Google Books Ngram Viewer
Google Books Ngram Viewer

Google Books Ngram Viewer

Catatanpanda.com Google Books Ngram Viewer (Google Ngram) adalah mesin pencari yang memetakan frekuensi kata dari kumpulan besar buku dan dengan demikian memungkinkan pemeriksaan perubahan budaya seperti yang tercermin dalam buku.

Sementara kumpulan data yang sangat besar dari alat ini (sekitar 8 juta buku atau 6% dari semua buku yang pernah diterbitkan) telah digunakan dalam berbagai studi ilmiah, kekhawatiran tentang keakuratan hasil secara bersamaan muncul.

Makalah ini meninjau literatur dan berfungsi sebagai pedoman untuk meningkatkan studi Google Ngram dengan menyarankan lima prosedur metodologis yang cocok untuk meningkatkan keandalan hasil.

Secara khusus, kami merekomendasikan penggunaan (I) korpora bahasa yang berbeda, (II) pemeriksaan silang pada korpora yang berbeda dari bahasa yang sama, (III) infleksi kata, (IV) sinonim,dan (V) prosedur standarisasi yang memperhitungkan masuknya data dan bobot frekuensi kata yang tidak sama.

Selanjutnya, kami menguraikan bagaimana menggabungkan prosedur ini dan mengatasi risiko potensi bias yang timbul dari penyensoran dan propaganda. Sebagai contoh prosedur yang diusulkan, kami memeriksa ekspresi lintas budaya agama melalui istilah agama selama tahun 1900 hingga 2000.

Penekanan khusus ditempatkan pada situasi selama Perang Dunia II. Sejalan dengan untaian literatur yang menekankan pada penurunan nilai-nilai kolektivistik, hasil penelitian kami menunjukkan penurunan secara keseluruhan tentang pentingnya agama.

Namun, agama kembali menjadi penting selama masa krisis seperti Perang Dunia II. Dengan membandingkan hasil yang diperoleh melalui metode yang berbeda,kami mengilustrasikan bahwa menerapkan dan khususnya menggabungkan prosedur yang kami sarankan meningkatkan keandalan hasil dan mencegah penulis dari asumsi yang salah.

Baca Juga: 6 Investasi Terbaik Di Indonesia Dan Sangat Populer

Kegunaan Google Books Ngram Viewer

Sejak diluncurkan pada 2010, kemungkinan dan batasan penggunaan Google Books Ngram Viewer (Google Ngram) untuk tujuan penelitian telah didiskusikan secara kontroversial.

Meskipun sejumlah besar studi Google Ngram menunjukkan pengakuan ilmiah, beberapa makalah dengan tepat membahas masalah metodologis (lihat, misalnya, [ 1 , 2 , 3 ]). Namun, tidak ada serangkaian solusi yang dapat diterapkan yang diberikan.

Artikel kami saat ini bertujuan untuk mengurangi kekhawatiran tentang keterpercayaan studi Google Ngram dengan menyajikan panduan tentang berbagai prosedur langsung yang dapat meningkatkan keandalan.

Google Ngram adalah mesin pencari yang memetakan frekuensi kata dari kumpulan besar buku yang dicetak antara tahun 1500 dan 2008.

Alat ini menghasilkan grafik dengan membagi jumlah kemunculan kata tahunan dengan jumlah total kata dalam korpus pada tahun itu.

Dengan demikian, konten buku dipecah menjadi blok teks peka huruf besar-kecil—disebut n-gram . Kata “buku”, misalnya, adalah 1 gram, sedangkan “kitab suci” adalah 2 gram dan seterusnya, maksimal lima kata.

Karena dekade-dekade awal berisi lebih sedikit buku, keseluruhan korpus Google Ngram menjadi cukup besar untuk penggunaan ilmiah pada tahun 1800 [ 4].

Ketika alat ini dirilis pada 2010, total korpus terdiri dari lebih dari 5 juta buku, meliputi bahasa Inggris, Prancis, Spanyol, Jerman, Cina, Rusia, dan Ibrani. Buku-buku ini diambil dari lebih dari 40 perpustakaan universitas yang berbeda [ 4 ].

Sejak pembaruan terakhir corpus pada tahun 2012, pengguna dapat mengakses 22 sub-korpora yang berbeda, dengan total 8 juta buku.

Versi baru ini ditandai dengan peningkatan pengenalan karakter optik (OCR) serta perpustakaan dan metadata penerbit yang lebih baik [ 5]. Saat ini, dua korpora untuk masing-masing bahasa yang disebutkan di atas ada – versi lama dan versi yang diperbarui.

Satu korpus tambahan berisi buku-buku Italia. Empat korpora selanjutnya membagi bahasa Inggris menjadi bahasa Inggris Britania dan bahasa Inggris Amerika.

Terakhir, ada dua korpora fiksi, yang mencakup buku-buku fiksi yang didominasi bahasa Inggris dan satu korpus, yang disebut “Bahasa Inggris satu Juta”, yang mencakup kumpulan teks berimbang dari 6000 buku berbahasa Inggris, diterbitkan antara tahun 1500 dan 2008, dan dipilih dari tahun mana pun.

Baca Juga: Informasi Seputar Emas Forex Hari Ini

Analisis dasar

Setelah mengekstraksi frekuensi kata dari Google Ngram, penelitian sebelumnya telah menyelidiki perubahan budaya dengan memeriksa koefisien korelasi antara frekuensi kata dan tahun.

Berdasarkan gagasan bahwa frekuensi alami sebuah kata relevan untuk menilai perubahan budaya, masuk akal untuk menjumlahkan frekuensi kata tunggal per tahun (dan bahasa), dan untuk menjalankan analisis korelasional agregat (lihat, misalnya, [ 6 ] , 7 , 9 , 18]). Dalam hal ini, semakin sering sebuah kata, semakin besar pengaruh proporsionalnya. 

Dengan menganalisis frekuensi penjumlahan kata-kata agama kita (berdasarkan tahun dan bahasa), kita mengamati korelasi negatif antara tahun dan frekuensi istilah agama untuk bahasa Inggris Amerika (r = -0,89, p<0,001), Inggris Inggris (r = – 0,96, p<0,001), Jerman (r = -0,47, p<0,001), dan Italia (r = -0,64, p<0,001). Sebaliknya, menyelidiki perkembangan istilah agama di masa krisis seperti Perang Dunia II, istilah Jerman menunjukkan tren positif yang signifikan (r = 0,79, p<0,01). 

Temuan menunjukkan bahwa agama menjadi kurang penting dari waktu ke waktu tetapi menunjukkan prevalensi lebih selama masa krisis eksistensial (lihat Gambar AH di lampiran S1 untuk inspeksi visual).

>>>Baca Selengkapnya<<<

Gallery for Google Books Ngram Viewer

Leave a Reply

Your email address will not be published.