Home > Serba-serbi > Bahasa Indonesia: Huruf Paling Sering Muncul

Bahasa Indonesia: Huruf Paling Sering Muncul


Pada pemecahan kode kriptografi sederhana, frekuensi kemunculan suatu karakter dapat dijadikan acuan. Meskipun kode terekskripsi tidak dapat dimengerti, mengetahui bahasa yang digunakan dan menilik huruf yang paling sering kemunculannya akan sangat membantu.


Pada teks:

Saya cinta kamu

Jika semua huruf digeser 2 sehingga ‘a’ menjadi ‘c’ dan ‘c’ menjadi ‘e’ maka teks tersebut menjadi:

Ucac ekpvc mcow

Huruf yang paling sering muncul pada teks terenskripsi adalah ‘c’ sebanyak 4 kali. Seandainya huruf yang paling sering muncul dalam bahasa Indonesia adalah ‘a’ maka peluang untuk mengetahui teks yang sebenarnya akan lebih mudah. Kemudian dilanjutkan dengan mengganti huruf dengan frekuensi tertinggi berikutnya.

Ini memang bukan jaminan, hanya peluang untuk menebak secara benar semakin besar.

Benarkah huruf ‘a’ paling sering muncul dalam bahasa Indonesia? Saya mencoba membuktikan, ternyata dari 2 artikel berbahasa Indonesia yang diuji, diperoleh hasil sebagai berikut (10 huruf dengan frekuensi tertinggi).

File Indonesia01.txt (sumber tvone.co.id):

Ranking 1 : Huruf a sebanyak 690 kali
Ranking 2 : Huruf e sebanyak 137 kali
Ranking 3 : Huruf n sebanyak 127 kali
Ranking 4 : Huruf i sebanyak 104 kali
Ranking 5 : Huruf t sebanyak 80 kali
Ranking 6 : Huruf u sebanyak 76 kali
Ranking 7 : Huruf k sebanyak 72 kali
Ranking 8 : Huruf r sebanyak 69 kali
Ranking 9 : Huruf d sebanyak 66 kali
Ranking 10 : Huruf m sebanyak 59 kali

File Indonesia02.txt (sumber kompas.com):

Ranking 1 : Huruf a sebanyak 634 kali
Ranking 2 : Huruf n sebanyak 130 kali
Ranking 3 : Huruf e sebanyak 126 kali
Ranking 4 : Huruf r sebanyak 109 kali
Ranking 5 : Huruf u sebanyak 87 kali
Ranking 6 : Huruf m sebanyak 85 kali
Ranking 7 : Huruf i sebanyak 84 kali
Ranking 8 : Huruf t sebanyak 59 kali
Ranking 9 : Huruf s sebanyak 57 kali
Ranking 10 : Huruf k sebanyak 50 kali

Ternyata huruf ‘a’ memang yang paling tinggi frekuensi kemunculannya. Huruf ‘e’ dan ‘n’ terlihat cukup sering muncul di belakang huruf ‘a’ namun dengan frekuensi yang sangat jauh berbeda. Jadi, sangat meyakinkan bahwa huruf ‘a’ memang huruf paling banyak dipakai dalam menulis teks bahasa Indonesia tercinta. Mau menguji sendiri? Gunakan script yang saya tulis, silakan dimodifikasi sesuai kebutuhan.

  1. 11 August 2011 at 2:49 am

    saya sedang menulis modul baca, dan frekuensi huruf yang paling sering muncul ini menjadi acuan saya untuk menyusun huruf-huruf apa yang harus dikenal anak pertama kali. terima kasih!🙂
    @ayu_kartikadewi

  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: