Mengenal Teori Bayes dan Aplikasinya

Coba bayangkan, jika ada orang yang punya bintik-bintik dan gatal-gatal, seberapa besar kemungkinan orang itu punya cacar air? Pertanyaan ini mungkin pernah ada di angan-angan para dokter di zaman dulu. Saat itu teknologi belum memungkinkan untuk melakukan tes darah atau tes biologis lainnya sehingga para ahli medis tidak bisa menyimpulkan apakah gejala yang terjadi pada manusia itu berhubungan dengan penyakit yang dideritanya.

Anggap saja kita adalah dokter dan hidup di zaman dulu dan terjadi wabah cacar air. Orang-orang di kota kita harus dikarantina agar tidak menular. Kalau kemungkinan penularannya sangat kecil, kita tidak perlu takut, tetapi kalau kemungkinannya besar, kita harus segera mengimbau mereka agar tidak keluar rumah dulu supaya tidak menular pada yang lain. Di sinilah sebuah teori statistika yang dirumuskan oleh Thomas Bayes digunakan. Namanya diabadikan sebagai “teori Bayes”.

Untuk memahami teori Bayes, mari kita bayangkan suatu diagram seperti pada gambar.

Ada empat kuadran dari diagram. Variabel B dan negasinya ¬B adalah orang terkena bintik-bintik dan sebaliknya. Variabel C dan negasinya ¬C melambangkan orang-orang yang terkena cacar dan sebaliknya. Jika semua digabungkan, akan membentuk suatu set atau himpunan yang dilambangkan dengan S. Di sini yang perlu kita perhatikan adalah dua variabel yang belum disebut, yaitu x dan c (huruf kecil). Variabel x adalah probabilitas (peluang) untuk orang yang terkena bintik-bintik dan juga mengidap penyakit cacar, sementara variabel c adalah peluang orang mendapat penyakit cacar.

Dengan variabel yang sudah didefinisikan, formula Bayes dapat dituliskan:

\mathrm{prob(B|C)} = \displaystyle\frac{x}{s} = \displaystyle\frac{x}{c} \times \frac{c}{s},

dengan

\mathrm{prob}(C|B) = \displaystyle \frac{\mathrm{prob}(C)}{\mathrm{prob}(B)} \times \mathrm{prob}(B|C)

Dalam bahasa yang lebih “manusiawi”, kita bisa tuliskan:

prob(C|B) = probabilitas orang cacar ketika dia mempunyai bintik-bintik,

prob(C) = probabilitas orang yang mendapat cacar di suatu himpunan,

prob(B|C) = probabilitas orang yang bintik-bintik ketika dia mendapat cacar, dan

prob(B|¬C) = probabilitas orang yang bintik-bintik ketika dia tidak mendapat cacar.

Mari kita kembali lagi ke contoh di atas dengan menggunakan angka. Misalkan prob(C) = 0,2, ini berarti di seluruh masyarakat di suatu desa ada 20% kemungkinan orang terkena penyakit cacar. Kemudian misalkan pula prob(B|C) = 0,9 dan prob(B|¬C)=0,15, yang berarti kemungkinan orang mendapat bintik-bintik ketika dia mendapat cacar adalah 90% dan kemungkinan orang mendapat bintik-bintik ketika dia tidak mendapat cacar adalah 15%. Dari semua yang kita ketahui, kita bisa mencari peluang atau kemungkinan orang mendapat bintik-bintik di daerah tersebut dengan cara prob(B) = prob(B|C) x prob(C) + prob(B|¬C) x prob(¬C). Substitusikan nilai variabelnya, kita peroleh prob(B) = 0,9 x 0,2 + 0,15 x 0,8 = 0,3. Dari semua variabel yang kita ketahui di atas kita bisa mendapat peluang orang mendapat cacar ketika dia mendapat bintik-bintik:

\mathrm{prob(C|B)} = \displaystyle \frac{\mathrm{prob}(C)}{\mathrm{prob}(B)} \times \mathrm{prob}(B|C) = \displaystyle\frac{0,2}{0,3} \times 0,9 = 0,6.

Dari hasil di atas, kita bisa melihat bahwa kemungkinan orang mendapat cacar ketika dia memiliki bintik-bintik adalah 60%. Ini adalah hasil yang cukup mencengangkan, karena ada kemungkinan 40% orang tersebut tidak mengidap penyakit cacar, suatu kemungkinan yang cukup tinggi mengingat probabilitas orang yang mendapat bintik-bintik ketika ia memiliki cacar adalah 90%. Ini dikarenakan ada kemungkinan yang cukup signifikan untuk orang mendapat bintik-bintik dan tidak mendapat cacar sebesar prob(B|¬C), dan kemungkinan orang mendapat cacar sebesar prob(B|C) yang masih sedikit mempunyai celah 10%.

Anggap saja kita mendapat data-data ini untuk musim pancaroba. Banyak nyamuk berkeliaran dan ada kemungkinan orang mendapat bintik-bintik walaupun tidak mengidap penyakit cacar. Cacar mewabah lagi ketika musim kering, misalnya, ada sedikit nyamuk. Kita mendapat data, prob(B|C) = 0,95 dan prob(B|¬C) = 0,1. Gunakan prosedur yang sama seperti di atas, kita peroleh prob(B|C) = 0,7037 = 70,37%. Hal ini adalah peningkatan yang lumayan signifikan.

Teori Bayes ini diaplikasikan sampai di ranah hukum, khususnya hukum perdata. Untuk hukum pidana, masih banyak kontroversi soal membuktikan kesalahan seseorang dengan sebuah probabilitas. Di bagian lain seperti prakiraan cuaca, ilmu komputer, hingga machine learning, teori Bayes ini sangat luas penerapannya. Selain itu, keunikan sosok Thomas Bayes adalah profesi sehari-harinya yang bukan sebagai matematikawan, melainkan pendeta. Artinya, apapun profesi teman-teman nanti, asalkan kita bisa berpikir logis dan memiliki rasa ingin tahu yang tinggi, bisa saja kita berkontribusi pada perkembangan ilmu pengetahuan dan teknologi.

Untuk menutup artikel ini, coba teman-teman pikirkan aplikasi teori Bayes di dunia nyata. Misalkan kita bekerja di pemerintahan di bagian kependudukan dan tata kota, kita ingin mengetahui peluang orang mengendarai sepeda motor miliknya sendiri. Kita pakai variabel M untuk kemungkinan pemilik motor dan G untuk pengguna motor. Ingat bahwa pengguna motor belum tentu memiliki motor tersebut dan pemilik motor belum tentu menggunakan motornya. Anggap saja prob(M) = 65%, prob(G|M) = 98% dan prob(G|¬M) = 62%. Berapakah kemungkinan orang memiliki motor ketika dia menggunakan motor, prob(M|G)?

Penulis:
Rian Josua Masikome, Software Engineer, Alumnus Informatika RWTH Aachen, Jerman.
Kontak: rj(at)masiko.me

Mengenal Teori Bayes dan Aplikasinya