🍊Naive Bayes

Apa itu Naive Bayes?

Sebelum kita mempelajari tentang model naïve bayes, ada baiknya kita memahami apa itu kaidah bayes. Konsep utama dari kaidah bayes adalah mencari nilai probabilitas (peluang) dari sebuah kejadian berdasarkan nilai probabilitas kejadian lain yang diketahui. Secara matematis, kaidah bayes dapat digambarkan dengan menggunakan Persamaan berikut.

P(AB)=P(A)P(BA)P(B)P(A|B)=\frac{P(A)P(B|A)}{P(B)}

Dimana AA dan BB adalah sebuah kejadian dan nilai P(A)P(A) merupakan peluang kejadian AA dan P(B)P(B) merupakan peluang kejadian BB. P(AB)P(A|B) adalah peluang kejadian AA setelah kita mengetahui kejadian BB, begitu juga sebaliknya untuk nilai peluang P(BA)P(B|A).

Sebagai contoh, kita akan merencanakan untuk pergi untuk melakukan kegiatan piknik. Kondisi saat ini didapati cuaca sedang berawan. Kita juga mendapatkan fakta bahwa,

  • 50% dari hari hujan diawali dengan cuaca berawan

  • Keadaan berawan sering terjadi pada pagi hari dengan peluang 40%

  • Kondisi umum saat ini cenderung kering dan jarang terjadi hujan. Hujan hanya terjadi 3 hari sepanjang 30 hari.

Kemudian kita ingin mengetahui peluang terjadinya hujan pada siang hari ini sebelum kita memutuskan untuk pergi piknik.

Berdasarkan fakta-fakta tersebut, kita dapat memformulasikannya ke dalam bentuk bayes, yaitu,

  • Menentukan kejadian AA dan kejadian BB. Pada kasus ini, kita berasumsi bahwa kejadian AA adalah hujan, sedangkan kejadian BB adalah kondisi berawan. Sehingga didapatkan P(Hujan)=P(A)P(Hujan)=P(A) dan P(Berawan)=P(B)P(Berawan)=P(B).

  • 50% dari hari hujan diawali cuaca berawan → P(BerawanHujan)=P(BA)=50P(Berawan│Hujan)=P(B│A)=50%=0.5.

  • Keadaan berawan sering terjadi di pagi hari dengan peluang 40% → P(B)=40P(B)=40%=0.4.

  • Kondisi kering dan jarang terjadi hujan dapat kita modelkan menjadi P(A) dengan peluang 3/30=103/30=10%=0.1P(A)=0.1P(A)=0.1.

  • Sehingga untuk menghitung peluang terjadinya hujan pada siang hari, kita dapat modelkan menjadi P(AB)P(A|B).

Didapatkan nilai P(AB)P(A|B) adalah,

P(AB)=P(A)P(BA)P(B)=0.10.50.4=0.125=12.5%P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{0.1*0.5}{0.4}=0.125=12.5\%

Dengan demikian, didapatkan peluang terjadinya hujan pada siang hari adalah 12.5%.

Lalu apa hubungan contoh tersebut dengan model Naïve Bayes?

Pada model naïve bayes kita dapat menghitung peluang sebuah label pada kelas dalam kasus klasifikasi berdasarkan peluang setiap fitur untuk label tersebut. Sehingga, untuk menghitung peluang label yy berdasarkan fitur-fitur xnx_n pada naïve bayes dilakukan dengan Persamaan berikut.

P(yx1,x2,...,xn)=P(y)P(x1,x2,...,xn)P(x1,x2,...,xn)P(y|x_1, x_2, . . . ,x_n)=\frac{P(y)P(x_1,x_2,...,x_n)}{P(x_1,x_2, ...,x_n)}

Setelah mendapatkan peluang dari label yy berdasarkan fitur-fitur xnx_n, maka proses terakhir dari model naïve bayes adalah membandingkan peluang untuk setiap label yang dimiliki. Label dengan peluang terbesar adalah hasil prediksi dari model naïve bayes.

Lalu mengapa naïve bayes dikatakan naif? Hal ini dikarenakan naïve bayes tidak memperhitungkan hubungan atau korelasi antar fitur. Dalam praktiknya, terdapat beberapa jenis model naïve bayes berdasarkan sumber data yang digunakan. Jika data yang digunakan bersifat diskrit, maka model naïve bayes yang paling cocok digunakan adalah multinomial naïve bayes. Jika data kita berupa data kategorikal, maka kita dapat menggunakan model categorical naïve bayes. Sedangkan jika data yang digunakan bersifat kontinu, maka kita dapat menggunakan model gaussian naïve bayes. Akan tetapi perlu dicatat, pada model gaussian naïve bayes, model berasumsi bahwa data pada fitur terdistrubusi secara normal (distribusi gaus)

Last updated