๐งซPraktikum 3
Klasifikasi Naive Bayes dengan Data Dummy
Pada percobaan ini kita akan menggunakan data dummy (sintentis) untuk membuat sebuah model Naive Bayes. Untuk membuat data dummy, kita dapat menggunakan fungsi make_classification dari library scikit-learn. Selanjutnya, kita akan membuat model Multinomial Naive Bayes dengan menggunakan MultinomialNB dan model Gaussian Naive Bayes menggunakan GaussianNB.
Mendefiniskan Data Dummy
import numpy as np
from sklearn.datasets import make_classification
# Membuat data dummy
# Hasil dari make_classification berupa data fitur X dan label y
# Label y akan berupa data yang sudah di encode (angka)
X,y = make_classification(n_samples=30, n_features=2, n_classes=2, n_informative=2, n_redundant=0, n_repeated=0, shuffle=False)
# Secara defalt, make_classfication menghasilkan nilai float
# Kita perlu merubah dalam bentuk diskrit
# Absolutekan nilai
X = np.absolute(X)
# Bulatkan nilai ke 2 angka dibelakang koma
# Kalikan dengan 100 supaya tidak ada lagi koma
X = np.round(X, 2) * 100
# Ubah ke dalam bentuk integer
X = X.astype(int)
print(X)
print(y)Parameter yang digunakan pada fungsi make_classification adalah,
n_samples: jumlah sampel yang diinginkan
n_features: jumlah fitur yang digunakan
n_classes: jumlah kelas
n_informative: jumlah fitur yang memiliki korelasi dengan kelas
n_redundant: jumlah fitur yang tidak memiliki korelasi dengan kelas
n_repeated: jumlah fitur yang diulang
(Opsional) Membuat Data Frame
Agar data lebih mudah untuk dibaca, maka kita akan membuat DataFrame dengan menggunakan library Pandas berdasarkan data dummy yang telah dibuat sebelumnya
0
142
15
0
1
67
139
0
2
152
114
0
3
108
51
0
4
145
55
0
Dikarenakan label masih berbetuk encoding angka, untuk mempermudah pembacaan data, kita dapat mengubah bentuknya dalam bentuk kategorial
0
142
15
Kelas B
1
67
139
Kelas B
2
152
114
Kelas B
3
108
51
Kelas B
4
145
55
Kelas B
(Opsional) Visualisasi Data

Klasifikasi Multinomial Naive Bayes
Klasifikasi Gaussian Naive Bayes
Last updated
Was this helpful?