๐ŸงซPraktikum 3

Klasifikasi Naive Bayes dengan Data Dummy

Pada percobaan ini kita akan menggunakan data dummy (sintentis) untuk membuat sebuah model Naive Bayes. Untuk membuat data dummy, kita dapat menggunakan fungsi make_classification dari library scikit-learn. Selanjutnya, kita akan membuat model Multinomial Naive Bayes dengan menggunakan MultinomialNB dan model Gaussian Naive Bayes menggunakan GaussianNB.

Mendefiniskan Data Dummy

import numpy as np
from sklearn.datasets import make_classification

# Membuat data dummy
# Hasil dari make_classification berupa data fitur X dan label y
# Label y akan berupa data yang sudah di encode (angka)
X,y = make_classification(n_samples=30, n_features=2, n_classes=2, n_informative=2, n_redundant=0, n_repeated=0, shuffle=False)

# Secara defalt, make_classfication menghasilkan nilai float
# Kita perlu merubah dalam bentuk diskrit

# Absolutekan nilai
X = np.absolute(X)

# Bulatkan nilai ke 2 angka dibelakang koma
# Kalikan dengan 100 supaya tidak ada lagi koma
X = np.round(X, 2) * 100

# Ubah ke dalam bentuk integer
X = X.astype(int)
print(X)
print(y)

Parameter yang digunakan pada fungsi make_classification adalah,

  • n_samples: jumlah sampel yang diinginkan

  • n_features: jumlah fitur yang digunakan

  • n_classes: jumlah kelas

  • n_informative: jumlah fitur yang memiliki korelasi dengan kelas

  • n_redundant: jumlah fitur yang tidak memiliki korelasi dengan kelas

  • n_repeated: jumlah fitur yang diulang

(Opsional) Membuat Data Frame

Agar data lebih mudah untuk dibaca, maka kita akan membuat DataFrame dengan menggunakan library Pandas berdasarkan data dummy yang telah dibuat sebelumnya

Fitur 1
Fitur 2
Label

0

142

15

0

1

67

139

0

2

152

114

0

3

108

51

0

4

145

55

0

Dikarenakan label masih berbetuk encoding angka, untuk mempermudah pembacaan data, kita dapat mengubah bentuknya dalam bentuk kategorial

Fitur 1
Fitur 2
Label

0

142

15

Kelas B

1

67

139

Kelas B

2

152

114

Kelas B

3

108

51

Kelas B

4

145

55

Kelas B

(Opsional) Visualisasi Data

Klasifikasi Multinomial Naive Bayes

Klasifikasi Gaussian Naive Bayes

Last updated

Was this helpful?