πŸ₯‰Lab 3

Pengantar

Setelah pada praktikum kedua kita membandingkan HDBSCAN dengan DBSCAN dan melihat keunggulannya, pada praktikum kedua ini kita akan fokus hanya pada HDBSCAN. Tujuannya adalah memahami bagaimana hasil clustering dapat dipengaruhi oleh perubahan hyperparameter. Dengan mencoba berbagai nilai untuk min_cluster_size, min_samples, dan cut_distance, kita akan melihat bagaimana HDBSCAN mengatur jumlah cluster, memisahkan noise, dan menyesuaikan diri terhadap struktur data yang berbeda.

Langkah 1 - Eksperimen Hyperparameter min_cluster_size

Ubah nilai min_cluster_size.

PARAM = ({"min_cluster_size": 5}, {"min_cluster_size": 3}, {"min_cluster_size": 25})
fig, axes = plt.subplots(3, 1, figsize=(10, 12))
for i, param in enumerate(PARAM):
    hdb = hdbscan.HDBSCAN(**param).fit(X)
    plot(X, hdb.labels_, hdb.probabilities_, param, ax=axes[i])

Langkah 8: Eksperimen Hyperparameter min_samples

Ubah nilai min_samples.

Langkah 9 - DBSCAN Clustering dari Pohon HDBSCAN

Gunakan parameter cut_distance.

Langkah 10 - Evaluasi dengan Silhouette Score

Jalankan kode berikut untuk menghitung Silhouette Score:

  • Jika nilai Silhouette Score mendekati 1, ini menunjukkan bahwa clustering berhasil memisahkan data dengan baik.

  • Nilai negatif menunjukkan bahwa data mungkin salah kelompok atau tidak tercluster dengan baik.

Langkah 11 - Evaluasi dengan Davies-Bouldin Index

Jalankan kode berikut untuk menghitung Davies-Bouldin Index:

  • Davies-Bouldin Index yang lebih rendah menunjukkan bahwa clustering lebih baik karena cluster lebih terpisah dengan jelas dan homogen.

  • Nilai yang lebih tinggi menunjukkan bahwa cluster lebih saling tumpang tindih dan kurang terpisah dengan jelas.

Langkah 12 - Visualisasi Hasil Evaluasi

Setelah menghitung Silhouette Score dan Davies-Bouldin Index, kita dapat membuat visualisasi untuk mempermudah pemahaman. Anda bisa memplot hasil Silhouette Score dan Davies-Bouldin Index dalam bentuk grafik untuk membandingkan berbagai eksperimen dengan hyperparameter yang berbeda.

Last updated