πŸ₯‡Lab 1

Hierarchical Clustering

Pengantar

Pada praktikum ini Anda akan mencoba membuat model clustering menggunakan heirarchical clustering. Anda diminta untuk membuat kelompok-kolompok customer pada toko ritel berdasarkan fitur Annual Income dan Spending Score.

Langkah 0 - Download Dataset

⬇️ Download ⬇️

file-download
4KB

Langkah 1 - Import Library

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

Langkah 2 - Load Dataset

Pada tahap ini, load dataset yang telah di unduh. Kemudian lakukan inspeksi terhadap data.

Anda akan mendapatkan hasil seperti,

Langkah 3 - Slicing Fitur

Selanjutnya, kita akan melakukan proses slicing untuk menggunakan fitur Annual Income dan Spending Score saja.

Langkah 4 - Visualisasi Dendogram

Untuk mempermudah penentuan cluster, kita akan membuat visualisasi dendogram. Visualisasi ini dapat dimanfaatkan untuk menentukan jumlah cluster. Nilai threshold pada sumbu x digunakan untuk menentukan jumlah cluster berdasarkan dendogram.

Hasil dendogram adalah sebagai berikut,

Pada dendogram, dihasilkan 3 buah cluster utama, orange, hijau, dan merah. Akan tetapi, jika kita menggunakan nilai threshold yang rendah, misal 100 - 150, maka kita akan mendapatkan 5 cluster.

Langkah 5 - Membuat Model Agglomerative

Buat cluster dengan menggunakan model Agglomeratvie (bottom-up) dengan jumlah 5 cluster.

Langkah 6 - Visualisasi Cluster

Untuk mengetahui hasil cluster, visualisasikan cluster dengan menggunakan scatterplot.

Hasilnya adalah sebagai berikut,

Langkah 7 - Evaluasi Hasil Cluster

Lakukan evaluasi hasil cluster dengan menggunakan silhouette coefficient.

Didapatkan hasil berkisar,

Hasil dari silhouette score menunjukkan hasil yang cukup baik dengan nilai berkisar 0.550.55. Anda dapat bereksperimen dengan mengubah jumlah klaster untuk mengetahui jumlah cluster mana yang terbaik.

Last updated