🇹🇱JS04 - Klasterisasi

Pengantar

Klasterisasi adalah teknik dalam unsupervised learning yang digunakan untuk mengelompokkan data ke dalam beberapa grup berdasarkan kemiripan atau jarak antar data. Dalam praktiknya, klasterisasi sering divisualisasikan sebagai titik-titik pada grafik 2D atau 3D, di mana titik-titik yang memiliki kesamaan tinggi berkumpul membentuk grup (klaster), sedangkan titik yang berbeda berada pada klaster lain.

Visualisasi ini membantu kita memahami struktur data yang tersembunyi, melihat pola yang tidak langsung terlihat, serta mempermudah analisis dan interpretasi data. Misalnya, pada dataset pelanggan, setiap titik bisa merepresentasikan seorang pelanggan dengan atribut seperti usia dan pengeluaran, dan titik-titik yang mirip secara perilaku akan membentuk kelompok yang sama.

Tujuan

  • Mampu menjelaskan konsep klasterisasi dalam unsupervised learning.

  • Mampu membedakan klasterisasi dengan klasifikasi (supervised learning).

  • Mampu menjelaskan konsep dasar pengukuran kemiripan antar data (jarak Euclidean, Manhattan, Cosine Similarity).

  • Mampu memberikan contoh pemanfaatan klasterisasi, seperti segmentasi pelanggan, deteksi anomali, dan pengelompokan dokumen.

  • Mampu memvisualisasikan hasil klasterisasi menggunakan scatter plot 2D/3D untuk memahami pola data.

Last updated