π°Konsep Dasar
Artificial Intelligence (AI) vs. Machine Learning (ML) vs. Deep Learning (DL) vs. Generative AI (GenAI)
Secara definisi,
Artificial intelligence (AI) atau kecerdasan buatan adalah cabang dari ilmu komputer yang bertujuan untuk menciptakan sistem yang memiliki kecerdasan seperti manusia menggunakan berbagai macam teknik seperti logika matematika, if-then rules, ataupun pembelajaran mesin. Kecerdasan buatan dibuat dengan cara mempelajari bagaimana otak manusia berpikir, belajar, dan menyelesaikan masalah.
Machine learning (ML) atau pembelajaran mesin merupakan subset dari AI yang bergantung kepada pola data untuk melakukan proses pembelajaran. Model ML menggunakan model-model statistika untuk menyelesaikan masalah yang spesifik.
Deep learning (DL) merupakan subset dari ML yang memungkinkan algoritmanya dapat melatih dirinya sendiri untuk memahami suatu pola. DL biasanya menggunakan artificial neural network (ANN) atau jaringan saraf tiruan (JST) dalam proses pembelajarannya. DL menggunakan jumlah data yang besar dalam proses pembelajaran.
Generative AI (GenAI) merupakan pemanfaatan dari model DL untuk menciptakan konten "original" seperti teks panjang, gambar, video ataupun suara dengan menggunakan data contoh. GenAI akan menghasilkan konten yang "mirip" dengan data contoh yang digunakan dalam proses pembelajaran.
Garis waktu dan ilustrasi irisan konsep AI, ML, DL, dan GenAI digambarkan dengan oleh IBM yang dapat dilihat pada Gambar 1.

Gambar 1. Hubungan AI, ML, DL, GenAI (IBM, 2024)
Apa itu Pembelajaran Mesin?
Pembelajaran mesin atau machine learning (ML) secara sederhana dapat didefinisikan sebagai ilmu dari pemrograman sehingga menjadikan dia ("sistem") dapat belajar dari data. Definisi lain dari ahli adalah,
(Machine learning is the) field of study that gives computers the ability to learn without being explicitly programmed. β Arthur Samuel, 1959
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. β Tom Mitchell, 1997
Contoh - Filter Spam Email
Filter spam email adalah program berbasis pembelajaran mesin yang dapat membedakan email "spam" dengan email normal (biasanya disebut sebagai "ham"). Program ini bekerja dimulai dengan memberikan contoh / flag email pada kategori "spam" dan "ham". Contoh-contoh tersebut kemudian digunakan untuk program mempelajari pola-pola dari email "spam" dan "ham". Contoh data yang digunakan untuk belajar, disebut sebagai "training set". Setiap contoh data yang digunakan untuk proses pembelajaran disebut sebagai "training instance" atau sampel.
Jika dikaitkan dengan definisi dari Mitchell, maka,
Task (T) β Membedakan email "spam" dan "ham" pada email baru yang masuk.
Experience (E) β Contoh-contoh data email "spam" dan "ham" untuk dipelajari.
Performance (P) β Ukuran untuk mengetahui performansi mesin. Pada kasus ini dapat berupa rasio email "spam" diklasifikasikan dengan benar.
Gambar 2. merupakan ilustrasi kasus filter "spam" menggunakan pendekatan dari Mitchel.

Gambar 2. Kasus Filter "Spam" dengan Pendekatan Definisi Mitchell
Tipe Pembelajaran Mesin
Tipe pembelajaran mesin dapat diklasifikasikan berdasarkan jenis dan seberapa banyak supervisi yang dia dapatkan selama proses pembelajaran. Secara umum, terdapat empat tipe pembelajaran mesin, yaitu,
Supervised Learning (Pembelajaran Terbimbing)
Unsupervised Learning (Pembelajaran Tak Terbimbing)
Semi-supervised Learning
Reinforcement Learning
Supervised Learning
Pada supervised learning, data latih (training set) yang digunakan untuk pembelajaran algoritma harus memiliki solusi atau nilai benarnya dan sering disebut sebagai "label". Sebagai contoh sistem filter email. Algoritma dapat membedakan antara email "spam" dan "ham" dikarenakan pada proses pelatihan, algoritma telah diberi contoh seperti apa karakteristik email "spam" dan "ham" dengan memberikan label pada data email.
Terdapat dua tugas yang umum dilakukan oleh tipe supervised learning, yaitu,
Klasifikasi (classification) β Membedakan data berdasarkan label. Contoh: filter email.
Regresi (regression) β Memprediksi nilai asli (nilai numerik) dari data. Contoh: harga mobil, harga rumah, jumlah penduduk.
Ilustrasi tugas supervised learning digambarkan pada Gambar 3 dan Gambar 4.

Gambar 3. Proses Pelatihan Tugas Klasifikasi (Geron, 2019)

Gambar 4. Proses Pelatihan Tugas Regresi (Geron, 2019)
Dalam praktiknya, terdapat algoritma yang dapat digunakan dalam tugas klasifikasi maupun prediksi, sebagai contoh Logistic Regression dan Support Vector Machine (SVM).
Beberapa contoh algoritma supervised learning yang populer adalah,
k-Nearest Neighbors (kNN)
Linear Regression
Logistic Regression
Support Vector Machines (SVM)
Decision Tree dan Random Forests
Neural networks
Unsupervised Learning
Unsupervised learning melakukan proses pembelajaran tanpa menggunakan data yang memiliki label (unlabeled data). Algoritma unsupervised learning akan mengelompokkan data berdasarkan kesamaan karakteristik. Tidak ada prediksi label atau nilai numerik yang didapatkan. Unsupervised learning akan menghasilkan kelompok-kelompok data.

Gambar 5. Ilustrasi Data Pengunjung Supermarket (Geron, 2019)
Sebagai ilustrasi, Gambar 5 menunjukkan training set yang akan digunakan dalam proses pembelajaran. Training set merupakan data pengujung supermarket. Kita ingin mengelompokkan pengujung-pengunjung tersebut sesuai dengan kesamaan karakteristik. Algoritma unsupervised learning akan membuat boundary (batas) antara kelompok satu dengan kelompok lain sehingga kita dapat memisahkan data berdasarkan karakteristiknya. Gambar 6 merupakan ilustrasi pengelompokan yang dilakukan oleh algoritma unsupervised learning.

Gambar 6. Hasil Pengelompokan Pengujung Menggunakan Algoritma Unsupervised Learning (Geron, 2019)
Hasil pengelompokan yang telah dilakukan oleh algoritma unsupervised learning selanjutnya akan digunakan untuk analisis lebih lanjut. Kita dapat menafsirkan kelompok sesuai dengan kebutuhan, sebagai contoh setiap kelompok dapat kita asumsikan sebagai berbagai macam profil pengujung supermarket berdasarkan intensitas kunjungan atau nominal pembelanjaan per bulan.
Lebih lanjut, unsupervised learning tidak hanya digunakan untuk proses pengelompokan, atau lebih dikenal sebagai klasterisasi (clustering) namun juga dapat digunakan untuk deteksi anomali, reduksi dimensi. Secara umum, tugas dari unsupervised learning dapat dibagi menjadi 4 kategori, yaitu,
Klasterisasi (Clustering)
K-Means
DBSCAN
Hierarchical Clustering Analysis (HCA)
Deteksi anomali
One-class SVM
Isolation Forest
Visualisasi dan reduksi dimensi
Principal Component Analysis (PCA)
Locally Linear Embedding (LLE)
t-Distributed Stochastic Neighbour Embedding (t-SNE)
Association rule learning
Apriori
Eclat
Semisupervised Learning
Semisupervised learning mengombinasikan tugas supervised learning dan unsupervised learning dalam menyelesaikan sebuah pekerjaan. Contoh kasus yang paling umum adalah ketika terdapat banyak data namun hanya sedikit data yang memiliki label. Proses pelabelan manual akan memakan cukup banyak waktu. Dengan pendekatan semisupervised learning, data yang belum memiliki label dapat diberikan label sementara (dikenal sebagai pseudo-label) berdasarkan kedekatan data tersebut dengan data yang memiliki label (konsep klasterisasi). Data dengan label dan pseudo-label tersebut kemudian dapat digunakan untuk proses pelatihan algoritma supervised learning. Gambar 7 merupakan ilustrasi bagaimana semisupervised learning bekerja.

Gambar 7. Ilustrasi Cara Kerja Semisupervised Learning
Contoh penerapan teknik ini adalah proses taging seseorang dalam foto yang diunggah ke media sosial. Orang A dapat dikenali pada gambar 1, 5, dan 19. Kemudian terdapat orang B yang dikenali pada gambar 3, 20, 25. Proses dilakukan dengan melakukan klasterisasi pada objek citra yang memiliki kedekatan karakteristik. Jika satu orang sudah pernah ditandai dengan tag, maka jika ada gambar lain, proses taging hanya perlu mencari kedekatan karakteristik pada gambar lainnya.
Reinforcement Learning
Tipe pembelajaran ini berbeda dengan tipe yang sudah dibahas sebelumnya. Reinforcement learning tidak menggunakan data latih untuk proses pembelajaran, akan tetapi langsung melakukan proses pelatihan pada kondisi sebenarnya. Terdapat 3 konsep utama yang perlu dipahami dalam reinforcement learning, yaitu
Agent β Entitas yang dapat berinteraksi dengan lingkungan (environment) dan dapat melakukan aksi pada lingkungan tersebut.
Environment (Lingkungan) β Lingkungan yang akan dipelajari oleh agent.
Reward/Penalty β Nilai yang diberikan ketikan agent melakukan sebuah aksi. Reward jika aksi yang dilakukan sesuai harapan, penalty ketika aksi yang dilakukan tidak sesuai dengan harapan.

Gambar 8. Proses Pembelajaran Pada Reinforcement Learning
Gambar 8 menjelaskan secara ringkas proses pembelajaran pada reinforcement learning. Proses pelatihan pada reinforcement learning dilakukan berulang-ulang untuk mendapatkan model yang sesuai harapan, biasanya ditandai dengan nilai reward yang paling optimal.
Contoh pemanfaatan reinforcement learning adalah autonomous vehicle, autonomous robot, ataupun NPC pada game.
Last updated