📀JS02 - Pemahaman Data dan Pra Pengolahan Data

Pengantar

Dalam pembelajaran mesin, pemahaman terhadap data yang digunakan sangat penting. Data yang digunakan harus dapat menjawab kebutuhan mengapa kita memerlukan model pembelajaran mesin. Permasalahan yang sering muncul adalah, data seperti apa yang harus kita gunakan dan bagaimana cara menggunakannya. Hal ini tidak terlepas dari berbagai macam jenis data yang dapat digunakan, mulai dari data terstruktur, semi-terstruktur, hingga tidak terstruktur. Setiap jenis data tersebut memiliki keunikan masing-masing dalam proses pengolahannya. Setelah menentukan data yang dapat kita gunakan, kita masih diharapkan dengan permasalahan bagaimana mengolah data tersebut. Terkadang, data yang kita dapatkan memiliki kondisi yang tidak seragam, seperti satuan yang berbeda, adanya data yang hilang, ataupun nilai-nilai asusmsi statistik yang tidak sesuai. Sebelum melangkah lebih jauh, kita harus melakukan sesuatu terhadap data tersebut. Tindakan ini diperlukan agar model yang akan dilatih mendapatkan informasi yang telah sesuai.

Pada bab ini kita akan belajar terkait dengan pemahaman data berkaitan jenis variabel dan jenis data (dalam konteks struktur), serta proses pra pengolahan data. Namun sebelum itu, kita akan belajar tentang bagaimana sebuah mesin dapat mengenali pola-pola data.

Tujuan

  1. Mampu menjelaskan konsep rekognisi, pola, dan pengenalan pola

  2. Mampu mengenali jenis-jenis data pada pembelajaran mesin

  3. Mampu melakukan proses exploratory data analysis (EDA) untuk memahami pola distribusi data, korelasi, outlier, dan missing value.

  4. Mampu menerapkan teknik teknik dasar pra pengolahan data pada berbagai jenis data.

Last updated