🧬Tugas Praktikum

Wisconsin Breast Cancer (Again)

Deskripsi Tugas

Pada tugas pratikum ini Anda akan menggunakan data "Wisconsin Breast Cancer". Data tersebut terdiri dari 569 data yang digunakan untuk mendiagnonis jenis kanker Malignant (M) dan Benign (B). Tugas Anda adalah,

  1. Pisahkan antara variabel yang dapat digunakan dan variabel yang tidak dapat digunakan.

  2. Lakukan proses encoding pada kolom "diagnosis".

  3. Lakukan proses standardisasi pada semua kolom yang memiliki nilai numerik.

  4. Lakukan proses seleksi fitur. Anda dapat menggunakan SelectKBest.

  5. Lakukan proses pengujian dengan model Logistic Regression seperti pada praktikum 1.

  6. Anda dapat menggunakan model pipeline untuk mempermudah perkejaan Anda.

  7. Berdasarkan hasil analisa Anda, berapa jumlah fitur terbaik yang dapat digunakan? Apa saja fitur tersebut?

Last updated