πPraktikum 1
β¬οΈ Download Dataset Terlebih Dahulu β¬οΈ
Berikut adalah langkah-langkah beserta penjelasan singkat dan snapshot kode program Python untuk melakukan praktikum regresi linier, mengacu pada kode program yang telah diberikan sebelumnya:
Langkah 1: Persiapan Data
Download dan letakkan file data yang akan digunakan pada direktori yang sama. Pastikan data telah disimpan dalam format CSV.
Langkah 2: Import Library
# import package
import numpy as np
import pandas as pdImport library NumPy dan Pandas yang digunakan untuk manipulasi data.
Langkah 3: Baca Data
# baca data dari file CSV
data = pd.read_csv('dataset.csv')Baca data dari file CSV dengan menggunakan Pandas.
Langkah 4: Pemahaman Terhadap Data
Tampilkan beberapa data awal, ukuran data, informasi data, dan deskripsi statistik data untuk memahami karakteristik data.
Langkah 5: Visualisasi Data
Import library Matplotlib dan Seaborn untuk visualisasi data.
Gunakan pairplot untuk menampilkan hubungan antara variabel bebas dan variabel target dalam bentuk scatter plot.
Gunakan heatmap untuk menampilkan matriks korelasi antara variabel-variabel dalam dataset. Semakin tinggi nilainya, semakin tinggi korelasinya.
Langkah 6: Regresi Linier
Pisahkan variabel bebas (X) dan variabel target (y).
Bagi data menjadi data latih (70%) dan data uji (30%) menggunakan train_test_split.
Lakukan training model regresi linier menggunakan library StatsModels. Tambahkan konstanta (intercept) ke variabel bebas.
Visualisasikan garis regresi pada data latih.
Langkah 7: Analisis Residual
Lakukan prediksi nilai y dari data latih dan hitung residual (selisih antara nilai sebenarnya dan nilai prediksi).
Visualisasikan residual dalam bentuk histogram dan scatter plot untuk mengevaluasi distribusi dan pola error.
Langkah 8: Prediksi pada Data Uji dan Evaluasi Model
Lakukan prediksi pada data uji.
Hitung nilai R-squared untuk mengukur kinerja model pada data uji.
Langkah 9: Visualisasi Hasil
Visualisasikan data uji dan hasil prediksi dalam bentuk scatter plot.
Dengan mengikuti langkah-langkah di atas, Anda dapat melakukan analisis regresi linier pada data Anda, mengukur kinerja model, dan memvisualisasikan hasilnya.
Kode Lengkap
Last updated
Was this helpful?