⏳UAS
Mata Kuliah: Datawarehouse Dosen: Vit Zuraida, S.Kom., M.Kom Endah Septa Sintiya, S.Pd., M.Kom. Vipkas Al Hadid Firdaus, S.T., M.T Waktu: 60 menit Prodi/Kelas: D4 Sistem Informasi Bisnis / SIB 2A-2G Sifat: Praktikum (Non PBL)
1. Cari Studi Kasus Pengelolaan Data
Cari studi kasus pengelolaan data dalam konteks perusahaan atau organisasi pada sumber data publik online, misalnya Kaggle, data.gov, atau repositori data dummy.
Pilih minimal 4 kasus sebagai berikut:
Data Karyawan – atribut seperti ID karyawan, nama, jabatan, departemen, gaji, tanggal masuk, dll.
Data Penjualan – atribut seperti ID transaksi, tanggal, produk, jumlah, harga, pelanggan, dll.
Data Inventaris – atribut seperti ID barang, nama barang, kategori, jumlah stok, lokasi gudang, dll.
Data Pelanggan – atribut seperti ID pelanggan, nama, alamat, histori pembelian, kategori pelanggan, dll.
Pastikan data dummy yang dipilih tersedia, lengkap, dan dapat digunakan untuk pembangunan proyek ETL dan data warehouse.
2. Pilih Studi Kasus yang Memenuhi Kriteria
Pilih satu studi kasus yang paling lengkap dan sesuai untuk kebutuhan analisis ETL dan desain data warehouse.
Pastikan data mudah diakses dan digunakan secara legal untuk proyek.
3. Ambil Data Dummy dari Studi Kasus Terpilih
Download atau akses data dummy tersebut.
Periksa format data (CSV, JSON, Excel, dsb) dan atribut yang tersedia.
4. Rancang Skema Bintang (Star Schema) untuk Data Warehouse
Tentukan tabel fakta dan tabel dimensi berdasarkan data studi kasus.
Contoh untuk kasus data karyawan:
Tabel Fakta:
Fact_Penggajian
(atribut: gaji, bonus, tanggal pembayaran, id_karyawan, id_departemen, dll)Tabel Dimensi:
Dim_Karyawan
(id_karyawan, nama, tanggal_lahir, jenis_kelamin, status_kerja, dll)Dim_Departemen
(id_departemen, nama_departemen, lokasi)Dim_Jabatan
(id_jabatan, nama_jabatan, level)Dim_Waktu
(id_waktu, tanggal, bulan, tahun)
Untuk kasus lain, sesuaikan skema, misal:
Data Penjualan:
Fact_Penjualan
,Dim_Produk
,Dim_Pelanggan
,Dim_Waktu
Data Inventaris:
Fact_Stok
,Dim_Barang
,Dim_Gudang
,Dim_Waktu
Tentukan relasi antar tabel melalui foreign key.
5. Rancang Proyek ETL Berdasarkan Skema Bintang
Buat pipeline ETL yang terdiri dari:
Extract: Mengambil data dari sumber data dummy (file CSV, database, API, dsb).
Transform: Membersihkan data, mengubah format data, konversi tipe data, agregasi, dan transformasi lainnya sesuai kebutuhan.
Load: Memasukkan data yang sudah bersih dan siap ke dalam tabel fakta dan dimensi di data warehouse.
6. Jelaskan Langkah-Langkah Proses ETL
Extract: Membaca data dummy dari sumber, misalnya membaca file CSV berisi data karyawan atau data lain.
Transform: Melakukan pembersihan data seperti memperbaiki format tanggal, normalisasi nama atau kategori, menghapus data duplikat, menyesuaikan struktur data sesuai skema star schema.
Load: Memasukkan data ke tabel fakta dan dimensi dengan memperhatikan integritas data, kunci primer, dan relasi antar tabel.
7. Buat Laporan/Dokumentasi Proyek ETL
Jelaskan seluruh proses pembangunan proyek ETL mulai dari pengambilan data dummy, perancangan skema, implementasi pipeline ETL.
Jelaskan hasil yang diperoleh, misalnya data yang sudah terstruktur di data warehouse dan contoh hasil query atau dashboard.
Analisis KPI (Key Performance Indicators) seperti:
Waktu proses ETL
Konsistensi dan kualitas data
Akurasi dan kelengkapan data dalam warehouse
8. Pengumpulan:
Kumpulkan semua file proyek di repository GitHub kelas masing-masing, dengan folder terpisah per individu.
Sertakan file dengan ekstensi .etl
yang berisi pipeline ETL dan laporan dalam format PDF sebagai dokumentasi.
Last updated
Was this helpful?