“Statistics are the triumph of the quantitative method, and the quantitative method is the victory of sterility and death.”
Setelah kita membahas mengenai scaling data pada postingan Berkenalan dengan scikit-learn (Part 3) β Scaling Data Menjadi Standard Normal dan Berkenalan dengan scikit-learn (Part 4) β Scaling Data dengan MinMaxScaler. Kali ini kita juga akan membahas mengenai Imputation. π
Dalam ilmu statistika, imputation adalah proses substitusi nilai kosong (missing data/null value/not available) pada dataset. Terdapat beragam metode untuk menangani missing value ini, misalnya dengan menghapus seluruh baris data yang terdapat nilai kosong, mengganti nilai kosong dengan nilai rata-rata (mean) maupun nilai yang sering muncul (mode atau modus) apabila data tersebut numerik, dsb.
Imputation adalah topik yang sangat dalam, sehingga pada kesempatan kali ini, kita berkenalan saja dulu dengan dua contoh implementasinya menggunakan scikit-learn. Selamat membaca & mencoba! π