Data Collection
1. Identifikasi Sumber Data: Mengidentifikasi sumber-sumber data potensial yang relevan dengan tujuan analisis atau pemodelan yang ingin dilakukan. Sumber data ini bisa berupa database internal perusahaan, data daring, data sensor, atau data publik dari berbagai platform.
2. Penentuan Jenis Data: Menentukan jenis data yang diperlukan untuk mencapai tujuan analisis atau pemodelan, seperti data numerik, kategorikal, temporal, spasial, atau teks.
3. Perencanaan Pengumpulan Data: Merencanakan strategi pengumpulan data yang mencakup parameter seperti waktu, metode pengumpulan, alat yang digunakan, dan ukuran sampel yang dibutuhkan.
4. Pengumpulan Data: Melaksanakan proses pengumpulan data sesuai dengan rencana yang telah disusun, termasuk pengambilan sampel, survei, observasi, atau penggunaan sensor dan perangkat IoT.
5. Validasi Data: Memastikan keakuratan, keabsahan, dan kebersihan data yang dikumpulkan dengan melakukan verifikasi dan validasi data.
6. Pembersihan Data Awal: Melakukan pembersihan data awal untuk menghilangkan nilai yang hilang, outlier, atau nilai yang tidak valid.
7. Penggabungan Data: Menggabungkan data dari berbagai sumber atau tabel jika diperlukan untuk menyusun dataset yang lengkap dan bermutu.
Tahap pengumpulan data adalah langkah kritis dalam proses data mining karena kualitas dan relevansi data yang diperoleh akan mempengaruhi hasil akhir analisis atau pemodelan. Oleh karena itu, perencanaan yang cermat dan pemantauan yang teliti diperlukan untuk memastikan bahwa data yang dikumpulkan sesuai dengan kebutuhan dan tujuan analisis yang ditetapkan.
Komentar
Posting Komentar