SEMMA (Sample, Explore, Modify, Model, Assess)

 

SEMMA adalah akronim dari Sample, Explore, Modify, Model, dan Assess, sebuah model proses yang dikembangkan oleh SAS Institute untuk memandu pelaksanaan proyek data mining dengan fokus pada pengembangan dan penilaian model. Berikut adalah penjelasan singkat tentang setiap tahap SEMMA:
  • Sample (Sampel): Tahap ini bersifat opsional, yaitu mengambil sampel data dari dataset besar untuk menampung informasi signifikan, yang dapat dimanipulasi dengan cepat.
  • Explore (Eksplorasi): Tahap ini melibatkan eksplorasi data yang telah dikumpulkan untuk mencari tren dan anomali tak terduga, dengan tujuan memperoleh pemahaman dan ide-ide.
  • Modify (Modifikasi): Tahap ini melibatkan modifikasi data dengan menciptakan, memilih, dan mentransformasi variabel-variabel untuk fokus pada proses pemilihan model.
  • Model (Model): Tahap ini melibatkan pemodelan data yang telah dimodifikasi dengan menggunakan perangkat lunak untuk secara otomatis mencari kombinasi data yang dapat diandalkan untuk memprediksi hasil yang diinginkan.
  • Assess (Penilaian): Tahap ini melibatkan penilaian data dengan mengevaluasi kegunaan dan keandalan penemuan dari proses data mining serta mengevaluasi sejauh mana model tersebut berkinerja.
SEMMA memberikan panduan yang terstruktur untuk mengatasi langkah-langkah penting dalam proyek data mining, membantu memastikan bahwa analisis data dilakukan dengan metode yang sistematis dan efisien.

Komentar

Postingan populer dari blog ini

Quiz Data Mining Pertemuan 5

Data Cleaning

Data Collection