Pramudiono
(2006) mengemukakan
bahwa pengertian data mining adalah adalah serangkaian proses untuk menggali
nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak
diketahui secara manual.
Lalu
Larose berpendapat bahwa
data mining adalah bidang yang digabung dari beberapa bidang keilmuan yang
menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik,
database, dan visualisasi untuk pengenalan permasalahan pengambilan informasi
dari database yang besar.
Pengertian
data mining menurut Jiawei bahwa data mining merupakan pemilihan atau “menambang”
pengetahuan dari jumlah data yang banyak.
Definisi
data mining menurut Berry bahwa
data mining adalah aktivitas mengeksplorasi dan menganalisis data jumlah yang
besar untuk menemukan pattern (pola) dan rule (aturan) yang berarti.
Hoffer dan McFadden
mengemukakan bahwa pengertian data mining adalah
penemuan pengetahuan dengan menggunakan teknik-teknik yang tergabung dari
statistik, tradisional, kecerdasan dan grafik komputer.
Pengertian data mining
menurut Turban,dkk.(2005) data mining adalah proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan mesin learning untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan
yang terkait berbagai database besar (baca pengertian database).
Istilah
Istilah khusus dalam Data Mining
- Data cleaning (untuk
menghilangkan noise data yang tidak konsisten)
- Data integration (di mana sumber
data yang terpecah dapat disatukan)
- Data selection (di mana data
yang relevan dengan tugas analisis dikembalikan ke dalam database)
- Data transformation (di mana
data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan
ringkasan performa atau operasi agresi)
- Data mining (proses esensial di
mana metode yang intelejen digunakan untuk mengekstrak pola data) –
Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik
yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang
menarik)
- Knowledge presentation (di mana
gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan
pengetahuan yang telah ditambang kpada user).
Rancangan bangun dari
data mining yang khas memiliki beberapa komponen utama yaitu : – Database, data
warehouse, atau tempat penyimpanan informasi lainnya. – Server database atau
data warehouse. – Knowledge base – Data mining engine. – Pattern evolution module.
– Graphical user interface.
Langkah
langkah dalam data mining
a.
Pembersihan data. Biasanya
terdapat data yang kurang bagus untuk dimasukkan dalam kelengkapan data
perusahaan karena hanya akan dianggap tidak valid bahkan untuk data yang
hilang. Sehingga data yang seperti itu lebih baik dibuang.
b.
Integrasi data
c.
Transformasi data : Beberapa
teknik data mining memerlukan format data yang khusus sebelum bisa digunakan
dan disebarluaskan. Dalam tahap ini, dilakukan pula pemilihan data yang
dibutuhkan oleh teknik data mining yang akan dipakai. Tahap inilah yang akan
menentukan kualitas dari data mining.
d.
Aplikasi teknik data mining
Ini merupakan salah
satu langkah dari proses data mining. Gunakan teknik data mining yang sesuai
dengan hasil yang dibutuhkan.
e.
Evaluasi pola yang ditemukan: Dalam tahap ini hasil dari teknik data mining berupa pola
pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesis
yang ada memang tercapai.
e.
Presentasi pola
Tahap terakhir dari
proses data mining adalah bagaimana formulasi keputusan atau aksi dari hasil
analisis dari data mining. Dalam presentasi ini, visualisasi juga dapat
membantu mengkomunikasikan hasil data mining
Tidak ada komentar:
Posting Komentar