April 6, 2016

Pengertian Data Mining




Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining merupakan teknik yang menggabungkan teknik analisis data dengan algoritma untuk melakukan analisis data dan menemukan pola-pola penting data.

Secara sederhana, data mining atau penambangan data dapat didefinisikan sebagai proses seleksi, eksplorasi, dan pemodelan dari sejumlah besar data untuk menemukan pola atau kecenderungan yang biasanya tidak disadari keberadaannya [HAN-01]. Data mining dapat dikatakan sebagai proses mengekstrak pengetahuan dari sejumlah besar data yang tersedia [HAN-01]. Pengetahuan yang dihasilkan dari proses data mining harus baru, mudah dimengerti, dan bermanfaat. Dalam data mining, data disimpan secara elektronik dan diproses secara otomatis oleh komputer menggunakan teknik dan perhitungan tertentu.

Alasan-alasan  utama dalam penggunaan data mining adalah [HAN-01]:

1. Banyaknya jumlah data yang ada dan akan terus  meningkatnya jumlah data. 
2. Kebutuhan untuk menginterpretasikan data


Ada beberapa definisi data mining, diantaranya:

1.   Data mining adalah disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pangetahuan dari data atau informasi yang kita miliki [1].

2.   Data mining adalah suatu proses otomatis terhadap data yang sudah ada, data yang diproses berupa data yang sangat besar [2].
3.   Data mining ( knowledge   discovery in database ) adalah kegiatan yang  meliputi  pengumpulan,  pemakaian  data  historis  untuk menemukan  keteraturan, pola atau hubungan dalam set data beukuran besar [3]
 4. Data mining adalah bagian integral dari knowledge discovery in databases (KDD). 
5.   Data mining adalah sebuah proses percarian secara otomatis informasi yang berguna dalam tempat penyimpanan data berukuran besar

Dari beberapa definisi diatas maka dapat disimpulkan bahwa, data mining adalah metode secara otomatis menemukan informasi yang berguna dan tersimpan pada data dengan ukuran yang sangat besar sehingga ditemukan pola menarik yang sebelumnya tidak diketahui. Teknik data mining difungsikan untuk mendapatkan deskripsi dari data dan mendapatkan model dari data yang berguna untuk prediksi. Deskripsi berarti menemukan pola yang mudah dipahami oleh pengguna dalam menggambarkan data, contohnya: Clustering, Association Rule Discovery, Sequential Pattern Discovery, sedangkan prediksi berarti menemukan pola untuk memprediksi nilai dari suatu variabel yang nilainya belum diketahui contohnya: Classification, Regression, Deviation Detection. Kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. 

Ada beberapa karakteristik dari data mining diantaranya:

a.  Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya. 
b. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya. 
c.  Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.