Pengantar Data Mining

Bahasannya mencakup : pendahuluan, pengertian DaMing, DaMing dalam KDD, Arrsitektur DaMing, Data mining tasks, aplikasi daMing.

 

Pendahuluan

  • Masalah Eksplorasi Data. Penumpukan data dalam database, data warehouse, dll.   “Kita telah tenggelam dalam data, tetapi kelaparan untuk mendapatkan pengetahuan/informasi!”
  • Solusi : data warehousing dan data mining –>  ekstraksi pengetahuan yang menarik dari basis data berukuran besar
  • mencari informasi ‘tersembunyi’ dari data (kita belum tahu hasilnya apa, tidak seperti meng-query)
  • untuk menganalisis data (data tidak hanya dikumpulkan)

 

Pengertian Data Mining

 Ekstraksi Informasi/Pola yang menarik dalam basis data berukuran besar

istilah lain: Knowledge Discovery in Database, knowledge extraction, bussiness intelligence, dll.

berikut ini bukan termasuk data mining task :

  • Pemrosesan (deduktif) Queri
  • Sistem Pakar

Data mining berkaitan erat dengan machine learning, AI, statistika, dan sistem basis data.  Katanya buku, 

Secara khusus, data mining menggunakan ide-ide seperti (1) pengambilan contoh, estimasi, dan pengujian hipotesis, dari statistika dan (2) algoritme pencarian, teknik pemodelan, dan teori pembelajaran dari kecerdasan buatan, pengenalan pola, dan machine learning.

 

 

Data Mining sebagai proses dalam Knowledge Discovery in Data (KDD)

Data mining adalah elemen utama dalam proses knowledge discovery, lengkapnya sbb..

 

Data Mining dalam proses KDD

Data Mining dalam proses KDD

 Proses dalam KDD

  1. Data cleaning. menghilangkan noise.
  2. Integrasi Data.
  3. Seleksi
  4. Transformasi Data
  5. Data Mining
  6. Evaluasi Pola
  7. Presentasi Pengetahuan

 

 

Arsitektur Data Mining

Arsitektur Data Mining

Arsitektur Data Mining

 

 

Data Mining Tasks– Tugas-tugas Data Mining

Tugas-tugas dalam data mining secara umum dibagi ke dalam dua ketegori utama :

  • Prediktif. Memprediksi atribut target (variabel tak bebas) berdasarkan atribut-atribut lainnya (variabel bebas/explanatory)
  • Deskriptif. Menemukan pola-pola yang meringkas hubungan dalam data.

 

Tugas-tugas dalam data mining :

  • Asosiasi (correlation dan causality)/(hubungan dan sebab-akibat).
  • Klasifikasi dan Prediksi. Menemukan model (fungsi) yang membedakan kelas untuk prediksi mendatang.
  • Analisis Cluster. Label kelas tidak diketahui. Prinsip : memaksimumkan kemiripan intra(di dalam)kelas, dan meminimumkan kemiripan interkelas.

Aplikasi

Contohnya diantaranya: segmentasi pasar, direct marketing, penempatan barang di supermarket.  Contoh penempatan barang di supermarket:  dari data pembelian dapat dicari pengetahuan mengenai barang apa yang dibeli oleh pembeli saat ia membeli barang X, penempatan barang itu dapat diatur di dekat untuk kenyamanan pembeli.

 

*sumber : catatan, slide, diktat bab1.  Mohon merujuk ke sumber yang lebih terpercaya..*

: )

4 Tanggapan to this post.

  1. mau tanya nie, kalo Decision Support System (DSS) termasuk data mining ga??? :P

  2. He, perasaan Sule dah nanya ma Bu Dosen juga ya kemarin. ayo Le, jelasin! :)
    mm,, kan diantara bagian dari DSS itu adalah aktivitas decision making,, terus… kalau lihat gambar yang ada di slide kemarin…
    gambar ini

    mm, katanya gambar kan Decison Making itu ada di tingkat teratas, jadi,,,, kayaknya c…(he.. sotoy mode starting..) data mining itu salah satu cara/metode/bagian dalam DSS, sedangkan DSS nya itu sendiri lebih kompleks dari sekedar penambangan data untuk pencarian informasi berharga.

    terus dari pdf diktat bab1 halmn 2 ada tulisan bgini :

    Hasil dari data mining sering kali diintegrasikan dengan decision support system (DSS). Sebagai contoh, dalam aplikasi bisnis informasi yang dihasilkan oleh data mining dapat diintegrasikan dengan tool manajemen kampanye produk sehingga promosi pemasaran yang efektif yang dilaksanakan dan dapat diuji

    he… ngarang-ngarang aja nih… gak tau deh Le. emang kemarin kata Ibunya gmana?

  3. Posted by poetri on 26 Februari 2009 at 10:40

    iya menurutku juga begitu, za. DSS bukan termasuk dalam proses datamining. Proses data mining itu selesai sampai menghasilkan suatu informasi valid yang berguna, dalam hal ini misalnya berguna dalam proses pengambilan keputusan. Jadi hasil dari data mining itu yang kemudian dipake dalam DSS. Hihiihihi ga yakin juga ding ^_^

  4. ada yang tahu informasi tentang data mining untuk prediksi gempa nggak?

Tanggapi posting ini