Bahasannya mencakup : pendahuluan, pengertian DaMing, DaMing dalam KDD, Arrsitektur DaMing, Data mining tasks, aplikasi daMing.
Pendahuluan
- Masalah Eksplorasi Data. Penumpukan data dalam database, data warehouse, dll.
“Kita telah tenggelam dalam data, tetapi kelaparan untuk mendapatkan pengetahuan/informasi!”
- Solusi : data warehousing dan data mining –> ekstraksi pengetahuan yang menarik dari basis data berukuran besar
- mencari informasi ‘tersembunyi’ dari data (kita belum tahu hasilnya apa, tidak seperti meng-query)
- untuk menganalisis data (data tidak hanya dikumpulkan)
Pengertian Data Mining
Ekstraksi Informasi/Pola yang menarik dalam basis data berukuran besar
istilah lain: Knowledge Discovery in Database, knowledge extraction, bussiness intelligence, dll.
berikut ini bukan termasuk data mining task :
- Pemrosesan (deduktif) Queri
- Sistem Pakar
Data mining berkaitan erat dengan machine learning, AI, statistika, dan sistem basis data. Katanya buku,
Secara khusus, data mining menggunakan ide-ide seperti (1) pengambilan contoh, estimasi, dan pengujian hipotesis, dari statistika dan (2) algoritme pencarian, teknik pemodelan, dan teori pembelajaran dari kecerdasan buatan, pengenalan pola, dan machine learning.
Data Mining sebagai proses dalam Knowledge Discovery in Data (KDD)
Data mining adalah elemen utama dalam proses knowledge discovery, lengkapnya sbb..

Data Mining dalam proses KDD
Proses dalam KDD
- Data cleaning. menghilangkan noise.
- Integrasi Data.
- Seleksi
- Transformasi Data
- Data Mining
- Evaluasi Pola
- Presentasi Pengetahuan
Arsitektur Data Mining

Arsitektur Data Mining
Data Mining Tasks– Tugas-tugas Data Mining
Tugas-tugas dalam data mining secara umum dibagi ke dalam dua ketegori utama :
- Prediktif. Memprediksi atribut target (variabel tak bebas) berdasarkan atribut-atribut lainnya (variabel bebas/explanatory)
- Deskriptif. Menemukan pola-pola yang meringkas hubungan dalam data.
Tugas-tugas dalam data mining :
- Asosiasi (correlation dan causality)/(hubungan dan sebab-akibat).
- Klasifikasi dan Prediksi. Menemukan model (fungsi) yang membedakan kelas untuk prediksi mendatang.
- Analisis Cluster. Label kelas tidak diketahui. Prinsip : memaksimumkan kemiripan intra(di dalam)kelas, dan meminimumkan kemiripan interkelas.
Aplikasi
Contohnya diantaranya: segmentasi pasar, direct marketing, penempatan barang di supermarket. Contoh penempatan barang di supermarket: dari data pembelian dapat dicari pengetahuan mengenai barang apa yang dibeli oleh pembeli saat ia membeli barang X, penempatan barang itu dapat diatur di dekat untuk kenyamanan pembeli.
*sumber : catatan, slide, diktat bab1. Mohon merujuk ke sumber yang lebih terpercaya..*
: )