36
Data Mining http://www.unhas.ac.id/amil/S1TIF/DM2020/ L1 Amil Ahmad Ilham

Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data Mininghttp://www.unhas.ac.id/amil/S1TIF/DM2020/

L1

Amil Ahmad Ilham

Page 2: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Administrasi Kuliah

• Kuliah 4 sks:• 2 sks teori = 2 x 50 menit = 100 menit

• 2 sks praktek (kerja mandiri) = 4 x 50 menit = 200 menit

• Total waktu belajar = 300 menit.

• Jadwal kuliah:• Selasa: 10.00 – 12.30 (150 menit)

Page 3: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

CPMK (Capaian Pembelajaran MK)

• Mahasiswa memahami konsep, algoritma, dan tool data mining

• Mahasiswa memahami seluruh proses data mining

• Mahasiswa mampu melakukan eksperimen berdasarkan proses data mining dan menggunakan tool data mining

• Mahasiswa memahami arah terbaru penelitian data mining

• Mahasiswa mampu melakukan penelitian pada topik data mining

Page 4: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Mengintip Ekosistem Big Data di Gojek

• Download bahan bacaan di http://www.unhas.ac.id/amil/S1TIF/DM2020/

Page 5: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Big Data CultureBig Data Culture

5

Page 6: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Model of Generating/Consuming Data

6

Page 7: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Manusia Memproduksi Data

7

Page 8: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Perubahan Kultur dan Perilaku

8

Page 9: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Source of Big Data

9

Page 10: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Source of Big Data

10

Page 11: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

11

Page 12: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Mengapa diperlukan Data Mining?

Page 13: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

13

Page 14: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data - Informasi – Pengetahuan

Data Kehadiran Pegawai14

NIP TGL DATANG PULANG

1103 02/12/2004 07:20 15:40

1142 02/12/2004 07:45 15:33

1156 02/12/2004 07:51 16:00

1173 02/12/2004 08:00 15:15

1180 02/12/2004 07:01 16:31

1183 02/12/2004 07:49 17:00

Page 15: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data - Informasi – Pengetahuan

Informasi Akumulasi Bulanan Kehadiran Pegawai15

NIP Masuk Alpa Cuti Sakit Telat

1103 22

1142 18 2 2

1156 10 1 11

1173 12 5 5

1180 10 12

Page 16: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data - Informasi – Pengetahuan

Pola Kebiasaan Kehadiran Mingguan Pegawai16

Senin Selasa Rabu Kamis Jumat

Terlambat 7 0 1 0 5

Pulang Cepat

0 1 1 1 8

Izin 3 0 0 1 4

Alpa 1 0 2 0 2

Page 17: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data - Informasi – Pengetahuan - Kebijakan

• Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat

• Peraturan jam kerja:• Hari Senin dimulai jam 10:00

• Hari Jumat diakhiri jam 14:00

• Sisa jam kerja dikompensasi ke hari lain

17

Page 18: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Cek di Google Search

• Uber

• Google

• Alibaba

• Airbnb

• Gojek

• Groceria

Apa kesamaan dari perusahaan di atas?

18

Page 19: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

19

Page 20: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

20

Apa itu Data Mining?

Page 21: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

• Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuanatau menemukan pola dari suatu data yang besar

• Ekstraksi dari data ke pengetahuan:1. Data: fakta yang terekam dan tidak membawa arti2. Pengetahuan: pola, rumus, aturan atau model yang muncul dari data

• Nama lain data mining:• Knowledge Discovery in Database (KDD)• Knowledge extraction• Pattern analysis• Information harvesting• Business intelligence

21

Apa itu Data Mining?

Page 22: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Apa Itu Data Mining?

22

HimpunanData

Metode Data Mining

Pengetahuan

Page 23: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

• Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Wittenet al., 2011)

• Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007)

• Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data (Han et al., 2011)

23

Definisi Data Mining

Page 24: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Data Mining pada Business Intelligence

24

Increasing potentialto support business decisions

End User

Business Analyst

Data Analyst

DBA

Decision Making

Data Presentation

Visualization Techniques

Data MiningInformation Discovery

Data Exploration

Statistical Summary, Querying, and Reporting

Data Preprocessing/Integration, Data Warehouses

Data SourcesPaper, Files, Web documents, Scientific experiments, Database Systems

Page 25: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Hubungan dengan Berbagai Bidang

Data Mining

Machine Learning

Pattern Recognition

StatisticsComputing Algorithms

Database Technology

High Performance Computing

25

Page 26: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Teknik Data Mining

Page 27: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Peran Utama Data Mining

27

1. Estimasi

2. Prediksi

3. Klasifikasi4. Klastering

5. Asosiasi

Page 28: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Algoritma Data Mining (DM)

1. Estimation (Estimasi):• Linear Regression, Neural Network, Support Vector Machine, etc

2. Prediction/Forecasting (Prediksi/Peramalan):• Linear Regression, Neural Network, Support Vector Machine, etc

3. Classification (Klasifikasi):• Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis,

Logistic Regression, etc

4. Clustering (Klastering):• K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc

5. Association (Asosiasi):• FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc

28

Page 29: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Estimasi Waktu Pengiriman Pizza

Customer Jumlah Pesanan (P) Jumlah Traffic Light (TL) Jarak (J) Waktu Tempuh (T)

1 3 3 3 16

2 1 7 4 20

3 2 4 6 18

4 4 6 8 36

...

1000 2 4 2 12

29

Waktu Tempuh (T) = 0.48P + 0.23TL + 0.5JPengetahuan

Pembelajaran denganMetode Estimasi (Regresi Linier)

Label

Page 30: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan
Page 31: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Klasifikasi

Page 32: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan
Page 33: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan
Page 34: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan
Page 35: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

35

Page 36: Data Miningunhas.ac.id/amil/S1TIF/DM2020/01 DM 2020.pdf•Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan

Tugas #1

• Buat essay minimal 2 halaman, 1 spasi, font 12, dari informasi yang ada di slide (submit dalam bentuk file word di Sikola sebelumpertemuan kedua)

• Cari minimal 1 paper (proceeding atau jurnal internasional) terkaitdengan data mining (lihat contoh slide 29-35)• Tunjukkan softfile paper tersebut dan jelaskan secara singkat pada pertemuan

berikutnya.