76
ANALISA DATA MINING Lathifah Nur Aini (201210370311241) Imroatus Sholiha (201210370311271) Anggraini Fahrunnisah (201210370311305)

analisa data mining

  • Upload
    somness

  • View
    258

  • Download
    1

Embed Size (px)

DESCRIPTION

slide presentasi analisa data mining

Citation preview

KNN

ANALISA DATA MINING

Lathifah Nur Aini (201210370311241)Imroatus Sholiha (201210370311271)Anggraini Fahrunnisah (201210370311305)KNNAlgoritmaK-Nearest Neighbor(KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikankruang berdimensi banyak, dimana masing masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruangan ini ditandai dengan kelasc, jika kelascmerupakan klasifikasi yang paling banyak ditemui padakbuah tetangga terdekat titik tersebut.Data 1

Data 2

Proses Implementasi Algoritma KNN di rapid minerData 1

Proses Implementasi Algoritma Perceptron di rapid minerData 2

Kita akan menguji coba metode KNN dengan data 1 dan data 2 serta menggunakan penghitungan jarak Euclidean distance dan Cosine similarityDATA 1K=10 dengan Euclidean Distanceaccuracy = 92,7 %

K=10 dengan Cosine Similarityaccuracy : 93,1 %

K=20 dengan Euclidean Distanceaccuracy : 92,7 %

K=20 dengan Cosine Similarityaccuracy : 92,9 %

DATA 2

K=10 dengan Euclidean Distanceaccuracy : 91,9 %

K=10 dengan Cosine Similarityaccuracy : 93,5 %

K=20 dengan Euclidean Distanceaccuracy : 91,6%

K=20 dengan Cosine Similarityaccuracy : 93,5 %

KesimpulanDari percobaan diatas didapat bahwa jika menggunakan penghitungan jarak Euclidean distance, akurasi lebih besar data 2Menggunakan penghitungan jarak cosine similarity, akurasi lebih besar data 1ID3ID3 merupakan algoritma yang dipergunakan untuk membangun sebuahdecision treeatau pohon keputusan.Data 1

Data 2

Proses Implementasi Algoritma ID3 di rapid minerData 1

Proses Implementasi Algoritma ID3 di rapid minerData 2

Gain ratioaccuracy : 49,3%

Information gainaccuracy : 49,3%

Gini indexaccuracy : 49,3%

Accuracy : 49,3%

Data 2Gain ratioaccuracy : 52%

Information gainaccuracy : 52%

Gini indexaccuracy : 52%

Accuracy : 52%

Kesimpulan Pada algoritma menggunakan ID3, data 1 dan data 2 sama sama menghasilkan akurasi yang sama pada setiap kriteria ALGORITMA NAVE BAYESPengertian Algoritma Naive Bayes merupakan Data 1

Data 2

Proses implementasi algoritma nave bayes pada rapidminerData 1

Nextkemudian klik 2x pada validation dan akan muncul dua colom yang berisi data training dan data testing. Pada kolom testing berisi tentang algoritma nave bayes yang akan dianalisa sendangkan pada data testing berisi tentang apply model dan performance. Lalu hubungkan antara data training dengan data testing sesuai dengan ketentuan.

Proses implementasi algoritma nave bayes pada rapidminerData 2

Next

Tahap pengujianSetelah data training dan data testing saling terhubung, kita akan melakukan uji coba dengan menggunakan metode algoritma nave bayes pada data 1 dan data 2DATA 1K = 10 dengan type stratified sampling Accuracy = 93.90%

DATA 1K = 20 dengan type stratified sampling Accuracy = 93.80%

DATA 2K = 10 dengan type stratified sampling Accuracy = 91.30%

DATA 2K = 20 dengan type stratified sampling Accuracy = 91.40%

Kesimpulan Dari percobaan diatas dapat disimpulkan bahwa setiap kelipatan K= 10,20 dst, tingkat kenaikan accuracy dari data 1 dan data 2 sama dengan 0.10%Dan tingkat accuracy lebih besar data 1 di bandingkan data 2PERCEPTRONPengertian Perceptron merupakan Data 1

Data 2

Proses implementasi perceptron pada rapidminerData 1

Nextkemudian klik 2x pada validation dan akan muncul dua colom yang berisi data training dan data testing. Pada kolom testing berisi tentang algoritma perceptron yang akan dianalisa, sendangkan pada data testing berisi tentang apply model dan performance. Lalu hubungkan antara data training dengan data testing sesuai dengan ketentuan.

Proses implementasi perceptron pada rapidminerData 2

Next

Tahap pengujianSetelah data training dan data testing saling terhubung, kita akan melakukan uji coba dengan menggunakan metode perceptronpada data 1 dan data 2DATA 1K = 10 dengan learning rate = 0.1Accuracy = 88.60%

DATA 1K = 20 dengan learning rate = 0.1Accuracy = 88.40%

DATA 2K = 10 dengan learning rate = 0.1Accuracy = 81.40%

DATA 2K = 20 dengan learning rate = 0.1Accuracy = 81.80%

Kesimpulan Dari percobaan diatas dapat disimpulkan bahwa metode perceptron akan terus melakukan eksekusi atau perulangan sampai nilai accuracy stabil yaitu memiliki minimal 3 nilai accuracy yang sama secara berurutan pada setiap kelipatan K= 10,20 dst, dan learning rate = 0.1 Dan tingkat accuracy lebih besar data 1 di bandingkan data 2ANN (Artificial Neural Network)Neural networkSistem komputasi dimana arsitektur ddan komputasi di pelajari dari pegetahuan tentang sel saraf dalam otak. Atau dapat disebut model yang meniru cara kerja jaringan neural biologis.Neuron dikelompokkan dalam layer, disebut neuron layer. Tiap neuron dari sebuah layer dihubungkan ke semua neuron yang ada di layer belakang atau depan(kecuali input,output). Informasi yang dikirim di sebuah NN, dipropagasi layer-per-layer mulai input sampai output tanpa / melalui 1 atau lebih hidden layer. Data 1

Data 2

Proses implementasi Data 1 ANN di Rapid Miner

Proses implementasi Data 2 di Rapid Miner

Melakukan Uji coba dan analisa Data 1 dan Data 2menggunakan ANN dengan mengubah learning rate = 0.1 dan momentum = 0, dengan rounds mulai dari 10, 20, 30,...100, 200, 300, ..., 1000, 2000, 3000,...)Data 1Percobaan pertama k=10, accuracy = 92.7%

Baru pada k=80, k=90, dan k=100 dengan accuracy stabil = 92.9%

Data 2Percobaan pertama k= 10 dengan accuracy= 92.4%

Baru pada k=200, k=300, k=400 dengan accuracy stabil =93.3%

KesimpulanPada data 1, perbandingan accuracy k=10 dan k=100 adalah 0,2Pada data 2, perbandingan accuracy k-10 dan k-400 adalah 0,9