Penerapan Data Mining Untuk Menampilkan Informasi
Pertumbuhan Berat Badan Ideal Balita dengan
Menggunakan Metode Naive Bayes Classifier
Octia Nuraeni
55410244
Teknik Informatika
Pembimbing : Dr. Riza Adrianti S, Skom., MMSI
LATAR BELAKANG
• Perkembangan teknologi informasi yang semakinpesat
• Penggunaan konsep data mining
• Pertumbuhan dan perkembangan anak balitayang ideal merupakan hal penting dan sangatdiinginkan bagi setiap orang tua.
• Agar hasil pengukuran berat badan balitamendapatkan hasil yang optimal makadigunakan teknik data mining dengan algoritmaNBC (Naïve Bayes Classifier).
BATASAN MASALAH
Lokasi Penelitian:
Posyandu G 20 A RW 022 wilayah RW 022, Harapan
Jaya Bekasi Utara
Responden:
Para Kader Posyandu dan Orangtua Balita
Waktu Penelitian :
Bulan Mei 2014
Metode:
Teknik Data Mining Klasifikasi, Naive Bayes Classifier
Dataset :
Data penimbangan balita yang berjumlah
250 instances
Permasalahan:
Menerapkan teknik data mining untuk menampilkaninformasi
pertumbuhan berat badan ideal balita menggunakan software
aplikasi WEKA V3.6.9
TUJUAN PENULISAN
Menerapkan teknik data mining denganalgoritma Naive Bayesian Classifier untukmenampilkan informasi yang berhargadari data posyandu mengenaipertumbuhan balita ideal dan tidak idealdi wilayah RW 022 Posyandu G 20 A,Harapan Jaya Bekasi Utara
1
Menganalisis data balita di PosyanduG 20 A dan membuktikan kebenarandari teknik data mining denganmengukur hasil akurasinya.
2
ANALISA DAN PEMBAHASAN
• Data mining adalah suatu disiplin ilmu atau teknik menggaliinformasi berharga yang tersembunyi pada suatu databasedengan volume besar sehingga ditemukan suatu pola yangmenarik yang sebelumnya tidak diketahui.
• Klasifikasi adalah proses untuk menemukan model atau fungsiyang menjelaskan atau membedakan suatu class data, dengantujuan untuk dapat memperkirakan class dari suatu atribut yanglabelnya tidak diketahui.
• Algoritma Naive Bayes adalah salah satu algoritma dalam teknikklasifikasi yang mudah diimplementasikan dan cepat prosesnya.
ANALISA DAN PEMBAHASAN
• Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakukanteknik pengklasifikasian dengan menghitung derajat kecocokandengan cara membandingkan nilai Posterior untuk masing-masingclass, dan mengambil class dengan nilai Posterior yang tinggi.
Rumus Naive Bayes Classifier
atau
• Untuk klasifikasi dengan data kontinyu digunakan rumus DensitasGauss :
ANALISA DAN PEMBAHASAN
Class Name : Tabel 1. Data Training Balita : data_posyandu.csv
Pertumbuhan Berat Badan Ideal Balita
Class Label Attribut :
Ideal = [ Ya | Tidak ]
Identifier :
Nama Balita
Attribut/Variabel dan Anggota attribut
- Usia [ <=12 | 13...24 | 25...36 |
37...48 | 49...60 ]
- Status [ Bayi | Balita ]
- Berat Badan
- Hasil Berat Badan [ Underweight |
Normal | Overweight ]
- Jenis Kelamin [ Laki-laki | Perempuan ]
ANALISA DAN PEMBAHASAN
Rancangan Algoritma Naive Bayes 1. Menghitung jumlah class atau label attribut
P(Ya) = 222/250 = 0,888 → Jumlah data “Ya” pada data training dibagi dengan jumlah keseluruhan data.
P(Tidak) = 28/250 = 0,112 → Jumlah data “Tidak” pada data training dibagi dengan jumlah keseluruhan data.
2. Apabila data numerik, hitung mean dan standar deviasi setiap atribut/variabel
Kemudian menghitung densitas Gauss data menggunakan persamaan dibawah ini.
ANALISA DAN PEMBAHASAN
3. Menghitung jumlah kategori atribut yang sama dengan class yang sama
P(Status = Bayi |Ya) = 21/222 = 0,094 P(Berat Badan = 8 | Ya) = 0,394
P(Status = Bayi | Tidak) = 1/28 = 0,036 P(Berat Badan = 8 | Tidak) = 0,527
P(Usia = <=12 | Ya) = 21/222 = 0,094
P(Usia = <=12 | Tidak) = 1/28 = 0,036
P(Hasil Berat Badan = Normal | Ya) = 212/222 = 0,955
P(Hasil Berat Badan = Normal | Tidak) = 0/28 = 0
P(Jenis Kelamin = Laki-laki|Ya) = 115/222 = 0,518
P(Jenis Kelamin = Laki-laki | Tidak) = 14/28 = 0,5
4. Kalikan semua hasil atribut Ya dan Tidak, kemudian hitung probabilitas setiap kategori dari input yang diberikan
P(Ya) = P(Status = Bayi|Ya) × P(Usia = <=12|Ya) × P(Berat Badan = 8|Ya) ×P(Hasil Berat Badan = Normal|Ya) × P(Jenis Kelamin = Laki-laki|Ya) × P(Ya)
= 0,094 × 0,094 × 0,394 × 0,955 × 0,518 × 0,888
= 1,53 × 10-3
ANALISA DAN PEMBAHASAN
P(Tidak) = P(Status = Bayi|Tidak) × P(Usia = <=12|Tidak) × P(Berat Badan = 8|Tidak) × P(Hasil Berat Badan = Normal|Tidak) × P(Jenis Kelamin = Laki-laki|Tidak) × P(Tidak)
= 0,036 × 0,036 × 0,527 × 0 × 0,5 × 0,112
= 0
Probabilitas Ya = = 1 × 100 % = 100 %
Probabilitas Tidak = = 0 × 100 % = 0 %
5. Bandingkan hasil class Ya, dan Tidak
Dari hasil diatas, terlihat bahwa nilai probabilitas tertinggi ada pada kelas (P|Ya) sehingga dapat disimpulkan bahwa bayi yang bernama Alvin Chandra masuk dalam klasifikasi “Ya”. Artinya bayi tersebut memiliki pertumbuhan berat badan ideal.
ANALISA DAN PEMBAHASAN
• Perbandingan hasil yang didapat secara real (perhitungan manualberdasarkan Metode Konvensional dan Tabel Berat Badan Ideal Anakmenurut WHO) dengan hasil yang didapat dari perhitunganmenggunakan tools WEKA dengan teknik classifier NaiveBayes, sepertiyang terlihat pada tabel 2.
Tabel 2. Perbandingan Hasil Perhitungan Secara Manual dengan Metode Naive Bayes Classifier Menggunakan WEKA
SIMPULAN
• Melalui teknik data mining yang digunakan, penulis telah berhasilmengumpulkan, menganalisa, dan mengklasifikasikan data balitasebanyak 250 instances mengenai pertumbuhan berat badan ideal dantidak ideal balita di wilayah RW 022 Posyandu G20 A, Harapan JayaBekasi Utara pada bulan Mei tahun 2014. Penggunaan aplikasi WEKAdirasa dapat mempermudah para kader posyandu dalam menampilkaninformasi pertumbuhan berat badan ideal balita.
• Berdasarkan hasil uji coba terhadap tools WEKA, terdapat sedikitperbedaan dari tingkat kevalidan hasil perhitungan status berat badanideal dengan teknik classifier NaiveBayes. Dari 250 data instances,terdapat 240 data yang sesuai dengan class yang diberikan dan 10 datayang tidak sesuai dengan hasil yang diberikan. Hal ini dapat terjadikarena data training yang digunakan cukup akurat, sehinggaperhitungan presentase tingkat akurasinya sebesar 96%.
SARAN
• Penelitian lanjutan dapat juga dilakukan dengan menggabungkanmetode Bayes dengan metode lain seperti Association Rules,Decision Tree, Neural Network (NN) dan Support Vector Machine(SVM). Hasil dari perangkat lunak WEKA hanya bisa digunakansesuai dengan apa yang sudah dilatih menggunakan datatraining, sehingga keakuratan data harus tetap terjaga agarmampu memberikan hasil yang lebih signifikan.
• Penulis juga berharap pada penelitian lanjutan bisadiimplementasikan melalui bahasa pemrograman seperti Java,Visual Basic, Matlab, dan lain sebagainya, sehingga penerapanteknik data mining dapat lebih dimengerti oleh user apabiladiimplementasikan kedalam suatu aplikasi.
DAFTAR PUSTAKA[1] Aplikasi Weka. http://sourceforge.net/projects/weka/. Tanggal akses 19 Mei 2014 pukul 12.17.
[2] Budi, Santoso. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta:Graha Ilmu.
[3] Bustami. Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi. http://ejurnal.tif.unimal.ac.id/index.php/ejournal/article/download/37/22 Tanggal akses 30 Juni 2014 pukul 12:17
[4] Danone Institue. Prinsip 4: Pentingnya Menjaga Berat Badan Ideal Pada Anak. http://www.danonenutrindo.org/prinsip4_anak_anak.php. Tanggal akses 08 Agustus 2014 pukul 12:50
[5] Fauzy, Nurrochim. 2013. Sistem Pendukung Keputusan Berbasis Android Sebagai Penentu Kelayakan Peminjaman Uang Menggunakan Metode Naive Bayes. Jakarta:Universitas Persada Indonesia YAI
[6] Haryanto. 2012. Teknik Data Mining Untuk Mendapatkan Informasi Dari Keluaran Perangkat Jaringan. Jakarta:Binus University
[7] Kusumadewi, Sri. 2009. Klasifikasi Status Gizi Menggunakan Algoritma Naive Bayes Classification. Yogyakarta:Universitas Islam Indonesia
[8] Natalius, Samuel. 2010. Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen. Bandung:ITB
[9] Planet Sehat. Cara Menghitung Berat Badan Ideal Dengan Metode IMT dan Konvensional. http://planetsehat.com/tips-diet/berat-badan-ideal/cara-menghitung-berat-badan-ideal-dengan-metode-imt-dan-konvensional/ . Tanggal akses 08 Juli 2014 pukul 22:57
[10] Prabowo, Sony. Tabel Berat Badan Anak Menurut Usia. http://majalahkesehatan.com/tabel-berat-badan-anak-menurut-usia/. Tanggal akses 07 Mei 2014 pukul 07:34
[11] Pratama, Anindito Yoga. 2012. Penerapan Teknik Data Mining Untuk Menentukan Hasil Seleksi Masuk Sman 99 Jakarta Untuk Siswa / Siswi Smpn 9 Jakarta Menggunakan Decision Tree. Jakarta:Universitas Gunadarma
[12] Rumus Hitung. Tabel Berat Badan Dan Tinggi Ideal Anak 0-5 Tahun. http://rumushitung.com/2013/06/01/tabel-berat-badan-dan-tinggi-ideal-anak-0-5-tahun/. Tanggal akses 07 Mei 2014 pukul 07:30
[13] Susanto, Sani, Ph.D, Suryadi, Dedy. 2010. Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data. Yogyakarta:Andi.