G07aia.ppt

Embed Size (px)

Citation preview

  • 7/22/2019 G07aia.ppt

    1/45

    DIAGNOSIS PENYAKIT DEMAM BERDARAH

    DENGUE MENGGUNAKAN

    VOTING FEATURE INTERVALS 5

    Oleh :

    Aristi Imka Apniasari

    G64103027

    Pembimbing :

    Aziz Kustiyo, S.Si, M.Kom

    Irman Hermadi S.Kom, MS

  • 7/22/2019 G07aia.ppt

    2/45

    Outline

    Pendahuluan

    Tinjauan Pustaka

    Metode Penelitian

    Hasil dan Pembahasan

    Kesimpulan dan Saran

    Daftar Pustaka

  • 7/22/2019 G07aia.ppt

    3/45

    Latar Belakang

    Tingkat kematian akibat penyakit Demam

    Berdarah Dengue (DBD) relatif masih tinggi.

    Salah satu penyebab tingginya tingkat kematian

    tersebut adalah keterlambatan diagnosis.Penyakit DBD juga sering salah didiagnosis

    dengan penyakit lain seperti flu atau tipus.

    Semakin cepat diagnosis dapat dilakukan,semakin cepat pula pertolongan bisa diberikan

  • 7/22/2019 G07aia.ppt

    4/45

    Latar Belakang (cont..)

    VFI5 digunakan oleh HA Gvenir, G Demirz

    dan N Ilter (1998) dalam memprediksi penyakit

    erythemato-squamous dengan akurasi 96,2%.

    Selain itu juga digunakan oleh Iqbal (2007)dalam mengklasifikasi pasien Suspect Parvo

    dan Distemper. Akurasi yang dihasilkan adalah

    90%.

  • 7/22/2019 G07aia.ppt

    5/45

    Tujuan

    Tujuan dari penelitian ini adalah untuk

    menerapkan algoritma klasifikasi VFI5

    dalam diagnosa penyakit DBD.

  • 7/22/2019 G07aia.ppt

    6/45

    Ruang Lingkup

    Data yang digunakan adalah data sekunder

    penyakit DBD pada penelitian M.Syafii (2006).

    Bobot (weight) setiap feature pada data

    diasumsikan sama.

  • 7/22/2019 G07aia.ppt

    7/45

    Manfaat

    Penelitian ini diharapkan dapat membantusemua pihak dalam deteksi dini penyakitDBD menggunakan algoritma klasifikasi

    VFI5.

    Back

  • 7/22/2019 G07aia.ppt

    8/45

    Tinjauan Pustaka

    Demam Berdarah Dengue (DBD)

    Validasi data

    k-Fold Cross Validation

    Voting Feature Intervals (VFI5)

  • 7/22/2019 G07aia.ppt

    9/45

    Demam Berdarah Dengue

    Penyakit Demam Berdarah Dengue atau Dengue

    Hemorrhagic Fever (DHF) ialah penyakit yang

    disebabkan oleh virus dengue yang ditularkan melalui

    gigitan nyamuk Aedes aegypti dan Aedes albopictus

    (Kristina dkk, 2004). Kriteria klinis untuk diagnosa DBD antara lain (Kristina

    dkk, 2004) :

    a Demam tinggi mendadak dan terus menerus selama 2-7 hari (38 C- 40 C).

    b Manifestasi pendarahan.

    c Hepatomegali (pembesaran hati).

  • 7/22/2019 G07aia.ppt

    10/45

    Demam Berdarah Dengue (cont..)

    d Shockyang ditandai dengan nadi lemah, cepat,

    tekanan nadi menurun menjadi 20 mmHg atau kurang

    dan tekanan sistolik sampai 80 mmHg atau lebih

    rendah.

    e Trombositopenia, pada hari ke 3-7 ditemukan

    penurunan trombosit sampai 100.000/mm3.

    f Hemokonsentrasi, meningkatnya nilai hematokrit.

    g Gejala-gejala klinis lainnya yang dapat menyertai :

    anoreksia (hilangnya nafsu makan), lemah, mual,

    muntah, sakit perut, diare, kejang dan sakit kepala.

    h Rasa sakit pada otot dan persendian.

  • 7/22/2019 G07aia.ppt

    11/45

    Demam Berdarah Dengue (cont..)

    Secara alamiah penyakit DBD mengalami perjalanan

    empat tahap yaitu (Sutaryo 2004 diacu dalam Syafii

    2006) :

    1 masa inkubasi selama 5-9 hari.

    2 masa akut selama 1-3 hari.

    3 masa kritis selama 1-3 hari

    4 masa penyembuhan selama 1-2 hari

    Penyakit DBD sering terjadi di daerah tropis dan muncul

    pada musim penghujan (Kristina dkk, 2004).

  • 7/22/2019 G07aia.ppt

    12/45

    Validasi Data

    Validasi adalah meneliti kebenaran data dalam

    kondisi khusus. Dalam hal ini kondisi khusus

    tersebut adalah aturan (rule base) yang

    diperoleh dari pakar. Validasi dilakukan dengancara meneliti konsistensi data terhadap aturan

    tersebut (Syafii 2006).

  • 7/22/2019 G07aia.ppt

    13/45

    k-Fold Cross Val idat ion

    Dalam k-fold cross validation, data dibagi secara

    acak menjadi k himpunan bagian yang

    ukurannya hampir sama satu sama lain.

    Himpunan bagian yang dihasilkan yaituS1,S2,...,Sk digunakan sebagai pelatihan dan

    pengujian yang masing-masing diulang

    sebanyak kkali.

    Pada iterasi ke-i, subset Si diperlakukan

    sebagai data pengujian, dan subset lainnya

    diperlakukan sebagai data pelatihan.

  • 7/22/2019 G07aia.ppt

    14/45

    Vot ing Featu re In tervals(VFI5)

    Algoritma klasifikasi Voting Feature Intervals

    (VFI5) merepresentasikan deskripsi sebuah

    konsep oleh sekumpulan interval nilai-nilai

    feature atau atribut. Termasuk algoritma supervised, karena memiliki

    target yaitu kelas-kelas data dari kasus yang

    ada.

  • 7/22/2019 G07aia.ppt

    15/45

    Vot ing Featu re In tervals(cont..)

    VFI5 dikembangkan menjadi dua tahap :

    1 Pelatihan

    - menemukan nilai end pointsetiap feature f

    pada setiap kelas data c- mengurutkan nilai-nilai end pointtersebutsehingga membentuk interval untuk setiapfeature f.

    - menghitung jumlah instance pelatihan setiapkelas c dengan feature f yang nilainya jatuhpada interval i

    - dilakukan normalisasi

  • 7/22/2019 G07aia.ppt

    16/45

    Vot ing Feature In tervals(cont..)

    2 Prediksi (klasifikasi)

    - Untuk setiap feature f, dicari interval i dimana

    nilai efjatuh, dengan efmerupakan nilai

    feature f dari instance tes e.- Memberi nilai vote untuk setiap feature pada

    masing-masing kelas kemudian dijumlahkan.

    - Kelas dengan jumlah vote terbesar diprediksisebagai kelas dari instance tes e.

    Back

  • 7/22/2019 G07aia.ppt

    17/45

    Metode Penelitian

    Data

    Seleksi data

    Data ujiKlasifikasi

    Pelatihan

    Akurasi

    Data latih

    Model VFI5

  • 7/22/2019 G07aia.ppt

    18/45

    Data

    Data yang digunakan adalah data sekunderpenyakit DBD pada penelitian Syafii (2006).Sampel terdiri dari data pasien yang menderitapenyakit DBD dan Demam Dengue (DD).

    Catatan medis yang dijadikan sampel adalahyang mencatat 4 kriteria klinis yaitu : demam,bercak-bercak, tanda pendarahan spontan danhasil uji tornikuet.

    Dari 205 catatan medis yang ditemukan, yangmemenuhi persyaratan hanya 64, yang terdiridari 32 kasus DBD dan 32 kasus DD.

  • 7/22/2019 G07aia.ppt

    19/45

    Seleksi Data

    Pada penelitian ini akan dilakukan seleksi

    terhadap keseluruhan data baik sebelum

    maupun setelah validasi. Seleksi ini dilakukan

    untuk menentukan data mana yang digunakansebagai data latih dan data uji.

  • 7/22/2019 G07aia.ppt

    20/45

    Data Latih dan Data Uji

    Seluruh data yang digunakan dibagimenjadi beberapa subset dengan ukurancontoh yang hampir sama.

    Setiap subset dibagi-bagi lagi menjadi tigasub-subset dengan metode 3-fold crossvalidation.

    Subset-subset tersebut akan digunakansebagai data pelatihan (training) dan datapengujian (testing).

  • 7/22/2019 G07aia.ppt

    21/45

    VFI5

    Pada penelitian ini digunakan algoritmaklasifikasi VFI5 dengan bobot setiap featurediasumsikan sama, yaitu satu.

    Pelatihan

    Pada tahap ini akan ditentukan nilai end pointuntuk setiap feature. Selanjutnya akan dibentukinterval-interval dari setiap feature yang ada.Setelah semua interval terbentuk, langkahselanjutnya adalah menghitung jumlah instancesetiap kelas yang berada pada setiap intervaltersebut dan dilakukan normalisasi.

  • 7/22/2019 G07aia.ppt

    22/45

    VFI5 (cont..)

    Klasifikasi

    Setiap nilai feature dari suatu instance barudiperiksa letak interval nilai feature tersebut.

    Vote-vote setiap kelas untuk setiap feature padasetiap interval yang bersesuaian diambil dankemudian dijumlahkan. Kelas dengan nilai totalvote tertinggi akan menjadi kelas prediksi

    instance baru tersebut.

  • 7/22/2019 G07aia.ppt

    23/45

    Analisis

    Pada tahapan ini dilakukan prosespenghitungan tingkat akurasi. Tingkat akurasi

    diperoleh dengan perhitungan :

    Dilakukan pengamatan terhadap hasil diagnosa

    penyakit DBD dengan menggunakan VFI5.

    Hasil diagnosa diperoleh dari kelas dengan

    jumlah vote terbesar.

    ujidatatotal

    asidiklasifikbenarujidataakurasitingkat

  • 7/22/2019 G07aia.ppt

    24/45

    Spesifikasi Aplikasi

    Hardware :1 Prosesor Intel Pentium 4

    2 Memori 512 MB

    3 Harddisk80 GB

    4 Monitor 155 Alat input mouse dan keyboard

    Software :

    1 Sistem Operasi : Microsoft Windows XP

    2 Microsoft Visual Basic 6.0

    Back

  • 7/22/2019 G07aia.ppt

    25/45

    Hasil dan Pembahasan

    Terdapat 4 gejala klinis objektif yang kemudian

    menjadi fitur pada VFI5

  • 7/22/2019 G07aia.ppt

    26/45

    Selanjutnya akan dilakukan validasi data.Semua data yang nilainya dianggap tidakkonsisten dengan kelasnya akan dihilangkan.

    Sebaran data sebelum dan sesudah validasi :

    Keseluruhan data baik sebelum maupun

    setelah validasi terlebih dahulu dibagi secaraacak menjadi 3 himpunan bagian (subset) yangakan digunakan dalam 3-fold cross validation.

    Kasus Sebelum validasi Setelah validasi

    DBD 32 23

    Bukan DBD 32 19

    Jumlah 64 42

  • 7/22/2019 G07aia.ppt

    27/45

    Akan dilakukan 3 tahap pengujian.

    - Tahap pertama : pengujian untuk data sebelumvalidasi

    - Tahap kedua : pengujian untuk data setelah

    validasi tanpa persebaran

    - Tahap ketiga : pengujian untuk data setelahvalidasi dengan persebaran

  • 7/22/2019 G07aia.ppt

    28/45

    Data sebanyak 64 instance dibagi menjadi 3 himpunan

    bagian.

    Susunan data yang digunakan sebagai data pelatihan

    dan data pengujian pada setiap iterasi :

    Tahap Pertama

  • 7/22/2019 G07aia.ppt

    29/45

    Iterasi pertama

    S1 : data pengujian S2&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 66,67% (dari 21 instance terdapat 7instance yang diklasifikasi salah)

    Tahap Pertama (cont..)

  • 7/22/2019 G07aia.ppt

    30/45

    Tahap Pertama (cont..)

    Iterasi kedua S2 : data pengujian

    S1&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 66,67% (dari 21 instance terdapat7 instance yang diklasifikasi salah)

    Iterasi ketiga

    S3 : data pengujian

    S1&S2 : data pelatihan Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 63,64% (dari 22 instance terdapat

    8 instance yang diklasifikasi salah)

  • 7/22/2019 G07aia.ppt

    31/45

    Tahap Pertama (cont..)

    Hasil pengujian tahap pertama

    Iterasi Akurasi

    Pertama 66,67%Kedua 66,67%

    Ketiga 63,64%

    Rata-rata 65,66%

  • 7/22/2019 G07aia.ppt

    32/45

    Tahap Kedua

    Data sebanyak 42 instance dibagi menjadi 3 himpunanbagian.

    Susunan data yang digunakan sebagai data pelatihan

    dan data pengujian pada setiap iterasi :

  • 7/22/2019 G07aia.ppt

    33/45

    Tahap Kedua (cont..)

    Iterasi pertama S1 : data pengujian

    S2&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 100%

  • 7/22/2019 G07aia.ppt

    34/45

    Tahap Kedua (cont..)

    Iterasi kedua S2 : data pengujian

    S1&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 78,57% (dari 14 instance terdapat 3

    instance yang diklasifikasi salah)

    Hasil pengujian algoritma VFI5 untuk 3 instance yang salah

    diklasifikasi :

  • 7/22/2019 G07aia.ppt

    35/45

    Tahap Kedua (cont..)

    Ketiga instance tersebut diklasifikasi ke dalam kelas bukan DBD,sedangkan kelas sebenarnya adalah kelas DBD.

    Nilai normalisasi ketiga instance mendekati 0,5. Ini berarti ketiga

    instance tersebut mempunyai peluang yang hampir sama untuk

    menjadi kelas DBD maupun kelas bukan DBD.

    Iterasi ketiga

    S3 : data pengujian

    S1&S2 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur. Akurasi yang dihasilkan 100%

  • 7/22/2019 G07aia.ppt

    36/45

    Tahap Kedua (cont..)

    Hasil pengujian tahap kedua

    Iterasi Akurasi

    Pertama 100%Kedua 78,57%

    Ketiga 100%

    Rata-rata 92,86%

  • 7/22/2019 G07aia.ppt

    37/45

    Tahap Ketiga

    Pembagian data menjadi 3 himpunan bagian dansusunan data yang digunakan sebagai data pelatihan

    dan data pengujian sama seperti pada tahap kedua.

    Dari hasil pengujian tahap kedua, ditemukan 3 instance

    yang salah diklasifikasi dimana ketiga instance tersebutberada pada satu data pengujian yang sama.

    Pada tahap ini, ketiga instance tersebut akan disebar

    pada 3 data pengujian yang berbeda. Sehingga masing-

    masing data perngujian mengandung satu instance yang

    salah diklasifikasi.

  • 7/22/2019 G07aia.ppt

    38/45

    Tahap Ketiga (cont..) Iterasi pertama

    S1 : data pengujian

    S2&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 92,86% (dari 14 instance terdapat 1instance yang diklasifikasi salah)

  • 7/22/2019 G07aia.ppt

    39/45

    Tahap Ketiga (cont..) Hasil pengujian instance yang salah diklasifikasi

    Instance yang salah diklasifikasi tersebut termasuk ke dalam

    kelas bukan DBD, sedangkan kelas sebenarnya adalah kelas

    DBD.

    Nilai normalisasi instance tersebut mendekati 0.5 untuk setiap

    kelasnya. Ini berarti instance tersebut mempunyai peluang yang

    hampir sama untuk menjadi kelas DBD maupun kelas bukan

    DBD.

  • 7/22/2019 G07aia.ppt

    40/45

    Tahap Ketiga (cont..)

    Iterasi kedua S2 : data pengujian

    S1&S3 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 100%

    Iterasi ketiga

    S3 : data pengujian

    S1&S2 : data pelatihan

    Proses pelatihan menghasilkan selang-selang fitur.

    Akurasi yang dihasilkan 100%

  • 7/22/2019 G07aia.ppt

    41/45

    Tahap Ketiga (cont..)

    Hasil pengujian tahap ketiga

    Tiga instance yang salah diklasifikasi pada tahap kedua

    tidak semuanya diklasifikasi salah pada pengujian tahap

    ketiga.

    Back

    Iterasi Akurasi

    Pertama 92,86%

    Kedua 100%

    Ketiga 100%

    Rata-rata 97,62%

  • 7/22/2019 G07aia.ppt

    42/45

    Kesimpulan dan Saran

    Kesimpulan Algoritma Voting Feature Intervals (VFI5) pada penelitian ini

    dapat digunakan secara selektif untuk memprediksi penyakit

    Demam Berdarah Dengue (DBD).

    Pada pengujian tahap pertama, rata-rata akurasi yang dihasilkanadalah 65,66%, dimana terdapat 22 instance yang kelas

    prediksinya tidak sesuai dengan kelas sebenarnya.

    Pada pengujian tahap kedua ditemukan 3 instance yang kelas

    prediksinya tidak sesuai dengan kelas sebenarnya dengan rata-

    rata akurasi 92,86%.

    Pada pengujian tahap ketiga hanya terdapat 1 instance yang

    kelas prediksinya tidak sesuai dengan kelas sebenarnya dengan

    rata-rata akurasi 97,62%.

  • 7/22/2019 G07aia.ppt

    43/45

    Saran

    Pada penelitian selanjutnya dapat digunakan bobot yangberbeda untuk setiap fiturnya.

    Data yang akan digunakan diharapkan memiliki jumlah record

    yang lebih banyak. Disarankan juga adanya pengembangan

    jumlah kriteria klinis termasuk tanda subjektif seperti sakit

    kepala, nyeri perut, mual dan sebagainya.

    Back

  • 7/22/2019 G07aia.ppt

    44/45

    Daftar Pustaka Demirz G, Gvenir HA. 1997. Classification by Voting Feature Intervals.

    http://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdf. Gvenir HA, Demirz G, Ilter N. 1998. Learning Differential Diagnosis of

    Erythemato-Squamous Diseases using Voting Feature Intevals.ArtificialIntelligence in Medicine, 13(3), 147-165.

    Ibrahim F, Taib MN, Abas WABW, Guan CC, Sulaiman S. 2005.A NovelDengue Fever(DF) and Dengue Haemorrhagic Fever(DHF)Analysis UsingArtificial Neural Network(ANN).

    http://www.intl.elsevierhealt.com/journals/cmpb. Iqbal M. 2007. Klasifikasi Pasien Suspect Parvo dan Distemperpada Data

    Rekam Medik Rumah Sakit Hewan IPB Menggunakan Voting FeatureIntevals [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam,Institut Pertanian Bogor.

    Kristina, Isminah, Wulandari L. 2004. Demam Berdarah Dengue. http://www.litbang.depkes.go.id/maskes/052004/demamberdarah1.htm.

    Sarle W. 2004. What are cross-validation andbootstrapping?.http://www.faqs.org/faqs/ai-faq/neuralnets/part3/section-12.html.

    Syafii M. 2006.Adaptive Neuro Fuzzy Inference System (ANFIS) untukDiagnosa dan Tatalaksana Penyakit Demam Berdarah Dengue [tesis].Bogor: Sekolah Pascasarjana, Intitut Pertanian Bogor.

    http://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdfhttp://www.intl.elsevierhealt.com/journals/cmpbhttp://www.intl.elsevierhealt.com/journals/cmpbhttp://www.cs.ucf.edu/~ecl/papers/demiros97classification.pdf
  • 7/22/2019 G07aia.ppt

    45/45

    Terima Kasih