Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
i
PENDEKATAN RANDOM FOREST UNTUK MODEL PERAMALAN HARGA
TEMBAKAU RAJANGAN DI KABUPATEN TEMANGGUNG
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Diajukan oleh:
Agenda Yudha Samudra
NIM: 155314025
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
RANDOM FOREST APPROACH TO FORECAST MODEL OF CHOPPING
TOBACCO PRICE AT TEMANGGUNG
THESIS
Submitted in Partial Fullfillment of The Requirements
for The Degree of Sarjana Komputer
in Informatics Engineering Study Program
By :
Agenda Yudha Samudra
NIM : 155314025
INFORMATICS ENGINEERING STUDY PROGRAM
DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
.
HALAMAN PERSEMBAHAN
Innallaha ma’ashshobiriin...
(Allah selalu bersama hamba-Nya yang bersabar)
Kupersembahkan untuk:
Ibu dan Bapak tercinta,
Kakakku,
Calon Pendamping hidupku,
Teman-temanku,
serta orang-orang yang kusayangi
Semoga bermanfaat bagi kehidupan manusia.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
PRAKATA
Assalamualaikum warahmatullahi wabarakatuh.
Puji syukur atas berkat dan rahmat Allah SWT yang telah memberikan
kesempatan hidup serta kasih dan karunia yang tak hingga kepada penulis sehingga
dapat menyelesaikan skripsi dengan judul “Pendekatan Random Forest Untuk
Model Peramalan Harga Tembakau Rajangan di Kabupaten Temanggung”.
Skripsi ini disusun untuk memenuhi salah satu syarat memperoleh gelar Sarjana
Teknik Informatika di Fakultas Sains Dan Teknologi, Universitas Sanata Dharma,
Yogyakarta.
Penulis sadar bahwa dalam proses pelaksanaan dan penyusunan skripsi ini
banyak sekali bantuan, bimbingan, dan dukungan dari berbagai pihak. Oleh karena
itu, ijinkan penulis untuk mengucapkan terima kasih kepada:
1. Bapak Sudi Mungkasi, S.Si., M.Math.Sc., PhD. selaku Dekan Fakultas Sains dan
Teknologi Universitas Sanata Dharma.
2. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik Informatika
Fakultas Sains Dan Teknologi Universitas Sanata Dharma.
3. Ibu Agnes Maria Polina, S.Kom., M.Sc. selaku Dosen Pembimbing sekaligus Dosen
Penguji skripsi yang telah memberikan bimbingan, masukan, kritik, dan saran
dengan sangat sabar dari awal penelitian hingga akhir penyusunan skripsi.
4. Para Dosen Penguji yang telah memberikan masukan, kritik, dan saran yang
sangat membangun dalam proses penelitian dan penyusunan skripsi.
5. Keluarga Tercinta: Ibuk, Bapak, Mas Dhito, dan semua Pakdhe, Budhe, Bulik,
Om, dan Sepupu-Sepupuku yang selalu mendukung dengan nasihat dan doa tulus
demi kelancaran studi.
6. Terkhusus: Novi Morita Siwi, terima kasih banyak atas segala bantuan tenaga,
hati, dan pikiran, selama ini sudah membantu, membimbing, menemani, dan
memberikan semangat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
7. Teruntuk teman teman saya, Christian, Osmond, Timmo danYulius, terima kasih
atas support dan mau bertukar pikiran dalam perkuliahan.
8. Teman-teman FST 2015 Universitas Sanata Dharma atas segala kisah
perkuliahan.
9. Semua pihak yang tidak dapat disebutkan satu per satu, terima kasih banyak atas
doa dan dukungannya sehingga penulis dapat menyelesaikan skripsi ini.
Penulis sangat sadar bahwa masih banyak kesalahan dan kekurangan dalam
penulisan skripsi ini. Oleh karena itu, penulis memohon kritik dan saran yang
membangun agar penulisan skripsi dapat menjadi lebih baik. Demikian prakata yang
dapat disampaikan, semoga skripsi ini dapat menjadi manfaat bagi pembaca.
Wassalamualaikum warahmatullahi wabarakatuh.
Yogyakarta, …………….. 2019
Penulis,
Agenda Yudha Samudra
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
DAFTAR ISI
HALAMAN JUDUL .............................................................................. i
HALAMAN PERSETUJUAN PEMBIMBING .................................... iii
HALAMAN PENGESAHAN ................................................................ iv
HALAMAN PERSEMBAHAN ............................................................ v
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI ................. vi
PERNYATAAN KEASLIAN KARYA ................................................ vii
PRAKATA ............................................................................................. viii
DAFTAR ISI .......................................................................................... x
DAFTAR TABEL .................................................................................. xiii
DAFTAR GAMBAR ............................................................................. xiv
DAFTAR LAMPIRAN .......................................................................... xv
ABSTRAK ............................................................................................. xvi
ABSTRACT ............................................................................................. xvii
BAB I PENDAHULUAN ...................................................................... 1
1.1 Latar Belakang ........................................................................ 1
1.2 Rumusan Masalah ................................................................... 3
1.3 Tujuan Penelitian .................................................................... 3
1.4 Batasan Masalah ...................................................................... 4
1.5 Sistematika Penulisan ............................................................. 4
BAB II LANDASAN TEORI ................................................................ 6
2.1 Klasifikasi Tembakau .............................................................. 6
2.2 Faktor yang Mempengaruhi Kualitas Tembakau .................... 6
2.3 Penambangan Data .................................................................. 7
2.4 Peramalan ................................................................................ 9
2.5 Imputasi ................................................................................... 10
2.6 Classification And Regression Tree (CART) .......................... 10
2.7 Random Forest ........................................................................ 11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
2.8 Jumlah Pohon Dalam Random Forest ..................................... . 13
2.9 Menghitung Akurasi ............................................................... 15
BAB III METODE PENELITIAN ......................................................... 16
3.1 Sumber Data ............................................................................ 16
3.2 Tahap-tahap Penelitian ............................................................ 17
3.2.1 Studi Pustaka .................................................................. 17
3.2.2 Observasi ........................................................................ . 18
3.2.3 Pengolahan Data ............................................................. 18
3.2.4 Pembuatan Alat Uji ......................................................... 20
3.2.5 Analisa Hasil dan Pembuatan Laporan .......................... 20
3.3 Spesifikasi Alat ....................................................................... 20
BAB IV PERANCANGAN PERANGKAT LUNAK ........................... 21
4.1 Perancanganan Sistem ............................................................. 21
4.1.1 Input ............................................................................... 21
4.1.2 Proses ............................................................................. 21
4.1.3 Output ............................................................................. 22
4.2 Preprocessing .......................................................................... 22
4.2.1 Missing data .................................................................... 22
4.2.2 Data selection ................................................................. 23
4.2.3 Data transformation ......................................................... 24
4.2.4 Data integration .............................................................. 24
4.2.5 Membagi data training dan data testing ......................... 25
4.2.6 Membangun model Random Forest ............................... 25
4.3 Desain Antarmuka ................................................................... 25
4.4 Pengujian ................................................................................. 26
4.5 Pengukuran Akurasi Sistem ..................................................... 26
BAB V ANALISA HASIL .................................................................... 27
5.1 Implementasi Desain Antarmuka ............................................ 27
5.2 Hasil Prediksi .......................................................................... 27
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
5.3 Analisis Hasil Prediksi ............................................................. 28
BAB VI PENUTUP ............................................................................... 31
6.1 Kesimpulan ............................................................................. 31
6.2 Saran ........................................................................................ 31
DAFTAR PUSTAKA ............................................................................ 32
LAMPIRAN ........................................................................................... 34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
DAFTAR TABEL
Tabel 1 Dataset pada penelitian How Many Tree in Random Forest .......................... 13
Tabel 2 Atribut dataset ......................................................................................... 16
Tabel 3 Perbandingan Jumlah Pohon Untuk Nilai Akurasi .................................. 30
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR GAMBAR
Gambar 2.1 Sturktur Pohon Klasifikasi ........................................................... 11
Gambar 2.2 Random Forest ........................................................................... 12
Gambar 3.1 Blok Diagram .............................................................................. 18
Gambar 4.1 Flowchart Diagram .................................................................... 21
Gambar 4.2 Desain Antarmuka Sistem ........................................................... 26
Gambar 5.1 Antarmuka Sistem Prediksi ......................................................... 27
Gambar 5.2 Hasil Ploting untuk Random Forest dengan jumlah pohon 64 .... 28
Gambar 5.3 Pohon ke 1 dari 64 pohon dalam Random Forest........................ 29
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR LAMPIRAN
Lampiran 1 Tabel 4. Produk Domestik Regional Bruto Atas Dasar Harga Berlaku
Menurut Lapangan Usaha di Kabupaten Temanggung (Miliar rupiah)
2014-2017 (Badan Pusat Statistik Kabupaten Temangggung, 2018) .. 35
Lampiran 2 Tabel 5. Luas area dan produksi Tembakau Perkebunan Rakyat
Menurut Kabupaten dan keadaan Tanaman tahun 2014-2017 (Badan
Pusat Statistik Provinsi Jawa Tengah, 2017) ...................................... 37
Lampiran 3 Contoh Pembuatan Model Random Forest ........................................... 38
Lampiran 4 Dataset Iklim harian Tahun 2015 dari Bulan April Hingga
September .............................................................................................. 59
Lampiran 5 Contoh Dataset Transaksi Tembakau PT. GUDANG GARAM
TBK ..................................................................................................... 80
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvi
ABSTRAK
Tembakau merupakan tanaman perkebunan unggul yang mempunyai nilai
ekonomis yang tinggi dan sudah lama diusahakan oleh petani tembakau di Jawa
Tengah khususnya di kabupaten Temanggung. Tidak adanya standarisasi harga dan
mutu tembakau menyebabkan harga kerugian di pihak petani dikarenakan untuk
menentukan harga tembakau rajangan masih bergantung kepada grader pabrik.
Dalam penelitian ini dibangun perangkat lunak untuk memprediksi harga
tembakau rajangan di kabupaten Temanggung dengan menggunakan metode Random
Forest dan diimplementasikan menggunakan Python.
Metode Random Forest merupakan pengembangan dari CART dengan
menerapkan metode bootstrap aggregating (bagging) dan random feature selection.
Dimana tidak hanya menghasilkan satu pohon tetapi puluhan hingga ratusan pohon
dari data replacement yang selanjutnya dilakukan pengumpulan informasi sehingga
pada Random Forest dapat dihasilkan pohon dengan ukuran yang berbeda-beda. Ini
dikarenakan pohon yang dihasilkan oleh dari bootstrap dan replacement tidak
dilakukan pemangkasan, Pada proses klasifikasi, didasarkan pada vote dari suara
terbanyak pada kumpulan populasi pohon, sedangkan untuk regresi menggunakan
hasil rata-rata populasi pohon.
Atribut yang digunakan dalam penelitian ini adalah suhu rata-rata,
kelembaban rata-rata ,curah hujan, lama penyinaran, seri, grade dan harga. Dengan
menggunkan data iklim dan penjualan tembakau sebanyak 1244 record, menunjukkan
bahwa hasil prediksi mencapai akurasi 82.39%.
Kata Kunci : Tembakau, Random Forest, CART
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvii
ABSTRACT
Tobacco is a superior crop that has high economic value and has long been
cultivated by tobacco farmers in Central Java, especially in Temanggung regency.
There is no standardization of the price and quality of tobacco which causes farmer
prices on the part of the parties to determine the price of chopped tobacco still
depends on the grader's factory.
In this study, the software was built to predict knit prices in the Temanggung
district by using the Random Forest method and implemented using Python.
The Random Forest method is the development of CART using the bootstrap
aggregating (bagging) method and random feature selection. Where not only produce
one tree but make a replacement tree for data which is then collected information so
that in Random Forest can produce trees of different sizes. This is related to the tree
produced by bootstrap and replacements are not pruned, in the classification process,
based on the sound of the most sounds in the tree cluster, whereas for regression
using the results of the average tree population.
The attributes used in this study are average temperature, average
temperature, rainfall, duration of irradiation, series, grade and, price. By using climate
data and sales of tobacco as many as 1244 records, the prediction results reached an
accuracy of 82.39%.
Keywords: Tobacco, Random Forest, CART
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Pertanian Indonesia adalah pertanian tropika yang sangat terpengaruh oleh
iklim. Selain permasalan produksi, pertanian Indonesia juga dihadapkan pada
fluktuasi harga. Fluktuasi harga yang berisiko pada harga komoditas pertanian
serta besarnya pembiayaan menjadi risiko tersendiri terhadap pendapatan yang
diharapkan petani (Ihsannudin, 2010).
Dalam meningkatkan kualitas dan produksitas hasil panen, petani harus
cakap dalam penyesuaian lahan. Pertumbuhan suatu tanaman sangat dipengaruhi
oleh empat faktor, yakni adaphis (tanah), climatis (iklim), fisiografis (benteng
alam), dan biologis. Komponen tanah yang penting adalah struktur dan tekstur
tanah, termasuk susunan partikel tanah, air tanah, temperatur tanah, dan hara
mineral tanah yang terkandung (Alfa Susetyo Yerymia, 2011).
Tembakau merupakan tanaman perkebunan unggul yang mempunyai nilai
ekonomis yang tinggi dan sudah lama diusahakan oleh petani tembakau di Jawa
Tengah. Tanaman tembakau berperan penting bagi perekonomian Indonesia,
terutama dalam penyediaan lapangan pekerjaan, sumber pendapatan bagi petani
dan sumber devisa bagi negara disamping mendorong berkembangnya agribisnis
tembakau dan agroindustri (Cahyono, 2005).
Pemetikan dilakukan antara 5-7 hari dengan selanh waktu 2-7 hari. Panen
pertama baru dapat dimulai sekitar 90 hari setelah tanam dan lama panen sekitar
20-30 hari (pemeraman, penggulungan). Sedangkan proses pengolahan sekitar 7-
10 hari (perajangan, penjemuran, pengemasan) itu bergantung pada sinar matahari
(Samsuri Tirtosastro,2004)
Komoditas pertanian tembakau mempunyai karakteristik spesifik, terlebih
lagi sifat kriteria tembakau dapat dikatakan unik, dengan grade yang sama akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
tetapi harga tembakau rajangan berbeda. Grade tembakau dipengaruhi oleh
berbagai macam faktor mulai dari penanaman hingga pengemasan.
Usaha standardisasi belum berhasil dengan baik dan perdagangan
tembakau masih menggunakan cara lama, yaitu penentuan mutu dan harga secara
subyekif oleh konsumen (pabrikan). Penyebab belum berhasilnya penerapan
standar mutu tersebut karena stand mutu belum seluruhnya sesuai dengan selera
konsumen dan juga maraknya pemalsuan mutu (Samsuri Tirtosastro, 2004).
Davies dan Nielsen (1999), berpendapat bahwa mutu tembakau
mempunyai pengertian relatif, yang dapat berubah setiap saat karena pengaruh
orang, waktu dan tempat. Dapat disimpulkan bahwa mutu tembakau merupakan
sesuatu yang tidak tetap, mudah berubah sesuai ekonomi, selera konsumen dan
keputusan pabrikan menentukan karakteristik rokok yang dipasarkan.
Peramalan merupakan alat bantu yang penting dalam perencanaan yang
efektif dan efisien (Makridakis et al., 1991). Seringkali, dalam peramalan data
time series menunjukkan perilaku yang bersifat musiman. Musiman didefinisikan
sebagai kecenderungan data time series yang berulang setiap periode. Musiman
adalah istilah yang digunakan untuk mewakili periode waktu yang berulang
(Kalekar: 2004).
Menurut Pramudiono, data mining adalah analisi otomatis dari data yang
berjumlah besar atau kompleks dengan tujuan untuk menemukan pola
kecenderungan yang penting yang biasanya tidak disadari keberadaannya. Data
mining memiliki berbagai macam teknik, salah satunya adalah peramalan atau
forcasting (Kursrini & Luthfi, 2009).
Pada Lampiran 1, kabupaten Temanggug dengan luas wilayah 87.026 ha
terbagi menjadi 20 kecamatan, 266 desa dan 23 kelurahan merupakan daerah
yang menjadikan tembakau sebagai produk unggulan. Sektor pertanian menjadi
sektor penyumbang terbersar dalam pembetukan PDRBnya. Terdapat lima
subsektor pertaniaan di Kabupaten Temanggung antara lain tananam perkebunan,
tanaman pangan, perternakan, kehutanan dan perikanan. Hampir 70% dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
759.128 pedudukan adalah petani. Sektor pertanian ini menyumbang sekitar 24%
PDRB dari 20 industri dari pendapatan total PDRB 18.833.19 pada tahun 2017
(BPS Jawa Tengah, 2018).
Pada Lampiran 2, dapat dilihat bahwa Kabupaten Temanggung menempati
urutan pertama luas area dan produksi tembakau dibadingkan kabupaten-
kabupaten lainnya di Provinsi Jawa Tengah. Hal ini dapat dilihat juga dari aspek
ekologi dan geografis Kabupaten Temanggung yang cocok untuk perkembangan
tembakau dibandingkan dengan daerah-daerah lain. Dalam segi produksi
Kabupaten Temanggung merupakan pengahasil tembakau terbesar di Provinsi
Jawa Tengah dengan angka 10.581 ton pada tahun 2015.
Berdasarkan uraian di atas, peneliti mencoba untuk menganalisis pola data
harga tembakau di kabupaten Temanggung dengan menerapkan metode Random
Forest. Sehingga, berdasarkan dari latar belakang diatas maka penulis
mengangkat judul “PENDEKATAN RANDOM FOREST UNTUK MODEL
PERAMALAN HARGA TEMBAKAU RAJANGAN DI KABUPATEN
TEMANGGUNG”
1.2 Rumusan Masalah
a. Bagaimana membuat perangkat lunak peramalan untuk memprediksi harga
tembakau di Kabupaten Temanggung ?
b. Berapakah persentase akurasi yang diperoleh dalam proses peramalan untuk
memprediksi harga tembakau di Kabupaten Temanggung ?
1.3 Tujuan Penelitian
Tujuan penelitian ini yaitu membuat model peramalan untuk memprediksi
data harga tembakau di kabupaten Temanggung dengan pendekatan Random
Forest.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
1.4 Batasan Masalah
Batasan masalah yang ditentukan dalam penelitian ini, antara lain :
1. Metode peramalan yang digunakan adalah teknik Random Forest.
2. Dataset yang digunakan adalah data iklim harian tahun 2015, dan data
transaksi PT. GUDANG GARAM TBK pada tahun 2015 di kabupaten
Temanggung.
3. Pada penelitian ini menggunakan beberapa atribut, antara lain :
a. Suhu rata-rata
b. Kelembaban rata-rata
c. Curah hujan
d. Lama penyinaran matahari
e. Seri
f. Grade
g. Harga
4. Aplikasi yang dibuat menggunakan Pyhton.
5. Proses tanam tembakau hingga tembakau rajangan siap untuk dijual
memerlukan jangka waktu 4 bulan.
1.5 Sistematika Penulisan
Penulisan tugas akhir ini tersusun dari 6 (enam) bab dengan sistematika
penulisan sebagai berikut :
a. BAB I PENDAHULUAN
Bab ini berisi latar belakang, rumusan masalah, tujuan penelitian, batasan
masalah, sistematika penulisan.
b. BAB II LANDASAN TEORI
Bab ini menjelaskan tentang landasan teori yang akan menjadi dasar
penelitian implementasi algoritma Random Forest.
c. BAB III METODOLOGI PENELITIAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
Bab ini berisi tentang sumber data, studi pustaka, observasi, pengolahan data,
pembuatan alat uji, analisa hasil dan pembuatan laporan, spesifikasi alat.
d. BAB IV PERANCANGAN PERANGKAT LUNAK
Bab ini berisi tentang perancangan sistem mulai dari input, proses, dan output.
serta proses preprocessing, desain antarmuka, pengujian, pengukuran akurasi.
e. BAB V ANALISA HASIL
Bab ini berisi analisa hasil dari algoritma Random Forest, dan hasil prediksi.
f. BAB VI PENUTUP
Bab ini berisi kesimpulan dari penelitian yang sudah dibangun dan dijalankan
juga memuat saran-saran yang bisa digunakan guna memperbaiki dan
mengembangkan penelitian di kemudian hari.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
BAB II
LANDASAN TEORI
2.1 Klasifikasi Tembakau
Tembakau secara umum dapat diklasifikasikan :
Divisio : Spermatophyta
Sub divisio : Angiospermae
Class : Dicotyledoneae
Ordo : Solanales
Famili : Solanaceae
Genus : Nicotiana
Species : Nicotiana tabacum
Keadaan tanah harus memiliki pH yang berkisar 5,5-6,5. Tembakau yang
ditanam di dataran rendah memerlukan ketinggian 50-550 mdpl dengan curah
hujan 2000mm/tahun sedangkan tembakau yang ditanam di dataran tinggi
memerlukan ketinggian 1000-1500 mdpl dengan curah hujan sekitar 1500-3500
mm/tahun. Struktur tanah yang baik untuk tanaman tembakau adalah tanah yang
berstuktur gembur karena tanah ini memudahkan pertumbuhan dan
perkembangan perakaran tanaman, meningkatkan peredaran udara di dalam
tanah sehingga dapat mencegah air yang menggenang (Matnawi, 1997).
2.2 Faktor yang Mempengatuhi Kualitas Tembakau
Tembakau temanggung ditanam di 12 kecamatan dengan agroekosistem
beragam (tegal, sawah tadah hujan, sawah irigasi) dan topografi wilayah mulai
dari daerah datar, berbukit-bukit, sampai pada lereng-lereng gunung dengan
kemiringan 60o (Rochman dan Suwarso, 2000).
Tembakau temanggung sesuai ditanam di daerah dengan ketinggian 700
sampai dengan 1500 m dpl. Curah hujan yang dibutuhkan antara 2.200-3.100
mm/tahun dengan 8-9 bulan basah dan 3-4 bulan kering (Basuki et al . , 2000).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
Curah hujan merupakan faktor yang menentukan hasil dan mutu tembakau
temanggung, sedangkan intensitas matahari yang tinggi sangat diperlukan pada
saat panen dan pengeringan (Sholeh, 2000). Secara umum, elevasi yang tinggi
menghasilkan mutu tembakau yang tinggi, sedangkan elevasi rendah
menghasilkan mutu rendah (Purlani dan Rachman, 2000).
Menurut Djumali (2008), keterbatasan air tersedia dalam tanah berakibat
pada peningkatan produksi nikotin dalam akar, oleh karena itu ketersediaan air
dalam tanah sampai batas-batas tertentu berakibat pada peningkatan kadar
nikotin dalam daun.
Menurut Sulistyono (1995), tinggi tempat berpengaruh terhadap
temperatur udara dan intensitas cahaya. Temperatur dan intensitas cahaya akan
semakin kecil dengan semakin tingginya tempat tumbuh. Berkurangnya
temperatur dan intensitas cahaya dapat menghambat pertumbuhan karena proses
fotosintesis terganggu.
Dari (Elda Nurnasari dan Djumali, 2010), penelitian menunjukkan bahwa
ketinggian tempat mempengaruhi produksi dan kadar nikotin yang dihasilkan.
Perbedaan ketinggian tempat diikuti oleh perbedaan unsur-unsur lingkungan
(temperatur udara, kelembapan udara relatif, curah hujan, dan jumlah hari hujan)
berpengaruh terhadap produksi dan mutu tembakau Temanggung. Unsur
lingkungan yang mempengaruhi produksi adalah temperatur udara, kelembapan
relatif, curah hujan, dan jumlah hari hujan.
2.3 Penambangan data
Data mining adalah kegiatan menemukan pola yang menarik dari data
dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau
penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu
lain, seperti database system, data warehousing, statistic, machine learning,
information retrieval, dan komputasi tingkat tinggi. Selain itu, data mining
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data
analysis, image database, signal processing (Han dan Kamber, 2006).
Karakteristik data mining sebagai berikut :
1. Data minig berhubungan dengan penemuan sesuatu yang tersembunyi dan pola
data tertentu yang tidak diketauhui sebelumnya.
2. Data minig biasa menggunakan data yang sangat besar. Biasanya data yang
besar digunakan untuk membuat hasil lebih dipercaya.
3. Data mining berguna untuk membuat keputusan yang kritis, tertama dalam
strategi (Davies, 2004).
Beberapa metode yang sering disebut-sebut dalam literatur data mining
antara lain clustering, classification, association rule mining, neural network,
genetic algorithm, dan lain-lain (Pramudiono, 2007).
Data mining sering disebut juga knowledge discovery in database (KDD),
adalah kegitan yang meliputi pengumpulan , pemakaian data historis untuk
menemukan keteraturan, pola atau hubungan dalam set data yang berukuran besar
(Santoso, 2007).
Penambangan data dibagi menjadi beberapa berdasarkan tugas yang
dapat dilakukan, yaitu (Kursrini & Luthfi, 2009):
1. Deskripsi
Menggambarkan pola dan kecenderungan yang terdapat dalam data. Deskripsi
dari pola dan kecenderungan sering memberikan kemungkinan penjelasan
untuk suatu pola atau kecenderungan.
2. Etimasi
Metode ini hampir sama dengan metode klasifikasi, namum pada variable
target, estimasi lebih ke arah numerik dari pada kearah kategori. Peninjauan
estimasi nilai dari variable target dibuat berdasarkan nilai prediksi.
3. Peramalan
Metode ini hampir sama dengan metode klasifikasi dan estimasi. Namum
dalam prediksi nilai dari hasil akan merujuk ke masa yang akan mendatang.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
4. Klasifikasi
Proses penemuan model atau fungsi yang menjelaskan atau membedakan
konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari
suatu objek yang labelnya tidak diketahui.
5. Klustering
Merupakan pengelompokan record, pengamatan, atau memperhatikan dan
membentuk kelas objek-objek yang memiliki kemiripan.
6. Asosiasi
Tugas asosiasi dalam penambangan data adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis
keranjang belanja.
2.4 Peramalan
Menurut Martiningtyas (2004), peramalan (forecasting) adalah kegiatan
untuk memperkirakan apa yang akan terjadi pada masa yang akan datang.
Pengumpulan data yang relevan berupa informasi dapat menghasilkan peramalan
yang akurat disertai pemilihan teknik peramalan yang tepat maka pemanfaatan
informasi data akan diperoleh secara optimal.
Menurut Makridakis et al. (1991) peramalan kuantitatif dapat dilakukan
apabila terdapat 3 (tiga) kondisi, yaitu:
1. Tersedia informasi masa lalu.
2. Informasi tersebut dapat dikuantitatifkan dalam bentuk data numerik.
3. Dapat diasumsikan bahwa beberapa aspek pola masa lalu akan terus berlanjut
di masa mendatang.
Menurut Makridakis et al,. (1999), metode peramalan dibagi ke dalam
dua kategori utama, yaitu metode kualitatif dan metode kuantitatif. Metode
kuantitatif dilakukan apabila informasi masa lalu tersedia sehingga peramalan
bisa dilakukan, informasi tersebut dapat dikuantitatifkan dalam bentuk data
numerik. Dalam metode kualitatif pendapat-pendapat dari para ahli akan menjadi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
pertimbangan dalam pengambilan keputusan sebagai hasil dari peramalan yang
telah dilakukan. Namun, apabila data masa lalu tersedia, peramalan dengan
metode kuantitatif akan lebih efektif digunakan dibandingkan denganmetode
kualitatif.
2.5 Imputasi
Metode Imputasi adalah pengisian nilai hilang pada suatu survei. Salah
satu pendekatan dalam prosedur berbasis imputasi adalah single imputation.
Dalam single imputation, nilai hilang diisi dengan nilai penduga seperti
mean imputation, median imputation, mode imputation, cold deck imputation,
hot deck imputation. Masalah umum dalam single imputation adalah
menempatkan kembali nilai hilang dengan nilai tunggal dan kemudian
memperlakukannnya sebagaimana nilai tersebut merupakan nilai sebenarnya.
Imputation mengurangi kolelasi antara variable, dikarenakan dalam imputation
mengasumsikan bahwa tidak ada hubungan antara variable imputation dan
variable lainnya. (Little dan Rubin, 1987).
2.6 Classification And Regression Tree (CART)
Classification and regression tree, merupakan salah satu metode dari pohon
keputusan. Metode yang dikembangkan oleh Leo Breiman ini merupakan teknik
klasifikasi dengan menggunakan algoritma penyekatan rekursih secara biner
(Lewis dan Roger, 2000).
Classification and regression tree akan menghasilkan pohon klasifikasi jika
variable respon mempunyai skala kategorik dan menghasilkan pohon regresi jika
variable respon berupa data kontinu. Simpul awal disebut parent node dinotasikan
t1, simpul dalam dinotasikan dengan t2, t3, t4, t5 t7, t9 dan t13, serta simpul akhir
dinotasikan dengan t5, t6, t8, t11, t12, t14, t15, t16, dan t17 dimana setelahnya
tidak ada lagi pemilahan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
Gambar 2.1. Struktur Pohon Klasifikasi
2.7 Random Forest
Metode Random Forest merupakan pengembangan dari metode CART,
yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random
feature selection.
Random Forest yang dihasilkan memiliki banyak pohon bisa mencapai
ratusan, dan setiap pohon ditanam dengan cara yang sama. Beberapa fungsi
pembelajaran yang dihasilkan Random Forest digunakan strategi ensemble
bagging untuk mengatasi masalah overfitting apabila dihadapkan data train yang
kecil. Ada banyak algoritma yang dapat digunakan dalam pembentukan Decision
Tree, antara lain ID3, CART, dan C4.5 (Breiman, 2001).
Bagging atau disebut juga dengan bootstrap aggregating, merupakan
metode yang dapat memperbaiki hasil dari algoritma klasifikasi. Bagging
merupakan salah satu metode yang berdasar pada ensemble method, yaitu metode
yang menggunakan kombinasi dari beberapa model. Bagging prediktor adalah
metode yang digunakan untuk membangkitkan multiple versions dari prediktor
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
dan menggunakannya untuk mendapatkan kumpulan prediktor. Multiple versions
dibentuk dengan replikasi (replacement) bootstrap dari sebuah data percobaan
(Breiman, 1996).
Algoritma yang harus diikuti ketika membangun sebuah pohon
menggunakan Random Forest adalah:
1. Buat subset data dari data set menggunakan bootstrap dengan replacement
2. Gunakan subset data untuk membangun pohon ke i (i= 1,2,3 ….. k)
3. Ulangi langkah satu dan dua sebanyak k kali
Pada proses klasifikasi, individunya didasarkan pada vote dari suara terbanyak
pada kumpulan populasi pohon, sedangkan untuk regresi menggunakan hasil rata-
rata populasi pohon.
Gambar 2.2. Random Forest
Dalam membangun pohon keputusan dalam Random Forest menggunakan
metode CART, dimulai dengan cara menghitung nilai entropy sebagai penentu
tingkat ketidakmurnian atribut dan nilai information gain. Untuk menghitung nilai
entropy digunakan rumus :
∑
Dimana :
Y : himpunan kasus
p(c|Y) : merupakam proporsi nilai Y terhadap kelaas c
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Sedangkan untuk mencari information gain yang digunakan untuk mengukur
efektifitas suatu atribut dalam pengklasifikasian data dapat dihitung dengan
rumus :
∑
Dimana :
Value(a) : merupakan semua nilai yang mungki dalam himpunan kasus a
Yv : subkelas dari Y dengan kelas v yang berhubungan dengan kelas a
Ya : semua nilai yang sesuai dengan a
Untuk mencari split-point terbaik maka data dari atribut tersebut harus
diurutkan terlebih dahulu. Nilai tengah antara setiap pasangan nilai yang
berdekatan dianggap sebagai kemungkinan yang bisa dijadikan split-point.
2.8 Jumlah Pohon Dalam Random Forest
Menurut (Thais Mayumi Oshiro et al., 2012) banyak literatur mengenai
Random Forest namum hampir tidak ada yang memberikan pentunjuk berapa
banyak pohon yang harus dibangun dalam menyusun Random Forest. Dimana
peningkatan jumlah pohon tidak menghasilkan peningkatan kinerja yang
signifikan, dan hanya mengingkatkan lama komputasi. Dari penelitian tersebut
dapat disimpulkan ketika jumlah pohon bertambah, tidak selalu berarti kinerja
Random Forest secara signifikan lebih baik daripada Random Forest sebelumnya
(lebih sedikit pohon), dan menggandakan jumlah pohon tidak bermakna.
Analisis dari 29 dataset menunjukkan bahwa dari 128 pohon tidak ada
perbedaan yang signifikan antara hutan menggunakan 256, 512,1024, 2048 dan
4096 pohon. Dataset yang digunakan dalam penelitian tersebut adalah :
Tabel 1. Dataset pada penelitian How Many Tree in Random Forest
No Dataset Banyak
data
Kelas
1 GCM (Global Cancer Map) 190 14
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
2 Lymphoma 96 3
3 CNS (Central Nervous System Tumour Outcome) 60 2
4 Leukimia 72 2
5 Leukimia nom. 72 2
6 Ovarian 61902 61902 253
7 Lung cancer 32 3
8 C. Arrhythmia 452 16
9 Dermatology 366 6
10 HD Switz 123 5
11 Lymphography 148 4
12 Hepatitis 155 2
13 HD Hungarian 294 5
14 HD Cleveland 303 5
15 P. Patient 90 3
16 WDBC (Wisconsin Diagnositic Breast Cancer) 569 2
17 Splice Junction 3190 3
18 Heart Statlog 270 2
19 Allhyper 3772 5
20 Allhypo 3772 4
21 Sick 3772 2
22 Breast cancer 286 2
23 Hypothyroid 3163 2
24 ANN thyroid 7200 3
25 WBC (Wisconsin Breast Cancer) 699 2
26 C. Method 1473 3
27 Pima Diabetes 768 2
28 Liver disorders 345 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
29 H. Survival 306 2
Analisa dari 29 dataset menunjukan bahwa dari 128 pohon tidak ada
perbedaan yang signifikan antara hutan menggunakan 256, 512,1024, 2048 dan
4096 pohon. Oleh karena itu, dimungkinkan banyak pohon, berdasarkan
percobaan sebelumnya, kisaran antara 64 dan 128 pohon di hutan. Dengan jumlah
pohon ini, memperoleh keseimbangan yang baik antara area under curva, waktu
pemrosesan, dan penggunaan memori.
2.9 Menghitung Akurasi
Performansi suatu prediksi dari suatu metode pada diukur dari error hasil
prediksi tersebut. Nilai error dapat dihitungan dengan menggunakan Mean
Absolute Percentage Error (MAPE). MAPE adalah rata-rata dari keseluruhan
persentase selisih antara data aktual dan data hasil prediksi. Rumus MAPE adalah
∑
Dimana :
At = nilai harga sesungguhnya
Ft = nilai prediksi
n = banyak data
t = waktu
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
BAB III
METODE PENELITIAN
3.1 Sumber Data
Data yang digunakan pada penelitian ini merupakan data transaksi penjualan
tembakau rajangan diperoleh dari PT Gudang Garam TBK tahun 2015. Serta data
iklim harian tahun 2015 dari Badan Meteorologi Klimatologi dan Geofisika.
Jumlah data diperoleh 1244 record dan 23 atribut. Atribut data set ditunjukan
pada tabel 2 sebagai berikut:
Tabel 2. Atribut Dataset
No Atribut Keterangan dan Nilai
1 Daerah Asal daerah tembakau rajangan diambil
2 Party Tempat penjualan tembakau rajangan
3 Seri Jenis atau asal tembakau (sawah/tegalan/gunung/beli daun)
4 Nomor Nomor transaksi tembakau rajangan
5 Grade Tingkat kwalitas tembakau (A/B/C/D/E/F) A adalah kwalitas
terendah dan F adalah kwalitas tertinggi
6 Bruto Berat kotor, berat termasuk berat keranjang dalam (kg)
7 Netto Berat bersih tembakau murni dalam (kg)
8 Harga Harga perkilo gram tembakau dalam rupiah
9 Jumlah Hasil perkalian dari Netto dengan Harga
10 Tanggal
Transaksi Tanggal transaksi tembakau rajangan
11 Nama
stasiun Nama stasiun Klimatologi
12 WMO ID
Identitas World Meteorological Organization, WMO adalah badan
khusus Perserikatan Bangsa-Bangsa untuk meteorologi (cuaca dan
iklim), hidrologi dan geofisika
13 Tanggal Tanggal iklim harian Kabupaten Temanggung
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
14 Suhu
minimum Suhu minimum di Kabupaten Temanggung (°C)
15 Suhu
maksimum Suhu maksimum di Kabupaten Temanggung (°C)
16 Suhu rata-
rata Suhu rata-rata di Kabupaten Temanggung (°C)
17 Kelembaban
rata-rata Kelembaban rata-rata di Kabupaten Temanggung (°C)
18 Curah hujan Curah hujan di Kabupaten Temanggung (mm)
19 Lama
penyinaran
Lama penyinaran matahari di Kabupaten Temanggung
(jam)
20
Kecepatan
angin rata-
rata
Kecepatan angin rata-rata di Kabupaten Temanggung
(knot)
21 Arah angin
terbanyak Arah angin terbanyak di Kabupaten Temanggung (deg)
22
Kecepatan
angin
terbesar
Kecepatan angin terbesar di Kabupaten Temanggung
(knot)
23
Arah angin
saat
kecepatan
maksimum
Arah angin saat kecepatan maksimum di Kabupaten
Temanggung (deg)
3.2 Tahap-tahap penelitian
3.2.1 Studi Pustaka
Penulis mempelajari berbagai literatur yang berkaitan dengan metode
decision tree pada penambangan data khususnya mengenai algoritma
Random Forest dan literatur lainnya yang digunakan sebagai acuan
membangun sistem.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
3.2.2 Observasi
Observasi merupakah salah satu metode dalam mengumpulkan data
dengan melakukan pengamatan dan pencatatan mengenai objek yang sedang
diteliti. Objek yang diteliti adalah harga tembakau rajangan di kabupaten
Temanggung pada tahun 2015. Data transaksi diambil dari PT Gudang
Garam TBK sedangkan data iklim harian diambil dari BMKG. Berdasarkan
wawancara dengan grader PT Gudang Garam TBK diketahui bahwa harga
tembakau dipengaruhi oleh kualitas.
Berdasarkan studi literatur pada bab 2 sub bab 2.2 mengenai faktor
yang mempengaruhi kualitas tembakau dapat diketahui bahwa suhu,
kelembaban, curah hujan, lama penyinaran, agroeksistem, dan elevasi atau
ketinggian mempengaruhi kualitas tembakau.
3.2.3 Pengolahan Data
Setelah data terkumpul maka proses selanjutnya adalah pengolahan
data. Cara pengolahan data dapat dinyatakan kedalam bentuk blok diagram
seperti dibawah ini.
Gambar 3.1. Blok Diagram
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
Dataset dan pengujian memiliki langkah yang sama. Penjelasan
preprocessing akan dijelaskan pada proses Knowledge Discovery in
Database. Pada tahap ini, dilakukan proses Knowledge Discovery in
Database. Proses yang terjadi adalah sebagai berikut :
1. Data Integration
Proses data integration adalah proses menggabungkan data dari
berbagai sumber data yang berbeda. Pada penelitian ini dilakukan tahap
data integration terhadap dataset tidak konsisten. Atribut dataset iklim
digabung dengan dataset transaksi tembakau rajangan berdasarkan
tanggal transaksi. Pada tahap ini penulis melakukan secara manual
menggunakan aplikasi microsoft excel, yaitu menggabungkan dataset
iklim dan dataset transaksi.
2. Data Selection
Proses data selection adalah proses memilih data atau atribut yang
relevan untuk penelitian ini. Dalam data mining pemilihan atau
pengurangan dataset seharusnya dapat mengefektifkan hasil analisa tanpa
mengurangi integritas data asli. Tujuan dari pemilihan subset atribut
adalah untuk menemukan seperangkat atribut minimum sehingga
distribusi probabilitas yang dihasilkan dari data kelas sedekat mungkin
dengan distribusi asli yang diperoleh menggunakan semua atribut. Pada
tahap ini penulias melakukan secara manual menggunakan aplikasi
microsoft excel.
3. Data Transformation
Proses data transformation adalah proses menggabungkan data ke
dalam bentuk yang sesuai untuk ditambang. Pada penelitian ini, proses
data transformasi akan dilakukan perubahan menjadi data numerik untuk
semua atribut. Pada tahap ini penulias melakukan secara manual
menggunakan aplikasi microsoft excel.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
3.2.4 Pembuatan Alat Uji
Alat uji nantinya dibuat menggunakan aplikasi PyCharm dengan
menggunakan bahasa pemrogram Python dengan mengimplementasikan
metode Random Forest Regressor.
3.2.5 Analisa Hasil dan Pembuatan Laporan
Analisa hasil dari perangkat lunak dibuat berdasarkan pendekatan
algoritma Random Forest, yaitu algoritma yang digunakan pada klasifikasi
data dalam jumlah yang besar. Klasifikasi Random Forest dilakukan melalui
penggabungan pohon dengan melakukan training pada sampel dataset
penjualan tembakau dan dataset iklim harian di Kabupaten Temanggung.
Penentuan klasifikasi dengan Random Forest diambil berdasarkan hasil vote
terbanyak dari pohon yang terbentuk dan untuk regresi diambil berdasarkan
hasil rata-rata dari pohon yang terbentuk. Pemenang dari pohon yang
terbentuk ditentukan dengan rata-rata pohon. Hasil dari analisi dan
pengujian akan disusun kedalam sebuah laporan tugas akhir.
3.3 Spesifikasi Alat
Penelitian dilakukan dengan menggunakan hardware dan dan software
sebagai berikut:
a. Spesifikasi hardware
1) Prosessor : Intel® Core™ i5-4210 CPU @ 1.70GHz (4 CPUs), ~ 2.4GHz
2) RAM : 4.00 GB
3) Tipe Sistem : Windows 10 Pro 64-bit (10.0, Build 17134)
b. Spesifikasi software
1) Sistem Operasi Microsoft Windows 10.
2) Pycharm, software ini akan digunakan untuk membuat sistem.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
BAB IV
PERANCANGAN PERANGKAT LUNAK
4.1 Perancangan Sistem
4.1.1 Input
Masukan pada sistem perangkat lunak ini berupa data file dengan extensi
.csv dan jumlah pohon.
4.1.2 Proses
Data yang dimasukan ke perangkat lunak akan di proses memiliki beberapa
tahap untuk membangun model pohon Random Forest. Dapat dilihat pada
gambar 3.
Gambar 4.1. Flowchart diagram
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
4.1.3 Output
Output yang dihasilkan dari proses analisa Random Forest
menampilkan grafik model prediksi harga tembakau rajangan Kabupaten
Temanggung pada tahun 2015.
4.2 Preprocessing
Tahap preprocessing dilakukan untuk mempersiapkan data agar siap untuk
diolah untuk memprediksi harga. Proses preprocessing ini dibagi menjadi 4 tahap
yaitu mengatasi missing data dengan teknik impultasi, data integration, data
selection dan data transformation.
4.2.1 Mising Data
Pada dataset iklim terdapat missing data yang dinotasikan dengan
9999 untuk data iklim tidak tersedia dan 8888 untuk data iklim tidak
terukur. Proses untuk menangani missing data adalah dengan menggunakan
teknik impultasi.
Langkah 1 : membaca dataset iklim bertipe .csv
Langkah 2 : menghapus kolom atau baris yang bernilai NA, dan data
yang bernilai kosong dapat diisi dengan data baru hasil
implutasi.
Langkah 3 : menghitung nilai rata-rata dari variable a
Langkah 4 : menghitung nilai standar deviasi variable a
Langkah 5 : menjumlah banyak data yang kosong dari variable a
Langkah 6 : menentukan nilai random yang akan diisi kedalam list
sebanyak data kosong dari variable a, nilai random diambil dari
rata-rata variable a dikurangi standar deviasi nilai a sebagai
batas bawah dan rata-rata variable a ditambah standar deviasi
nilai a sebagai batas atas
Langkah 7 : mengisi dataset variable a dengan nilai yang sudah
disimpan dalam list (random)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Langkah 8 : mengisi dataset variable a yang kosong dengan nilai
random
4.2.2 Data Selection
Dalam data selection akan menghilangkan atribut yang tidak relevan
dalam penelitian ini. Atribut yang dihapus dalam dataset dalam penelitian
ini adalah atribut yang tidak independen. Sesuai dengan (Elda Nurnasari dan
Djumali, 2010), perbedaan ketinggian tempat diikuti oleh perbedaan unsur-
unsur lingkungan (temperatur udara, kelembapan udara relatif, curah hujan,
dan jumlah hari hujan) berpengaruh terhadap produksi dan mutu tembakau
temanggung.
Atribut subset yang dihapus atau dihilangkan pada dataset iklim adalah :
a. Nama stasiun
b. WMO ID
c. Tanggal
d. Suhu minimum
e. Suhu maksimum
f. Kecepatan angin rata-rata
g. Arah angina terbanyak
h. Kecepatan angin terbesar
i. Arah angin saat kecepatan maksimum
Atribut yang dihapus atau dihilangkan pada dataset transaksi adalah :
a. Tanggal Transaksi
b. Party
c. Nomor transaksi
d. Bruto
e. Netto
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
4.2.3 Data Transformation
Tranformasi dilakukan di dataset transaksi pada atribut seri dan grade.
Dimana nilai grade A merupakan mutu terendah dan grade F merupakan
mutu tertinggi.
Atribut grade ditransformasi menjadi :
A : 1
B : 2
C : 3
D : 4
E : 5
F : 6
Sedangkan untuk atribut seri terdapat nilai LSP, LSW, LSS, LSY,
LSR, LSU, BLS, LSX merupakan tembakau yang ditanam di
agroekosistem sawah. TGP, TGW, TGS, TGR, TGX, TGU, TGS
merupakan tembakau yang ditanam di agroekosistem tegal. BLL, KTT,
BLS, BLP merupakan tembakau yang ditanam di agroekosistem gunung.
Dan GAL merupakan tembakau yang dibeli daun.
Atribut seri ditransformasi menjadi :
LSP, LSW, LSS , LSY, LSR, LSU, BLS, LSX : 1
TGP, TGW, TGS, TGR, TGX, TGU, TGS : 2
BLL, KTT, BLS, BLP : 3
GAL : 4
4.2.4 Data Integration
Menggabungkan dataset iklim dengan dataset transaksi,
Penggabungan berdasarkan tanggal transaksi. Contoh jika terdapat
transaksi di tanggal 28 Agustus 2015 (lampiran 4 dan 5) maka dataset
iklim diambil 4 bulan sebelum tanggal 28 Agustus 2015 yaitu tanggal 28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
April 2015. Setelah mendapat dataset iklim selama 4 bulan, maka langkah
selanjutnya adalah menggabungkan dengan dataset transaksi.
4.2.5 Membagi data training dan data testing
Total data yang digunakan dalam penelitian ini adalah 1244 record,
dan akan dibagi 2/3 bagian untuk data training dan 1/3 bagian untuk data
testing. Maka akan di dapat 871 data training dan 373 data testing.
Langkah 1 : membuat parameter X dan y
Langkah 2 : besar parameter test size 30%
Langkah 3 : split_i sama dengan panjang parameter y dikurangi
panjang parameter y dibagi menggunakan floor division (
1 dibagi test size).
Langkah 4 : mengembalikan nilai X dan y
4.2.6 Membangun model Random Forest
Dalam membangun model Random Forest menggunakan fungsi
RandomForestRegressor. Dengan parameter bootstrap dan n_estimators.
Dimana n_estimator adalah jumlah pohon dan bootstrap bernilai true
maka bootstrap dan replacement digunkan ketika membangun pohon,
jika bootstrap bernilai false maka akan menggunkan semua dataset untuk
membangun pohon.
4.3 Desain Antarmuka
Prototype sistem yang dibangun memiliki interface seperti pada gambar
dibawah ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Gambar 4.2. Desain Antarmuka Sistem
4.4 Pengujian
Dalam pengujian, mencari performa dataset akan dibagi menjadi 2/3
sebagai data training dan 1/3 sebagai data testing. Data testing digunakan sebagai
input. Kemudian menggunakan fungsi RandomForestRegressor( ) untuk membuat
regresi Random Forest. Jumlah pohon yang digunakan dalam penelitian ini
adalah 2j dimana j = 1,2,3…..12.
Dari 12 kali percobaan maka akan dicari nilai akurasi yang paling tinggi dan
nilai error yang paling rendah. Jumlah pohon yang digunakan adalah 2, 4, 8, 16,
32, 64, 128, 256, 512, 1024, 2048, 4096.
4.5 Pengukuran Akurasi Sistem
Cara untuk mengukur tingkat akurasi yaitu dengan mean absolute error
presentase. Nilai tingkat akurasi yang tinggi menunjukan bahwa sistem yang
dibuat cukup baik, untuk memprediksi harga tembakau rajangan di kabupaten
Temanggung pada tahun 2015.
\
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
BAB V
IMPLEMENTASI DAN ANALISA HASIL
5.1 Implementasi Desain Antarmuka
Gambar 5.1. Antarmuka sistem prediksi
Dalam desain antarmuka sistem, terdapat empat button yaitu Load, Proses, Pohon
dan Prediksi yang dibuat dengan Qpush button. Tombol Load digunakan untuk memuat
dataset, tombol Proses digunakan untuk membuat model prediksi, sedangkan tombol
Pohon digunakan menampilkan pohon. Untuk menampilkan dataset menggunakan
Qtabelview. Terdapat juga Qline edit untuk memasukan banyak pohon dan pohon ke-i
yang ingin ditampilkan.
5.2 Hasil Prediksi
Hasil akurasi pendekatan Random Forest untuk model peramalan harga
tembakau rajangan di kabupaten temanggung pada tahun 2015 menghasilkan nilai
akurasi 82.39%. Dari model Random Forest tersebut dapat diperdiksi harga
tembakau untuk tahun tahun kedepannya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
5.3 Analisis Hasil Prediksi
Pembangunan pohon dalam Random Forest adalah dengan membagi dataset
menjadi data training dan data testing. Dimana ukuran dari data training adalah
2/3 sedangkan ukuran dari data testing adalah 1/3. Setelah membagi data,
kemudian membuat subset data secara acak dari dataset dengan menggunakan
bootstrap dengan replacement.
Pohon dibangun sampai ukuran maksimum tanpa adanya pruning, dimana banyak
data tiap model pohon lebih kecil samadengan daripada banyak data training. Setelah
mendapat pohon sebanyak k maka hasil dari tiap model di rata-rata untuk dijadikan nilai
prediksi. Contoh pembuatan model Random Forest dapat dilihat pada lampiran 3.
Gambar 5.2. Hasil ploting untuk Random Forest dengan jumlah pohon 64
Dengan 64 pohon dalam Random Forest, peneliti dapat memprediksi harga
tembakau pada transaksi selanjutnya atau pada tahun selanjutnya. Pohon ke 1
dapat dilihat pada gambar 5.2. Pada pohon ke 1 dataset bootstrap dan
replacement yang digunakan berjumlah 559.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Gambar 5.3. Pohon ke 1 dari 64 pohon dalam Random Forest
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Tabel 3 menunjukkan perbandingan jumlah pohon dalam Random
Forest dengan akurasi yang diperoleh.
Tabel 3. Perbandingan jumlah pohon dengan akurasi
No Banyak pohon Akurasi (%)
1 2 74.94
2 4 81.75
3 8 81.97
4 16 82.13
5 32 82.03
6 64 82.39
7 128 81.89
8 256 82.34
9 512 82.13
10 1024 81.86
11 2048 81.82
12 4096 81.89
Berdasarkan Tabel 3 dapat dianalisa bahwa jumlah pohon yang
optimal pada penelitian ini adalah 64 pohon dengan nilai akurasi 82.39%.
Dimana peningkatan jumlah pohon tidak menghasilkan peningkatan akurasi yang
signifikan (Tidak ada perubahan signifikan dari 256 pohon hingga 4096
pohon), sebaliknya hanya mengingkatkan lama komputasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
BAB VI
PENUTUP
6.1 Kesimpulan
Dari hasil uji data prediksi harga tembakau rajangan di kabupaten
Temanggung dengan menggunakan metode Random Forest. Maka kesimpulan
yang diperoleh dari penelitian ini adalah :
1. Algoritma Random Forest dapat diterapkan untuk memprediksi harga
tembakau rajangan di kabupaten Temanggung.
2. Proses predikisi terhadap 1244 record menggunakan algoritma Random Forest
mengahasilkan akurasi sebesar 82.39%.
3. Banyak pohon yang efektif dalam penelitian ini adalah 64 pohon. Jumlah
pohon mempengaruhi tingkat akurasi dan error serta waktu untuk komputasi.
6.2 Saran
Berdasarkan hasil analisis pada tugas akhir ini, saran yang dapat penulis
berikan untuk penelitian yang akan datang :
1. Mencari data transaksi tembakau dalam bentuk time series lebih banyak
2. Menggunakan teknik lain untuk menangani missing data pada dataset.
3. Mencari indikator lain yang dapat mempengarui harga tembakau, seperti warna
dan tekstur tembakau rajangan.
4. Data prediksi diberikan label, atau membuat pengelompokan harga. Semisal
harga 140000-90000 diberi label A, harga 89999-60000 diberi label B, dan
harga 59999-30000 diberi label C. A adalah harga tinggi, B adalah harga
sedang, dan C adalah harga rendah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
DAFTAR PUSTAKA
Allison, P.D. 2000. Multiple Imputation for Missing Data. A Caautionary Tale.
Badan Pusat Statistik Kabupaten Temanggung, 2018. Kabupaten Temanggung dalam
Angka 2018.
Badan Pusat Statistik Provinsi Jawa Tengah, 2017. Provinsi Jawa Tengah dalam
Angka 2017.
Basuki, S., F. Rochman, dan S. Yulaikah, 2000. Biologi Tembakau Temanggung, 1-6.
Breiman, L., 2001. Random forests, Machine Learning, Kluwer Academic
Publishers, 45, 5-32.
Cahyono, B., 2005. Tembakau Budi Daya dan Analisis Tani, Kanisius, Yogyakarta.
Davies, B., 2004. Database Systems 3rd Edition. Palgrave, Basingstoke, UK.
Davis, D. L. and Neilsen, M. T., 1999. Tobacco Production, Chemistry and
Technology, Coresta, Blackwell Science Ltd.
Djumali. 2008. Produksi dan Mutu Tembakau Temanggung (Nicotiana tabacum L.)
di Daerah Tradisional serta Faktor-Faktor yang Mempengaruhinya, Disertasi,
Universitas Brawijaya, Malang.
Han, J., Kamber, M., dan Pei, J., 2006. Data Mining: Concepts and Techniques.
Morgan Kaufmann.
Kusrini, Luthfi, Taufiq, dan Emha, 2009. Algoritma Data Mining, Penerbit Andi,
Yogyakarta.
L. Breiman, “Bagging Predictors,” Machine Learning, 24, 123-140.
Lewis, M.D dan Roger, J. (2000). An Introducion to Classification and Regression
Trees (CART) Analysis. Annual Meeting of Society For Academic Emergency.
California, UCLA Medical Center
Makridakis, Wheelwright and Mcgee, 1991. Metode dan Aplikasi Peramalan, Edisi
Kedua. Jakarta: Erlangga.
Martiningtyas, N, 2004. Diktat Statistika. STIKOM, Surabaya.
Matnawi, H., 1997. Budi Daya Tembakau Dibawah Naungan. Kanisius. Yogyakarta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
Mayumi, T. O. et al. 2012. How Many Trees in a Random Forest?. Department of
Computer Science and Mathematics Faculty of Philosophy, Sciences and
Languages at Ribeirao Preto University of Sao Paulo.
Nicholson. Walter, 1995. Teori Ekonomi Mikro Prinsip Dasar dan Perluasan.
Jakarta: Binarupa Aksara.
Nurnasari, E. dan Djumali, 2010. Pengaruh Kondisi Ketinggian Tempat Terhadap
Produksi dan Mutu Tembakau Temanggung.
Pramudiono, I., 2006. Apa itu Data Mining?, http://datamining.japati.net/cgibin/
indodm.cgi, diakses tanggal 06 November 2018.
Purlani, E. dan Rachman, A., 2000. Budi Daya Tembakau Temanggung, dalam
Monograf Tembakau Temanggung, Balai Penelitian Tembakau dan Tanaman
Serat, Malang, 19-31.
Rochman, F. dan Suwarso, 2000. Kultivar Lokal Tembakau Temanggung dan Usaha
Perbaikannya, dalam Monograf Tembakau Temanggung, Balai Penelitian
Tembakau dan Tanaman Serat, Malang, 7-13.
Rubin, D., 1987. Multiple imputation for nonresponse in surveys. John Wiley & Sons,
Inc., New York.
Santosa, Budi, 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis,
Graha Ilmu, Yogyakarta.
Sholeh, M. 2000. Curah Hujan dan Waktu Tanam Tembakau Temanggung, dalam
Monograf Tembakau Temanggung, Balai Penelitian Tembakau dan Tanaman
Serat, Malang, 14-18.
Sulistyono. 1995. Pengaruh tinggi tempat terhadap Pinus merkusii Jungh et de Vriese
di KPH Probolinggo Perum Perhutani Unit II Jawa Timur. Skripsi, IPB.
Tirtosastro, S., 2004. Penerapan Standar Mutu Tembakau di Indonesia.
Tirtosastro, S., 2004. Panen dan Pengolahan Tembakau Rajangan Temanggung
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
Lampiran 1
Tabel 4. Produk Domestik Regional Bruto Atas Dasar Harga Berlaku Menurut
Lapangan Usaha di Kabupaten Temanggung (Miliar rupiah) 2014-2017 (Badan Pusat
Statistik Kabupaten Temangggung, 2018)
No Lapangan Usaha 2014 2015 2016 2017
1 Pertanian,
Kehutanan, dan
Perikanan
3,734.88 4,156.11 4,429.54 4,576.31
2 Pertambangan dan
Penggalian
120.93 140.87 156.46 168.90
3 Industri
Pengelolahan
3.862.67 4.272.81 4.701.85 5.094.77
4 Pengadaan Listrik dan
Gas
11.01 11.59 13.01 15.46
5 Pengadaan Air,
Pengelolaan
Sampah, Limbah dan
Daur Ulang
11.57 12.13 12.81 13.70
6 Konstruksi 653.21 746.20 809.21 907.37
7 Pedagang Besar dan
Eceran,
Reparasi Moobil dan
Sepeda Motor
3.023.32 3.272.21 3.566.49 3.847.20
8 Transportasi dan
Pergudangan
568.60 613.42 652.23 675.72
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
9 Penyediaan
Akomodasi dan
Makan Minum
188.55 201.30 212.59 228.95
10 Informasi dan 201.37 217.69 228.83 253.04
Komunikasi
11 Jasa Keuangan dan
Asuransi
359.10 387.73 418.78 437.36
12 Real Estate 99.76 106.71 112.91 121.78
13, 14 Jasa Perusahaan 39.26 42.45 44.74 48.39
15 Administrasi
Pemerintahan,
Pertahaan dan Jaminan
Sosial
Wajib
341.60 358.69 368.63 377.51
16 Jasa Pendidikan 486.47 516.48 547.87 575.21
17 Jasa Kesehatan dan
Kegiatan Sosial
123.93 130.65 140.36 154.28
18,19,
20,21
Jasa lainnya 243.33 250.29 268.52 289.60
Produk Domestik
Regional Bruto
11.867.68 12.486.49 13.110.80 13.724.46
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Lampiran 2
Tabel 5. Luas area dan produksi Tembakau Perkebunan Rakyat Menurut
Kabupaten dan keadaan Tanaman tahun 2014-2017 (Badan Pusat Statistik
Provinsi Jawa Tengah, 2017)
No Provinsi-
Kabupaten
Luas Area (Ha) Produk
si (ton)
Produktivitas
(Kg/Ha)
Jumlah
Petani Tanam Panen
1 Kab
Temanggung
19.209 18.248 10.581 580 64.030
2 Kab Magelang 6.613 6.613 4.298 650 8.107
3 Kab
Wonosobo
3.876 3.876 2.785 718 7.071
4 Kab Boyolali 3.754 3.754 3.379 900 8.597
5 Kab Rembang 2.500 2.500 2.804 1.122 4.541
6 Kab Klaten 1.802 1.802 2.191 1.216 6.487
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Lampiran 3 Pembuatan model random forset
Dataset yang digunakan untuk membangun model :
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran
1
Seri Grade Harga
Data
Training
27.7 67 15.5 9.4 1 2 45000
27.9 68 17 9.4 4 2 45000
27 68 17 9.5 1 1 40000
27.7 67 17 9 3 2 35000
27.7 68 9 9.4 3 3 40000
28.1 67 11 9.4 4 2 37500
27.9 69 13 8.4 2 3 35000
26 70 17 9.4 3 2 37500
27.7 68 15.5 9 3 2 35000
27.9 71 15 9.7 2 2 40000
Data
Testing
25.5 72 10 9.5 4 2 40000
25.5 72 10 9.5 4 2 45000
27.7 68 20 9.4 4 2 40000
Pembentukan pohon model 1
Setelah proses bootstrap dan replacement model 1 didapat random dataset untuk
membangun pohon 1
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 68 9 9.4 3 3 40000
27.7 68 9 9.4 3 3 40000
27.9 71 15 9.7 2 2 40000
28.1 67 11 9.4 4 2 37500
26 70 17 9.4 3 2 37500
27.7 68 15.5 9 3 2 35000
27.7 68 15.5 9 3 2 35000
27.9 69 13 8.4 2 3 35000
Langkah-langkah dalam membangun pohon 1:
1. Menentukan node 1
Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi
gain
Total 8 3 2 3 1.561278
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
Suhu 1 0.015712
<=27.7 5 2 1 2 1.521928
>27.7 3 1 1 1 1.584963
Kelembaban 1 0.015712
<=68 5 2 1 2 1.521928
>68 3 1 1 1 1.584963
Curah hujan 1 0.061278
<=14 4 2 1 1 1.5
>14 4 1 1 2 1.5
Lama Penyinaran 1 0.199204
<=9.4 7 2 2 3 1.556657
>9.4 1 1 0 0 0
Seri 0.293564
<=3 7 3 1 3 1.448816
>3 1 0 1 0 0
Grade 0.610073
<=2 5 1 2 2 1.521928
>2 3 2 0 1 0
Atribut yang dipilih untuk dijadikan node adalah grade, karena grade memiliki nilai
information gain yang paling besar.Hasil pohon :
2. Menentukan node 2
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 71 15 9.7 2 2 40000
28.1 67 11 9.4 4 2 37500
26 70 17 9.4 3 2 37500
27.7 68 15.5 9 3 2 35000
27.7 68 15.5 9 3 2 35000
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi
Grade <=2
sample = 8
Value = 41428.57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
gain
Total 5 1 2 2 1.521928
Suhu 1 1.521928
<=27.7 3 0 1 2 0
>27.7 2 1 1 0 0
Kelembaban 1 1.521928
<=68 3 0 1 2 0
>68 2 1 1 0 0
Curah hujan 1 0.355894
<=15.5 4 1 1 2 1.457542
>15.5 1 0 1 0 0
Lama Penyinaran 1 1.521928
<=9.4 4 0 2 2 0
>9.4 1 1 0 0 0
Seri 0.355894
<=3 4 1 1 2 1.457542
>3 1 0 1 0 0
Grade 0
<=2 5 1 2 2 1.521928
>2 0 0 0 0 0
Atribut yang dipilih untuk dijadikan node adalah kelembaban 1, karena memiliki
yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.
Hasil pohon
True
Grade <=2
sample = 8
Value = 41428.57
Kelembaban 1 <= 68
sample = 5
Value = 37000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
3. Menentukan node 3
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 68 9 9.4 3 3 40000
27.7 68 9 9.4 3 3 40000
27.9 69 13 8.4 2 3 35000
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi
gain
Total 3 2 - 1 0.918296
Suhu 1 0.918296
<=27.7 2 2 - 0 0
>27.7 1 0 - 1 0
Kelembaban 1 0.918296
<=68 2 2 - 0 0
>68 1 0 - 1 0
Curah hujan 1 0.918296
<=9 2 2 - 0 0
>9 1 0 - 1 0
Lama Penyinaran 1 0.918296
<=9.4 2 2 - 0 0
>9.4 1 0 - 1 0
Seri 0
<=3 3 2 - 1 0.918296
>3 0 0 - 0 0
Grade 0
<=3 3 2 - 1 0.918296
>3 0 0 - 0 0
Atribut yang dipilih untuk dijadikan node adalah suhu 1, karena memiliki yang
paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil
pohon
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
True False
4. Menentukan node 4
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
28.1 67 11 9.4 4 2 37500
27.7 68 15.5 9 3 2 35000
27.7 68 15.5 9 3 2 35000
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi
gain
Total 3 - 1 2 0.918296
Suhu 1 0.918296
<=27.7 2 - 0 2 0
>27.7 1 - 1 0 0
Kelembaban 1 0.918296
<=68 2 - 0 2 0
>68 1 - 1 0 0
Curah hujan 1 0.918296
<=15.5 2 - 1 0 0
>15.5 1 - 0 2 0
Lama Penyinaran 1 0.918296
<=9 2 - 0 2 0
>9 1 - 1 0 0
Seri 0
<=3 3 - 0 2 0.918296
>3 0 - 1 0 0
Grade <=2
sample = 8
Value = 41428.57
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
Grade 0
<=2 3 - 1 2 0.918296
>2 0 - 0 0 0
Atribut yang dipilih untuk dijadikan node adalah lama penyinaran 1, karena memiliki
yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.
Hasil pohon
True False
5. Menentukan node 5
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 71 15 9.7 2 2 40000
26 70 17 9.4 3 2 37500
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 37500 35000 Entropy Informasi
gain
Total 2 1 1 - 1
Suhu 1 1
<=27 1 0 1 - 0
>27 1 1 0 - 0
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Kelembaban 1 1
<=70.5 1 0 1 - 0
>70.5 1 1 0 - 0
Curah hujan 1 1
<=16 1 1 0 - 0
>16 1 0 1 - 0
Lama Penyinaran 1 1
<=9.6 1 0 1 - 0
>9.6 1 1 0 - 0
Seri 1
<=2.5 1 1 0 - 0
>2.5 1 0 1 - 0
Grade 0
<=2 2 1 1 - 1
>2 0 0 0 - 0
Atribut yang dipilih untuk dijadikan node adalah curah hujan 1, karena memiliki
yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.
Hasil pohon
True False
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
6. Menentukan node 6
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 68 15.5 9 3 2 35000
27.7 68 15.5 9 3 2 35000
Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut
kelas dijadikan leaf node dengan nilai kelas tersebut.
True False
7. Menentukan node 7
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
28.1 67 11 9.4 4 2 37500
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa.
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
True False
8. Menentukan node 8
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 71 15 9.7 2 2 40000
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa
True False
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
sample = 1
Value = 37500
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
9. Menentukan node 9
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
26 70 17 9.4 3 2 37500
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa
True False
10. Menentukan node 10
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
sample = 1
Value = 37500 sample = 1
Value = 40000
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
sample = 1
Value = 37500 sample = 1
Value = 40000 sample = 1
Value = 37500
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 68 9 9.4 3 3 40000
27.7 68 9 9.4 3 3 40000
Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut
kelas dijadikan leaf node dengan nilai kelas tersebut
True False
11. Menentukan node 11
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 69 13 8.4 2 3 35000
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa.
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
sample = 1
Value = 37500
sample = 2
Value = 40000
sample = 1
Value = 40000 sample = 1
Value = 37500
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
True False
Pembentukan pohon model 2
Setelah proses bootstrap dan replacement model 2 didapat random dataset untuk
membangun pohon 2
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 67 15.5 9.4 1 2 45000
27.7 67 15.5 9.4 1 2 45000
27.9 68 17 9.4 4 2 45000
27 68 17 9.5 1 1 40000
27 68 17 9.5 1 1 40000
27.7 67 17 9 3 2 35000
27.9 71 8 9.7 2 2 40000
Langkah-langkah dalam membangun pohon 1:
Lama penyinaran 1 <= 9
sample = 3
Value = 37000
Kelembaban 1 <= 68
sample = 5
Value = 37000
Suhu 1 <= 27.7
sample = 3
Value =38333.33
Grade <=2
sample = 8
Value = 41428.57
Curah hujan 1 <= 16
sample = 2
Value = 38750
sample = 2
Value = 35000
sample = 1
Value = 37500
sample = 2
Value = 40000
sample = 1
Value = 35000
sample = 1
Value = 40000 sample = 1
Value = 37500
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
1. Menentukan node 1
Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi
gain
Total 7 3 3 1 1.448816
Suhu 1 0.361724
<=27.7 5 2 1 2 1.521928
>27.7 2 1 0 1 0
Kelembaban 1 0.198117
<=68 6 0 1 2 1.459148
>68 1 1 1 0 0
Curah hujan 1 0
<=17 7 3 1 3 1.448816
>17 0 0 0 0 0
Lama Penyinaran 1 1.448816
<=9.4 4 3 1 0 0
>9.4 3 0 0 3 0
Seri 0.769546
<=1 4 2 0 2 0
>1 3 1 1 1 1.584963
Grade 0
<=2 7 3 1 3 1.448816
>2 0 0 0 0 0
Atribut yang dipilih untuk dijadikan node adalah lama penyinaran 1, karena lama
penyinaran 1 memiliki nilai information gain yang paling besar.Hasil pohon :
2. Menentukan node 2
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 67 15.5 9.4 1 2 45000
27.7 67 15.5 9.4 1 2 45000
27.9 68 17 9.4 4 2 45000
27.7 67 17 9 3 2 35000
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi
gain
Total 4 - 3 1 0.811278
Suhu 1 0.122556
<=27.7 3 - 2 1 0.918296
>27.7 1 - 1 0 0
Kelembaban 1 0.122556
<=67 3 - 2 1 0.918296
>67 1 - 1 0 0
Curah hujan 1 0.311278
<=16.3 2 - 2 0 0
>16.3 2 - 1 1 1
Lama Penyinaran 1 0
<=9.4 4 - 3 1 0.811278
>9.4 0 - 0 0 0
Seri 0.311278
<=2 2 - 2 0 0
>2 2 - 1 1 1
Grade 0
<=2 4 - 3 1 0.811278
>2 0 - 0 0 0
Atribut yang dipilih untuk dijadikan node adalah seri, karena memiliki yang paling
besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil pohon
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
3. Menentukan node 3
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27 68 17 9.5 1 1 40000
27 68 17 9.5 1 1 40000
27.9 71 8 9.7 2 2 40000
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi
gain
Total 3 3 - - 0
Suhu 1 0
<=27 2 2 - - 0
>27 1 1 - - 0
Kelembaban 1 0
<=68 2 2 - - 0
>68 1 1 - - 0
Curah hujan 1 0
<=17 2 2 - - 0
>17 1 1 - - 0
Lama Penyinaran 1 0
<=9.5 2 2 - - 0
>9.5 1 1 - - 0
Seri 0
<=1 2 2 - - 0
>1 1 1 - - 0
Grade 0
<=1 2 2 - - 0
>1 1 1 - - 0
Atribut yang dipilih untuk dijadikan node adalah suhu 1, karena memiliki yang
paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu. Hasil
pohon
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
4. Menentukan node 4
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 67 15.5 9.4 1 2 45000
27.7 67 15.5 9.4 1 2 45000
Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut
kelas dijadikan leaf node dengan nilai kelas tersebut
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
5. Menentukan node 5
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 68 17 9.4 4 2 45000
27.7 67 17 9 3 2 35000
Hasil perhitungan information gain
Atribut Partisi Total kasus 40000 45000 35000 Entropy Informasi
gain
Total 2 - 1 1 1
Suhu 1 1
<=27.8 1 - 0 1 0
>27.8 1 - 1 0 0
Kelembaban 1 1
<=67.5 1 - 0 1 0
>67.5 1 - 1 0 0
Curah hujan 1 1
<=17 1 - 0 1 0
>17 1 - 1 0 0
Lama Penyinaran 1 1
<=9.2 1 - 0 1 0
>9.2 1 - 1 0 0
Seri 1
<=3.5 1 - 0 1 0
>3.5 1 - 1 0 0
Grade 0
<=2 2 - 1 1 1
>2 0 - 0 0 0
Atribut yang dipilih untuk dijadikan node adalah kelembaban 1, karena memiliki
yang paling besar dan jika ada nilai information gain yang sama maka dipilih salah satu.
Hasil pohon
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
6. Menentukan node 6
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.7 67 17 9 3 2 35000
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa.
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000
Kelembaban 1 <= 67.5
sample = 2
Value = 40000
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000 Kelembaban 1 <= 67.5
sample = 2
Value = 40000
Sample = 1
Value = 35000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
7. Menentukan node 7
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 68 17 9.4 4 2 45000
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa.
8. Menentukan node 8
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27 68 17 9.5 1 1 40000
27 68 17 9.5 1 1 40000
Setiap kali data yang tersisa memiliki nilai atribut kelas yang sama, maka atribut
kelas dijadikan leaf node dengan nilai kelas tersebut
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000 Kelembaban 1 <= 67.5
sample = 2
Value = 40000
Sample = 1
Value = 35000 Sample = 1
Value = 45000
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
9. Menentukan node 9
Suhu 1 Kelembaban
1
Curah
hujan 1
Lama
penyinaran 1
Seri Grade Harga
27.9 71 8 9.7 2 2 40000
Setiap kali data tersisa satu maka atribut kelas akan dijadikan leaf node dengan nilai
kelas yang tersisa.
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000 Kelembaban 1 <= 67.5
sample = 2
Value = 40000
Sample = 1
Value = 35000 Sample = 1
Value = 45000
Sample = 2
Value = 40000
Lama penyinaran 1 <= 9.4
sample = 7
Value = 41428.57
Seri <= 2
sample = 4
Value = 42500
Suhu 1 <= 27
sample = 3
Value = 40000
Sample = 2
Value = 45000 Kelembaban 1 <= 67.5
sample = 2
Value = 40000
Sample = 1
Value = 35000 Sample = 1
Value = 45000
Sample = 2
Value = 40000
Sample = 1
Value = 40000
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
Setelah pohon terbentuk maka dapat dilakukan prediksi harga tembakau dan mengukur akurasi dari Random Forest
yang terbuat :
Suhu 1 Kelembaban 1 Curah hujan 1 Lama penyinaran 1 Seri Grade Harga Pohon 1 Pohon 2 Prediksi harga
25.5 72 10 9.5 4 2 40000 40000 40000 40000
25.5 72 10 9.5 4 2 45000 40000 40000 40000
27.7 68 20 9.4 4 2 40000 37500 45000 41250
Dari data testing dapat diprediksi harga berdasarkan pohon 1 dan pohon 2 dimana nilai predikisi adalahh rata-rata di tiap
pohon. Kemudian untuk menghitung akurasi menggunakan mean absolute percentage error, maka didapat nilai MAPE 4.75. Untuk
nilai akurasi yaitu dengan 100 - 4.75 = 95.25%.
Harga Prediksi Error MAPE
40000 40000 |40000-40000| = 0 (0/40000)x100 = 0
45000 40000 |40000-45000| = 5000 (5000/45000)x100 = 11.11
40000 41250 |41250-40000| = 1250 (1250/40000)x100 = 3.125
Mean dari MAPE 4.75
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
Lampiran 4 Dataset Iklim harian Tahun 2015 dari Bulan April Hingga September
Nama
Stasiun
WMO
ID Tanggal
Suhu
Minimum
Suhu
Maksimum
Suhu
Rata -
rata
Kelemba
ban
Rata-
rata
Curah
Hujan
Lama
Penyinaran
Kecepatan
Angin
Rata-
rata
Arah
Angin
Terban
yak
Kecepatan
Angin
Terbesar
Arah
Angin Saat
Kecepata
Maksimum
Stasiun
Klimatologi
Semarang 96835 01/04/2015 24.6 31.8 28.1 86 42.5 8.4 1 N 4 360
Stasiun
Klimatologi
Semarang 96835 02/04/2015 25.4 31.2 28 84 32.3 9999 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 03/04/2015 23 30.2 26.6 87 5.3 6.7 3 N 4 360
Stasiun
Klimatologi
Semarang 96835 04/04/2015 24.4 33.4 28.3 78 19 2.2 2 E 3 180
Stasiun
Klimatologi
Semarang 96835 05/04/2015 24.8 33 29.2 81 2 10 1 N 2 90
Stasiun
Klimatologi
Semarang 96835 06/04/2015 26.2 32.6 28.2 82 9999 8.5 1 N 4 45
Stasiun
Klimatologi
Semarang 96835 07/04/2015 25.6 30.6 27.1 80 9999 4.7 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 08/04/2015 25 30.8 27.5 80 9999 4.3 2 N 4 360
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
Stasiun
Klimatologi
Semarang 96835 09/04/2015 24.4 31.4 28.2 74 9999 7.8 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 10/04/2015 24.2 33.6 29.1 75 9999 10.4 2 E 4 330
Stasiun
Klimatologi
Semarang 96835 11/04/2015 25.6 31.8 28.9 80 1 9.6 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 12/04/2015 25.6 31.6 28.6 9999 9999 8.2 9999 N 2 360
Stasiun
Klimatologi
Semarang 96835 13/04/2015 24 30.2 26.7 85 15.5 5.1 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 14/04/2015 25 31.8 27.4 82 9999 5.3 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 15/04/2015 24.2 32.2 28.4 78 49.9 7 2 E 2 90
Stasiun
Klimatologi
Semarang 96835 16/04/2015 24.4 31.6 28 85 9999 9999 2 N 2 90
Stasiun
Klimatologi
Semarang 96835 17/04/2015 26 30.8 28.3 79 9999 5 9999 N 2 90
Stasiun
Klimatologi
Semarang 96835 18/04/2015 24.4 31.8 28.1 77 8888 2.5 1 N 4 360
Stasiun
Klimatologi 96835 19/04/2015 26 31.6 26.9 87 9999 9999 1 N 4 225
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
Semarang
Stasiun
Klimatologi
Semarang 96835 20/04/2015 25.2 31.2 27.9 84 15.5 5.3 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 21/04/2015 25 31 28 82 9999 6.6 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 22/04/2015 25.4 31.2 28.2 85 9999 6.2 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 23/04/2015 25.2 31.4 27.4 83 1 4 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 24/04/2015 24.4 31.2 27.6 85 12.2 9.4 1 N 5 360
Stasiun
Klimatologi
Semarang 96835 25/04/2015 24 28.4 26.3 89 21.8 6.9 9999 N 2 360
Stasiun
Klimatologi
Semarang 96835 26/04/2015 24.8 31.2 26.9 86 0.6 0 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 27/04/2015 24.6 31.2 27.3 84 3.2 5 2 N 2 360
Stasiun
Klimatologi
Semarang 96835 28/04/2015 24.6 31 27.8 79 9999 3.8 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 29/04/2015 25.8 30.2 27.7 84 9999 6.7 9999 N 3 360
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
Stasiun
Klimatologi
Semarang 96835 30/04/2015 24 31 27.6 86 35.8 1 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 01/05/2015 23.6 31 27.6 85 27.5 7.8 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 02/05/2015 24 30.2 27.1 86 66 4.8 1 N 2 360
Stasiun
Klimatologi
Semarang 96835 03/05/2015 25 30.4 27.1 84 9999 1.4 2 N 2 360
Stasiun
Klimatologi
Semarang 96835 04/05/2015 20.6 30.4 25.5 94 0.3 1.4 1 N 2 90
Stasiun
Klimatologi
Semarang 96835 05/05/2015 23.6 32.8 27.9 76 71 3.5 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 06/05/2015 26.2 33 29.6 9999 9999 10.4 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 07/05/2015 25.2 33 28.4 78 4.6 9999 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 08/05/2015 24.4 32.8 28.5 69 9999 10.5 3 E 6 120
Stasiun
Klimatologi
Semarang 96835 09/05/2015 24 32.6 27.8 71 9999 10 2 E 2 90
Stasiun
Klimatologi 96835 10/05/2015 23.6 33.4 30 63 9999 9.8 2 E 5 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
Semarang
Stasiun
Klimatologi
Semarang 96835 11/05/2015 27 33.2 29.8 69 9999 9 3 E 5 130
Stasiun
Klimatologi
Semarang 96835 12/05/2015 26.4 34 29.5 71 9999 9.5 2 SE 3 120
Stasiun
Klimatologi
Semarang 96835 13/05/2015 27.8 33 29.8 69 9999 10.2 2 N 3 120
Stasiun
Klimatologi
Semarang 96835 14/05/2015 26.4 33.4 29.2 76 9999 5.2 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 15/05/2015 26 33.4 29.7 72 9999 8.5 3 E 4 90
Stasiun
Klimatologi
Semarang 96835 16/05/2015 24.6 32.4 28.8 75 9999 10 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 17/05/2015 26 33.4 29.3 70 9999 9.8 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 18/05/2015 24.6 33.8 29.2 67 9999 10 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 19/05/2015 25 32.6 28.1 71 9999 10 1 N 4 120
Stasiun
Klimatologi
Semarang 96835 20/05/2015 22.4 32.2 27.6 62 9999 10.3 2 E 4 120
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
Stasiun
Klimatologi
Semarang 96835 21/05/2015 25.4 32.6 29 63 9999 10.3 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 22/05/2015 24.2 33 28.9 66 9999 10.3 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 23/05/2015 24.6 33.8 28.5 69 9999 10 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 24/05/2015 26.4 33 28.9 73 9999 10 2 N 4 120
Stasiun
Klimatologi
Semarang 96835 25/05/2015 26 33.2 29.4 74 9999 10 2 N 5 120
Stasiun
Klimatologi
Semarang 96835 26/05/2015 27 33.2 29.8 73 9999 10 2 E 4 120
Stasiun
Klimatologi
Semarang 96835 27/05/2015 25.4 34 29.5 74 14 8 2 E 2 90
Stasiun
Klimatologi
Semarang 96835 28/05/2015 23.6 33.6 28.9 76 2 9.8 1 N 2 90
Stasiun
Klimatologi
Semarang 96835 29/05/2015 25.4 34.4 29.3 72 9999 9.6 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 30/05/2015 25.4 34.4 28.9 75 9999 10.4 1 N 4 90
Stasiun
Klimatologi 96835 31/05/2015 26.2 34 29 78 9999 9.9 2 E 4 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
Semarang
Stasiun
Klimatologi
Semarang 96835 01/06/2015 24.8 31.8 28.7 77 29.5 9 3 E 6 90
Stasiun
Klimatologi
Semarang 96835 02/06/2015 23.8 32.8 28.3 75 9999 1.2 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 03/06/2015 25.2 34.2 28.4 79 9999 3.8 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 04/06/2015 25.4 33.6 29.3 73 22 9999 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 05/06/2015 25.2 33.8 29.4 67 9999 8.9 2 SE 5 120
Stasiun
Klimatologi
Semarang 96835 06/06/2015 24.8 34 28.6 75 9999 9.5 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 07/06/2015 25.6 32.8 29.1 73 9999 7.5 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 08/06/2015 25 33.4 29 75 1.7 6 2 E 2 90
Stasiun
Klimatologi
Semarang 96835 09/06/2015 26.2 32 28.4 79 9999 7.3 2 N 3 100
Stasiun
Klimatologi
Semarang 96835 10/06/2015 25.4 32.2 28.5 81 9999 3.6 1 N 4 360
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
Stasiun
Klimatologi
Semarang 96835 11/06/2015 25.2 33.4 28.2 78 9999 7.6 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 12/06/2015 22 33 27.5 66 9999 8.3 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 13/06/2015 23 33.8 27.7 66 9999 9.7 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 14/06/2015 22 33.6 27.8 68 9999 9.5 2 E 2 90
Stasiun
Klimatologi
Semarang 96835 15/06/2015 23.6 33.2 27.6 75 2 7.8 1 E 3 90
Stasiun
Klimatologi
Semarang 96835 16/06/2015 22.6 33.6 27.9 61 9999 8 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 17/06/2015 22.8 33.2 27.1 69 9999 10.5 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 18/06/2015 22.8 33.8 28.3 64 9999 9.9 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 19/06/2015 23.4 33.4 27.8 71 9999 10.3 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 20/06/2015 22.6 33.2 28.1 67 9999 8.2 3 E 4 90
Stasiun
Klimatologi 96835 21/06/2015 23.6 33.8 28.7 68 9999 9.5 1 N 3 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
Semarang
Stasiun
Klimatologi
Semarang 96835 22/06/2015 21.4 33.8 27.5 61 9999 9 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 23/06/2015 21.8 33.4 27.2 66 9999 10.3 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 24/06/2015 21 33.6 26.9 64 9999 8.6 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 25/06/2015 22.6 33.2 9999 9999 9999 9999 1 E 3 90
Stasiun
Klimatologi
Semarang 96835 28/06/2015 24.4 33.8 28 71 9999 7 1 N 4 360
Stasiun
Klimatologi
Semarang 96835 29/06/2015 23.8 32.2 27.6 72 9999 10 2 N 6 45
Stasiun
Klimatologi
Semarang 96835 30/06/2015 22.8 33.4 27.7 66 9999 9.4 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 01/07/2015 24.2 30.6 27.4 70 9999 9.2 1 N 4 45
Stasiun
Klimatologi
Semarang 96835 02/07/2015 23.2 32.6 27.5 59 9999 9 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 03/07/2015 20 33.4 26.7 66 9999 6.3 1 N 2 340
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
Stasiun
Klimatologi
Semarang 96835 04/07/2015 22.4 32.4 26.7 69 9999 8.8 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 05/07/2015 22.4 31.6 26.1 71 9999 10 1 N 4 360
Stasiun
Klimatologi
Semarang 96835 06/07/2015 22.2 32.8 26.4 70 9999 9999 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 07/07/2015 23.2 33.8 27.3 70 9999 9 2 E 3 120
Stasiun
Klimatologi
Semarang 96835 08/07/2015 23.4 33.2 27.4 67 9999 7.4 2 E 2 90
Stasiun
Klimatologi
Semarang 96835 09/07/2015 22.4 31.4 27.6 71 9999 8.2 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 10/07/2015 22.4 33.2 27 65 9999 2.5 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 11/07/2015 24.6 33.4 28.6 63 9999 8.2 3 E 5 120
Stasiun
Klimatologi
Semarang 96835 12/07/2015 26.6 33.4 29.2 67 9999 8 4 SE 4 120
Stasiun
Klimatologi
Semarang 96835 13/07/2015 26.6 34.2 29.5 67 9999 10.1 4 E 6 90
Stasiun
Klimatologi 96835 14/07/2015 26.4 33.2 28.9 60 9999 10 2 E 3 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
Semarang
Stasiun
Klimatologi
Semarang 96835 15/07/2015 26 33.4 28.9 61 9999 9.5 3 E 5 90
Stasiun
Klimatologi
Semarang 96835 16/07/2015 25.3 33 28.9 62 9999 10 4 E 6 90
Stasiun
Klimatologi
Semarang 96835 17/07/2015 25 33.6 27.9 68 9999 10 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 18/07/2015 24.8 34 28.8 66 9999 10.3 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 19/07/2015 24 34 27.9 67 9999 9.8 2 N 5 120
Stasiun
Klimatologi
Semarang 96835 20/07/2015 25.6 33.8 28.7 69 9999 10 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 21/07/2015 26.2 33.6 29 68 9999 10 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 22/07/2015 25.4 33.8 28.4 72 1.5 10.1 2 E 5 130
Stasiun
Klimatologi
Semarang 96835 23/07/2015 25.4 33.2 28.3 69 9999 9.4 2 SE 5 120
Stasiun
Klimatologi
Semarang 96835 24/07/2015 24.4 34 28.8 65 9999 10 2 N 5 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
Stasiun
Klimatologi
Semarang 96835 25/07/2015 23.8 33.8 32.5 50 9999 10.3 2 N 5 360
Stasiun
Klimatologi
Semarang 96835 26/07/2015 22.8 34 28.4 67 9999 9.6 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 27/07/2015 22.6 34.2 28.4 67 9999 10 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 28/07/2015 24.4 34.4 28.6 69 9999 9.8 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 29/07/2015 23.6 34.6 28.2 67 9999 10.2 2 E 5 90
Stasiun
Klimatologi
Semarang 96835 30/07/2015 26.2 34.2 28.8 68 9999 10.3 2 N 5 360
Stasiun
Klimatologi
Semarang 96835 31/07/2015 24.2 34 28.3 72 9 9 3 N 4 90
Stasiun
Klimatologi
Semarang 96835 01/08/2015 21.8 34.2 28 68 9999 10 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 02/08/2015 23.2 34 27.4 59 9999 7 3 N 4 90
Stasiun
Klimatologi
Semarang 96835 03/08/2015 19.8 33.4 25.8 66 9999 10.5 2 N 4 360
Stasiun
Klimatologi 96835 04/08/2015 23.6 32.6 27 68 9999 10.5 2 N 4 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
Semarang
Stasiun
Klimatologi
Semarang 96835 05/08/2015 23.6 33 27.8 66 9999 8.7 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 06/08/2015 25.8 32.4 28.2 67 9999 9.4 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 07/08/2015 22.8 33 27.9 74 5.6 5 2 E 3 180
Stasiun
Klimatologi
Semarang 96835 08/08/2015 23.6 33.6 27.7 67 9999 5.5 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 09/08/2015 24.8 33.4 28.5 66 9999 9 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 10/08/2015 26 35 29.1 67 9999 7.3 3 N 6 120
Stasiun
Klimatologi
Semarang 96835 11/08/2015 26.2 34.6 29.4 64 9999 9.5 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 12/08/2015 25.8 35.4 28.8 72 9999 9.4 1 N 4 120
Stasiun
Klimatologi
Semarang 96835 14/08/2015 23.8 33.6 28.7 71 9999 9 2 N 5 360
Stasiun
Klimatologi
Semarang 96835 15/08/2015 26 34.6 29.3 69 9999 9.8 2 E 5 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
Stasiun
Klimatologi
Semarang 96835 16/08/2015 23.8 34.2 29 62 9999 10.3 3 E 5 360
Stasiun
Klimatologi
Semarang 96835 17/08/2015 24.6 35 28 68 9999 10 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 18/08/2015 25.2 34 28.1 67 9999 10 2 N 3 120
Stasiun
Klimatologi
Semarang 96835 19/08/2015 23.4 34 28.7 69 9999 9.8 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 20/08/2015 22 34.4 27.1 64 9999 10 2 E 4 330
Stasiun
Klimatologi
Semarang 96835 21/08/2015 21.4 33 26.8 67 9999 10 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 22/08/2015 23.6 33.8 27.4 63 9999 10.5 2 E 5 360
Stasiun
Klimatologi
Semarang 96835 23/08/2015 22.4 34.4 27.2 61 9999 10 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 24/08/2015 22.2 35.4 27.5 64 9999 10.4 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 25/08/2015 23.4 35.4 28.2 63 9999 10.2 2 E 4 360
Stasiun
Klimatologi 96835 26/08/2015 23.4 34.6 28.1 70 9999 9.2 2 E 3 360
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
Semarang
Stasiun
Klimatologi
Semarang 96835 27/08/2015 24.4 34.6 28.5 69 9999 10.3 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 28/08/2015 25 34.4 29.2 63 9999 10.3 1 N 4 360
Stasiun
Klimatologi
Semarang 96835 29/08/2015 22.4 35.8 28 67 9999 10.5 2 E 5 315
Stasiun
Klimatologi
Semarang 96835 30/08/2015 23.6 35.4 28.4 68 2 10.5 3 E 5 90
Stasiun
Klimatologi
Semarang 96835 31/08/2015 22.6 35.2 28.6 62 9999 10.5 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 01/09/2015 23.6 35.4 28.3 68 9999 10 1 E 2 90
Stasiun
Klimatologi
Semarang 96835 02/09/2015 22.8 35.4 28.1 61 9999 10 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 03/09/2015 22 33.2 27.6 67 9999 10.7 2 N 6 90
Stasiun
Klimatologi
Semarang 96835 04/09/2015 23.8 35.2 28.1 65 9999 10.4 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 05/09/2015 23.6 35 28.2 65 9999 10.3 2 E 3 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
Stasiun
Klimatologi
Semarang 96835 06/09/2015 20.8 35.2 28 68 9999 10.4 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 07/09/2015 23.2 35.6 28.4 64 9999 10 2 E 4 360
Stasiun
Klimatologi
Semarang 96835 08/09/2015 23.8 35.4 28.9 64 9999 9.8 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 09/09/2015 23.4 35.4 28.4 66 9999 10 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 10/09/2015 25 35.4 29.7 53 9999 10.2 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 11/09/2015 21.6 35 28.3 61 9999 9999 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 12/09/2015 25.6 35.4 29.8 57 9999 10 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 13/09/2015 26 34.6 29.7 62 9999 9.7 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 14/09/2015 23.2 33.8 28.4 61 9999 9.6 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 15/09/2015 23.2 34.8 28 62 9999 9 2 N 4 90
Stasiun
Klimatologi 96835 16/09/2015 24.2 34.6 29.3 59 9999 8.9 2 E 5 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
Semarang
Stasiun
Klimatologi
Semarang 96835 17/09/2015 25.8 35.2 29.2 65 9999 7.6 2 E 4 120
Stasiun
Klimatologi
Semarang 96835 18/09/2015 26.6 36.2 30.9 52 9999 10 3 E 4 90
Stasiun
Klimatologi
Semarang 96835 19/09/2015 23.6 35.2 29.3 61 9999 9.6 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 20/09/2015 25.2 32.8 28.5 72 9999 9.7 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 21/09/2015 24.8 33 29.1 65 9999 10 2 N 4 360
Stasiun
Klimatologi
Semarang 96835 22/09/2015 23.4 37.6 29.4 59 9999 10 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 23/09/2015 24 35.8 29 64 9999 10.9 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 24/09/2015 23.6 32.8 28.5 67 9999 9.3 3 N 3 360
Stasiun
Klimatologi
Semarang 96835 25/09/2015 23 35.4 28.6 62 9999 9.7 2 N 3 90
Stasiun
Klimatologi
Semarang 96835 26/09/2015 23.4 35.6 29.2 62 9999 9.7 2 N 3 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
Stasiun
Klimatologi
Semarang 96835 27/09/2015 26.2 35 29.9 61 9999 10 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 29/09/2015 25.2 35.8 30.5 56 9999 9 3 E 5 90
Stasiun
Klimatologi
Semarang 96835 30/09/2015 26.4 35 30.8 53 9999 10 3 N 3 360
Stasiun
Klimatologi
Semarang 96835 01/10/2015 25.2 36.8 31 51 9999 8.7 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 02/10/2015 26.4 36.6 31.6 52 9999 9.4 3 E 5 90
Stasiun
Klimatologi
Semarang 96835 03/10/2015 26 36.4 30.4 52 0.4 9.8 2 N 6 90
Stasiun
Klimatologi
Semarang 96835 04/10/2015 27 36 30.5 51 9999 10 3 E 6 90
Stasiun
Klimatologi
Semarang 96835 05/10/2015 25.4 35.4 29.2 57 9999 10 3 E 4 120
Stasiun
Klimatologi
Semarang 96835 06/10/2015 24.4 32.4 28.1 73 9999 10 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 07/10/2015 24.2 36.2 29.6 67 9999 9.3 2 N 4 360
Stasiun
Klimatologi 96835 08/10/2015 25.4 36.4 29.4 66 9999 8.7 1 N 4 360
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
Semarang
Stasiun
Klimatologi
Semarang 96835 09/10/2015 25 36 29.5 65 9999 9.5 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 10/10/2015 23.6 36.2 29.7 63 9999 10 2 E 4 90
Stasiun
Klimatologi
Semarang 96835 11/10/2015 27 34 29.2 63 9999 10.4 3 N 4 360
Stasiun
Klimatologi
Semarang 96835 12/10/2015 26.4 35.4 30.9 59 9999 10 3 N 5 360
Stasiun
Klimatologi
Semarang 96835 13/10/2015 25 36 29.5 9999 9999 9999 2 N 3 360
Stasiun
Klimatologi
Semarang 96835 14/10/2015 25 36.8 30.3 62 9999 9.3 1 N 3 90
Stasiun
Klimatologi
Semarang 96835 15/10/2015 25.8 36.8 30.4 59 9999 10.5 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 16/10/2015 24.6 36.6 30.8 49 9999 9.6 2 N 7 120
Stasiun
Klimatologi
Semarang 96835 17/10/2015 22.8 31.8 27.3 9999 9999 10 2 N 5 90
Stasiun
Klimatologi
Semarang 96835 18/10/2015 25 31 28 9999 9999 9999 2 N 3 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
Stasiun
Klimatologi
Semarang 96835 19/10/2015 25.4 37.6 30 63 9999 8.4 2 N 4 90
Stasiun
Klimatologi
Semarang 96835 20/10/2015 24 37.2 30.4 62 9999 4 2 E 3 90
Stasiun
Klimatologi
Semarang 96835 21/10/2015 24.8 36.6 30 61 9999 11 3 E 6 90
Stasiun
Klimatologi
Semarang 96835 22/10/2015 26.4 36.2 30.7 52 9999 9.4 3 E 6 90
Stasiun
Klimatologi
Semarang 96835 23/10/2015 24.8 36 30.4 9999 9999 9.8 4 E 8 80
Stasiun
Klimatologi
Semarang 96835 24/10/2015 26 36 31 9999 9999 9999 4 E 5 360
Stasiun
Klimatologi
Semarang 96835 25/10/2015 23.6 37 30.3 9999 9999 9999 1 N 3 360
Stasiun
Klimatologi
Semarang 96835 26/10/2015 24 36.8 30.2 62 9999 9.8 1 N 4 90
Stasiun
Klimatologi
Semarang 96835 27/10/2015 25.2 38.2 30.7 61 9999 9 3 E 5 90
Stasiun
Klimatologi
Semarang 96835 28/10/2015 26 34.6 29.6 72 9999 10.2 3 E 8 320
Stasiun
Klimatologi 96835 29/10/2015 25.8 38 31.9 9999 9999 9.2 3 E 5 90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
Semarang
Stasiun
Klimatologi
Semarang 96835 30/10/2015 25.4 37.6 31.5 9999 9999 9999 9999 E 9999 90
Stasiun
Klimatologi
Semarang 96835 31/10/2015 25.4 36.6 30 69 9999 7 3 N 5 350
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
Lampiran 5 Contoh Dataset Transaksi Tembakau PT. GUDANG GARAM TBK
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI