View
158
Download
4
Category
Preview:
Citation preview
Eksplorasi Data dengan R
Prana Ugiana Gio
Selasa, 22 November 2016
Prana Ugiana GioEksplorasi Data dengan R
Perkenalkan♠ Nama: Prana Ugiana Gio
♠ Tempat/Tanggal Lahir: Tanjung Pinang/1 Oktober 1989
Prana Ugiana GioEksplorasi Data dengan R
Latar Belakang Pendidikan♠ 2008-2012: S1 Matematika Konsentrasi Statistika, USU
♠ 2012-2014: S2 Matematika Konsentrasi Operasi Riset, USU
Prana Ugiana GioEksplorasi Data dengan R
Pengalaman MengajarAsisten Laboratorium Komputer D3 Statistika DepartemenMatematika FMIPA USU (25 April 2012 s/d 2016)
Mengajar SPSS (statistical product of service solution) untukmatakuliah statistika dasar, regresi linier, dan statistikanonparametrik.Mengajar bahasa pemrograman C untuk matakuliahalgoritma.Mengajar bahasa pemrograman statistika R untuk matakuliahmetode statistika dan metode hitung peluang.Mengajar POM-QM untuk matakuliah program linier.Mengajar microsoft excel untuk matakuliah lembar kerja.
Prana Ugiana GioEksplorasi Data dengan R
Pengalaman Mengajar♣ Mengajar terkait matakuliah matematika/statistika di jurusan: S1Teknik Lingkungan, S1 Kedokteran Gigi, S1 Kimia, S1 Biologi, D3Komputer, D3 Statistika, D3 Kimia, Universitas Sumatera Utara.
♣ Mengajar terkait matakuliah statistika di Politeknik Negeri Medan.
♣ Mengajar terkait matakuliah statistika di Universitas Prima.
Prana Ugiana GioEksplorasi Data dengan R
Buku♣ Penulis Buku "Belajar Statistika dengan R" (Prana Ugiana Gio(USU) & Dasapta Erwin Irawan (Dosen Hidrogeologi ITB)), ISBN979 458 860 1, USUpress.
♣ Penulis Buku "Belajar Olah Data dengan SPSS, Minitab,R, Microsoft Excel, EViews, LISREL, Amos, dan SmartPLS,disertai beberapa contoh perhitungan manual" (Prana UgianaGio (USU) & Elly Rosmaini (Dosen Matematika USU)), ISBN 979458 801 6, USUpress.
♣ Penulis Buku "Riset Pemasaran Bagi Pemula dengan AplikasiSPSS", ISBN 979 458 806 7 (Penulis Bermitra dengan Salah SatuDosen Panca Budi) (USUpress)
♣ Penulis Buku "Belajar Olah Data dengan EVIEWS", ISBN 979458 790 7 (USUpress).
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-1
Informasi♠ dplyr merupakan suatu package yang di dalamnya terdapat fungsifilter().
♠ Fungsi filter() digunakan untuk memilih suatu baris berdasarkankriteria tertentu.
♠ Dalam latihan ke-1, fungsi filter() digunakan untuk memilihbaris/responden berjenis kelamin laki-laki.
♠ Kemudian menampilkan informasi dari variabel nama, jenis kelamin,pendidikan, dan jumlah bersaudara.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-2
Informasi♠ Dalam latihan ke-2, fungsi filter() digunakan untuk memilihbaris/responden dengan pendidikan S2 atau S3.
♠ Kemudian menampilkan informasi dari variabel nama, jenis kelamin,pendidikan, dan jumlah bersaudara.
♠ Perhatikan bahwa simbol | berarti atau.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-3
Informasi♠ Dalam latihan ke-3, digunakan fungsi names() dan colnames()untuk menampilkan nama-nama variabel atau kolom dari data frameData1.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-4
Informasi♠ Dalam latihan ke-4, digunakan fungsi length() untuk mengetahuijumlah variabel dalam data frame Data1. Diketahui jumlah variabeldalam data frame Data1 sebanyak 4, yakni nama, jenis kelamin,pendidikan, dan jumlah bersaudara
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-5
Informasi♠ Dalam latihan ke-5, digunakan fungsi length() untuk mengetahuijumlah baris dari masing-masing kolom/variabel. Diketahui jumlahbaris dari masing-masing variabel sebanyak 10.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-6
Informasi♠ Dalam latihan ke-6, digunakan fungsi length() dan na.omit().
♠ NA berarti not available yang berarti data tidak tersedia.
♠ Penggunaan fungsi na.omit() bertujuan untuk mengabaikan NApada saat menghitung jumlah pengamatan dengan fungsi length().
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-7
Informasi♠ Dalam latihan ke-7, digunakan fungsi dim() untuk mengetahuidimensi (jumlah baris dan jumlah kolom) dari data frame Data1.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-8
Informasi♠ Dalam latihan ke-8, digunakan fungsi levels() dan factor() untukmengetahui level dari suatu variabel. Sebagai contoh level darivariabel jenis kelamin sebanyak 2, yakni laki-laki dan perempuan,level dari variabel pendidikan sebanyak 3, yakni S1, S2, dan S3.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-9
Informasi♠ Dalam latihan ke-9, digunakan fungsi filter().
♠ Fungsi filter() digunakan untuk memilih baris/responden perem-puan dengan pendidikan S2.
♠ Kemudian menampilkan informasi dari variabel nama, jenis kelamin,pendidikan, dan jumlah bersaudara.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-10
Informasi♠ Dalam latihan ke-10, digunakan fungsi filter().
♠ Fungsi filter() digunakan untuk memilih baris/responden perem-puan dengan pendidikan S2 atau S3.
♠ Kemudian menampilkan informasi dari variabel nama, jenis kelamin,pendidikan, dan jumlah bersaudara.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-11
Informasi♠ Dalam latihan ke-11, digunakan fungsi select().
♠ Fungsi select() digunakan untuk memilih variabel nama. Kemu-dian menampilkan data pada variabel tersebut.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-12
Informasi♠ Dalam latihan ke-12, digunakan fungsi select().
♠ Fungsi select() digunakan untuk memilih variabel nama danpendidikan. Kemudian menampilkan data pada variabel-variabeltersebut.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-13
Informasi♠ Dalam latihan ke-13, digunakan fungsi filter() dan select().
♠ Fungsi filter() digunakan untuk memilih baris/responden denganpendidikan S1.
♠ Fungsi select() digunakan untuk memilih variabel nama danpendidikan. Kemudian menampilkan data pada variabel tersebut.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-14
Informasi♠ Dalam latihan ke-14, digunakan fungsi filter(), select(), ar-range(), dan desc().
♠ Fungsi filter() digunakan untuk memilih baris/responden denganpendidikan S2 atau S3.
♠ Fungsi select() digunakan untuk memilih variabel nama, pen-didikan, dan jumlah bersaudara. Kemudian menampilkan data padavariabel tersebut.
♠ Fungsi arrange() digunakan untuk mengurutkan data berdasarkanvariabel jumlah bersaudara.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-14
Informasi♠ Fungsi desc() digunakan untuk mengurutkan data berdasarkandari nilai yang paling besar, sampai dengan nilai yang paling kecil.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-15
Informasi♠ Dalam latihan ke-15, digunakan fungsi mutate().
♠ Fungsi mutate() digunakan membentuk variabel baru bernamarata-rata.
♠ Nilai rata-rata dari masing-masing responden dihitung denganrumus sebagai berikut.
rata − rata = nilai matematika + nilai kimia + nilai biologi3
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-16
Informasi♠ Dalam latihan ke-16, digunakan fungsi transmute().
♠ Fungsi transmute() digunakan membentuk variabel baru bernamarata-rata.
♠ Nilai rata-rata dari masing-masing responden dihitung denganrumus sebagai berikut.
rata − rata = nilai matematika + nilai kimia + nilai biologi3
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-16
COBA PERHATIKAN, DI MANALETAK PERBEDAAN mutate() &transmute()??
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-17
Informasi♠ Dalam latihan ke-17, digunakan fungsi mutate() dan ifelse().
♠ Fungsi mutate() digunakan membentuk variabel baru bernamakelulusan matematika.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai matematika < 60, maka tidak lulus (TL).Jika nilai matematika ≥ 60, maka lulus (L).
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-18
Informasi♠ Dalam latihan ke-18, digunakan fungsi transmute() dan ifelse().
♠ Fungsi transmute() digunakan membentuk variabel baru bernamakelulusan matematika.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai matematika < 60, maka tidak lulus (TL).Jika nilai matematika ≥ 60, maka lulus (L).
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-19
Informasi♠ Dalam latihan ke-19, digunakan fungsi mutate(), select(), danifelse().
♠ Pertama, fungsi mutate() digunakan pada data frame Data1untuk membentuk variabel baru bernama rata-rata.
♠ Nilai rata-rata dari masing-masing responden dihitung denganrumus sebagai berikut.
rata − rata = nilai matematika + nilai kimia + nilai biologi3
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-19Informasi♠ Kemudian, digunakan fungsi select() untuk memilih hanya vari-abel nama dan rata-rata, dan kemudian disimpan dalam data frameekstrak.
♠ Selanjutnya digunakan fungsi mutate() pada data frame ekstrakuntuk membentuk variabel baru bernama nilai.
♠ Gunakan fungsi ifelse() untuk membuat kriteria:
Jika nilai rata-rata < 60, beri nilai D.Jika nilai rata-rata < 70, beri nilai C.Jika nilai rata-rata < 80, beri nilai B.Jika nilai rata-rata ≥, beri nilai A.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-20
Informasi♠ Dalam latihan ke-20, digunakan fungsi mutate() dan ifelse().
♠ Fungsi mutate() digunakan membentuk variabel baru bernamakelulusan matematika, kelulusan kimia, dan kelulusan biologi.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai < 60, maka tidak lulus (TL).Jika nilai ≥ 60, maka lulus (L).
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-21
Informasi♠ Dalam latihan ke-21, digunakan fungsi transmute() dan ifelse().
♠ Fungsi transmute() digunakan membentuk variabel baru bernamakelulusan matematika, kelulusan kimia, dan kelulusan biologi.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai < 60, maka tidak lulus (TL).Jika nilai ≥ 60, maka lulus (L).
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-22Informasi♠ Dalam latihan ke-22, digunakan fungsi transmute() dan ifelse().
♠ Fungsi transmute() digunakan membentuk variabel baru bernamakelulusan matematika, kelulusan kimia, dan kelulusan biologi.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai < 60, maka tidak lulus (TL).Jika nilai ≥ 60, maka lulus (L).
♠ Perintah R data.frame(Data1["Nama"],kelulusan) ataudata.frame(Data1[1],kelulusan) bertujuan untuk membuat dataframe berdasarkan data frame Data1 dan kelulusan, yang memuatvariabel nama, kelulusan matematika, kimia, dan biologi.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-23
Informasi♠ Dalam latihan ke-23, digunakan fungsi mutate(), ifelse(), danselect().
♠ Fungsi mutate() digunakan pada data frame Data1 untuk mem-bentuk variabel kelulusan matematika, kimia, dan biologi.
♠ Fungsi ifelse() digunakan membuat kriteria:
Jika nilai < 60, maka tidak lulus (0).Jika nilai ≥ 60, maka lulus (1).
♠ Selanjutnya simpan ke dalam data frame simpan.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-23
Informasi♠ Fungsi mutate() digunakan pada data frame simpan untuk mem-bentuk variabel jumlah pelajaran yang lulus.
♠ Jumlah pelajaran yang lulus dari tiap-tiap responden dihitungdengan menjumlahkan:
kelulusan matematika + kelulusan kimia + kelulusan biologi
♠ Fungsi select() digunakan untuk memilih variabel nama danjumlah pelajaran yang lulus, pada data frame simpan.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-24Informasi♠ Dalam latihan ke-24, digunakan fungsi mutate(), apply(), danselect().
♠ Fungsi select() digunakan pada data frame Data1 untuk memilihvariabel nilai matematika, kimia, dan biologi. Kemudian disimpan kedalam data frame pelajaran.
♠ Fungsi mutate() digunakan pada data frame Data1 untuk mem-bentuk variabel minimum, maksimum, rata-rata, median, dan standardeviasi.
♠ Pada pembentukan variabel minimum, maksimum, rata-rata, me-dian, dan standar deviasi, digunakan fungsi apply().
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-24Informasi♠ Pada penggunaan fungsi apply(), terdapat argumen MARGIN,yang mana nilai 1 menunjukkan baris, dan nilai 2 menunjukkankolom.
\end{block}
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-25
Informasi♠ Dalam latihan ke-25, digunakan fungsi mutate(), apply(), danselect().
♠ Fungsi fungsi select() digunakan pada data frame Data1 untukmemilih variabel nilai matematika, kimia, dan biologi. Kemudiandisimpan ke dalam data frame pelajaran.
♠ Fungsi fungsi mutate() digunakan pada data frame Data1 untukmembentuk variabel rata-rata dan rata-rata2.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-25
Informasi♠ Pada pembentukan variabel rata-rata dan rata-rata2 digunakanfungsi apply().
♠ Pada pembentukan variabel rata-rata, melibatkan argumenna.rm=TRUE, sementara pada pembentukan variabel rata-rata2,tidak melibatkan argumen na.rm=TRUE.
♠ Perhatikan perbedaan hasilnya.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-26Informasi♠ Dalam latihan ke-26, digunakan fungsi transmute(), apply(),dan select().
♠ Fungsi select() digunakan pada data frame Data1 untuk memilihvariabel nilai matematika, kimia, dan biologi. Kemudian simpan kedalam data frame pelajaran.
♠ Fungsi transmute digunakan pada data frame Data1 untukmembentuk variabel jumlah ujian yang diikuti, rata-rata, standardeviasi, median, minimum, maksimum, dan jumlah.
♠ Pada pembentukan variabel jumlah ujian yang diikuti, rata-rata,standar deviasi, median, minimum, maksimum, dan jumlah, digu-nakan fungsi apply().
♠ Pada penggunaan fungsi apply(), argumen na.rm=TRUE bertu-juan untuk mengabaikan data yang kosong.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-27
Informasi♠ Dalam latihan ke-27, digunakan fungsi summarise().
♠ Fungsi summarise() digunakan untuk menghitung nilai rata-rata, standar deviasi, minimum, dan maksimum, dari variabel nilaimatematika, kimia, dan biologi.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-28
Informasi♠ Dalam latihan ke-28, digunakan fungsi summarise().
♠ Fungsi summarise() digunakan untuk menghitung nilai rata-ratamatematika.
♠ Karena data pada variabel nilai matematika memuat NA, makaberi tambahan argumen na.rm=TRUE.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-29
Informasi♠ Dalam latihan ke-29, digunakan fungsi summarise().
♠ Fungsi summarise() digunakan untuk menghitung nilai rata-rata, median, modus, standar deviasi, minimum, maksimum, jumlahseluruh nilai, banyaknya nilai, dan banyaknya nilai yang berbeda, darivariabel nilai matematika.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-30
Informasi♠ Dalam latihan ke-30, digunakan fungsi mfv() dan mlv() untukmenghitung modus dari suatu data.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-31
Informasi♠ Dalam latihan ke-31 digunakan fungsi distinct() dann_distinct().
♠ Fungsi distinct() digunakan untuk menentukan/menampilkandata-data yang berbeda (unique values) dari variabel jenis kelamin,pendidikan, dan jumlah bersaudara.
♠ Fungsi n_distinct() digunakan untuk menentukan jumlah datayang berbeda.
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-32
Informasi♠ Dalam latihan ke-32 digunakan fungsi group_by() dan n().
Prana Ugiana GioEksplorasi Data dengan R
Latihan Ke-33
Informasi♠ Dalam latihan ke-33 digunakan fungsi group_by() dan n().
Prana Ugiana GioEksplorasi Data dengan R
Visualisasi Data dengan R
LANGKAH DEMI LANGKAH VISU-ALISASI DATA DENGAN R
Prana Ugiana GioEksplorasi Data dengan R
Visualisasi Data dengan R
Misalkan diberikan data sebagai berikut.
Prana Ugiana GioEksplorasi Data dengan R
Recommended