36
RENCANA MUTU PEMBELAJARAN: STATISTIC & PROBABILISTYKONTRAK PEMBELAJARAN:
Pembelajaran meng-insertkan sofskill (character building): working independently (SC, honesty) & team work (interpersonal skill)
Toleransi masuk kelas: 15 menit
Proses pembelajaran mrpkan aktifitas 2 arah.Koordinator kelas: Nama ...................................... No. Hp...................................
NoKDDateSubjectSub Subject
1125 FebIntroductionSta.&prob Frequency and Distribution Tabulation of data
Frequency grouping, Cumulative Freq, Graphycal representatio, Accuracy & precision of measuement, Problems.
24 MarCharasteristics of distribution: Central tendencyAverage, Arithmetic Mean, Median, Mode, Quantiles. Problems
311Charasteristics of distribution: dispersionVariance, standard distribution, degree of freedom, coef of variation. Problems
418Test of KD1
5225Probability, Prob. Distribution & expectation.
61 AprSample: accuracy of the Mean
78Binomial Distr, Pisson Distr.
815 Test of KD 2
22Free
9329Normal distribution
106 MayUse of normal distr.
1113Chi-squared test
121920Test of KD3
13427Comparison of Mean
1423 JunLeast Squares Method & Regression, Correlation, Multiple Regression, Analysis of variance.
1510MINGGU TENANG
17UJIAN KD3 & KD4
STATISTIK
Data
Alat
Is a science that deals with the collection, tabulation, analysis, and interpretation of quantitative & qualitative data.
Data:
Kualitatitf: data berbentuk kalimat, kata, gambar
Kuantitatif: data yg berupa angka, atau data kualitatif yg diangkakan (skoring)
1. Data/variabel diskrit: data yg diperoleh dr hasil menghitung (bukan mengukur): Jumlah mhs = 40 (disebut juga data nominal, diperoleh dr survey / eksploratif).
2. Data/variabel kontinyu: data yg diperoleh dr hasil pengukuran.Kuat beton = ...., jumlah kendaraaan di jalan ... = ...., jumlah hujan = ....
Mencari data ( see the pp
FERQUENCY DISTRIBUTION (distribusi frekuensi)
-bidang enggineering sering melakukan pengukuran / penelitian
-sering terjadi error, hub nya dg ACCURACY (akurasi) & PRECISION (presisi), terkait dg alat, manusia, lingkungan dll.(lihat Gambar 2-5).TABULATON OF DATA
Hasil pengukuran ditabulasikan ( Contoh
Data bisa diurutkan/diranking: kecil ( besar (ASCENDING), atau besar ( kecil (Decending)
Data di masukkan dlm Interval Kelas,
Nilai tengah dr tiap kelas dicantumkan,
Jumlah data pd tiap interval dihitung, dst.
....
Hingga diperoleh Relative Feqiency Distribution.
Lihat data Cummulative freq. F:
Berapa jumlah bata yg memp. Kekuatan LEBIH KECIL DARI 5,5 ?
Berapa jumlah bata yg memp. Kekuatan TIDAK LEBIH KECIL DARI 9,5 ?
Bisa kah kita sebut: LEBIH BESAR DARI 9,5? (TIDAK)Proporsi bata dg kekuatan < 5,5 = 30/270 = 0,11.
(Tidak bs disebut lebih besar dr 9,5 krn bata dg kekuatan 9,5 masuk dlm interval 9,5 10,5)
GRAPHICAL REPRESENTATION Grafik Histogram: Absis: class interval; Ordinat: frequency f
Grafik Frequency Polygon: Absis: nilai tengah; Ordinat: frequency f(biasanya utk data diskrit)Utk melihat procentase:
Grafik Kumulatif Frekuensi & fractional cummulative freq.: Absis: class interval; Ordinat: cummulative frequencyOrdinat grafik ini = representasi dr area sebelah kiri dr ordinat grafik histogram.
Amati: Less than 6,5; dan Not less than 6,5.DAY 2:
HW 21 n 15
TEAM WORKPengujian terhadap kuat desak beton menghasilkan data sbb:
Fig 2-2 has not been explained yet.CHARACTERISTICS OF DISTRIBUTION: CENTRAL TENDENCY DISPERSIONCENTRAL TENDENCY
AVERAGE (rata-rata): Arithmetic Mean
Geometric Mean
Arithmetic Mean (MEAN = Xrt):-Jumlah dari nilai observasi / pengamatan dibagi julah data:
Xrt =
3.1-Jumlah dari deviasi terhadap nilai Mean = 0
Xrt =
3.2Untuk jumlah data yang BANYAK (large number of observation / sample) ( gunakan metode klas interval.
Lihat Tabel 3-2 (data dari Tabel 2-3)
Xrt = X0 + (friction mean) . w
3.3Keterangan:
X = nilai tengah (mid point) yang pertama = 2
Xi = deviasi nilai tengah pertama terhadap nilai tengah berikutnya
w = lebar kelas Dari pers 3.3 diperoleh X rt = 2 + 4,92 x 1 = 6,92 NILAI RATA-RATA dari data Tabel 2.1 = 6,89.MEDIAN
Suatu Nilai yang membagi luas histogram menjadi dua sama besar.
Median tidak konsen terkait dg numerik tapi pada jarak/posisi data
Contoh:
Data: 21, 22, 31, 34, 31, 22, 17, 26 ( (n = 8)Data diurutkan: 17, 21, 22, 22, 26, 31, 31,
Median = (22+26)/2 = 24
Jika data = 34 tidak ada, Median = 22Contoh:
Data: 2, 3, 6, 8 9, 9, 12 ( Median = 8, Mean = 7Data: 3, 3, 6, 8, 9, 9, 18 ( Median masih sama, yaitu 8 , tetapi Mean = 8MODE
Merepresentasikan nilai tertinggi (peak value) pd distribusi frekusensi.
Nilai dimana jumlah datanya paling banyak.Contoh: Kandungan polutan dalam air (ppm) yg diukur dari 11 sampel adalah sbb:
1234567891011
45204570452044904540457045004520452045004590
Mean = 4530,9Data diurutkan ( ascending (kecil ke besar)
Mode = .4520 (jumlahnya 4)
Median = ....PROBLEM 3.1:
-Pengujian kekuatan regangan (kN/m2) pd 303 buah benda uji selama 7 hari telah ditabulasikan sbb :
Tabel 3-4 n 3-5
PROBLEM 3.2:
MODE= 44, MEDIAN = 44,02, MEAN=44,6785%X541= 460 cars ( 54km/h; 95%x541= 530 cars ( 67km/h.
PR. Hitung Mean dr data hujan : ungroup data & frequency tabel.DISPERSION DISTRIBUTION
VARIANCE:Jika terdapat satu set data (populasi terbatas) dg jumlah observasi = n; dan nilai mean = , maka setiap observasi (xi) mempunyai deviasi (.Xi - Xrt...). (Deviasi = residual).Varian (Mean square deviation):
2 = atau JIKA TANPA MENCARI HARGA RATA-RATA ( 2 = X2/n (X/n)2Varian pada distribusi frekuensi DATA TUNGGAL & DATA BERGOLONG:
See page 43 & 45
STANDARD DEVIATION (Deviasi Baku):Utk keperluan praktis digunakan Sandard deviasi (nilainya selalu positif) = akar dari VARIANStandar deviasi = akar dr variance = =
JIKA TANPA MENCARI HARGA RATA-RATA ( = ...................... Untuk Populasi: RATA-RATA = ; VARIAN = 2; DEV. STANDARD =
SAMPEL: rata-rata =; VARIAN = S2 ; DEV. STANDARD = SS2 =
JIKA NILAI RATA-RATA tidak BULAT:S2 = ......................................
Contoh Excell (page 47)====================== 19/3/14COEFISIEN VARIASI
Kalau Std. Deviasi diekspresikan sesuai data variabel yg ada.
Coef variasi ( V) diekspresikan dalam prosentasi:
Kv = /Xrt x 100
CONTOH:Data X = 1,5,9,13,17
( Xrt = 9; S =6,32; Kv = 70,27% Data Y = 1,3,5,7,9,13,15,17( Xrt = 9; S = 5,48; Kv = 60,89% SEBARAN DATA X lebih renggang drpd Y.
Koefisien SKEWNESS (Kemencengan / Kemiringan): Cs = a3= m3 /S3;m3= (Xi-Xrt)3/n ( aplikasi : n .(Xi-Xrt)3/(n-1)(n-2) Koefisien KURTOSIS (Keruncingan): a4= m4 /S4;m4 = (Xi-Xrt)4/n ( aplikasi : n2 . (Xi-Xrt)4/(n-1)(n-2)(n-3)JIKA
a3 > 0 (distribusi miring positifa3 < 0 ( negatif
a3 = 0 ( simetrik
JIKA:
a4 > 3 (runcing
a4 < 3 ( landai
a4 = 0 ( normal
CONTOH:DATA: 1,1,1,1,1,2,2,2,2,2,2,2,3,3,4,5,5,6,7,8
X=60; X2=266; n=20; Xrt=3; S=2,128
(X-3)3 = 186S3=9,636m3= 186/20 = 9,300
a3=9,300/9,636=0,965 (X-3)4 = 1082S4=20,506m4=1082/20=54,100
a4=54,100/20,506=2,638
Nilai a3 & a4 menyimpulkan bahwa distribusi datanya miring ke kanan dan landai. ( Gambar!BILANGAN BAKU:
Seberapa jauh sebuah nilai menyimpang dari rata-ratanya
Z = (Xi Xrt)/S
RANGE = jangkauan: Nilai Data maksimum Nilai Data minimum==
PROBABILITY, PROBABILITY DISTRIBUTION, n EXPECTATION
SOAL KD 1 STATISTIK & PROBABILITASBerikut data distribusi frekuensi dari populasi suatu alat yang diuji coba dalam suatu laboratorium:
Lifetime
(jam)400-499500-599600-699700-799800-899900-9991000-10991100-1199
Jumlah25657910892763421
1. Buat histogram dan diagram frekuensi kumulatif2. Berapa persen alat yg lifetime-nya tidak lebih dari 700 jam?
3. Berapa persen alat yg lifetime-nya minimal 600 jam dan tidak lebih dari 1000 jam?
4. Hitung mean, median dan mode
5. Hitung varian, koefisien varian, dan standard deviasi data populasi di atas.
==PERMUTASI
Contoh 1:
Dari angka 1,2,3,4,5, berapa bnyk angka 3 digit bs diatur (setiap angka bs diulang)?
Masing2 angka berpeluang 5 kali
Jadi terdatat 5x5x5 = 125 angka yg berbedaContoh 2:
Berapa banyak angka dg 4 digit bs dibentuk dari angka 1 sd 9?
Rms 1
nPr = n!/(n-r)! = 9!/5! = 9x8x7x6 = 3024 angka
Jika r = n ( Rms 2: nPn = n!
Contoh 3:
Berapa banyak pola yg dibuat dari 3 warna kuning, 2 merah, 7 hijau?
n=3+2+7=12
Rms 3= 12!/(3!x2!x7!) = 7920
Contoh 4:
Berapa banyak cara sebuah tim beranggotakan 9 orang yg dipilih dr 12 orang?
Rms 4:
n=12; 2=9 ( nCr = n!/r!(n-2)! = 12!/9!x3! = 220
Contoh 5: Dari 5 pria & 4 wanita, dalam berapa banyak kita dpt memilih grup yg terdiri dari 3 pria & 2 wanita?
A. Pilih 3 dr 5 pria: 5C3 B. Pilih 2 dari 4 wanita: 4C2
Jawab: 5C3 x 4C2 = (5x4)/2 x (4x3)/2 = 60PROBABILITY
KONSEP DASAR PELUANG
Sebuah dadu dilempar.
S = (1,2,3,4,5,6); n(S) = 6
A = no gasal = (1,3,5); n(A)=3
( P(A) = 3/6=0,5
B = bil prima = (2,3,5); n(B)=3
( P(B) = 3/6=0,5
C = yg tak kurang dr 3 = (3,4,5,6); n(C)=4 ( P(C) = 4/6=0,67
P(A+B) = P(A) + P(B) P(AB)
Gambar peluang kejadian dr 2 kejadian yg independen
PELUANG BERSYARAT, yaitu:- peluang munculnya kejadian B jika kejadian A telah terjadi: P(B/A) = P(AB)/P(A)- peluang munculnya kejadian A jika kejadian B telah terjadi: P(A/B) = P(AB)/P(B)
Gambar klasifikasi kejadian
Dua kejadian A & B disebut independet JIKA:P(A/B) = P(A) atau P(B/A) = P(B)
Contoh:Dari 900 orang yg disurvey, trdapat data sbb:
Tabel: orang yg bekerja ditijau dr jenis kelamin
Bekerja (B)Menganggur (M)J
L46040500
W140260400
JUMLAH600300900
Seseorang dipanggil secara randon. Jika orang tsb telah bekerja, peluang orang tsb adalah laki-laki? P(L/B) = 460/600 = 0,767
Cara lain: P(BL) = 460/900 = 23/45; P(B) = 600/900 = 2/3 ;
P(L/B) = P(BL)/P(B) = (23/45) / (2/3) = 0,767
Contoh:Sebuah perusahaan jasa antar menggunakan kendaraan A & B spt dlm tabel:
Kilometer
A BTotal40.001 dan lebih102030
20.001 40.000
6050110
0 20.000
301040
Total
10080180
Berapa peluang kendaraan yg lebih dari 40.000 km? (= 30/180)
Berapa besar peluang masing-2 kendaraan ?
Jawab:untuk A ( P = (10/180) / (100/180) = 0,1
Untuk B ( P = (20/180) / (80/180) = 0,25
DISTRIBUSI PELUANG
Proses generalisasi terkait statistik memuat ketidakpastian, krn brdasar sampel
Model matematik diperlkan utk menjelaskan sifat populasi secara teori statistik
Model teoritis tsb ( distribusi peluang
Variabel Random Diskrit (VRD) Jika nilai-nilai var random tsb dpt didaftar sbb:
x1, x2, x3, ..... xn
Distribusi Peluang Diskrit (discrete probabilitty distribution):
Peluang dari variabel random diskrit : p0, p1, p2, ....pn
Dimana pi > dan = 0 dan jumlah semua probabilitas = 1
Gambar Distribusi Peluang dari VRD: absis xi ; ordinat p(x)Fungsi distribusi kumulatif dari VRD didefinisikan sbg:
P (X) = pi untuk xi XCatatan:
p(x) = probabilitas; P(X) = kumulatif probabilitas (ingat f & F = frekuensi & kumilatif frekuensi)
Gambar Fungsi distribusi kumulatif (cumulative dist function = cdf) dari VRD : absis xi ; ordinat P(X)
Contoh:
Gambar distr prob & distr prob kumulatif dari var random x (dari 2 dadu):
Prob mendapatkan jumlah sama dengan2 = 1/6 +1/6 = 1/36 = p(2)
3 =
KURVA NORMAL
Luas wilayah dibawah kurva distribusi frekuensi = jumlah data (N) ( seperti luas histogram( jumlah dr semua kemungkinan = 1 unit (100%)
( luas wilayah di bawah kurva distribusi probablitas = 1
( kurva disebut normal jika:
p(x) = .............................................................. ( 9.16p(x)=probability density for deviation (x-)
= bergerak sepanjang sumbu x tidak merubah bentuk kurva
= mempengaruhi melebar atau meruncing nya kurva
Normal biasa ( var random nya: & dirubah ke Normal Baku ( var rnadom nya : z
z = (x-)/
f (z) = ................................................ ( 9-18 ( Tabel Ordinat Kurva NormalDISINI, variabel z memiliki nilai rata-rata = 0 dan st. Dev = 1
LUAS AREA DIBAWAH KURVA NORMAL
Luas di bawah kurva normal antara mean (z=0) dan x=z adalah:
F(z) = f(z) dz
F(z) = ................................................. 9-19Fig 9-3 . Luas daerah di bawah kurva probabilitas normal
Absis: x & z;
Tabel 9-1.z00,250,50,670,67450,6811,9622,52,5763
F(z)00,09870,19150,24860,250,25180,34130,47300,4770,4930,4950,498
2xF(z)00,19740,500,68260,950,990
NOTE: SOME IMPORTANT PROBABILITIES50%( 0,6745
68,26% (
95% (1,96
99%( 2,576
Untuk mengetahui data observasi mengikuti kurva normal:1. Berdasar visual/mata( Probability Paper (jaman belum ada komputer ?)
Dengan kertas ini, jika data di plot ke dalam nya, akan membentuk (mendekati ) garis lurus.
REMEMBER: cummulative frequency curve ( berbentuk S (not convenient)
KERTAS PROBABILITAS:
Absis: data observasi (skala linier)
Ordinat: Kiri: probabilitas Not less than x; Kanan: Less than x
Nilai Mean ( diperoleh dari prob 50% lalu ........
Nilai st. Dev ( dari prob 16% .....
NOTE: tail area = 05 F(z) ( figure !
2. Chi SquareLEVEL OF SIGNIFICANCE
Jika distribusi data normal, maka prob 1-2F(z) = prob diluar range z (tail area) ( probabilitas in disebut the level of significance of statistical test yg ditandai dg .See fig 10-12 for two-sided tests & one sided test
=level of sign = 1- 2F(z):
one tail area = /2 = 0,5 F(z)
Area of acceptance = 2xF(z) = confidence level
Jika z = 1,96 ( = [1- 2F(z)] = 1- 0,95 = 0,05 = 5%.
Penjelasan:
jika suatu data nilainya berjarak dari nilai Mean minimal sebesar 1,96, maka data tsb significan berbeda dg data mayoritas yg mengikuti distr. Normal & kemungkinannya adlah 5%.
ATAU: sekumpulan data tsb kemungkinannya 5% salah
Derajat kepercayaan (degree of confidence) 95% adalah area 2F(z).
Batasan (-z) dan (+z) disebut confidence limits.
Confidence level adlah area of aceptance region.
Significance level adalah area of rejection region.
Nilai z untuk beberapa area dalam interval (z)Level of Significance %zConfidence Level
Team work: Pelajari soal 10-1 & 10-2 & 10-3 & 10-5===
DISTRIBUSI NORMAL
DISTRIBUSI NORMAL UMUM: N(,2)
The most widely used & most important continuous probability distribution Many statistical methods derived under assumption of normal distr.
Coef of skewness pd normal distrb = .....?
Rumus umum :
P (x) = (22)-1/2 e-1/2 (x )2/2 . untuk - < x < Notasi umum : N (,2) ( distribusi normal dg mean dan variance 2Data berdistribusi normal: Kurva simetris spt lonceng
Jumlah data di atas Mean & Simpangan Baku = jumlah data di bawah Mean & Simpangan Baku
Prosentasi luas kurva normal kekanan & ke kiri sama, yaitu: 34,13% (1SD), 13,53% (antara 1SD&2SD), 2,27% (antara 2SD & 3SD)
Jumlah SD dari suatu kelompok data adalah tak terhingga, maka secara teorotis kurva normal tak pernah menyentuh dasar ( luasnya 99,99% (bukan 100%) tp dalam praktek disebut 100% (kiri & kana masing2 50%)DISTRIBUSI NORMAL STANDAR (BAKU): N(0,1)
Disebut standar krn nilai rata-rata = 0, dan SD = 1,2, dst.
Persamaan umum pd kurvanormal umum di atas sulit diselesaika secara analitis ( ditransform secara linier dg simbol z:
Z = (x-)/
Variabel random Z menjadi N(0,1) artinya: =0, 2=1
PENGUJIAN NORMALITAS DATA
(Penelitian biasanya pertama kali berasumsi bahwa datanya berdist. Normal) Plot data pd kertas probabilitas normal (secara visual)
CHI KUADRAT
CHI SQUARE TEST (CHI KUADRAT)Chi square test untuk mengetahui apakah data frekuensi Observasi berbeda cukup signifikan dengan yg diharapkan (Expectation).X2 = (O E)2 EPersamaan di atas dibatasi (constrain) dg: O = E = N
( = jumlah semua kelas)N = total data (frekuensi)
K = jumlah kelas
Nilai chi (X2) tsb di atas diandingkan dg nilai chi tabel.
Contoh 1:Nilai mata kuliah Statistik dari 150 mahasiswa adalah (lihat tabel kolom . Uji normalitas data dg Chi Kuadrat.
Step pengujian:
Tentukan jumlah kelas interval. Sesuai dg jumlah batasan luasa di bawah kurva normal (ada 6) ( jumlah kelas =6
Tentukan lebar kelas = (data terbesar terkecil)/jumlah kelas Susun dlm tabel.
Jika nilai Chi hitung < nilai Chi dalam tabel ( distribusi datanya NormalChi tabel diambil berdasar: dk (derajat kebebasan / degree of freedom) & level of significant yg ditetapkan
DEGREE OF FREEDOM:
-is defined as a comparison between the data,
-the number of independent variables minus the number of constraint
if there are n independent variabel related by m equation (restrictions) ( degree of freedom = n-m
Degree of Freedom (dk= derajat kebebasan) dalam Chi Kuadrat:Dk = K -1K = jumlah kelas interval
Angka 1 karena constraintnya =1 yaitu persamaan *) di atas
HOME WORK:
Analisis dg Chi Kuadrat data hujan pd PR yg lalu apakah ikuti distribusi normal atau bukan.Cek nilai skewness nya.
CONTOH :
Data diameter pipa diasumsi berdistribusi normal. Mean=4,5cm. St.dev= 0,005cm. Berapa probabilitas pipa yg berdiameter lebih dari 4,51cm?
Z=4,51-4,5 /0,005 = 0,01/0,005 = 2 ( table : z=2, F(z)= 0,4772, maka 0,5-0,4772=0,0228=2,28%
Latihan:(Carilah luas di bawah kurva normal:
1. yg dibatasi oleh z= 0 dan z=1,24
2. yg dibatasi oleh z = - 0,76 dan z = 0
3. yg dibatasi oleh z= - 0,76 dan z=1,24
4. di sebelah kanan z= - 0,76
5. di sebelah kanan z= 2,21
6. yg dibatasi oleh z = 0,76 dan z = 1,24
( Dari 2000 mahasiswa, rata-rata tinggi badan = 160 cm. Deviasi standar 4 cm. Dengan mengganggap distribusi normal, berapa banyak mahasiswa yg:
a. tingginya lebih dari 166 cm?b. yg tingginya antara 150cm dan 165 cm.
Catatan:
Jika suatu data ditentukan nilai Mean & SD nya ( terdapat 2 constraint lagi, shg m=2 ( nilai dk menjadi dk= k 1 -2====STATISTIK
Arti sempit: data
Arti luas: alat utk analisis guna mengambil keputusan
Statistik dibedakan menjadi 2, yaitu:
1. Statistik Deskriptif
(digunakan utk menggambarkan/menganalisis suatu statistic hasil penelitian, ttp tidak utk mengambil kesimpulan yg lebih luas (tidak menggeneralisir). 2. Statistik Inferensial: a. Statistik Parametris, b. Statistik Non Parametris
(digunakan utk menggambarkan/menganalisis suatu sampel penelitian dan hasilnya akan digeneralisir pd polulasi dimana sampel diambil.a. Sta. Parametris: utk analisis data Interval / Ratio dari populasi dg Distribusi Normal
b. Sta. Non Parametris: utk analisis data Nominal dan Ordinal dari populasi yg bebas distribusi (tidak hrs normal)(Teknik Korelasi dan Regresi dapat berperan baik pd st. deskriptif maupun inferensial)DATA PENELITIAN
Kualitatif: berbentuk gambar, kalimat, dll
Kuantitatif: berbentuk angka atau data kualitatif yg di-angka-kan/scoring
1. Data diskrit (Nominal):
(diperoleh dari menghitung (bukan mengukur)
( biasanya dlm penelitian survey
2. Data Kontinum:( diperoleh dari hasil pengukuran, yg dikelompokkan dalam: a. Data Ordinal: data berjenjang (juara 1,2,3)b. Data Interval: data yg jaraknya sama dg tidak mempunyai nilai Nol absolute (pen. Social: skala likert, dll., data ini bisa dijadikan data ordinal)c. Data Rasio: data yg jaraknya sama dan punya nilai absolute (berat/kg, panjang/m, dll, bisa dijumlah, dikali, data yg lain tdk bisa). Data ini dpt disusun kedlm data ordinal atau interval.Teknik statistic mana yg digunakan? Tgt pada data : 1) jenis data nya, 2) bentuk hipotesisnya. 1. Hipotesis Deskriptif: Pernyataan terkait dugaan nilai suatu variable mandiri
Rumusan masalah: Berapa umur efektif bangunan jembatan ini?
Hipotesis: Umur efektif bangunan jembatan = 50 tahun
2. Hipotesis Komparatif:Pernyataan terkait dugaan nilai satu variable atau lebih pd sampel yg berbeda
Rumusan masalah: Apakah ada perbedaan kekuatan antara genteng beton produk X dan produk Y?
Hipotesis: kekuatan genteng produk X sama dengan produk Y
3. Hipotesis Asosiatif:Pernyataan yg menduga adanya hubungan antara 2 variabel atau lebihRumusan masalah: Apa ada hubungan antara jumlah kendaraan dan kecelakaan di jalan?
Hipotesis: Tidak ada hubungan hubungan antara jumlah kendaraan dan kecelakaan di jananUJI HIPOTHESIS:
Hipotesis dlm penelitian: merupakan suatu pernyataan /argumen yang akan diuji kebenarannya Hipothesis dlm statistic: pernyataan statistic ttg parameter populasi (taksiran parameter populasi melalui data sampel)Hipotesis Nol: Ho = tidak ada perbedaan antara ukuran sampel dan populasi
Hipotesis Alternatif: Ha = ada perbedaan antara ukuran sampel dan populasi1. Hipotesis Deskriptif: perkiraan nilai suatu variable bebas, tidak diperbandingkan / hubungan.a. Uji t-test (uji statistik parametris utk menguji hipotesis deskriptif)
(Uji 2 pihak (Two Tail Test)
Uji 2 pihak digunakan jika hipotesis Ho berbunyi: sama dengan (=); dan Ha berbunyi: tidak sama dengan () Jika t hitung t tabel ( Ho diterima;
Gambar : daerah penerimaan & penolakan.
Contoh:
Produsen baja menyatakan bahwa daya tahan / kekuatan baja produksinya = 4 (satuan unit). ( Apa iya?
Rumusan hipotesis:Hipotesis nol (Ho):
daya tahan baja = 4 ( =4Hipotesis alternatif (Ha): daya tahan baja 4 ( 4Dari sampel diketahui: n=31, x rata2 = 4,645; S = 1,81
Lihat tabel Nilai-Nilai dalam distribusi t
Jika derajat kesalahan () ditetapkan = 5% dan derajat kebebasan = n-1= 30 ( nilai t tabel = 2,042
T hitung < t tabel ( Ho diterima (bahwa daya tahan baja tsb = 4 satuan ).
Plot harga t pada gambar tsb di atas!
(Uji Satu Pihak (One Tail Test)
Uji Pihak Kiri
Uji pihak kiri digunakan jika hipotesis Ho berbunyi: lebih besar atau sama dengan (); dan Ha berbunyi: lebih kecil ()
Jika t hitung t tabel ( Ho diterima;
Gambar:
Contoh:
Asosiasi Pengembang menyatakan bhw jumlah rumah paling banyak 100 unit terjual tiap bulan.
Apa iya?
Ho: rumah terjual paling paling banyak 100 ( 100 unit)
Ha: rumah terjual paling > 100 unit (> 100 unit)
Penelitian pd 20 Pengembang (n=20): nilai rata2 = 86,65; S = 15,83
( t = (86,65-100)/(15,83/V20) = - 3,77 Dk = n-1= 20-1= 19 = 5%
Tabel uji satu pihak = 1,729 Plot di gambar: t hitung terletak pd area penerimaan ( Ho diterima!
b. Uji Chi KuadratX2 = (O E)2 E
O = frekuensi Observed; E = frekuensi Expexted (yg diharapkan)N = total data (frekuensi)
K = jumlah kelas
Nilai chi (X2) tsb di atas diandingkan dg nilai chi tabel.
Contoh:
Penelitian menunjukkan data terkait warna cat tembok yang disukai masyarakat:
1000 orang memilih warna biru; 900 pilih merah; 600 pilih putih; 500 pilih warna lain.
Ho: peluang masyarakat memilih empat warna adalah sama
Ha: peluang masyarakat memilih empat warna adalah TIDAK sama
WarnaOEO E(O-E)^2(O-E)^2/E
Biru100075025062.50083,33
Merah90075015022.50030,00
Putih600750-15022.50030,00
Lainnya500750-25062.50083,33
Jumlah300030000170.000226,67
Dk = K-1 = 4-1 = 3; kesalahan: 5% ( Chi Kuadrat table = 7,815Chi Kuadrat hitung = 226,67> table = 7,815 ( Ho ditolak, Ha diterima2. Hipotesis Komparatif( Komparasi 2 sampel:
a. Uji 2 pihak:
Ho: tidak ada perbedaan (ada kesamaan) produk beton antara yg diberi zat addiktif tertentu dan yg tidak
Ha: ada perbedaan (ada kesamaan) produk beton antara yg diberi zat addiktif tertentu dan yg tidak
Contoh: N=25;
Diberi zat: X1 rerata = 74; S1 = 7,5; S12 = 56,25
Tdk diberi zat: X2 rerata = 79,2; S2 = 0,17; S22 = 103,5
Rumus:
Nilai t hitung < t table;
Contoh di atas: r = Coefisien korelasi = 0,866 ( t hitung = - 4,952
Dk = n1 + n2 2 = 25+25-2= 48; dg tingkat kesalahan 5% ( t table = 2,013 ( Ho ditolak
3. UJI HIPOTESIS ASOSIATIF
->hipotesa / dugaan adanya hubungan antara 2 variabel dalam populasi dg mengambil sampel dari populasi tsb.
->dihitung koefisien korelasi (r) yg juga disebut korelasi Product Moment antara 2 variabel tsb. Dg rumus:
Dimana X = xi-x rata2; Y = yi y rata2
R = koefisien/ angka yg menunjukkan relasi (hub) anta var x & y
Nilai -1r1
r = 0 ( tidak ada korelasi
r = 1 ( positif sempurna ( garis dg gradien +;
r = -1( negatif sempurna ( garis dg gradien ;
Contoh: -> excel: ada tidaknya hubungan antara pendapatan & pengeluaranHasil r diuji signifakannya dg table r produt momen, dan atau dg uji-t (t table)
Uji t:
=
Nilai t hitung = 6,33;
Nilai t tabel: Dk = n-2 = 8; kesalahan: 5%; ( t tabel = 2,306
t hitung > t tabel ( Ho ditolak; berarti terdapat hubungan antara pendapatan & pengeluaran dg koef. Korelasi ( r ) = 0,9129
Koefisien Determinasi:
r2 = 0,83 ( artinya 83% pengeluaran ditentukan oleh factor besar pendapatan, sedangkan yg 17% ditentukan oleh factor lain, misalnya sakit, dll. ====
ANALISIS DUA VARIABEL ATAU LEBIHPertanyaan:
1. Adakah hubungan antara variabel x & y? ( berdasar common sense, bukan berdasar statistic/matematik2. Jika ada hubungan, bgmana hubungan tsb? ( regresi3. Seberapa erat hubungan antara 2 var tsb? ( korelasiHubugan antara 2 var:
1. Fungsi secara matematik: y = f (x)
2. Fungsi secara statistik
Contoh:
Matematik: Jika satu harga motor Rp 15jt, kalau 2 motor? ( pasti = 30jtStatistik: Jika nilai X diketahui, nilai Y tidak dpt diperkirakan dg pasti.
Contoh: X = jam kerja. Y = produksi yg dipengaruhi jam kerja, dll SCATTER DIAGRAM
Dalam gambar garis regresi:
tidak semua titik terletak pd grs regresi
ada perbedaan ( dinamakan ERROR (hal ini sering terjadi pada pengamatan/pengukuran, dll, akibat human error, alat yg error, dll)
TUJUAN REGRESI adalah: untuk memperkirakan besar parameter Y dari bentuk hubungan yg diprediksi ada antara variable yg diamati.
KORELASI:
untuk menunjukkan seberapa erat hub ant 2 var
hubungan yg erat secara statistic tsb BUKAN berarti hub kausal (sebab-akibat), krn hub kausal ditentukan oleh ilmu non-statistik atau common sense.
Misal: ada data antara jumlah di .dan kejahatn di . Yg absurd (lucu)
PERINGATAN:
JANGAN MENGAMBIL KESIMPULAN ADA HUB KAUSAL HANYA KARENA KOEF r TINGGI.
MODEL REGRESI:
1. Linier Sederhana: 1Y & 1X
2. Linear Berganda: 1Y & lebih dari 1X
LINIER SEDERHANA:
Bentuk lurus: Y = a + bX
Besaran a: nilai Y pada X = 0; b: setiap X berubah 1 unit, maka Y berubah b unit. ( PR: CEK PADA GAMBAR : b = kemiringan Jika tidak lurus, model ditransformasikan (dg Log atau akar, eksponential ) sehingga jd lurus
REGRESI SEDERHANA (METHOD OF LEAST SQUARES)
REGRESI LINIER SEDERHANA
y = a + bx
y = DEPENDENT variabel (= predicted value, estimated value)x = independet variabel
a = harga konstanta Y saat X = 0
b = koef regresi (tangen : y/x) ( jika b=+, grafik naik, jika b= -, grafik turun( b = f (r), artinya jika r tinggi, maka b juga besar, dan sebaliknya
( jika r negative, maka b juga negative, dan sebaliknya CEK PR !Contoh: y = 2+0,5x ( Gambar
=Contoh:
Mencari pers hub ant tegangan normal (x) & gaya geser (y) pd sampel tanah:
Diperoleh pers. Refresi:Y = 4,089 + 1,026 x
Setelah persamaan diperoleh ( bisa melakukan prediksi Y utk sembarang nilai X (interpolasi).Note:
Hanya melakukan prediksi pd domainnya (interpolasi)
Tidak ekstrapolasi krn model nya mungkin bukan linier di luar domainnya
Persyaratan pada Uji Regresi Linier:
Normalitas
Keberartian Regresi
Linieritas
Keberartian Koefisien Regresi
KOEFISIEN KORELASI (r) LINIER
Angka yg menunjukkan relasi (hub) anta var x & y
Nilai -1r1
r = 0 ( tidak ada korelasi
r = 1 ( positif sempurna ( garis dg gradien +; x>>> ( y>>>
r = -1( negatif sempurna ( garis dg gradien ; x>>> ( y excel: ada tidaknya hubungan antara pendapatan & pengeluaran
Hasil r diuji signifakannya dg table r produt momen, dan atau dg uji-t (t table)
Uji t:
=
Nilai t hitung = 6,33;
Nilai t tabel: Dk = n-2 = 8; kesalahan: 5%; ( t tabel = 2,306
t hitung > t tabel ( Ho ditolak; berarti terdapat hubungan antara pendapatan & pengeluaran dg koef. Korelasi ( r ) = 0,9129
NOTE:
Jika regresi signifinakan maka koefisien regresinya juga signifikan !Contoh:
Data dg n=12, X = 800, Y=811, XY=54107, X^2= 53418, Y^2 = 54849
Jika diambil alpha 5%, bagaimana persyaratan regresi linier? 1. Dengan Analisis Korelasi
Hipotesis:
Ho = tidak ada korelasi antara X dan Y
Ha = ada korlasi antara X dan Y
koef r dihitung = 0,7027 t dihitung = 3,12Daerah kritis: alfa 5% dan n = 10 ( t tabel = 1,812 ( t hitung > t tabel ( Ho ditolak ( Kesimpulan: ada korelasi antara X dan Y2. Analisis VarianSource of
VariationSSDfMSFFtabel
Regression19,2119,29,754,96
Error19,712-2=101,97
TOTAL38,911
F hitung > F tabel ( Ho ditolak NOTE: F hitung = kuadrat dari t hitung==REVIEW
Hubungan antara variabel:
functional relation
statistical relation
Functional relation is expresed by: Y = f (X)
X = independent var; Y = dependent var
Ex: Y = 2X( Gambar: semua titik data langsung terletak pd kurva
Statiscal relation: semua titik data tidak langsung terletak pd kurva
1. gambar kurva
SIMPLE LINIER REGRESION (A FIRST ORDER MODEL)
Y = a0 + a1 X ; a0= koef regresi; b1= kemiringan garis regresi
DATA for REGRESSION ANALYSIS
Observational Data:
data are obtained WITHOUT controlling the independent variable
misal: studi hub ant umur dan jumlah hari ijin krn sakit (NOT cause and effect)
Experimental Data:
data are obtained WITH controlling the independent variable
misal: hub anta pemahaman thd materi kursus (>> waktu kursus >> paham), jadi lamanya waktu kursus mrpka kontrol dr variabel independent
PROPERTIES OF FITTED REGRESSION LINE (sifat-sifat dr garis regresi)
2. The sum of residual = 0
3. The sum of observed values = the sum of fitted values (nilai hasil regresi)
4. Titik data rata-rata (Xrt, Yrt) selalu berada di garis regresi)
Coefficient of determination = r2 = SSR/SSTO ( 0r21
Coefficient of correlation = r = r2 = ( -1r1
HOMEWORK: buat Anova Table dg data di atas, dan koef korelasi
Rumus r (Koef. Korelasi):
Dimana: Yi = yi yrt; Xi=xi x rtMULTIPLE LINIER REGRESSION
Persamaan : y = b0 + b1 x1 + b2 x2 + .............. bk xk
Yi = yi yrt; Xi=xi x rtb1 dan b2 dicari dari 2 persamaan sbb:
X1Y = b1 X12 + b2 (X1 X2)
X2Y = b1 (X1X2) + b2 X22b0 dicari dari persamaan : y rt = b0 + b1 X1 rerata + b2 X2 rerataExample:
From an experimental study on the stabilization of highly plastic clay, molding water content for optimum density was found to be linierly dependent on the percentages of lime and pozoolan mixed with the clay. The result was tabulated. Fit an equation of the form : y = b0+b1x1+b2x2 to the data.
Water content = y% of lime = x1% of pozzolan = x2
27,5218
Cari b1, b2, dan b0Persamaan mutiple regresi dari data di atas :
Y = .... + ..... x1 + .... x2
Rumus r (Koef. Korelasi) utk Simple Linier Regresi:
Dimana: Yi = yi yrt; X1i= x1i x1 rt Rumus r (Koef. Korelasi) utk Multiple Linier Regresi:
5. Multiple correlation coefficient:
6. Dimana: Yi = yi yrt; X1i= x1i x1 rt ; X2 = x2i x2 rt. Antara dua variabel, coef of correlation:
REGRESSION TROUGH THE ORIGIN / Regresi dari titik pusat (0,0)
Pers: y reg = b1 . x
Rumus mencari b1 (
TRANFORMATION
See fig. 4.13 & 4.14
( dari scatter diagram, dpt dilihat pola regresi non linier dg varian yg konstant ( transfor x
a. x = log x
b.
c.
Contoh: Regression calculation with Square Root Transformation of x.
See fig. 4.15 & 4.16
( dari scatter diagram, dpt dilihat variasi yg unik ( transform y
Transfor y: y = akar y; y = log y;y = 1/y
Contoh: Regression calculation with Logarithmic Transformation of y.
==
Note:
Teknik statistic t-test :
( statistic parametris utk uji komparasi data ratio / interval
7. statistic nonparametris pakai Kolmonogorof / chi kuadrat/ dll.
8. ==
=============================
===REVIEW:Coefficient for multiple linier regression.
Non Linier Regression / Polynomial regression ( just 4 a slight exp.
NON LINIER: y = a + bx2POLYNOMIAL REGRESSION:y = b0 + b1 x + b2 x2 ( satu variabel bebas
Dimana: x = xobserved x rerataY = nb0 + b2 X2XY = b1 X2 + b2 X3X2Y = b0 X2 + b1 X3 + b2 X4.
One independent variable second order ( See fig. 9.1 & 9.2One independent variable third order ( fig 9.3
CONFIDENCE LIMIT OF REGRESSIONGambar a: influence of the confidence limits of Yrerata on the confidence limits of regression line
Gambar b: confidence limits of an estimate of y (==y topi=y reg)
Estimate of y ( y = a + bx9. Nilai y tsb tidak mesti nilai observed
10. Nilai tsb hasil dr nilai x sembarang
11. Muncul pertanyaan: seberapa besar kepercayaan (confidence level) dr nilai estimasi tsb?
12. Perlu diketahui/dihitung varian dari y-reg thd y observed dibagi dk:Sy/x2 = e2/dke = nilai y-reg dikurangi y observednote: Constraint (batasan) dari garis regresi: parameter a & b( dk = n 2
(
==
13. The probablity of being wrong = level of significant of the value of t14. Garis regresi pasti melalui titik centroidal (x rerata, y rerata) => eror nilai y rerata adalah konstan sepanjang garis regresi (gambar a)Jika mau memprediksi derajat kepercayaan/confidence interval/confidence limit (confidence level ) dari nilai Y regresi (Y reg = b0 + b1.X) oleh sembarang nilai tunggal x (=xi , varian dari nilai tunggal adalah:
Confidence interval nilai tunggal = y t x Syi ( gambar bContoh Soal :Hub X & Y ( lihat excell
Problem:
1. Estimasi Y jika X = 2010
2. Tentukan 95% confidence level dari Y hubungannya dg X = 2010 tsb
Solusi:
1. Y = - 38,007 + 0,994 x 2010 = 1959,933
2. area 95% confidence level = 1959,993 t . Syi
t = nilai pd 5% significant level untuk 8 degree of freedom (dk=n-2) => t hitung = 2,306
Sy/x = 19,267
Batasan 95% confidence level:1959,933 2,306 x Syi 1959,933 46,784
OVERIEW OF F-test & T-test
Problem:
15. Buat persamaan regresi dari data yg diketahui16. Gunakan F-test untuk mengecek apakah persamaan tsb di atas signifikan secara statistik ? (dg lpha=1%)
17. Gunakan t-test untuk mengecek signifikansi dari koefisien regresi pada level 1%
UJIAN KD3 SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL FAKULTAS TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Kamis, 19 Mei 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Rata-rata nilai ujian mata kuliah Statistik dari 150 mahasiswa adalah 72. Deviasi standard = 9. Jika nilai-nilai tsb diasumsi distribusi normal, hitung:
a. Jumlah mahasiswa yg nilainya kurang dari 70
b. Jumlah mahasiswa yg nilainya lebih dari 60
c. Jumlah mahasiswa yg nilainya antara 60 dan 70
d. Jumlah mahasiswa yg nilainya A (sama atau lebih besar dari 80)
2. Pengujian laboratorium terhadap kekuatan suatu bahan kostruksi dengan metode tertentu menunjukkan distribusi normal. Jika 10% dari hasil pengujian kekuatannya lebih besar dari 8000 N, dan 70% lebih besar dari 6000 N, berapa nilai Mean dan Standard Deviasi nya?
3. Jika suatu data mempunyai distribusi normal dengan nilai Mean = 100, dan Stand. Deviasi = 18, hitung peluang (probabilitas) variabel dengan nilai:
a. Antara 115 dan 140
b. Antara 90 dan 120
4. Pengujian kekuatan geser terhadap 50 sampel material menghasilkan nilai Mean = 3265 kN/m2. Dan nilai Standard deviasi = 466 kN/m2. Distribusi diasumsi normal.
a. Estimasi probabilitas suatu random tes yang menghasilkan nilai berjarak dari nilai Mean sebesar 100 dan + 400 kN/m2.
b. Tentukan besaran kekuatan geser minimum dimana 2% dari hasil tes memiliki nilai dibawah nilai minimum tsb.
c. Jika nilai level of significance data tsb = 5%, jelaskan maksud dari ketentuan tsb.
JAWAB
1a. 70-72/9= -0,22( f(z)=0,0871
Kurang dr 70( luas=0,5-0,0871=0,4129( kali 150=62
1b. 60-72/9= -1,33( f(z)=0,4082
Lbh besar dr 60( luas=0,5+0,4082=0,9082( kali 150=136
1c. F(z)= 0,4082-0,0871= 0,3211( kali 150= 48
1d. 79-72/9= 0,89( f(z)=0,3133
Lbh besar n =80( luas=0,5-0,3133=0,1867( kali 150=28
2 F(z)=0,5-0,1=0,4 ( z=1,285 ( 1,285xsigma=8000-rerata ..(1)
F(z)=0,7-0,5=0,2 ( z=0,525 ( 0,525xsigma=rerata-6000 ..(2)
Dari (1)&(2): diperoleh rerata= 6580 & sigma=11053a115-100/18= 0,833( f(z)=0,2970;140-100/18= 2,222( f(z)=0,4865
0,4865-0,2970= 0,1898= 18,9%
3b100-90/18= 0,... ( f(z)=0,2123;
120-100/18= 1,111( f(z)=0,3665
0,2123 + 0,3665= 0,5788= 57,9%
4a.100/466=0,21 ( 0,0832
400/466=0,86 ( 0,3051
Dijumlah=0,38834b.f(z)=0,5 0,02 = 0,48 ( z= 2,06 ( 2,06x 466 = 3265 x ( x = 2305
UJIAN TENGAH (KD2) SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL FAKULTAS TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Jumat, 15 April 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Terdapat 20 data sbb:
3; 3; 3; 3; 3; 3; 3; 1; 2; 2; 2; 2; 5; 4; 5; 6; 6; 7; 8; 9
a. Hitung koefisien skewness (kemencengan) dan koefisien kurtosis (keruncingan)
b. Gambar histogram dr data di atas. Bgmana kesimpulan anda antara hasil hitungan dengan histogram?
2. Dalam suatu percobaan di laboratorium, terdapat hubungan antara dua variabel x dan y sbb:
x4567891011
y4681318232631
a. Hitung persamaan garis regresi
b. Buktikan bhw jumlah kuadrat total (JKT) = jumlah kuadrat erros (JKG) + jumlah kuadrat regresi (JKR)
UJIAN KD4 SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL FAKULTAS TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Jumat, 24 Juni 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Jelaskan yg dimaksud dg koefisien korelasi (r) pada garis regresi. Kalau perlu gunakan bantuan gambar / sketsa 20%.
2. Penelitian laboratorium terhadap material tertentu, menghasilkan data tegangan F (N/m2) dan temperatur T (0 Celsius) seperti pada kolom 2 & 3 tabel di bawah.
a. Dengan y = transformasi dari data T (y=log T), lakukan analisis hubungan antara tegangan F (variabel x) & temperatur T (variabel y) 20%.b. Jika menginginkan material dg tegangan 65 N/m2, estimasi berapa waktu yang dibutuhkan? -10%c. Dengan tingkat signifikan 5% dan derajat kebebasan = 2 diperoleh t = 4,303. Hitung berapa confidence interval (batas kepercayaan) hubungannya dg jawaban b) tsb di atas 10%.Ix= FTy=log Tx2Xy
180221,34246400107,3938
270571,75594900122,9112
3602052,31183600138,7052
45013243,12192500156,0944
JUMLAH2608,531917400525,1047
3. Penelitian skala kecil menghasilkan data seperti tabel di bawah. a. Tentukan persamaan regresi ganda (multiple regression) -30%. b. Hitung koefisien korelasinya 10%.
Ix1x2y
173342
244133
316775
434928
521591
683155
jumlah59166324
UJI LINIERITAS REGRESI
Apakah grs regresi antara x & y membentuk grs lurus?
Kalau tidak linier analisis regresi tidak dipakai
_1362879931.unknown
_1427084434.unknown
_1459696432.unknown
_1460304987.unknown
_1461522595.unknown
_1459696282.unknown
_1427084608.unknown
_1369045165.unknown
_1369669317.unknown
_1369676816.unknown
_1427082363.unknown
_1369675992.unknown
_1369046682.unknown
_1369047875.unknown
_1369045047.unknown
_1369045107.unknown
_1369043990.unknown
_1362823165.unknown
_1362823189.unknown
_1362820635.unknown