21
Erste Hilfe für Einsteiger (falls Sie erstmalig mit MATLAB arbeiten, dann bitte nicht nur durchlesen, sondern ausprobieren!) MATLAB-Hilfe bei bekanntem Funktionsnamen fkt_name: help fkt_name z.B. help linspace wenn Funktionsname in MATLAB unbekannt, d.h. bei Suche nach Funktion zu Begriff: lookfor Begriff Pfad setzen (funktioniert eventuell nicht im Pool) Hinzufügen von Verzeichnissen zum Suchpfad, in dem MATLAB Funktionen, Daten sucht addpath dir1 Entfernen von Verzeichnissen aus Suchpfad rmpath dir1 Editor zum stapelweisen Abarbeiten von MATLAB-Kommandos zum Schreiben eigener Funktionen/Skripts edit Vektoren (numerisch) Zeilenvektor v = [1, 4, 6] oder auch v = [1 4 6] Spaltenvektor v = [1; 4; 6] leerer Vektor v = [] Vektoren mit konstanter Schrittweite v = 1:5 bzw. v = 1:3:10 bzw. v = 10:-2:1 v = linspace(0,0.1,2) Zeilenvektor mit n Nullen v = zeros(1,n) Spaltenvektor mit n Nullen v = zeros(n,1) d.h. erster Eintrag: Zeilenzahl, zweiter Eintrag: Spaltenzahl Zeilenvektor mit n Dreien v = 3*ones(1,n) Umwandlung Zeilen- in Spaltenvektor: Transponieren v1 = v‘ Verkettung von Vektoren a = [1 2] und b = [3 4] ergibt c=[a b] oder auch d = [a‘;b‘] aber nicht möglich e = [a,b‘] d.h. Dimensionen müssen passen Vektoren (logisch) entstehen durch Vergleich von 2 Vektoren, wobei eine Relation komponentenweise geprüft wird mit Ergebnis = 1 für wahr und Ergebnis = 0 für falsch der logische Vektor besteht dann aus Nullen bzw. Einsen, z.B. a = [1 2] und b = [3 4] l=(a<b) ergibt l=[1 1] für obige Belegung Logische Vektoren können zur Auswahl von Komponenten genutzt werden. Zugreifen auf Komponenten eines Vektors Die erste Komponente hat stets Index 1!!! Index der Komponente steht in runden Klammern!

Erste Hilfe für Einsteiger - web.eah-jena.deweb.eah-jena.de/~schuetze/lehre/material/stoch_prakt.pdf · Erste Hilfe für Einsteiger (falls Sie erstmalig mit MATLAB arbeiten, dann

Embed Size (px)

Citation preview

Erste Hilfe für Einsteiger (falls Sie erstmalig mit MATLAB arbeiten, dann bitte nicht nur durchlesen, sondern ausprobieren!) MATLAB-Hilfe bei bekanntem Funktionsnamen fkt_name: help fkt_name z.B. help linspace wenn Funktionsname in MATLAB unbekannt, d.h. bei Suche nach Funktion zu Begriff: lookfor Begriff Pfad setzen (funktioniert eventuell nicht im Pool) Hinzufügen von Verzeichnissen zum Suchpfad, in dem MATLAB Funktionen, Daten sucht addpath dir1 Entfernen von Verzeichnissen aus Suchpfad rmpath dir1 Editor zum stapelweisen Abarbeiten von MATLAB-Kommandos zum Schreiben eigener Funktionen/Skripts edit Vektoren (numerisch) Zeilenvektor v = [1, 4, 6] oder auch v = [1 4 6] Spaltenvektor v = [1; 4; 6] leerer Vektor v = [] Vektoren mit konstanter Schrittweite v = 1:5 bzw. v = 1:3:10 bzw. v = 10:-2:1 v = linspace(0,0.1,2) Zeilenvektor mit n Nullen v = zeros(1,n) Spaltenvektor mit n Nullen v = zeros(n,1) d.h. erster Eintrag: Zeilenzahl, zweiter Eintrag: Spaltenzahl Zeilenvektor mit n Dreien v = 3*ones(1,n) Umwandlung Zeilen- in Spaltenvektor: Transponieren v1 = v‘ Verkettung von Vektoren a = [1 2] und b = [3 4] ergibt c=[a b] oder auch d = [a‘;b‘] aber nicht möglich e = [a,b‘] d.h. Dimensionen müssen passen Vektoren (logisch) entstehen durch Vergleich von 2 Vektoren, wobei eine Relation komponentenweise geprüft wird mit Ergebnis = 1 für wahr und Ergebnis = 0 für falsch der logische Vektor besteht dann aus Nullen bzw. Einsen, z.B. a = [1 2] und b = [3 4] l=(a<b) ergibt l=[1 1] für obige Belegung Logische Vektoren können zur Auswahl von Komponenten genutzt werden. Zugreifen auf Komponenten eines Vektors Die erste Komponente hat stets Index 1!!! Index der Komponente steht in runden Klammern!

Komponente i von Vektor a ai=a(i) letzte Komponente von a a_end = a(length(a)) = a(end) Komponenten von i bis j von a a_ibisj = a(i:j) alle positiven Komponenten apos = a(a>0) Vektor i0 mit den Indizees der Komponenten von a, die = 0 sind i0 = find(a==0) aus Vektor a nur Komponenten ungleich 0 i1 = find(a~=0) a(i1) Vektoraddition/Subtraktion a + b a – b Komponentenweise Multiplikation a.*b Komponentenweise Division a./b Komponentenweises Potenzieren a.^n Länge von X l = length(x) oder l = size(x) Sortieren der Komponenten xsort = sort(x) Achtung Dimensionen müssen passen! Multiplikation eines 3-dim. Zeilenvektors mit einem 3-dim. Spaltenvektor ergibt eine Zahl, nämlich das Skalarprodukt. Multiplikation eines 3-dim. Spaltenvektors mit einem 3-dim. Zeilenvektor ergibt eine (3x3)-Matrix. Multiplikation eines 3-dim. Zeilenvektors mit einem 2-dim. Spaltenvektor ergibt eine Fehlermeldung! Matrizen Matrizen entstehen z.B. durch Aneinanderhängen von Spaltenvektoren gleicher Dimension. Elementweiser Zugriff: der erste Index ist die Zeilennummer, der zweite Index ist die Spaltennummer. v1 = [1, 4, 6]‘ und v2 = [2, 3, 0]‘ A = [v1;v2] ist eine (3x2)-Matrix Einträge der Matrix A A(2,1)=2, A(1,3)=6. komplette erste Spalte x von A x = A(:,1), d.h. der Doppelpunkt steht als Platzhalter für alle Zeilenindizees. komplette zweite Spalte x von A x = A(2,:), d.h. hier steht der Doppelpunkt als Platzhalter für alle Spaltenindizees. Viele Funktionen können Vektoren/Matrizen als Argument haben, z.B. x=0:0.1:2 y=sin(x) erzeugt für jede der Komponenten des Vektors x den Funktionswert, abgelegt im Vektor y Verwenden von Platzhaltern z.B. Anwendung von sum auf eine Matrix A: sum(A) erzeugt einen Vektor der Spaltensummen, d.h. Summe spaltenweise über alle Zeilen sum(A‘)erzeugt einen Vektor der Zeilensummen, d.h. zeilenweise Summe über alle Spalten sum(A(:)) ergibt die Summe aller Einträge der Matrix A.

Praktikum 1

1. Funktionen der deskriptiven Statistik Bsp. eindimensional Kleinste Komponente von Vektor x x_min =min(x) Größte Komponente von x x_max =max(x) Mittelwert m = mean(x) Median md = median(x) Varianz v = var(x) Standardabweichung s = std(x) Interquartilsabstand d = iqr(x) Perzentile vorgegebener Ordnung prctile(x,[10 90]) Quantile vorgegebener Ordnung quantile(x,[0.10 0.25 0.5 0.75 0.9]) Häufigkeitsauszählung von x vals = unique(x) [anz, bins]=hist(x, vals) Zweidimensional Häufigkeitsauszählung der Kombinationen der Werte von nominalen Vektoren x,y crosstab(x,y) Korrelation der metrischen Vektoren x,y corr(x,y) Lineare Regression Anpassung von Polynomen in x polyfit lineare Regression der in A stehenden unabhängigen Variablen auf y regress(y,A) soll Absolutglied dabei sein, ist die erste Spalte von A mit Einsen zu belegen allgemeine Regressionsfktn interaktiv cftool

2. Grafische Darstellung Histogramm von x mit p Balken hist(x,p) zusätzlich zugehörige Normalverteilung histfit(x,p) Boxplot eines Vektors x boxplot(x) Boxplots von x,y mit gleich skalierter Achse boxplot([x‘,y‘]) weitere Optionen über help boxplot Empirische Verteilungsfunktion ecdf(x) Streudiagramm y über x scatter(x,y) weitere Optionen über help scatter Balkendiagramm nach vorheriger Auszählung bar(bins,anz)

Stochastik f�ur ETSS [email protected]

MATLAB-Praktikum 1: Deskriptive Statistik

1. Bei 20 Streichholzschachteln wird jeweils die Anzahl der darin enthaltenen Streichhölzer ermittelt mitfolgendem Ergebnis37 40 41 42 40 38 41 43 41 40 35 40 38 37 38 40 38 37 38 38 .

a) Bestimmen Sie die absoluten und relativen Häu�gkeiten der Merkmalsausprägungen und zeichnenSie ein Balkendiagramm.

b) Berechnen und zeichnen Sie ein Histogrammm und die empirische Verteilungsfunktion.

c) Berechnen Sie Mittelwert, Standardabweichung und den Variationskoe¢ zienten.d) Berechnen Sie den Median, die Quartile sowie das 10%- und 90%-Quantil.

AnleitungLegen Sie ein Daten�le an, indem Sie den Datenvektor a1_1 eingeben und speichern (copy, paste).Schreiben Sie (zumindest am Ende der Bearbeitung der Aufgabe) alle Kommandos in ein M-File.Die in der Anleitung angegebenen MATLAB-Kommandos stellen nur eine denkbare Möglichkeitdar. Schauen Sie sich die Hilfe dazu an. Vielleicht �nden Sie Alternativen.

a) vals = unique(a1_1) erzeugt einen Vektor mit den verschiedenen Merkmalsausprägungen,Häu�gkeitsauszählung der Merkmalsausprägungen mit [anz, bins ]= hist(a1_1,vals)Balkendiagramm mit bar(bins,anz)

b) Histogramm mit hist(a1_1,4) oder hist(a1_1,5) (4 bzw. 5 Klassen)empirische VF ecdf(a1_1)

c) m = mean(a1_1), s = std(a1_1), v=s/md) med = median(a1_1)

prctile(a1_1,[10 25 75 90]) oder quantile(a1_1,[0.10 0.25 0.75 0.90])

2. In folgenden Tabellen ist die Verteilung der Anzahl X der Arbeitsunfähigkeitstage pro Versicherten derAOK in M-Stadt für einen bestimmten Zeitraum angegeben.Anzahl Tage X 0 1 2 3 4 5 6 7 8Anz. Versicherte 176122 106702 61069 30899 13631 5605 2337 896 364

Tage 9 10 11 12 13 14 15 16 19 21Anz. Versicherte 168 73 37 17 5 3 3 1 1 1

a) Berechnen Sie das arithmetische Mittel, den Median, die Streuung und den Quartilsabstand.b) Zeichnen Sie ein Boxplot. Finden Sie ausreißerverdächtige Werte?

AnleitungDatenvektor aus Teilvektoren zusammensetzen, die aus 176122 Nullen, 106702 Einsen, 61069 Zwei-en,... bestehen: v0=zeros(176122,1), v1=ones(106702,1), v2=2*ones(61069,1),...,v15=15*ones(3,1)zusammengesetztes Daten�le: a1_2=[v0 v1; v2; ...; v15; 16; 19; 21];(letztes Semikolon nicht vergessen zum Unterdrücken der Ausgabe von a1_2 im Kommandofens-ter)

a) m = mean(a1_2), s = std(a1_2), med = median(a1_2), d = iqr(a1_2)b) boxplot(a1_2)

3. Es werden n = 30 Bleche auf Zugfestigkeit geprüft, man erhält folgende Messwerte [kg/mm2]44.2 43.4 41.0 41.1 43.8 44.2 43.2 44.3 42.0 45.0 43.1 42.9 43.9 44.8 46.042.1 45.1 40.9 43.7 44.0 43.0 43.6 46.1 41.0 43.3 45.3 44.9 42.0 44.0 44.3

1

a) Berechnen und vergleichen Sie den Mittelwert mit dem Median, die Standardabweichung mit demQuartilsabstand.

b) Zeichnen Sie ein Histogramm mit 6 Klassen.

c) Zeichnen Sie die empirische Verteilungsfunktion.

d) Entscheiden Sie anhand eines Boxplots, ob ausreißerverdächtige Werte vorliegen.Anleitunganalog zu Aufgaben 1 und 2

4. 100 zufällig ausgewählte Studenten einer Universität wurden nach ihrem Studienfach und ihrer Einstel-lung zu einem Studentenstreik für bessere Studienbedingungen gefragt. Eine Auszählung ergab, dassvon den Naturwissenschaftlern 20 dafür, 5 dagegen und 15 neutral sind, von den Geisteswissenschaft-lern 10 dafür, 5 dagegen und 5 neutral und von den Wirtschaftswissenschaftlern 10 dafür, 20 dagegenund 10 neutral.

a) Schreiben Sie die Daten in eine Kontingenztabelle und bestimmen Sie die Randverteilungen.

b) Vergleichen Sie die Verteilung der Einstellung zum Streik zwischen den Fachgruppen, indem Sie diebedingten Verteilungen bestimmen.

c) Welche Zellenbesetzung würden Sie bei Unabhängigkeit der Merkmale erwarten? Berechnen Sie dassowie alle Kontingenzkoe¢ zienten.AnleitungErzeugung eines Daten�les: Es gibt prinzipiell zwei Möglichkeiten.(1) Man erzeugt ein �Ur�le�, das für die 100 Fälle in der ersten Spalte die FB-Zugehörigkeit, inder zweiten die Meinung zum Streik enthält.(100 x 2 - Matrix)entweder über Eingabe in Datentabelle per Menü (New Variable)oder durch folgenden Codedie erste Variable X enthält die Zugehörigkeit zu den FBs, die zweite Variable Y die Meinung zumStreikX = [ones(40,1); 2*ones(20,1);3*ones(40)]Y = [ones(20,1); 2*ones(5,1); 3*ones(15,1);ones(10,1); 2*ones(5,1); 3*ones(5,1);ones(10,1); 2*ones(20,1);3*ones(10,1)]a1_4=[X Y]

(2) Man erzeugt ein schon zusammengefasstes File analog der Kontingenztabelle, d.h. eine (3x3)-Matrix tab, die die Häu�gkeiten der 9 vorliegenden Merkmalskombinationen enthält.tab =[20 5 15;10 5 5;10 20 10]

a) Variante (1):[tab,chi_qu,p]=crosstab(a1_4(:,1),a1_4(:,2)) erzeugt das gleiche File tab, das unter (2) zu Fußangelegt wurde, zusätzlich wird das �2-Maßund der Test auf -unabhängigkeit berechnet (p-Wertp < 0.05 bedeutet Ablehnung der Unabhängigkeit).Varianten (1) und (2) rechnen weiter mit tabBerechnung ausgewählter Summen bestimmter Elemente einer Matrix (für Rand- bzw. bedingteVerteileungen):Kommando sum in Anwendung auf eine Matrix erzeugt Spaltensummen, Zeilensummen bzw.Summe aller Einträge (genaueres der Doku von sum entnehmen; vgl. help sum)Randverteilung FB entspricht gemäßobiger Struktur von tab den Zeilensummen:rv_FB=[sum(tab(1,:)),sum(tab(2,:)),sum(tab(3,:))] oder einfacher rv_FB = sum(tab�)Randverteilung Streik entspricht Spaltensummen:rv_Streik=[sum(tab(:,1));sum(tab(:,2));sum(tab(:,3))] oder einfacher rv_Streik = sum(tab)

b) bedingte Verteilung der Streikeinstellung in Fachgruppen: jeweilige FB-Zeilen normiert mit Zeilen-summev_nat = tab(1,:)/rv_FB(1)v_gei = tab(2,:)/rv_FB(2)v_wiwi = tab(3,:)/rv_FB(3)

2

c) expected=(rv_FB�*rv_Streik)/sum(tab(:))d=((tab-expected).^2)./expectedT=sum(d(:)gleiches Ergebnis wie ChiQuadrat-Maßmit crosstabkont=sqrt(T/100)Korr_kont=kont*sqrt(3/2)

5. Bei Bewitterungstests von Bezugsfolien für die Innenverkleidung von Pkw wurden 3 Folientypen un-tersucht. Die Verfärbungen wurden anhand von Grenzmustern in 4 Klassen eingeteilt von keiner Ver-färbung (B1) bis sehr starker Verfärbung (B4). Man erhielt folgende Ergebnisse

VerfärbungsklasseFolientyp B1 B2 B3 B4A1 15 6 6 3A2 3 12 3 2A3 1 2 14 3Berechnen Sie den Kontingenzkoe¢ zienten.Anleitungwie Aufgabe 4

6. Ein Versuch zur Bestimmung der Thermospannung eines Elements in einem Abkühlprozess zeigte fol-gende MessergebnisseTemperatur [�C] 81.5 76 69 65 58 54 49.5 45 41 36 29 26Spannung [mV] 2.36 2.23 1.94 1.92 1.62 1.44 1.31 1.19 1.01 0.78 0.45 0.25

a) Berechnen Sie die Korrelationskoe¢ zienten nach Pearson.

b) Beschreiben Sie die Abhängigkeit der Thermospannung von der Temperatur durch lineare Regres-sion.

c) Wie großsind die erklärte und die Restvariation?

d) Berechnen Sie das Bestimmtheitsmaß.AnleitungDatensatz a1_6 erzeugen:aus obiger Datentabelle Werte in Vektoren x bzw. y kopieren (Dezimaltrennzeichen muss Punktsein!!!), dabei in Spaltenvektoren transponierena1_6=[x y]

a) corr(x,y)

b) unter APPS Curve �tting wählen, Variablen x, y zuordnen sowie Polynomial Fit, Degree 1odercftool im Kommandofenster aufrufenoder zu Fußaus Variable x muss man die Koe¢ zientenmatrix A des LGS erzeugen, d.h. x wird um eine Spalteerweitert, die nur Einsen enthält (anderenfalls erhält man Regressionsgerade durch Koordina-tenursprung - ohne Absolutglied)A=[ones(size(x) x]b=Any enthält die Regressionsparameteroder[b ci]=regress(y,A) berechnet zusätzlich zu den Regressionsparametern ihre Kon�denzintervalle

c) zu FußSST=sum((y-mean(y)).^2) %totale Variation in yu=y-A*b %ResiduenSSE=sum(u.^2) %RestvariationSSR=SST-SSE %erklärte Variation

d) BestimmtheitsmaßR_Square=SSR/SSToder

3

R_Square=(corr(x,y))^2Weitere Ausgabegrößen von cftoolRMSE =

pSSE=(n� 2)

Radj = 1�n� 1n� p

SSE

SST, p: Anzahl geschätzter Parameter des linearen Modells

7. Der Abbau von Adrenalin in der Leber wurde in bestimmten Zeitabständen durch die Bestimmung derKonzentrationen im Blut gemessen, es liegen folgende Werte vorZeit nach Adrenalingabe (min) 6 18 30 42 54Adrenalinkonzentration (mg/l) 30.2 9.8 4.7 1.8 0.8

a) Stellen Sie die Daten gra�sch dar.

b) Berechnen Sie die Korrelationskoe¢ zienten nach Pearson und Spearman und interpretieren Sie dieErgebnisse.

c) Logarithmieren Sie die Konzentrationen und berechnen Sie erneut die Pearson-Korrelation. Wasbewirkt das Logarithmieren?

d) Berechnen Sie die lineare und die exponentielle Regressionsfunktion und vergleichen Sie die Be-stimmtheitsmaße.Anleitungim Prinzip wie Aufgabe 6gra�sche Darstellung der Punkte durch plot(x,y,�o�) oder über cftoolSpearman-Korrelation: rho=corr(x,y,�type�,�spearman�)Ergebnisse

b) Pearson_rho = -0.8722Spearman_rho = -1

c) nach Logarithmieren: Pearson_rho = -0.9980, fast perfekte Korrelation

d) lineare Regression: y = 26:16� 0:5567x; BestimmtheitsmaßR_square= 0:7607exponentielle Regression aus quasilin. Regress. lny = 3:7596� 0:07467x,BestimmtheitsmaßR_Square = 0:9961nach Rücktransformation: y = 42:9313 � exp(�0:07467x)zum Vergleich mit exponentieller Kurvenanpassung von MATLABy = 50:37�exp(�0:0862); BestimmtheitsmaßR_Square= 0:9967; berechnet als (SST�SSE)=SST

8. Die Konzentration eines bestimmten Wirksto¤es im Blut erreicht 2 Stunden nach Verabreichung ihrenhöchsten Wert und fällt dann ab. Untersuchen Sie anhand folgender Messungen, ob dieser Abfall imZeitintervall von 2 bis 4 Stunden als lineare Funktion beschreibbar ist.Zeit 2 2.5 3 3.5 4Konzentration 72 70 65 60 53

a) Stellen Sie die Werte gra�sch dar und berechnen Sie den Korrelationskoe¢ zienten nach Pearson.

b) Schätzen Sie die Parameter einer linearen Regressionsfunktion.

c) Wie großsind die erklärte bzw. nicht erklärte Variation?Ergebnisse

a) Pearson_rho = -0.9839

b) y = �9:6x+ 92:8c) SSE = 7:6; SST = 238, R_Square = (SST � SSE)=SST = 0:9681

9. Beschreiben Sie die Abhängigkeit der Viskosität einer Mischung von Wachsen in Abhängigkeit von derTemperatur durch einen Exponentialansatz der Form y = b0e

b1T

Temperatur T 100 90 80 70 60Viskosität y 3.0 5.3 8.2 14.7 20.1

a) Stellen Sie die Werte gra�sch dar und berechnen Sie den Korrelationskoe¢ zienten nach Pearson.

4

b) Schätzen Sie die Parameter einer linearen Regressionsfunktion und eines Exponentialansatzes.derForm y = b0e

b1T :

c) Vergleichen Sie die Bestimmtheitsmaße.Ergebnisse

a) Pearson_rho = -0.9769

b) lineare Regression: y = �0:436x+ 45:14Exponentielle Regression: y = 288:9 � exp(�0:04396T )

c) linear:exponentiell: R_Square = 0:9861

10. Schätzen Sie für den Zusammenhang S =A

Nmzwischen der Anzahl N der Prüfzyklen (in Mio) und

der maximalen mechanischen Spannung S eines Biegeversuchs die Parameter A und m aus folgendenermittelten DatenS 50.5 43.5 42.0 35.7 33.0 32.0N 0.925 6.75 29.1 126 445 420AnleitungAchtung: S ist die abhängige Variable!Kurventyp Power anpassenErgebnisseS = 50:52 �N�0:07033

BestimmtheitsmaßR_Square = 0:9755

5

Praktikum 2

Erzeugen von Zufallszahlen, Simulation

Basis aller Simulationen sind mit bestimmten Computerprogrammen erzeugte Zufallszahlen,

die Pseudozufallszahlen. Es gibt dafür verschiedene Algorithmen, ein besonders leicht zu

demonstrierender aus den Anfangszeiten der Simulation ist der Kongruenzalgorithmus.

Basis sind Zahlenkongruenzen, die bei ganzzahliger Division im Bereich der natürlichen

Zahlen die sich ergebenden Reste betrachten. Alle Zahlen mit gleichem Rest bilden dann eine

Restklase.

a ≡ b mod m (a ist kongruent b modulo m), wenn a und b bei Division durch m den gleichen

Rest haben

Beispiel:

9 ≡ 17 mod 8

da 9 und 17 bei Division durch 8 den gleichen Rest, nämlich 1 haben.

Somit gilt auch

9 ≡ 1 mod 8

17 ≡ 1 mod 8 und ebenso

33 ≡ 1 mod 8

die Zahlen 9, 17, 33 gehören alle zur Restklasse 1 modulo 8 (eine der 8 Restklassen).

Pseudozufallszahlen nach Kongruenzalgorithmus

Startwert x₀ ≠ 0 wählen sowie teilerfremde Zahlen m und b, a

rekursive Berechnung der Folge ix durch

1 modi ix a x b m ( ix ist die Restklasse von 1ia x b )

Es entsteht so eine zufällige Anordnung der Restklassen, d.h. eine 'Zufallsfolge' der Zahlen

zwischen 0 und m-1

Berechnen Sie die ersten 12 Glieder einer solchen Folge für einen Startwert x0 6= 0 und a = 11, m = 10, b = 7: Periodizitäten in der Folge sind unvermeidbar, durch Wahl von großem m treten sie erst spät

auf: MATLAB verwendete ursprünglich 23 5

12 , 7 , modn im a x a x m

Nach Division durch m erhält man damit ‚Zufallszahlen‘ zwischen 0 und 1. Eine Folge von computererzeugten Pseudozufallszahlen ist nur dann reproduzierbar, wenn

man den gleichen Startwert 0x verwendet.

Der aktuelle Startwert kann bei Bedarf ausgelesen werden und zur Reproduktion der gleichen Folge wieder gesetzt werden. Auslesen des Startwerts s = rng Setzen des Startwerts bei nächstem Aufruf rng(s)

1. Erzeugen von Pseudozufallszahlen mit MATLAB Gleichverteilte Zufallszahl auf (0, 1) rand

Vektor/Matrix gleichverteilter Zufallszahlen rand(m,n) mit m Zeilen, n Spalten Gleichverteilte Zufallszahl auf (a, b) rand(m,n)*(b-a) + b diskrete, gleichverteilte Zufallszahlen aus

der Menge 1,..., N randi(N,m,n)

Normalverteilte Zufallszahlen mit

20, 1 randn(m,n)

Normalverteilte Zufallszahlen mit ,a b normrnd(a,b,m,n)

Achtung: der 2. Parameter b > 0 ist die Standardabweichung, nicht die Varianz! Exponentialverteilte Zufallszahlen mit

a exprnd(a,m,n)

Achtung: der Parameter > 0 ist der

Erwartungswert, entspricht 1/ aus Vorlesung! Prinzipiell für die in MATLAB enthaltenen Verteilungen: Kürzel der Verteilung pd pdrnd(…)

0-1-verteilter Vektor der Länge n mit Anteil p von Einsen Idee: Bei einen Vektor gleichverteilter Zufallszahlen auf (0, 1) der Länge n sollte der relative Anteil der Einträge, die kleiner als p sind, gerade p betragen. Daher setzt man

1 falls Eintrag

0 falls Eintrag i

px

p

MATLAB-Kommandos z = rand(n,1) x = z < p

2. Berechnen von Wahrscheinlichkeiten diskreter Verteilungen Binomialverteilung Bin(n,p)

( ) (1 )k n k

k

np P X k p p

k

1 k n binopdf(k,n,p)

Poissonverteilung Pois()

( )!

k

kp P X k ek

0 k poisspdf(k, )

Geometrische Verteilung Geo(p)

( ) (1 )k

kp P X k p p

0 k geopdf(k)

3. Berechnen von Wahrscheinlichkeiten stetiger Verteilungen

Normalverteilung N(,σ²) 2

2

( )

2

2

1( )

2

tx

p P X x e dt

normcdf(x,,σ)

Achtung: Parameterliste in MATLAB enthält die Standardabweichung!

Exponentialverteilung Exp()

( ) 1 , 0xp P X x e x

Achtung: Parameterliste in MATLAB

enthält Erwartungswert 1/! expcdf(x,1/) Weibullverteilung Wei(a,b)

1

( / )

0

( )b

bx

t ab tp P X x e dt

a a

wblcdf(x,a,b)

4. Quantile der Testverteilungen Standardnormalverteilung

: ( )z P X z norminv(, 0, 1)

t-Verteilung mit n Freiheitsgraden

, ,: ( )n nt P X t tinv(, n)

Chi-Quadratverteilung mit n Freiheitsgraden

, ,: ( )n nP X chi2inv(, n)

F-Verteilung mit n und m Freiheitsgraden

, , , ,: ( )n m n mF P X F finv(, n, m)

Stochastik f�ur ETSS [email protected]

MATLAB-Praktikum 2: Wahrscheinlichkeiten, Simulation

1. Testen Sie die in MATLAB implementierte Funktion rand zur Erzeugung von gleichverteilten Zufalls-zahlen zwischen 0 und 1. Die dabei entstehende Folge wird durch die Wahl des Startwerts beein�usst,der bei wiederholtem Aufruf von rand intern verändert wird. Der aktuelle Startwert kann durch s=rngausgelesen werden. Soll die Folge reproduziert werden, setzt man den Startwert zurück durch rng(s).

a) Erzeugen Sie einen Vektor x von 10 auf (0,1) gleichverteilten Zufallszahlen.

b) Erzeugen Sie einen zweiten solchen Vektor y:

c) Erzeugen Sie zwei solche Vektoren z1 und z2, die die gleichen Werte enthalten, indem Sie denaktuellen Startwert auslesen und beim 2. Aufruf wieder auf diesen Wert setzen.Anleitung

a) x = rand(10,1); % array mit 10 Zeilen, 1 Spalte

c) s=rng;x1=rand(10,1);rng(s);x2=rand(10,1);

2. Erzeugen Sie für die Längen n = 100=1000=10000 Vektoren von auf (0; 1) gleichverteilten Zufallszahlenund stellen Sie diese in einem Histogramm dar.Anleitungz = rand(n,1);[anz,vals]=hist(z,[0 1])bar(vals,anz)

3. Erzeugen Sie eine Folge der Länge n = 100=1000=10000 von Nullen und Einsen, der etwa 30% Einsenenthält - das entspricht den Realisierungen einer ZufallgrößeP (X = 1) = 0:3; P (X = 0) = 0:7.Überprüfen Sie gra�sch, wie gut der Anteil realisiert wird.Anleitungz = rand(n,1);x = z<0.3;weiter wie 2. Aufgabe

4. Durch randi erzeugt man gleichverteilte ganzzahlige Zufallszahlen aus der Menge f1; :::; Ng :

a) Simulieren Sie die Ergebnisse des Würfelns mit einem symmetrischenWürfel bei n = 100=1000=10000Wiederholungen und überprüfen Sie die Verteilung gra�sch.

b) Simulieren Sie die Ergebnisse des Würfelns mit zwei symmetrischen Würfel bei n = 100=1000=10000WiederholungenAnleitung

a) x=randi(6,100,1); % N = 6[anz,vals]=hist(x,[1:6])bar(vals,anz) % Balkendiagramm statt Histogramm verhindert Klassenbildung

b) analog mit x=randi(6,100,2);

5. Simulieren Sie einen Münzwurf

1

a) mit einer symmetrischen Münze, n = 100=1000=10000=100000 Wiederholungen

b) mit 4 symmetrischen Münzen, je n = 100=1000=10000=100000 Wiederholungen

c) Schätzen Sie die Wahrscheinlichkeiten, dass bei 4 Würfen mindestens 2x Zahl fällt.Anleitung

a) SM1=randi(2,n,1) % erzeugt Kodierung mit 1 und 2oderz=rand(n,1) % gleichverteilte ZufallszahlenSM1 = z < 0.5 % erzeugt Kodierung mit 0 und 1

b) SM4=randi(2,n,4)oderz=rand(n,4) und weiter wie a)

c) die Outcomes in SM1 bzw SM4 sind nach Variante 1 mit 1 bzw. 2 codiert.zur Ermittlung der Anzahl �Zahl gefallen�bei 4 Wiederholungen ist 0-1-Kodierung mit 1=�Zahlgefallen�vorteilhaftÜberführung in 0-1-Kodierung durch Subtraktion einer Matrix aus nur Einsen, dann ist die An-zahl �Zahl gefallen�, gleich der Zeilensumme der EinträgeSM4_0=SM4-ones(n,4);anz_zahl=sum(SM4_0�);prob_s=sum(anz_zahl >=2)/ngenaues Ergebnis - vgl ÜA 2.Serie: p = 0:6875oderBerechnung der exakten Wahrscheinlichkeit mit Binomialverteilung mit MATLAB:für Zufallsgröße X : Anzahl Zahl bei 4 Versuchen gilt X~Bin(n = 4; p = 0:5)P (X � 2) = P (X = 2)+P (X = 3)+P (X = 4) = binopdf(2,4,0.5)+binopdf(3,4,0.5)+binopdf(4,4,0.5)

6. Simulieren Sie einen Münzwurf

a) mit einer unsymmetrischen Münze, bei der Zahl mit Wahrscheinlichkeit 0.3 fällt, n = 100=1000=10000=100000Wiederholungen

b) mit 4 solchen unsymmetrischen Münzen, n = 100=1000=10000=100000 Wiederholungen

c) Wie großist die geschätzte Wahrscheinlichkeit, dass nun bei 4 Würfen mindestens 2x Zahl fällt?Anleitung

a) z=rand(n,1)x = z < 0.3

b) z=rand(n,4)x = z < 0.3anz_zahl=sum(x�);prob_s=sum(anz_zahl >=2)/n

c) wie. b)genaues Ergebnis p = 0:3483oderBerechnung der exakten Wahrscheinlichkeit mit Binomialverteilung mit MATLAB:P (X � 2) = binopdf(2,4,0.3)+binopdf(3,4,0.3)+binopdf(4,4,0.3)

7. Simulieren Sie das Würfeln mit 3 Würfeln.

a) Bestimmen Sie die Verteilung der Summe der Augenzahlen.

b) Mit welcher Wahrscheinlichkeit ist die Summe der von den 3 Würfeln gezeigten Augenzahlen größerals 4?Anleitung

2

a) bei n Wiederholungenw =randi(6,n,3); % pro Zeile 3 Würfelergebnisses=sum(w�); % jeweilige Summe der 3 Würfelergebnissess=[3:18]; % mögliche Werte für die Summe[ps,vs]=hist(s,ss)bar(ss,ps)Vergleich mit theoretischer Verteilung der Summe pk = h(k)=63

k 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18h(k) 1 3 6 10 15 21 25 27 27 25 21 15 10 6 3 1Berechnung der theoretischen Verteilung in MATLAB als Faltung der Gleichverteilung auf f1; :::; 6gu = 1=6 � ones(6; 1) :u2=conv(u,u)u3=conv(u2,u)

b) prob_summe=sum((s>4))/nzum Vergleich exakte WahrscheinlichkeitP (X > 4) = 1� P (X � 4) = 1� P (X = 3)� P (X = 4) = 1� 1=63 � 3=63 = 0:9815

8. Berechnen Sie die Ausfallwahrscheinlichkeit folgender Schaltung,wenn die einzelnen Komponenten un-abhängig voneinander ausfallen mit den Wahrscheinlichkeiten�E1 �E2 �E3 �E4 �E5 �E60.1 0.1 0.3 0.1 0.3 0.1

a) Lösen Sie die Aufgabe durch Simulation.

b) Wiederholen Sie die Simulationen mit gleicher Anzahl von Zufallszahlen zum Abschätzen der Sta-bilität des Ergebnisses.AnleitungZustände mit gegebenen Ausfallwahrscheinlichkeiten analogAufgabe 7Verknüpfung gemäßSchaltung durch Multiplikation bzw. max/min

a) M=100000;abs_h=0;for i=1:Me1 = rand <0.9; % E1 funktioniert mit Wkt. 0.9e2 = rand <0.9;e3 = rand <0.7;e4 = rand <0.9;e5 = rand <0.7;e6 = rand <0.9;

s1=max(max(e2,e3),e4);s2=max(e5,e6);s=min(min(e1,s1),s2); % Schaltung funktioniertabs_h=abs_h+s; % absolute Häuf. funktionierender Schaltungenendwork_p=abs_h/Mfail_p=1-work_poder alles ohne Schleife

3

z=rand(n,6)e1 = z(:,1) < 0.3...

b) analog a)

9. Es wird erwartet, dass ein neues Medikament in 1% aller Fälle eine bestimmte Nebenwirkung verur-sacht. (vgl. Übungsserie 2)Wie viele Probanden müssten in einer Studie mindestens erfasst werden, um diese Nebenwirkung mitSicherheit von 95% mindestens zweimal zu beobachten? Lösen Sie diese Aufgabe mit MATLAB.gesucht ist also n : P (X � 2) = 1 � P (X = 0) � P (X = 1) = 1 �

�n0

�0:0100:99n �

�n1

�0:0110:99n�1 =

0:95!0:99n � n � 0:01 � 0:99n�1 = 0:05n als Lösung dieser Gleichung mit MATLABAnleitungn=1:1000;x=.05-.99.^n-n.*0.01.*.99.^(n-1);plot(n,x)grid on

ind=�nd(x>0,1,��rst�)

oderf = @(n).05-.99.^n-n.*0.01.*.99.^(n-1);z = fzero(f,300)

10. Ein Student benötigt für die Konstruktion eines Schaltkreises 12 Chips einer bestimmten Sorte. Erkann sie bei einem Hersteller kostengünstig bestellen, allerdings produziert dieser Hersteller mit 4%Ausschuss. Wie viele Chips sollte er bestellen, um mit Sicherheit 0.99 über genügend intakte Chips zuverfügen?Anleitungbei n bestellten ist die AnzahlX von intakten Chips dieses Herstellers binomialverteilt mitX~Bin(n; p =0:96)es soll gelten: P (X � 12) � 0:99!P (X � 12) = P (X = 12) + :::+ P (X = n) = binopdf(12; n; 0:96) + :::+ binopdf(n; n; 0:96)mit n = 13=14=15=16=::: ausprobieren, wann die Summe erstmalig > 0:99 ist

11. An einem Server gehen Anfragen von 3 Zwischenstellen ein, die unabhängig voneinander als poisson-verteilt mit den Parametern �1 = 3; �2 = 3:5; �3 = 5 pro Minute verteilt sind.Berechnen Sie die Verteilung der insgesamt eingehenden Anfragen pro Minute sowie die Wahrschein-lichkeit dafür, dass mehr als 15 Anfragen pro Minute eingehen.AnleitungAnzahl Anfragen an Zwischenstellen:Xi~Pois(�i); i = 1; 2; 3Verteilung der insgesamt eingehenden Anfragen pro Minute am Server (Faltung von unabhängigenPoissonverteilungen) S = X1 +X2 +X3 ist S~Pois(�1 + �2 + �3); �1 + �2 + �3 = 11:5P (S > 15) = 1 � P (S � 15) = 1 � (P (S = 0) + ::: + P (S = 15)) = 1 � (poisspdf(0; 11:5) + ::: +poisspdf(15; 11:5))

12. Die Wärmeerzeugung an einem Widerstand (in Joule) sei normalverteilt mit N (77, 11,62 ).

a) Mit welcher Wahrscheinlichkeit liegt die erzeugte Wärme unter 60 ?

b) Mit welcher Wahrscheinlichkeit liegt sie über 90?

c) Mit welcher Wahrscheinlichkeit liegt sie zwischen 60 und 90 ?AnleitungX~N(�; �2);dann ist P (a < X < b) = normcdf(b; �; �)� normcdf(a; �; �)

13. Zwei Ohmsche Widerstände R1 und R2 werden hintereinander geschaltet. Sie seien unabhängig undnormalverteilt mit �1 = 500; �1 = 10 bzw. �2 = 200; �2 = 4 (alles in ):In welchen Grenzen

4

(700� "; 700 + ") liegt mit Sicherheit 0.99 der Gesamtwiderstand R1 +R2?AnleitungVerteilung von R1 +R2 nach Additionssatz: R1 +R2~N(700; 116)0:99 = P (700� " < X < 700 + ") = �( "p

116)� �(� "p

116) = 2�( "p

116)� 1

1:992 = �( "p

116)! "p

116= norminv (0:995; 0; 1)! " =

p116�norminv (0:995; 0; 1)

14. Die Zeit (in h) zwischen dem Eintre¤en zweier Telefonanrufe an einem Anschluss sei exponential verteiltmit dem Parameter � = 0:5.

a) Wieviel Zeit vergeht im Mittel zwischen dem Eintre¤en von 2 Anrufen?

b) Mit welcher Wahrscheinlichkeit tri¤t länger als eine Stunde kein Anruf ein?Anleitung

a) X Dauer zwischen zwei Anrufen, X~ exp(� = 0:5)Erwartungswert ist EX = 1

� =10:5 = 2

b) Parameter der Exponentialverteilung in MATLAB ist der Erwartungswert, also lambda = 2P (X > 1) = 1� P (X � 1) = 1� expcdf (1; 2)

15. Die zufällige LebensdauerX (in h) eines Gerätetyps mit Verschleißerscheinung kann durch eine Weibull-Verteilung mit der Dichte

f(x) =

8<:0 x � 0

5

a

�xa

�4e��xa

�5x > 0

beschrieben werden. Es sei bekannt, dass nach 400 h Betriebs-

dauer 95% der Geräte ausgefallen sind.

a) Bestimmen Sie den Parameter a und geben Sie die Verteilungsfunktion an.

b) Wie großist die Wahrscheinlichkeit, dass ein Gerät länger als 300 Stunden arbeitet?

c) Wie großist die Wahrscheinlichkeit, dass ein Gerät länger als 300 Stunden arbeitet, wenn seineLebensdauer bereits 200 Stunden überschritten hat?Anleitung

a) Dichte der zweiparametrigen Weibull-Verteilung

f(x) =

8<:0 x � 0

b

a

�xa

�b�1e��xa

�bx > 0

; somit ist b = 5

Verteilungsfunktion F (x) = 1� e��xa

�b= 1� e

��xa

�5Berechnung von a ausP (X < 400) = F (400) = 0:95

1� e� 400

a

!5

= 0:95

0:05 = e� 400

a

!5

� ln 0:05 =�400

a

�5! a =

400

(� ln 0:05)1=5= 321:19

a = 321:19

F (x) = 1� e�� x

321:19

�5

b) P (X > 300) = 1� P (X � 300) = 1�

0B@1� e� 300

321:19

!51CA = e

� 300

321:19

!5

= 0:491 21

MATLAB: P (X > 300) = 1� wblcdf (300; 321:19; 5)

5

c) P (X > 300=X > 200) =P (X > 300 \X > 200)

P (X > 200)=P (X > 300)

P (X > 200)

=

1�

0B@1� e� 300

321:19

!51CA

1�

0B@1� e� 200

321:19

!51CA=e��

300321:19

�5e��

200321:19

�5 = 0:539 42

MATLAB: P (X > 300=X > 200) =1� wblcdf (300; 321:19; 5)1� wblcdf (200; 321:19; 5)

6

Praktikum 3

Parameterschätzungen und Konfidenzintervalle für Normalverteilung

[m, s, mci, sci] = normfit(data)

data enthält die Stichprobenwerte (Zeilen- oder Spaltenvektor)

bei von 0.05 abweichendem Risiko: [m, s, mci, sci] = normfit(data,alpha)

Parameterschätzungen und Konfidenzintervalle (95%) für andere Verteilungen

[par, ki] = mle(data, ‘distribution‘, dist)

dabei wird dist durch einen String der Bezeichnung der speziellen Verteilung ersetzt, z.B.

‘exponential‘

‘poisson‘

‘binomial‘

‘weibull‘

‘uniform‘

‘normal‘

dabei ist bei Binomialverteilung die zusätzliche Angabe der Gesamtzahl der Versuche ‘ntrials‘,n- und

bei Poissonverteilung die zusätzliche Angabe einer Häufigkeitsvariablen ‘frequency‘, freq erforderlich

bei von 0.05 abweichendem Risiko: ‘alpha‘, alpha

Tests für die Parameter der Normalverteilung

Einstichprobentests für Erwartungswert

Nullhypothese: = m gegen H1: ≠ m, m vorgegebener Referenzwert für den Erwartungswert

Falls σ2 bekannt ist: Gauß-Test [h p ci stats]=ztest(x,m,sigma)

sigma ist die bekannte Standardabweichung

Falls σ2 geschätzt wird: T-Test [h p ci stats]=ttest(x,m)

die Parameterliste kann erweitert werden bei von 0.05 abweichendem Risiko: ‘Alpha‘, alpha

einseitiger Test H0: <= m gegen H1: > m durch ‘tail‘,right‘

einseitiger Test H0: >= m gegen H1: < m durch ‘tail‘,left‘

z.B. [h p ci stats]=ttest(x,m,‘alpha‘,0.01,‘tail‘,'right')

In der Ausgabe steht h = 1 für Ablehnung der Nullhypothese,

der p-Wert gibt die Überschreitungswahrscheinlichkeit an: Ablehnung von H0 bei p < alpha

Einstichprobentest für Varianz σ2,

Nullhypothese: σ2 = v , v vorgegebener Referenzwert für die Varianz

[h p ci stats]=vartest(x,v)

Zweistichprobentests bei Normalverteilung für Vergleich der Erwartungswerte 1 , 2 aus zwei

Grundgesamtheiten

Nullhypothese: 1 = 2,

Falls gepaarte Daten vorliegen, wendet man den T-Test auf die Differenzen der Datenpaare an.

Falls Daten nicht gepaart und die

Varianzen gleich sind: Doppelter T-Test [h p ci stats]=ttest2(x1,x2)

Falls Daten nicht gepaart und die

Varianzen ungleich sind: Doppelter T-Test [h p ci stats]=ttest2(x1,x2, 'vartype‘,'unequal‘)

die Parameterliste kann erweitert werden bei von 0.05 abweichendem Risiko: ‘Alpha‘, alpha

einseitiger Test H0: 1 <= 2 gegen H1: 1 > 2durch ‘tail‘,right‘

einseitiger Test H0: 1 >= 2gegen H1: 1 < 2 durch ‘tail‘,left‘

z.B. [h p ci stats]=ttest2(x1,x2,‘alpha‘,0.01,‘tail‘,'right')

Zweistichprobentest für Vergleich der Varianzen 2 2

1 2,

Nullhypothese: 2 2

1 2 [h p ci stats]=vartest2(x1,x2)

Verteilungstests auf Normalverteilung

Chi-Quadrat-Test auf Normalverteilung [h p]=chi2gof(data)

Lilliefors-Test auf NV [h p]=lillietest(x)

Stochastik f�ur ETSS [email protected]

3. Praktikum: Punktschätzungen, Kon�denzintervalle, Hypothesentests

1. Schätzen Sie die Parameter �; �2 der Normalverteilung, der folgende Beobachtungen entstammen12.2 15.8 13.6 12.9 14.2 12.5 11.2 10.9 12.7 13.1 11.0 12.6 12.5 13.0 12.9Anleitung[mu,sigma]=norm�t(data)oder mit Kon�denzintervall[mu,sigma,ci_mu,ci_sigma]=norm�t(data)oder mit Kon�denzintervall nach Maximum-Likelihood[par, par_ci]=mle(data)

2. Bei 25 zufällig ausgewählten Kindern zwischen 6 und 10 Jahren wurde ermittelt, wieviel Zeit sie täglichvor dem Fernseher verbringen (in min)0 10 25 30 40 55 60 60 60 65 65 70 70 75 75 80 80 85 90 95100 120 140 145 180

a) Geben Sie unter der Annahme der Normalverteilung ein 95%-Kon�denzintervall für die im Durch-schnitt zu erwartende tägliche Fernsehzeit an.

b) Testen Sie, ob die durchschnittliche tägliche Fernsehzeit bei 1.5 h liegt (Sicherheit 0.95). VergleichenSie das Testergebnis mit dem Kon�denzintervall.

c) Testen Sie, ob die durchschnittliche tägliche Fernsehzeit 1.5 h übersteigt (Sicherheit 0.95). Verglei-chen Sie das Testergebnis mit dem Kon�denzintervall.Achtung: Nullhypothese wird als Gegenteil gewählt, � < 90. Bei Ablehnung hat man mit 0.95Sicherheit das Überschreiten bestätigt.

d) Testen Sie, ob die Daten als normalverteilt angenommen werden können.Anleitung

a) wie Aufgabe 1

b) t-Test für eine Stichprobe auf Erwartungswert m (mit Ausgabe von p-Wert, Kon�denzintervall undder Testgröße)[h p ci stats]=ttest(data,m) mit m = 90Ablehnung der Nullhypothese bei h = 1

c) [h p ci stats]=ttest(x,m,�Tail�,�left�)

d) [h p]=chi2gof(data)oder (besser)[h p]=lillietest(x)

3. Die Messung des Bleigehalts von 40 Proben ergab folgende Werte (in%)17.3 13.8 18.7 16.4 12.9 15.3 19.3 14.1 16.6 18.518.4 14.9 16.5 16.7 10.3 17.5 21.4 16.8 16.3 14.915.9 15.1 20.5 16.8 17.4 15.3 16.5 15.5 14.5 15.515.3 17.5 17.1 15.5 14.8 14.3 17.0 16.2 15.4 16.2Bestimmen Sie ein zweiseitiges sowie ein einseitiges, nach oben o¤enes Kon�denzintervall zum Niveau99% für den mittleren Bleigehalt.Anleitungwie Aufgabe 1einseitiges KI über ttest wie Aufgabe 2.b)

1

4. Bei einer Landtagswahl wurden nach Auszählung von 5000 Stimmzetteln 750 für die Partei A regis-triert. Schätzen Sie den prozentualen Anteil p für diese Partei und geben Sie für p ein approximativesKon�denzintervall zur Sicherheit 0.99 an.Anleitungdata=750;[par,ci]=mle(data,�distribution�,�binomial�,�alpha�,0.01,�ntrials�,5000)

5. Bei der Erprobung eines bestimmten Autoteils wurden 20 Teile unter Bedingungen getestet, die etwa150000 km Fahrstrecke entsprechen. Dabei ist keines der Teile ausgefallen. Kann man daraus mit95%iger Sicherheit schließen, dass auch im Serieneinsatz keins ausfällt?AnleitungKI zu Fuß, vgl Übung

6. Die Anzahl emitierter Teilchen beim radioaktiven Zerfall kann durch eine Poissonverteilung beschriebenwerden.

X 0 1 2 3 4 5 6 7 8 9 10 11 � 12Häu�gkeit 57 203 383 525 532 408 273 139 45 27 10 4 0

a) Bestimmen Sie nach der Maximum-Likelihood-Methode eine Schätzung für die mittlere Anzahlemitierter Teilchen

b) Berechnen Sie ein 95%- Kon�denzintervall für mittlere Anzahl der emitierter Teilchen.Anleitungdata=[0 1 2 3 4 5 6 7 8 9 10 11]freq=[57 203 383 525 532 408 273 139 45 27 10 4][par,ci]=mle(data,�distribution�,�poisson�,�alpha�,0.05,�frequency�,freq)

7. Die Lebensdauer (in Stunden) der bei einem bestimmten Hersteller produzierten Sorte eines Bauteilesei unabhängig und exponentialverteilt.106 102 130 114 105 114 103 129 107 110Ermitteln Sie ein 95%-KI für die mittlere Lebensdauer des Bauteils.

a) Bestimmen Sie nach der Maximum-Likelihood-Methode eine Schätzung für die mittlere Lebensdauerder Bauteile.

b) Berechnen Sie ein 95%- Kon�denzintervall für die mittlere Lebensdauer.Anleitungdata=[106 102 130 114 105 114 103 129 107 110][par,ci]=mle(data,�distribution�,�exponential�)

8. Testen Sie, ob die Daten aus Aufgabe 3 einer Normalverteilung entstammen.Anleitungwie 2d)

9. Testen Sie anhand der Daten aus Aufgabe 3, ob der mittlere Bleigehalt aller Proben mit Sicherheit0.95 kleiner als 16% ist.Anleitungwie 2c) aber andere Richtung des einseitigen Tests

10. Die ersten 20 Proben aus Aufgabe 3 entstammen einer anderen Lagerstätte als die letzten 20 Proben.

a) Testen Sie, ob die Varianzen der Proben beider Lagerstätten übereinstimmen ( Sicherheit 0.95).b) Testen Sie, ob die Lagerstätten einen gleichen mittleren Bleigehalt haben ( Sicherheit 0.95).

Anleitunga) data1 und data2 erzeugen

[h p ci stats]=vartest2(data1,data2)

b) in Abhängigkeit vom Testergebnis aus a)bei gleichen Varianzen: [h p ci stats]=ttest2(data1,data2)bei ungleichen Varianzen: [h p ci stats]=ttest2(data1,data2,�Vartype�,�unequal�)

2