39
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 13 oktober 2008 Catherine De Clercq

Meten en experimenteren

  • Upload
    ifama

  • View
    63

  • Download
    0

Embed Size (px)

DESCRIPTION

Meten en experimenteren. Statistische verwerking van gegevens Een korte inleiding. 13 oktober 2008 Catherine De Clercq. Statistische verwerking van gegevens. Kursus statistiek voor fysici door Jorgen D’Hondt in 2de semester - PowerPoint PPT Presentation

Citation preview

Page 1: Meten en experimenteren

Meten en experimenteren

Statistische verwerking van gegevensEen korte inleiding

13 oktober 2008Catherine De Clercq

Page 2: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p2

Statistische verwerking van gegevens

• Kursus statistiek voor fysici door Jorgen D’Hondt in 2de semester• In deze les wordt een samenvatting gegeven van de formules

nodig in het practicum fysica

• Deel I:

• Deel II:

• Deel III:

• Deel IV:

•Toevallige veranderlijken, Steekproef•Beschrijving van gegevens, Histogram•Gemiddelde en standaarddeviatie•Normale of gaussische verdeling •Fouten en onzekerheden

•Herhaalde metingen: gemiddelde en variantie•Bewerkingen met stochastische veranderlijken•Voortplanten van statistische onzekerheden

•Bepalen van de beste rechte door de metingen•Methode van de kleinste kwadraten•Niet lineaire problemen

•Presentatie van resultaten•Aantal beduidende cijfers, Afronden van getalwaarden•Grafieken, tabellen, eenheden etc

Page 3: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p3

Deel I

• Toevallige of stochastische veranderlijken• Steekproef• Beschrijving van gegevens• Histogram• Gemiddelde en standaarddeviatie• Normale verdeling • Fouten en onzekerheden

Page 4: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p4

Toevallige veranderlijken

• experiment = meting van een bepaalde grootheid x uitgevoerd met een bepaald instrument volgens een bepaalde procedure

• Een experiment wordt meestal beïnvloed door verschillende factoren: vb bepaling verbruik van een auto, meten valversnelling

• Het resultaat van een experiment is nooit exact reproduceerbaar

• De verschillende waarnemingen of resultaten van een experiment vertonen een spreiding

• Men noemt de grootheid x (het resultaat van het experiment) een toevallige of stochastische veranderlijke

Page 5: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p5

Keuze van de steekproef

• Men wil meestal uit het experiment een fysische grootheid bepalen, bvb de valversnelling

• Elk experiment wordt beïnvloed door verschillende willekeurige factoren

• Het is dus best om een groot aantal experimenten uit te voeren, at random (willekeurig) gekozen

• Dit is een steekproef waaruit men conclusies wenst te trekken over de fysische grootheid

• Men bekomt een verzameling gegevens {x1,x2,x3,…xn}

Page 6: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p6

Beschrijving van gegevens

• Na het uitvoeren van n experimenten beschikt men over een verzameling gegevens {x1,x2,x3,…xn}

• Men kan deze verzameling beschrijven met behulp van de volgende empirische grootheden :

• Het aantal gegevens• Het steekproefgemiddelde: maat voor de locatie van de

gegevens• De steekproefvariantie en de -standaarddeviatie: maat

voor de spreiding van de gegevens

• De gegevens worden vaak voorgesteld in een histogram

Page 7: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p7

Histogram

• De gegevens worden ingedeeld in klassen• Het histogram geeft een eerste informatie over

structuren (pieken, uniform ..) in de verdeling van gemeten grootheid

• De keuze van de breedte van de klassen hangt af van de nauwkeurigheid waarmee men de grootheid gemeten heeft, van het aantal gegevens …

• Voorbeelden :– Men meet de lengte van een balk van 200mm met een lat met

onderverdelingen van 1mm – Men meet de lengte van 1100 willekeurig gekozen mannen in

Brussel

Page 8: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p8

100 metingen lengte balk – 1mm lat

in 10 klassen van elk 1mm breed in 4 klassen van elk 2,5mm breed

Het histogram met 10 klassen geeft meer informatie over de structuur van de steekproef dan het histogram met 4

klassen.

Page 9: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p9

Lengte 1100 mannenIn 10 klassen van

6cmIn 300 klassen van

0,2cmIn 60 klassen van

1cm

Het histogram met 60 klassen geeft voldoende informatie over de structuur van de steekproef en er zijn voldoende elementen in elke klasse.

Het histogram met 10 klassen geeft te weinig informatie over de structuur.In het histogram met 300 klassen zijn er in sommige klassen te weinig

elementen.

Page 10: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p10

Aantal generaties materiedeeltjes

Page 11: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p11

Gemiddelde en standaarddeviatie

• Een steekproef met n gegevens wordt gekarakteriseerd door de volgende grootheden:

• Rekenkundig gemiddelde

• Variantie

• Standaardafwijking of standaarddeviatie = s

1

1 n

ii

x xn

22

1

1

1

n

ii

s x xn

Page 12: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p12

Gemiddelde en standaarddeviatie• 100 metingen van de lengte van

een balk van 200mm met een lat met 1mm onderverdelingen

• Gemiddelde waarde = 200mm• Standaarddeviatie = 1mm

Page 13: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p13

Indien de steekproef oneindig groot wordt dan volgt de verdeling van de gemeten grootheid een normale of gaussische verdeling (centrale limietstelling) met

–gemiddelde waarde μ –standaardafwijking σ–Variantie σ2 –Waarschijnlijkheidsverdeling f(x)

Normale of gaussische verdeling

2-

-221

2

x

f x e

Grootheid x

freq

uent

ie

[0;0,45]

[2;0,7]

[0;1]

[0;2,24]

Page 14: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p14

Normale of gaussische verdeling• 68% van de metingen ligt in

het interval [µ-σ, µ+σ]• 95% van de metingen ligt in

het interval [µ-2σ, µ+2σ]• 99,7% van de metingen ligt in

het interval [µ-3σ, µ+3σ]

22

1

2--

221

2

1lim

N

iN

i

x

f x e

xN

Page 15: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p15

Normale verdeling en steekproef

• Steekproef is nooit oneindig groot• Men benadert

– Gemiddelde μ door rekenkundig gemiddelde x– variantie σ2 door steekproefvariantie s2

• Centrale limietstelling: theorie van de onzekerheden (foutentheorie) mag gebaseerd worden op een normale verdeling

• Standaardafwijking σ = statistische onzekerheid op één meting van de grootheid

• Voorbeeld : meting lengte balk – 100 of 10000 metingen

Page 16: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p16

100 en 10000 metingen lengte balk • 100 metingen met

statistische onzekerheid van 1mm

• 10000 metingen + normale verdeling

Het histogram met 10000 metingen benadert goed een normale verdeling

Page 17: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p17

Fouten en onzekerheden

• Statistische onzekerheden – Te wijten aan toevallige fluctuaties in de metingen– De onzekerheid op de conclusie uit de metingen verkleint

wanneer men beschikt over een grotere steekproef– Men spreekt vaak van statistische ‘fout’

• Blunders = fouten die niet ingeschat kunnen worden

• Systematische fouten– Reproduceerbare fouten te wijten aan slecht afgesteld

apparaat– Bvb amperemeter meet systematisch te hoge stroom– De metingen herhalen geeft geen betere nauwkeurigheid en

geeft niet meer zekerheid over de conclusies uit de proef

Page 18: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p18

Deel II

• Herhaalde metingen: gemiddelde en variantie• Bewerkingen met stochastische veranderlijken• Voorplanten van statistische onzekerheden

Page 19: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p19

Een enkele meting

• Elk meetinstrument laat toe metingen uit te voeren met een bepaalde onzekerheid

• Bvb weegschaal meet op 0,01g nauwkeurig• Bvb lat meet op 1mm nauwkeurig• …• Voor de meetapparaten die in het practicum gebruikt

zullen worden wordt de nauwkeurigheid gegeven in de syllabus of op het apparaat zelf

• Notatie:

bvb 50,00 0,01i ix s

m g

Page 20: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p20

Herhaalde metingen – gewogen gemiddelde

• De metingen herhalen levert een resultaat met een kleinere onzekerheid

• Wanneer men N metingen uitvoert van een grootheid x, elk men een bepaalde onzekerheid si

• Dan zijn het gewogen gemiddelde en zijn variantie

; 1,i ix s i N

212

1 1

1 1 en = met gewichten

N

i ii

iN Ni

i ii i

x

w xx s w

sw w

Page 21: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p21

Herhaalde metingen met zelfde onzekerheid

• Indien alle metingen dezelfde onzekerheid s bezitten (of hetzelfde gewicht) dan worden het gemiddelde en zijn onzekerheid

• Bvb 100 metingen van 200mm lange balk met lat met 1mm nauwkeurigheid geven:– Elke meting : onzekerheid s = 1mm

– Gemiddelde : onzekerheid sx = 1mm/√100 = 1mm/10

22

1

1 N

i xi

sx x s

N N

Page 22: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p22

Bewerkingen met toevallige variabelen

• De metingen uitgevoerd in een of meerdere experimenten zijn zelden zelf het eindresultaat waarin men geïnteresseerd is

• Eenvoudig geval: ik bepaal mijn gewicht door elke ochtend op de weegschaal te staan

• De proeven uitgevoerd in de fysica bestaan meestal uit metingen van verschillende grootheden, elk met een statistische onzekerheid

• Bewerkingen met die metingen leiden tot het eindresultaat

Page 23: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p23

Voorbeeld: bepaling valversnelling

• bepaling valversnelling g: laat een kogel vanop een hoogte vallen en meet de tijd tot die de grond raakt

• Metingen van hoogte y en tijd t, elk met een statistische onzekerheid

• Valbeweging

• De valversnelling g wordt

• Vraag: welke is de onzekerheid op g?

20 0 0 0

1 met 0 en 0

2y y v t gt y v

2

2yg

t

Page 24: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p24

Voorplanten van onzekerheden 1• Voor een groot aantal metingen van een stochastische

variabele heeft deze variabele een normale verdeling• de onzekerheid op één enkele meting gelijk is aan de

standaarddeviatie van de normale verdeling

• Voor een variabele z=f(u,v), een functie van 2 variabelen (bvb hoogte en tijd bij valversnelling), geldt

• Vraag is

( )22

1

1lim

N

iN ix x

Ns

®¥ == -å

( )22

1

1lim

N

z iN iz z

Ns

®¥ == -å( , )i i iz f u v

?( , )?z f u v

Page 25: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p25

Voorplanten van onzekerheden 2

• De vraag is nu

• Voor een lineair verband geldt deze relatie altijd• Voor een niet-linear verband geldt deze relatie bij

benadering. De functie f(u,v) wordt rond het gemiddelde gelineariseerd

• Dit geschiedt door een ontwikkeling in Taylorreeks rond het punt (u,v)

• Termen van 2de en hogere orde worden verwaarloosd

( , )?z f u v

, ,

( , ) ( , ) ( ) ( ) ...u v u v

f ff u v f u v u u v v

u v

Page 26: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p26

Voortplanten van onzekerheden 3

• De variantie op z wordt

2

22

, ,

( ) , , ( ) ( )i i i i iu v u v

f fz z f u v f u v u u v v

u v

2

2, ,

1

2 2 2 2

1 1

1

1lim ( ) ( )

1 1lim ( ) ( ) lim ( ) ( )

12 lim ( )( )

N

z i u v i u vN

i

N N

i iN N

i i

N

i iN

i

f fu u v v

N u v

f fu u v v

N u N v

f fu u v v

N u v

Page 27: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p27

Voortplanten van onzekerheden 4

• De covariantie σuv is nul voor niet gecorreleerde veranderlijken, wat in alle practica het geval is

• Voorbeeld: men bepaalt de snelheid van een auto uit de metingen van afstand x en tijd t

• Voor de steekproefvariantie geldt

2 2 2 2 2( ) ( ) 2z u v uv

f f f f

u v u v

2 2 2 2 2( ) ( )v x t

xv tv v

x t

2vv v resultaat

, ,x x t t v vs s s

Page 28: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p28

Deel III

• Bepalen van de beste rechte door de metingen• Methode van de kleinste kwadraten• Niet lineaire problemen

Page 29: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p29

Een lineaire fysische wet

• Voorbeeld : bepaling veerconstante• Een veer wordt opgehangen aan een punt – men

hangt achtereenvolgens verschillende massa’s onderaan de veer – dit veroorzaakt een elongatie van de veer – men meet de positie x van het onderste punt van de veer als functie van de massa m

elongatie vd veer ifv massa

05

1015202530

0 100 200 300 400 500

massa(g)

po

sit

ie(c

m)

Blauw = MeetpuntenAlle posities zijn gemeten met dezelfde onzekerheid

Page 30: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p30

Bepalen van de beste rechte - voorbeeld• Fysische wet

• vraag: wat is de veerconstante k voor deze veer?• Of: welke is de beste schatting van k uit deze

metingen?• de beste schatting van k geeft de beste rechte door

de meetpunten (m,x)• Hoe bepaalt men de beste rechte door de

meetpunten? Met de methode van de kleinste kwadraten.

elongatie vd veer ifv massa

05

1015202530

0 100 200 300 400 500

massa(g)

po

sit

ie x

(cm

)

0 0 of

veerconstante

g=valversnelling

k x x mg

x mk

g

k

x

x

Page 31: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p31

Methode van de kleinste kwadraten 1

• Uit N metingen {xi,yiσi} schat men de beste rechte y=ax+b

• de beste schatting wordt bekomen door minimisatie van de χ2

• Vb verloop van χ2 als functie van parameter a(rico) voor proef ‘veer’

2 22

1

1( )

N

i ii i

y ax b

0

5

10

15

20

25

30

-4 -3 -2 -1 0 1 2 3 4 5 6

rico a

ch

i2

a

χ2minimum

Page 32: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p32

Methode van de kleinste kwadraten 2

• Het minimum van de χ2 functie wordt bekomen door partieel af te leiden naar de parameters a en b

• Algemene oplossing: zie cursus statistiek

• Indien alle metingen yi dezelfde onzekerheid σy bezitten bekomt men een eenvoudig stelsel van 2 vergelijkingen en 2 onbekenden– Oplossing van het stelsel:1. Eerst 2de vergelijking oplossen naar b2. Deze oplossing substitueren in 1ste vergelijking – geeft a3. Dit invullen in oplossing voor b bekomen in stap 1.

2 2

0, 0a b

Parameters a,bvan beste rechte

Page 33: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p33

Oplossen van stelsel naar a en b

2

2

1 1

1 1 1

2

1 1 1 1

stel

1

1

N N

i ii i

N N N

i i i ii i i

N N N N

i i i i ii i i i

N x x

a N x y x y

b x y x x y

Alle metingen hebben dezelfde

onzekerheid y

Page 34: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p34

Schatting van onzekerheden op a,b

• Voortplanten van onzekerheden op yi naar a,b

• In de praktijk is de onzekerheid σy vaak niet gekend en kan berekend worden uit

2

2 2

1

2

2 2

1

N

a ii i

N

b ii i

a

y

b

y

22

22 2

1

ya

Ny

b ii

N

x

i y i

2 2 2

1

1( )

2

N

y y i ii

s y ax bN

Page 35: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p35

Indien de fysische wet geen rechte volgt

• De methode van de kleinste kwadraten is steeds geldig. Men berekent de χ2 en leidt af naar de parameters om het minimum te vinden – zie cursus statistiek en Mathematica

• Bvb voor valbeweging

• Men kan het probleem lineariseren • Bvb valbeweging: indien men t2 ipv t als ‘x’ variabele

gebruikt bekomt men een rechte waarvan de richtingscoëfficient = g

21

2y gt

2 2 22

1

1 1( )

2

N

i ii i

y gt

Page 36: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p36

Deel IV

• Presentatie van resultaten• Aantal beduidende cijfers• Afronden van getalwaarden• Grafieken, tabellen, eenheden etc

Page 37: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p37

Aantal beduidende cijfers

• Meest LINKSE cijfer ( 0) is meest beduidende cijfer

• Geen decimaal punt : minst beduidende cijfer is meest RECHTSE cijfer ( 0)

• Wel decimaal punt : : minst beduidende cijfer is meest RECHTSE cijfer, ook al is dit 0

• Aantal beduidende cijfers = aantal tussen meest en minst beduidende cijfers– 5280 : 3 beduidende cijfers– 5280, : 4 beduidende cijfers– 0,0094 : 2 beduidende cijfers– 3,010 x 104 : 4 beduidende cijfers

Page 38: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p38

Afronden van getalwaarden

• Resultaat van de proef: hoeveel beduidende cijfers moet men geven?

• Men rond eerst de onzekerheid op het resultaat (de ‘fout’) af tot 2 of 3 beduidende cijfers

• Men kiest de meest aangepaste eenheden, bvb keuze tussen 1,0mm (3 bed cijfers) 0,1cm (1 bed cijfer)

• Dan rond men het resultaat zelf af tot hetzelfde aantal decimalen als de ‘fout’

Page 39: Meten en experimenteren

Meten en Experimenteren2008-2009

Verwerking van gegevens p39

Grafieken, tabellen, eenheden

• Tabellen en grafieken geven een duidelijk overzicht van de metingen – gebruik ze!

• Grafiek: geef assen een naam en eenheden• Kies de schaal zodanig dat de gegevens over het

gehele gebied verspreid zijn• Geef duidelijk de schalen aan van de assen

• Tabel: zet bovenaan de naam van de grootheid en de eenheden

• Vergeet eenheden niet bij het geven van resultaten van metingen en berekeningen

• Zet titels boven grafieken en tabellen