52
Medicinsk statistik I Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus

Medicinsk statistik I

  • Upload
    sine

  • View
    78

  • Download
    1

Embed Size (px)

DESCRIPTION

Medicinsk statistik I. Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus. Medicinsk statistik. Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Framtida arbete Kunna tolka resultat från andra studier Analysera data - PowerPoint PPT Presentation

Citation preview

Page 1: Medicinsk statistik I

Medicinsk statistik ILäkarprogrammet

T5HT 2013

Susann UllénFoU-centrum Skåne

Skånes Universitetssjukhus

Page 2: Medicinsk statistik I

Medicinsk statistik

Varför behöver Ni kunskap i medicinsk statistik?

• Självständigt arbete

• Framtida arbete

• Kunna tolka resultat från andra studier

• Analysera data

• Presentera resultat

• …

Page 3: Medicinsk statistik I

Medicinsk statistikLITTERATURTIPS

Jonas Björk”Praktisk statistik för medicin och hälsa”

Page 4: Medicinsk statistik I

Målpopulation

Stickprov Stickprov

Analys

Analytisk statistik

Beskrivning

Deskriptiv statistik

Datainsamling

Slutsats

Page 5: Medicinsk statistik I

Vilka personer gäller resultatet för?

• Gruppen personer som man vill kunna dra slutsatser om kallas målpopulation

• Exempel på målpopulationer:– Personer som kommer till akuten med

bröstsmärtor– Barn under 5 år– Rökare– Typ 2-diabetiker

Page 6: Medicinsk statistik I

Systematiska fel - bias

• Kan ge fel tolkning av resultatet• Olika typer av systematiska fel:

– Urvalet inte är representativt för populationen• Icke-slumpmässigt urval• Bortfall

– Felaktigheter i datainsamling• Fel svar från apparatur• Otydligt formulerade enkätfrågor

– Bristande jämförbarhet i de grupper som jämförs• Skillnader i utgångsläge mellan patientgrupper

Page 7: Medicinsk statistik I

Undersökningsupplägg

• Undersökningen påverkar skeendet

– Experiment, tex klinisk prövning

• Undersökningen påverkar inte skeendet– Observationsundersökning

• Tvärsnittsundersökning• Longitudinell undersökning

Page 8: Medicinsk statistik I

Observationsundersökning

• Påverkar inte skeendet utan jämför grupperingar som har uppstått utan påverkan– Rökare jämfört med icke rökare– Boende i stad jämfört med boende på landsbygd– Personer med en viss diagnos jämfört med

personer utan den diagnosen

• Gruppskillnaden behöver inte bero på den faktor vi vill studera

Page 9: Medicinsk statistik I

Experiment - Randomisering

• Slumpvis bestämning av vilka patienter som får vilken av två (eller flera) behandlingar

• Är ofta lämpligt vid kliniska prövningar

• Ger två grupper som är lika vid start-tillfället och eventuella skillnader som uppstår kan antas bero på behandlingseffekten

Page 10: Medicinsk statistik I

Placeboeffekt

• Patientens förväntade effekt av behandlingen• Kan medföra att effekt kan observeras av

verkningslös behandling• Kontrollgrupp kan användas för att skilja på

behandlingseffekt och placeboeffekt• Bäst att låta kontrollgruppen använda

nuvarande behandling, ”gold standard”• Blindning

– Enkelblind– Dubbelblind

Page 11: Medicinsk statistik I

Datatyper

Kontinuerliga data – mäts på en intervallskalaExempel: Vikt, längd, ålder, blodtryck

Diskreta data – data som mäts på en intervallskala men bara kan anta vissa värden Exempel: Antal barn, antal bakterier

Page 12: Medicinsk statistik I

Datatyper

Ordinaldata – klassdata/kategoriindelning med rangordningExempel: klassificering av smärta enligt

låg – måttlig – hög – outhärdlig, 1 – 2 – 3 – 4

• Ej säkert att 2-1 = 3-2

• Ej säkert att 4 är dubbelt så mycket som 2

Nominaldata – klassdata/kategoriindelning utan rangordningExempel: Kön, bostadsort, behandlingsgrupp

Page 13: Medicinsk statistik I

Målpopulation

Stickprov Stickprov

Analys

Analytisk statistik

Beskrivning

Deskriptiv statistik

Datainsamling

Slutsats

Page 14: Medicinsk statistik I

Deskriptiv statistik

Beskrivning av materialet

• Grafiskt

• Figurer

• Numeriskt

• Genomsnittsmått

• Spridningsmått

Page 15: Medicinsk statistik I

GenomsnittsmåttLägesmått, centralmått, tyngdpunkt

Var ligger tyngdpunkten?Hur kan tyngdpunkten anges?

Page 16: Medicinsk statistik I

Genomsnittsmått

• Medelvärde– Summan av observationerna dividerat med antalet

observationer

• Median– Den mittersta observationen om observationerna

sorteras i storleksordning

Page 17: Medicinsk statistik I

Valet görs utifrån hur data ser ut• Symmetriska data på intervallskala

• Asymmetriska data på intervallskala

• Ordinaldata

Medelvärde eller median ?

Page 18: Medicinsk statistik I

Symmetriska kontinuerliga data

Medelvärde = Median

Exempel: Födelsevikt, längd

I figuren: Medelvärde = 24

Median = 24

Använd medelvärdet!

Page 19: Medicinsk statistik I

Asymmetriska kontinuerliga data

Data är skevt åt höger eller åt vänster

Medelvärdet < Medianen

Medelvärdet > Medianen

I figuren: Medelvärdet = 8

Medianen = 5

Använd medianen!

Page 20: Medicinsk statistik I

Utfall på ordinalskala – ExempelModified Ranking Scale – Grad av handikapp efter stroke

(Kasner 2006)

(Hacke et al. 2008)

Använd medianen!

Page 21: Medicinsk statistik I

Varför inte alltid använda medelvärdet?

ExempelI en enkätundersökning fanns följande fråga:

Hur ofta tränar du?Aldrig

1-4 gånger i månaden

5-8 gånger i månaden

Mer än 8 gånger i månaden

0 poäng

1 poäng

2 poäng

3 poäng

Medelvärdet blir beroende av hur man kodar variabeln!

eller

0 poäng

1 poäng

3 poäng

6 poäng

Page 22: Medicinsk statistik I

Nominaldata

Här är lägesmått inte meningsfulla.

I figuren:

Malmö = 24% (60)

Göteborg = 50% (125)

Stockholm = 26% (65)

Ange andelar och antal!

Page 23: Medicinsk statistik I

Sammanfattning

Lägesmått

Symmetriska data

Medelvärde

Asymmetriska data

Median

Ordinaldata Median

Page 24: Medicinsk statistik I

SpridningLiten spridning

Stor spridning

Page 25: Medicinsk statistik I

Spridningsmått• Beskriver hur pass koncentrerade data är kring

centralvärdet

• Olika mått används för symmetriska och asymmetriska data– Symmetri – spridningsmått baseras på medelvärde– Asymmetri – spridningsmått baseras INTE på

medelvärde

Page 26: Medicinsk statistik I

Spridningsmått

• Standardavvikelse, genomsnittliga avvikelsen från medelvärdet

• Percentiler och kvartiler, delar data i bestämda proportioner

• Variationsvidd, differensen mellan max och min

Page 27: Medicinsk statistik I

Kvartiler delar upp data i fyra lika stora delar;

Undre kvartil =

Övre kvartil =

Percentiler

Beskriver hur stor andel av observationerna som ligger under värdet

• 10% ligger under 10:e percentilen

• 20% ligger under 20:e percentilen etc.

1

1001

q

n

1100

251

n

1100

751

n

Page 28: Medicinsk statistik I

Lägesmått Spridning

Symmetriska data

Medelvärde Varians/Standardavvikelse

Asymmetriska data

Median Percentiler

Ordinaldata Median Percentiler

Sammanfattning

Page 29: Medicinsk statistik I

Hur vet vi om det är symmetriskt?

• Grafiskt se om värdena ser symmetriska ut, tex med histogram eller boxplot (lådagram)

• Medianen och medelvärdet skall vara lika

• Avståndet mellan median och symmetriska percentiler skall vara lika stora, t.ex. jämföra avståndet av övre kvartilen med medianen och undre kvartilen med medianen. Dessa avstånd skall vara lika.

Max

Min

Övre kvartil

Median

Undre kvartil

Page 30: Medicinsk statistik I

Normalfördelningen

Referensintervall

Medelvärdet ± 1 SD täcker 68% av dataMedelvärdet ± 2 SD täcker 95% av dataMedelvärdet ± 3 SD täcker 99.7% av data

X=medelvärdeS=SD=standardavvikelse

Page 31: Medicinsk statistik I

MålpopulationStickprov Stickprov

Analys

Analytisk statistik

Beskrivning

Deskriptiv statistik

Datainsamling

Slutsats

Page 32: Medicinsk statistik I

Punktskattning

• Stickprovet används för att skatta värden i studiepopulationen

- Medelvärdet är exempel på en punktskattning.

Page 33: Medicinsk statistik I

Skattningar – standardfel (medelfel)

• Varje skattning har en osäkerhet• Osäkerheten kan mätas med standardfelet

(standard error, SE)• SE för medelvärde:

s = standardavvikelsen

n = antal observationer• Ju större n ju mindre blir SE

ns

SE2

Page 34: Medicinsk statistik I

Standardfel - exempelMedellängden hos individer i två populationer

Stor spridning•Patienter i ett väntrum på en akutmottagning

Medelvärde=150cm; standardavvikelse=25

Liten spridning•Barn i årskurs 5

Medelvärde=150cm; standardavvikelse=10

Page 35: Medicinsk statistik I

100 observationerMedel = 150,4s = 28,9SE = 2,9

100 observationerMedel = 149,2

s = 8,6SE = 0,9

Patienter i ett väntrum på en akutmottagning

Elever i årskurs 5

10 observationerMedel = 141,2s = 32,4SE = 10,2

10 observationerMedel = 149,2

s = 8,2SE = 2,6

Medel=150, s=25 Medel=150, s=10

Standardfel - exempel

Page 36: Medicinsk statistik I

Konfidensintervall

• SE kan användas för att beräkna ett konfidensintervall (KI)

• Med en viss säkerhet täcker konfidensintervallet det sanna värdet

• Konfidensintervallets bredd beror av – Storleken på SE (och därmed antalet

individer i stickprovet samt spridningen)– Konfidensgraden – hur säker man vill vara

Page 37: Medicinsk statistik I

Konfidensintervall

120 130 140 150 160 170120 130 140 150 160 170

• Om man gör 100 konfidensintervall med konfidensgrad 95% så kommer i genomsnitt 95 av de 100 intervallen att innehålla den sanna parametern.

Page 38: Medicinsk statistik I

Beräkning av konfidensintervall

Generell formel för konfidensintervall

Skattning ± konstant*SE

Konfidensgrad på 90% ger en konstant = 1.64Konfidensgrad på 95% ger en konstant = 1.96Konfidensgrad på 99% ger en konstant = 2.58

Konstanterna kommer från Normalfördelningen.

Page 39: Medicinsk statistik I

Konfidensintervall Exempel

• Patienter i ett väntrum på en akutmottagning• Tar ut ett stickprov på 100 individer • Beräknar ett 95% KI

Med 95 procent säkerhet finns den genomsnittliga längden i den underliggande målpopulationen mellan 144.7 och 156.1 cm.

Det ”sanna” medelvärdet ligger med 95% säkerhet i intervallet medelvärdet ± 2*SE

156.1] [144.7; 2.91.96 150.4 SE1.96 x

Page 40: Medicinsk statistik I

Referensintervall

• Ett referensintervall säger något om spridningen i studiepopulationen

• Istället för att använda SE används standardavvikelsen, s.

Page 41: Medicinsk statistik I

ReferensintervallExempel

•Stickprov om 100 individer till patienter i ett väntrum på en akutmottagning

Beräkning av 95% referensintervall

= 150,4 ± 1.96*28.9 = [93.8; 207.0]

95% av målpopulationen bör vara mellan 94 och 207 cm

”medelvärde ± 2* standardavvikelser ” täcker 95% av data i studiepopulationen

Page 42: Medicinsk statistik I

Sammanfattning

• Konfidensintervall och referensintervall är beräknade baserat på data från stickprovet men drar slutsatser om studiepopulationen!

• KONFIDENSINTERVALL: Medelvärdet i studiepopulationen ligger med 95%

säkerhet inom gränserna

• REFERENSINTERVALL:95% av studiepopulationen har ett värde inom gränserna

Page 43: Medicinsk statistik I

Förutsättningar för konfidens – och referensintervall

Stickprovet måste vara representativt för studiepopulationen

Kontinuerlig data måste vara approximativt normalfördelade•Stickprovet är normalfördelat

eller•Stickprovet stort

Page 44: Medicinsk statistik I

T-fördelningen

Konstanten c=1.96 i formeln

Medelvärdet ± c*SE

kommer från den standardiserade normalfördelningen vid konfidensgraden 95%

För små stickprov blir KI för snäva, går inte upp till den önskade konfidensgraden

Hur löser vi det?

Page 45: Medicinsk statistik I

T-fördelningen

• Vi löser det genom att använda t-fördelningen med n-1 frihetsgrader för att bestämma konstanten c

- Ex. om vi har n=10 så blir antalet frihetsgrader 10-1=9

• I en tabell kan man ta reda på att c=2.26

Page 46: Medicinsk statistik I

T-fördelningen

• En fördelning som mycket påminner om normalfördelningen men som för små stickprov gör att vi bättre uppnår den önskade konfidensgraden

Vad är små stickprov?

Page 47: Medicinsk statistik I

Tumregel - stickprovsstorlek

Antal oberoendeobservationer Tumregel

n<20 Beräkna bara konfidensintervall om det sedan tidigare är känt att den variabel som studeras är normalfördelad. Använd t-fördelningen medn-1 frihetsgrader för att bestämmakonstanten c

n: 20-50 Beräkna konfidensintervall om mätvariabeln ärnågorlunda normalfördelad. Använd t-fördelningen med n-1 frihetsgrader för att bestämmakonstanten c

n>50 Konfidensintervall kan beräknas oavsett hur variabelnsom undersöks är fördelad i studiepopulationen. Den standardiserade normalfördelningen ger fortfarande någotför låga värden på c; skillnaden jämfört med korrekta värdethämtat från t-fördelningen är dock försumbart

Page 48: Medicinsk statistik I

Hur gör vi med data som inte är kontinuerliga/normalfördelade?

Page 49: Medicinsk statistik I

Exempel

• Ett nytt läkemedel ska testas. Hur många kände sig bättre av det nya läkemedlet?

Page 50: Medicinsk statistik I

Konfidensintervall för en andel

• Antag att q = punktskattningen• q är andelen i stickprovet, q ligger mellan 0-1• Konfidensintervall för andelar beräknas

n=antalet individer i stickprovetc=konstant (samma som i tidigare beräkningar)

Förutsättning: q*(1-q)*n > 10

n

qqcq

1

Page 51: Medicinsk statistik I

Konfidensintervall för en andel

• Exempel: Ett nytt läkemedel ska testas. Hur många kände sig bättre av det nya läkemedlet?

• En studie med 100 individer, n=100• q=andel som kände sig bättre av det nya

läkemedlet. q=70%• Konfidensgrad=95% c=1.96

Page 52: Medicinsk statistik I

Exempel fortsättning

• 95% KI:

95% KI: 61% - 79%

100

70.0170.096.170.0

n

qqcq

1