39
Základní statistická analýza dat z pre- a klinických studií Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové

Základní statistická analýza dat z pre - a klinických studií

Embed Size (px)

DESCRIPTION

Základní statistická analýza dat z pre - a klinických studií. Doc. PharmDr. Miloslav Hronek, Ph.D. UK Faf Hradec Králové. Obsah Základní statistické pojmy (nejvíce používané) Základní deskriptivní statistika (charakteristiky úrovně) Hodnocení statisticky významné rozdílnosti souborů - PowerPoint PPT Presentation

Citation preview

Page 1: Základní statistická analýza dat  z  pre - a klinických studií

Základní statistická analýza dat z pre- a klinických studií

Doc. PharmDr. Miloslav Hronek, Ph.D.UK Faf

Hradec Králové

Page 2: Základní statistická analýza dat  z  pre - a klinických studií

Obsah

– Základní statistické pojmy (nejvíce používané)– Základní deskriptivní statistika (charakteristiky

úrovně)– Hodnocení statisticky významné rozdílnosti souborů– Hodnocení statisticky významné souvislostí mezi

daty– Excel a GraphPad Prism software

Page 3: Základní statistická analýza dat  z  pre - a klinických studií

Proč školící seminář na dané téma

– Využití základní statistiky pro vyhodnocení dat v rámci kvalifikačních prací

– Špatná aplikace a interpretace výsledků daná předchozí neznalostí

Page 4: Základní statistická analýza dat  z  pre - a klinických studií

• Statistika je dnes nezbytným nástrojem informatiky

– Množství informací se ve světě stále zvyšuje. – Je proto nutné naučit se využívat statistické

metody, neboť ty nám umožňují hledání souvislostí tam, kde se množství dat stalo nepřehledným.

Page 5: Základní statistická analýza dat  z  pre - a klinických studií

Základní pojmy

Statistika • Zabývá se analýzou informací, především daty– informace vyjádřenými jako měřitelné a

pozorovatelné veličiny

Experiment• Sběr dat s cílem něco se naučit nebo objevit

Page 6: Základní statistická analýza dat  z  pre - a klinických studií

Základní pojmy

• Proměnná• Neznámá, jako veličina

– Diskrétní proměnná• Proměnná může nabývat pouze určité hodnoty

– např. konkrétní hodnoty tlaku krve

– Spojitá proměnná• Může nabývat nekonečně mnoho hodnot

– např. okolní teplota ve stupních

Page 7: Základní statistická analýza dat  z  pre - a klinických studií

Základní pojmy

• Populace– Také základní soubor– Určitý počet položek, předmětů, úkazů…

• Výběr– Také výběrový soubor– Populace je zároveň podmnožinou této populace

Page 8: Základní statistická analýza dat  z  pre - a klinických studií

Základní pojmy

• Statistický jev – jednotlivá jednotka výběru

• Náhodný výběr– náhodně vybrané jednotky

• Náhodná proměnná– diskrétní nebo spojitá proměnná, jejíž hodnotu

nemůžeme předem určit, např. číslo od 1 do 6 u hodu kostkou

Page 9: Základní statistická analýza dat  z  pre - a klinických studií

Základní pojmy

• Četnost– udává, kolikrát se tento výsledek vyskytl v určitém výběru populace

• Parametr– specifická, přesně stanovená vlastnost populace, např. hodnota

glykémie

50 69,75 89,5 109,25 More0123456789

Histogram

Frequency

hmotnost [kg]

Freq

uenc

y

Page 10: Základní statistická analýza dat  z  pre - a klinických studií

Charakteristiky úrovněStatistický soubor je nahrazen jen jediným číslem,

– určitým způsobem je specifikuje.

• Počet hodnot, minimum a maximum – nejjednodušší ukazatele

• Průměry - počítané ze všech hodnot souboru

• Ostatní střední hodnoty – robustní charakteristiky polohy– jsou-li v souboru extrémní (odlehlá) pozorování

• Useknuté průměry, kvantily – nepočítají se ze všech hodnot souboru (část hodnot se úmyslně

vynechává)

Page 11: Základní statistická analýza dat  z  pre - a klinických studií

Základní deskriptivní statistika• Není nutný speciální software– Lze využít Excel z Microsoft Office– Lze vyhodnotit aritm. průměr, SE, SD, Min., Max., počet,

Medián, Modus

Nastavit pro každý parametr zvlášť• Nejčastější• Časově náročnější• Méně přehledné (dle nastavení)

Nastavení Deskriptivní statistiky• Vyhodnocení najednou všech

parametrů• Přehledné tabulkové zobrazení

Excel

Page 12: Základní statistická analýza dat  z  pre - a klinických studií

Excel – zavedení Analysis ToolPak

Page 13: Základní statistická analýza dat  z  pre - a klinických studií

Deskriptivní statistika v EXCEL1. krok

Page 14: Základní statistická analýza dat  z  pre - a klinických studií

Deskriptivní statistika v EXCEL2. krok

Page 15: Základní statistická analýza dat  z  pre - a klinických studií

Deskriptivní statistika v EXCELvýsledky

Column1

průměr Mean 4,666666667SE=výběr.směr.odch.Standard Error 0,881917104medián Median 4,5modus Mode #NENÍ_K_DISPOZICISD=směr.odch. Standard Deviation 2,160246899

Sample Variance 4,666666667Kurtosis -0,3Skewness 0,46291005

rozsah Range 6min Minimum 2max Maximum 8suma Sum 28počet Count 6

Ukázka v Excel

Page 16: Základní statistická analýza dat  z  pre - a klinických studií

Hodnota (Value)

Index i se nahrazuje číslem a označuje kolikátá hodnota v souboru to je.

x14 = 51 znamená, že 14. hodnota souboru je 51.

ix

Page 17: Základní statistická analýza dat  z  pre - a klinických studií

Aritmetický průměr

n

ii

n xnn

xxxx

1

21 1...

N

iixN 1

1

Aritmetický průměr, nebo často též jen průměr, • je průměr všech hodnot ve statistickém souboru.

Výpočet průměru• sečteme všechny hodnoty a vydělíme je počtem hodnot v

souboru.

Page 18: Základní statistická analýza dat  z  pre - a klinických studií

Vlastnosti aritmetického průměru

– Vynásobíme-li aritmetický průměr počtem n (rozsah souboru) = suma (Σ) všech hodnot souboru.

– Přičteme-li ke všem hodnotám stejnou konstantu k, je to obdoba jako když k aritm. průměru tuto konstantu přičteme

– Obdobně, když vynásobíme nenulovou konstantou všechna čísla, je to obdoba jako když aritm. průměr vynásobíme stejnou konstantou

– Součet jednotlivých odchylek od aritm. průměru je nulový

Page 19: Základní statistická analýza dat  z  pre - a klinických studií

Useknutý průměr (Trimmed Mean) )

1 2

1

... 1 ll

ii

x x xx x

l l

Gx

- Odstraňuje nedostatky aritmetického průměru

- Používá se k vyloučení extrémních hodnot- Výpočet průměru ze selekce hodnot- Např. se vyloučí 5 % nejnižších a 5 % nejvyšších hodnot

- V Excelu = TRIMMEAN (oblast; procenta)

Page 20: Základní statistická analýza dat  z  pre - a klinických studií

Medián (Median)

• Naměřené hodnoty se seřadí podle velikosti• medián je prostřední hodnota• u sudého počtu

– je mediánem průměr obou prostředních čísel– polovina prvků je větších nebo rovných mediánu a polovina je menších

nebo rovna mediánu

• u lichého počtu prvků – počet prvků s vyšší nebo stejnou hodnotou roven počtu prvků s menší

nebo stejnou hodnotou

x~

Page 21: Základní statistická analýza dat  z  pre - a klinických studií

Modus (Mode)

• hodnota, která se vyskytuje nejčastěji• vhodné pro větší rozsah výběru – je-li málo čísel, • čísla se opakují např. jen 2x, tedy nelze stanovit

Page 22: Základní statistická analýza dat  z  pre - a klinických studií

Rozptyl (variance)

• je to míra rozsahu, která udává, jak jsou hodnoty rozptýleny

• je to jiný způsob, jak můžeme popsat povahu rozložení• průměr druhé mocniny vzdálenosti každé hodnoty od

průměru• Pro výpočet je nutné znát průměr• Vypočítáme rozdíl mezi všemi naměřenými hodnotami a

průměrem

• Všechna tato čísla sečteme a výsledek vydělíme počtem měření sníženým o 1

Page 23: Základní statistická analýza dat  z  pre - a klinických studií

Směrodatná odchylka SD

– podobně jako rozptyl vyjadřuje, jak jsou hodnoty rozptýleny s ohledem na průměr

– je druhou odmocninou rozptylu– značení kurzívou σ

Page 24: Základní statistická analýza dat  z  pre - a klinických studií

Výběrová směrodatná odchylka SE

– Pro skutečný výpočet odhadu směrodatné odchylky na empiricky zjištěné řadě čísel

Page 25: Základní statistická analýza dat  z  pre - a klinických studií

Variační koeficient

– Chceme-li posoudit, je-li variabilita malá nebo velká, porovnáme směrodatnou odchylku s průměrem

– Jedná se procentuální vyjádření velikosti směrodatné odchylky vzhledem k aritmetickému průměru

Page 26: Základní statistická analýza dat  z  pre - a klinických studií

Rozdělení

Gaussova křivka – normální rozdělení– Udělat histogram (výskyt četnosti jednotlivých hodnot)– Excel umí histogram, ale ne přímo vyhodnocení normality

rozložení– Ideální tvar

Page 27: Základní statistická analýza dat  z  pre - a klinických studií

INTERVALY SPOLEHLIVOSTI u normálního rozložení

– 68% interval spolehlivosti = průměr ± SD– 95% IS = průměr ± 2SD– 97,7% IS = průměr ± 3SD

Page 28: Základní statistická analýza dat  z  pre - a klinických studií

Vyjádření výsledků deskriptivní statistiky

a) U normálního rozdělení• Aritmetický průměr ± SD• Nad 30 (50) hodnot není nutný test normality

b) U nenormálního rozdělení• Medián (min – max)• Týká se to především malých souborů

Page 29: Základní statistická analýza dat  z  pre - a klinických studií

• Příklady spojitých rozdělení a) symetrické jednovrcholové rozdělení, b) dvouvrcholové rozdělení, c) pravostranně asymetrické rozdělení, d) levostranně asymetrické rozdělení

Page 30: Základní statistická analýza dat  z  pre - a klinických studií

Hodnocení statisticky významné rozdílnosti u dvou souborů hodnot

– U souborů do cca 30 hodnot provézt test normality

Gaussovo rozdělení (normální)• použít parametrický

• t-test

Neprokázána normalita rozdělení• Použít neparametrický

• Mann-Whitney test• Wilcoxonův test

ano ne

Ukázka v GraphPad Prism

Page 31: Základní statistická analýza dat  z  pre - a klinických studií

• Excel – nemá test normality, umí histogram• Vhodnější a uživatelsky jednodušší statistický software např. GraphPad

Prism (v sítí Faf)

Přehled testů• Parametrické

– Nepárové (netvoří související dvojici dat např. kontrola x pacienti)

Test pro stejnou SD Test pro rozdílnou SD

- Párový t-test (např. u stejných osob měření TK ve dvou obdobích po aplikaci léčiva)

Stanovuje F-test

Page 32: Základní statistická analýza dat  z  pre - a klinických studií

• Neparametrické– Nepárový (Mann-Whitney test)– Párový (Wilcoxonův test)

Page 33: Základní statistická analýza dat  z  pre - a klinických studií

Hodnocení statisticky významné rozdílnosti

u více jak dvou souborů hodnot

• Parametrický– Nepárový - použít ANOVA test – viz GraphPad Prism

• Neparametrický– Nepárový Kruskal-Wallisův test – Párový Friedmanův test

Page 34: Základní statistická analýza dat  z  pre - a klinických studií

Hodnocení vztahů mezi parametry- korelace

– Značena kurzívou r (korelační koeficient)– Může být vyjádřena pouze mezi proměnnými, které

mohou být vyčísleny– Vyjadřuje se

-1 r +1 obdoba je -100 % r +100 %

– Na jednotkách nezáleží– Korelace neznamená, že musí existovat souvislost mezi

příčinou a následkem

Page 35: Základní statistická analýza dat  z  pre - a klinických studií

Korelace

Typy:

Parametrický test • Pearsonova korelace

Neparametrický test• Spearmanova korelace

Příklad prezentace výsledku

Tělesná hmotnost statisticky významně korelovala s povrchem těla (P<0,0001; r=0,95).

Page 36: Základní statistická analýza dat  z  pre - a klinických studií

Regrese

• Způsob hodnocení, určující do jaké míry jeden jev ovlivňuje druhý• ! Existence korelace mezi proměnnými nemusí vždy znamenat, že mezi

nimi existuje kauzální vztah (tj. souvislost mezi příčinou a jejím důsledkem)!

• Lineární a nelineární regrese

Page 37: Základní statistická analýza dat  z  pre - a klinických studií

Jak na statistickou analýzu?

• Zformulovat otázku: Co chci zjistit?• Sesbírat data.• Data uspořádat a analyzovat z nich INFORMACE• Vyhodnotit INFORMACE z nich POZNÁNÍ

Page 38: Základní statistická analýza dat  z  pre - a klinických studií

Zdroje:• Gibilisco S. Statistika bez předchozích znalostí. Computer

Press, Brno, 2009, s. 272.• Manuál Excel.• Manuál GraphPad Prism.

Page 39: Základní statistická analýza dat  z  pre - a klinických studií

Děkuji za milou pozornost.