43
Katedra za istraživanja u biomedicini i zdravstvu Opis podataka

Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Katedra za istraživanja u biomedicini i zdravstvu

Opis podataka

Page 2: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Opis kvantitativnih (brojčanih) podataka ?

Mjere srednje vrijednosti (centralne tendencije) Mjere raspršenja

Page 3: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere srednje vrijednosti (centralne tendencije)

Kojoj vrijednosti teže moji podatci?

Page 4: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere raspršenja (varijabilnosti)

Koliko su moji podatci različiti?

Page 5: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere srednje vrijednosti (centralne tendencije)

Aritmetička sredina (prosječna vrijednost) Medijan Mod

Page 6: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Aritmetička sredina, Koristi se isključivo za kvantitativne (brojčane) podatke -

intervalne i omjerne varijable

Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja.

Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj 3+4+2+3+4= 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost) = 15/ 5 = 3 kg

x

Page 7: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Medijan, Md 1. Koristi se uvijek za ordinalne podatke, te 2. za brojčane podatke kada su “asimetrično

raspodijeljeni”

Aritmetička sredina

Page 8: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Medijan, Md Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po

položaju je medijan

Dijeli donjih 50% podataka od gornjih 50%.

Primjer: Broj prethodnih trudnoća je 3,6,2,5,7. Koliki je medijan?

• Poredaj brojeve po veličini: 2,3,5,6,7 • Srednji broj je 5 • Medijan je 5

Page 9: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Medijan za paran broj ispitanika Primjer: Odredi medijan za broj prethodnih trudnoća u

slijedećih šest ispitanica: 2,7,1,6,6,3

Medijan, Md

• Poredaj brojeve po veličini: 1,2,3,6,6,7 • Srednji brojevi su: 3 i 6 • Medijan je ( ) 5,4

263=

+

Page 10: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mod, Mo

Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke

Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku

Primjer: Podatci o 2,2,2,4,5,6,7,7,7,7,8 7 je broj koji se pojavljuje najučestalije (najveći broj puta) Mod je 7

Page 11: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere srednje vrijednosti na primjeru

Page 12: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere raspršenja (varijabilnosti)

Raspon Interkvartilni raspon Varijanca Standardna devijacija

Page 13: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Raspon, R

Koristi se kao mjera raspršenja uz medijan ili mod

Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak

Greške pri mjerenju utječu na njega

Page 14: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Raspon, R u literaturi RAD: Merewood A et al. Vitamin D status among 4-month-old

infants in New England: a prospective cohort study. J Hum Lact. 2012. 28:159-66

CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca, testiranih nakon poroda.

REZULTATI: At 4 months, 11.9% of the 177 infants were vitamin D deficient compared to 37.5% at birth (25(OH)D <20 ng/mL). Median 25(OH)D was 35.2 ng/mL (range, 5.0-100.8). …

Page 16: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Varijanca, s2 Koristi se kao mjera raspršenja uz aritmetičku sredinu

Prosječno kvadratno odstupanje podataka od aritmetičke sredine

Rijetko se koristi jer se izražava u mjernim jedinicama2 pa je praktično tumačenje problematično npr. ovisno o tome što mjerimo: ng2/mL2, g2/danu2, …

podatci za n ispitanika

s2 -1

Page 17: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Standardna devijacija, s (SD)

Standardna devijacija – uvijek uz aritmetičku sredinu!

Korijen iz varijance => Prosječno odstupanje podataka od aritmetičke sredine

Mjerne jedinice iste kao i u aritmetičke sredine: ng/mL, g/danu

1)(...)()( 22

22

1

−−++−+−

=n

xxxxxxs n

Page 18: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

x

Page 19: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

x

Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram).

68% novorođenčadi ima težinu od 3624-464=3160 g do 3624+464=4088 g 95% novorođenčadi ima težinu od 3624-2*464=2696 g do 3624+2*464=4552 g

Page 20: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Mjere raspršenja vrijednosti na primjeru

IQR

Page 21: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena T1 i T2?

Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy.

“Twelve donors were studied at baseline; eight retested at (mean±SD) 11±3 days(T1), 10 at 91±9 days(T2), and 10 at 185±17 days(T3) after donation.

Regeneration rates (mL liver per kg body weight per day) were 0.60±0.22 from baseline to T1, 0.05±0.02 from T1 to T2, 0.01±0.01 from T2 to T3 by CT, 0.54±0.20, 0.04±0.01 and 0.01±0.02 by SPECT. At T3, liver volume was 84±7% of baseline by CT and 92±13% by SPECT. “

0.60 ± 0.22 => 0.60-0.22= 0.38 0.60+0.22= 0.82 Najveći dio podataka u vremenu T1 nalazi se u rasponu od 0.38 do 0.82 ml jetre/kg tijela po danu Najveći dio podataka u vremenu T2 nalazi se u rasponu od 0.03 do 0.07 ml jetre/kg tijela po danu

Page 22: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

1. Opis uzorka usporedba s populacijskim parametrima

2. Opis uzorka u ograncima RCT usporedba s populacijskim parametrima kvaliteta randomizacije

3. Procjena razdiobe podataka (odabir statističkog testa)

Zašto se opisna statistika koristi?

Page 23: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?

Page 24: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Unilateralna N=49 Bilateralna N=47

Varijable Aritmetička sredina±SD /medijan (IQR) MD (95% CI)*

Dob [godine] 29.3±3.31 29.3±3.05 0.08 (-1.23, 1.38) BMI [kg/m2] 25.1±1.94 25.0±2.10 0.02 (-0.81, 0.85) FSH [IU/L] 5.5±1.19 5.1±1.15 0.38 (-0.09, 0.86) LH [IU/L] 13.0±2.64 12.3±3.50 0.68 (-0.58, 1.95) Prosječna vrijednost ukupnog V [cm3] 11.3±1.79 11.4±2.74 -0.13 (-1.08, 0.82)

Prosječna vrijednost AFC 15.0±2.37 14.8±3.20 0.21 (-0.94, 1.37) A [nmol/L] 15.2±4.62 11.9±4.18 3.13 (1.34, 4.93) ǂ SHBG [nmol/L] 35.0±9.32 39.0±10.45 -4.02 (-8.07, 0.03) Prolactin [µg/L] 294.0±96.27 284.4±78.08 9.78 (-26.20, 45.77) AMH [ng/ml] 5.9 (2.7) 6.5 (3.6) -0.7 (-1.6, 0.1) T [nmol/L] 2.7 (0.6) 3.0 (1.1) -0.2 (-0.5, -0.1) ǂ DHESO4 [μmol/L] 7.8 (4.3) 7 (2.7) 0.4 (-0.6, 1.5) FAI 7.8 (1.4) 8.0 (3.3) -0.4 (-1.4, 0.2)

Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena?

Klinički neznačajno

Page 25: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Razdioba brojčanih podataka

Opis preko mjera srednje vrijednosti i raspršenja

ili Grafičkim prikazom (histogram)

Page 26: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Razdioba brojčanih podataka

Opis preko mjera srednje vrijednosti i raspršenja

ili Grafičkim prikazom (histogram)

Page 27: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Grafički prikaz razdiobe brojčanih podataka - histogram

Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala

0-1, 1-2, … 8-9 cm Pobrojeno je koliko

ispitanika ima u pojedinoj kategoriji

Broj ispitanika po kategoriji je prikazan grafički.

Page 28: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Histogram – Razdioba veličine tumora u 13 bolesnika

Srednja vrijednost veličine tumora u ovoj skupini je 3-4 cm (3 bolesnika)

Veličina tumora je raspršena – od >0 do 9 cm

Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika)

Računanjem iz aritmetičke sredine i SD 3.77-2.25=1.52 3.77+2.25=6.02

Page 29: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Oblik histograma

Krivulja normalne (Gaussove) razdiobe

Page 30: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Oblik histograma

Page 31: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Laž s prosječnom plaćom

Page 32: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

x

Page 33: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Opis kvalitativnih (nominalnih, ordinalnih) podataka

Kvalitativne varijable – vrijednost tih varijabli je kategorija: Spol (muško/žensko) Stupanj tumora (mali/ srednji/ veliki) Stupanj opeklina (1/ II/ III)

Kvalitativne varijable pobrojavamo!

Page 34: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Opis kvalitativnih podataka Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka Što možete reći o razdiobi spola u vašem ispitivanju?

SPOL EEG nalaz muško patološki žensko uredan žensko uredan žensko patološki muško patološki žensko uredan žensko uredan žensko uredan muško patološki žensko uredan žensko uredan žensko uredan muško patološki žensko uredan žensko uredan žensko uredan muško uredan

Nžena=12 Nmuškaraca=5

Postotak žena=12*100/17=71% Postotak mušk=5*100/17=29%

apsolutna učestalost

Je li vaše istraživanje dobro izbalansirano s obzirom na spol?

relativna učestalost

Page 35: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Zapamti!

Apsolutna učestalost ili apsolutna frekvencija 3 bolesnika u uzorku od 10

Relativna učestalost ili relativna frekvencija 3/10=30% bolesnika

Postotak 30% = Proporcija 0.3

Page 36: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Dvije varijable?

Povezanost varijabli

Page 37: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Tablice frekvencija (ili tablice kontigencija) s više varijabli služe: 1.prikazu odnosa između odabranih varijabli (SPOL i EKG nalaz) ili 2.kao podloga za primjenu statističkog testa koji ispituje postoji li povezanost između tih varijabli.

EEG nalaz patološki uredan Ukupno

SPOL muško 4 1 5 žensko 1 11 12

Ukupno 5 12 17

Tablica frekvencija (2X2) EKG nalaza prema spolu ispitanika

Opis kvalitativnih podataka - 2 varijable

Page 38: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Tablica 1. Broj (%) ispitanika prema EKG nalazu u odnosu na spol Patološki

(n=5) Uredan (n=12)

Ukupno (n=17)

Spol

muškarci 4 (80) 1 (8) 5

žene 1 (20) 11 (92) 12

Slika 1. Razdioba ispitanika prema EKG nalazu u odnosu na spol

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

patološki uredan

muškarci

žene

Opis kvalitativnih podataka - 2 varijable

Page 39: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

patološki

muškarcižene

uredan

Slika. Razdioba ispitanika prema EKG nalazu u odnosu na spol

Opis kvalitativnih podataka – 2 varijable

Page 40: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Opis kvantitativnih (brojčanih) podataka za 2 varijable?

npr. interesira nas povezanost duljine bubrega s porastom životne dobi djece

Za svako dijete imamo podatke za dvije varijable (obilježja) Dob djeteta [dani] Duljina bubrega [mm]

Page 41: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

TOČKASTI GRAF

Na x osi je dob (dani)- NEOVISNA VARIJABLA, a na y je duljina bubrega (mm)-OVISNA VARIJABLA.

Starost djeteta [dani]

Duljina bubrega [mmi]

Page 42: Opis podatakaneuron.mefst.hr/docs/katedre/istrazivanja_bz/ibz m1/Dan6...Medijan, M d Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli

Hvala na pozornosti!

Pitanja?