155
Máme data – a co dál? Martina Litschmannová

Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Máme data – a co dál?Martina Litschmannová

Page 2: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Obsah

Část 1

▪ Analýza dat – Základní pojmy

▪ Popisná statistika kvalitativního znaku – Tabulky četnosti, vizualizace

▪ Jak to vypadá v praxi

Část 2

▪ Popisná statistika kvantitativního znaku – Míry polohy, míry variability, vizualizace, zaokrouhlování

Část 3

▪ Jak posoudit normalitu dat na základě explorační analýzy

▪ Několik tipů pro zpracování domácích úkolů

Litschmannová Martina, 2020 Máme data - a co dál? 2 / 152

Máme data – a co dál?

Page 3: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Google – 83.106 odkazů (čeština), 1,3.109 odkazů (angličtina)

▪ Teoretická disciplína, která se zabývá metodami sběru a analýzy dat(matematická statistika vs. aplikovaná statistika)

▪ Číselný údaj „syntetizující“ vlastnosti datových souborů (četnost, průměr, rozptyl, …)

▪ Uspořádaný datový soubor (statistika přístupů na web. stránky, statistika střel na branku,statistika nehodovosti, ekonomické statistiky, …)

Litschmannová Martina, 2020 Máme data - a co dál? 3 / 152

Co je to statistika?

Page 4: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 4 / 152

Co vypovídá statistika o jednotlivci?

američan

▪ Statistika nezkoumá jednotlivce jako individualitu, ale jako anonymního nositele některého znaku (činnosti, vlastnosti).

podnikatelDonald Trump politik (prezident)

Page 5: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Populace (základní soubor) je soubor nějakých prvků, o kterém chceme statistickými metodami něco vypovídat. Definuje se výčtem nebo pomocí zvolené vlastnosti. O každém prvku umíme rozhodnout, zda do populace patří či nikoliv.

▪ Výběr je část dané populace, která má sloužit k odvození závěrů platných pro celou populaci. (Pozor na reprezentativnost výběru!)

▪ Statistická jednotka je prvek populace.

▪ Statistický znak (proměnná) je nějaká měřitelná (zjistitelná) charakteristika statistické jednotky (hmotnost, pohlaví, …).

Litschmannová Martina, 2020 Máme data - a co dál? 5 / 152

Základní pojmy

statistická jednotka

populace

výběr

Page 6: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 6 / 152

Typy statistických znaků (proměnných)

Nominální• varianty jsou ve formátu text nebo číselný kód• o každých dvou variantách lze říci, zda jsou různé• např. škola, fakulta, obor, výrobce, …• Další dělení: dichotomické (alternativní), vícekategoriální (množné)

Ordinální (pořadová)• varianty jsou ve fomátu text, datum nebo číslo• u každých dvou variant lze stanovit jejich pořadí• např. úroveň vzdělání, známka (A, B, …, E), úroveň spokojenosti, …

Intervalové (rozdílové)• varianty jsou v číselném formátu• u každých dvou variant lze určit jejich pořadí a rozdíl• např. teplota ve °C, chyba měření, …

Poměrové • varianty jsou v číselném formátu (pouze kladná čísla + nulový bod)• u každých dvou variant lze určit jejich pořadí, rozdíl a podíl (poměr)• např. teplota v K, velikost chyby měření, …

Kvalitativní

Kvantitativní(numerické, kardinální)Další dělení: diskrétní, spojité

Page 7: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Dotazník pro studenty (např. pomocí Google Apps) - http://goo.gl/forms/Z289s0ALPY

Litschmannová Martina, 2020 Máme data - a co dál? 7 / 152

Vlastní pokus o dotazníkové šetření

Page 8: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Populace (základní soubor) je soubor nějakých prvků, o kterém chceme statistickými metodami něco vypovídat.

▪ Výběr je část dané populace, která má sloužit k odvození závěrů platných pro celou populaci.

▪ Statistická jednotka je prvek populace.

▪ Statistický znak (proměnná) je nějaká měřitelná (zjistitelná) charakteristika statistické jednotky.

Litschmannová Martina, 2020 Máme data - a co dál? 8 / 152

Základní pojmy

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 9: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.

Litschmannová Martina, 2020 Máme data - a co dál? 9 / 152

Základní pojmy

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 10: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.

▪ Kvantitativní znak – znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry)

Litschmannová Martina, 2020 Máme data - a co dál? 10 / 152

Základní pojmy

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 11: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.

▪ Kvantitativní znak – znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry)

▪ Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky)

Litschmannová Martina, 2020 Máme data - a co dál? 11 / 152

Základní pojmy

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 12: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Statistický znak je nějaká měřitelná (zjistitelná) charakteristika prvků základního souboru.

▪ Kvantitativní znak – znak, jehož varianty mají číselné hodnoty (má smysl posuzovat rozdíly a poměry)

▪ Kvalitativní znak – znak, jehož varianty se liší kvalitou (může jít i o číselné hodnoty – např. známka z matematiky)

Litschmannová Martina, 2020 Máme data - a co dál? 12 / 152

Základní pojmy

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 13: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 13 / 152

Část 2

Popisná statistika

aneb

Jak jednoduše a přehledně prezentovat výsledky šetření?

▪ Kvalitativní znak

Page 14: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Respondent (proband) – označení statistické jednotky v dotazníkovém šetření

Popište strukturu datového souboru v závislosti na pohlaví respondentů.

Litschmannová Martina, 2020 Máme data - a co dál? 14 / 152

Popisná statistika – Kvalitativní znak

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 15: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

▪ Modus (varianta, které znak nabývá s nejvyšší četností)

Litschmannová Martina, 2020 Máme data - a co dál? 15 / 152

Popisná statistika – Kvalitativní znak

Tabulka četností

Varianta znaku

xi

Absolutní četnost

ni

Relativní četnost

pi

x1 n1 p1=n1 /n

x2 n2 p2=n2 /n

xk nk pk=nk /n

Celkem: n1+n2+…+nk=n 1

Page 16: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 16 / 152

Popisná statistika – Kvalitativní znak

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost

muž 66 0,776470588

žena 19 0,223529412

Celkem: 85 1,000000000

Page 17: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 17 / 152

Popisná statistika – Kvalitativní znak

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost

muž 66 0,776470588

žena 19 0,223529412

Celkem: 85 1,000000000

Page 18: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 18 / 152

Popisná statistika – Kvalitativní znak

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 77,6470588

žena 19 22,3529412

Celkem: 85 100,0000000

1,0 % … 0,85 osob0,1 % … 0,085 osob

Pozor na zaokrouhlovací chybu!

Page 19: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 78

žena 19 22

Celkem: 85 100

▪ Tabulka četnosti

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 19 / 152

Popisná statistika – Kvalitativní znak

1,0 % … 0,85 osob0,1 % … 0,085 osob

Pozor na zaokrouhlovací chybu!

Součet musí být 100 %!

Page 20: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 20 / 152

Příklad demonstrující problém zaokrouhlovací chyby

1,0 % … 2,06 osob0,1 % … 0,206 osob

TABULKA ROZDĚLENÍ ČETNOSTI

Typ pasažéra Absolutní četnostiRelativní četnosti

(%)

Muž 77 37,37864

Žena 85 41,26214

Dítě 44 21,35922

Celkem: 206 100,00000

Page 21: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 21 / 152

Příklad demonstrující problém zaokrouhlovací chyby

1,0 % … 2,06 osob0,1 % … 0,206 osob

TABULKA ROZDĚLENÍ ČETNOSTI

Typ pasažéra Absolutní četnostiRelativní četnosti

(%)

Muž 77 37,4

Žena 85 41,3

Dítě 44 21,4

Celkem: 206 100,1

POZOR na zaokrouhlovací

chybu!

Součet musí být 100 %!

Page 22: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak zaokrouhlovat relativní četnosti?

Litschmannová Martina, 2020 Máme data - a co dál? 22 / 152

Příklad demonstrující problém zaokrouhlovací chyby

1,0 % … 2,06 osob0,1 % … 0,206 osob

TABULKA ROZDĚLENÍ ČETNOSTI

Typ pasažéra Absolutní četnostiRelativní četnosti

(%)

Muž 77 37,4

Žena 85 41,3

Dítě 44 21,3

Celkem: 206 100,0

POZOR na zaokrouhlovací

chybu!

Dopočet do 100 %!

Page 23: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Relativní četnosti používejte vždy pouze jako doplněk absolutních četností!

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž ? 78

žena ? 22

Celkem: 85 100

Litschmannová Martina, 2020 Máme data - a co dál? 23 / 152

Popisná statistika – Kvalitativní znak

Page 24: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Určete modus pohlaví.

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 78

žena 19 22

Celkem: 85 100

Litschmannová Martina, 2020 Máme data - a co dál? 24 / 152

Popisná statistika – Kvalitativní znak

Page 25: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Určete modus pohlaví.

modus = muž

Mezi respondenty převažovali muži.

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 78

žena 19 22

Celkem: 85 100

Litschmannová Martina, 2020 Máme data - a co dál? 25 / 152

Popisná statistika – Kvalitativní znak

Page 26: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 78

žena 19 22

Celkem: 85 100

Litschmannová Martina, 2020 Máme data - a co dál? 26 / 152

Popisná statistika – Kvalitativní znak (nominální)

Page 27: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

▪ Tabulku četností rozšiřujeme o kum. četnosti a kum. relativní četnosti.

Kumulativní četnost (kum. rel. četnost) je postupně načítaná četnost (rel. četnost) jednotlivých vzestupněuspořádaných variant ordinálního znaku.

Tabulka četností

Velikost Absolutní

četnost

Relativní četnost

(%)

Kumulativní

četnost

Kumulativní

rel. četnost (%)

S 66 60,0 66 60,0

M 19 17,3 85 77,3

L 15 13,6 100 90,9

XL 10 9,1 110 100,0

Celkem: 110 100,0 --- ---

Litschmannová Martina, 2020 Máme data - a co dál? 27 / 152

Popisná statistika – Kvalitativní znak (ordinální)

Page 28: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Zamyslete se nad interpretaci kumulativních četností (kumulativních relativních četností)!

Tabulka četností

Velikost Absolutní

četnost

Relativní četnost

(%)

Kumulativní

četnost

Kumulativní

rel. četnost (%)

S 66 60,0 66 60,0

M 19 17,3 85 77,3

L 15 13,6 100 90,9

XL 10 9,1 110 100,0

Celkem: 110 100,0 --- ---

Litschmannová Martina, 2020 Máme data - a co dál? 28 / 152

Popisná statistika – Kvalitativní znak (ordinální)

Page 29: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Tabulka četností

Jak data vizualizovat?

Tabulka četností

Pohlaví Absolutní četnost Relativní četnost (%)

muž 66 78

žena 19 22

Celkem: 85 100

Litschmannová Martina, 2020 Máme data - a co dál? 29 / 152

Popisná statistika – Kvalitativní znak

Page 30: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

▪ Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme „od oka“ přesně odečíst.

Litschmannová Martina, 2020 Máme data - a co dál? 30 / 152

Popisná statistika – Kvalitativní znak

0

10

20

30

40

50

60

70

muž žena

po

čet

resp

on

den

66

19

0

10

20

30

40

50

60

70

muž žena

po

čet

resp

on

den

Page 31: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

▪ Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme „od oka“ přesně odečíst.

▪ Pozor na uvádění popisu os!

Litschmannová Martina, 2020 Máme data - a co dál? 31 / 152

Popisná statistika – Kvalitativní znak

66

19

0

10

20

30

40

50

60

70

muž žena

78

22

0

10

20

30

40

50

60

70

80

muž žena

Page 32: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

▪ Nejsou-li v grafu uvedeny absolutní (relativní) četnosti, obvykle je nedokážeme „od oka“ přesně odečíst.

▪ Pozor na uvádění popisu os!

Litschmannová Martina, 2020 Máme data - a co dál? 32 / 152

Popisná statistika – Kvalitativní znak

66

19

0

10

20

30

40

50

60

70

muž žena

po

čet

resp

on

den

78

22

0

10

20

30

40

50

60

70

80

muž žena

rela

tivn

í po

čet

resp

on

den

tů(%

)

Page 33: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: Srovnávací testy pro žáky 9. tříd

Určete pravdivost tvrzení:

V žádných dvou letech nebyl počet studentů stejný.

Litschmannová Martina, 2020 Máme data - a co dál? 33 / 152

Popisná statistika – Kvalitativní znak

241 240

Pozor na omezenou vypovídací schopnost grafů!

Page 34: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

Litschmannová Martina, 2020 Máme data - a co dál? 34 / 152

Popisná statistika – Kvalitativní znak

Nezapomínejte, že méně mnohdy znamená více …

0

10

20

30

40

50

60

70

muž žena

po

čet

resp

on

den

Page 35: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

Litschmannová Martina, 2020 Máme data - a co dál? 35 / 152

Popisná statistika – Kvalitativní znak

0

5

10

15

20Počet

I takto může vypadat sloupcový graf …

Page 36: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

Litschmannová Martina, 2020 Máme data - a co dál? 36 / 152

Popisná statistika – Kvalitativní znak

I takto může vypadat sloupcový graf …

0

5

10

15

20Počet

Page 37: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

Litschmannová Martina, 2020 Máme data - a co dál? 37 / 152

Popisná statistika – Kvalitativní znak

Kolik bylo mezi respondenty mužů, resp. žen?

0

10

20

30

40

50

60

70

muž žena

po

čet

resp

on

den

Page 38: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Sloupcový graf (Bar Chart)

Litschmannová Martina, 2020 Máme data - a co dál? 38 / 152

Popisná statistika – Kvalitativní znak

Kolik bylo mezi respondenty mužů, resp. žen?

0

10

20

30

40

50

60

70

muž žena

66

19

po

čet

resp

on

den

Page 39: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

3D sloupcový graf

Litschmannová Martina, 2020 Máme data - a co dál? 39 / 152

Popisná statistika – Kvalitativní znak

Opravdu musí být v každé efektní / efektivní prezentaci?

Zdroj: Whitbread, David (2001). The design manual (2nd ed.). Sydney: University of New South Wales Press. ISBN 0868406589.

Page 40: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 40 / 152

Popisná statistika – Kvalitativní znak

Nepoužívejte barevné pozadí grafů!

0

2000

4000

6000

8000

10000

12000

14000

16000

produktA

produktB

produktC

produktD

produkt E produkt F produktG

produktH

produkt I

CEN

AP

RO

DU

KTU

PRODUKT

Cena produktů k 1. 9. 2018

cena produktu

Page 41: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 41 / 152

Popisná statistika – Kvalitativní znak

0

2000

4000

6000

8000

10000

12000

14000

16000

produktA

produktB

produktC

produktD

produktE

produktF

produktG

produktH

produktI

cen

ap

rod

ukt

u

produkt

Cena produktů k 1. 9. 2018

cena produktu

Neopakujte informace!V tomto případě je legenda zcela nadbytečná. V případě, že ji potřebujete, zvažte její umístění!

Page 42: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 42 / 152

Popisná statistika – Kvalitativní znak

Zvažte úpravu popisku horizontální osy!

0

2000

4000

6000

8000

10000

12000

14000

16000

produkt A produkt B produkt C produkt D produkt E produkt F produktG

produkt H produkt I

cen

a

produkt

Cena produktů k 1. 9. 2018

Page 43: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 43 / 152

Popisná statistika – Kvalitativní znak

Zvažte úpravu popisku horizontální osy!

0

2000

4000

6000

8000

10000

12000

14000

16000

pro

du

kt A

pro

du

kt B

pro

du

kt C

pro

du

kt D

pro

du

kt E

pro

du

kt F

pro

du

kt G

pro

du

kt H

pro

du

kt I

cen

a

produkt

Cena produktů k 1. 9. 2018

Page 44: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 44 / 152

Popisná statistika – Kvalitativní znak

Vždy uvádějte jednotky!

0

2000

4000

6000

8000

10000

12000

14000

16000

A B C D E F G H I

cen

a

produkt

Cena produktů k 1. 9. 2018

Page 45: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 45 / 152

Popisná statistika – Kvalitativní znak

Nepoužívejte neefektivní nuly! (Nebo alespoň použijte oddělovače tisíců!)

0

2000

4000

6000

8000

10000

12000

14000

16000

A B C D E F G H I

cen

a (K

č)

produkt

Cena produktů k 1. 9. 2018

Page 46: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 46 / 152

Popisná statistika – Kvalitativní znak

Nepoužívejte neefektivní nuly! (Nebo alespoň použijte oddělovače tisíců!)

0

2 000

4 000

6 000

8 000

10 000

12 000

14 000

16 000

A B C D E F G H I

cen

a (K

č)

produkt

Cena produktů k 1. 9. 2018

Page 47: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 47 / 152

Popisná statistika – Kvalitativní znak

Používejte strukturované nadpisy!

0

2

4

6

8

10

12

14

16

A B C D E F G H I

cen

a (t

is. K

č)

produkt

Cena produktů k 1. 9. 2018

Page 48: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 48 / 152

Popisná statistika – Kvalitativní znak

Zvažte zvýraznění mřížky!

0

2

4

6

8

10

12

14

16

A B C D E F G H I

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 49: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 49 / 152

Popisná statistika – Kvalitativní znak

Nepoužívejte 3D grafy!

0

2

4

6

8

10

12

14

16

A B C D E F G H I

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 50: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 50 / 152

Popisná statistika – Kvalitativní znak

Vždy přemýšlejte nad tím, co chcete na grafu ukázat!!!

0

2

4

6

8

10

12

14

16

A B C D E F G H I

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 51: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 51 / 152

Popisná statistika – Kvalitativní znak

Varianty nominálního znaku je vhodné řadit dle četností, varianty ordinálního znaku dle přirozeného uspořádání!

0

2

4

6

8

10

12

14

16

B H E F I C D G A

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 52: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 52 / 152

Popisná statistika – Kvalitativní znak

Nejsou-li v grafu uvedeny absolutní četnosti, obvykle je nedokážeme „od oka“ přesně odečíst!

0

2

4

6

8

10

12

14

16

B H E F I C D G A

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 53: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 53 / 152

Popisná statistika – Kvalitativní znak

7 78

9

1112

13 13

15

0

2

4

6

8

10

12

14

16

B H E F I C D G A

cen

a (t

is. K

č)

produkt

Cena produktů(k 1. 9. 2018)

Page 54: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Tipy nejen pro sloupcové grafy…

Litschmannová Martina, 2020 Máme data - a co dál? 54 / 152

Popisná statistika – Kvalitativní znak

0

10

20

30

1993 2007

Pro

du

kce

CO

2

(tu

ny

na

oso

bu

)

USA ČR

0%

50%

100%

150%

1993 2007

Pro

du

kce

CO

2

(tu

ny

na

oso

bu

)(%

ro

ku1

99

3)

USA ČR

10

15

20

1993 2007USA ČR

90%

95%

100%

1993 2007USA ČR

Který z grafů je „správný“?

Page 55: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Výsečový graf

Litschmannová Martina, 2020 Máme data - a co dál? 55 / 152

Popisná statistika – Kvalitativní znak

66; 78%

19; 22%

muž

žena

Page 56: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Prstencový graf

Litschmannová Martina, 2020 Máme data - a co dál? 56 / 152

Popisná statistika – Kvalitativní znak

66; 78%

19; 22%

muž

žena

Page 57: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

3D výsečový graf

Litschmannová Martina, 2020 Máme data - a co dál? 57 / 152

Popisná statistika – Kvalitativní znak

66; 78%

19; 22%

muž

žena

Page 58: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

3D výsečový graf

Litschmannová Martina, 2020 Máme data - a co dál? 58 / 152

Popisná statistika – Kvalitativní znak

66; 78%

19; 22%

muž

žena

Pozor na vypovídací schopnost 3D grafů!

Page 59: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

3D vs. 2D výsečový graf

Litschmannová Martina, 2020 Máme data - a co dál? 59 / 152

Popisná statistika – Kvalitativní znak

Jaký je poměr velikosti výsečí A a C?

Jaký je poměr velikosti výsečí B a D?

Page 60: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jste pro navýšení hodinové dotace matematiky?

Litschmannová Martina, 2020 Máme data - a co dál? 60 / 152

Popisná statistika – Kvalitativní znak

TAKHLE NE!!!

Nezapomínejte, že relativní četnosti byste měli uvádět pouze jako doplněk četností absolutních!

Page 61: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jsou tygři populárnější než lvi?

Kolikrát jsou zebry populárnější než žirafy?

Litschmannová Martina, 2020 Máme data - a co dál? 61 / 152

Je výsečový graf tou správnou volbou?

zdroj: https://blog.funnel.io/why-we-dont-use-pie-charts-and-some-tips-on-better-data-visualizations

Page 62: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Srovnání průměrných ročních nástupních platů učitelů středních škol

v ČR (17 244 $) a Irsku (34 604 $)

Litschmannová Martina, 2020 Máme data - a co dál? 62 / 152

Obrazkové grafy – užiteční pomocníci?

Page 63: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Srovnání průměrných ročních nástupních platů učitelů středních škol

v ČR (17 244 $) a Irsku (34 604 $)

Litschmannová Martina, 2020 Máme data - a co dál? 63 / 152

Obrazkové grafy – užiteční pomocníci?

Page 64: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: UTTS, Jessica M. Seeing through statistics. 3rd ed. Belmont, CA: Thomson, Brooks/Cole, c2005. ISBN 0-534-39402-7

Litschmannová Martina, 2020 Máme data - a co dál? 64 / 152

Obrazkové grafy – užiteční pomocníci?

Page 65: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: UTTS, Jessica M. Seeing through statistics. 3rd ed. Belmont, CA: Thomson, Brooks/Cole, c2005. ISBN 0-534-39402-7

Litschmannová Martina, 2020 Máme data - a co dál? 65 / 152

Obrazkové grafy – užiteční pomocníci?

Page 66: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Pár příkladů z praxe

Litschmannová Martina, 2020 Máme data - a co dál? 66 / 152

Page 67: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: Mf Dnes, 10. 7. 2014: Zemědělci si rozdělí miliardy. Krávy a vepři se budou mít lépe.

Litschmannová Martina, 2020 Máme data - a co dál? 67 / 152

Obrazkové grafy – užiteční pomocníci?

Page 68: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

„Úžasná infografika o výdajích státního rozpočtu České republiky v roce 2013“

Zdroj: http://www.estat.cz/zpravy/informace-k-projektum/kde-konci-vase-dane/

Litschmannová Martina, 2020 Máme data - a co dál? 68 / 152

Obrazkové grafy – užiteční pomocníci?

Page 69: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: http://www.estat.cz/zpravy/informace-k-projektum/kde-konci-vase-dane/

Litschmannová Martina, 2020 Máme data - a co dál? 69 / 152

Obrazkové grafy – užiteční pomocníci?

Page 70: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 70 / 152

Příklad s klobásou

Page 71: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 71 / 152

Příklad s klobásou

Page 72: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 72 / 152

Český export do Číny aneb Porovnávejte!!!

Page 73: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 73 / 152

Český export do Číny aneb Porovnávejte!!!

Page 74: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: https://www.souki.cz/kouzelne-grafy

Litschmannová Martina, 2020 Máme data - a co dál? 74 / 152

Český export do Číny aneb Porovnávejte!!!

Page 75: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: Mimořádná příloha Mf Dnes, 27. 3. 2014 – výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: „přes tisíc vysokoškoláků ze všech ročníků po celé republice“)

Litschmannová Martina, 2020 Máme data - a co dál? 75 / 152

Průzkum o představách studentů o budoucím zaměstnání

Page 76: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: Mimořádná příloha Mf Dnes, 27. 3. 2014 – výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: „přes tisíc vysokoškoláků ze všech ročníků po celé republice“)

Litschmannová Martina, 2020 Máme data - a co dál? 76 / 152

Průzkum o představách studentů o budoucím zaměstnání

S přesností na setinu procenta…

1 000 studentů … 100 %10 studentů … 1 %0,1 studentů … 0,01 %

Proč není součet 100 %?

Čemu odpovídá velikost jednotlivých částí prstence?

Page 77: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 77 / 152

Jak výsledky šetření zobrazit správně?

Co je pro Vás důležité při výběru zaměstnání?(vyberte 3 pro Vás nejdůležitější faktory)

četnost rel. četnost (%)rel. četnost (%) vzhledem

k počtu respondentůplat 692 22 67profesní růst 550 18 53atraktivita pracovní pozice 493 16 48pracovní prostředí 479 16 47work-life balance 443 14 43benefity 234 8 23reputace společnosti 199 6 19celkem 3 090 100 ---

Page 78: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 78 / 152

Jak výsledky šetření zobrazit správně?

67%

53%48% 47%

43%

23%19%

0%

10%

20%

30%

40%

50%

60%

70%

80%

plat profesní růst atraktivitapracovnípozice

pracovníprostředí

work-lifebalance

benefity reputacespolečnosti

rel.

čet

no

stz

10

30

re

spo

nd

en

Co je pro Vás důležité při výběru zaměstnání?

Barevné odlišení výplní sloupců není nutné (odborná publikace vs. marketing)!

Page 79: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Pokuste se o interpretaci!

▪ V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z 1 955 oslovených občanů.

▪ Žádné další informace k dané otázce uvedeny nejsou.

Zdroj: https://www.krmelin.cz/evt_file.php?file=1673&original=Dotaznikove_setreni_obce_Krmelin_vysledky_10_18.pdf (18. 11. 2018)

Page 80: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 80 / 152

Informace z vyžádané podrobnější zprávy (na webu není zveřejněna)

Page 81: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Pokuste se o interpretaci!

▪ V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z 1 955 oslovených občanů.

▪ Žádné další informace k dané otázce uvedeny nejsou.

Informace z vyžádané zprávy:

▪ „Celkový počet odpovědí na tuto otázku byl 686. Celkem 120 občanů (18 % z celkového počtu odpovědí) je nespokojeno s chodníky…“

▪ Titulek k grafu: „Graf 10 Podíl výskytu odpovědi na vyjádření občanů, které prvky infrastruktury v obci nejvíce chybí nebo jsou v nevyhovujícím stavu dle podílu z celkového počtu odpovědí“

Zdroj: https://www.krmelin.cz/evt_file.php?file=1673&original=Dotaznikove_setreni_obce_Krmelin_vysledky_10_18.pdf (18. 11. 2018) Zdroj: https://www.krmelin.cz/evt_file.php?file=1673&original=Dotaznikove_setreni_obce_Krmelin_vysledky_10_18.pdf (18. 11. 2018)

Page 82: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Co je pro respondenty „palčivějším“ problémem – stav chodníků nebo chybějící bankomat?

▪ V prezentaci se můžete dozvědět, že průzkumu se zúčastnilo 219 (11,20 %) z 1 955 oslovených občanů.

▪ Žádné další informace k dané otázce uvedeny nejsou.

Informace z vyžádané zprávy:

▪ „Občané uvedli celkem 160 námětů na chybějící služby v obci. Občanům nejčastěji chybí v obci bankomat (20 % z celkového počtu odpovědí, 32 odpovědí) …“

▪ Titulek k grafu: „Graf 6 Vyjádření občanů k otázce, jaké služby jim v obci chybí dle podílů z celkového počtu odpovědí “

Page 83: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: https://www.krmelin.cz/evt_file.php?file=1673&original=Dotaznikove_setreni_obce_Krmelin_vysledky_10_18.pdf (18. 11. 2018)

Page 84: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Prvky infrastruktury, které označilo méně než 5 respondentů: dešťová a splašková kanalizace, vodovody, místní rozhlas, rozvody elektřiny, špatná dostupnost Ostravy a Frýdku-Místku, obřadní síň, hřiště, náves, přechody pro chodce, autobusový záliv

Litschmannová Martina, 2020 Máme data - a co dál? 84 / 152

A co takto?

123 (56 %)117 (53 %)

69 (32 %)

55 (25 %)48 (22 %) 48 (22 %)

41 (19 %)34 (16 %)

27 (12 %) 27 (12 %) 27 (12 %)

0

10

20

30

40

50

60

chodníky sběrný dvůr komunikace(silnice)

parkovacíplochy

obecnímobiliář

veřejnéosvětlení

nádoby natříděnýodpad

cyklostezky připojení kinternetu

hřbitov zastávkyMHD

po

díl

(%)

z 2

19

do

táza

nýc

h

Které prvky infrastruktury podle vás v obci nejvíce chybí nebo jsou v nevyhovujícím stavu?

Analýza je jedním z podkladů pro tvorbu

Strategického plánu obce!

Page 85: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 85 / 152

Popisná statistika

aneb

Jak efektivně popsat a vizualizovat data

Část 2

Kvantitativní znak

Page 86: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Popište a vizualizujte hmotnost respondentů.

Litschmannová Martina, 2020 Máme data - a co dál? 86 / 152

Popisná statistika – Kvantitativní znak

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 87: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy: průměr, kvantily

▪ Míry variability: variační rozpětí, interkvartilové rozpětí, rozptyl, směrodatná odchylka, variační koeficient

▪ Míry šikmosti a špičatosti: standardizovaná šikmost, standardizovaná špičatost

Litschmannová Martina, 2020 Máme data - a co dál? 87 / 152

Popisná statistika – Kvantitativní znak

Časo

vá značka

Poh

laví

Výška (cm

)

Váh

a (kg)

Přivyd

ěláváte si v rám

ci prezen

čníh

o

stud

ia na

brigád

ách?

Jak často b

rigádu

m

áte?

Jak byste svo

u

brigád

u

charakterizo

val(a)?

Ko

lik času týd

ob

vykle věnu

jete b

rigádě?

Ko

lik času týd

ob

vykle věnu

jete stu

diu

?

ID pohlavívýška

(cm)

váha

(kg)brigáda frekvence brigády charakteristika brigády

čas

věnovaný

brigádě

(h/týden)

čas

věnovaný

studiu

(h/týden)

1.4.2016 10:38 muž 180 70 ano každý pracovní den praxe v oboru během studia 20 15

1.4.2016 10:41 muž 186 85 ano nepravidelněkancelářská práce a na ní navazující

práce manuální při realizaci projektů30 20

1.4.2016 10:41 muž 172 75 ano nepravidelně praxe v oboru během studia 5 361.4.2016 10:45 žena 166 56 ano Různě, 2-3 týdně Hlídání dětí 12 101.4.2016 10:52 žena 188 70 ano 3 dny v tydnu praxe v oboru během studia 24 26

Page 88: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

Litschmannová Martina, 2020 Máme data - a co dál? 88 / 152

Popisná statistika – Kvantitativní znak

Zdroj: Swoboda Helmut, Moderní statistika, 1977

Page 89: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

Litschmannová Martina, 2020 Máme data - a co dál? 89 / 152

Popisná statistika – Kvantitativní znak

Průměrná produkce kuřat (na osobu): 1,0 (denně)

Země K

Page 90: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

Zdroj: Blesk, 9.4.2013

Litschmannová Martina, 2020 Máme data - a co dál? 90 / 152

Popisná statistika – Kvantitativní znak

Page 91: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

POZOR!

• Pozor na interpretaci průměru! Nepřisuzujme mu vlastnosti, které nemá!

Litschmannová Martina, 2020 Máme data - a co dál? 91 / 152

Popisná statistika – Kvantitativní znak

Page 92: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

Zdroj: https://www.czso.cz/documents/11350/91605949/gpmz090319.xlsx/5e3fc7c3-effc-4269-935b-a999431a8aab?version=1.0

Litschmannová Martina, 2020 Máme data - a co dál? 92 / 152

Popisná statistika – Kvantitativní znak

0,0

2,0

4,0

6,0

8,0

10,0

0

4 000

8 000

12 000

16 000

20 000

24 000

28 000

32 000

36 000

2 3 4 1 2 3 4 1 2

2017 2018 2019

Mezir

očn

í te

mp

o r

ůstu

(v %

) |

Y-o

-y g

row

th r

ate

(%

)

Kč |

CZ

K

Čtvrtletí / Quarter

Průměrná hrubá nominální mzda (levá osa)… Nominální mzda po očištění od sezónních vlivů (levá osa)… Růst nominální mzdy (pravá osa)… Růst reálné mzdy (pravá osa)…

Průměrná měsíční mzda – čtvrtletní údaje (absolutní hodnoty a meziroční změny)

Page 93: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

„Průměrná rodina má 2,2 dítěte.“

Zdroj: Swoboda Helmut, Moderní statistika, 1977

Litschmannová Martina, 2020 Máme data - a co dál? 93 / 152

Popisná statistika – Kvantitativní znak

Page 94: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

POZOR!

• Pozor na interpretaci průměru! Nepřisuzujme mu vlastnosti, které nemá!

• Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku (např. průměrný počet dětí jedné ženy).

Litschmannová Martina, 2020 Máme data - a co dál? 94 / 152

Popisná statistika – Kvantitativní znak

Page 95: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže.$25 000 $27 000 $29 000 $35 000 $37 000 $38 000

Určete průměrný plat obyvatel této vesnice.

($31 830)

Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $40 000 000.$25 000 $27 000 $29 000 $35 000 $37 000 $38 000 $40 000 000

Určete průměrný plat obyvatel této vesnice.

($5 741 571)

Litschmannová Martina, 2020 Máme data - a co dál? 95 / 152

Popisná statistika – Kvantitativní znak

Page 96: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

Litschmannová Martina, 2020 Máme data - a co dál? 96 / 152

Popisná statistika – Kvantitativní znak

Page 97: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

POZOR!

• Pozor na interpretaci průměru! Nepřisuzujme mu vlastnosti, které nemá!

• Průměr je číslo, které nemusí patřit do definičního oboru analyzovaného znaku (např. průměrný počet dětí jedné ženy).

• Průměr není rezistentní vůči odlehlým pozorováním!

Litschmannová Martina, 2020 Máme data - a co dál? 97 / 152

Popisná statistika – Kvantitativní znak

Page 98: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry polohy

▪ (Aritmetický) průměr: ҧ𝑥 =σ𝑖=1𝑛 𝑥𝑖

𝑛

▪ Medián 𝑴𝒆𝒅 (50% kvantil – 50 % hodnot je menších nebo rovných mediánů)

▪ Dolní kvartil 𝑸𝟏 (25% kvantil – 25 % hodnot je menších nebo rovných dolnímu kvartilu)

▪ Horní kvartil 𝑸𝟑 (75% kvantil – 75 % hodnot je menších nebo rovných hornímu kvartilu)

▪ 100p% kvantil – 100p % hodnot je menších nebo rovných 100p% kvantilu

Speciální typy kvantilů:

▪ Kvartily

▪ Decily

▪ Percentily

Litschmannová Martina, 2020 Máme data - a co dál? 98 / 152

Popisná statistika – Kvantitativní znak

Page 99: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 99 / 152

Kvantily v praxi

Page 100: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Zdroj: http://www.statistikaamy.cz/2018/09/kvantily-kvartily-decily-percentily/

Litschmannová Martina, 2020 Máme data - a co dál? 100 / 152

Kvantily v praxi

Page 101: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 101 / 152

Kvantily v praxi

Page 102: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 102 / 152

Kvantily v praxi

Page 103: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 103 / 152

Kvantily v praxi

Vizualizace

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

0 10 20 30 40 50 60 70 80 90 100

10

0p

% k

van

tilh

mo

tno

sti(

kg)

100p %

Míry polohy Váha (kg)minimum 50dolní kvartil 68průměr 78medián 76horní kvartil 85maximum 130

Kvantilová funkce

Page 104: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variability

K čemu nám jsou dobré?

Informují jak moc jsou hodnoty proměnné rozptýleny, tj. jak moc se liší mezi sebou navzájem.

Litschmannová Martina, 2020 Máme data - a co dál? 104 / 152

Popisná statistika – Kvantitativní znak

Třída Hřiště

Zdroj: https://www.youtube.com/watch?v=ipYaHqutMds (upraveno)

Page 105: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variability

Jak měřit variabilitu?

Variační rozpětí: 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

Litschmannová Martina, 2020 Máme data - a co dál? 105 / 152

Popisná statistika – Kvantitativní znak

Page 106: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variability

Jak měřit variabilitu?

Mezikvartilové (interkvartilové) rozpětí: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1

Litschmannová Martina, 2020 Máme data - a co dál? 106 / 152

Popisná statistika – Kvantitativní znak

Page 107: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variabilityJak měřit variabilitu?

Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

Litschmannová Martina, 2020 Máme data - a co dál? 107 / 152

Popisná statistika – Kvantitativní znak

Page 108: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variabilityJak měřit variabilitu?

Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

Litschmannová Martina, 2020 Máme data - a co dál? 108 / 152

Popisná statistika – Kvantitativní znak

Page 109: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variabilityJak měřit variabilitu?

Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

Litschmannová Martina, 2020 Máme data - a co dál? 109 / 152

Popisná statistika – Kvantitativní znak

Page 110: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variability

Jednotka rozptylu je kvadrátem jednotky analyzované proměnné!!!

Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

Litschmannová Martina, 2020 Máme data - a co dál? 110 / 152

Popisná statistika – Kvantitativní znak

Page 111: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Míry variabilityJak měřit variabilitu?

Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

Litschmannová Martina, 2020 Máme data - a co dál? 111 / 152

Popisná statistika – Kvantitativní znak

Page 112: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Míry variability

▪ Variační rozpětí: 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

▪ Interkvartilové rozpětí: 𝐼𝑄𝑅 = 𝑥0,75 − 𝑥0,25

▪ Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

✓ POZOR! – Jednotka rozptylu je kvadrátem jednotky analyzovaného znaku.

▪ Výběrová směrodatná odchylka: 𝑠 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

✓ Neumožňuje srovnání variability znaků s různými jednotkami.

Litschmannová Martina, 2020 Máme data - a co dál? 112 / 152

Popisná statistika – Kvantitativní znak

Page 113: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Výběrová směrodatná odchylka: 𝑠 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

▪ Populační směrodatná odchylka: σ =σ𝑖=1𝑁 𝑥𝑖− ҧ𝑥 2

𝑁

✓ 𝑁 … rozsah populace, tj. pro výpočet musíme mít k dispozici všechna data ze základního souboru (populace), tj. musíme provést úplné šetření.

✓ Lze ukázat, že nejlepším odhadem populační směrodatné odchylky je výběrová směrodatná odchylka:ො𝜎 ≅ 𝑠

Litschmannová Martina, 2020 Máme data - a co dál? 113 / 152

Proč se pro směrodatnou odchylku někdy používá symbol 𝑠

a jindy symbol 𝜎?

Page 114: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Čebyševova nerovnost

∀𝑘 > 0: 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎 > 1 −1

𝑘2

kde

𝜇 … populační průměr, ො𝜇 ≅ ҧ𝑥,

𝜎 … populační směrodatná odchylka, ො𝜎 ≅ 𝑠

Litschmannová Martina, 2020 Máme data - a co dál? 114 / 152

Jakou představu o variabilitě dat nám dává směrodatná odchylka?

k 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎1 >0

2 >0,75

3 >0,89

nejméně 89 %

nejméně 75 %

hu

sto

ta p

ravd

ěpo

do

bn

ost

i

Page 115: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Čebyševova nerovnost

∀𝑘 > 0: 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎 > 1 −1

𝑘2

kde

𝜇 … populační průměr, ො𝜇 ≅ ҧ𝑥,

𝜎 … populační směrodatná odchylka, ො𝜎 ≅ 𝑠

Příklad:

V odborném článku je uvedeno, že u 100 pacientů byla zjištěna průměrná hladina cholesterolu 4,6 mmol/l a směrodatná odchylka 0,1 mmol/l. Odhadněte v jakém rozmezí se pohybovala hladina cholesterolu v krvi daných pacientů.

Řešení:

Více než 89 % pacientů mělo hladinu cholesterolu v rozmezí 4,3 – 4,9 mmol/l (tj. 4,6 ± 3 ∙ 0,1).

Litschmannová Martina, 2020 Máme data - a co dál? 115 / 152

Jakou představu o variabilitě dat nám dává směrodatná odchylka?

Page 116: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Příklad:

V odborném článku je uvedeno, že u 100 pacientů byla zjištěna průměrná hladina cholesterolu 4,6 mmol/l a směrodatná odchylka 0,1 mmol/l. Odhadněte v jakém rozmezí se pohybovala hladina cholesterolu v krvi daných pacientů.

Řešení:

Více než 89 % pacientů mělo hladinu cholesterolu v rozmezí 4,3 – 4,9 mmol/l (tj. 4,6 ± 3 ∙ 0,1).

Skutečnost:

Litschmannová Martina, 2020 Máme data - a co dál? 116 / 152

Jakou představu o variabilitě dat nám dává směrodatná odchylka?

Page 117: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Pro data, která mají normální rozdělení platí:

Mají-li data normální rozdělení (obálka histogramu odpovídá Gaussově křivce (zvonovitý tvar))

s konečným průměrem (𝜇) a konečnou sm. odchylkou (𝜎), pak:

Litschmannová Martina, 2020 Máme data - a co dál? 117 / 152

Jakou představu o variabilitě dat nám dává směrodatná odchylka?

k 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎1 ≅ 0,68

2 ≅ 0,95

3 ≅ 0,997

hu

sto

ta p

ravd

ěpo

do

bn

ost

i

Page 118: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Míry variability

▪ Variační rozpětí: 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

▪ Interkvartilové rozpětí: 𝐼𝑄𝑅 = 𝑥0,75 − 𝑥0,25

▪ Výběrový rozptyl: 𝑠2 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1✓ POZOR! – Jednotka rozptylu je kvadrátem jednotky analyzovaného znaku.

▪ Výběrová směrodatná odchylka: 𝑠 =σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 2

𝑛−1

✓ Neumožňuje srovnání variability znaků s různými jednotkami.

▪ Variační koeficient: 𝑉 =𝑠

ҧ𝑥∙ 100 %

✓ Čím nižší var. koeficient, tím homogennější soubor.✓ 𝑉 > 50% značí silně rozptýlený soubor. (empirické doporučení)✓ Doporučujeme používat pouze pro znaky, jejichž hodnoty „nemění znaménko“ a nemají průměr blízký nule.

Litschmannová Martina, 2020 Máme data - a co dál? 118 / 152

Popisná statistika – Kvantitativní znak

Page 119: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Výběrová šikmost 𝑎

𝑎 = 𝑛 ∙σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 3

σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 2 3/2

Litschmannová Martina, 2020 Máme data – a co dál? 119 / 152

Výběrová šikmost

x

f(x)

𝑎 ∈ −2; 2

pravděpodobně

symetrické rozdělení

x

f(x)

x

f(x)

𝑎 < −2

pravděpodobně

negativně zešikmené rozdělení

𝑎 > 2

pravděpodobně

pozitivně zešikmené rozdělení

Page 120: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Výběrová špičatost 𝑏 - míra koncentrace kolem průměru

𝑏 = 𝑛σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 4

σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 2

2

▪ standardizovaná špičatost 𝛼4 − 3

Litschmannová Martina, 2020 Máme data – a co dál? 120 / 152

Výběrová špičatost

x

f(x)

𝛼4 = 3

špičatost cca odpovídající

normálnímu rozdělení

x

f(x)

x

f(x)

𝑏 < 1

plošší rozdělení𝑏 > 5

špičatější rozdělení

Page 121: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ ty hodnoty proměnné, které se mimořádně liší od ostatních hodnot a tím ovlivňují např. vypovídací hodnotu průměru.

Jak postupovat v případě, že v datech identifikujeme odlehlá pozorování?

▪ V případě, že odlehlost pozorování je způsobena:

✓ hrubými chybami, překlepy, prokazatelným selháním lidí či techniky ...

✓ důsledky poruch, chybného měření, technologických chyb ...

tzn., známe-li příčinu odlehlosti a předpokládáme-li, že již nenastane, jsme oprávněni tato pozorování vyloučit z dalšího zpracování.

▪ V ostatních případech je nutno zvážit, zda se vyloučením odlehlých pozorování nepřipravíme o důležité informace o jevech vyskytujících se s nízkou četností.

Litschmannová Martina, 2020 Máme data - a co dál? 121 / 152

Odlehlá pozorování

Page 122: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Metoda vnitřních hradeb

𝑥𝑖 < 𝑥0,25 − 1,5𝐼𝑄𝑅 ∨ 𝑥𝑖 > 𝑥0,75 + 1,5𝐼𝑄𝑅 ⇒ 𝑥𝑖 je odlehlým pozorováním

Metoda vnějších hradeb

𝑥𝑖 < 𝑥0,25 − 3𝐼𝑄𝑅 ∨ 𝑥𝑖 > 𝑥0,75 + 3𝐼𝑄𝑅 ⇒ 𝑥𝑖 je extrémním pozorováním

Litschmannová Martina, 2020 Máme data - a co dál? 122 / 152

Identifikace odlehlých pozorování

Dolní mez vnitřních hradeb

Horní mez vnitřních hradeb

Dolní mez vnějších hradeb

Horní mez vnějších hradeb

Page 123: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

V předložených datech identifikujte odlehlá pozorování:

Vnitřní hradby:

Dolní mez: 6,8 − 2,85 = 𝟑, 𝟗𝟓 Horní mez: 8,7 + 2,85 = 𝟏𝟏, 𝟓𝟓

Litschmannová Martina, 2020 Máme data - a co dál? 123 / 152

Příklad 1

MN (%)

4,9

6,8

6,8

6,8

6,8

7,8

7,8

8,7

9,7

15,7

𝑀𝑁0,5=7,3

𝑀𝑁0,25 = 𝟔, 𝟖

𝑀𝑁0,75 = 8,7

𝐼𝑄𝑅 = 𝑀𝑁0,75 −𝑀𝑁0,25 = 1,9

1,5 ∙ 𝐼𝑄𝑅 = 2,85

Page 124: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

V předložených datech identifikujte odlehlá pozorování:

Vnitřní hradby:

Dolní mez: 6,8 − 2,85 = 𝟑, 𝟗𝟓 Horní mez: 8,7 + 2,85 = 𝟏𝟏, 𝟓𝟓

Litschmannová Martina, 2020 Máme data - a co dál? 124 / 152

Příklad 1

MN (%)

4,9

6,8

6,8

6,8

6,8

7,8

7,8

8,7

9,7

15,7

𝑀𝑁0,5=7,3

𝑀𝑁0,25 = 𝟔, 𝟖

𝑀𝑁0,75 = 8,7

𝐼𝑄𝑅 = 𝑀𝑁0,75 −𝑀𝑁0,25 = 1,9

1,5 ∙ 𝐼𝑄𝑅 = 2,85

Page 125: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Co to jsou platné cifry?

Platnými ciframi (číslicemi) daného čísla jsou všechny číslice od první zleva, která není nulová, do poslední zapsané číslice vpravo. Přitom se nepočítají nuly plynoucí z činitelů 10𝑛 (číslo 1 400 = 14 ∙ 102, proto má 2 platné cifry ).

▪ Nuly mezi číslicemi jsou platnými ciframi (1 201 má 4 platné cifry).

▪ Nuly následující za první platnou cifrou a jsou zapsány za desetinnou čárkou jsou platnými ciframi (číslo 12,0 má 3 platné cifry).

▪ Nuly za zapsané za desetinnou čárkou před první platnou cifrou nejsou (číslo 0,005 má 1 platné místo).

Nezaměňujme počet platných cifer s počtem desetinných míst!

Litschmannová Martina, 2020 Máme data - a co dál? 125 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Page 126: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 126 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50dolní kvartil 68průměr 77,62791medián 75,5horní kvartil 84,5maximum 130Míry variabilitysměrodatná odchylka 14,67615variační koeficient (%) 18,90576

Rozsah výběru: 29 (respondentů)

Směr. odchylku zaokrouhlíme nahoru na 2 platné cifry.

Page 127: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 127 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50dolní kvartil 68průměr 77,62791medián 75,5horní kvartil 84,5maximum 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Rozsah výběru: 29 (respondentů)

Směr. odchylku zaokrouhlíme nahoru na 2 platné cifry.

Page 128: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 128 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50dolní kvartil 68průměr 77,62791medián 75,5horní kvartil 84,5maximum 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Směr. odchylku jsme zaokrouhlili na celá čísla.

Míry polohy zaokrouhlíme na celá čísla.

Page 129: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 129 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50dolní kvartil 68 68průměr 77,62791 78medián 75,5 76horní kvartil 84,5 85maximum 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Směr. odchylku jsme zaokrouhlili na celá čísla.

Míry polohy zaokrouhlíme na celá čísla.

Page 130: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 130 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50dolní kvartil 68 68průměr 77,62791 78medián 75,5 76horní kvartil 84,5 85maximum 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Minimum a maximum jsou vybrané hodnoty analyzovaného znaku.

Minimum a maximumnezaokrouhlujeme.

Page 131: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 131 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50 50dolní kvartil 68 68průměr 77,62791 78medián 75,5 76horní kvartil 84,5 85maximum 130 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Minimum a maximum jsou vybrané hodnoty analyzovaného znaku.

Minimum a maximumnezaokrouhlujeme.

Page 132: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 132 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50 50dolní kvartil 68 68průměr 77,62791 78medián 75,5 76horní kvartil 84,5 85maximum 130 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576

Variační koeficient používáme k empirickému posouzení míry variability analyzovaného znaku. Je-li větší než 50 %, mluvíme o silné heterogenitě / variabilitě.

Var. koeficient (%) zaokrouhlujeme na desetiny.

Page 133: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

Litschmannová Martina, 2020 Máme data - a co dál? 133 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Míry polohy Váha (kg) zaokrouhlenominimum 50 50dolní kvartil 68 68průměr 77,62791 78medián 75,5 76horní kvartil 84,5 85maximum 130 130Míry variabilitysměrodatná odchylka 14,67615 15variační koeficient (%) 18,90576 18,9

Minimum a maximum jsou vybrané hodnoty analyzovaného znaku.

Minimum a maximumnezaokrouhlujeme.

Page 134: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Jak zaokrouhlovat výběrové charakteristiky?

Směrodatnou odchylku zaokrouhlujeme nahoru na 𝑘 platných cifer, kde 𝑘 závisí na rozsahu výběru.

Míry polohy zaokrouhlujeme následně na stejný řád.

▪ Minimum a maximum nezaokrouhlujeme.

▪ Variační koeficient (%) zaokrouhlujeme na desetiny.

▪ Šikmost a špičatost zaokrouhlujeme na desetiny.

▪ Meze vnitřních hradeb zaokrouhlujeme na o jednu cifru vyšší přesnost, než data v datovém souboru.

Podrobněji viz Manuál pro zaokrouhlování.

Litschmannová Martina, 2020 Máme data - a co dál? 134 / 152

Jak zaokrouhlovat výběrové charakteristiky?

Page 135: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Histogram

Tvar histogramů závisí na počtu tříd (sloupečků)!

Litschmannová Martina, 2020 Máme data - a co dál? 135 / 152

Vizualizace kvantitativního znaku

0

2

4

6

8

10

12

14

16

18

četn

ost

hmotnost (kg)

0

5

10

15

20

25

30

50 59 68 77 86 94 103 112 121 Další

četn

ost

hmotnost (kg)

Page 136: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Histogram

Tvar histogramů závisí na počtu tříd (sloupečků)!

Litschmannová Martina, 2020 Máme data - a co dál? 136 / 152

Vizualizace kvantitativního znaku

Page 137: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Krabicový graf (angl. boxplot)

boxplot(data)# neboboxplot(data,range = 1.5) # parametrem range lze modifikovat velikost hradeb

Litschmannová Martina, 2020 Máme data - a co dál? 137 / 152

Vizualizace kvantitativního znaku

dolní kvartil

horní kvartilmedián

není definováno jednoznačně, v R je to defaultně nastaveno jako max(data)[data<horní mez vnitřních hradeb]

není definováno jednoznačně, v R je to defaultně nastaveno jako min(data)[data>dolní mez vnitřních hradeb]

odlehlá pozorování, tj. defaultně: data ležící vně vnitřních hradeb

Page 138: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 138 / 152

Popisná statistika

aneb

Jak efektivně popsat a vizualizovat data

Část 3

Posuzování normality

na základě explorační analýzy

Page 139: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 139 / 152

Odhad hustoty pravděpodobnosti (empirická hustota p-sti)

Page 140: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 140 / 152

Odhad distribuční funkce (empirická distribuční funkce)

Page 141: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Pokud jsou data výběrem z daného rozdělení, výběrové a teoretické kvantily by měly být shodné.

Litschmannová Martina, 2020 Máme data - a co dál? 141 / 152

Q-Q graf: Jak to funguje?

výběrový 30% kvantilteoretický 30% kvantil

Page 142: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 142 / 152

Q-Q graf

Page 143: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 143 / 152

Page 144: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 144 / 152

Page 145: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 145 / 152

Page 146: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 146 / 152

Page 147: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 147 / 152

Jak empiricky na základě metod explorační analýzy

ověřit možnou shodu rozptylů dvou populací?

𝑠𝐴 = 36 𝑚𝐴ℎ𝑠𝐷 = 38 𝑚𝐴ℎ

𝑠𝑚𝑎𝑥2

𝑠𝑚𝑖𝑛2 ≅

382

362≅ 1,12 < 2

Nepředpokládáme, že výběry pocházejí z populací s různými rozptyly.

Page 148: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 148 / 152

Jak empiricky na základě metod explorační analýzy

ověřit možnou shodu rozptylů dvou populací?

𝑠𝐴 = 36 𝑚𝐴ℎ𝑠𝐵 = 15 𝑚𝐴ℎ

𝑠𝑚𝑎𝑥2

𝑠𝑚𝑖𝑛2 ≅

382

152≅ 5,76 > 2

Předpokládáme, že výběry pocházejí z populací s různými rozptyly.

Page 149: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 149 / 152

Pár tipů pro zpracování domácích úkolů

Page 150: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ „Příliš barviček škodí dobrému dojmu…“

▪ Každá tabulka a každý obrázek musí mít výstižný titulek!

▪ Nezařazujte tabulky a obrázky, na něž se v dalším textu neodkazujete.

▪ Tabulky a grafy by měly být v „myšlenkovém“ souladu.

Litschmannová Martina, 2020 Máme data - a co dál? 150 / 152

Výrobce \ Kvalita Vyhovující Nevyhovující CelkemA 45 (62,5%) 27 (37,5%) 72B 32 (49,2%) 33 (50,8%) 65C 28 (46,7%) 32 (53,3%) 60D 52 (71,2%) 21 (28,8%) 73Celkem 157 (58,1%) 113 (41,9%) 270

Page 151: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 151 / 152

Výrobce \ Kvalita Vyhovující Nevyhovující CelkemA 45 (62,5%) 27 (37,5%) 72B 32 (49,2%) 33 (50,8%) 65C 28 (46,7%) 32 (53,3%) 60D 52 (71,2%) 21 (28,8%) 73Celkem 157 (58,1%) 113 (41,9%) 270

Tab. 1: Zastoupení různých typů akumulátorů (dle kvality) pro jednotlivé výrobce

Obr. 1: Zastoupení různých typů akumulátorů (dle kvality) pro jednotlivé výrobce

Page 152: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

▪ Každá tabulka a každý obrázek musí mít výstižný titulek!

▪ Standardní součástí grafů je popis os.

▪ Chceme-li grafy používat k vzájemnému porovnávání výsledků, snažíme se používat stejné rozsahy os.

Litschmannová Martina, 2020 Máme data - a co dál? 152 / 152

Obr. 2 : Krabicové grafy výrobců

Page 153: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Litschmannová Martina, 2020 Máme data - a co dál? 153 / 152

Obr. 2 : Srovnání kapacit akumulátorů po 5 nabíjecích cyklech (mAh) dle výrobců (krabicový graf)

Page 154: Prezentace aplikace PowerPointam-nas.vsb.cz/lit40/PRASTA/Prezentace/STA_7_exploracni...Popisná statistika kvalitativního znaku–Tabulky četnosti, vizualizace Jak to vypadá v praxi

Naučte se grafy efektivně kombinovat!

Litschmannová Martina, 2020 Máme data - a co dál? 154 / 152

Obr. 3 : Srovnání kapacit akumulátorů po 5 nabíjecích cyklech (mAh) výrobců A a B