110

Analiza Statystyczna w Excelu Cognity

  • Upload
    cognity

  • View
    226

  • Download
    7

Embed Size (px)

DESCRIPTION

Zapraszamy do zapoznania się z prezentacją ze szkolenia Analiza Statystyczna w Excelu.

Citation preview

Page 2: Analiza Statystyczna w Excelu Cognity

Szanowni Państwo,

Zainteresowanych zagadnieniami związanymi z szeroko pojętą statystyką, zachęcamy do zapoznania się z materiałami ze szkolenia „Analiza Statystyczna w Excelu”.

Autorem prezentacji jest Trener Cognity – Grzegorz Plak. Przedstawione w niej zagadnienia zostały obszernie omówione w trakcie szkolenia, które odbyło się w Krakowie w dniach 19-20 grudnia 2013.

Program tego i innych szkoleń Cognity znajdą Państwo

na stronie www.cognity.pl.

Page 3: Analiza Statystyczna w Excelu Cognity

Agenda

• Podstawowe pojęcia statystyczne

• Etapy analizy danych

• Miary statystyczne

• Testy statystyczne

• Prognozowanie

Page 4: Analiza Statystyczna w Excelu Cognity

Podstawowe pojęcia statystyczne

Populacja Próba

Page 5: Analiza Statystyczna w Excelu Cognity

Populacja (zbiorowość)

Zbiorowość statystyczna (populacja statystyczna) to

zbiór obiektów (jednostek statystycznych), które objęte

są badaniem statystycznym.

Jednostki powinny mieć pewne cechy wspólne (które

pozwalają zakwalifikować je do danej zbiorowości) oraz

właściwości, dzięki którym można je różnicować)

Page 6: Analiza Statystyczna w Excelu Cognity

Populacja (zbiorowość) – cd.

Zbiorowość

Generalna Próbna

Page 7: Analiza Statystyczna w Excelu Cognity

Rodzaje cech statystycznych zmiennych

Cechy mierzalne (ilościowe) – oznaczane liczbą wraz z

określoną jednostką

długość

objętość

waga

Cechy niemierzalne (jakościowe) – brak miary

płeć

wykształcenie

poglądy polityczne

Page 8: Analiza Statystyczna w Excelu Cognity

Podział cech mierzalnych

• Cechy mierzalne skokowe – posiadają konkretne wartości liczbowe

• liczba studentów na uczelni

• Cechy quasi-ciągłe – z natury są skokowe, jednak ze względu na bardzo dużą liczbę wartości traktowane są jako cechy mierzalne ciągłe

• wysokość wynagrodzenia

• Cechy mierzalne ciągłe – wartość cechy może przyjąć dowolną wartość z danego przedziału liczbowego

• powierzchnia państw

Page 9: Analiza Statystyczna w Excelu Cognity

Etapy badania statystycznego

Projektowanie i organizacja

badania

Obserwacja statystyczna

Opracowanie materiału

statystycznego

Analiza statystyczna

Page 10: Analiza Statystyczna w Excelu Cognity

Projektowanie i organizacja badania

Cel badania

Podmiot badania

Przedmiot badania

Zakres badania

Źródła danych

Czas trwania badania

Page 11: Analiza Statystyczna w Excelu Cognity

Metody doboru próby

Dobór losowy

– dobór jednostek próby jest niezależny

od osoby prowadzącej badanie (za pomocą

mechanizmu losowego)

Dobór nielosowy

– dobór jednostek zależy od subiektywnej

oceny osoby prowadzącej badanie

Page 12: Analiza Statystyczna w Excelu Cognity

Dobór losowy (1)

Losowanie bezpośrednie (indywidualne) –

jednostki losowane są bezpośrednio z całej

populacji

losowanie zależne

(losowanie bez zwracania)

losowanie niezależne

(losowanie ze zwracaniem)

Losowanie warstwowe – przed losowaniem dzielimy populację

na warstwy (np. podział jednostek mieszkających na wsi oraz w mieście) w taki sposób, aby warstwy były wewnątrz jak najbardziej jednorodne. Losujemy

określoną liczbę jednostek z każdej warstwy

Page 13: Analiza Statystyczna w Excelu Cognity

Dobór losowy (2)

Losowanie zespołowe – przed losowaniem

dzielimy badaną populację na zespoły

(wewnętrznie zróżnicowane).

Wylosowaną próbę stanowią wszystkie

jednostki z wylosowanego

zespołu

Losowanie systematyczne –

przed losowaniem ustalamy tzw. interwał

losowania, na podstawie którego

wybieramy jednostki do próby. Warunkiem

zastosowania tej metody jest

ponumerowanie jednostek zbiorowości

kolejnymi liczbami naturalnymi (operat

losowania)

Page 14: Analiza Statystyczna w Excelu Cognity

Dobór nielosowy (1)

Dobór celowy – dobór jednostek do próby

opiera się na subiektywnym odczuciu

osoby prowadzącej badanie posiadania

przez jednostek pożądanych cech

Dobór kwotowy –polega na ustaleniu

składu próby narzucając jej

strukturę populacji wykorzystując tzw. kwoty, czyli liczbę

jednostek mających określone cechy,

które mają znaleźć się w grupie.

Jednostki do próby wybiera się w

dowolny nielosowy sposób

Page 15: Analiza Statystyczna w Excelu Cognity

Dobór nielosowy (2)

Dobór metodą „kuli śnieżnej” –

stosowany jest w przypadku, gdy do

jednostek trudno jest dotrzeć. W tej

metodzie na początku określa się niewielką grupę respondentów, a następnie prosi się

ich o wskazanie kolejnych jednostek

do badania

Dobór przypadkowy –polega na dobraniu jednostek, które w

danej sytuacji znalazły się w

dogodnym zasięgu

Page 16: Analiza Statystyczna w Excelu Cognity

Obserwacja statystyczna

Obserwacja statystyczna polega na gromadzeniu danych, dzięki

czemu uzyskuje się materiał statystyczny

Page 17: Analiza Statystyczna w Excelu Cognity

Opracowanie materiału statystycznego

• Kontrola zebranego materiału

• formalna (ilościowa)

• merytoryczna (jakościowa)

• Grupowanie uzyskanych danych

• Grupowanie typologiczne

• Grupowanie wariacyjne

• Prezentacja materiału statystycznego

Page 18: Analiza Statystyczna w Excelu Cognity

Analiza statystyczna

• Opis statystyczny

• Wnioskowanie statystyczne (w przypadku badań próbkowych)

Analiza statystyczna umożliwia ocenę stopnia dokładności i wiarygodności otrzymanych wyników, a także na wyciągnięcie końcowych wniosków dotyczących zaplanowanego celu badania

Page 19: Analiza Statystyczna w Excelu Cognity

Rodzaje szeregów statystycznych

Szereg szczegółowy (wyliczający)

Szereg rozdzielczy

punktowy

przedziałowy

Page 20: Analiza Statystyczna w Excelu Cognity

Szereg szczegółowy - przykład

2 4 3 6 1

1 3 4 5 1

1 3 5 2 3

5 5 2 1 5

Liczba wyrzuconych oczek na kostce w 20 losowaniach

Page 21: Analiza Statystyczna w Excelu Cognity

Szereg punktowy - przykład

Liczba oczek Częstość

1 5

2 3

3 4

4 2

5 5

6 1

Liczba wyrzuconych oczek na kostce w 20 losowaniach

Page 22: Analiza Statystyczna w Excelu Cognity

Szereg przedziałowy - przykład

Zbiór danych (koszyk)

Częstość

lewy przedział prawy przedział

1 2 8

2 4 6

4 6 6

Liczba wyrzuconych oczek na kostce w 20 losowaniach

Page 23: Analiza Statystyczna w Excelu Cognity

Prezentacja graficzna danych

Idealny wykres zawiera

Pole wykresu – graficzna prezentacja danego szeregu

Tytuł wykresu

Legendy wykresu

Źródła danych statystycznych

Page 24: Analiza Statystyczna w Excelu Cognity

Rodzaje wykresów

bryłowe

liniowe

mapowe (kartogramy)

obrazkowe

Powierzchniowe

punktowe

Page 25: Analiza Statystyczna w Excelu Cognity

Wykresy bryłowe

Page 26: Analiza Statystyczna w Excelu Cognity

Wykresy liniowe

Page 27: Analiza Statystyczna w Excelu Cognity

Wykresy mapowe

Małżeństwa wyznaniowe w Polsce jako procent wszystkich małżeństw, według województw. Dane za rok 2006 (GUS)

Źródło: http://pl.wikipedia.org/wiki/Ludność_Polski

Page 29: Analiza Statystyczna w Excelu Cognity

Wykresy powierzchniowe

Page 30: Analiza Statystyczna w Excelu Cognity

Wykresy punktowe

Page 31: Analiza Statystyczna w Excelu Cognity

Typy rozkładów empirycznych

symetryczne asymetryczne jednomodalne wielomodalne

Page 32: Analiza Statystyczna w Excelu Cognity

Rozkłady symetryczne - przykłady

Page 33: Analiza Statystyczna w Excelu Cognity

Rozkłady asymetryczne - przykłady

Page 34: Analiza Statystyczna w Excelu Cognity

Rozkład jednomodalny - przykłady

Page 35: Analiza Statystyczna w Excelu Cognity

Wykresy wielomodalne - przykłady

Page 36: Analiza Statystyczna w Excelu Cognity

Miary statystyczne

Miary położenia (przeciętne, poziomu)

Miary zmienności (zróżnicowania, dyspersji)

Miary asymetrii (skośności)

Miary koncentracji

Page 37: Analiza Statystyczna w Excelu Cognity

Miary położenia

Średnia arytmetyczna

Mediana Dominanta Kwantyle

Page 38: Analiza Statystyczna w Excelu Cognity

Średnia arytmetyczna szereg prosty

k

i

ik x

NN

xxxx

1

21 1...

Page 39: Analiza Statystyczna w Excelu Cognity

Średnia arytmetyczna szereg punktowy

k

i

iikk nx

NN

nxnxnxx

1

2211 1...

Page 40: Analiza Statystyczna w Excelu Cognity

Średnia arytmetyczna szereg przedziałowy

k

i

iikk nx

NN

nxnxnxx

1

2211 1ˆ...ˆˆ

Page 41: Analiza Statystyczna w Excelu Cognity

Mediana szereg wyliczeniowy

parzystegdy 2

,enieparzystgdy

122

2

1

n

xx

nx

Menn

n

Page 42: Analiza Statystyczna w Excelu Cognity

Mediana szereg przedziałowy

pm

pm

skum

pm

lpm rn

nn

xMe

1

2

Page 43: Analiza Statystyczna w Excelu Cognity

Dominanta szereg punktowy

Dominantą w szeregu punktowym jest największa liczebność dla danej

cechy

Page 44: Analiza Statystyczna w Excelu Cognity

Dominanta szereg przedziałowy

pd

pdpdpdpd

pdpd

lpd rnnnn

nnxDo

11

1

Page 45: Analiza Statystyczna w Excelu Cognity

Kwantyle

Najczęściej używanymi kwantylami są:

• Kwartyle

• Decyle

• Percentyle

Page 46: Analiza Statystyczna w Excelu Cognity

Kwartyl pierwszy szereg przedziałowy

pq

pq

skum

pq

lpq rn

nN

xQ

1

14

Page 47: Analiza Statystyczna w Excelu Cognity

Kwartyl trzeci szereg przedziałowy

pq

pq

skum

pq

lpq rn

nN

xQ

1

34

3

Page 48: Analiza Statystyczna w Excelu Cognity

Miary zmienności

• Wariancja

• Odchylenie standardowe

• Klasyczny współczynnik zmienności

• Odchylenie przeciętne

• Rozstęp

• Rozstęp międzykwartylowy

• Odchylenie ćwiartkowe

• Pozycyjny współczynnik zmienności

Page 49: Analiza Statystyczna w Excelu Cognity

Wariancja szereg wyliczeniowy

N

xx

s

k

i

i

1

2

2

Page 50: Analiza Statystyczna w Excelu Cognity

Wariancja szereg punktowy

N

nxx

s

k

i

ii

1

2

2

Page 51: Analiza Statystyczna w Excelu Cognity

Wariancja szereg przedziałowy

N

nxx

s

k

i

ii

1

2

2

ˆ

Page 52: Analiza Statystyczna w Excelu Cognity

Odchylenie standardowe

2s

2s wariancja

Page 53: Analiza Statystyczna w Excelu Cognity

Klasyczny współczynnik zmienności

%100x

Vs

Page 54: Analiza Statystyczna w Excelu Cognity

Odchylenie przeciętne

k

i

i xxN

d1

1

Page 55: Analiza Statystyczna w Excelu Cognity

Rozstęp szereg punktowy

minmax xxR

Page 56: Analiza Statystyczna w Excelu Cognity

Rozstęp międzykwartylowy

13 QQRq

3Q trzeci kwartyl

1Q pierwszy kwartyl

Page 57: Analiza Statystyczna w Excelu Cognity

Odchylenie ćwiartkowe

2

13 QQQ

Page 58: Analiza Statystyczna w Excelu Cognity

Pozycyjny współczynnik zmienności

%100Me

QVq

Page 59: Analiza Statystyczna w Excelu Cognity

Miary asymetrii

• Wskaźnik skośności

• Współczynnik asymetrii Pearsona

• Pozycyjny wskaźnik skośności

• Pozycyjny współczynnik asymetrii

• Trzeci moment centralny

• Klasyczny współczynnik asymetrii

Page 60: Analiza Statystyczna w Excelu Cognity

Wskaźnik skośności

DoxWs

Page 61: Analiza Statystyczna w Excelu Cognity

Współczynnik asymetrii Persona

DoxAp

Page 62: Analiza Statystyczna w Excelu Cognity

Pozycyjny wskaźnik skośności

MeQQWpoz 213

Page 63: Analiza Statystyczna w Excelu Cognity

Pozycyjny współczynnik asymetrii

13

13 2

QQ

MeQQApoz

Page 64: Analiza Statystyczna w Excelu Cognity

Trzeci moment centralny szereg punktowy

N

nxx

m

k

i

ii

1

3

3

Page 65: Analiza Statystyczna w Excelu Cognity

Trzeci moment centralny szereg przedziałowy

N

nxx

m

k

i

ii

1

3

3

ˆ

Page 66: Analiza Statystyczna w Excelu Cognity

Klasyczny współczynnik asymetrii

3

3

mAs

Page 67: Analiza Statystyczna w Excelu Cognity

Miary koncentracji

Współczynnik kurtozy

Współczynnik ekscesu

Krzywa koncentracji Lorenza

Współczynnik koncentracji Giniego

Page 68: Analiza Statystyczna w Excelu Cognity

Współczynnik kurtozy

4

1

4

4

4 1

N

xxm

K

k

i

i

Page 69: Analiza Statystyczna w Excelu Cognity

Współczynnik ekscesu

3 KK

Page 70: Analiza Statystyczna w Excelu Cognity

Krzywa Lorenza

0%

20%

40%

60%

80%

100%

0% 20% 40% 60% 80% 100%

Page 71: Analiza Statystyczna w Excelu Cognity

Współczynnik koncentracji Giniego

5000

aG

5,0

aG

Page 72: Analiza Statystyczna w Excelu Cognity

Badanie związków między cechami

• Analiza korelacji

• Współczynnik korelacji liniowej

Pearsona

• Współczynnik korelacji rang

Spearmana

• Analiza regresji

• Liniowy model regresji

Page 73: Analiza Statystyczna w Excelu Cognity

Współczynnik korelacji liniowej Pearsona

n

i

n

i

ii

n

i

ii

yyxx

yyxx

r

1 1

22

1

Page 74: Analiza Statystyczna w Excelu Cognity

Liniowy model regresji

01xy

n

i

i

n

i

ii

xx

yyxx

1

2

11 xy 10

Page 75: Analiza Statystyczna w Excelu Cognity

Podstawowe pojęcia rachunku prawdopodobieństwa

• Przestrzeń zdarzeń elementarnych

• Zdarzenie losowe

• Prawdopodobieństwo

• Zmienna losowa

• Dystrybuanta

Page 76: Analiza Statystyczna w Excelu Cognity

Przestrzeń zdarzeń elementarnych

Przestrzeń zdarzeń elementarnych to wszystkie możliwe wyniki

doświadczenia. Przestrzeń zdarzeń elementarnych oznaczamy

symbolem Ω.

Page 77: Analiza Statystyczna w Excelu Cognity

Zdarzenie losowe

Zdarzenie losowe to podzbiór przestrzeni zdarzeń

elementarnych Ω, które z góry wyróżnia eksperymentator.

Page 78: Analiza Statystyczna w Excelu Cognity

Prawdopodobieństwo

Prawdopodobieństwem nazywamy funkcję, która każdemu zdarzeniu przyporządkowuje liczbę

spełniającą następujące aksjomaty:

A AP

Page 79: Analiza Statystyczna w Excelu Cognity

Zmienna losowa

Niech dana będzie przestrzeń probabilistyczna (Ω, ζ, P). Funkcję X, określoną na przestrzeni zdarzeń elementarnych Ω, o wartościach rzeczywistych oraz taką, że dla każdego zbiór

jest zdarzeniem (czyli należy do ζ), będziemy nazywać zmienną losową.

t

tX :

Page 80: Analiza Statystyczna w Excelu Cognity

Dystrybuanta

Funkcję , określoną wzorem

nazywamy dystrybuantą zmiennej losowej X.

1 ,0: XF

tXPtFX :

Page 81: Analiza Statystyczna w Excelu Cognity

Wartość oczekiwana

Page 82: Analiza Statystyczna w Excelu Cognity

Wariancja

22 EXEXVarX

Page 83: Analiza Statystyczna w Excelu Cognity

Wybrane rozkłady zmiennych

Rozkłady zmiennych losowych typu skokowego

dwumianowy

Poissona

Rozkłady zmiennych losowych typu ciągłego

normalny

t-Studenta

χ2

Page 84: Analiza Statystyczna w Excelu Cognity

Rozkład dwumianowy

Page 85: Analiza Statystyczna w Excelu Cognity

Rozkład Poissona

Page 86: Analiza Statystyczna w Excelu Cognity

Rozkład normalny

Page 87: Analiza Statystyczna w Excelu Cognity

Rozkład t-Studenta

2

12

1

2

2

1

n

n

x

nn

n

xf

Page 88: Analiza Statystyczna w Excelu Cognity

Rozkład χ2

0x, 0

0,

22

12

12

2

xexnxf

xn

n

Page 89: Analiza Statystyczna w Excelu Cognity

1N

ZXMN

ZXP

Przedział ufności dla średniej (r. n.)

przy znanym odchyl. std. (populacji)

Page 90: Analiza Statystyczna w Excelu Cognity

Przedział ufności dla średniej (r. n.) przy nieznanym o. std. (populacji)

1N

SZXM

N

SZXP xx

Page 91: Analiza Statystyczna w Excelu Cognity

Przedział ufności dla średniej (r. t.) przy nieznanym o. std. (populacji)

1ˆˆ

N

StXM

N

StXP xx

Page 92: Analiza Statystyczna w Excelu Cognity

Przedział ufności dla wskaźnika struktury (rozkład normalny)

1

11

N

N

m

N

m

ZN

mp

N

N

m

N

m

ZN

mP

Page 93: Analiza Statystyczna w Excelu Cognity

Przedział ufności dla odchylenia standardowego (r. n.)

212

2

2

2

c

NS

c

NSP xx

Page 94: Analiza Statystyczna w Excelu Cognity

Dopuszczalny błąd szacunku

2

22

d

ZN

Page 95: Analiza Statystyczna w Excelu Cognity

Testy statystyczne

1. Sformułuj hipotezy

2. Ustal poziom istotności

3. Dobierz statystykę testową

4. Zbuduj obszar krytyczny

5. Zdecyduj, czy wartość zmiennej losowej

znajduje się w obszarze krytycznym i na tej

podstawie zdecyduj o wyniku testu

Page 96: Analiza Statystyczna w Excelu Cognity

Rodzaje błędów w testowaniu hipotez

Przyjęcie H0 Odrzucenie H0

H0 prawdziwa 1-αα

Błąd I-rodzaju

H0 fałszywaβ

Błąd II-rodzaju1-β

Page 97: Analiza Statystyczna w Excelu Cognity

Rodzaje zbiorów krytycznych (1)

Obszar krytyczny lewostronnyH0: S = S0H1: S < S0

Page 98: Analiza Statystyczna w Excelu Cognity

Rodzaje zbiorów krytycznych (2)

Obszar krytyczny prawostronnyH0: S = S0H1: S > S0

Page 99: Analiza Statystyczna w Excelu Cognity

Rodzaje zbiorów krytycznych (3)

Obszar krytyczny obustronnyH0: S = S0

H1: S <> S0

Page 100: Analiza Statystyczna w Excelu Cognity

Odczytywanie wartości z tablic dla rozkładu normalnego

• Dla obszaru lewostronnego odczytujemy taką wartość-tkryt, dla której Ф(-tkryt) = α

• Dla obszaru prawostronnego odczytujemy taką wartość tkryt, dla której Ф(tkryt) = α

• Dla obszaru obustronnego odczytujemy taką wartość-tkryt, dla której Ф(-tkryt) =

α

2.

Granicami będą wartości ±tkryt

Page 101: Analiza Statystyczna w Excelu Cognity

Odczytywanie wartości z tablicdla rozkładu t-Studenta

• Dla obszaru lewostronnego odczytujemy taką wartośćtkryt, dla której P{|Tn-1|>tkryt} > 2α i przyjmujemy wartość ujemną (dla obszaru lewostronnego) lub dodatnią (dla obszaru prawostronnego)

• Dla obszaru obustronnego odczytujemy taką wartość-tkryt, dla której P{|Tn-1|>tkryt} > α. Granicami będą wartości ±tkryt

Page 102: Analiza Statystyczna w Excelu Cognity

Test istotności dla średniej (1)

NMX

Z

0

Page 103: Analiza Statystyczna w Excelu Cognity

Test istotności dla średniej (2)

NS

MXt

0

Page 104: Analiza Statystyczna w Excelu Cognity

Test istotności dla dwóch średnich (1)

2

2

1

2

21

21

n

S

n

S

xxZ

xx

Page 105: Analiza Statystyczna w Excelu Cognity

Test istotności dla dwóch średnich (1)

2121

2

2

2

1

21

11

221

nnnn

SnSn

xxt

xx

Page 106: Analiza Statystyczna w Excelu Cognity

Test istotności dla wskaźnika struktury

N

PP

PpZ

00

0

1

Page 107: Analiza Statystyczna w Excelu Cognity

Test istotności dla wariancji

322

2

0

2

NNS

Z x

Page 108: Analiza Statystyczna w Excelu Cognity

Test istotności dla dwóch wariancji

2

2

2

1

x

x

S

SF

Page 109: Analiza Statystyczna w Excelu Cognity

Cognity

Jesteśmy firmą szkoleniowo-doradczą specjalizującą się przede wszystkim w szkoleniach informatycznych, ze szczególnym uwzględnieniem programów z pakietu Ms Office.

Przeszkoliliśmy już setki przedstawicieli klientów korporacyjnych, biznesowych, pracowników instytucji publicznych oraz klientów indywidualnych (zachęcamy do zapoznania się z treścią zakładki referencje na naszej stronie internetowej).

Proponując najwyższej jakości usługi edukacyjne, umożliwiamy naszym klientom odkrywanie nowych pokładów praktycznej wiedzy, która wpływa na realną poprawę ich wyników oraz podniesienie komfortu wykonywanej pracy.

OFERTA FIRMY COGNITY OBEJMUJE:

▶ Szkolenia otwarte▶ Szkolenia zamknięte (dedykowane dla firm)▶ Konsultacje▶ Opiekę poszkoleniową▶ Doradztwo informatyczne

Page 110: Analiza Statystyczna w Excelu Cognity

Jeżeli jesteś zainteresowany udziałem w organizowanym przez nas szkoleniu, zapraszamy do kontaktu:

Cognity Szkoleniaul. Dietla 25/531-070 Kraków

Tel. +48 12 421 87 54e-mail: [email protected]

Aby być na bieżąco odwiedzaj nas również na portalu Facebook https://www.facebook.com/cognityszkolenia

Zapraszamy!