64
Podstawy statystyki i obsluga SPSSa na przykladach z ekonomii Kurs letni dla studentów studiów zamawianych na kierunku „Matematyka w ekonomii i finansach” — wyklad 2. dr Joanna Karlowska-Pik Podstawy statystyki i obsluga SPSSa na przykladach z ekonomii – p. 1/64

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Podstawy statystykii obsługa SPSSa

na przykładach z ekonomiiKurs letni dla studentów studiów zamawianych

na kierunku „Matematyka w ekonomii i finansach” — wykład 2.

dr Joanna Karłowska-Pik

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 1/64

Page 2: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Tablice rozkładu czesto sci

Przykład 1. Dane dotyczace liczby sztuk sprzedanegotowaru objetego własnie promocja:

9 7 5 3 7 8 7 8 6 63 5 7 5 8 6 5 6 5 93 4 1 6 5 2 3 4 7 84 2 7 7 4 6 6 4 9 76 5 6 4 5 4 4 5 7 6

W tabeli podajemy wartosci danych, zliczamy dane(stawiajac kreski — ang. tally chart), czestosci,czestosci wzgledne i czestosci wzgledne skumulowane.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 2/64

Page 3: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Tabele czesto sci c.d.

Wartosci Zliczanie ni ni/N Skumulowane

1 | 1 1/50 1/50

2 || 2 2/50 3/50

3 |||| 4 4/50 7/50

4 ||||| ||| 8 8/50 15/50

5 ||||| |||| 9 9/50 24/50

6 ||||| ||||| 10 10/50 34/50

7 ||||| |||| 9 9/50 43/50

8 |||| 4 4/50 47/50

9 ||| 3 3/50 50/50=1Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 3/64

Page 4: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Histogramy dla danychniezgrupowanych

Ang. histogram. Termin wprowadzony przez KarlaPearsona w 1895 roku.

Szczególna kategoria wykresów słupkowych. Słupkirysujemy nad wartosciami zmiennej. Wysokoscsłupka odpowiada liczbie obserwacji, dla którychzmienna przyjmuje zadana wartosc.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 4/64

Page 5: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Histogram dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 5/64

Page 6: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wielokaty czesto sci

Ang. frequency polygon. Powstaja przez połaczeniesrodków górnych krawedzi słupków histogramu. Srodkigórnych krawedzi słupków skrajnych nalezy połaczycz osia OX. Pole powierzchni wielokata powinno bycrówne sumie pól słupków histogramu. Wielokatczestosci przybliza nam kształt gestosci rozkładu(pojecie teorii prawdopodobienstwa).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 6/64

Page 7: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wielokat czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 7/64

Page 8: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wielokat czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 8/64

Page 9: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Krzywe czesto sciskumulowanych

Nad wartosciami zmiennych zaznaczamy czestosciwzgledne skumulowane. Otrzymane punkty łaczymykrzywa (w sposób „gładki”). Krzywa czestosciwzglednych przybliza wykres funkcji znanej w teoriiprawdopodobienstwa jako dystrybuanta.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 9/64

Page 10: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Krzywa czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 100

1

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 10/64

Page 11: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Tabele i histogramyw programie

ANALIZA -> OPIS STATYSTYCZNY -> CZESTOSCI...Przerzucamy do okna Zmienne zmienne, których tabelei histogramy chcemy utworzyc. Zaznaczamy POKAZTABELE CZESTOSCI. Klikamy WYKRESY... i zaznaczamyHISTOGRAMY. Klikamy DALEJ i OK.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 11/64

Page 12: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Diagram „łodyga i li scie”

Ang. steam and leaf diagram.

Przykład 2. 12, 36, 18, 25, 24, 11, 39, 11, 29, 35.

1 2 8 1 12 5 4 93 6 9 5

—>1 1 1 2 82 4 5 93 5 6 9

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 12/64

Page 13: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Diagram „łodyga i li scie”w programie

ANALIZA -> OPIS STATYSTYCZNY -> EKSPLORACJA...Przerzucamy zmienna do okienka Zmienne zalezne.Zaznaczamy POKAZ WYKRESY i klikamy WYKRESY...Przy wykresach skrzynkowych zaznaczamy BRAK, przyopisie ŁODYGA-I-LISCIE. Klikamy DALEJ i OK.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 13/64

Page 14: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych

Stosuje sie głównie w przypadku duzej liczbydanych przyjmujacych wiele róznych wartosci.

Kiedys ułatwiało to obliczanie statystyk. Obecnie,gdy istnieje mozliwosc uzywania pakietówstatystycznych, stosuje sie tylko w celu prezentacjigraficznej, m.in. rysowania histogramów.

Zbyt duza liczba przedziałów moze powodowac, zeliczebnosci klas beda małe i nie bedzie widaccharakteru rozkładu. Zbyt mała moze spowodowac,ze sasiadujace ze soba przedziały o małej i duzejliczebnosci zostana połaczone w jeden.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 14/64

Page 15: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych c.d.

Gdy przedziały maja byc równej szerokosci, to ichliczbe mozna wyliczyc ze wzorów:k ¬ 5 lnN ,k = 1 + 3, 322 lnN ,

k =√N ,

Sturgesa: k = [log2N + 1],

Scotta: k = 3,5s3√N ,

gdzie N to liczebnosc danych, a s odchyleniestandardowe.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 15/64

Page 16: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych c.d.

Długosc klasy b ≈ xmax−xmink , przy czym stosujemyzawsze przyblizenie z nadmiarem.

Punkty stanowiace granice klas ustala siez dokładnoscia do α/2, gdzie α to dokładnosc z jakapodane sa dane.

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunekprawdopodobienstwa i statystyka matematyczna w zadaniach, czesc II, PWN, Warszawa(1995).

A. Łomnicki: Wprowadzenie do statystyki dla przyrodników, PWN, Warszawa (2003).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 16/64

Page 17: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Szereg rozdzielczy

Definicja: Dla danych pogrupowanych w klasy przezszereg rozdzielczy rozumiemy ciag par (xi, ni), gdzie xijest srodkiem i-tej klasy, a ni jej liczebnoscia.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 17/64

Page 18: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Przykład grupowania

Przykład 3.68 74 67 46 64 6561 53 69 54 44 3755 57 59 47 51 2173 62 47 64 50 4332 70 40 65 32 4958 46 62 73

N = 34. Liczbe klas wyznaczamy np. ze wzoruk ≈√N ≈ 6. Długosc klasy: b ≈ 74−216 = 53/6 ≈ 9.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 18/64

Page 19: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Tabela dla danych z przykładu

Przedział Zliczanie srodek xi ni ni/N Skumulowane

[20, 5; 29, 5) | 25 1 1/34 1/34

[29, 5; 38, 5) ||| 34 3 3/34 4/34

[38, 5; 47, 5) |||| 43 7 7/34 11/34

[47, 5; 56, 5) ||||| |||| 52 6 6/34 17/34

[56, 5; 65, 5) ||||| ||||| 61 10 10/34 27/34

[65, 5; 74, 5) ||||| || 70 7 7/34 34/34=1

Szereg rozdzielczy — 3. i 4. kolumna tabeli.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 19/64

Page 20: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wykresy dla danychzgrupowanych

Zasady tworzenia dla danych zgrupowanychanalogiczne jak dla niezgrupowanych. Słupkihistogramu rysujemy nad wyznaczonymiprzedziałami.

Pola słupków histogramu odpowiadaja wartosciomliczbowym, słupki nie musza byc równej szerokosci.

Wyglad histogramu zalezny od obranej szerokosciprzedziałów oraz długosci jednostek na osipionowej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 20/64

Page 21: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wykresy dla danychzgrupowanych c.d.

Punkty dla krzywej czestosci skumulowanychzaznaczamy nad prawymi brzegami klas.

Jezeli przy rysowaniu histogramu zamiast czestoscizaznaczymy czestosci wzgledne, to pole histogramui pole wielokata czestosci beda równe 1.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 21/64

Page 22: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wielokat czesto sci i histogram

5

10

25 34 43 52 61 70

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 22/64

Page 23: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Krzywa czesto sci wzglednych

1

29.5 38.5 47.5 56.5 65.5 74.5

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 23/64

Page 24: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych w SPSSie

Rekodujemy zmienne przyporzadkowujac danymz kazdej klasy srodek tej klasy. PRZEKSZTAŁCENIA-> REKODUJ NA INNE ZMIENNE... Przenosimyzmienna z oryginalnymi wartosciami do oknaz prawej strony. W polach z prawej strony wpisujemynazwe i etykiete zmiennej grupujacej i klikamyZMIEN. Nastepnie klikamy na WARTOSCI ZRÓDŁOWEI WYNIKOWE... Dla kazdej klasy w ramce WARTOSCZRÓDŁOWA wybieramy ZAKRES i podajemy graniceklasy. W ramce WARTOSC WYNIKOWA wybieramyWARTOSC i podajemy srodek klasy. Klikamy DODAJ.Po wprowadzeniu wszystkich klas klikamy DALEJi OK. Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 24/64

Page 25: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych w SPSSiec.d.

Agregujemy zmienna zawierajaca srodki klas,zliczajac wystapienia. DANE -> AGREGUJ...Przenosimy zmienna ze srodkami klas do polaZMIENNE GRUPUJACE. Zaznaczamy LICZBAOBSERWACJI i wpisujemy nazwe zmiennej bedacejliczba obserwacji w grupie np. n_i. W ramce ZAPISZwybieramy UTWÓRZ NOWY ZBIÓR DANYCHZAWIERAJACY TYLKO ZAGREGOWANE ZMIENNE.Podajemy nazwe nowego pliku. Klikamy OK.

Otwieramy plik zawierajacy zagregowana zmienna— mamy szereg rozdzielczy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 25/64

Page 26: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Grupowanie danych w SPSSiec.d.

Wazymy obserwacje: DANE -> WAZENIEOBSERWACJI.... W ramce wybieramy ZWAZOBSERWACJE i podajemy, ze zmienna wazaca jestn_i.

Wykonujemy tabele czestosci i histogram zmiennejzawierajacej srodki klas tak jak wczesniej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 26/64

Page 27: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Miary tendencji centralnej

Oznaczenia:

N — liczebnosc próbki,

x1, x2, . . . , xN — obserwacje,

x(1), x(2), . . . , x(N) — obserwacje ustawione rosnaco.

Miary tendencji centralnej:

srednia (ang. mean),

mediana (ang. median),

moda, inaczej dominanta (ang. mode).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 27/64

Page 28: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Srednia

x =

∑Ni=1 xiN.

Srednia podajemy z dokładnoscia o 1 wieksza niz dane.

Suma odchylen wszystkich wartosci zmiennej odsredniej jest równa 0.

Suma kwadratów odchylen wartosci zmiennej odpewnej liczby a jest najmniejsza dla a bedacegosrednia.G. A. Ferguson, Y. Takane: Analiza statystyczna w psychologii i pedagogice, PWN, Warszawa(1997).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 28/64

Page 29: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Zalety i wady sredniej

Zalety:Moze byc wykorzystywana w dalszychobliczeniach statystycznych.Jest najmniej podatna na bład jako przyblizeniesredniej dla całej populacji.

Wady:Wrazliwa na nienormalnie duze lub nienormalniemałe wartosci skrajne.W przypadku rozkładów dwu- i wielomodalnychbywa mylaca.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 29/64

Page 30: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Przykłady

Dla danych z przykładu 2. srednia to 24, 0.

W dowcipie rysunkowym robotnik mówi dodziennikarki: Srednio rocznie w naszej firmie zarabiasie 100 000 zł. Prezes zarabia milion, a naszadziesiatka po 10 000.

1 000 000 + 10 · 10 00011

=1 100 000

11= 100 000.

Przykład 4. Dane z pliku Przykład 4. — dlazmiennych płaca i premia srednia wynosi 700$. Jestto dobra miara tendencji centralnej dla płacy, ale niedla premii, bo ta ma rozkład dwumodalny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 30/64

Page 31: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Mediana

Wartosc srodkowa. Jesli N jest nieparzyste, tomediana jest x((N+1)/2), a jesli parzyste, tox(N/2)+x((N/2)+1)

2 .

Suma odchylen bezwzglednych od mediany jestmniejsza niz suma takich odchylen od jakiejkolwiekinnej liczby.

Dla danych z przykładu 2. mediana to 24+252 = 24, 5.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 31/64

Page 32: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Zalety i wady mediany

Zalety:Łatwa do zrozumienia.Nie ulega deformacji ze wzgledu na nienormalnieduze lub nienormalnie małe wartosci skrajne.

Wady:Nie moze byc wykorzystywana w dalszychobliczeniach statystycznych.Dla małych zbiorów danych, o pewnej szczególnejpostaci, nie jest dobra charakterystyka tendencjicentralnej (np. mediana dla 5, 5, 5, 9, 10 jest 5).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 32/64

Page 33: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Moda

Słowo „moda” wymyslił Karl Pearson w 1895 roku.

Dwa podejscia:wartosc najczestsza,wartosc, która nie jest mniej czesta niz wartoscisasiednie.

Czasem przyjmuje sie zastrzezenie, ze moda niemoze byc wartoscia skrajna.

Jesli moda jest jedna, rozkład nazywamy jedno-modalnym (ang. unimodal), jesli dwie — dwumodalnym(ang. bimodal), a jesli wiele — multimodalnym (ang.multimodal). Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 33/64

Page 34: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Zalety i wady mody

Zalety:Łatwa do zrozumienia.Czesto wykorzystywana przez np. producentów.Jedyna miara tendencji centralnej dla danychnominalnych.

Wady:Nie moze byc wykorzystywana w dalszychobliczeniach statystycznych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 34/64

Page 35: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Miary rozproszenia

Rozstep (ang. range) R = xmax − xmin.Kwantyle(ang. quantiles):

kwartyle (ang. quartiles),decyle (ang. deciles) — Sir Francis Galton (1882),percentyle (ang. percentiles) — Sir FrancisGalton (1885).

Odchylenie standardowe (ang. standard deviation)— Karl Pearson (1893).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 35/64

Page 36: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kwartyle

Kwartyl dolny Q1 — mediana grupy danych „na lewood mediany”,

Kwartyl srodkowy Q2 to mediana.

Kwartyl górny Q3 — mediana grupy danych „naprawo od mediany”.

Dla danych z przykładu 2. mamy:

Q1 = 12, Q2 = 24, 5, Q3 = 35.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 36/64

Page 37: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kwantyle

Kwantyle rzedu m to punkty podziału próbki na m„równych” czesci. Kwantyli rzedu m jest m− 1.Kwantyle rzedu 4 to kwartyle. Kwantyle rzedu 10 todecyle, a rzedu 100 to percentyle.W SPSSie l-ty kwartyl rzedu m (dla l = 1, 2, . . . m− 1)jest liczony według wzoru

Q lm=

(

k + 1− (N + 1)l

m

)

x(k) +

(

(N + 1)l

m− k

)

x(k+1),

gdzie k =[

(N + 1) lm]

. Dla kwantyli moze to da ctroche inny wynik niz przy poprzedniej definicji!

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 37/64

Page 38: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kwartyle dla przykładu 2.

Liczac wzorem na kwantyle otrzymamy, zek = [11/4] = 2,

Q1 = Q 14=1

4x(2) +

3

4x(3) = 11

3

4,

Q3 = Q 14=3

4x(8) +

1

4x(9) = 35

1

4.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 38/64

Page 39: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wykresy skrzynkowe

Wykres skrzynkowy, inaczej skrzynka z wasami (ang.boxplot lub box-and-whisker diagram) zostałwprowadzony przez Tukeya. Rysujemy go wzdłuz jednejosi ze skala. Składa sie on z pudełka rozciagajacegosie od 1. do 3. kwartyla, z przedziałka na wysokoscimediany. Do pudełka doczepione sa wasy siegajace zjednej strony do najmniejszej wartosci zmiennej, a zdrugiej do najwiekszej wartosci zmiennej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 39/64

Page 40: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wykres skrzynkowy dlaprzykładu 2.

10 15 20 25 30 35 40

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 40/64

Page 41: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Udoskonalone wykresyskrzynkowe

Dla udoskonalonych wykresów skrzynkowych (ang.refined boxplots) wasy maja długosc nieprzekraczajaca1, 5×rozstep miedzykwartylowy (tzn. róznica Q3 −Q1).Kazda wartosc, która znajduje sie poza wasami jestoznaczana kółeczkiem lub gwiazdka i nazywa siewartoscia odstajaca lub outsiderem

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 41/64

Page 42: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Odchylenie standardowe

s =

∑Ni=1(xi − x)2

N=

∑Ni=1 x

2i

N− x2.

W przypadku, gdy zgromadzone dane traktujemy jakodane całej populacji, odchylenie standardoweobliczamy, dzielac powyzsze sumy przez N . Jeslinatomiast analizujemy próbke i otrzymane odchyleniestandardowe ma byc przyblizeniem odchyleniastandardowego w całej populacji, nalezy dzielic przezN − 1 (tak liczy PASW Statistics). Zapobiega toobciazeniu tego przyblizenia (estymatora).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 42/64

Page 43: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Własno sci odchyleniastandardowego

Jezeli do wszystkich wartosci zmiennej dodamypewna wartosc stała, to odchylenie standardowe niezmienia sie.

Jezeli wszystkie wartosci zmiennej pomnozymyprzez pewna liczbe, to odchylenie standardowerówniez zostanie pomnozone przez ta liczbe.

Odchylenie standardowe moze nie byc dobra miararozproszenia, gdy zmienna przyjmuje kilka wartoscibardzo oddalonych od reszty lub, gdy rozkład jestmocno skosny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 43/64

Page 44: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Odchylenie standardowe dlaprzykładu 2.

xi xi − x (xi − x)2 xi xi − x (xi − x)2

11 −13 169 25 1 1

11 −13 169 29 5 25

12 −12 144 35 11 121

18 −6 36 36 12 144

24 0 0 39 15 225

Sumujemy liczby z 3. i 6. kolumny, otrzymujac 1034.Stad

s =

1034

10≈ 10, 17, s =

1034

9≈ 10, 79.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 44/64

Page 45: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Skosno sc

g =1N

∑Ni=1(xi − x)3

s3.

Ang. skewness.

Rozkład nazywamy prawoskosnym, gdy g > 0,a lewoskosnym, gdy g < 0.

Przy rozkładzie prawoskosnym histogram madłuzszy prawy ogon, a przy lewoskosnym lewy.

Dla rozkładów prawoskosnych mediana jestmniejsza od sredniej, dla lewoskosnych — naodwrót.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 45/64

Page 46: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Skosno sc c.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: dodatnia, Rys. B: rozkład symetryczny, Rys. C: ujemna.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 46/64

Page 47: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Wzór na sko sno sc w PASWStatistics

g =N∑Ni=1(xi − x)3

(N − 1)(N − 2)s3.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 47/64

Page 48: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Krzywa rozkładu normalnego

Krzywa rozkładu normalnego (ang. normal (Gaussian)distribution curve) dana jest wzorem

f(x) =1√2πσexp

−(x− a)2

2σ2

,

gdzie a to punkt, w którym funkcja osiaga maksimum,a σ to parametr odpowiadajacy za kształt.

Wzór podał prawdopodobnie de Moivre w 1733 roku,okreslenie „normalny” — Galton w 1889,a „gaussowski” — K. Pearson w 1905.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 48/64

Page 49: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Krzywa rozkładu normalnegoc.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice, PWN,Warszawa (1997).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 49/64

Page 50: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Rozkład normalny — zmianaparametru σ

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: σ < 1, Rys. B: σ = 1, Rys. C: σ > 1.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 50/64

Page 51: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kurtoza

Ang. kurtosis — Karl Pearson (przed 1905).

K =1N

∑Ni=1(xi − x)4

s4.

Dla rozkładu normalnego K = 3.

K < 3— rozkład platykurtyczny (ang. platykurtic),bardziej płaski niz normalny,

K > 3— rozkład leptokurtyczny (ang. leptokurtic),bardziej spiczasty niz normalny,

K = 3— rozkład mezokurtyczny (ang. mesokurtic).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 51/64

Page 52: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kurtoza c.d.

D. L. Harnett, A. K. Soni: Statistical Methods for Business and Economics (1991). U góryrozkład platykurtyczny, u dołu — leptokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 52/64

Page 53: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kurtoza c.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: normalny, Rys. B: platykurtyczny, Rys. C: leptokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 53/64

Page 54: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Kurtoza w PASW Statistics

K =N(N + 1)

∑Ni=1(xi − x)4 − 3(N − 1)

(

∑Ni=1(xi − x)2

)2

(N − 1)(N − 2)(N − 3)s4.

K < 0— rozkład platykurtyczny,

K > 0— rozkład leptokurtyczny,

K = 0— rozkład mezokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 54/64

Page 55: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Statystyki w PASW Statistics

Najwiekszy wybór: ANALIZA -> OPIS STATYSTYCZNY-> CZESTOSCI... Nalezy kliknac STATYSTYKIi wybrac te, które nas interesuja.

ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKIOPISOWE... Nalezy kliknac OPCJE i wybrac testatystyki, które nas interesuja. Nie ma kwantyli.

ANALIZA -> OPIS STATYSTYCZNY ->EKSPLORACJA... Nie ma wyboru. Wyliczaja sie:srednia, mediana, odchylenie standardowe,minimum, maksimum, rozstep, skosnosc i kurtoza.Wykonuje sie wykres skrzynkowy!

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 55/64

Page 56: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Srednia dla danychzgrupowanych

W przypadku danych zgrupowanych zamiastkonkretnych wartosci danych bierzemy srodki klas.Srednia liczymy zgodnie ze wzorem:

x =

∑ki=1 ni · xi∑ki=1 ni

,

k — liczba klas, xi — srodek i-tej klasy, ni — liczebnosci-tej klasy.

Jest to tzw. srednia wazona. Oczywiscie srednia liczonaw ten sposób bedzie sie rózniła od sredniej policzonejz surowych danych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 56/64

Page 57: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Mediana dla danychzgrupowanych

me = al +b

nl

N

2−l−1∑

i=1

ni

,

al — lewy koniec klasy zawierajacej mediane,l — numer klasy zawierajacej mediane,N — liczebnosc próbki,ni — liczebnosc i-tej klasy,b— długosc klasy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 57/64

Page 58: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Moda dla danychzgrupowanych

Moda w szeregu rozdzielczym nazywamy srodeknajliczniejszej klasy w przypadku, gdy liczebnosci klassasiednich sa identyczne, albo — w przypadku, gdyliczebnosci klas sasiednich sa rózne — liczbe

m0 = al +nl − nl−1

(nl − nl−1) + (nl − nl+1)b,

al — lewy koniec klasy zawierajacej mode,l — numer klasy zawierajacej mode,ni — liczebnosc i-tej klasy,b— długosc klasy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 58/64

Page 59: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Moda dla danychzgrupowanych c.d.

b

5

10

25 34 43 52moda 70

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 59/64

Page 60: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Moda dla danychzgrupowanych c.d.

Uwaga: Moda zalezy od sposobu podziału na klasy!Dlatego czesto sie jej nie wyznacza, a mówi sie tylkoo przedziale modalnym.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 60/64

Page 61: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Odchylenie standardowe dladanych zgrupowanych

Dla danych zgrupowanych:

s =

∑ki=1 ni(xi − x)2

N=

∑ki=1 nix

2i

N− x2.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 61/64

Page 62: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Statystyki dla danychzgrupowanych w SPSSie

Grupujemy dane zgodnie z procedura omówionawczesniej.

Wazymy obserwacje (tez jak wczesniej).

Obliczamy statystyki wybierajac te same opcje, codla danych niezgrupowanych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 62/64

Page 63: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Literatura

George A. Ferguson, Yoshio Takane: Analizastatystyczna w psychologii i pedagogice, PWN,Warszawa (1997).

D. L. Harnett, A. K. Soni: Statistical Methods forBusiness and Economics (1991).

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska,M. Wasilewski: Rachunek prawdopodobienstwa istatystyka matematyczna w zadaniach, czesc II,PWN, Warszawa (1995).

Adam Łomnicki: Wprowadzenie do statystyki dlaprzyrodników, PWN, Warszawa (2003).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 63/64

Page 64: Podstawy statystyki i obsługa SPSSa na przykładach z ekonomiijoanka/zajecia/kurs_letni/wyklad2.pdf · 2009-07-02 · Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii

Literatura

Graham Upton, Ian Cook: A Dictionary of Statistics,Oxford University Press, New York (2006).

James A. Walker, Margaret M. McLean: Statystykadla kazdego, WSiP, Warszawa (1994).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 64/64