Podstawy statystyki i obsługa SPSSa na przykładach z...

Preview:

Citation preview

Podstawy statystykii obsługa SPSSa

na przykładach z ekonomiiKurs letni dla studentów studiów zamawianych

na kierunku „Matematyka w ekonomii i finansach” — wykład 2.

dr Joanna Karłowska-Pik

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 1/64

Tablice rozkładu czesto sci

Przykład 1. Dane dotyczace liczby sztuk sprzedanegotowaru objetego własnie promocja:

9 7 5 3 7 8 7 8 6 63 5 7 5 8 6 5 6 5 93 4 1 6 5 2 3 4 7 84 2 7 7 4 6 6 4 9 76 5 6 4 5 4 4 5 7 6

W tabeli podajemy wartosci danych, zliczamy dane(stawiajac kreski — ang. tally chart), czestosci,czestosci wzgledne i czestosci wzgledne skumulowane.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 2/64

Tabele czesto sci c.d.

Wartosci Zliczanie ni ni/N Skumulowane

1 | 1 1/50 1/50

2 || 2 2/50 3/50

3 |||| 4 4/50 7/50

4 ||||| ||| 8 8/50 15/50

5 ||||| |||| 9 9/50 24/50

6 ||||| ||||| 10 10/50 34/50

7 ||||| |||| 9 9/50 43/50

8 |||| 4 4/50 47/50

9 ||| 3 3/50 50/50=1Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 3/64

Histogramy dla danychniezgrupowanych

Ang. histogram. Termin wprowadzony przez KarlaPearsona w 1895 roku.

Szczególna kategoria wykresów słupkowych. Słupkirysujemy nad wartosciami zmiennej. Wysokoscsłupka odpowiada liczbie obserwacji, dla którychzmienna przyjmuje zadana wartosc.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 4/64

Histogram dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 5/64

Wielokaty czesto sci

Ang. frequency polygon. Powstaja przez połaczeniesrodków górnych krawedzi słupków histogramu. Srodkigórnych krawedzi słupków skrajnych nalezy połaczycz osia OX. Pole powierzchni wielokata powinno bycrówne sumie pól słupków histogramu. Wielokatczestosci przybliza nam kształt gestosci rozkładu(pojecie teorii prawdopodobienstwa).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 6/64

Wielokat czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 7/64

Wielokat czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 10012345678910

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 8/64

Krzywe czesto sciskumulowanych

Nad wartosciami zmiennych zaznaczamy czestosciwzgledne skumulowane. Otrzymane punkty łaczymykrzywa (w sposób „gładki”). Krzywa czestosciwzglednych przybliza wykres funkcji znanej w teoriiprawdopodobienstwa jako dystrybuanta.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 9/64

Krzywa czesto sci dla danychz przykładu

0 1 2 3 4 5 6 7 8 9 100

1

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 10/64

Tabele i histogramyw programie

ANALIZA -> OPIS STATYSTYCZNY -> CZESTOSCI...Przerzucamy do okna Zmienne zmienne, których tabelei histogramy chcemy utworzyc. Zaznaczamy POKAZTABELE CZESTOSCI. Klikamy WYKRESY... i zaznaczamyHISTOGRAMY. Klikamy DALEJ i OK.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 11/64

Diagram „łodyga i li scie”

Ang. steam and leaf diagram.

Przykład 2. 12, 36, 18, 25, 24, 11, 39, 11, 29, 35.

1 2 8 1 12 5 4 93 6 9 5

—>1 1 1 2 82 4 5 93 5 6 9

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 12/64

Diagram „łodyga i li scie”w programie

ANALIZA -> OPIS STATYSTYCZNY -> EKSPLORACJA...Przerzucamy zmienna do okienka Zmienne zalezne.Zaznaczamy POKAZ WYKRESY i klikamy WYKRESY...Przy wykresach skrzynkowych zaznaczamy BRAK, przyopisie ŁODYGA-I-LISCIE. Klikamy DALEJ i OK.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 13/64

Grupowanie danych

Stosuje sie głównie w przypadku duzej liczbydanych przyjmujacych wiele róznych wartosci.

Kiedys ułatwiało to obliczanie statystyk. Obecnie,gdy istnieje mozliwosc uzywania pakietówstatystycznych, stosuje sie tylko w celu prezentacjigraficznej, m.in. rysowania histogramów.

Zbyt duza liczba przedziałów moze powodowac, zeliczebnosci klas beda małe i nie bedzie widaccharakteru rozkładu. Zbyt mała moze spowodowac,ze sasiadujace ze soba przedziały o małej i duzejliczebnosci zostana połaczone w jeden.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 14/64

Grupowanie danych c.d.

Gdy przedziały maja byc równej szerokosci, to ichliczbe mozna wyliczyc ze wzorów:k ¬ 5 lnN ,k = 1 + 3, 322 lnN ,

k =√N ,

Sturgesa: k = [log2N + 1],

Scotta: k = 3,5s3√N ,

gdzie N to liczebnosc danych, a s odchyleniestandardowe.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 15/64

Grupowanie danych c.d.

Długosc klasy b ≈ xmax−xmink , przy czym stosujemyzawsze przyblizenie z nadmiarem.

Punkty stanowiace granice klas ustala siez dokładnoscia do α/2, gdzie α to dokładnosc z jakapodane sa dane.

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunekprawdopodobienstwa i statystyka matematyczna w zadaniach, czesc II, PWN, Warszawa(1995).

A. Łomnicki: Wprowadzenie do statystyki dla przyrodników, PWN, Warszawa (2003).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 16/64

Szereg rozdzielczy

Definicja: Dla danych pogrupowanych w klasy przezszereg rozdzielczy rozumiemy ciag par (xi, ni), gdzie xijest srodkiem i-tej klasy, a ni jej liczebnoscia.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 17/64

Przykład grupowania

Przykład 3.68 74 67 46 64 6561 53 69 54 44 3755 57 59 47 51 2173 62 47 64 50 4332 70 40 65 32 4958 46 62 73

N = 34. Liczbe klas wyznaczamy np. ze wzoruk ≈√N ≈ 6. Długosc klasy: b ≈ 74−216 = 53/6 ≈ 9.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 18/64

Tabela dla danych z przykładu

Przedział Zliczanie srodek xi ni ni/N Skumulowane

[20, 5; 29, 5) | 25 1 1/34 1/34

[29, 5; 38, 5) ||| 34 3 3/34 4/34

[38, 5; 47, 5) |||| 43 7 7/34 11/34

[47, 5; 56, 5) ||||| |||| 52 6 6/34 17/34

[56, 5; 65, 5) ||||| ||||| 61 10 10/34 27/34

[65, 5; 74, 5) ||||| || 70 7 7/34 34/34=1

Szereg rozdzielczy — 3. i 4. kolumna tabeli.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 19/64

Wykresy dla danychzgrupowanych

Zasady tworzenia dla danych zgrupowanychanalogiczne jak dla niezgrupowanych. Słupkihistogramu rysujemy nad wyznaczonymiprzedziałami.

Pola słupków histogramu odpowiadaja wartosciomliczbowym, słupki nie musza byc równej szerokosci.

Wyglad histogramu zalezny od obranej szerokosciprzedziałów oraz długosci jednostek na osipionowej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 20/64

Wykresy dla danychzgrupowanych c.d.

Punkty dla krzywej czestosci skumulowanychzaznaczamy nad prawymi brzegami klas.

Jezeli przy rysowaniu histogramu zamiast czestoscizaznaczymy czestosci wzgledne, to pole histogramui pole wielokata czestosci beda równe 1.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 21/64

Wielokat czesto sci i histogram

5

10

25 34 43 52 61 70

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 22/64

Krzywa czesto sci wzglednych

1

29.5 38.5 47.5 56.5 65.5 74.5

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 23/64

Grupowanie danych w SPSSie

Rekodujemy zmienne przyporzadkowujac danymz kazdej klasy srodek tej klasy. PRZEKSZTAŁCENIA-> REKODUJ NA INNE ZMIENNE... Przenosimyzmienna z oryginalnymi wartosciami do oknaz prawej strony. W polach z prawej strony wpisujemynazwe i etykiete zmiennej grupujacej i klikamyZMIEN. Nastepnie klikamy na WARTOSCI ZRÓDŁOWEI WYNIKOWE... Dla kazdej klasy w ramce WARTOSCZRÓDŁOWA wybieramy ZAKRES i podajemy graniceklasy. W ramce WARTOSC WYNIKOWA wybieramyWARTOSC i podajemy srodek klasy. Klikamy DODAJ.Po wprowadzeniu wszystkich klas klikamy DALEJi OK. Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 24/64

Grupowanie danych w SPSSiec.d.

Agregujemy zmienna zawierajaca srodki klas,zliczajac wystapienia. DANE -> AGREGUJ...Przenosimy zmienna ze srodkami klas do polaZMIENNE GRUPUJACE. Zaznaczamy LICZBAOBSERWACJI i wpisujemy nazwe zmiennej bedacejliczba obserwacji w grupie np. n_i. W ramce ZAPISZwybieramy UTWÓRZ NOWY ZBIÓR DANYCHZAWIERAJACY TYLKO ZAGREGOWANE ZMIENNE.Podajemy nazwe nowego pliku. Klikamy OK.

Otwieramy plik zawierajacy zagregowana zmienna— mamy szereg rozdzielczy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 25/64

Grupowanie danych w SPSSiec.d.

Wazymy obserwacje: DANE -> WAZENIEOBSERWACJI.... W ramce wybieramy ZWAZOBSERWACJE i podajemy, ze zmienna wazaca jestn_i.

Wykonujemy tabele czestosci i histogram zmiennejzawierajacej srodki klas tak jak wczesniej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 26/64

Miary tendencji centralnej

Oznaczenia:

N — liczebnosc próbki,

x1, x2, . . . , xN — obserwacje,

x(1), x(2), . . . , x(N) — obserwacje ustawione rosnaco.

Miary tendencji centralnej:

srednia (ang. mean),

mediana (ang. median),

moda, inaczej dominanta (ang. mode).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 27/64

Srednia

x =

∑Ni=1 xiN.

Srednia podajemy z dokładnoscia o 1 wieksza niz dane.

Suma odchylen wszystkich wartosci zmiennej odsredniej jest równa 0.

Suma kwadratów odchylen wartosci zmiennej odpewnej liczby a jest najmniejsza dla a bedacegosrednia.G. A. Ferguson, Y. Takane: Analiza statystyczna w psychologii i pedagogice, PWN, Warszawa(1997).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 28/64

Zalety i wady sredniej

Zalety:Moze byc wykorzystywana w dalszychobliczeniach statystycznych.Jest najmniej podatna na bład jako przyblizeniesredniej dla całej populacji.

Wady:Wrazliwa na nienormalnie duze lub nienormalniemałe wartosci skrajne.W przypadku rozkładów dwu- i wielomodalnychbywa mylaca.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 29/64

Przykłady

Dla danych z przykładu 2. srednia to 24, 0.

W dowcipie rysunkowym robotnik mówi dodziennikarki: Srednio rocznie w naszej firmie zarabiasie 100 000 zł. Prezes zarabia milion, a naszadziesiatka po 10 000.

1 000 000 + 10 · 10 00011

=1 100 000

11= 100 000.

Przykład 4. Dane z pliku Przykład 4. — dlazmiennych płaca i premia srednia wynosi 700$. Jestto dobra miara tendencji centralnej dla płacy, ale niedla premii, bo ta ma rozkład dwumodalny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 30/64

Mediana

Wartosc srodkowa. Jesli N jest nieparzyste, tomediana jest x((N+1)/2), a jesli parzyste, tox(N/2)+x((N/2)+1)

2 .

Suma odchylen bezwzglednych od mediany jestmniejsza niz suma takich odchylen od jakiejkolwiekinnej liczby.

Dla danych z przykładu 2. mediana to 24+252 = 24, 5.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 31/64

Zalety i wady mediany

Zalety:Łatwa do zrozumienia.Nie ulega deformacji ze wzgledu na nienormalnieduze lub nienormalnie małe wartosci skrajne.

Wady:Nie moze byc wykorzystywana w dalszychobliczeniach statystycznych.Dla małych zbiorów danych, o pewnej szczególnejpostaci, nie jest dobra charakterystyka tendencjicentralnej (np. mediana dla 5, 5, 5, 9, 10 jest 5).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 32/64

Moda

Słowo „moda” wymyslił Karl Pearson w 1895 roku.

Dwa podejscia:wartosc najczestsza,wartosc, która nie jest mniej czesta niz wartoscisasiednie.

Czasem przyjmuje sie zastrzezenie, ze moda niemoze byc wartoscia skrajna.

Jesli moda jest jedna, rozkład nazywamy jedno-modalnym (ang. unimodal), jesli dwie — dwumodalnym(ang. bimodal), a jesli wiele — multimodalnym (ang.multimodal). Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 33/64

Zalety i wady mody

Zalety:Łatwa do zrozumienia.Czesto wykorzystywana przez np. producentów.Jedyna miara tendencji centralnej dla danychnominalnych.

Wady:Nie moze byc wykorzystywana w dalszychobliczeniach statystycznych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 34/64

Miary rozproszenia

Rozstep (ang. range) R = xmax − xmin.Kwantyle(ang. quantiles):

kwartyle (ang. quartiles),decyle (ang. deciles) — Sir Francis Galton (1882),percentyle (ang. percentiles) — Sir FrancisGalton (1885).

Odchylenie standardowe (ang. standard deviation)— Karl Pearson (1893).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 35/64

Kwartyle

Kwartyl dolny Q1 — mediana grupy danych „na lewood mediany”,

Kwartyl srodkowy Q2 to mediana.

Kwartyl górny Q3 — mediana grupy danych „naprawo od mediany”.

Dla danych z przykładu 2. mamy:

Q1 = 12, Q2 = 24, 5, Q3 = 35.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 36/64

Kwantyle

Kwantyle rzedu m to punkty podziału próbki na m„równych” czesci. Kwantyli rzedu m jest m− 1.Kwantyle rzedu 4 to kwartyle. Kwantyle rzedu 10 todecyle, a rzedu 100 to percentyle.W SPSSie l-ty kwartyl rzedu m (dla l = 1, 2, . . . m− 1)jest liczony według wzoru

Q lm=

(

k + 1− (N + 1)l

m

)

x(k) +

(

(N + 1)l

m− k

)

x(k+1),

gdzie k =[

(N + 1) lm]

. Dla kwantyli moze to da ctroche inny wynik niz przy poprzedniej definicji!

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 37/64

Kwartyle dla przykładu 2.

Liczac wzorem na kwantyle otrzymamy, zek = [11/4] = 2,

Q1 = Q 14=1

4x(2) +

3

4x(3) = 11

3

4,

Q3 = Q 14=3

4x(8) +

1

4x(9) = 35

1

4.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 38/64

Wykresy skrzynkowe

Wykres skrzynkowy, inaczej skrzynka z wasami (ang.boxplot lub box-and-whisker diagram) zostałwprowadzony przez Tukeya. Rysujemy go wzdłuz jednejosi ze skala. Składa sie on z pudełka rozciagajacegosie od 1. do 3. kwartyla, z przedziałka na wysokoscimediany. Do pudełka doczepione sa wasy siegajace zjednej strony do najmniejszej wartosci zmiennej, a zdrugiej do najwiekszej wartosci zmiennej.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 39/64

Wykres skrzynkowy dlaprzykładu 2.

10 15 20 25 30 35 40

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 40/64

Udoskonalone wykresyskrzynkowe

Dla udoskonalonych wykresów skrzynkowych (ang.refined boxplots) wasy maja długosc nieprzekraczajaca1, 5×rozstep miedzykwartylowy (tzn. róznica Q3 −Q1).Kazda wartosc, która znajduje sie poza wasami jestoznaczana kółeczkiem lub gwiazdka i nazywa siewartoscia odstajaca lub outsiderem

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 41/64

Odchylenie standardowe

s =

∑Ni=1(xi − x)2

N=

∑Ni=1 x

2i

N− x2.

W przypadku, gdy zgromadzone dane traktujemy jakodane całej populacji, odchylenie standardoweobliczamy, dzielac powyzsze sumy przez N . Jeslinatomiast analizujemy próbke i otrzymane odchyleniestandardowe ma byc przyblizeniem odchyleniastandardowego w całej populacji, nalezy dzielic przezN − 1 (tak liczy PASW Statistics). Zapobiega toobciazeniu tego przyblizenia (estymatora).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 42/64

Własno sci odchyleniastandardowego

Jezeli do wszystkich wartosci zmiennej dodamypewna wartosc stała, to odchylenie standardowe niezmienia sie.

Jezeli wszystkie wartosci zmiennej pomnozymyprzez pewna liczbe, to odchylenie standardowerówniez zostanie pomnozone przez ta liczbe.

Odchylenie standardowe moze nie byc dobra miararozproszenia, gdy zmienna przyjmuje kilka wartoscibardzo oddalonych od reszty lub, gdy rozkład jestmocno skosny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 43/64

Odchylenie standardowe dlaprzykładu 2.

xi xi − x (xi − x)2 xi xi − x (xi − x)2

11 −13 169 25 1 1

11 −13 169 29 5 25

12 −12 144 35 11 121

18 −6 36 36 12 144

24 0 0 39 15 225

Sumujemy liczby z 3. i 6. kolumny, otrzymujac 1034.Stad

s =

1034

10≈ 10, 17, s =

1034

9≈ 10, 79.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 44/64

Skosno sc

g =1N

∑Ni=1(xi − x)3

s3.

Ang. skewness.

Rozkład nazywamy prawoskosnym, gdy g > 0,a lewoskosnym, gdy g < 0.

Przy rozkładzie prawoskosnym histogram madłuzszy prawy ogon, a przy lewoskosnym lewy.

Dla rozkładów prawoskosnych mediana jestmniejsza od sredniej, dla lewoskosnych — naodwrót.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 45/64

Skosno sc c.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: dodatnia, Rys. B: rozkład symetryczny, Rys. C: ujemna.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 46/64

Wzór na sko sno sc w PASWStatistics

g =N∑Ni=1(xi − x)3

(N − 1)(N − 2)s3.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 47/64

Krzywa rozkładu normalnego

Krzywa rozkładu normalnego (ang. normal (Gaussian)distribution curve) dana jest wzorem

f(x) =1√2πσexp

−(x− a)2

2σ2

,

gdzie a to punkt, w którym funkcja osiaga maksimum,a σ to parametr odpowiadajacy za kształt.

Wzór podał prawdopodobnie de Moivre w 1733 roku,okreslenie „normalny” — Galton w 1889,a „gaussowski” — K. Pearson w 1905.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 48/64

Krzywa rozkładu normalnegoc.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice, PWN,Warszawa (1997).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 49/64

Rozkład normalny — zmianaparametru σ

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: σ < 1, Rys. B: σ = 1, Rys. C: σ > 1.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 50/64

Kurtoza

Ang. kurtosis — Karl Pearson (przed 1905).

K =1N

∑Ni=1(xi − x)4

s4.

Dla rozkładu normalnego K = 3.

K < 3— rozkład platykurtyczny (ang. platykurtic),bardziej płaski niz normalny,

K > 3— rozkład leptokurtyczny (ang. leptokurtic),bardziej spiczasty niz normalny,

K = 3— rozkład mezokurtyczny (ang. mesokurtic).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 51/64

Kurtoza c.d.

D. L. Harnett, A. K. Soni: Statistical Methods for Business and Economics (1991). U góryrozkład platykurtyczny, u dołu — leptokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 52/64

Kurtoza c.d.

George A. Ferguson, Yoshio Takane: Analiza statystyczna w psychologii i pedagogice (1997).Rys. A: normalny, Rys. B: platykurtyczny, Rys. C: leptokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 53/64

Kurtoza w PASW Statistics

K =N(N + 1)

∑Ni=1(xi − x)4 − 3(N − 1)

(

∑Ni=1(xi − x)2

)2

(N − 1)(N − 2)(N − 3)s4.

K < 0— rozkład platykurtyczny,

K > 0— rozkład leptokurtyczny,

K = 0— rozkład mezokurtyczny.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 54/64

Statystyki w PASW Statistics

Najwiekszy wybór: ANALIZA -> OPIS STATYSTYCZNY-> CZESTOSCI... Nalezy kliknac STATYSTYKIi wybrac te, które nas interesuja.

ANALIZA -> OPIS STATYSTYCZNY -> STATYSTYKIOPISOWE... Nalezy kliknac OPCJE i wybrac testatystyki, które nas interesuja. Nie ma kwantyli.

ANALIZA -> OPIS STATYSTYCZNY ->EKSPLORACJA... Nie ma wyboru. Wyliczaja sie:srednia, mediana, odchylenie standardowe,minimum, maksimum, rozstep, skosnosc i kurtoza.Wykonuje sie wykres skrzynkowy!

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 55/64

Srednia dla danychzgrupowanych

W przypadku danych zgrupowanych zamiastkonkretnych wartosci danych bierzemy srodki klas.Srednia liczymy zgodnie ze wzorem:

x =

∑ki=1 ni · xi∑ki=1 ni

,

k — liczba klas, xi — srodek i-tej klasy, ni — liczebnosci-tej klasy.

Jest to tzw. srednia wazona. Oczywiscie srednia liczonaw ten sposób bedzie sie rózniła od sredniej policzonejz surowych danych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 56/64

Mediana dla danychzgrupowanych

me = al +b

nl

N

2−l−1∑

i=1

ni

,

al — lewy koniec klasy zawierajacej mediane,l — numer klasy zawierajacej mediane,N — liczebnosc próbki,ni — liczebnosc i-tej klasy,b— długosc klasy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 57/64

Moda dla danychzgrupowanych

Moda w szeregu rozdzielczym nazywamy srodeknajliczniejszej klasy w przypadku, gdy liczebnosci klassasiednich sa identyczne, albo — w przypadku, gdyliczebnosci klas sasiednich sa rózne — liczbe

m0 = al +nl − nl−1

(nl − nl−1) + (nl − nl+1)b,

al — lewy koniec klasy zawierajacej mode,l — numer klasy zawierajacej mode,ni — liczebnosc i-tej klasy,b— długosc klasy.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 58/64

Moda dla danychzgrupowanych c.d.

b

5

10

25 34 43 52moda 70

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 59/64

Moda dla danychzgrupowanych c.d.

Uwaga: Moda zalezy od sposobu podziału na klasy!Dlatego czesto sie jej nie wyznacza, a mówi sie tylkoo przedziale modalnym.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 60/64

Odchylenie standardowe dladanych zgrupowanych

Dla danych zgrupowanych:

s =

∑ki=1 ni(xi − x)2

N=

∑ki=1 nix

2i

N− x2.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 61/64

Statystyki dla danychzgrupowanych w SPSSie

Grupujemy dane zgodnie z procedura omówionawczesniej.

Wazymy obserwacje (tez jak wczesniej).

Obliczamy statystyki wybierajac te same opcje, codla danych niezgrupowanych.

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 62/64

Literatura

George A. Ferguson, Yoshio Takane: Analizastatystyczna w psychologii i pedagogice, PWN,Warszawa (1997).

D. L. Harnett, A. K. Soni: Statistical Methods forBusiness and Economics (1991).

W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska,M. Wasilewski: Rachunek prawdopodobienstwa istatystyka matematyczna w zadaniach, czesc II,PWN, Warszawa (1995).

Adam Łomnicki: Wprowadzenie do statystyki dlaprzyrodników, PWN, Warszawa (2003).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 63/64

Literatura

Graham Upton, Ian Cook: A Dictionary of Statistics,Oxford University Press, New York (2006).

James A. Walker, Margaret M. McLean: Statystykadla kazdego, WSiP, Warszawa (1994).

Podstawy statystyki i obsługa SPSSa na przykładach z ekonomii – p. 64/64