55
ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

  • Upload
    oakes

  • View
    62

  • Download
    1

Embed Size (px)

DESCRIPTION

ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH. Dr inż. Agnieszka Strzelczak Zakład Inżynierii Procesowej i Maszynoznawstwa E-mail: [email protected] Tel: +48 91 449 65 36 Pokój: 308 PP Konsultacje: środa 11.30 – 13.30. - PowerPoint PPT Presentation

Citation preview

Page 1: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Page 2: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Dr inż. Agnieszka Strzelczak

Zakład Inżynierii Procesowej i Maszynoznawstwa

E-mail: [email protected]

Tel: +48 91 449 65 36

Pokój: 308 PP

Konsultacje: środa 11.30 – 13.30

Page 3: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Statystyka jest tylko narzędziem pozwalającym sprawdzić nasze

pomysły badawcze

Analiza wyników badań opopiera się na statystyce

Page 4: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

"Istnieją trzy rodzaje kłamstwa: przepowiadanie

pogody, statystyka i komunikat dyplomatyczny.”

Jean Rigaux

Page 5: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

"Statystyka to matematyczny kamuflaż błędu.”

Georges Elgozy

Page 6: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

„Jeśli mój sąsiad codziennie bije swoją żonę, ja zaś nie biję jej nigdy, to w świetle

statystyki obaj bijemy je co drugi dzień.”

George Bernard Shaw

Page 7: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

„Statystyka jest jak kostium bikini: pokazuje wiele, ale nie pokazuje najważniejszego.”

Aaron Levenstein

Page 8: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

„Istnieją trzy rodzaje kłamstw: kłamstwa, okropne

kłamstwa, statystyki.”

Benjamin Disraeli

Page 9: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Po co więc ta „cała” statystyka?

Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą.

Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać!

Statystyka: obejmuje metody pozyskiwania, prezentacji i analizy danych

Użycie statystyki do badania zjawisk sprawia, że badanie jest oparte na sprawdzonych i

dopracowanych metodach

Page 10: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Pojęcie statystyki

Statystyka jest dyscypliną naukową, zajmującą się „konstrukcją metod liczbowego opisu i wnioskowania o zjawiskach masowych”. Z takiej definicji wynika, że należy wyróżnić tutaj dwa pojęcia:

metodę i zjawisko masowe.

Page 11: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Metoda statystyczna

Jest to sposób badania liczbowego określonych zbiorowości, za pomocą odpowiednich narzędzi i procedur.

Page 12: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Zjawisko masowe

Zjawisko które często występuje, dotyczy ono więc wystarczająco dużej liczby jednostek. Dla odróżnienia, jednostkowym zjawiskiem jest pojedyncze, lub rzadko występujące zdarzenia.

Niektóre zjawiska mogą być traktowane jednostkowo jak i masowo, w zależności od perspektywy z jakiej je

analizujemy.

Przykład: Przyjęcie do przedsiębiorstwa dla nowego pracownika jest zjawiskiem jednostkowym, natomiast dla działu kadr takie zdarzenie będzie jednym z wielu podobnych, a więc będzie traktowane jako zjawisko masowe.

Page 13: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Zjawisko masowe cd.

Dane zjawisko można zaliczyć do masowych, wówczas gdy miała miejsce duża liczba przypadków jego występowania, co umożliwia zaobserwowanie pewnych prawidłowości statystycznych.

Obserwacja pojedynczej jednostki lub niewielkiego zespołu nie prowadzi do wykrycia prawidłowości

zjawiska.

Page 14: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Zbiorowość statystyczna (populacja)

Zespół jednostek objętych badaniem statystycznym (np. istot żywych, przedmiotów, przedsiębiorstw, obszarów geograficznych, zjawisk), które mają chociaż jedną wspólną cechę, a różnią się z innych punktów widzenia.

Page 15: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Zbiorowość statystyczna (populacja) cd.

Przykład zbiorowości stat.: studenci określonego województwa, mają dwie cechy wspólne: mieszkają w tym samym województwie i studiują, różnią się między sobą rodzajem uczelni do jakich uczęszczają, ocenami, cechami osobowości, wyglądem, płcią itd.

Zbiorowością stat. nie są np. krzesła w auli wykładowej o takim samym kształcie, kolorze, stopniu zużycia.

Page 16: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Próba statystyczna z populacji (zbiorowość)

Zbiór obserwacji statystycznych wybranych (zwykle wylosowanych) z populacji.

Page 17: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Jednostka statystyczna

Elementy składowe zbiorowości (próby) nazywane są jednostkami statystycznymi (jednostki badania, obserwacji).

Page 18: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Liczebność zbiorowości (próby)

Suma jednostek statystycznych ujmowana jest jako liczebność zbiorowości (oznaczana jest symbolem N)

Page 19: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Podstawowe pojęcia

Cechy statystyczne

Jednostka statystyczna w ramach zbiorowości statystycznej, charakteryzuje się wieloma

właściwościami, czyli cechami statystycznymi.

Cechy stałe (wspólne dla wszystkich

jednostek danej zbiorowości):

Nie podlegają analizie statystycznej

Cechy zmienne (różnicujące jednostki

między sobą:Podlegają analizie

statystycznej

Page 20: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PROCES BADAWCZY

1) Wymyślamy pytanie badawcze - np. „Czy liczebności ryb w 2 zbiornikach istotnie się różnią?”

2) Znajdujemy lub tworzymy zmienne, które mierzą odpowiednie zjawiska

NO3, PO4 ....

Page 21: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PROCES BADAWCZY

3) Sprawdzamy statystyki opisowe - oglądamy dane

rysunki, wykresy, średnie

4) Sprawdzamy hipotezy testem statystycznym

ważny jest poziom istotności (p)

<<

Page 22: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PROCES BADAWCZY

5) Sprawdzamy czy dane pasują do modelu statystycznego założenia dotyczące testów statystycznych

6) Rozważamy wyjaśnienia alternatywne - szukamy innych teorii

(jeśli znajdziemy to powinniśmy powtórzyć od początku)

Page 23: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

TERMINOLOGIA

Przypadki i zmienne:

Przypadki są odpowiednikami rekordów w bazach danych lub wierszy w arkuszach kalkulacyjnych.

Zmienne są zaś odpowiednikami pól lub kolumn.

Każdy przypadek jest zbiorem wartości zmiennych.

Page 24: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

TERMINOLOGIA

ZMIENNA

PRZYPADEK

Page 25: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

ETAPY ANALIZY STATYSTYCZNEJ

POPULACJA

PRÓBKA

POMIARY

OBLICZENIA

WYNIKI

ANALIZA

Page 26: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

ETAPY ANALIZY STATYSTYCZNEJ

POPULACJA

PRÓBKA

POMIARY

OBLICZENIA

WYNIKI

ANALIZA

Page 27: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PRÓBKA

WYBÓR PRÓBKI:

Próbka wybrana do badania musi być odpowiednia

Wybór próbki jest kluczowy etapem z punktu widzenia wiarygodności końcowych wyników

DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!!

Page 28: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

REPREZENTATYWNOŚĆ PRÓBKI

Próbka reprezentatywna: w dobry sposób odzwierciedla populację, z której została pobrana

Dla zapewnienia reprezentatywności konieczna jest odpowiednia liczebność próbki. Im większa próbka, tym bardziej wiarygodne wyniki.

Uwaga! Liczności nie można zwiększać w nieskończoność (koszty analiz!). Należy szukać optimum pomiędzy kosztami a wiarygodnością wyników.

Page 29: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Liczebność próby

Przeprowadzając badania z populacji generalnej pobieramy próbę:

n 100 próba b. dużan 30 próba duża10 n < 30 próba małan < 10 próba b. mała

Page 30: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Dana: każda informacja opisująca badane zjawisko/obiekt

Typy danych:

dane kategorialne (uzyskiwane przy ocenie metodą alternatywną)

dane liczbowe (pochodzące z pomiarów)

Page 31: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Typy danych: dane kategorialne

Uzyskuje się je w przypadkach:

dzielenia (klasyfikowania) przedmiotów na kategorie

zliczania liczby przedmiotów w danych kategoriach

zliczania proporcji przedmiotów

zliczania liczby braków/obecności

Page 32: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Typy danych: dane kategorialne

Są one często wykorzystywane w praktyce, bo do ich zebrania zazwyczaj nie potrzeba skomplikowanych i dokładnych urządzeń pomiarowych.

Przykład: klasyfikacja czystości wody, stwierdzanie braku/obecności danego gatunku ryby w jeziorze

Page 33: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Typy danych: dane kategorialne

Zwykle stosuje się 2 kategorie: brak i obecność.

Można jednak stosować więcej kategorii, które odzwierciedlać będą jakość.

Przykład: klasy czystości wód I, II, III. Klasa I- najwyższej jakości, klasa III- najgorszej.

Page 34: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Typy danych: dane kategorialne

Zalety:

prostota czytelność otrzymanych wyników

Wady:

nieprecyzyjność

Page 35: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

RODZAJE DANYCH

Typy danych: dane liczbowe

Uzyskuje się je w przypadkach:

pomiarów cechy obiektu badań

przeliczania numerycznych wartości z dwóch lub więcej pomiarów liczbowych

Wymóg: korzystanie z urządzeń pomiarowych

Page 36: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Najprostszy sposób: spisywanie w rzędzie np.:

5,6,9,11,6,7,7,6,5,9,7,8,7,6,7,8,4,8,7,8,10,10,9,7,8,...

Ten zapis jest nieczytelny i mało użyteczny

Page 37: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Użyteczne metody prezentacji danych:

tabela częstości wystąpień (liczności)

histogram

wykres punktowy

Page 38: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Tabela częstości wystąpień

Wartość danej Wystąpienie danej Liczba wystąpień

3 0

4 2

5 3

6 5

7 1

Page 39: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Tabela częstości wystąpień

Z tabeli takiej można łatwo odczytać:

ile pomiarów o danej wartości zarejestrowano

która wartość powtarzała się najczęściej

w jakim zakresie pojawiają się dane (minimum i maksimum)

Page 40: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Histogram

Jest pewnym rozwinięciem tabeli liczności.

Szczególnie przydatny do prezentowania dużej ilości danych liczbowych i kategorialnych.

Page 41: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Histogram

31,820 33,100 33,780 34,650 34,870 35,530 36,750

32,010 33,120 33,790 34,690 34,880 35,620 36,680

32,010 33,260 33,790 34,690 34,900 35,780 36,780

32,050 33,260 33,790 34,720 34,920 35,790 36,850

32,230 33,280 33,820 34,720 34,960 35,860 38,520

32,600 33,300 33,820 34,810 35,090 36,120

32,950 33,360 33,860 34,810 35,120 36,250

33,030 33,540 33,950 34,810 35,160 36,560

33,050 33,560 34,210 34,860 35,280 36,560

33,060 33,750 34,220 34,870 35,290 36,590

Page 42: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Histogram

Procedura rysowania histogramu:

1.Posortowanie danych w porządku od najmniejszej do największej: nasze dane są już tak ustawione

2. Wyznaczenie wartości najmniejszej i największej: w naszym zbiorze wartość najmniejsze xmin=31,820, wartość największa xmax=38,520

Page 43: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCHHistogramProcedura rysowania histogramu:

3. Obliczenie szerokości zakresu, w jakim pojawiają się dane (rozstępu): R=xmax-xmin=38,520-31,820=6,7

4. Wyznaczenie liczby przedziałów: ilość przedziałów= pierwiastek(ilość pomiarów) =pierwiastek(65)=8,068 UWAGA! Zasady tej nie stosujemy przy dużej liczbie pomiarów (>100). Zasadniczo liczba przedziałów powinna się mieścić w przedziale <6,12>

Page 44: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Histogram

Procedura rysowania histogramu:

5. Ustalenie szerokości przedziałów: szerokość przedziału=rozstęp/l-ba przedziałów =6,7/8=0,831

Otrzymaną wartość zaokrąglamy w taki sposób, aby narysowany histogram był jak najbardziej czytelny (tutaj do wartości 1)

Page 45: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCHHistogram

Procedura rysowania histogramu:

6. Rozpisanie przedziałów i obliczenie, ile w każdym z nich znajduje się wyników:

Przedział wartości Ilość wyników w przedziale

(31,32] 1

(32,33] 6

(33,34] 21

(34,35] 17

(35,36] 10

(36,37] 9

(37,38] 0

(38,39] 1

Page 46: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

Histogram

Procedura rysowania histogramu:

6. Narysowanie wykresu: w zależności od liczby wyników w poszczególnych przedziałach, rysuje się odpowiednią wysokość słupka.

Page 47: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Histogram

0

5

10

15

20

25

(31,32] (32,33] (33,34] (34,35] (35,36] (36,37] (37,38] (38,39]

Przedział

Iloś

ć w

ystą

pień

.

Page 48: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Typy rozkładów (histogramów)

Page 49: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Typy rozkładów (histogramów)

Amodalny = skrajnie asymetryczny

Page 50: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

Typy rozkładów (histogramów)

Page 51: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Wykres punktowy

Tabela Dane z pomiarów zagęszczenia makrozoobentosu w zależności od głębokości.

Pomiary w próbce

Głębokość [m]

1 2 3 4 5

1 32,76 33,37 36,54 36,20 36,74

2 32,72 33,11 35,11 36,58 36,40

3 32,70 33,15 36,02 35,24 36,43

4 32,69 33,25 35,59 36,14 36,72

5 32,67 33,20 36,03 35,52 36,55

Page 52: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Wykres punktowy

Rys. Wykres punktowy zależności pomiędzy głębokością a zagęszczeniem makrozoobentosu.

32

32.5

33

33.5

34

34.5

35

35.5

36

36.5

37

1410 1420 1430 1440 1450 1460 1470 1480 1490

Obroty [obr/min]

Uzi

arni

enie

Głębokość w [m]

Zag

ęszc

zeni

e [o

s./m

2 ]

1 2 3 4 5

Page 53: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Wykres punktowy

im większa głębokość tym większe zagęszczenie

32

32.5

33

33.5

34

34.5

35

35.5

36

36.5

37

1410 1420 1430 1440 1450 1460 1470 1480 1490

Obroty [obr/min]

Uzi

arni

enie

Głębokość w [m]

Zag

ęszc

zeni

e [o

s./m

2 ]

1 2 3 4 5

Page 54: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Wykres punktowy

przy głębokości 3 i 4 m zagęszczenie charakteryzuje się największą zmiennością

32

32.5

33

33.5

34

34.5

35

35.5

36

36.5

37

1410 1420 1430 1440 1450 1460 1470 1480 1490

Obroty [obr/min]

Uzi

arni

enie

Głębokość w [m]

Zag

ęszc

zeni

e [o

s./m

2 ]

1 2 3 4 5

Page 55: ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH

PREZENTOWANIE DANYCH

PODSTAWY – DANE I ICH PREZENTACJA

Wykres punktowy

zagęszczenie jest najbardziej jednorodne na głębokości 1m

32

32.5

33

33.5

34

34.5

35

35.5

36

36.5

37

1410 1420 1430 1440 1450 1460 1470 1480 1490

Obroty [obr/min]

Uzi

arni

enie

Głębokość w [m]

Zag

ęszc

zeni

e [o

s./m

2 ]

1 2 3 4 5