Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Valószínuségszámítás és statisztika afizikában
2019. május 3.
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adat, minta, statisztikus sokaság
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
• és ezek alapján próbálunk következtetéseket levonni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikai vizsgálat
Egy statisztikai vizsgálat során
• vannak adataink valamirol,
• és ezek alapján próbálunk következtetéseket levonni.
• Az esetek dönto többségében ezek a következtetések vagy egyparaméter értékére, vagy egy esemény valószínuségérevonatkoznak.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
ADATOK
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• Kvantitatív adatok: méréseket vagy leszámlálásokat jellemzoszámok.
• Kvalitatív adatok: kategóriákra bonthatók, melyeket valamilyennemnumerikus jellemzok alapján különböztetünk meg, pl. férfi/no.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adattípusok
• A kvantitatív adattípust tovább bonthatjuk:
- diszkrét: amikor a lehetséges adatok száma véges vagymegszámlálható. (Pl. tyúkok által tojt tojások száma).
- folytonos: amikor az adat végtelen sok lehetséges értéketvehet fel egy folytonos skálán. (Pl. a tehén által naponta adotttej mennyisége literben).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
Egy másik lehetoség az adatok jellemzésére, hogy megadjuk aszintjüket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdattípusokA mérések szintje
• Nominális szintu mérés: elnevezéseket, címkéket, vagykategóriákat tartalmazó adatok, melyeket nem lehet valami szerintrendezni.Pl.: kérdoíves válasznál igen, nem, nem tudom.
• Ordinális szintu mérés: olyan adatok, melyeket lehet rendezni, deaz adatok közti különbségeknek nincs értelmük, vagy nem lehetmeghatározni.Pl.: egyetemek sorrendje, érdemjegyek mint jeles, jó, közepes, stb.
• Intervallum szintu mérés: rendezheto adatok, melyeknél akülönbségeknek is van értelmük, de nincs természetes nullpont(ami pl. valamilyen mennyiség nemlétét jelezné), és emiatt azarányoknak nincs értelme.Pl.: évek mint 1848 vagy 1526, beérkezési idok egy kísérletnél, stb.
• Arány szintu mérés: az adatok rendezhetok, a különbségnek vanértelme és van természetes nullpont, ami azt jelzi, hogy az adottmérendo mennyiség nincs jelen. Ekkor az arányoknak is vanértelmePl.: árak (a 0Ft azt jelenti, hogy az adott termék vagy szolgáltatásnem kerül semmibe). ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
• Érdekelt adatgyujtok (pl. gyógyszercégek).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Tipikus problémák adatgyujtésnél:
• Kis minták.
• Kérdések sorrendjétol függ a válasz:
- Ön mit mondana, a közlekedési vagy az ipari légszennyezésmagasabb? (45% - 27%)
- Ön mit mondana, az ipari vagy a közlekedési légszennyezésmagasabb? (24% - 57%)
• Közvélemény-kutatásnál a nem válaszolók. (Általában különböznekazoktól, akik válaszolnak).
• Érdekelt adatgyujtok (pl. gyógyszercégek).
• Önkényes szelekció a figyelembe vett adatok között.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
Adatgyujtés fajtái:• Megfigyeléses vizsgálat (observational study): bizonyos jellemzo
tulajdonságok megfigyelése és mérése anélkül, hogymegváltoztatnánk a vizsgálat tárgyát/alanyát.Pl.: csillagászati/asztrofizikai megfigyelések.
• Kísérlet (experiment): valamilyen kezelést végzünk és utánamegfigyeljük a hatásait a kísérlet tárgyán/alanyán.Pl.: klinikai gyógyszervizsgálat, részecske ütköztetések aCERN-ben.
• Utólagos vizsgálat (retrospective study): múltbéli adatokathasználunk (amik nem is feltétlenül az általunk vizsgált kérdésszempontjából lettek rögzítve).Pl.: autóbalesetben meghaltak és másban meghaltakösszehasonlítása.
• Elore tervezett vizsgálat (prospective study): az adatokat ajövoben gyujtjük olyan csoportokból, melyek valamilyen közösfaktorban megegyeznek.Pl.: a mobilt használó és nem használó vezetok csoportjainakösszehasonlítása. ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Adatgyujtés
• Vak és duplán vak vizsgálat: a vizsgálat alanya nem tudja, hogykezelést kap vagy placebót, duplán vak esetben a kísérletezo semtudja.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésZavar
• Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletetvégzo nem tudja megkülönböztetni az egyes faktorokat.
Pl.: Indén mindenkitol levonunk 1 pontot, ha nem jelenik meg azeloadáson, javul-e a részvételi arány? Tfh., hogy javul. De lehet,hogy tavaly reggel 8-kor volt az eloadás, és azért nem jártak. A kétfaktor nem különböztetheto meg.
• A kísérletet lehetoleg úgy kell megtervezni, hogy ne lépjen fel zavar.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésBlokkosítás
A zavar elkerülését segítheti a blokkosítás:
• Felosztjuk a populációt olyan alcsoportokra, melyekben a kísérletszempontjából fontos tulajdonságok megegyeznek.
• Mindegyik blokkban véletlenszeruen választjuk ki a kezelteket.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésRandomizált és kontrollált
• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
AdatgyujtésRandomizált és kontrollált
• Egy elterjedt módszer a teljesenrandomizált (véletlenszerusített)elrendezés:Véletlenszeruen választjuk ki azokat, akikkezelést kapnak
• Egy másik megközelítés a szigorúankontrollált elrendezés:Nagyon körültekintoen kiválasztott egyedek,pl. ha vérnyomáscsökkentot tesztelünk és azegyik blokkban van egy 30 éves túlsúlyos,cigarettázó férfi, aki szereti a sós és zsírosételeket, akkor a másik blokkba is teszünkilyet.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
STATISZTIKUS SOKASÁG ÉS MINTA
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaság
Statisztikus sokaság
Definíció: a statisztikai vizsgálat tárgyát képezo egyedek összességét ahozzájuk tartozó (szempontunkból érdekes) adatokkal együtt egystatisztikai sokaságnak vagy populációnak hívjuk.
Példák
• Magyarországi lakosok testmagassága, életkora, vérnyomása, stb.
• Folyó vízállása, közutak vagy routerek terheltsége, tozsdeiárfolyam, stb.
• Telefonbeszélgetések hossza, hívások közti várakozási ido,kozmikus részecskék észlelése, stb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságSokaság eloszlása
Statisztikai sokaság eloszlása
• Ha a vizsgálat tárgyát képezo egyedek száma N, akkor mindenegyes egyed 1/N valószínuséggel fordul elo, illetve ha az egyedekegy A részhalmaza k egyedet tartalmaz, akkor annak valószínuségek/N.
• Ezzel a statisztikai sokaság valószínuségi mezové válik, azegyedekhez tartozó számértékek pedig egy X valószínuségiváltozóvá.
→ Definíció: az így kapott X eloszlását hívjuk a a statisztikaisokaság eloszlásának.
• Amennyiben több számérték is érdekel minket egyedenként, asokaság több dimenzióssá válik, és a X1,X2, . . . ,Xn együtteseloszlását nevezzük a sokaság eloszlásának.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Minta
Minta, mintavételezés
Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha
• visszatevéssel választottuk oket,
• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).
• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.
¼¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Minta
Minta, mintavételezés
Definíció: ha a statisztikai sokaságból kiválasztunk n egyedet, akkor ahozzájuk tartozó x1, x2, ..., xn értékek egy n elemu mintát adnak.Definíció: az x1, x2, ..., xn függetlenek, ha
• visszatevéssel választottuk oket,
• (visszatevés nélkül, de a sokaság mérete gyakorlatilag végtelen).
• Ha a minta megegyezik a populációval, akkor cenzusról beszélünk.
¼¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Véletlen mintavétel: a populáció minden tagjának ugyanakkoraesélye van a bekerülésre.
• Egyszeru n hosszúságú véletlen mintavétel: minden nhosszúságú mintának ugyanakkora a kiválasztási esélye.
• Szisztematikus mintavétel: valamilyen kezdoponttól indulvakiválasztjuk minden K-adik elemet a populációból.
Problémás lehet, ha a populáció is szisztematikusan van rendezve.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Kényelmes mintavétel: használjuk azt a mintát, amit alegkönnyebb beszerezni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Rétegzett mintavétel: felosztjuk a populációt rétegekre(csoportokra), melyeken belül a kísérlet szempontjából fontostulajdonságok azonosak vagy hasonlók, majd mintát veszünkmindegyik rétegbol.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Mintavételezés
• Klaszter mintavétel: felosztjuk a populációt valamilyentermészetes módon (pl. irányítószám alapján) klaszterekre,véletlenszeruen választunk a klaszterek közül, majd a kiválasztottklaszter összes tagját használjuk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
Statisztikai következtetés
Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
Paraméter
A statisztikai sokaságot (populációt) jellemzo numerikus érték a sokáságegy paramétere.
Statisztikai következtetés
Definíció: ha a minta alapján következtetünk valamire valamilyenvalószínuséggel, az statisztikai következtetés, vagy rövidenstatisztika. Ezt szokták még becslésnek is nevezni.
Példa
• A magyarországi lakosok magasságának várható értéke egyparaméter,
• és pl. egy 1000 fos mintán a magasságok átlaga az egy ezzelkapcsolatos statisztika.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Paraméter és statisztika
populáció Ð→ minta
↕ ↕
paraméter ←Ð statisztika
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Statisztikus sokaságParaméteres becslés
Paraméteres és nem paraméteres becslések
Definíció: egy statisztikai következtetés paraméteres becslés, haismerjük a X eloszlásának típusát, és ez alapján az eloszlás valamelyparaméterére következtetünk.(Pl. tudjuk, hogy binomiális, és meg akarjuk becsülni p-t).Ha nem ismerjük az eloszlás típusát, akkor nem paraméteres becslésrolbeszélünk.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Empirikus eloszlásfüggvény
• Tegyük fel, hogy n elemu, független mintánk van, x1, x2, ..., xn
értékekkel.
→ Ezen belül minden minta elem 1/n valószínuségu. (Természetesentöbb minta elemhez is társulhat ugyanaz az x érték).
Definíció: a minta empirikus eloszlásfüggvénye:
F(x) ∶= 1n∣{i ∣ xi < x}∣ = ∑
i∶ xi<x
1n,
azaz ha összesen k olyan minta elem van, melyekre xi < x, akkorF(x) = k/n.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus eloszlás
Példa
• Tegyük fel, hogy a táblázatban látható cipoméreteket mértük egy 20fos csoportban. Milyen lesz a cipoméret empirikuseloszlásfüggvénye?
méret hány?38-as 139-es 240-es 441-es 442-es 743-as 2
∑ = 20
207
x
F(x)
44 42 40 38 36 0
0.2
0.4
0.6
0.8
1
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi lesz az empirikus suruségfüggvény?Mivel az empirikus eloszlás mindig diszkrét, szigorú értelemben ittis csak hisztogramról beszélhetünk suruségfüggvény helyett:
• felosztjuk az x tengelyt ∆x nagyságú intervallumokra,• intervallumonként a hisztogram konstans; értéke, h egy adott
[x, x +∆x], intervallumra:
h ⋅∆x = kn→ h = k
n∆x
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Példa
Hogy fog kinézni a cipoméret eloszlás hisztogramja az elozo példánál?(Itt ∆x = 1 a természetes választás.)
7
20
x
h(x)
0
0.2
0.4
0.6
0.8
1
36 38 40 42 44
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
• Mi történik, ha hatványszeruen lassan cseng le a suruségfüggvény?
→ Amennyiben ρ(x) ∼ x−α , elofordulhat, hogy ha azonos méretu ∆x-ethasználunk az eloforduló x-ek teljes tartományán, akkor a nagyértékek felé a hisztogram „kilaposodik”!
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
300 250 200 150 100 50 0 0
0.1
0.2
0.3
0.4
0.5
0.7
0.6
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
0.001
0.01
0.1
1
100 10 1 0.0001
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Pl. a Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye konstans ∆k = 1 esetén:
k
h(k)
0.001
0.01
0.1
1
100 10 1 0.0001
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
→ Ilyenkor célszeru a konstans ∆x helyett
• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),
• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
→ Ilyenkor célszeru a konstans ∆x helyett
• vagy exponenciálisan növekvo ∆x-et használni, ez a„logarithmic binning”, (ami logaritmikus skálán tunik konstansméretunek),
• vagy eloírni egy minimális esetszámot intervallumonként, ésezen kritérium szerint beállítani egy dinamikusan változó∆x-et.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
A Magyar Wikipédia, mint hálózat fokszámeloszlásának empirikussuruségfüggvénye exponenciálisan növekvo ∆k esetén:
k
h(k)
1
1e−05
1e−06
0.0001
0.001
0.01
0.1
1
10
10 100
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus suruségfüggvény
Megjegyzés: ha csak a hatványszeru lecsengés érdekel minket (pl. ahatványkitevo), akkor azt az empirikus eloszlásfüggvény is megmutatja,(és ott nem kell a ∆x-ekkel veszodni):
k
1−F(k)~k
1−F(k)
−α+1
0.0001
0.001
0.01
0.1
1
1 10 100
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
Empirikus várható érték
Definíció: Az empirikus várható érték a minta átlagával azonos:
x ∶= x1 + x2 +⋯ + xn
n= 1
n
n
∑i=1
xi.
A nagy számok törvényei alapján xPÐ→ ⟨X⟩,
(illetve ha ⟨X4⟩ korlátos, akkor eros értelemben is konvergál).
Empirikus szórásnégyzet
Definíció: Az empirikus szórásnégyzet az empirikus átlagtól valónégyzetes eltérés átlaga:
S2 ∶= (x1 − x)2 + (x2 − x)2 +⋯ + (xn − x)2
n= 1
n
n
∑i=1
(xi − x)2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Korrigált empirikus szórásnégyzet
A fentiek alapján a korrigált empirikus szórásnégyzet:
S∗2 ∶= nn − 1
S2 = 1n − 1
n
∑i=1
(xi − x)2.
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus várható érték és szórás
• Mi az empirikus szórásnégyzet várható értéke?
→ Korábban a szórás tárgyalásánál már levezettük,
⟨S2⟩ = n − 1n
σ2
Korrigált empirikus szórásnégyzet
A fentiek alapján a korrigált empirikus szórásnégyzet:
S∗2 ∶= nn − 1
S2 = 1n − 1
n
∑i=1
(xi − x)2.
Ennek várható értéke már megegyezik a sokaság szórásnégyzetével,
⟨S∗2⟩ = nn − 1
⟨S2⟩ = σ2.
Empirikus szórásnégyzet várható értéke ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Empirikus kvantilisek
• Hogyan lehetne pl. a kvartiliseket megbecsülni a minta alapján?
- Rendezzük a mintákat érték alapján,- és a mintaelemek elso negyedénél lesz az alsó kvartilis,- (a felénél van a medián),- és a háromnegyedénél a felso kvartilis.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
• Egy adathalmaz 5-szám összesítoje:
1) a minimum,2) az alsó kvartilis, Q1,3) a medián, Q2,4) a felso kvartilis Q3,5) a maximum.
• Ezeket egy ún. boxplot-ban szokás összefoglalni:
• Az adathalmaz terjedelme (angolul range) a maximum és minimumközti különbség.
• Az interkvartilis terjedelem (IQR): Q3 −Q1.¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot néhány eloszlásfajta esetén:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot néhány eloszlásfajta esetén:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Outlier
• A kiugró értékeket hívjuk outlier-nek:
- outlier, ha Q3-at meghaladja az IQR másfélszeresével,- outlier, ha Q1-nél több mint IQR másfélszeresével kisebb.
• Az outlier-eknek drámai hatása lehet az átlagra és a szórásra.
• Ezeket általában külön csillaggal jelöljük, és a maradék adatokracsinálunk box-plotot.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Boxplot
A boxplot akkor igazán érdekes, ha több mintát hasonlítunk összeegymással:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Különösen fontos az az eset, amikor a statisztikai sokaságnormális eloszlású, ami azt jelenti, hogy X eloszlása normális,X ∼ N (µ,σ).
• Természetesen ilyenkor az xi mintaelemekre is tekinthetünk úgy,mint µ várható értéku és σ szórású normális eloszlású függetlenváltozókra, xi ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz x eloszlása?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz x eloszlása?Mivel a normális eloszlás stabil,
n
∑i=1
xi ∈ N (nµ,√
nσ), x = 1n
n
∑i=1
xi
→ x ∈ N (µ, σ√n)
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = 1n
n
∑i=1
(xi − x)2 = 1n
n
∑i=1
⎛⎝
xi −1n
n
∑j=1
xj⎞⎠
2
=
1n
n
∑i=1
⎡⎢⎢⎢⎢⎣x2
i −2xi
n
n
∑j=1
xj +1n2
⎛⎝
n
∑j=1
xj⎞⎠
2⎤⎥⎥⎥⎥⎦=
1n
n
∑i=1
x2i −
2n2
n
∑i,j=1
xixj +1n2
⎛⎝
n
∑j=1
x2j + 2∑
j<kxjxk
⎞⎠=
1n
n
∑i=1
x2i −
2n2
⎛⎝
n
∑i=1
x2i + 2∑
i<jxixj
⎞⎠+ 1
n2
⎛⎝
n
∑j=1
x2j + 2∑
j<kxjxk
⎞⎠=
(1n− 1
n2)
n
∑i=1
x2i −
2n2 ∑
i<jxixj =
n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = n − 1n
1n
n
∑i=1
(µ2 + 2µσzi + σ2z2i ) −
2n2 ∑
i<j(µ2 + µσzi + µσzj + σ2zjzj) =
n − 1n
µ2 + n − 1n
2nµσ
n
∑i=1
zi +n − 1
n1nσ2
n
∑i=1
z2i
− 2n2
n(n − 1)2
µ2 − 2n2
(n − 1)µσn
∑i=1
zi −2n2σ2∑
i<jzizj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = σ2 n − 1n
1n
n
∑i=1
z2i − σ2 2
n2 ∑i<j
zizj
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Tegyük fel tehát, hogy xi ∼ N (µ,σ).
→ Mi lesz S2 eloszlása?
S2 = n − 1n
1n
n
∑i=1
x2i −
2n2 ∑
i<jxixj
Bevezetünk egy új változót, melynek eloszlása standard normális,
zi =xi − µσ
xi = µ + σzi, zi ∈ N (0, 1),ezzel
S2 = σ2 n − 1n
1n
n
∑i=1
z2i − σ2 2
n2 ∑i<j
zizj
Bevezetünk még egy új változót, y ∶= nS2
σ2 , melyre
y = n − 1n
n
∑i=1
z2i −
2n∑i<j
zjzj = (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az y változó suruségfüggvénye és karakterisztikus függvénye:
ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝
y − (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj⎞⎠×
× 1√2π
e−z212
1√2π
e−z222 ⋯ 1√
2πe−
z2n2
ϕy(t) =∞
∫−∞
ρ(y)eitydy =∬ ⋯∫dz1⋯dzn
(2π) n2
eit(1− 1
n )n∑i=1
z2i − 2it
n ∑i<jzizj− 1
2
n∑i=1
z2i
Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:
it (1 − 1n)
n
∑i=1
z2i −
2itn∑i<j
zizj −12
n
∑i=1
z2i = −zAz
A =⎛⎜⎜⎜⎝
12 − it (1 − 1
n)itn
itn ⋯
itn
12 − it (1 − 1
n)itn ⋯
itn
itn
12 − it (1 − 1
n) ⋯⋮ ⋮ ⋮ ⋱
⎞⎟⎟⎟⎠
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az y változó suruségfüggvénye és karakterisztikus függvénye:
ρ(y) = ∬ ⋯∫ dz1⋯dznδ⎛⎝
y − (1 − 1n)
n
∑i=1
z2i −
2n∑i<j
zizj⎞⎠×
× 1√2π
e−z212
1√2π
e−z222 ⋯ 1√
2πe−
z2n2
ϕy(t) =∞
∫−∞
ρ(y)eitydy =∬ ⋯∫dz1⋯dzn
(2π) n2
eit(1− 1
n )n∑i=1
z2i − 2it
n ∑i<jzizj− 1
2
n∑i=1
z2i
Az exponensben lévo kifejezés felfogható úgy, mint egy mátrixszendvicselés:
it (1 − 1n)
n
∑i=1
z2i −
2itn∑i<j
zizj −12
n
∑i=1
z2i = −zAz
A =⎛⎜⎜⎜⎝
12 − it (1 − 1
n)itn
itn ⋯
itn
12 − it (1 − 1
n)itn ⋯
itn
itn
12 − it (1 − 1
n) ⋯⋮ ⋮ ⋮ ⋱
⎞⎟⎟⎟⎠
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Ezzel a ϕy(t) karakterisztikus függvény:
ϕy(t) =∬ ⋯∫dz1⋯dzn
(2π) n2
e−zAz = 1(2π) n
2
√πn
det A,
hiszen A saját rendszerére áttérve
Avi = λivi, det A =n
∏i=1λi,
∞
∫−∞
e−αx2=√π
α
ϕy(t) =∬ ⋯∫du1⋯dun
(2π) n2
e−
n∑i=1λiu
2i =
∞
∫−∞
du1√2π
e−λ1u21 ×
∞
∫−∞
du2√2π
e−λ2u22 ×⋯ ×
∞
∫−∞
dun√2π
e−λnu2n =
n
∏i=1
1√2π
√π
λi.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Ezzel a ϕy(t) karakterisztikus függvény:
ϕy(t) =∬ ⋯∫dz1⋯dzn
(2π) n2
e−zAz = 1(2π) n
2
√πn
det A,
hiszen A saját rendszerére áttérve
Avi = λivi, det A =n
∏i=1λi,
∞
∫−∞
e−αx2=√π
α
ϕy(t) =∬ ⋯∫du1⋯dun
(2π) n2
e−
n∑i=1λiu
2i =
∞
∫−∞
du1√2π
e−λ1u21 ×
∞
∫−∞
du2√2π
e−λ2u22 ×⋯ ×
∞
∫−∞
dun√2π
e−λnu2n =
n
∏i=1
1√2π
√π
λi.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorai:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorai:
• Han∑i=1
vi = 0 teljesül, akkor ezen belül v tetszoleges lehet, azaz ez
egy n − 1 dimenziós altér n − 1 darab λ = ( 12 − it) sajátértékkel.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A sajátvektorja:
• Han∑i=1
vi ≠ 0 akkor a sajátvektor v =⎛⎜⎝
1⋮1
⎞⎟⎠
, a sajátérték
λ = (12− it) + it
nn = 1
2¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
Az A determinánsának meghatározásához eloször felbontjuk:
A = (12− it)
⎛⎜⎜⎜⎜⎜⎝
1 0 0 ⋯ 00 1 0 ⋯ 00 0 1 0⋮ ⋱ ⋮0 0 0 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
+ itn
⎛⎜⎜⎜⎜⎜⎝
1 1 1 ⋯ 11 1 1 ⋯ 11 1 1 ⋯ 1⋮ ⋮ ⋮ ⋱ 11 1 1 ⋯ 1
⎞⎟⎟⎟⎟⎟⎠
Ez alapján egy tetszoleges v =⎛⎜⎝
v1
⋮vn
⎞⎟⎠
esetén
Av = (12− it) v + it
n
n
∑i=1
vi
⎛⎜⎝
1⋮1
⎞⎟⎠.
Az A determinánsa:
det A = 12⋅ (1
2− it)
n−1
.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
A ϕy(t) karakterisztikus függvény:
ϕy(t) = 1(2π) n
2
√πn
det A= 1
(2π) n2
¿ÁÁÀ πn
12 ⋅ (
12 − it)n−1 = 1
(1 − 2it) n−12.
→ Ez egy n − 1 szabadsági fokú χ2 eloszlás karakterisztikus függvénye!
→ ρ(y) = yn−3
2
2n−1
2 Γ ( n−12 )
e−y2 ,
Az empirikus szórásnégyzet eloszlása
A fentiek alapján az S2 eloszlása egy átskálázott, n − 1 szabadsági fokúχ2 eloszlás, hiszen S2 = σ2y
n
χ2 -eloszlás karakterisztikus függvénye Konfidencia–intervallum ¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Az S2 eloszlása, ρ(y) transzformálásával:
ρS2(x) = ρχ2n−1
( nxσ2
) nσ2
= nσ2
( nxσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−nx
2σ2 ,
• Nézzük meg, mit kapunk S2 várható értékére a fentiek alapján:
- Az y = nS2
σ2 változó eloszlása χ2n−1, ezért a várható értéke
⟨y⟩ = n − 1.- Ez alapján S2 = σ2y
n várható értéke ⟨S2⟩ = n−1n σ
2, ami teljesenkonzisztens a korábban levezetett eredménnyel.
• Viszont a χ2 eloszlásra vonatkozó ismereteink alapján most már S2
szórásnégyzetét is meg tudjuk adni:
- Az y szórásnégyzete V(y) = V(χ2n−1) = 2(n − 1).
- Ez alapján
V(S2) = 2(n − 1)σ4
n2.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
- és a szórás
V(S∗2) = σ4
(n − 1)2V(χ2
n−1) =2(n − 1)σ4
(n − 1)2= 2σ4
n − 1.
¼
Adat, minta,statisztikus
sokaság
AdatokAdattípusok
Adatgyujtés
Statisztikussokaság és mintaMinta
Statisztika
Empirikus eloszlás
Empirikus várhatóérték és szórás
Empirikus kvantilisek
Normális eloszlásúsokaság
Normális eloszlású sokaság
• Mi a helyzet a korrigált empirikus szórásnégyzettel?
→ A definíció alapján S∗2 = nn−1 S2 = σ2y
n−1 , ezért
- a suruségfüggvény
ρS∗2(x) = ρχ2n−1
((n − 1)xσ2
) (n − 1)σ2
= n − 1σ2
( (n−1)xσ2 )
n−32
2n−1
2 Γ ( n−12 )
e−(n−1)x
2σ2 ,
- a várható érték ⟨S∗2⟩ = σ2
n−1 ⟨χ2n−1⟩ = σ2,
- és a szórás
V(S∗2) = σ4
(n − 1)2V(χ2
n−1) =2(n − 1)σ4
(n − 1)2= 2σ4
n − 1.
• Azt kaptuk, hogy a korrigált empirikus szórásnégyzet szórásais csökken a mintaszámmal, mégpedig úgy mint 1/(n − 1).
¼