23
Pecze Judit 2012-12-16 14:30:09 4. fejezet Az átlag és a szórás Nehéz megérteni, hogy a statisztikusok miért korlátozzák vizsgálódásaikat rendszerint az átlagokra, és nem lelik örömü- ket egy átfogóbb szemléletben. Szellemük oly tompának tűnik a változatosság varázsával szemben, mint Angliánk egyik sík vidékének azon szülöttéé, aki Svájcra visszatekintve úgy nyilat- kozott, hogy ha a hegyeket be lehetne lökni a tavakba, egy csapásra két kellemetlenség is megszűnne. —SIR FRANCIS GALTON (ANGLIA, 1822-1911) 1 1. BEVEZETÉS Hisztogram segítségével terjedelmes mennyiségű adatot összesíthetünk. Sokszor en- nél drasztikusabb összefoglalást is alkalmazhatunk: csak a hisztogram középpontját, valamint a centrum körüli szóródást adjuk meg. (A „középpont” és a „szóródás” itt köznapi szavak, pontos matematikai jelentés nélkül.) Az 1. ábrán két hisztogram váz- lata látható; bejelöltük a középpontot és a szóródást is. A középpont mindkettőnél ugyanaz, de a második szórtabb – nagyobb terület esik a középponttól messzebbre. A statisztikusi munkához pontos definíciókat kell megadnunk, aminek többféleképpen is nekiláthatunk. A középpont megragadására gyakran használjuk az átlagot, de a mediánt is sokszor használjuk. 2 Az átlag körüli szóródást méri a szórás nevű mennyi- ség; a szóródás egy másik mérőszáma az interkvartilis terjedelem. Az 1. ábrán látható hisztogramokat összegezhetjük a középpont és a szóródás megadásával, a dolog azonban nem működik mindig ilyen jól. A 2. ábra például a föld- felszín tengerszinthez viszonyított magasságának megoszlását mutatja. A tengerszint- hez viszonyított magasság szerepel a vízszintes tengelyen, mérföldben mérve a tenger- szint alatt (-), illetve felett (+). A hisztogram alatti terület két magasságérték között megadja, hogy a föld felszínének hány százaléka esik ezen két magasságérték közé. Egyértelmű csúcsok láthatók ezen a hisztogramon. A földfelszín túlnyomó részét vagy tenger borítja, mintegy 3 mérfölddel a tengerszint alatt; vagy pedig kontinentális sík- ság teszi ki, nagyjából a tengerszint körül. Ha erről a hisztogramról csak a középérté- ket és a szóródást adnánk meg, nem vennénk észre a két kicsúcsosodást. 3 © David Freedman, Robert Pisani, Roger Purves © Typotex Kiadó

4. fejezet Az átlag és a szórás - G-Portálweped.gportal.hu/portal/weped/upload/710292_1355954170_04493.pdf · szint alatt (-), illetve felett (+). A hisztogram alatti terület

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Pecze Judit2012-12-16 14:30:09

4. fejezet

Az átlag és a szórásNehéz megérteni, hogy a statisztikusok miért korlátozzák vizsgálódásaikat rendszerint az átlagokra, és nem lelik örömü-ket egy átfogóbb szemléletben. Szellemük oly tompának tűnika változatosság varázsával szemben, mint Angliánk egyik síkvidékének azon szülöttéé, aki Svájcra visszatekintve úgy nyilat-kozott, hogy ha a hegyeket be lehetne lökni a tavakba, egy csapásra két kellemetlenség is megszűnne.

—SIR FRANCIS GALTON (ANGLIA, 1822-1911) 1

1. BEVEZETÉS

Hisztogram segítségével terjedelmes mennyiségű adatot összesíthetünk. Sokszor en-nél drasztikusabb összefoglalást is alkalmazhatunk: csak a hisztogram középpontját,valamint a centrum körüli szóródást adjuk meg. (A „középpont” és a „szóródás” ittköznapi szavak, pontos matematikai jelentés nélkül.) Az 1. ábrán két hisztogram váz-lata látható; bejelöltük a középpontot és a szóródást is. A középpont mindkettőnélugyanaz, de a második szórtabb – nagyobb terület esik a középponttól messzebbre. Astatisztikusi munkához pontos definíciókat kell megadnunk, aminek többféleképpenis nekiláthatunk. A középpont megragadására gyakran használjuk az átlagot, de amediánt is sokszor használjuk.2 Az átlag körüli szóródást méri a szórás nevű mennyi-ség; a szóródás egy másik mérőszáma az interkvartilis terjedelem.

Az 1. ábrán látható hisztogramokat összegezhetjük a középpont és a szóródásmegadásával, a dolog azonban nem működik mindig ilyen jól. A 2. ábra például a föld-felszín tengerszinthez viszonyított magasságának megoszlását mutatja. A tengerszint-hez viszonyított magasság szerepel a vízszintes tengelyen, mérföldben mérve a tenger-szint alatt (-), illetve felett (+). A hisztogram alatti terület két magasságérték közöttmegadja, hogy a föld felszínének hány százaléka esik ezen két magasságérték közé.Egyértelmű csúcsok láthatók ezen a hisztogramon. A földfelszín túlnyomó részét vagytenger borítja, mintegy 3 mérfölddel a tengerszint alatt; vagy pedig kontinentális sík-ság teszi ki, nagyjából a tengerszint körül. Ha erről a hisztogramról csak a középérté-ket és a szóródást adnánk meg, nem vennénk észre a két kicsúcsosodást.3

freedman02.qxd 2002.08.22. 20:01 Page 77

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

1. ÁBRA. Középérték és szóródás. A két hisztogram középpontja azonos, dea jobb oldali jobban szóródik.

2. ÁBRA. A föld felszínének megoszlása a tengerszinthez viszonyított magas-ság szerint a tengerszint fölött (+), illetve alatt (-).

2. AZ ÁTLAG

Témánk most az átlag (számtani középnek is nevezik) áttekintése; de beszélni fo-gunk a keresztmetszeti és a longitudinális kérdőíves felvételek közötti különbségrőlis. Egy 1976-80 között folytatott, az egészségi állapottal és a táplálkozással foglalko-zó amerikai kutatás, a HANES* adatait fogjuk felhasználni. Ennek keretében az 1-74éves amerikaiak 20 322 fős reprezentatív mintáját vizsgálta a szövetségi Közegész-ségügyi Hivatal. A cél az volt, hogy alapvető adatokat szerezzenek

demográfiai változókról, amilyen az életkor, az iskolázottság, a jövedelem;fiziológiai változókról, mint a testmagasság, a testsúly, a vérnyomás, a kolesz-

terinszint;az étkezési szokásokról;a vérben kimutatható ólom és rovarirtószer szintjéről;különféle betegségek előfordulásáról.

A begyűjtött adatok elemzése a változók közötti összefüggésekre összpontosított, ésjelentősen befolyásolta az egészségpolitikát is. Például a kutatott időszak végére aHANES adatai szerint 37%-kal csökkent az emberek vér-ólomszintje. A Közegészség-ügyi Hivatal ennek okát az ólmozatlan üzemanyagok elterjedésében határozta meg.Az ólomadalékokat ezután betiltották.4

Nekünk most csak az a célunk, hogy rövid pillantást vessünk a mintára, miköz-ben átismételjük az átlag fogalmát.

78 II. RÉSZ: LEÍRÓ STATISZTIKA

* Health and Nutrition Examination Survey

freedman02.qxd 2002.08.22. 20:01 Page 78

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

4. fejezet: Az átlag és a szórás 79

A 9, 1, 2, 2, 0 számokból álló listában például 5 szám szerepel, az első közülük a 9-es, az átlaguk pedig

9 + 1 + 2 + 2 + 0 = 14 = 2,8.5 5

Vajon hogyan néztek ki a mintában szereplő (18-74 éves) nők és férfiak? A férfiak átlagos testmagassága 5 láb 9 hüvelyk (175,25 cm) volt, átlagos test-

súlyuk 171 font (kb.77,5 kg).A nők átlagos testmagassága 5 láb 3,5 hüvelyk (kb. 161 cm), átlagos testsúlyuk

146 font (közelítőleg 66 kg).

Kissé dundik voltak.Vajon hogyan függ össze a magasság és a testsúly az életkorral? A 3. ábrán lát-

hatjuk a Közegészségügyi Hivatal által vizsgált különböző korcsoportok magasság-és testsúlyátlagát külön a férfiakra és külön a nőkre; az ábrán az átlagokat egyenesvonalakkal kötöttük össze. Hasznos eszköz az átlag az adatok összegzésére – ebbe anégy görbébe is sok-sok hisztogramot sűrítettünk bele. Ám ezt a sűrítést csak úgyérthettük el, hogy figyelmen kívül hagytuk az egyéni eltéréseket. A 18-24 éves férfi-ak magasságátlaga például 5 láb 10 hüvelyk (178 cm), 10%-uk viszont 6 láb 1 hü-velyknél (185 cm-nél) magasabb; 10%-uk pedig 5 láb 6 hüvelyknél (168 cm-nél) ala-csonyabb. Ezt a sokféleséget az átlag elrejti.

3. ÁBRA. Az életkor-specifikus testmagasság- és testsúlyátlagok a HANES min-tájában szereplő 18-74 éves férfiakra és nőkre. A bal oldali ábra a testmagassá-gokat, a jobb oldali a testsúlyokat ábrázolja. (Az eredetileg hüvelykben és font-ban mért adatokat itt centiméterben és kilogrammban adjuk meg. A szerk.)

FORRÁS: Az adatokat mágnesszalagon az Inter-University Consortium for Political and SocialResearch bocsátotta rendelkezésünkre.

Egy számsor átlaga: a számok összege elosztva azzal, ahány számunk van.

freedman02.qxd 2002.08.22. 20:01 Page 79

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

Egy pillanatra most visszatérünk a kutatási elrendezés kérdéséhez (2. fejezet). A 3.ábra szerint a férfiak átlagos testmagassága a 20 éves életkor után csökken, 50 év el-teltével körülbelül 5 centiméterrel (2 hüvelykkel). Hasonlót láthatunk a nők eseté-ben is. Azt jelenti ez vajon, hogy az átlagember ilyen mértékben összemegy? Nemigazán. A HANES keresztmetszeti, nem pedig longitudinális vizsgálat. Egy kereszt-metszeti vizsgálatban különböző alanyokat hasonlítunk össze egyazon időpillanat-ban. Longitudinális vizsgálatnál az alanyokat követjük az időben, és saját korábbiadataikkal hasonlítjuk össze őket a különböző időpontokban. A 3. ábrán szereplő18-24 évesek egészen mások, mint a 65-74 évesek. Az első csoport 1955 körül szüle-tett, a második 1905 táján. Minden jel arra utal, hogy az idők során az emberek egy-re magasabbra nőnek. Akcelerációs tendenciának nevezzük ezt, melynek hatása a 3.ábrán egybemosódik az öregedés hatásával. Az öt centiméter magasságcsökkenésnagy része az akcelerációnak tulajdonítható: a 65-74 éves emberek mintegy 50 évvelkorábban születtek a 18-24 éveseknél, és ez az oka, hogy néhány centivel alacso-nyabbak náluk.5

„A” feladatsor

1. (a) Az alábbi vízszintes tengelyen bejelöltük a 3-as és az 5-ös számot. Mennyi a két szám átlaga? Jelölje meg egy nyíllal!

(b) Ismételje meg ugyanezt a 3, 5, 5 számokra!

(c) Bejelöltünk két pontot az alábbi tengelyen. Rajzoljon a két szám átlagáhozmutató nyilat!

2. 10 szám szerepel egy listán. A számok értéke 1, 2 vagy 3 lehet. Hogyan néz ki alista, ha a számok átlaga 1? És ha 3? Lehet-e 4 az átlag?

3. A következő számsorok közül melyiknek nagyobb az átlaga? Vagy ugyanaz? Pró-báljon meg számolás nélkül válaszolni!

(i) 10, 7, 8, 3, 5, 9 (ii) 10, 7, 8, 3, 5, 9, 11

80 II. RÉSZ: LEÍRÓ STATISZTIKA

Ha egy vizsgálatban az életkor hatásáról vonnak le következtetéseket, fi-gyeljünk oda arra, hogy keresztmetszeti vagy longitudinális adatokkal dolgoztak-e.

freedman02.qxd 2002.08.22. 20:01 Page 80

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

4. Egy szobában tíz ember tartózkodik, testmagasságuk átlaga 168 cm. Belép egy 195cm magas férfi. Mennyi lesz most a 11ember magasságátlaga?

5. A teremben tartózkodó huszonegy ember átlagos magassága 168 cm. Belép egy195 cm magas férfi. Mennyi lesz most a 22 ember magasságátlaga? Vesse össze amegoldást a 4. feladatéval!

6. A teremben tartózkodó huszonegy ember átlagos magassága 168 cm. Belép mégvalaki. Milyen magasnak kell lennie ahhoz, hogy a magasságátlag 2 centiméterrelmegnőjön?

7. Hol található a Sziklás hegység a 2. ábrán: a vízszintes tengely bal széle körül, kö-zépen vagy a jobb szél tájékán? Hová esik Florida? És vajon az olyan mélytengeri ár-kok, mint például a Mariana-árok?

8. Szívproblémákkal kapcsolatban a szisztolés vérnyomásnál jobb indikátornak te-kintik a diasztolés vérnyomást. Az alábbi ábrán a HANES felmérésében részt vett 18-74 éves férfiak életkor-specifikus diasztolés vérnyomásátlaga látható. Igaz-e, hogy azadatok szerint a férfiak diasztolés vérnyomása nagyjából 55 éves korukig emelkedik,azután pedig csökken? Ha nem igaz: hogyan magyarázhatjuk a görbe menetét? (Avérnyomást higanymilliméterben mérjük.)

9. A munkaügyi statisztikával foglalkozó hivatal (a Bureau of Labor Statistics) ha-vonta kiszámítja az átlagos órabéreket a gazdálkodó szervezetek által bejelentettadatok alapján. Kiszámolják az összes (alkalmazottaknak) kifizetett bért, és eloszt-ják a ledolgozott órák teljes számával. Recesszió idején az átlagórabér tipikusanemelkedik. Ha véget ér a recesszió, az órabérek átlaga többnyire csökkenni kezd.Hogyan lehetséges ez?

4. fejezet: Az átlag és a szórás 81

freedman02.qxd 2002.08.22. 20:01 Page 81

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

3. AZ ÁTLAG ÉS A HISZTOGRAM

Ebben a szakaszban megmutatjuk, hogyan viszonyul az átlag és a medián a hisz-togramhoz. Kezdjük egy példával! A 4. ábrán a HANES mintájában szereplő 6588 fő18-74 éves nő testsúlyának hisztogramját láthatjuk. Függőleges vonal jelöli az átla-got, ami 146 font (= 66,2 kg). Természetesnek tűnik az a tipp, hogy a nők felének sú-lya ez alatt volt, a felének meg fölötte. Ez azonban nem egészen stimmel. Valójábancsak 41% volt súlyosabb az átlagnál, 59% súlya viszont átlagon aluli volt. Az arányokmás esetben még ennél is jobban eltérhetnek az 50%-tól.

4. ÁBRA. A HANES mintájában szereplő 6 588 18-74 éves nő testsúlyának hisz-togramja. A testsúlyátlagot szaggatott vonal jelöli. Csak 41% testsúlya na-gyobb az átlagosnál. (Az adatokat átírtuk font helyett kilogrammra. A szerk.)

FORRÁS: L. a 3. ábránál

Hogyan lehetséges ez? Az egyszerűség kedvéért kezdjük egy hipotetikus példával: le-gyen a számsorunk 1, 2, 2, 3. Ennek a sorozatnak a hisztogramja ( lásd az 5. ábrát)szimmetrikus a 2-es értékre. És az átlag is 2. Ha egy hisztogram valamely értékre szim-metrikus, akkor ez az érték az átlag; valamint a hisztogram alatti terület fele ettől azértéktől balra, fele jobbra helyezkedik el. (Hogy mit jelent az, hogy szimmetrikus?Képzeljük el, hogy függőleges vonalat rajzolunk a hisztogram középpontján keresztül,és ennek mentén félbehajtjuk az ábrát: a két félnek illeszkednie kell egymásra.)

5. ÁBRA. Az 1, 2, 2, 3 számsor hisztogramja. A hisztogram szimmetrikus a 2-esértékre nézve; a teljes terület 50%-a 2-től balra, 50%-a jobbra helyezkedik el.

82 II. RÉSZ: LEÍRÓ STATISZTIKA

freedman02.qxd 2002.08.22. 20:01 Page 82

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

Mi történik, ha az 1, 2, 2, 3 számokból álló listán a 3-as értéket nagyobbra, mondjuk5-re vagy 7-re cseréljük? Mint a 6. ábrán látható, az ehhez az értékhez tartozó téglalapjobbra helyeződik, tönkretéve a szimmetriát. Nyíllal megjelöltük az átlagot az egyeshisztogramoknál; ez a nyíl is tolódik jobbra, követve a téglalapot. Hogy jobban átlás-suk ezt, képzeljük el, hogy a hisztogram fa építőkockákból áll, melyeket súlytalan, me-rev deszkára erősítettek. Helyezzük a hisztogramot egy merev pálcára a 6. ábra alsó ré-szén látható módon. Hisztogramunk az átlagnál lesz egyensúlyban.6 Az átlagtól jómessze eső kis téglalap kiegyensúlyozhat egy, az átlaghoz közel fekvő nagy területet,mivel a területek az alátámasztási ponttól mért távolsággal súlyozandók.

6. ÁBRA. Az átlag. Az ábra felső részében három hisztogram látható, az átla-gokat nyilak jelölik. Ahogy a besatírozott téglalap tolódik jobbra, az átlagotis húzza maga után. Az átlagtól balra eső terület aránya felmegy 75%-ra. Azábra alsó részében ugyanezen hisztogramokat merev súlytalan deszkáraerősített fatömbökként ábrázoltuk. A hisztogramok az átlagnál alátámaszt-va lesznek egyensúlyban.

4. fejezet: Az átlag és a szórás 83

freedman02.qxd 2002.08.22. 20:01 Page 83

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

A mérleghintán egy kicsi gyerek a középponttól távolabb ül, hogy egyensúlyt tartsona középponthoz közelebb ülő nagyobb gyerekkel. A hisztogram oszlopai is ugyan-így működnek. Ezért van, hogy az átlag egyik oldalára eső esetek aránya eltérhet az50%-tól.

Egy hisztogram mediánja az az érték, amelytől balra és jobbra is a terület fele találha-tó. A 6. ábrán szereplő mindhárom hisztogramnál 2 a medián. A második és a harma-dik hisztogram esetében sokkal messzebb van a mediántól jobbra eső terület, mint azattól balra fekvő. Ebből következik, hogy ha a mediánnál próbálnánk meg alátámasz-tani a hisztogramot, akkor ledőlne jobbra. Általánosabban: az átlag mindig jobbra vana mediánhoz képest, ha a hisztogram jobbra elnyújtott, amint az a 7. ábrán látható. Atestsúlyok hisztogramja (lásd a korábbi 4. ábrát) hosszan elnyúlik jobbra; ezért a 66,2kg-s (146 fontos) átlag nagyobb a mediánnál, ami 62,5 kg (139 font).

7. ÁBRA. A hisztogram ferdesége

84 II. RÉSZ: LEÍRÓ STATISZTIKA

A hisztogram akkor lesz egyensúlyban, ha az átlagnál támasztjuk alá.

freedman02.qxd 2002.08.22. 20:01 Page 84

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

Vegyünk egy másik példát! 1992-ben a családi jövedelem mediánja 36 800 dollár kö-rül volt az USA-ban. A jövedelemhisztogram jobbra erősen elnyújtott, így ennél ma-gasabb volt az átlag: 44 500 dollár.7 Valamelyik irányban erősen elnyújtott megosz-lás esetén érdemes lehet a mediánt használni az átlag helyett, amennyiben az átla-got túlságosan befolyásolják a távoli értékek.

„B” feladatsor

1. Három számsor hisztogramját vázoltuk fel. Töltse ki az üresen hagyott helyet mind-három esetben: Az átlag _______ körül van. Válaszlehetőségek: 25, 40, 50, 60, 75.

2. Egybeesik-e a medián az átlaggal az előző feladatban szereplő hisztogramoknál?Vagy balra esik tőle? Netán jobbra?

3. Lapozzon vissza a cigarettafogyasztás hisztogramjához a 3. fejezetbeli C-4 fela-dathoz. A medián ________ körül van. Töltse ki az üresen hagyott helyet az alábbiválaszlehetőségek valamelyikével:

10 20 30 40

4. A cigarettafogyasztás hisztogramjánál 15, 20 vagy 25 körül van-e az átlag?

5. Az egyetemekre beiratkozott hallgatók körében melyik nagyobb vajon: az átlagoséletkor vagy az életkorok mediánja*?

6. A következő listákon szereplő számok összességükben vajon 1, 5 vagy 10 körülszóródnak? Számolásra nincs szükség.

(a) 1,3; 0,9; 1,2; 0,8 (b) 13; 9; 12; 8(c) 7; 3; 6; 4 (d) 7; -3; -6; 4

4. fejezet: Az átlag és a szórás 85

* Ez utóbbit közepes életkornak is szokás nevezni, de mi most inkább kerüljük ezt a – sok-szor egyébként könnyedebb – szóhasználatot. A ford.

freedman02.qxd 2002.08.22. 20:01 Page 85

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

Kiegészítő megjegyzés: Egy lista mediánját úgy definiáljuk, hogy a számok legalábbfele (a fele vagy több) a mediánnál nagyobb vagy azzal egyenlő, és legalább a fele amediánnál kisebb vagy azzal egyenlő. Négy számsoron mutatjuk be ezt:

(a) 1, 5, 7(b) 1, 2, 5, 7(c) 1, 2, 2, 7, 8(d) 8, -3, 5, 0, 1, 4, -1

Az (a) esetben 5 a medián: a három szám közül kettő nagyobb vagy egyenlő 5-tel,kettő pedig kisebb vagy egyenlő 5-tel. A (b) esetben bármely 2 és 5 közötti számmedián; ha egyetlen számot kell megneveznie, a statisztikusok zöme a 3,5-et (a 2 és5 között félúton lévő számot) választja „a” mediánnak. A (c) lista esetében a medián2: az öt közül négy szám 2-nél nagyobb vagy azzal egyenlő, három pedig 2-nél ki-sebb vagy egyenlő. A (d) lista mediánjának meghatározásához rendezzük nagyságszerinti sorba a számokat:

-3, -1, 0, 1, 4, 5, 8

Hét számunk van: négy nagyobb vagy egyenlő 1-gyel, négy kisebb vagy egyenlő 1-gyel. A medián tehát 1.

4. A NÉGYZETES KÖZÉPÉRTÉK

Fejezetünk következő fontos témája az ún. szórás, melyet a szóródás mérésére hasz-nálunk. Ebben a szakaszban némi matematikai bevezetőt nyújtunk ehhez a

0, 5, -8, 7, -3

számokból álló lista segítségével.

Mekkora ez az öt szám? Az átlaguk 0,2, de ez még elég gyengén jelzi a nagyságukat.Annyit jelent csak, hogy a pozitív számok nagyrészt kioltják a negatívakat. A legegy-szerűbben úgy járhatnánk el ezzel a problémával, ha elhagynánk az előjeleket, ésúgy vennénk az átlagot. A statisztikusok azonban valami mást tesznek: a lista négy-zetes középértékét (rövidebben: négyzetes közepét) használják. Némi fantáziávalmár az elnevezésből is kitalálható, hogyan kell ezt kiszámolni:

A számokat NÉGYZETRE emeljük, megszabadulva így az előjelektől.Kiszámoljuk a négyzetek ÁTLAGÁT.Az átlag NÉGYZETGYÖKÉT vesszük.

Képletszerűen is kifejezhetjük ezt:

86 II. RÉSZ: LEÍRÓ STATISZTIKA

egy lista négyzetes közepe = √ a számok négyzeteinek átlaga

freedman02.qxd 2002.08.22. 20:01 Page 86

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

1.példa. Határozzuk meg a 0, 5, -8, 7, -3 számokból álló lista átlagát, a számok ab-szolút értékeinek átlagát (az előjelek figyelmen kívül hagyásával számított átlagot)és a lista négyzetes középértékét.

Megoldás:

Átlag = = 0,2

Abszolút értékek átlaga = = 4,6

Négyzetes középérték = = 29,4 ≈ 5,4

A négyzetes közép valamivel nagyobb az előjelek figyelmen kívül hagyásával kép-zett átlagnál. Ez mindig így alakul – kivéve azt a triviális esetet, amikor minden számugyanakkora abszolút értékű. A négyzetre emelés és a négyzetgyökvonás nem sem-legesítik egymást, hiszen a kettő között elvégezzük az átlagolás műveletét.

Hogy 5,4 és 4,6 közül melyiket válasszuk a példában szereplő számok nagyságánakátfogó jellemzésére, arra nincsenek nyilvánvaló érvek. A statisztikusok azért használ-ják a négyzetes közepet, mert jobban illeszkedik az általuk végzendő számításokhoz.8Akár elégedett az Olvasó ezzel a magyarázattal, akár nem – ne aggódjon! Elsőre min-denki utálja a négyzetes közepet, azután nagyon gyorsan megszokja.

„C” feladatsor

1. (a) Mennyi az átlaga és a négyzetes közepe a következő számoknak?1, -3, 5, -6, 3.

(b) És a most következőknek? -11, 8, -9, -3, 15.

2. 1, 10 vagy 20 körül van inkább a következő számsorok négyzetes középértéke?Számolásra nincs szükség.

(a) 1, 5, -7, 8, -10, 9, -6, 5, 12, -17(b) 22, -18, -33, 7, 31, -12, 1, 24, -6, -16(c) 1, 2, 0, 0, -1, 0, 0, -3, 0, 1

3. (a) Mennyi a négyzetes középértéke a következő számsornak: 7, 7, 7, 7 ?(b) És ennek: 7, -7, 7, -7 ?

4. 103, 96, 101, 104. Mind a négy szám értéke 100 körül van, de valamivel eltérnekattól. Mennyi az eltérések négyzetes közepe?

4. fejezet: Az átlag és a szórás 87

0 + 5 - 8 + 7 – 35

02 + 52 +(- 8)2 + 72 +(– 3)2

5√ √

0 + 5 + 8 + 7 + 35

freedman02.qxd 2002.08.22. 20:01 Page 87

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

5. Mennyi a következő számsor átlaga: 103, 96, 101, 104 ? Mindegyik szám valame-lyest eltér az átlagtól. Mennyi az eltérések négyzetes közepe?

6. Egy számítógépes programnak az a feladata, hogy megjósolja a teszteredménye-ket, összehasonlítsa ezeket a tényleges pontszámokkal, és kiszámolja a kettő közöt-ti eltérések (a becslési hibák) négyzetes középértékét. A kinyomtatott listára pillant-va azt látjuk, hogy a becslési hibák négyzetes közepe 3,6, az első tíz vizsgázó pediga következő pontszámokat érte el:

Becsült pontszám: 90 90 87 80 42 70 67 60 83 94Elért pontszám: 88 70 81 85 63 77 66 49 71 69

Hihetőnek tűnik az eredmény, vagy valami hiba lehet a programmal?

5. A SZÓRÁS

Sokszor érdemes úgy gondolkodnunk, hogy egy listában szereplő számok az átla-guk körül szóródnak – amint azt a fejezet elején szereplő idézet is sugallja. Ezt a szó-ródást többnyire a szórásnak nevezett mennyiséggel mérjük. A szórás az átlagtól va-ló eltérések nagyságát méri: egyfajta átlagos eltérés az átlagtól. A következőkben elő-ször valós adatok esetében fogjuk értelmezni a szórást, azután majd megnézzük akiszámítás módját is.

A HANES mintájában 6588 fő 18-74 éves nő szerepel (lásd a 2. szakaszt). Átlagostestmagasságuk 161cm (63,5 hüvelyk), a szórás pedig 6,3 cm (2,5 hüvelyk). Az átlag-ból megtudjuk, hogy a nők többségének magassága valahol 161 cm körül volt. Deakadtak eltérések az átlagtól. Voltak az átlagosnál magasabb, és az átlagosnál alacso-nyabb hölgyek is. Mekkorák voltak ezek az eltérések? Na, itt jön be a szórás.

Abból, hogy a szórás 6,3 cm, megtudjuk, hogy a HANES vizsgálatában résztvevőnők közül sokan 2 - 8 cm-rel tértek el az átlagtól: 2 cm fél szórásnál kevesebb, a 8cm egy és két szórás között van. Kevesen tértek el 13 cm-nél (két szórásnál) jobbanaz átlagtól.

Létezik egy gyakorlatban alkalmazott szabály, amely számszerűsíti ezt a gondo-latot, és sok adatsorra érvényes:

88 II. RÉSZ: LEÍRÓ STATISZTIKA

A szórás megmutatja, milyen messze esnek egy lista számai az átlaguktól. A számok többsége nagyjából egy szórásnyi távolságon belül van az átlagtól.Csak nagyon kevés esik két vagy három szórásnyi távolságnál messzebb.

Egy lista számainak durván 68%-a (háromból kettő) az átlagtól egy szórás-nyin belül esik, a többi 32% ennél távolabb. Durván 95% (20-ból 19) az át-lagtól két szórásnyin belül esik, a maradék 5% van ennél távolabb. Sokadatsorra igaz ez, de nem mindegyikre.

freedman02.qxd 2002.08.22. 20:01 Page 88

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

A 8. ábrán láthatjuk a HANES-ben résztvevő 18-74 éves nők magassághisztogramját.Függőleges vonal jelzi az átlagot, és besatíroztuk az átlagtól egy szórásnyin belül esőterületet. Ez a satírozott terület jelenti azokat a nőket, akik legfeljebb egy szórásnyi-val tértek el az átlagtól. A terület 67% körül van. A nők körülbelül 67%-a legfeljebbegy szórásnyival tért el az átlagtól.

8. ÁBRA. A szórás és a hisztogram: a HANES vizsgálatában résztvevő 6588 fő18-74 éves nő testmagassága. Szaggatott függőleges vonal jelzi az átlagot(161 cm). Az egy szórásnyin belüli területet besatíroztuk: a nők 67%-a tértel legfeljebb egy szórásnyival (legfeljebb 6,3 cm-rel) az átlagtól. (A hisz-togram adatait hüvelyk helyett centiméterben adjuk meg. A szerk.)

A 9. ábrán ugyanezt a hisztogramot láthatjuk. Most a két szórásnyin belüli területetsatíroztuk be. Ez a besatírozott rész azokat a nőket jelenti, akik legfeljebb két szó-rásnyival tértek el az átlagtól. A terület nagyjából 94%. A nők körülbelül 94%-a tértel legfeljebb két szórásnyival az átlagos testmagasságtól. (A hisztogram adatait hü-velyk helyett centiméterben adjuk meg. A szerk.)

4. fejezet: Az átlag és a szórás 89

freedman02.qxd 2002.08.22. 20:01 Page 89

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

9. ÁBRA. A szórás és a hisztogram: a HANES vizsgálatában részt vevő 6588fő 18-74 éves nő testmagassága. Szaggatott függőleges vonal jelzi az átlagot(161 cm). A két szórásnyin belüli területet besatíroztuk: a nők 94%-a tért ellegfeljebb két szórásnyival (legfeljebb 13 cm-rel) az átlagtól.

Röviden összegezve: a nők körülbelül 67%-a legfeljebb egy szórásnyival, 94%-a leg-feljebb két szórásnyival különbözött az átlagtól. Mindössze egyetlen nő akadt a min-tában, aki négy szórásnyinál többel tért el az átlagtól. Erre az adatsorra egész jól mű-ködik a 68%-95%-os szabály. De vajon honnan jön ez a 68 és 95%? A kérdésre a kö-vetkező fejezetben válaszolunk.9

A HANES felmérésben résztvevő nők kétharmada legfeljebb egy szórásnyival tért el az átlagtól

90 II. RÉSZ: LEÍRÓ STATISZTIKA

freedman02.qxd 2002.08.22. 20:01 Page 90

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

„D” feladatsor

1. A Közegészségügyi Hivatal számításai szerint a HANES felmérésében részt vevő11 éves fiúk átlagos magassága 146 cm volt, a szórás pedig 8 cm. Töltse ki az üresenhagyott helyeket!

(a) Az egyik fiú 170 cm volt. Ő az átlagnál ________ szórásnyival volt magasabb.(b) Egy másik fiú 148 cm magas volt. Ő az átlagnál __________ szórásnyival voltmagasabb.(c) Egy harmadik fiú 1,5 szórásnyival alacsonyabb volt az átlagnál. Ő ________cm magas volt.(d) Ha egy fiú magassága az átlagtól vett 2,25 szórásnyin belül volt, akkor leg-alább ________ cm és legfeljebb _________ cm magas volt.

2. Az 1. feladat folytatása.(a) Íme négy fiú testmagassága: 150 cm, 130 cm, 165 cm, 140 cm. Melyik leírásillik rájuk az alábbiak közül? (Van olyan leírás, amely kettőre is illik.)

szokatlanul alacsony nagyjából átlagos szokatlanul magas

(b) A vizsgálatban szereplő 11 éves fiúknak körülbelül hány százaléka volt 138-154 cm között? Hány százalék volt 130-162 cm között?

3. A következő listák mindegyikének 50 az átlaga. Melyiknél a legnagyobb a szóró-dás az átlag körül? Melyiknél a legkisebb?

(i) 0, 20, 40, 50, 60, 80, 100(ii) 0, 48, 49, 50, 51, 52, 100(iii) 0, 1, 2, 50, 98, 99, 100

4. A következő listák mindegyikének 50 az átlaga. Tippelje meg mindegyiknél, hogy1, 2 vagy 10 körül van-e inkább a szórás! (Számolásra nincs szükség.)

(a) 49, 51, 49, 51, 49, 51, 49, 51, 49, 51(b) 48, 52, 48, 52, 48, 52, 48, 52, 48, 52(c) 48, 51, 49, 52, 47, 52, 46, 51, 53, 51(d) 54, 49, 46, 49, 51, 53, 50, 50, 49, 49(e) 60, 36, 31, 50, 48, 50, 54, 56, 62, 53

5. A HANES mintájába bekerült emberek életkorának szórása ________ körül volt.Töltse ki az üresen hagyott helyet az alábbi válaszlehetőségek valamelyikével. Adjonrövid magyarázatot is! (A felvételről részletesebben szóltunk a 2. szakaszban; azéletkorok 1-74 év között voltak.)

5 év 20 év 50 év

6. Felvázoltuk három adatsor hisztogramját. Melyik leírás tartozik az egyes ábrák-hoz? (Nem lehet mindegyiket felhasználni.) Adjon magyarázatot is mindegyik eset-ben!

4. fejezet: Az átlag és a szórás 91

freedman02.qxd 2002.08.22. 20:01 Page 91

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

(i) átlag ≈ 3,5; szórás ≈ 1 (iv) átlag ≈ 2,5; szórás ≈ 1 (ii) átlag ≈ 3,5; szórás ≈ 0,5 (v) átlag ≈ 2,5; szórás ≈ 0,5 (iii) átlag ≈ 3,5; szórás ≈ 2 (vi) átlag ≈ 4,5; szórás ≈ 0,5

7. (Kitalált példa). Klinikai vizsgálatoknál az adatgyűjtés általában azzal kezdődik,hogy véletlenszerűen kísérleti, és kontrollcsoportba sorolják a részt vevőket. Az adat-gyűjtés az utókövetés befejezéséig folyik. Két, a szívinfarktus megelőzésével foglalko-zó klinikai kísérlet vezetői beszámolnak a kiinduló testsúlyadatokról, az alábbiak sze-rint. Az egyik kísérletnél rosszul sikerült a véletlenszerű besorolás. Melyiknél? Miért?

Személyek száma Átlagos testsúly SzórásKísérleti 1012 83 kg 11 kg

(i) Kontroll 997 64 kg 11,5 kg

Kísérleti 995 74 kg 12 kg(ii) Kontroll 1017 73 kg 11 kg

8. Egy kutató 100 fős mintát vesz egy bizonyos város 18-24 éves férfi lakosai közül.Egy másik kutató 1000 fős mintát vesz ugyanezen sokaságból.

(a) Melyik kutató mintájában lesz nagyobb a férfiak magasságátlaga? Vagy nagy-jából ugyanakkora lesz?(b) Melyik kutató mintájában lesz nagyobb a testmagasságok szórása? Vagynagyjából ugyanakkora lesz?(c) Melyik kutató mintájában fog szerepelni valószínűleg a legmagasabb férfi?Vagy mindkét kutatónak egyforma az esélye erre? (d) Melyik kutató mintájában fog szerepelni valószínűleg a legalacsonyabb férfi? Vagy mindkét kutatónak egyforma az esélye?

9. A HANES mintájában a férfiak magasságátlaga 175 cm volt, a szórás pedig 7,6 cm.Mondjuk holnap véletlenszerűen kiválasztunk egy férfit a mintából. Önnek meg kelltippelnie a magasságát. Hogyan tippelne? Nagyjából háromból egy az esélye annak,hogy ________ centiméternél többet téved. Töltse ki az üresen hagyott helyet! Vá-laszlehetőségek:

1 cm, 8 cm, 13 cm.

10. A 9. feladathoz képest most annyi a különbség, hogy egy egész sor férfit válasz-tunk ki véletlenszerűen. Ahogy egy férfi megjelenik, összevetjük tényleges testma-

92 II. RÉSZ: LEÍRÓ STATISZTIKA

freedman02.qxd 2002.08.22. 20:01 Page 92

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

gasságát a tippel, és megnézzük, mekkora az eltérés. Az eltérések négyzetes közép-értéke _______ lesz. Töltse ki az üresen hagyott helyet! (Javaslatunk: Vessen egy pil-lantást a 6. szakasz bekeretezett mondatára!)

6. A SZÓRÁS KISZÁMÍTÁSA

Egy számsor szórásának kiszámításához nézzük egyenként a számokat. Valamilyenmértékben mindegyik eltér az átlagtól, esetleg 0-val:

átlagtól való eltérés = szám – átlag

A szórás ezeknek az eltéréseknek a négyzetes középértéke.

2. példa. Mennyi a következő számsor szórása: 20, 10, 15, 15 ?

Megoldás: Az első lépés az átlag kiszámítása:

átlag = = 15.

A második lépés az átlagtól való eltérések kiszámítása: egyszerűen kivonjuk az átla-got a számokból. Az eltérések:

5 -5 0 0

Az utolsó lépés az eltérések négyzetes középértékének kiszámolása:

szórás =

=

= = 12,5 ≈ 3,5

Ezzel kész is a számítás.

A szórásnak ugyanaz lesz a mértékegysége, mint amiben az adataink vannak. A test-magasságot mondjuk centiméterben mértük. A köztes lépésben, amikor négyzetreemelünk, a mértékegység négyzetcentiméterre változik, de a gyökvonással az ered-mény újra visszakerül az eredeti mértékegységbe.10 Ne keverjük össze egy számsorszórását a számok négyzetes középértékével! A szórás az átlagtól vett eltérések négy-zetes közepe, nem pedig az eredeti számoké!

4. fejezet: Az átlag és a szórás 93

szórás = az átlagtól való eltérések négyzetes középértéke

20 + 10 + 15 + 154

√ 52 + (-5) 2 + 02 + 02

4

√ 25 + 25 + 0+ 04

√ 504 √

freedman02.qxd 2002.08.22. 20:01 Page 93

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

„E” feladatsor

1. Tippelje meg, melyik számsor szórása nagyobb! Ellenőrzésképpen számolja is kia szórásokat!

(i) 9, 9, 10, 10, 10, 12(ii) 7, 8, 10, 11, 11, 13

2. Következőképpen mondja el valaki, hogyan kell kiszámítani az 1, 2, 3, 4, 5 szám-sor szórását:

Az átlag 3, az átlagtól való eltérések tehát: -2 -1 0 1 2

Hagyjuk el az előjeleket. Az átlagos eltérés

= 1,2

Ez a szórás.Igaza van-e? Magyarázza is meg a válaszát!

3. Következőképpen mondja el valaki, hogyan kell kiszámítani az 1, 2, 3, 4, 5 szám-sor szórását:

Az átlag 3, az átlagtól való eltérések tehát: -2 -1 0 1 2

A 0 nem számít, tehát az eltérések négyzetes középértéke

= 1,6

Ez a szórás.Igaza van-e? Magyarázza is meg a válaszát!

4. Három oktató összehasonlítja a vizsgájukon elért pontszámokat; mindegyikük-nek 99 hallgatója volt. Az A csoport hallgatói közül egy diáknak 1 pontja volt, egymásik 99 pontot kapott, a többiek 50 pontot. A B csoportban 49 hallgató kapott 1pontot, egy fő 50 pontot, 49 pedig 99 pontot. A C csoportban egy diák kapott 1 pon-tot, egy másik 2 pontot, egy harmadik 3 pontot, és így tovább, egészen 99 pontig.

(a) Melyik csoportban a legmagasabb az átlag? Vagy egyformák az átlagok?(b) Melyik csoportban a legnagyobb a szórás? Vagy ugyanakkorák?(c) Melyik csoportban a legnagyobb a pontszámok terjedelme? Vagy ugyanakkorák?

94 II. RÉSZ: LEÍRÓ STATISZTIKA

2 + 1 + 0 + 1 + 25

√ 4 + 1+ 1 + 44

freedman02.qxd 2002.08.22. 20:01 Page 94

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

5. (a) Az alábbi számsorok mindegyikére számítsa ki az átlagot, az átlagtól való eltéréseket és a szórást!

(i) 1, 3, 4, 5, 7(ii) 6, 8, 9, 10, 12

6. Hajtsa végre az 5. feladat utasításait a következő számsorokra is:1, 3, 4, 5, 73, 9, 12, 15, 21

7. Hajtsa végre az 5. feladat utasításait a következő számsorokra is:5, -4, 3, -1, 7–5, 4, -3, 1, -7

8. (a) Kalifornia állam kormányzója azt javasolja, hogy minden állami alkalmazottkapjon egységesen havi 70 dollár fizetésemelést. Hogyan befolyásolná ez az állami alkalmazottak átlagjövedelmét? És a szórást?(b) Hogyan befolyásolná az átlagjövedelmet és a szórást, ha 5%-os fizetéseme-lést kapna mindenki?

9. Mekkora a következő számsor négyzetes középértéke: 17, 17, 17, 17, 17 ? Mennyia szórása?

10. A 107, 98, 93, 101, 104 számsor esetében melyik a nagyobb: a négyzetes közép-érték vagy a szórás? Számolásra nincs szükség.

11. Lehet-e negatív szám a szórás?

12. Vegyünk egy pozitív számokból álló számsort! Nagyobb lehet-e a szórás az át-lagnál?

Kiegészítő megjegyzés: A szórás kiszámításának van egy másik módja is, mely bizo-nyos esetekben kényelmesebb lehet:11

szórás = a számok négyzetének átlaga – a számok átlagának négyzete

7. A SZÁMÍTÁS STATISZTIKAI FUNKCIÓKKAL ELLÁTOTT SZÁMOLÓGÉPPEL

A statisztikai funkciókkal ellátott számológépek többsége nem a szórást számítja ki,hanem egy másik, picivel nagyobb mennyiséget: a korrigált szórást. (A szórás és akorrigált szórás közti különbséget gondosan elmagyarázzuk majd a 26. fejezet 6.szakaszában.) Ha ki akarjuk deríteni, hogy saját kalkulátorunk melyiket számolja,üssük be a –1, 1 számokat; ha a gép 1-et ad eredményül, akkor szórással dolgozik;ha 1,41...-et ír ki, akkor korrigált szórással. Ha a korrigált szórást kapjuk meg, de mi

4. fejezet: Az átlag és a szórás 95

freedman02.qxd 2002.08.22. 20:01 Page 95

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

a szórást szeretnénk, akkor szoroznunk kell még egy tényezővel. Ennek nagyságaattól függ, hány szám szerepel a listán. Tíz szám esetében 9/10 a faktor. Húsz számesetén 19/20. Általánosságban:

szórás = · (korrigált szórás)

8. ISMÉTLŐ FELADATSOR

Az ismétlő feladatok a korábbi fejezetek anyagait is felhasználhatják.

1. (a) Mennyi az átlaga és a szórása a következő számsornak: 41, 48, 50, 50, 54, 57?(b) Mely számok esnek közülük az átlagtól 0,5 szórásnyin belül? Melyek 1,5 szó-ráson belül?

2. (a) A következő számsorok átlaga 50. Melyiknek kisebb a szórása? Miért? Számolásra nincs szükség.

(i) 50, 40, 60, 30, 70, 25, 75(ii) 50, 40, 60, 30, 70, 25, 75, 50, 50, 50

(b) Ugyanezek a kérdések a következő két listával kapcsolatban is:(i) 50, 40, 60, 30, 70, 25, 75(ii) 50, 40, 60, 30, 70, 25, 75, 99, 1

3. Íme egy lista:0,7 1,6 9,8 3,2 5,4 0,8 7,7 6,3 2,2 4,18,1 6,5 3,7 0,6 6,9 9,9 8,8 3,1 5,7 9,1(a) Tippelje meg mindenfajta számolás nélkül, hogy az átlag inkább 1, 5 vagy 10körül van-e!(b) Tippelje meg mindenfajta számolás nélkül, hogy a szórás inkább 1, 3 vagy 6körül van-e!

4. A 25 éven felüli amerikai népesség jövedelmét tekintve vajon az átlag vagy amedián a nagyobb? És a befejezett iskolai osztályok számát nézve?

5. A HANES felmérésben részt vevő 18-24 éves férfiak szisztolés vérnyomásának át-laga 124 hgmm, a szórás 14 hgmm volt.12 Az alábbi vérnyomásértékek szokatlanulmagasnak, szokatlanul alacsonynak vagy nagyjából átlagosnak számítanak-e:

80 hgmm 115 hgmm 135 hgmm 210 hgmm

96 II. RÉSZ: LEÍRÓ STATISZTIKA

√√

√ a listán szereplő számok száma –1a listán szereplő számok száma

freedman02.qxd 2002.08.22. 20:01 Page 96

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

6. Felvázoltuk három adatsor hisztogramját.(a) Az átlagok növekvő sorrendben: 40, 50, 60. Párosítsa össze a hisztogramokata saját átlagukkal!(b) Melyik hisztogramhoz tartoznak a következő leírások?

A medián kisebb az átlagnálA medián az átlag körül vanA medián nagyobb az átlagnál

(c) 5, 15 vagy 50 körül van-e inkább az (iii) hisztogram szórása?(d) Igaz-e, hogy az (i) hisztogramnak sokkal kisebb a szórása, mint az (iii) hisz-togramnak? Miért?

7. Egy főiskolai hallgatók körében folytatott vizsgálatban a férfiak átlagos testsúlyakörülbelül 66 kg, a szórás körülbelül 9 kg volt. A nőknél az átlagos testsúly 55 kg, aszórás 9 kg.

(a) Mennyi az átlag és a szórás fontban számolva? (1 kg = 2,2 font)(b) Elég egy durva becslés: vajon a férfiak hány százaléka volt 57 és 75 kg között?(c) Ha a férfiakat és a nőket együtt tekintjük, akkor a testsúlyok szórása 9 kg-nálkevesebb lesz, több lesz annál, vagy 9 kg körül lesz? Miért?

8. A HANES mintájában a fiúk átlagos magassága 9 éves korban 136 cm, 11 éves kor-ban 146 cm volt. 11 éves kornál az összes gyerekre vonatkozó magasságátlag 147 cm.12

(a) Átlagosan véve magasabbak-e a fiúk a lányoknál 11 éves korban?(b) Becsülje meg a 10 éves fiúk magasságátlagát!

9. A kutató egy vizsgálatban megkérdezett 1000 ember családi jövedelmeit tartalma-zó adatfájllal dolgozik. A jövedelmek évi 5800 dollártól 98 600 dollárig terjednek. Vé-letlenségből elírták a legmagasabb jövedelem értékét 986 000 dollárra.

(a) Befolyásolja ez az átlagot? Ha igen, mennyire?(b) Befolyásolja ez a mediánt? Ha igen, mennyire?

10. Az egyik jogi egyetemen a frissen bekerült hallgatók felvételi teszt* pontszámai-nak átlaga 163 pont, a szórás 8 pont volt. Holnap véletlenszerűen kiválasztunk kö-zülük valakit. Önnek most kell megtippelnie az illető pontszámát; ezt majd összeha-sonlítják az illető tényleges eredményével és megnézik, mennyit tévedett. Minden

4. fejezet: Az átlag és a szórás 97

* LSAT (Law School Aptitude Test), emeltszintű érettségi, illetve központi felvételi vizsga jog-ból. A ford.

freedman02.qxd 2002.08.22. 20:01 Page 97

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

egyes pontnyi tévedés 1 dollárjába kerül. (Ha például 158-at tippel, a tényleges pont-szám pedig 151, akkor 7 dollárt kell fizetnie.)

(a) Melyikre érdemes tippelni: 150, 163 vagy 170?(b) Kb. háromból egy az esélye, hogy _________ dollárnál többet veszít. Töltseki az üres helyet! A lehetőségek: 1$, 8$, 20$.

(A teszt lehetséges pontszámai 120-tól 180-ig terjednek; a teszt összes kitöltőjére vo-natkozó átlag 150, a szórás pedig 9 körül van. A tesztet elég gyakran felülvizsgálják,ezek az adatok az 1993-as változatra vonatkoznak.)

11. Ugyanaz történik, mint az előző feladatban, csak most egy egész sor hallgatót vá-lasztunk ki. A veszteségek négyzetes közepe _________ körül lesz. Töltse ki az üre-sen hagyott helyet!

12. Sokak véleménye szerint az amerikai társadalomban létezik egy zárt alsóosztály– a szegények többsége évről évre a szegények között marad. Az 1970-1990 közöttiidőszakban meglepően állandó volt a szegénységben élők részaránya az amerikainépességen belül, mintegy 12%. Az egyes évek jövedelemadatai a rendszeres népes-ségfelmérés adott év márciusi felvételéből származnak; a szegénységi küszöbök a hi-vatalos definíciókon alapulnak.13

Milyen mértékben támasztják alá ezek az adatok a zárt alsóosztályról szóló el-méletet? Elemezze röviden!

9. ÖSSZEFOGLALÁS

1. Egy tipikus adatsor összefoglalható az átlaggal és a szórással.

2. A számsor átlaga =

3. Az átlag kijelöli a hisztogram közepét abban az értelemben, hogy az átlagnál„alátámasztva“ lesz egyensúlyban a hisztogram.

4. A hisztogram alatti terület fele a mediántól balra, a fele attól jobbra esik. A medián a hisztogram közepének egy másfajta meghatározása.

5. Egy számsor négyzetes középértéke azt méri, hogy mekkorák ezek a számokaz előjeleket figyelmen kívül hagyva.

6. Egy számsor négyzetes közepe = a számok négyzetének átlaga.

7. A szórás az átlagtól való távolságot méri. A listán szereplő számok valameny-nyire eltérnek az átlagtól. A szórás ezeknek az eltéréseknek egyfajta átlaga. Konkré-tan: a szórás az átlagtól való eltérések négyzetes középértéke.

98 II. RÉSZ: LEÍRÓ STATISZTIKA

a számok összegea számok darabszáma

freedman02.qxd 2002.08.22. 20:01 Page 98

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó

Pecze Judit2012-12-16 14:30:09

8. A listán szereplő számok durván 68%-a az átlagtól számított egy szórásnyinbelül esik, 95%-uk pedig két szórásnyin belül. Ez sok esetben igaz, de nem mindig.

9. Ha egy vizsgálat az életkor hatásáról tesz megállapításokat, nézzük meg, hogykeresztmetszeti vagy longitudinális adatokkal dolgoztak-e.

4. fejezet: Az átlag és a szórás 99

freedman02.qxd 2002.08.22. 20:01 Page 99

© David Freedman, Robert Pisani, Roger Purves

© Typotex Kiadó