50
Gazdasági informatika 2001/2002. tanév II. félév Gazdálkodási szak Nappali tagozat

Gazdasági informatika

  • Upload
    shea

  • View
    33

  • Download
    0

Embed Size (px)

DESCRIPTION

Gazdasági informatika. 2001/2002. tanév II. félév Gazdálkodási szak Nappali tagozat. 1. BECSLÉS. Intervallumbecslés Adott valószínűség mellett megadjuk, hogy az adott értéknek mekkora az alsó-felső határa. Pontbecslés Egyetlen érték. Számtani átlag becslése. Példa. - PowerPoint PPT Presentation

Citation preview

Page 1: Gazdasági informatika

Gazdasági informatika

2001/2002. tanév II. félévGazdálkodási szak

Nappali tagozat

Page 2: Gazdasági informatika

1. BECSLÉS

PontbecslésPontbecslés

•Egyetlen érték

IntervallumbecslésIntervallumbecslés

•Adott valószínűség mellett megadjuk, hogy az adott értéknek mekkora az alsó-felső határa

Page 3: Gazdasági informatika

Számtani átlag becslésePontbecslés Intervallumbecslés

Egyetlen érték: xa

Egyszerű számtani átlgaSúlyozott számtani átlag

[xa ± Δ]

Δ: Hibahatár = z * : Becslés standard hibájaZ: standard normális valószínűségi változó

Függvények:= ÁTLAG()

= ÁTLAG ()= MEGBÍZHATÓSÁG() – hibahatár kiszámítása

Page 4: Gazdasági informatika

Példa Egy főiskola hallgatóinak köréből

egyszerű véletlen mintát vettünk. (n:=105 fő).Célunk a hallgatók szorgalmi időszakon belüli teljesítmény- szintjének vizsgálata. Ehhez egy véletlenszerűen kiválasztott tantárgy zárthelyi dolgozatainak teljesítmény % -át jegyeztük fel.

Mekkora becsült átlag! Mekkora 95%-os valószínűség mellett a becsült átlag intervalluma?

Page 5: Gazdasági informatika

Megoldás

Létszám O:közép Átlag 65,1930 40 10 35 Szórás 16,9040 50 13 45 Hibahatár: 3,2350 60 16 5560 70 20 6570 80 24 7580 90 16 8590 100 6 95

AdatokTeljesítmény

%

Hibahatár:

= MEGBÍZHATÓSÁG(Megbízhatósági szint;szórás;elemszám) =

= MEGBÍZHATÓSÁG(0,05,19; 16,9;105)

[65,19-3,23; 65,19 + 3,23] = [61,96; 68,42 ]

Page 6: Gazdasági informatika

MEGBÍZHATÓSÁG() Egy statisztikai sokaság várható értékének

megbízhatósági intervallumát adja eredményül megbízhatósági intervallum a középérték

mindkét oldalán azonos méretű. Paraméterei:

Alfa:A megbízhatósági szint kiszámításához használt pontossági szint. A megbízhatósági szint egyenlő 100*(1 - alfa), másképpen kifejezve, 0,05 alfaérték 95%-os megbízhatósági szintet takar.

SzórásA sokaságnak az adattartományon vett szórása; feltételezzük, hogy ismert.

ElemszámA minta mérete

Page 7: Gazdasági informatika

Szórás becslése

= SZÓRÁS() függvénnyel

Page 8: Gazdasági informatika

2. HIPOTÉZISELLENŐRZÉS

Statisztikai próbák

Page 9: Gazdasági informatika

PróbákPróbaPróba AlkalmazásaAlkalmazása

Z-próbaMintából számított átlag összevetése egy a mintától független értékhez (norma, szabvány, korábbi érték….) és a szórás is kivülről származik nem a mintából!

T-próba(egymintás)

Mintából számított átlag összevetése egy a mintától független értékhez (norma, szabvány, korábbi érték….) és a szórás a mintából származik!

T-próba(kétmintás)

Két egymástól független mintavétel eredményét akarjuk hasonlítani. (pl. Két főiskola átlagos tanulmányi eredményeinek összehasonlítása)

F-próbaKét minta szórásának összehasonlítása vagy kettőnél több minta átlagának összehasonlítása – Variancia analízis

2 (khi)-próba

Illeszkedésvizsgálat – sokaságok eloszlásának vizsgálata; ismérvek függetlenségének bizonyítása; mintabeli szórások és a teljes sokaságra vonatkozó szórások összehasonlítása

Page 10: Gazdasági informatika

Fogalmak – Ismétlés! Hipotézis: Előzetes feltevés Konfidencia intervallum: elfogadási tartomány Hipotézisellenőrzés: a mintából számított statisztikai

jellemzőket egy korábbi teljes körű felvétel eredményeihez vagy egy másik mintavételhez hasonlítjuk.

Eredmények közötti számszerű eltérés lényeges: - szignifikáns

Nullhipotézis: Feltételezzük a két vizsgált érték egyenlőségét

Ellenhipotézis (alternatív hipotézis) – nullhipotézis ellentéte

Egyoldalú - < vagy > Kétoldalú - nem egyenlő reláció!

Page 11: Gazdasági informatika

Kétoldali alternatív hipotézis

Page 12: Gazdasági informatika

1. Példa Egy felsőoktatási intézményben a hallgatók közül

egyszerű véletlen módszerrel kiválasztunk 105 főt. Egy ugyancsak véletlenszerűen kiválasztott tantárgyra vonatkozóan kiszámítottuk teljesítményszázalékuk átlagát: 65.19%. Egy korábbi teljes körű adatgyűjtésből tudjuk, hogy a hallgatók teljesítmény-százalékának átlaga 67,5% 18,1%-os szórás mellett!

Feladat: 5%-os szignifikancia szint mellett vizsgáljuk meg, hogy változott-e a teljes körű felvétel óta a vizsgált felsőfokú intézményhallgatóinak átlagos teljesítmény – százaléka!

Megoldás: Z- próbaMegoldás: Z- próba

Page 13: Gazdasági informatika

Megoldás

=z.próba(adatok;megadott átlag;megadott szórás) = 0,99,

Azaz már 1% -os szignifikancia szinten állíthatjuk, hogy nem változott az átlag!

Microsoft Excel munkalap

Minta adatokat

tartalmazó munkafüzet

Page 14: Gazdasági informatika

z.próba A kétszélű z-próbával kapott P-értéket (az

aggregált elsőfajú hiba nagyságát) számítja ki. A függvénnyel egy adott statisztikai sokaságból egy meghatározott esemény bekövetkezésének valószínűségét számíthatjuk ki.

Paraméterei:(tömb;x;szigma) Tömb: Az x-szel összevetendő adatokat tartalmazó

tömb vagy tartomány. X: Vizsgálandó érték Szigma: A sokaság (ismert) szórása. Ha nem adjuk

meg, akkor a minta szórását használja a függvény.

Page 15: Gazdasági informatika

2. Példa

Egy minta jellemzői: elemszám:105; szórás: 16,9; átlag:65,19

Másik minta jellemzői: elemszám:50; szórás: 17,5; átlag:62,8

Feladat: Azonosnak tekinthető-e a két minta átlaga?

Megoldás: kétmintás t-próbaMegoldás: kétmintás t-próba

Page 16: Gazdasági informatika

Megoldás

=t.próba()

Page 17: Gazdasági informatika

t.próba A Student-féle t-próbához tartozó

valószínűséget számítja ki. A T.PRÓBA például annak eldöntésére használható, hogy két minta valószínűleg azonos középértékkel rendelkező ugyanazon két statisztikai sokaságból származik-e.

Paraméterei: (tömb1;tömb2;szél;típus) Tömb1: első adathalmaz Tömb2:második adathalmaz Szél:értékei 1 – egyszélű; 2 - kétszélű Típus:t próba fajtája:

1: Párosított 2: Kétmintás egyenlő variancia 3: Kétmintás nem egyenlő variancia

Page 18: Gazdasági informatika

Inverz.t A függvény a megadott szabadságfok mellett a

Student-féle t-eloszlás inverzét számítja ki. Paraméterei:(valószínűség;szabadságfok)

Valószínűség:A Student-féle t-eloszláshoz tartozó valószínűség Szabadságfok:Az eloszlás szabadságfokának száma.

Egyszélű t-értéket kapunk eredményül, ha a valószínűség helyett a 2*valószínűség értéket használjuk. Ha a valószínűség 0,05, a szabadságfokok száma 10, a kétszélű értéket az INVERZ.T(0,05;10) kifejezés adja, amelynek értéke 2,28139. Az egyszélű érték ugyanennél a valószínűségnél és szabadságfoknál INVERZ.T(2*0,05;10) alakban számítható, amelynek eredménye 1,812462.

Page 19: Gazdasági informatika

3.Példa Két minta áll rendelkezésünkre. Hasonlítsuk

össze ezek szórását! - 5 %-os szignifikancia – szint mellett vizsgáljuk meg, hogy azonosnak tekinthető-e a két minta szórása!

Megoldás: F - próbaMegoldás: F - próba

Minták

Elemszám

Szórás %

1. 105 16,9

2. 50 17,5

Microsoft Excel munkalap

Minta adatokat

tartalmazó munkafüzet

Page 20: Gazdasági informatika

Megoldás

07,19.16

5.172

2

FPróbafüggvény értéke:

Kétoldalú hipotézishez F táblabeli érték 53,1104,49

975,0 F

Számított (1,07)< Táblabeli (1,53), ezért 5%-os szignifikancia szinten állíthatjuk, hogy a két minta szórása azonos – nincs a szórások között szignifikáns különbség

Page 21: Gazdasági informatika

Megoldás – Excellel!

=F.próba(tömb1;tömb2) = 0,95 Ennyi a valószínűsége, hogy a két minta nem különbözik egymástól! , azaz 5%-os szignifikancia szinten állíthatjuk, hogy a két minta szórása azonos.

F táblabeli érték: =inverz.f()

Page 22: Gazdasági informatika

f.próba Az F-próba értékét adja eredményül. Az F-

próba az egyszélű valószínűségét adja meg annak, hogy a tömb1 és a tömb2 szórásnégyzete nem különbözik egymástól szignifikánsan. Ezzel a függvénnyel azt állapíthatjuk meg, hogy két minta szórásnégyzete különbözik-e egymástól. Segítségével például megállapíthatjuk, hogy az állami és a magániskolák tanulóinak tanulmányi eredményei szignifikánsan különböznek-e egymástól.

Paraméterei: (tömb1;tömb2)

Page 23: Gazdasági informatika

Inverz.f

Az F-eloszlás inverzének értékét számítja ki.

F táblabeli érték Paraméterei:

(valószínűség;szabadságfok1;szabadságfok2) Szabadságfok1: számláló szabadságfoka Szabadságfok2: nevező szabadságfoka

Page 24: Gazdasági informatika

Khi.próba Függetlenségvizsgálatot hajt végre. A

KHI.PRÓBA függvény a khi-négyzet (γ2) eloszláshoz rendelt értéket adja vissza a statisztika és a szabadságfokok érvényes száma szerint. A γ2 próba összehasonlítja a várható értéket a megfigyelt adatokkal.

Paraméterei:(tényleges_tartomány;várható_tartomány)

Page 25: Gazdasági informatika

Megjegyzés

Táblabeli értékeket az inverz.Xinverz.X (x: próba neve – t;khi;F) függvényekkel számoltathatjuk ki!

Page 26: Gazdasági informatika

3. ANALYSIS TOOLPAK VBA

Page 27: Gazdasági informatika

Eszközök menü - Bővítménykezelő

Page 28: Gazdasági informatika

Eszközök - Adatelemzés

Page 29: Gazdasági informatika

Leíró statisztikák

Page 30: Gazdasági informatika

Példa:

Adott egy osztály matematikából kapott eredménye.

Számítsuk ki a jellemző középértékeket (átlag, medián, módusz) valamint a szórást!

Page 31: Gazdasági informatika

Megoldás Eszközök menü AdatelemzésLeíró

statisztika Leíró statisztika párbeszédpanel

Tanuló Eredmény1 52 53 44 45 56 27 28 49 5

10 111 412 313 114 315 416 517 218 219 520 521 522 423 524 225 326 527 228 529 230 231 532 133 234 535 336 337 138 1

Page 32: Gazdasági informatika

Leíró statisztika párbeszédpanel beállításai Bemeneti tartomány Csoportosítási alap Feliratok az első sorban/oszlopban Várható értékek konfidenciaszintje K-adik legnagyobb K-adik legkisebb Kimeneti tartomány Összesítő statisztika

Page 33: Gazdasági informatika

VégeredményVárható érték = ÁTLAG(tartomány)

Medián= MEDIÁN(tartomány)

Módusz= MÓDUSZ (tartomány)

Szórás = SZÓRÁS(tartomány)

Variancia = VAR(tartomány)

Csúcsosság= CSÚCSOSSÁG (tartomány)

Ferdeség = FERDESÉG(tartomány)

Tartomány = MAX() – MIN()

Minimum = MIN(tartomány)

Maximum = MAX(tartomány)

Összeg = SZUM(tartomány)

Darabszám = DARAB(tartomány)

Legnagyobb(k)=NAGY(tratomány;k)

Legkisebb(k) = KICSI(tartomány;k)

Page 34: Gazdasági informatika

Gyakoriság

Page 35: Gazdasági informatika

Feladat

Az előző feladatban közölt adatokkal dolgozva állapítsuk meg a gyakoriságokat – hány hallgató kapott 1,2,3,4,5 osztályzatot matematikából? Készítsünk diagramot is!

Page 36: Gazdasági informatika

Megoldás EszközökAdatelemzés Hisztogram menüpont

Page 37: Gazdasági informatika

Hisztogram párbeszédablak pontjai

Bementi tartomány - adatok Rekesztartomány – csoportosítási szempont

(nem kötelező megadni) Feliratok – ekkor a megadott tartományok első

sorát feliratként kezeli! Kimeneti beállítások

Eredmény megjelenítésének helye Tartomány - adatokat tartalmazó munkalapon

belül Új munkalap Új munkafüzet

Paraeto – Rendezett oszlopdiagram felrajzolása – csökkenő sorrendben megjelenítve, kezdve a leggyakoribb adattal

Halmozott százalék – kummulált relatív gyakoriság kiszámolása

Diagram kimenet – adatok oszlopdiagramban ábrázolása

10 111 412 313 114 315 416 517 218 219 520 521 522 423 524 225 326 527 228 529 230 231 532 133 234 535 336 337 138 139 540 141 442 243 444 245 546 447 348 5

Page 38: Gazdasági informatika

Paraeto

Page 39: Gazdasági informatika

Mozgóátlag

Alkalmazása: azon idősoroknál, melyek az adatokat rövidebb időszakokra bontva tartalmazzák

Page 40: Gazdasági informatika

Példa

I. II. III. IV.1996 20 59 132 531997 21 62 139 561998 22 66 148 591999 22 69 153 612000 25 74 168 62

NegyedévÉv

Adatokat egy oszlopban vagy egy sorban kell elhelyezni!

1996 I. 20II. 59III. 132IV. 53

1997 I. 21II. 62III. 139IV. 56

1998 I. 22II. 66III. 148IV. 59

1999 I. 22

Page 41: Gazdasági informatika

Megoldás

Page 42: Gazdasági informatika

Varianciaanalízis

Több minta átlagának összehasonlítása

Page 43: Gazdasági informatika

Példa

Minták

Elemszám

Átlag %

Szórás %

1. 105 65,19 16,9

2. 50 62,8 17,5

3. 65 68,1 18,2

4. 30 66,2 15,4

Összehasonlítandó minták adatai: Kérdés: Azonosak-e a minták átlagai?

VARIANCIAANALÍZISVARIANCIAANALÍZIS

Page 44: Gazdasági informatika

Megoldás

A példában szereplő táblázatban nem a minta adatai találhatók, hanem az azokból számított adatok! A varianciaanalízis elvégzéséhez pedig a minta adatokra van szükségünk!

Mit tehetünk! Válasz: Előállíthatunk olyan

mintaadatokat, melyekből számított értékek a megadott értékeknek felelnek meg ez az első lépés

Page 45: Gazdasági informatika

Mintaadatok előállítása a példabeli értékeknek megfelelően

EszközökAdatelemzésVéletlenszám - generátor

Page 46: Gazdasági informatika

Véletlenszám-generátor párbeszédablak Változók száma Véletlenszámok száma – azaz a minta

elemszáma Eloszlás – mi csak a Normális eloszlással

foglalkoztunk! Paraméterek – a kiválasztott

eloszlástípusnak megfelelően jelennek meg a mezők (pl. Normális eloszlásnál: Várható érték és szórás)

Kimeneti beállítások

Page 47: Gazdasági informatika

Megoldás

1. Véletlenszám-generátorral 4 minta előállítása egymás mletti oszlopokba!

2. EszközökAdatelemzésEgytényEgytényezős varianciaanalízisezős varianciaanalízis

Microsoft Excel munkalap

Page 48: Gazdasági informatika

Egytényezős varianciaanalízis eredménye Kérdésre a választ az F oszlop és az F

krit. Oszlop értékeinek összehasonlításával nyerjük!

F krit.: F táblabeli érték 5%-os szignifikancia szinten.

F: kiszámított F érték - véletlenszám-generálás miatt ez mindenkinél más lehet!

6,2246,395,0 F

Nullhipotézis: Az átlagok azonosak.

Ha F < F krit., akkor a nullhipotézist elfogadjuk, ellenben elvetjük!

2,03 < 2,6, ezért a nullhipotézist elfogadjuk, azaz 5%-os szignifikancia szinten állíthatjuk, hogy a minták átlagai között számottevő különbség nincs!

Page 49: Gazdasági informatika

Variaancianalízis értékei

SS Külső szórásBelső szórás

df Szabadságfok (minták dbszáma-1;összes minta együttes elemszáma – mintákdbszáma; Összes minta db száma -1 )

MS F próba számlálója MS = SS\dfMS = SS\dfF próba nevezője

F F kiszámított érték = MS \MS= MS \MS

F krit. F táblabeli érték

Page 50: Gazdasági informatika

Összefoglalás

FüggvényAngol

FüggvényMagyar

MEGBÍZHATÓSÁG CONFIDENCE

SZÓRÁS STDEV

Z.PRÓBA ZTEST

T.PRÓBA TTEST

F.PRÓBA FTEST

KHI.PRÓBA CHITEST

INVERZ.T TINV

INVERZ.F FINV

INVERZ.KHI CHIINV