23

Click here to load reader

Хи квадрат- единичен и множествен

Embed Size (px)

DESCRIPTION

Курсова работа по "Статистическо изследване на зависимости"

Citation preview

Page 1: Хи квадрат- единичен и множествен

УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВОСОФИЯ

КУРСОВА РАБОТАпо Статистическо изследване на зависимости

на тема

Page 2: Хи квадрат- единичен и множествен

Хи- квадрат е статистически метод за проверка на хипотези от класа на непараметричните.Когато се изследва предполагаема връзка между две явления, представени чрез измерители, разположени на слабите скали за измерване, се използва обикновенният Хи квадрат метод.Най-честата употреба на χ2-разпределението е във връзка с анализа на данни, измерени по номиналната скала. При този анализ наблюдаваните честоти на появата на дадено събитие се сравняват с теоретичните (очакваните) честоти.Наблюдавани честоти са тези, които се получават по емпиричен път чрез директно наблюдение. Теоретичните или очакваните честоти се получават в резултат на определена хипотеза.Теоретичното извадково разпределение на χ2 може да бъде генерирано, но това не е необходимо. Подобно на t- разпределението, χ2- разпределението е фамилия от разпределения, всяко от които е функция на степените на свобода, свързани с извадковите данни. Подобно на t- разпределението, за еднозначното определяне на специфично χ2-разпределение е достатъчно да са зададени единствено степените на свобода. Да разгледаме резултатите от примера с хвърлянето на една монета.Едно от основните предимства на метода е,че не изисква познаването на закона за стохастичното разпределение. Нещо, което при слабите скали на измерване би било почти невъзможно. По принцип методът е приложим и при връзки, представени на по-високи равнища на индикиране на променливите (ординална, интервална или относителна скала), но в тези случаи съществуват и други по- ефективни методи за анализ, поради което използването на този става безпредметно.Хи квадрат методът е пригоден за изследване на възки от корелационен тип, каквито са повечето от връзките в социално- икономическата област. Метода търси отговор на въпроса доколко предполагаема зависимост съществува обективно, неслучайно и се проявява като такава сред исзследваната съвкупност от единици. За да се използва метода, единиците трябва предварително едновременно да бъдат групирани по значенията на онези признаци, чрез които са индикирани изследваните явления, т.е. да разполагаме с едномерни, двумерни, тримерни или многомерни емпирични честотни разпределения под формата на таблици. Методът е конструиран така,че да се основава на сравнението на две разпределения. Едното- емпирично, такова, каквото се наблюдава в действителността, а другото- теоретично, каквото бихме имали, ако между изследваните явления не съществува обективно връзка. От съпоставянето на тези две разпределения се изгражда критерий, въз основа на който се проверява наличието (респективно условието) на изследваната предполагаема връзка.Когато преп изследователя стои задачата да се изследва някаква предполагаема връзка между две явления, представени чрез измерители, разположени на слабите скали за измерване, се използва обикновенният χ2- метод.Разглеждаме определена извадка спрямо два признака, разположени на слабите скали на измерване. Означаваме тези признаци с А и В.Първият етап от изследването на връзката между двата признака изисква дефиниране на нулева (H 0) и алтернативна (H 1) хипотеза. Нулевата хипотеза ще бъде предположението, че между възрастта на респондента и средния месечен доход на домакинството не

~ 1 ~

Page 3: Хи квадрат- единичен и множествен

съществува обективна връзка. Казано подруг начин, различните месечни доходи в домакинствата не са обвързани с възрастта. Ако се наблюдава такава връзка, то тя е плод на действието на случайни влияния. Алтернативната хипотеза е предположението, че между двете явления съществува обективна, неслучайна връзка. Тоест средният месечен доход на домакинството е свързан по някакъв начин с възрастта на респондента.Не се залага на предположение относно характера на изследваната връзка- дали е причинно- следствена или някаква връзка от общ характер.На втория етап определяме риска за грешки от първи род (α). Трети етап: определяме метода на проверката. Изборът на метода на проверката е предопеделен от равнището, на което се измерват изследваните явления и от характера на проверяваната хипотеза. Хи-квадрат метода е от групата на непараметричните методи за проверка на хипотези, прикоито не се налага никакво предположение относно стохастичния закон на разпределение на характеристиките на хипотезата. Формулата, чрез която се оценява емпиричната характеристика е следната:

χем2 =∑

i∑j

( f ij− f̂ ij)2

f̂ ijкъдето: χем2 е оценяваната емпирична характеристика на хипотезата;f ij - фактически наблюдаваният брой случаи във всяка клетка от изходната таблица;f̂ ij - теоретически очакваният брой случаи в отделните клетки на изходната таблица, такъв, какъвто би бил, ако между изследваните явления не съществува връзка;∑i∑j

−¿¿ двойната сума, която показва, че сумирането трябва да се извърши

последователно по редове и по колони или обратно.На четвърти етап осигуряваме необходимата ни информация. Необходимо условие за проверката е данните да бъдат набрани чрез представителна извадка. Само по този начин може да се очаква, че емпиричната характеристика на хипотезата ще има поведение на случайна величина и ще реализира общия модел на проверката.Пети етап: изчисляваме емпиричната характеристика на хипотезата. Тази точка се свежда до чисто технически изчислителни операции. Оценяването на емпиричната характеристика преминава през следните стъпки:

изчисляват се теоретично очакваните честоти за всяка клетка на изходната таблица по формулата:

f̂ ij=∑i

f i •∑j

f • j

∑i∑j

f ij

където:f̂ ij- търсеният брой случаи за всяка отделна клетка;∑i

f i •- броят на случаите по редове при постоянна колона (маржинална сума по

редове);

~ 2 ~

Page 4: Хи квадрат- единичен и множествен

∑j

f • j- броят на случаите по колони при постоянна колона (маржинална сума по

колони);∑i∑j

f ij- общия брой на наблюдаваните случаи (обем на извадката).

намират се разликите ( f ij−f̂ ij ) за всяка клетка на таблицата и се повдигат на квадрат.съгласно формулата:

χем2 =∑

i∑j

( f ij− f̂ ij)2

f̂ ij

се оценяват отношенията ( f ij−f̂ ij )

2

f̂ ij за всяка клетка от таблицата и чрез тах изчисляваме

χем2 .

Шести етап- определяме характеристиката на критичната област на хипотезата (W). Тя зависи от метода на проверка и от начина на дефиниране на алтернативната хипотеза Хи-квадрат методът предполага едностранна(десностранна) критична област. Следователно при търсене на теоретичната характеристика се работи с координата α.Седми етап- определяне на теоретичната характеристика на хипотезата χ t

2. Това става с помощта на таблицата за теоретично разпределение при α= 0,05 и степени на свобода f= (p-1)(k-1), където p е броят на редовете, а k е броят на колоните в изходната таблица (без сумарните).Осми етап- Вземане на решение- става след като се сравнят емпиричната и теоретичната характеристика на хипотезата. Когато χем

2 е по-голяма от χ t2, това означава, че приемаме за

вярна алтернативната хипотеза и обратното.Задача:

Да се измери връзката между пола и четенето на книги.За да осъществим изследването ще използваме следните данни:

Пол на респондента

ТВЪРДЕНИЕ - Чета поне по една книга

на месец

Жена По-скоро ДА

Жена По-скоро ДА

Мъж Не

Жена Да

Жена По-скоро ДА

Жена По-скоро ДА

Мъж Не

Жена Не

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена Не

Жена Да

Жена Да

Мъж Не

~ 3 ~

Page 5: Хи квадрат- единичен и множествен

Жена Не

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена Не

Жена Не

Жена Не

Жена По-скоро НЕМъж Не

Жена Да

Мъж Не

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена ДаМъж По-скоро НЕ

Жена Да

Мъж По-скоро ДА

Мъж По-скоро НЕ

Жена По-скоро НЕ

Мъж Не

Мъж По-скоро ДА

Мъж Не

Жена Да

Мъж Не

Мъж По-скоро ДА

Жена Не

Мъж Не

Жена Не

Мъж Да

Жена По-скоро НЕ

Жена По-скоро ДА

Жена Да

Жена По-скоро НЕ

Жена Да

Жена Да

Жена По-скоро ДА

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена Не

Жена Да

Жена Да

Мъж Не

Жена По-скоро НЕ

Жена По-скоро НЕ

~ 4 ~

Page 6: Хи квадрат- единичен и множествен

Жена Да

Жена По-скоро НЕ

Жена Не

Мъж Да

Жена Да

Жена По-скоро НЕ

Мъж По-скоро НЕ

Мъж По-скоро ДА

Мъж По-скоро НЕ

Жена Да

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена По-скоро ДА

Жена Да

Жена Не

Мъж Не

Жена Не

Жена Да

Жена Да

Мъж По-скоро НЕ

Мъж Да

Жена Да

Мъж Да

Мъж По-скоро НЕ

Жена Не

Жена По-скоро ДА

Жена Да

Жена По-скоро ДА

Жена По-скоро НЕ

Жена По-скоро НЕ

Мъж Да

Жена Да

Жена Не

Жена Да

Мъж Да

Жена Да

Жена Не

Жена Да

Мъж По-скоро НЕ

Жена Не

Жена По-скоро ДА

Жена По-скоро ДА

Жена Не

~ 5 ~

Page 7: Хи квадрат- единичен и множествен

Мъж По-скоро ДА

Мъж Не

Жена По-скоро НЕ

Жена Да

Жена Не

Мъж По-скоро ДА

Мъж По-скоро НЕ

Жена Да

Мъж По-скоро ДА

Мъж По-скоро НЕ

Жена По-скоро НЕ

Мъж По-скоро ДА

Мъж Не

Мъж Да

Жена Не

Мъж Да

Жена Не

Жена По-скоро ДА

Жена По-скоро ДА

Жена Да

Мъж Не

Жена Да

Мъж Да

Мъж Да

Жена По-скоро ДА

Жена По-скоро НЕ

Мъж Да

Жена По-скоро ДА

Мъж Да

Жена По-скоро НЕ

Мъж Не

Мъж Не

Жена Да

Мъж По-скоро ДА

Мъж Не

Мъж Да

Жена По-скоро НЕ

Мъж Да

Жена По-скоро ДА

Жена Да

Жена Да

Мъж Не

Жена Да

~ 6 ~

Page 8: Хи квадрат- единичен и множествен

Жена По-скоро НЕ

Жена По-скоро НЕ

Мъж По-скоро НЕ

Жена По-скоро НЕ

Мъж Не

Мъж Не

Жена По-скоро НЕ

Жена По-скоро ДА

Жена Да

Мъж Не

Жена Да

Мъж Да

Жена По-скоро НЕ

Жена Да

Мъж Не

Мъж Не

Жена По-скоро ДА

Мъж Не

Мъж Не

Жена По-скоро ДА

Жена По-скоро НЕ

Мъж По-скоро НЕ

Жена По-скоро НЕ

Жена Не

Жена Да

Мъж Да

Жена Да

Мъж По-скоро НЕ

Жена По-скоро НЕ

Жена Да

Жена По-скоро НЕ

Жена По-скоро НЕ

Жена По-скоро ДА

Жена Не

Мъж Не

Жена Не

Жена Да

Мъж По-скоро НЕ

Мъж По-скоро НЕ

Мъж По-скоро ДА

Жена По-скоро НЕ

Жена Да

Жена По-скоро ДА

~ 7 ~

Page 9: Хи квадрат- единичен и множествен

Жена Не

Мъж По-скоро НЕ

Жена По-скоро ДА

Жена По-скоро ДА

Жена Не

Жена По-скоро НЕ

Жена По-скоро ДА

Жена Не

Жена По-скоро ДА

Жена Да

Жена Не

Мъж По-скоро ДА

Жена Не

Мъж Не

I етап: Дефиниране на хипотезиH 0- няма статистически значима връзка между пола и четенето на книги.H 1- има статистически значима връзка между пола и четенето на книги.

II етап: Определяне на риска за грешки от първи родα= 0,05

III етап: Определяне на критерий за проверкаТъй като разполагаме с данни за две явления, разположени на слабите скали (възрастта на респондента и средния месечен доход на домакинството), то ще използваме χ2 метода.

χем2 =∑

i∑j

( f ij− f̂ ij)2

f̂ ijIV етап: Набавяне на необходимата информацияЧрез репрезентативна извадка са набавени следните данни:

Пол на респондента (f)

ТВЪРДЕНИЕ - Чета поне по една книга на месец

Да (m) Не (n) ОбщоЖена (a) 66 65 131Мъж (b) 27 42 69Общо (Σ) 93 107 200

Пол на респондента f̂

ТВЪРДЕНИЕ - Чета поне по една книга на месец

Да (m) Не (n) Общо (P)Жена (а) 60,915 70,085 131Мъж (b) 32,085 36,915 69

~ 8 ~

Page 10: Хи квадрат- единичен и множествен

Общо (Σ) 93 107 200

f̂ am= (Σm*Σa): Σ P = (93*131): 200= 60,915f̂ bm= (Σm*Σb): Σ P = (93*69): 200= 32,085f̂ an= (Σn*Σa): Σ P = (107*131): 200= 70,085b̂an= (Σn*Σb): Σ P = (107*69): 200= 36,915

Следващата стъпка е да намерим разликата между стойностите в отделните клетки и техните изгладени стойности:

( f ij−f̂ ij )2

Да (m) Не (n) ОбщоЖена (a) 25,857225 25,857225 51,71445Мъж (b) 25,857225 25,857225 51,71445Общо (Σ) 51,71445 51,71445 103,4289

( f ¿¿am− f̂ am)2 ¿= (66−60,915)2 = 5,0852 = 5,0852

( f ¿¿bm− f̂ bm)2 ¿= (27−32,085)2 = (−5,085)2 =25,857225

( f ¿¿an−f̂ an)2¿= (65−70,085)2 = 5,0852 =25,857225

( f ¿¿bn− f̂ bn)2¿= (42−36,915)2 = (−5,085)2 =25 ,857225

( f ij−f̂ ij )2

f̂ ij Да (m) Не (n) ОбщоЖена (a) 0,424480424 0,368940929 0,793421352Мъж (b) 0,805897616 0,700453068 1,506350684Общо (Σ) 1,230378039 1,069393997 2,299772036

( f am− f̂ am)2

f̂ am = 25,85722560,915

≈ 0,424480424

( f bm− f̂ bm)2

f̂ bm = 25,85722530 ,085

≈ 0,805897616

( f an− f̂ an)2

f̂ an = 25,85722570 ,085

≈ 0,368940929

~ 9 ~

Page 11: Хи квадрат- единичен и множествен

( f bn− f̂ bn)2

f̂ bn = 25,85722536,915

≈ 0,700453068

V етап: изчисляваме емпиричната характеристика на хипотезата:∑i∑j

f ij = 200 (обема на извадката)

χem2 =∑

i∑j

( f ij− f̂ ij)2

f̂ ij ≈ 0,424480424 + 0,805897616 + 0,368940929 + 0,700453068

≈ 2,299772036

VI етап- определяме характеристиката на критичната област на хипотезата (W). Имаме едностранна (десностранна) критична област.

VII етап- определяне на теоретичната характеристика на хипотезата χ t2.

χt (α=0,05f=1 )2

= 3,841

f= (p-1)*(k-1) = (2-1)*(2-1) = 1

VIII етап- Вземане на решение: χem2 < χ t

2 (2,299772036 < 3,841) => приемаме за вярна нулевата хипотеза

Извод: С риск за грешка 5 % не можем да отхвърлим H 0, тоест не съществува статистически значима връзка между пола и четенето на книги.

Множествен Хи- кварат метод

Множествения Хи- квадрат метод има няколко разновидности:метод на Бартлет;метод на Ланкастър;метод на Плакет;метод на Гутман и др.

Ще разгледаме по- подробно метода на Гутман. При него се изследва връзката едновременно между три явления, представени на номиналната скала, две от тях се представят с по две разновидности,а третото- с произволен брой такива. Изследването на връзката между тези три признака, с помощта на множествения Хи- квадрат метод преминава през следните етапи:Първи етап: Дефиниране на нулева (H 0) и алтернативна (H 1) хипотеза:Нулевата хипотеза: между пола на изследваните лица, типа на населеното място, където живее респондента и четенето на книги не съществува обективна връзка. Доколкото

~ 10 ~

Page 12: Хи квадрат- единичен и множествен

такава се наблюдава, тя е плод на случайни фактори. Алтернативната хипотеза е предположението, че между трите явления (пола на изследваните лица, типа на населеното място, където живее респондента и четенето на книги) съществува обективна, неслучайна връзка.

Втория етап определяме риска за грешки от първи род (α).α= 0,05

Трети етап: определяме метода на проверката. Той се основава на χ2- разпределението и се оценява чрез модификацията на χ2- метода във вида:

χem2 =∑

m

qm−(∑m

bmqm)2

∑m

bm2 qm

където:

qm=1um

;

um=∑i∑j

1f ijm

;

bm=f 12m∗f 21mf 11m∗f 22m

.

f ij е броят на случаите в отделната клетка на таблицата предварително групирани данни;m- категориите на третия признак, който може да се представи с произволен брой разновидности.На четвърти етап осигуряваме необходимата ни информация. На този етап осигуряваме необходимата ни информация за qm, um и bm.

Пети етап: изчисляваме емпиричната характеристика на хипотезата.

Шести етап- определяме характеристиката на критичната област на хипотезата (W). Критичната област е едностранна, тъй като чрез проверката може само да се отхвърли нулевата хипотеза, но не може да се определи каква е посоката на връзката.

Седми етап- определяне на теоретичната характеристика на хипотезата χ t2.

Тя се определя при грешка α = 0,05 и степени на свобода f= m-1.

Осми етап- Вземане на решение- става след като се сравнят емпиричната и теоретичната характеристика на хипотезата. Когато χем

2 е по-голяма от χ t2, това означава, че приемаме за

вярна алтернативната хипотеза и обратното.

~ 11 ~

Page 13: Хи квадрат- единичен и множествен

Задача:Разполагаме със следните данни, получени чрез представителна извадка:

Пол на респондента

Тип населено място в което живее респондента

ТВЪРДЕНИЕ - Чета поне по една книга на месец

Жена Среден и малък град По-скоро ДА

Жена Среден и малък град По-скоро ДА

Мъж Среден и малък град Не

Жена София Да

Жена София По-скоро ДА

Жена София По-скоро ДА

Мъж Голям град Не

Жена Без отговор Не

Жена Голям град По-скоро НЕ

Жена Среден и малък град По-скоро НЕ

Жена Среден и малък град Не

Жена София Да

Жена Среден и малък град Да

Мъж Среден и малък град Не

Жена Среден и малък град Не

Жена София По-скоро НЕ

Жена София По-скоро НЕ

Жена Среден и малък град Не

Жена Среден и малък град Не

Жена Голям град Не

Жена Без отговор По-скоро НЕ

Мъж Среден и малък град Не

Жена София Да

Мъж София Не

Жена Среден и малък град По-скоро НЕ

Жена Среден и малък град По-скоро НЕ

Жена София Да

Мъж Среден и малък град По-скоро НЕЖена Голям град Да

Мъж Среден и малък град По-скоро ДА

Мъж Голям град По-скоро НЕ

Жена София По-скоро НЕ

Мъж Голям град Не

Мъж Среден и малък град По-скоро ДА

Мъж София Не

Жена Голям град Да

Мъж София Не

~ 12 ~

Page 14: Хи квадрат- единичен и множествен

Мъж София По-скоро ДА

Жена Без отговор Не

Мъж Голям град Не

Жена Среден и малък град Не

Мъж Среден и малък град Да

Жена Среден и малък град По-скоро НЕ

Жена Среден и малък град По-скоро ДА

Жена Среден и малък град Да

Жена Голям град По-скоро НЕ

Жена Среден и малък град Да

Жена София Да

Жена Среден и малък град По-скоро ДА

Жена София По-скоро НЕ

Жена Без отговор По-скоро НЕ

Жена Среден и малък град Не

Жена Среден и малък град Да

Жена Голям град Да

Мъж София Не

Жена Среден и малък град По-скоро НЕ

Жена София По-скоро НЕ

Жена София Да

Жена Среден и малък град По-скоро НЕ

Жена София Не

Мъж София Да

Жена София Да

Жена София По-скоро НЕ

Мъж Среден и малък град По-скоро НЕ

Мъж София По-скоро ДА

Мъж София По-скоро НЕ

Жена Голям град Да

Жена Среден и малък град По-скоро НЕ

Жена Среден и малък град По-скоро НЕ

Жена Голям град По-скоро ДА

Жена София Да

Жена София Не

Мъж София Не

Жена Среден и малък град Не

Жена София Да

Жена Среден и малък град Да

Мъж Среден и малък град По-скоро НЕ

Мъж Голям град Да

Жена Голям град Да

Мъж Среден и малък град Да

~ 13 ~

Page 15: Хи квадрат- единичен и множествен

Мъж Среден и малък град По-скоро НЕ

Жена Среден и малък град Не

Жена София По-скоро ДА

Жена Среден и малък град Да

Жена София По-скоро ДА

Жена Без отговор По-скоро НЕ

Жена Голям град По-скоро НЕ

Мъж Голям град Да

Жена Среден и малък град Да

Жена Голям град Не

Жена Среден и малък град Да

Мъж София Да

Жена София Да

Жена Среден и малък град Не

Жена Среден и малък град Да

Мъж Среден и малък град По-скоро НЕ

Жена Голям град Не

Жена София По-скоро ДА

Жена София По-скоро ДА

Жена София Не

Мъж Голям град По-скоро ДА

Мъж София Не

Жена София По-скоро НЕ

Жена Голям град Да

Жена Среден и малък град Не

Мъж София По-скоро ДА

Мъж София По-скоро НЕ

Жена Голям град Да

Мъж София По-скоро ДА

Мъж София По-скоро НЕ

Жена Без отговор По-скоро НЕ

Мъж Без отговор По-скоро ДА

Мъж Среден и малък град Не

Мъж Среден и малък град Да

Жена Голям град Не

Мъж Голям град Да

Жена Среден и малък град Не

Жена Среден и малък град По-скоро ДА

Жена Среден и малък град По-скоро ДА

Жена Среден и малък град Да

Мъж Среден и малък град Не

Жена Среден и малък град Да

Мъж София Да

~ 14 ~

Page 16: Хи квадрат- единичен и множествен

Мъж Среден и малък град Да

Жена Без отговор По-скоро ДА

Жена София По-скоро НЕ

Мъж София Да

Жена Среден и малък град По-скоро ДА

Мъж Голям град Да

Жена София По-скоро НЕ

Мъж Среден и малък град Не

Мъж Голям град Не

Жена София Да

Мъж Среден и малък град По-скоро ДА

Мъж Среден и малък град Не

Мъж София Да

Жена Среден и малък град По-скоро НЕ

Мъж София Да

Жена София По-скоро ДА

Жена София Да

Жена Среден и малък град Да

Мъж Голям град Не

Жена София Да

Жена София По-скоро НЕ

Жена Среден и малък град По-скоро НЕ

Мъж София По-скоро НЕ

Жена София По-скоро НЕ

Мъж Голям град Не

Мъж Без отговор Не

Жена Голям град По-скоро НЕ

Жена Голям град По-скоро ДА

Жена Голям град Да

Мъж София Не

Жена Среден и малък град Да

Мъж Среден и малък град Да

Жена Без отговор По-скоро НЕ

Жена Голям град Да

Мъж София Не

Мъж Среден и малък град Не

Жена Среден и малък град По-скоро ДА

Мъж Среден и малък град Не

Мъж Среден и малък град Не

Жена София По-скоро ДА

Жена Среден и малък град По-скоро НЕ

Мъж Среден и малък град По-скоро НЕ

Жена Голям град По-скоро НЕ

~ 15 ~

Page 17: Хи квадрат- единичен и множествен

Жена Голям град Не

Жена Голям град Да

Мъж София Да

Жена Среден и малък град Да

Мъж Среден и малък град По-скоро НЕ

Жена Голям град По-скоро НЕ

Жена Среден и малък град Да

Жена София По-скоро НЕ

Жена Среден и малък град По-скоро НЕ

Жена Среден и малък град По-скоро ДА

Жена Без отговор Не

Мъж Среден и малък град Не

Жена Среден и малък град Не

Жена София Да

Мъж Среден и малък град По-скоро НЕ

Мъж Среден и малък град По-скоро НЕ

Мъж Среден и малък град По-скоро ДА

Жена Голям град По-скоро НЕ

Жена Среден и малък град Да

Жена Голям град По-скоро ДА

Жена Среден и малък град Не

Мъж Среден и малък град По-скоро НЕ

Жена София По-скоро ДА

Жена Среден и малък град По-скоро ДА

Жена Без отговор Не

Жена Среден и малък град По-скоро НЕ

Жена София По-скоро ДА

Жена Голям град Не

Жена Среден и малък град По-скоро ДА

Жена Голям град Да

Жена Среден и малък град Не

Мъж Без отговор По-скоро ДА

Жена Среден и малък град Не

Мъж Без отговор Не

За целта на изследването обобщаваме иформацията в следната таблица:

Тип населено място в което живее респондента

ТВЪРДЕНИЕ - Чета поне по една книга на месецПол на респондента Да (p) Не (n) Общо

Голям град Жена (a) 14 13 27 Мъж (b) 5 7 12Голям град общо 19 20 39София Жена (a) 24 15 39

~ 16 ~

Page 18: Хи квадрат- единичен и множествен

Мъж (b) 11 12 23София Total 35 27 62Среден и малък град Жена (a) 27 28 55 Мъж (b) 9 21 30Среден и малък град общо 36 49 85Общо 90 96 186

I: Дефиниране на нулева (H 0) и алтернативна (H 1) хипотеза:Нулевата хипотеза (H 0) : между пола на респондента, типа на населеното място, където живее и четенето на книги не съществува обективна връзка. Доколкото такава се наблюдава, тя е плод на случайни фактори. Алтернативната хипотеза (H 1): между трите явления (пола на изследваните лица, типа на населеното място, където живее респондента и четенето на книги) съществува обективна, неслучайна връзка.

II: определяме риска за грешки от първи род (α).α= 0,05 III: определяме метода на проверката. Изследваме връзката между две явления, при контролирано влияние на трето. Тък като две от явленията са с по две разновидности, а третото е с произволен брой (в дадения случай – 4), то ще използваме метода на Гутман.

IV: осигуряваме необходимата ни информация:

b u q b*b b*b*q b*q

Голям град 0,663265306 0,491208791 2,035794183 0,439920866 0,895588341 1,350271652София 0,572916667 0,282575758 3,538873995 0,328233507 1,161577022 2,027479893Среден и малък град 0,444444444 0,231481481 4,32 0,197530864 0,853333333 1,92

Общо 1,680626417 9,894668178 2,910498696 5,297751545

За изчисляване на необходимите данни в таблицата използваме следните формули, съобразени с приетите означения в таблицата по-горе:

b = f an∗f bpf ap∗f bn

; u=1f ap

+ 1f an

+ 1f bp

+ 1f bn

и q=1u

.

Голям град:

b1= f an∗f bpf ap∗f bn

= (13*5) : (14*7) = 65: 98 ≈ 0,663265306

~ 17 ~

Page 19: Хи квадрат- единичен и множествен

u1=1f ap

+ 1f an

+ 1f bp

+ 1f bn

= 114

+ 113

+ 15+ 17

≈ 0,491208791

q1=1u1

= 1 : 0,491 = 2,035794183

София:

b2= f an∗f bpf ap∗f bn

= (15*11) : (24*12) = 165 : 288 ≈ 0,572916667

u2=1f ap

+ 1f an

+ 1f bp

+ 1f bn

= 124

+ 115

+ 111

+ 112

≈ 0,282575758

q2=1u2

= 1 : 0,282575758 ≈ 3,538873995

Среден и малък град:

b= f an∗f bpf ap∗f bn

= (28*9) : (27*21) = 252 : 567 ≈ 0,444444444

u3=1f ap

+ 1f an

+ 1f bp

+ 1f bn

= 127

+ 128

+ 19+ 121

≈ 0,231481481

q3=1u3

= 1 : 0,231481481 ≈ 4,32

V: изчисляваме емпиричната характеристика на хипотезата.

χem2 =∑

m

qm−(∑m

bmqm)2

∑m

bm2 qm

= 9,894668178 – (5,297751545)2

2,910498696 =

= 9,894668178 – 28,066171432,910498696

= 9,894668178 – 9,643079886 = 0,251588292 ≈ 0,252

VI: определяме характеристиката на критичната област на хипотезата.Критичната област е едностранна, тъй като чрез проверката може само да се отхвърли нулевата хипотеза, но не може да се определи каква е посоката на връзката.

~ 18 ~

Page 20: Хи квадрат- единичен и множествен

VII: определяне на теоретичната характеристика на хипотезата χ t2 .

Тя се определя при α = 0,05 и f= m-1.χt (α=0,05f=2 )2

= 5,991

VIII: Вземане на решение: χем2 < χ t

2

0,252 < 5,991Приемаме за вярна нулевата хипотеза.

Извод: С риск за грешка 5 % можем да твърдим, че между пола на изследваните лица, типа на населеното място, където живее респондента и четенето на книги не съществува обективна. Доколкото такава се наблюдава, тя е плод на случайни фактори.

~ 19 ~