Analiza Datelor - EXCEL

Embed Size (px)

Citation preview

PARTEA 2-a ANALIZA DISPERSIONAL IN SINTEZA SI INTEPRETAREA DATELOR 2.1. ANALIZA DISPERSIONAL I TESTUL FISHER Analiza dispersional permite testarea semnificaiei relaiei ntre dou sau mai multe tipuri de clasificri, determinnd importana factorilor respectivi asupra acestor relaii. Cu alte cuvinte, analiza dispersional stabilete contribuiile pe care le aduc la dispersia total a eantionului de date, dispersiile factorilor utilizai drept criterii pentru clasificarea observaiilor6. Dac n acest raport variana atribuit unui factor este mai mare dect variana estimat a eantionului, i anume ntr-o La baza analizei dispersionale se afl segregarea dispersiei totale mrime superioar celei la a unei serii de date n dispersiile componente, care pot fi care ne-am atepta ca s atribuite diferiilor factori implicai.Variana care poate fi provin numai din variaiile atribuit unui factor este mprit la variana estimat a de eantionare, atunci i se eantionului, aceasta fiind o dispersie normal, dat de efectul recunoate acestui factor variaiilor de eantionare asupra datelor din eantion. calitatea de a exercita o influen asupra datelor din eantion. Semnificaia mrimii cu care variana unui factor depete variana estimat a eantionului se determin interpolnd valoarea acestui raport F. Celebra distribuie F provine de la numele celui care n anul 1924 a dezvoltat aceast metod R.A. Fisher (1890-1962) si ale carui contributii il pun alaturi de Karl Pearson, tatal gindirii statistice moderne. Cu ajutorul distribuiilor de probabilitate F, se stabileste dac valoarea calculat depete sau nu valoarea corespunztoare la nivelul de semnificaie = 0,05 a lui F, pentru fiecare mrime a gradelor de libertate. In mod obisnuit ne ateptm s apar o valoare F mai mare dect cea dat ca urmare a variaiilor de eantionare ntmpltoare. Analiza dispersionala se aplica atunci cind (1) fiecare populatie poate fi descrisa printr-o variabila sau factor considerata ca efect principal asupra variatiei datelor, (2) fiecare variabila independenta poate fi impartita in doua sau mai multe grupuri (alternative), (3) variabila care trebuie masurata este numita variabila dependenta), (4) scopul este acela de a determina impactul efectelor principale asupra variabilei dependente dar si interactiunile dintre variabilele independente. Se presupune ca erorile sunt normal distribuite, dispersiile esantionului nu difera semnificativ, esantioanele din fiecare populatie sunt aleatoare si independente iar datele masurate sunt bazate pe scala proportionala ori interval. Cel mai mare avantaj al analizei dispersionale este dat de capacitatea acesteia de a localiza sursa diferenelor semnificative din gruprile combinate, ntocmite dup 2, 3 sau mai multe caracteristici7.6

Isaic-Maniu A., Mitru C., Voineagu V., Statistica pentru managementul afacerilor, Editura Economic, 1996

68

Metode cantitative n marketing

n cele ce urmeaz, vom folosi analiza varianei

n urmtoarele cazuri:

influena unui singur factor (variabil aflat n coloanele tabelului statistic), influena a doi factori independeni care acioneaz simultan (n rndul i coloana tabelului de contingen), influena potenial a interaciunii celor doi factori simultan independeni, fr a folosi facilitile pachetului de programe EXCEL, recomandat pentru multiplele caliti oferite.

Aceast prim abordare se va realiza prin tehnici aritmetice, robuste, uor de intuit i reinut, dar dup verificarea calcul cu calcul vom proceda la utilizarea facilitilor pachetului mai sus amintit. Asupra datelor acioneaz variabila independent cu alternativele din coloanele tabelului statistic. Pentru verificarea omogenitii datelor, deci a lipsei de influen a variabilei considerate independente, se utilizeaz cel mai adesea, testul prezentat la punctul 2.1.1. 2.1.1. Testul asocierii,2 t (Chi,

Hi sau X2 , teoretic-t)

Testul a fost introdus de Karl Pearson (1857-1936), considerat fondatorul analizei statistice moderne, n anul 1900 i de cele mai multe ori presupune verificarea ipotezei de asociere ntre: (1) frecventele rspunsurilor obinute ntr-un chestionar la alternativele unor ntrebri i (2) verificarea unui set particular de date ce pot urma o distribuie statistic cunoscut. n problemele de marketing se aplic dup alctuirea unor tabele de contingen n care datele sunt clasificate dup una, dou sau mai multe variabile de segmentare (categorii) in distributii multinomiale. Acest test permite punerea n eviden a existenei / inexistenei unei legturi de asociere ntre subcolectivitile create de variabilele de segmentare studiate. Spre exemplu, cnd analizm rezultatele intervievrii prin chestionar, primul pas este acela de a afla ct de multe rspunsuri exist pentru fiecare alternativ a unei ntrebri. Se pot obine apoi proporiile sau procentele celor care au anumite puncte de vedere sau dein informaii legate de scopul construirii chestionarului. n faza a doua, se constituie tabele de contingen a rezultatelor prin ncruciarea rspunsurilor la dou ntrebri X cu alternativele Xi, unde i = 1,.., r aezate ca rnduri (r) ale tabelului, i Y cu alternativele Yj, cu j = 1,, c aezate n coloanele (c) ale aceluiai tabel. n mod obinuit, ntrebrile considerate variabile de segmentare (atribute independente, variabile cauzale, caracteristici extrinseci, categorii exogene, stimuli) sunt aezate n coloanele tabelului (figura 2.1).

Yj 1. j c Ti . 1. .

Xi

i. .

xij

Ti

7

Colibab Dana tefania, Prospectarea pieei bunurilor de larg consum prin metodele cantitative specifice economiei de pia, tez de doctorat, ASE Bucureti, 1999.

Analiza dispersional

69

r T. j .T. j . T. .Figura 2.1 nsumrile la captul liniei presupun neluarea n considerare a variabilei din coloane sau a altor variabile-ntrebri reprezentnd ct de multe rspunsuri exist pentru fiecare alternativ i a unei ntrebri X ce depinde de respondent (atribut sau caracteristic dependent, efect, intrinsec, endogen) de aceea totalul parial este notal cu Ti . , unde punctul este simbolul indiferenei fata de variabila din coloana. n acela fel, T.. reprezint totalul (numrul) celor ce rspund la cele dou ntrebri X, Y (i poate fi mai mic sau egal cu cel al colectivitii intervievate) indiferent de alternativele de rspuns i sau j

Ti .=

xijj=1

c

(2.1)

Tj .=

x iji =1c

r

(2.2)

T. .=

xij x ijj=1

r

(2.3)

i =1

Etapele care trebuiesc parcurse sunt urmtoarele: 1. Formularea ipotezei nule H0, care afirm c ntre cele dou variabile-ntrebri de segmentare nu exist legtur cauzal, sau asociere; 2. Alegerea nivelului de semnificaie i calcularea numrului de grade de libertate al tabelului dup formula (r-1)(c-1); pe baza acestor date se preia din tabelul repartiiei 2 valoarea lui2 , teoretic; t

3. Se calculeaz frecvenele teoretice sperate ij dup urmtoarea formul:

( t o t lai n i a x t o t c o l o aj )n aT i*. T . j l al = = (2.4) i jt o tga e n e r a l l T ..

70

Metode cantitative n marketing

4.Calcularea lui

2 formulei; cu ajutorul c

xc =5. Se compar dac dac

2

r,c ( i,j

2 xij - ij)

ij

(2.5)

2 2 cu tabelul repartiiei obinut din c t 2 2 > se respinge ipoteza nul c t 2 2 admite se c t

2 astfel: i deci exist o deci nu exist o

legtur ntre variabilele de segmentare studiate; ipoteza nul i legtur ntre variabilele de segmentare studiate. n condiiile n care se stabilete c exist o legtur ntre cele dou variabile de segmentare se pune problema ct de corelate sunt acestea. Pentru a verifica acest lucru, se va calcula coeficientul de contingen C, pentru a msura gradul de asociere ntre variabilele tabelului de contingen. Acest coeficient se calculeaz indiferent de natura variabilelor (continue sau discrete) i indiferent de natura repartiiei acestora (normal sau nu) n cadrul populaiei supus cercetrii dup modelul matematic:

C=

xc

2 2

N + xc

] [ 0,1

(2.6)

Cu ct valoarea lui C este mai aproape de 1 (dar nu ajunge niciodat s fie egal cu 1) cu att variabilele sunt mai strns corelate. Valoarea lui C depinde de numrul de rnduri i coloane, deci doi coeficieni de contingen nu pot fi comparai dect dac provin din tabele de contingen de aceeai mrime. Vom nota cu litera r (rnd, row n englez) numrul de rnduri ale tabelului de contingen, cu litera c (coloana, column n englez) numrul de coloane iar cu litera n, unitile observate (n = r * c), iar cu (alfa) probabilitatea erorii de genul I care se numete i risc de genul I, reprezentnd un prag de semnificaie necesar pentru aflarea valorii F (Fisher) din tabelele statistice. Metodologia de determinare a raportului Fisher pentru un ntreprinztor care dorete s nu foloseasc facilitile pachetului de programe EXCEL: 1. Se scrie modelul matematic innd seama de toi factorii de influen i ipotezele ce urmeaz a fi testate;

Analiza dispersional

71

2. Se calculeaz numrul de grade de libertate pentru fiecare factor de influen n parte (r-1 pentru rnduri, c-1 pentru factorul din coloane) i pentru ntregul tabel [produsul (r-1)*(c1)] i se stabilete nivelul de semnificaie ; pe baza acestora se preia valoarea raportului Fisher din tabelul distribuiei F; 3. Se calculeaz factorul de corecie C, care reprezint dispersia egal distribuit pe cele n uniti ale observate (n = r * c); 4. Se calculeaz suma ptratelor SP pe fiecare factor de influen n parte ca raport ntre totalurile aferente, numrul de date observate pentru fiecare factor n parte i vor fi corectate cu C; 5. Se calculeaz suma ptratelor datelor din ntregul tabel; 6. Se determin suma ptratelor pe eroarea experimental scznd din suma ptratelor pe tabel suma ptratelor aferente fiecrui factor de influen n parte; 7. Se determin media ptratelor MP pe fiecare factor de influen raportnd suma ptratelor aferente la numrul de grade de libertate corespunztor fiecrui factor; 8. Se calculeaz media ptratelor pe eroarea experimental ca raport ntre suma ptratelor pe eroarea experimental i numrul de grade de libertate al ntregului tabel; 9. Se determin rapoartele Fisher ntre media ptratelor pe fiecare factor de influen n parte i media ptratelor pe eroarea experimental provenit din mediu, greeli de calcul sau interpretare iniial; 10. Se compar valorile calculate cu cele tabelate astfel: Fc > Ft se respinge ipoteza nul, deci factorul respectiv are influen asupra datelor din tabel; Fc < Ft se admite ipoteza nul, deci diferenele se datoreaz variaiilor de eantionare ntmpltoare. Aici Fc reprezint coeficientul Fisher calculat iar Ft, reprezint coeficientul Fisher din tabelele statistice. n urma centralizrii datelor culese dint-o cercetare de teren, a rezultat tabelul nr 2.1, cu numrul de chestionare realizate de 10 operatori de interviu. Se urmrete obinerea informaiei sunt sau nu diferene ntre operatori ca numr de chestionare completate. TABELUL 2.1DISTRIBUIA NR. DE CHESTIONARE PE ZILE I OPERATORI

Ziua i / Observator - j Luni ziua 1 Mari ziua 2 Miercuri ziua 3 Joi ziua 4 Vineri ziua 5 Total- Tj

1 99 96 95 98 97 485

2 70 65 60 65 65 325

Nr. chestionare .8 9 10 70 85 92 51 84 91 93 80 93 94 86 90 92 90 89 .400 425 455

Cifrele din interiorul tabelului reprezint respondenii chestionai n cele cinci zile ale cercetrii. Modelul statistico-matematic este urmtorul:

72

Metode cantitative n marketing

x i j = + j + ij

(2.7)

n care fiecare dat din tabel, xij este egal cu o medie a populaiei care sufer abaterea datorat coloanei j, j i a unei erori experimentale ij. Se presupun seturile de ipoteze statistice: H0 - numrul de chestionare nu este influenat de hrnicia operatorului de interviu; (j , = 0 ) (2.8) j sau, oricare ar fi media pe coloana j, j 1 = 2 = 3 = .j = . = c (2.9)

H1 - numrul de chestionare este influenat de hrnicia operatorului de interviu; exist diferene semnificative ntre operatori. ( j , ) 0 (2.10) j sau cel puin dou medii pe coloan nu sunt egale. 1 . j (2.11)

Se calculeaz numrul de grade de libertate df1 (degree of freedom englez) pentru fiecare factor de influen n parte (n cazul de fa, operatorii din coloanele tabelului) i numrul de grade de libertate df2 pentru ntregul tabel. df1 = c - 1 = 9 df2 = (r 1)*c = 40 = 0,05 Ft (9,40) = 2,05 Se determin factorul de corecie C:

2 T.. C= n

(2.12)

n care T.. reprezint totalul general (mrimea eantionului, n cazul de fa numrul de chestionare) iar n reprezint numrul de date observate (csue completate n tabel). Vom avea:C= 4.000 = 320 .000 1052

Se determin suma ptratelor SP pe fiecare factor de influen n parte (n acest exemplu, conform ipotezei i modelului matematic, doar coloana j):

Analiza dispersional

73

S P =C

nj - Cj =1

c T2 .j

(2.13)

n care T.j reprezint totalurile din fiecare coloan j (sau alternativ de rspuns n parte) ale factorului observat, iar nj numrul de date observate din factorul respectiv (numrul de csue completate din coloan). Pentru exemplul ales vom avea urmtoarele:SPC =2 2 2 485 +325 +3502.... +455 - 320.000=6.810 5

Se determin suma ptratelor pe ntregul tabel:

S P= T

i =1 j =1Vom avea n cazul nostru:

r c

xi2j- C

(2.14)

SPT = 99 2 + 70 2 + 90 2 ... + 89 2 - 320 .000 = 9.948

Se determin suma ptratelor pe eroarea experimental: SPE = SPT - SPC SPE= 9.948 6.810 = 3.138 Se determin media ptratelor aferente fiecrui factor de influen (n acest exemplu, conform ipotezei i modelului matematic, doar coloana j):M PC = SPC df 1

(2.15)

(2.16)

MPC

=

6.810 = 756, 67 9

Se determin media ptratelor pe eroarea experimental:MPE = SPE df 2

(2.17)

74

Metode cantitative n marketing

Vom avea n cazul nostru:MPE = 3.138 = 78,45 40

Se determin raportul Fisher calculat pentru fiecare factor de influen n parte (n acest exemplu, conform ipotezei i modelului matematic, doar factorul din coloane):Fc =Fc = 756,67 = 9,65 78,45

MPC MPE

(2.18)

Se compar valoarea tabelar cu valoarea calculat: Fc < Ft, se respinge ipoteza nul, deci performanele operatorilor de interviu sunt diferite. Aceasta nseamn c diferenele sunt semnificative . n urmtoarea pagin, n figura 2.2 prezentm prelucrarea n Microsoft EXCEL.

Analiza dispersional

75

Figura 2.2 Se observ unele deosebiri, dar ipoteza diferenierii rmne oricum valabil. Diferenierile rezult din luarea n calcul n mod diferit a gradele de libertate. Dac n exemplul manual erau df1 = c-1 = 9 i respectiv r = 5, produsul lor fiind 40, iar df2 este calculat drept produsul c * (r-1), din care rezult numrul 40, n varianta ANOVA, df2 are valoarea 44, pentru df1=c. Valoarea df1 rezult n primul caz deoarece numai c-1 medii ale coloanelor (eantioanelor), j pot fi alese arbitrar fr a afecta valoarea mediei generale, . La fel, pentru gradele de libertate din tabel pot fi alese, n varianta manual c * (r-1) de vreme ce r-1 valori eantioane (zile) sunt necesare fr a afecta o medie a coloanei, c = 10. Dac ipoteza unui singur factor o verificm pentru rnduri, avem valorile din tabelul de mai jos, n varianta Microsoft EXCEL. TABELUL 2.2

76

Metode cantitative n marketing

ANOVA: SINGLE FACTOR FA RNDUL ESTE CAUZA VARIAIEI SUMMARY Groups Count Su Average Variance m Ziua 10 55 5.5 9.16 1 10 830 83 152.89 2 10 790 79 215.33 3 10 750 75 324 4 10 820 82 154.22 5 10 810 81 214.44

TABELUL 2.2 (continuare) ANOVA Source of Variation Between Groups Within Groups Total SS46652. 9630.

df

MS

F

P-value

F. crit2.38

5 9330.41 52.317 1.71E-19 54 178.34

56282 59 .

Pentru a apela la att factorul raional, ct i la cel sentimental, n dorina argumentrii teoriei statistice dar i a unor explicaii intuitive, introducem n derularea capitolului un eseu asupra necesarului mbinrii analiticului cu holisticul (globalul).

2.2. EROAREA STATISTIC I RISCURILE RESPINGERII IPOTEZEI NULE

Analiza dispersional

77

Trinicia relaiilor funcionale este dat de repetabilitatea lor. Un scop major n tiin este acela de a permite prognoza fenomenelor naturale. Atingerea acestui obiectiv se face prin descoperirea relaiilor sistematice ntre variabilele predictive (independente, exogene, extrinseci, cauzale, stimuli) i variabilele de ieire, rezultative (dependente, endogene, intrinseci, efect, reacie). Dac variaia datelor conforme variabilei predictive corespunde n acelai mod cu variaia datelor variabilei rezultative, atunci avem o relaie funcional i putem prognoza rezultatul pe care nc nu l-am aflat (observat) cunoscnd doar valoarea variabilei independente. Din pcate, ne nfruntm cu surse variate de eroare ce provin din mediul din care am extras datele, din greelile legate de identificarea unor relaii ntmpltoare, greeli de calcul sau rotunjire, din existena i neluarea n calcul a mai multe surse de influen simultan i altele. Cteodat se realizeaz o relaie sistematic ntre dou variabile pur i simplu din intmplare, cnd nimic, cu excepia Erorii, nu opereaz. Din aceast cauz trebuie s fim permanent n poziia de a distinge ntre rezultatele experimentelor care se produc doar datorit ansei sau erorilor mediului i acelea care indic prin repetabilitate o relaie sistematic ntre variabile. Problema ncrederii n datele furnizate de o relaie este dat de repetabilitate, aa nct trinicia unei relaii este repetabilitatea ei. Dac exist cu Adevrat o relaie sistematic ntre variabile atunci una dintre ele va prezice cu regularitate valorile celeilalte. Dac aceast relaie se datoreaz mai degrab Erorii sau ntmplrii, atunci nu ne putem baza pe ea i nu ne este de folos n prognoze. Dar ce facem cu fenomenul socio-economic, unde sunt miriade de relaii ntre variabile, funcii compuse i compuneri de funcii? Cercettorul ori experimentatorul care caut s deslueasc aceaste fenomene trebuie s tind, poate, pentru nelegere ctre poetica lumii lui Eminescu. Acesta avnd o lume a lui, personal, secret, destinat unei experiene solitare. Plin de fulguraii i umbre, de strbateri uluitoare i de ciudate fracturi i stagnri, de struine i de renateri a cror lege interioar uneori se las regndit, alteori nu. Un labirint de miraje, ecouri i oglinzi, de uitri i de anamneze, de masive construcii i de paragini, n care i-au lsat urmele i clipele i eonii, i timpul din lume i cellalt.8 Mersul ideilor Demiurgului ctre Luceafr este la Petru Creia urmtorul: mi ceri s-i iau eternitatea ca s poi muri, ca s te poi ntoarce n vecinicul repaos dup care, cuprins de ispita iubirii, atta nsetezi. Dar eu: a) Nu pot s-i dau condiia de muritor pentru c, noi fiind cosubstaniali, ar nsemna s m neg pe mine nsumi, s tgduiesc adevrul care ne cuprinde pe amndoi n venicia lui b) Chiar dac te-a face muritor, te-a integra ntr-o lume n care moartea la care aspiri este pur aparen, de vreme ce entitile pieritoare din care este fcut umplu nite tipare, nite Forme inalterabile, pe veci nepieritoare, sustrase timpului i devenirii; i-ai pierde doar identitatea, fr s te poi stinge n repaos, pierind i renscndu-te mereu n neodihna venic a naterilor i pierderilor care se perind prin eternitatea formelor. Mai mult, pentru a-i face i mai evident teza aceasta, vorbete cu el ca i cum a devenit deja, sau pur i simplu ar fi, o fiin pieritoare (Petru Creia, pag. 126,127, op. cit).8

Petru Creia, Testamentul unui eminescolog, Editura HUMANITAS, 1998, pag.36.

78

Metode cantitative n marketing

Este subliniat juxtapoziia a dou teze exprimate n prima parte a vorbirii Demiurgului: a) cea a diferenei i incompatibilitii dintre ordinea eternului i cea a efemerului i b) cea a eternitii formelor sau a tiparelor efemerului. Dar cum putem recunoate c relaia observat este datorat sau nu ntmplrii (erorii)? De cele mai multe ori metoda pe care oamenii de tiin o ntrebuineaz este o versiune mai organizat a bunului sim. S ne reamintim poezia Luceafrul creat de genialul Eminescu. Ctlina: l vede azi, l vede mni/Astfel dorina-i gata/El iar privind de sptmni,/i cade drag fata. (repetabilitatea ce justific trinicia relaiei) Cauza genereaz efectele, rezultatele, reacia: M dor de crudul tu amor/A pieptului meu coarde,/i ochii mari i grei m dor, Privirea ta m arde. Consecina este cererea: Dar dac vrei cu crezmnt/S te-ndrgesc pe tine, /Tu te coboar pe pmnt, /Fii muritor ca mine. Situaia grea n care se afl Hyperion este aceea a unui experimentator. Ambii doresc s afle dac ceea ce s-a ntmplat (chemrile repetate, oaptele) este datorat unui ceva important. n ambele cazuri ei trebuie s se ngrijoreze dac reaciile obinute (datele) sunt produse de fluctuaiile necontrolate ale unor factori neinteresani. Ar trebui s se ntrebe pe ei nii Am primit un mesaj important, sau este datorat zgomotului din mediu (variabilitii mediului)? Hyperion nu tie dac toate aceste chemri nu au fost alarme false, adic ceea ce experimentatorul va numi erori de tip I, eroarea lui fiind n acest caz renunarea la nemurire cnd de fapt nu exist dragoste. Cu alte cuvinte crede n existena variabilei independente (amor), cnd aceasta nu exist. Dar mai exist un tip de eroare. Ce se ntmpl dac El nu renun la nemurire i dragostea exist? Experimentatorul tie c este eroarea de tip II. Prin impunerea interveniei Demiurgului i evidenierea comportamentului Ctlinei, Eminescu ne convinge c Lucifer iubete i noi tim c Luceafrul cade n primul tip de eroare. - Tu-mi cei chiar nemurirea mea /n schimb pe-o srutare,/Dar voi s tii asemenea/Ct te iubesc de tare; Ctlina face eroarea de tip II, ea fiind convins c Hyperion nu va renuna la nemurire: Lucete c-un amor nespus /Durerea s-mi alunge,/Dar se nal tot mai sus/Ca s nu-l pot ajunge. Eroarea de tip I este corectat, acel ceva important nu exist, se pare c reaciile obinute sunt produse de fluctuaiile necontrolate ale unor factori neinteresani (muritorii Ctlin i Ctlina). Prin urmare, El tremur ca alte di/n codrii i pe dealuri, / Cluzind singurti/De mictoare valuri;, Dar nu mai cade ca-n trecut / n mri din tot naltul;/- Ce-i pas ie, chip de lut,/Dac-ai fi eu sau altul ? Dac judecm n continuare la rece, statistic, reaciile celor doi atunci ajungem la un punct fundamental al experimentului i anume ncercarea de a detecta un semnal n prezena unui

Analiza dispersional

79

mediu zgomotos. oaptele naturii, ale mrii, ale pdurii, ale vntului trebuiesc difereniate de oaptele iubitei; apariiile misteriosului Luceafr trebuie discriminate de apariiile altor frumoi tineri (Ctlin). Decidentul dorete s afle dac rezultatele obinute cu un tratament experimental difer destul de mult de ceea ce se ntmpl n lipsa acestuia pentru a decide dac variabila experimental este eficient. n mod natural avem ncredere n date dac variabilele independente produc reacii previzibile. Vom decide acest fapt prin compararea nivelului de zgomot, variaie, analiznd datele n i fr prezena tratamentului. Trebuie s discriminm ntre zgomotul de fond i cel produs atunci cnd semnalul este prezent. Trebuie s deosebim combinaia de zgomot + semnal de zgomotul n sine ntrebndu-ne ct de probabil este s se produc evenimentul dac este doar zgomot. Hyperion auzea un nivel sigur al larmei provenit de pe pmnt. Unele zgomote ori oapte puteau fi o chemare. oaptele ca zgomote erau puin peste zgomotul de fond i puteau fi chemri. Ne putem imagina ce se putea ntmpla cnd Ctlina i-ar fi spus iubirea mea. Atunci, cu mari anse, s-ar fi produs evenimentul dragoste, dar i eroarea, prezumtiv, de tip II: odat ajuns muritor, relaia acceptat de ctre Ctlina cea uuratic, s fie temporar. Tehnic, suntem interesai de un raport algebric ntre oaptele auzite i fonetele naturale. Dac oaptele se confund sau au acelai nivel cu larma obinuit atunci raportul este, algebric, 1. Dac zgomotul este altfel dect larma obinuit, raportul este mai mare, caz n care, dac depete un anumit nivel de contientizare, produce reacia, deci apariia frumosului Luceafr. Pentru experimentator raportul este observaie / eroarea estimat. Rezult o privire asupra diferenei ntre tratament i condiiile de control n contrast cu diferenele ce se observ fr tratament. Dac raportul (semnal + zgomot) / zgomot este destul de mare n raport cu zgomot/zgomot atunci exist acel ceva, semnalul. n cazul nostru oapte + larm. Cum pot ns, n practic, decide experimentatorii c rezultatele sunt de ncredere. n primul rnd prin inspectarea acestora. Uneori este att de evident distorsionarea datelor nct este clar intervenia variabilei tratament doar prin analiza experimental a comportamentului acesteia. Alternativa tiinific presupune ns analiza statistic deoarece ochiul i judecata obinuit sunt relativ insensibile n identificarea pragului de ncredere. Nu trebuie uitat c rezolvm cu greutate, fr creion sau calculator, dou ecuaii cu dou necunoscute. Cu att mai mult dac considerm n experiment mai multe variabile independente. Poate ajuta doar reducerea nivelului de zgomot prin mrirea gradat a controlului experimentului ceea ce nseamn intervenie i artificializare. De aceea este preferat analiza statistic modern. Ideea fundamental n cadrul aplicaiilor statistice moderne este aceea c amplific abilitatea de a discrimina efectele tratamentelor experimentale.

Riscurile respingerii ipotezei nule.

Ce se ntmpl cnd dorim s aflm dac variabila independent are influen; spre exemplu, Hyperion poate raiona astfel: independent de el exist o mulime de zgomot pe Pmnt. Una dintre variabilele independente este oapta Ctlinei: Cobori. Statistica ncearc s rezolve acest dubiu, decizia de a rspunde la apel, prin cuantificarea probabilitii

80

Metode cantitative n marketing

evenimentului ca parte a zgomotului de fond. S presupunem c Luceafrul are o baz de date cu toate sunetele, zgomotele, fonetele, chemrile ntmplate sear de sear. Pentru simplificare, s lum numrul de date egal cu 1000. Teoretic orice nou sunet, chemare, oapt, o poate compara cu cele 1000. Dac chemarea Cobori s-a ntmplat s spunem de mai mult de 200 de ori el poate conchide c este ceva normal, se ntmpl tot timpul i deci nu este o oapt de dragoste. Dar dac nu s-a mai ntmplat, ansele s fie din mediu sunt de 1/1000 i poate presupune altceva (dorina ateptat). n experimente, aceasta nseamn s comparm descoperirile cu ateptrile (cunoaterea) provenite din fluctuaiile aleatoare sau erori. Pentru o bucat de vreme presupunem c totul se produce dintr-o ntmplare, eroare, i cutm s aflm ct de des ne putem atepta ca observaia s se produc dac presupunerea noastr este adevrat. Acest fapt este identic cu a presupune c variabila independent nu are efect, numit n statistic ipoteza nul. n secolul XVIII, Blaise Pascal a creat un model matematic pentru situaii de joc pentru a nu fi nevoii s repetm experimentul de 1000 de ori, cazul nostru. Modelul se cheam distribuie binomial.Conform anexei create de aceast distribuie, i presupunnd c Luceafrul coboar de 7 ori din cele 10 chemri netiind dac este iubit sau nu, atunci probabilitatea este 0,172. Aceasta nseamn c ne putem atepta s coboare la orice oapt n 17% din cazuri fr s tie dac este realmente dorit sau nu. Considerm c sunt cam riscante att de multe teleportri fr efect. Dar care este probabilitatea pe care s o acceptm ca evenimentele cercetate s se produc doar datorit ansei. Din punct de vedere logic, decizia este arbitrar dar n practic se accept 5% sau mai puin. Aceasta este probabilitatea de a respinge ipoteza nul i este cunoscut ca nivel (alfa). Mrimea acestei variabile ne spune proporia n care ne ateptm s greim n respingerea ipotezei nule. La nivelul de 5% ne ateptm s respingem, n mod fals (incorect), ipoteza nul n 5% din cazuri sau o dat n douzeci de experimente. Respingerea incorect a ipotezei nule este eroarea de gen I. Pentru muli decideni, a gndi att de des eronat este inacceptabil. Ei vor dori s aeze pragul probabilitii mai jos (3%, 1%) deci 3 n 100 de experimente sau doar unul, ori chiar odat n 1000 de experimente (nivel 0,001). Dar cu ct se micoreaz nivelul alfa, crete riscul de a identifica o variabil independent care lucreaz. Aceasta este eroarea de genul II. Probabilitatea acesteia este denumit beta i nu este un singur numr ci un set de numere. Valoarea ei depinde de proprietile populaiei examinate pe care de obicei nu o cunoatem. n analiza cazului de mai sus, ipotezele H0 i H1 pentru Luceafr, respectiv Ctlina sunt urmtoarele:LUCEAFR

H0 nu exist diferene semnificative n comportament la diferitele ntlniri, nu m iubete, decizia: voi rmne nemuritor; H1 exist diferene de la ntlnire la ntlnire, m iubete, renun la nemurire. CTLINA

Analiza dispersional

81

H0 nu exist diferene n comportamentul Luceafrului, decizia va fi c voi accepta flirtul lui Ctlin; H1 exist diferene, vrea s fie muritor ca i mine, m iubete i face sacrificiul suprem. Cum am apreciat anterior, eroarea Luceafrului este de genul nti, respinge ipoteza Ho dei n realitate ea este adevrat n timp ce Ctlina face o eroare de genul al doilea, accept Ho cnd ipoteza e fals9. Reacie - Ipotez H0 fals Accept - Ctlina Eroare gen II Resping - Luceafrul H0 adevrat Eroare gen I

Probabilitatea erorii de genul I se numete risc de genul I, reprezint un prag de semnificaie notat cu (alfa), iar probabilitatea erorii de genul doi se numete risc de genul II i se noteaz cu (beta). O decizie just este luat pe baza seleciei de date (sau observaii ori informaii) i atunci: (1) acceptm H0 cnd este adevrat evitnd eroarea de genul I i

(2)

respingem H0 cnd este fals i astfel nu comitem o eroare de genul II.

Analiza dispersional permite testarea semnificaiei relaiei ntre dou sau mai multe tipuri de clasificri, determinnd importana factorilor respectivi asupra acestor relaii. Cu alte cuvinte, analiza dispersional stabilete contribuiile pe care le aduc la dispersia total a eantionului de date, dispersiile factorilor utilizai drept criterii pentru clasificarea observaiilor.

2.3.ACIUNEA SIMULTAN A FACTORILOR N TABELELE DE CONTINGEN Vom lua n considerare acelai exemplu din tabelul 2.1, dar n acest caz socotim c variaia datelor din tabel se datoreaz att operatorilor (coloanele tabelului de contingen) ct i zilelor sptmnii, rndurile tabelului. Modelul matematic este urmtorul:

x i j= + i + j + i j

(2.19)

n care fiecare variabil observat xij este egal cu media populaiei, care sufer abaterea liniei i, abaterea coloanei j i a erorii experimentale ij. Se expliciteaz dou ipoteze statistice: 1. Pentru rnd (zi din sptmn)9

Mihi N.V., Eseu privind incertitudinea i comunicarea, Sesiunea tiinific a cadrelor didactice, Univ.George Bariiu, Braov, mai, 2000.

82

Metode cantitative n marketing

H0

numrul de chestionare nu este influenat de intervievarea ntr-o anume zi;( i , = 0 ) i

(2.20)

H1

numrul de chestionare este influenat de intervievarea ntr-o anume zi.( i , 0 ) i

(2.21)

2. Pentru coloan (eantionul operatorilor) H0 numrul de chestionare nu este influenat de hrnicia operatorului de interviu; vor fi valabile relaiile (2.8), (2.9)(j , = 0 ) j

sau, oricare ar fi media pe coloana j, j 1 = 2 = 3 = .j = . = c H1 numrul de chestionare este influenat de hrnicia operatorului de interviu; exist diferene semnificative ntre operatori. vor fi valabile relaiile (2.10), (2.11)( j , ) 0 j

sau cel puin dou medii pe coloan nu sunt egale: 1 .j Se calculeaz numrul de grade de libertate df1 pentru fiecare factor de influen i numrul de grade de libertate df2 pentru ntregul tabel.10 df1 = r - 1 = 4 df1 = c - 1 = 9 df2 = (r - 1)(c - 1) = 36 i pentru = 0,05 Fr (4, 36) = 2,63 iar Fc (9, 36) = 2,15 Se determin factorul de corecie C:

C=C=

2 T.. r c2

(2.22)

4.000 = 320 .000 105

Se determin suma ptratelor pe fiecare factor de influen n parte:10

Hicks, Charles R., Fundamental Concepts in the Design of Experiments., New York: Holt, Rinehart and Winston, Inc. 1964

Analiza dispersional

83

r T2 S P= R i . - C i =1

c

(2.23)

2 2 2 2 2 830 +790 +750 +820 +810 SPR = - 320.000=400 10

S P =CSPC =

c T2 .j

j =1

r

-C

(2.24)

2 2 2 485 +325 +3502.... +455 - 320.000=6.810 5

Se determin suma ptratelor pe ntregul tabel (conform relaiei 2.14):

S P= T

i =1 j =1

r c

xi2j- C

SPT =99 2 + 70 2 + 90 2 ... + 89 2 - 320 .000 = 9.948

Se determin suma ptratelor pe eroarea experimental: SPE = SPT SPC SPR SPE= 9.948 6.810 - 400 = 2.738 Se determin media ptratelor MP fiecrui factor de influen: (2.25)

84

Metode cantitative n marketing

SPR MPR = df 1

(2.26)

MPR =

400 =100,00 4

Pentru coloan relaia este (2.16)M PC = SPC df 1

MPC

=

6.810 = 756, 67 9

Se determin media ptratelor pe eroarea experimental (conform relaiei 2.17)MPE = SPE df 22.738 = 76,06 36

MPE

=

Se determin raportul Fisher calculat pentru fiecare factor de influen:Fr = MPR MPE MPC MPE

(2.27)

Pentru factorul coloan vom folosi relaia (2.18)Fc =

Valorile rapoartelor sunt:Fr = 100,00 =1,31 76,06 756,67 = 9,95 76,06

Fc =

Se compar valoarea tabelar cu valoarea calculat: Fr = 1,31 < F =2,63, se accept ipoteza nul, deci ziua n care se face ancheta nu influeneaz numrul de chestionare, iar Fc =9,95 > F =2,15, se respinge ipoteza nul, deci operatorii de interviu introduc varian n realizarea unui numr de chestionare, indiferent de ziua n care se face intervievarea. Cu ct avem mai mult ordine, mai multe variabile controlate, sau datele sunt mai organizate cu att, mai ales n condiiile influenei simultane a factorilor, rezultatele vor fi mai aproape de adevr i decizia, realist.Calculele utiliznd ANOVA prin MicrosoftEXCEL sunt redate cu explicaiile de rigoare n textul integrat mai jos (tabelul 2.3)

Analiza dispersional TABELUL 2.3 Se apeleaz din meniul Tools, Data Analysis i se alege : Anova: Two-Factor Without Replication n ecranul aprut se introduce: Se bifeaz: Label Anova: Two-Factor Without Replication Input Range $A$1:$K$6 Output Range $A$43

85

SUMAR

Count Sum

Average

Variance

1 2 3 4 5 1 2 3 4 5 6 7 8 9 10

10 10 10 10 10 5 5 5 5 5 5 5 5 5 5

830 790 750 820 810 485 325 350 475 310 410 365 400 425 455

83 79 75 82 81 97 65 70 95 62 82 73 80 85 91

152.89 215.33 324 154.22 214.44 2.5 12.5 262 24 74.5 24.5 6.5 362.5 13 2.5

Probabilitatea c dispersiile celor dou seturi nu difer semnificativ ANOVA Source of Variation Rows Columns Error SS 400 6810 2738 df 4 9 36 MS 100 756.67 76.056 F 1.3148 9.9489 PF crit value 0.283 2.634 2E-07 2.153

Total 9948 49 Rezultate similare cu lucrul direct

2.4. IDENTIFICAREA INTERACIUNILOR NTRE VARIABILE

86

Metode cantitative n marketing

Avnd n vedere c dorete determinarea interaciunilor dintre factori, experimentele iau n calcul repetiia pentru controlul i validarea prelucrrilor i semnalarea distorsionrii datelor. Experimentele au la baza interpretrii diferenelor semnificative, testul Fisher. Vom analiza cazul n care asupra datelor din tabel acioneaz doi factori simultan (alternativele n rnduri pentru unul i alternativele celuilalt n coloan) iar interaciunea existent sau nu ca legatur, va fi descoperit pe baza repetiiei observaiilor. Vom lua n calcul cazul n care exist interaciune ntre zilele lucrtoare ale sptmnii i amplasamentul unor uniti comerciale. n acest caz, rndurile tabelului de contingen vor cuprinde zilele lucrtoare , coloanele vor fi societile comerciale, iar drept repetiie vom lua n considerare observaiile fcute dimineaa i dup orele 15.TABELUL 2. 4 Dou intrri Ziua /Luni

Vadul comercial S.C. 1 72 76 71 75 81 83 70 72 600 S.C. 2 66 72 69 73 75 75 64 66 560 S.C. 3 80 84 97 95 100 96 95 89 736 T1. = 450

repetiiaDimineaa Dup ora 15

Mari

Dimineaa Dup ora 15

T2. = 480 T3. = 510 T4. = 456 Ti..

Miercuri

Dimineaa Dup ora 15

Joi

Dimineaa Dup ora 15

T.j.

Modelul matematic este urmtorul:xijk = + + j +ij + i ijk

(2.28)

n care fiecare variabil observat xijk este egal cu o medie a populaiei care sufer: abaterea liniei i, fa de medie, abaterea coloanei j, fa de medie, interaciunea dintre linie i coloan ij, abateri fa de medie datorit influenei simultane att a liniilor ct i coloanelor, sau datorit erorii experimentale ijk (ali factori influeneaz datele i ei nu au fost luai n model, exist perturbaii majore asupra datelor i le fac s difere fa de medie). Pentru a verifica modelul avem nevoie de un factor de control. Repetarea experimentului este un bun factor de control. Spre exemplu datele sunt culese dimineaa i dup ora 15 i se prezint n dou tabele de contingen pentru a se observa de multe ori instantaneu dac sunt sau

Analiza dispersional

87

nu diferene. Variabila de control trebuie s fie indiferent altfel devine una dintre variabilele care vor fi luate n model ca una dintre cauzele perturbrii acestora fa de medie. Se introduc seturile de ipoteze statistice pentru: Rnd (zi din sptmn) H0 nu sunt diferene semnificative ntre mediile pe rnduri; ex. indiferent de zi ncasrile tuturor unitilor din sistem sunt la fel; nu exist abateri semnificative fa de media pe zi (sistemul luat ca ntreg, nefragmentat). Relaia pe care o folosim este (2.20)( i , = 0 ) i

H1 sunt diferene semnificative ntre mediile pe rnduri; ex.n unele zile datele centralizate pe cele trei S.C.-uri sunt semnificativ diferite fa de media pe sistem datorit abaterilor. Relaia este n acest caz (2.21)( i , 0 ) iColoan (localizarea geografic) H0 datele o inute nu sunt diferite semnificativ statistic de la o unitate la alta; ex. indiferent

de zi sau ali factori (fenomen realizat prin totalizarea datelor, uitnd de unde provin) nu sunt abateri fa de medie. Relaia utilizat este (2.8)( j , = 0 ) j

datele difer statistic semnificativ de la o unitate la alta; ex. totalurile obinute difer semnificativ statistic fa de medie, exist abateri. Folosim relaia (2.10)H1( j , ) 0 j

Interaciune (exist o legtur care poate duce la o segmentare)

H0

datele obinute sunt aproape egale cu media general indiferent de zi sau unitate comercial;(i , j , = 0 ) i j

(2.29)

H1 anumitor S.C.-uri le merg bine n zile cnd altora le merge prost i vice-versa, sunt abateri semnificative statistic fa de medie. ( i, j , ) 0 (2.30) i jSe calculeaz numrul de grade de libertate df1 pentru rnd, coloan, interaciune (fiecare factor de influen din model) i numrul de grade de libertate df2 pentru ntregul tabel, unde sunt r rduri, c coloane, i n repetiii. df1 = r - 1 = 3 df1 = c - 1 = 2 df1 = (r - 1)(c - 1) = 6 df2 = r c (n - 1) = 12 pentru = 0,05 avem Fisher tabelat pentru: Ftabelat rnd (3, 12) = 3,49; Ftabelat coloan (2, 12) = 3,88; Ftabelat interaciune (6, 12) = 3,00

88

Metode cantitative n marketing

Se determin factorul de corecie

C:T2 ... C= r c n2 C =1.896 =149.784 24

(2.31)

unde T este totalul general, n care dispare identitatea liniei i, coloanei j i repetiiei k. Se determin suma ptratelor SP pentru fiecare factor de influen din model:

S P= R

i =1SPE =

c n - C

r T2 i.

(2.32)

4502 +4802 +5102 +4562 - 149.784=372 6

SPC =

j =1SPC =

c T2 .j

r x k

-C

(2.33)

6002 +5602 +7362 - 149.784=2.128 8

S P R e p -C = ni =1 j =1SP Re p =

r c T2 re p

(2.34)

( 72 + 76 )2 + (66 + 72 )2 + ... - 149 .784 = 2.676 2

SPI = SPRep - SPR - SPC SPI= 2.676 - 372 - 2.128 = 176

(2.35)

unde SPRep semnific suma ptratelor subtotalurilor repetiiilor pe categorii ale coloanelor iar SPI, suma ptratelor interaciunii, ceea ce rmne dup extragerea influenei rndului i coloanei.

Analiza dispersional

89

Se determin suma ptratelor pe ntregul tabel:

r cre p S =P T xi2 j- Ck i =1j =1k =1

(2.36)

SPT = 722 +662 +... +892 - 149.784=2.778

Se determin suma ptratelor pentru eroarea experimental: SPE = SPT SPRep ( 2.37)

SPE = 2.778 2.676 = 102Se determin media ptratelor MP pentru factorii de influen din model:M PR = SPR r 1 = 372 SPC 2.128 = 124 M PC = = = 1.064 3 2 c 1

M = PI

SPI 176 = = 29 ,33 6 ( r 1)( c 1) SPE 102 = = 8,5 12 r * c * ( n 1)MC P 1.0 64 = = 12 ,1 5 8 ME P 8,5

Se determin media ptratelor pentru eroarea experimental: MPE =

Se determin raportul Fisher calculat pentru fiecare factor de influen:F =r

MR P 1 24 = = 1 ,5 4 9 ME P 8,5

F =c

F =i

MI P 29 ,33 = = 3,45 ME P 8,5

Se compar valoarea tabelat cu valoarea calculat i se constat c ipoteza nul este respins n toate cele trei cazuri. In ilustrarea de mai jos artm modul n care se poate apela la MicrosoftEXCEL cu rezultatul urmtor:

90

Metode cantitative n marketing

Exist diferene semnificative ntre S.C. , zile, interaciune deoarece n unele zile sunt uniti ce ctig mai mult dect altele n celelalte zile. Ce trebuie apreciat, este c la un nivel de semnificaie = 0,01 nu exist interaciune. Pentru rezultatele MicrosoftEXCEL, situaia este redat mai jos n tabelul 4.TABELUL 4 ANOVA Source of Variation Sample Columns Interaction Within Total SS 372 2128 176 84 2760 df 3 2 6 12 23 MS 124 1064 29.33 7 F 17.7 152 4.2 P-value 0.00011 3E-09 0.0167 F crit 3.490 3.885 2.996

Ce trebuie iar apreciat este faptul c valoarea SPE a fost calculat diferit (rndul de mai sus Within) ceea ce arat nc odat, diferena ntre gndirea diferit a colilor de teorie statistic. Trebuie subliniat atitudinea specialistului de a nu rmne robul unei singure tehnici, dar mai ales verificarea din mai multe, unghiuri de vedere, cu tehnici diferite, deoarece ele nu sunt singurele purttoare de adevr.

Analiza dispersional 2.3. Identificarea interaciunilor prin experimente factoriale.

91

Experimentele factoriale au la baz studierea influenei factorilor asupra datelor observate, n condiiile n care factorii acioneaz simultan, independent i apoi n interaciune cte doi, rei etc. Pentru a realiza acest faot se iau n calcul nivelurile factorilor n comparaii aritmetice. Cele mai utilizate experimente de acest fel sunt: experimentul 22 (doi factori cu dou niveluri), experimentul 23 (trei factori cu dou niveluri) i experimentul 32 (doi factori cu trei niveluri). O firm de publicitate outdoors dorete s tie dac factorii sex, momentul zilei i tipul de panotaj pentru reclam influeneaz fenomenul de recall reamintire pe care o au trectorii chestionai ntr-o intersecie. Pentru a se valida cercetarea a fost luat n calcul ca test de control o alt intersecie amenajat identic ca panotaj. n urma cercetrii, au rezultat urmtoarele rezultate :

TABELUL 5Combinatia factorilor 1 A B C AB AC BC ABC Total Sptmna n care s-a desfurat experimentul I 69 72 71 75 73 77 79 82 589 II 74 81 80 82 80 87 94 95 673 143 153 151 157 153 164 173 177 1271 t1 ta tb tc tab tac tbc tabc Total Total Efect simplu si combinat

Cifrele reprezint numrul de intervievai care au tiut unde au mai vzut reclama din panotajul afiat. Factorul A: Factorul B: Factorul C: sex Niveluri: 0 Femeie 1 Brbat dup ora 15 1 pe o faad momentul zilei Niveluri: 0 dimineaa 1 Tipul panotajului Niveluri: 0 n strad

Interaciunile sunt date de combinarea factorilor: ab, ac, bc, abc. Figura 1 de mai jos arat cele 23 combinaii n care nivelurile A, B, C, sunt succesiv i alternativ la nivel 0 i 1, ilustrarea fcndu-se cnd cu litere mici, cnd cu litere mari. Modelul matematic este urmtorul:AbC101 Abc 100 (a) Abc Abc 110 (ab) 111 ABC

abC 001 (c) 001 abc

aBC O11(bc)

000

abc (1)

O1O (b) aBc

92xij k l

Metode cantitative n marketing

= + + + k + j + k + k + i i i j j i

j k

+ i

j k l

unde i = 0, 1sunt nivelurile factorului A, j = 0, 1 nivelurile factorului B, k = 0, 1 nivelurile factorului C, l = 0, 1 nivelurile factorului D, iar xijkl = fiecare dat observat supus influenei celor trei factori independeni, efectelor combinrii lor, repetiiei ct i erorilor experimentale. Cum sunt puse n eviden combinrile factorilor i nivelelor acestora: Explicitarea este fcut n tabelul 6 . TABELUL 6 Nivelul factorilor a 0 b 0 c 0 Repetiii momentul I 69 II 74 143 t1 Total pariAL Efect pariale i combinate

Frecvenele au rezultat n urma strii: cte femei i amintesc, intervievate dimineaa, de reclama aprut pe un panou stradal 1 0 0 72 81 153 ta Frecvenele au rezultat n urma strii: ci brbai i amintesc, intervievai dimineaa, de reclama aprut pe un panou stradal 0 1 0 ... ... ... tb Frecvenele au rezultat n urma strii: cte femei i amintesc, intervievate dup ora 15 , de reclama aprut pe un panou stradal 0 0 1 ... ... ... tc Frecvenele au rezultat n urma strii: cte femei i amintesc, intervievate dimineaa, de reclama aprut pe un panou situat pe o faad 1 1 0 ... ... ... tab Frecvenele au rezultat n urma strii: ci brbai i amintesc, intervievai dup ora 15, de reclama aprut pe un panou stradal 1 0 1 ... ... ... tac Frecvenele au rezultat n urma strii: ci brbai i amintesc, intervievai dimineaa, de reclama aprut pe un panou situat pe o faad 0 1 1 ... ... ... tbc Frecvenele au rezultat n urma strii: cte femei i amintesc, intervievate dup ora 15, de reclama aprut pe un panou situat pe o faad 1 1 1 ... ... ... tabc Frecvenele au rezultat n urma strii: ci brbai i amintesc, intervievai dup ora 15, de reclama aprut pe un panou situat pe o faad

Analiza dispersional

93

1 00 1 0

Se alctuiesc seturile de ipoteze statistice pentru fiecare factor de influen i a combinaiilor de dou i trei influene reciproce. Ilustrm n pagina urmtoare efectele directe i de dou combinaii folosind cubul influenelor.

94

Metode cantitative n marketing

Avnd n vedere c factorul A ctig influennd la patru subtotaluri i anume ta, tab, tac, tabc; pentru a obine efectul lui A, simplu i combinat, vom scdea din suma ctigului contribuiile altora fr factorul A, i anume ali factori din mediu (1), ctigul lui B fr A, ctigul lui C fr A, i ctigul combinaiei ntre B i C, fr A. Situaia se repet i pentru factorii B i C. Vom organiza datele n tabel astfel nct s obinem aceste noi totaluri. Datele vor fi organizate ntr-un tabel al semnelor aritmetice, astfel: 1 + + + + a + + + + b + + + + c + + + + ab + + + + ac + + + + bc + + + + abc + + + + + + + + 1271 23 37 71 (-11) (-1) 21 5 Total T1 Ta Tb Tc Tab Tac Tbc Tabc

Sumele s-au obinut prin adunarea , acolo unde este semnul "+" i prin scderea, acolo unde este semnul "-" a subtotalurilor efectelor pariale i combinate obinute n urma cercetrii i ilustrate n tabelul 6. Spre exemplu:

Ta=-t1+ta-tb-tc+tab+tac-tbc+tabc=-143+153-151-157+153+164-173+177=23 iar interacinea AC este: Tab=+t1-ta+tb-tc-tab+tac-tbc+tabc= 143-153+151-157 153 +164-173+177 = - 1Grafic, interaciunea AC arat astfel:

interaciunea AC

Analiza dispersional

95

interaciune a BC

interaciunea AB

Interaciunea BC ilustreaz influena simultan a factorilor cauzali B i C. La fel ca n cazul unor persoane, ei pot interaciona pozitiv, ajutndu-se reciproc sau negativ, reducnd, anulnd sau ascunznd energia pozitiv a efectului prin interaciuni cu ali factori din mediu informaional. Se calculeaz numrul de grade de libertate df1 pentru fiecare factor de influen i combinaia lor i numrul de grade de libertate df2 pentru ntregul tabel. df1 = nr. niveluri - 1 = 2 - 1 = 1 (2, deoarece fiecare factor este determinat de cele dou nivele ale sale mai puin 1 din raiuni amintite anterior) df2 = [23 (nr. repetiii - 1)] - 1 = 7 pentru = 0,05 avem Ft (1,7) = 5,59 Se determin factorul de corecie C:

C=

1 271 T = = 100.9650 6 , 2 * nr. rep etitii 2 x 22 1 3 3

2

96

Metode cantitative n marketing

Se determin suma ptratelor SP pe fiecare factor de influen i combinaiile lor:

23 S P A= 3Ta = = 3 3 ,0 6 2 x2 1 6 2 2 37 S P B 3Tb = = 8 5 ,5 6 = 2 x2 1 671 S P C 3Tc = = 3 1 5 ,0 6 = 2 x2 1 6 2 2 ( - 11) T SPA B 3 a b = = = 7,56 16 2 x22 ( - 1 )2 S PA C= Ta c = = 0,06 3 16 2 x2

2

2

2

2

S P B C Tb c = 2 1 = 2 7 ,5 6 = 3 2 x2 1 6

2

2

SPA B= C

Ta b c 5 = = 1 ,5 6 3 2 x2 16

2

2

T 5 29+ 68 27 3 S P =R e3 -pC = 3 -1 0 =0 3 9 5 6 1 5 , 5 6 2 k =1 2Se determin suma ptratelor pe ntregul tabel:

2 2 rep

Analiza dispersional

97

= 69 + 72 + ...+ 95 - 100965 = 8602 2 2

S = P x -CT=2 i=0 j=0 k =0 l=1 i jklSe determin suma ptratelor pentru eroarea experimental:

1112

SPE = SPT SPA SPB SPC SPAB SPAC - SPBC SPABC SPRepetiie = 37,96Se determin media ptratelor MP pentru fiecare factor de influen i a combinaiilor lui. Deoarece df1 = 1, rezult c media ptratelor va fi egal cu suma ptratelor, SP:M PA M PB M PC M B PA M C PA M C PB M B PA C = SPA = SPB = SPC = SPA B = SPA C = SPB C = SPA C B

Se determin media ptratelor pentru eroarea experimental:

98

Metode cantitative n marketing

MPE =

SPE df2

=

37,96 = 5,42 7

Se determin raportul Fisher calculat pentru fiecare factor de influen i combinaia

F

Re p

=

M R p 351 ,56 P e = = 64 ,86 > F M PE 5,42Fa =

t

Fa =

M PA MPE

(2.60)

33,06 = 6,09 > Ft 5,42

Fb =

M PB M PEF b=

(2.61)85,56 = 15,74 > F t 5,42

Fc =

M PC M PEFc =

(2.62)315,06 5,42 = 58,12 > F t

Fab =

MPAB MPEFab =

(2.63)7,56 = 1,39 < Ft 5,42

Fac =Fac =

M PAC M PE

(2.64)

0,06 = 0,01 < Ft 5,42

Fbc =

MPBC MPEFbc =

(2.65)27,56 5,42 = 5,08 < Ft

F abc =

MPABC MPEFabc =

(2.66)= 1,56 = 0,28 < F t 5,42

M B PA C M PE

Analiza dispersional

99

De vreme ce Fisher tabelat are valoarea 5,59, ipoteza nul este respins n primele patru teste i acceptat n ultimele patru teste. Sptmnile produc diferene semnificative statistic (panoul st mai mult timp, iar dup dou sptmni devine lesne reamintirea). Efectele principale ale variabilelor independente, sex, momentele zilei i tipul de panotaj sunt semnificative statistic, adic sunt diferene notabile ntre numrul de panouri de care i-au reamintit pe faade stradale, momentele observaiilor i-au spus cuvntul i chiar surpriza c reamintirea difer n funcie de sex. Se remarc faptul c nici o interaciune nu este obinut semnificativ statistic,dar interaciunea dintre momentul zilei i tipul de panotaj care nu este semnificativ la un nivel al semnificaiei de 0,05, poate deveni semnificativ la un nivel de 0,10. Aplicaia utiliznd rezultatele MicrosoftEXCEL este redat n figura 2.7, 2.8, 2.9 i 2.10. Figura 2.7 Comenzi succesive n MicrosoftEXCELData Pivot Table Report PAGE Microsoft Excel list or database = E18 B Factorul B Next Range =$B$17 COLUMN

Repetitii Repetitie Count of Repetitii C factor C A factor A DATA = B19 =

100 C19 = D19

Metode cantitative n marketing

Fig.2. 8Coloane EXCEL A B C D E F =D19 Linie EXCEL =$B$17 17 Experiment cu 3 factori si rep. 18 Repetitii C A 20 1 1 1 21 2 22 1 Total 23 2 1 24 2 25 2 Total 26 1 Total 27 2 1 1 28 2 29 1 Total 30 2 1 31 2 32 2 Total 33 2 Total 34 Grand Total =C19 B 1 69 72 141 75 77 152 293 74 81 155 82 87 169 324 617 2 71 73 144 79 82 161 305 80 80 160 94 95 189 349 654 Total 140 145 285 154 159 313 598 154 161 315 176 182 358 673 1271 G = B19 =E18

Figura 2.9

Plasarea n Pivot Table poate fi urmrit n continuare n figura 2.10.Rep.1 =E20 =E21 =F20 =E23 =F21 =E24 =F23 =F24 Rep.2 =E27 =E28 =F27 =E30 =F28 =E31 =F30 =F31

LEGENDA REPETITIE Factorul C Factorul A

2&3 Factorul B count Of repeti ie

=B20

=B27

Analiza dispersional Repetitii 1 69 72 71 75 73 77 79 82 598

101

1 A B C AB AC BC ABC T.rep

2 74 81 80 82 80 87 94 95 673

Total 143 153 151 157 153 164 173 177 1271 C =sus

SPEvariabilei 1271 100965 C 23 33.06 SPA 37 85.56 SPB 71 315.06 SPC -11 7.56 SPAB -1 0.06 SPAC 21 27.56 SPBC 5 1.56 SPABC 100. 351.56 SPRep 965 859.93 SPT 37.93 SPE 5.42 MPE

6.10 Fa 15.78 Fb 58.13 Fc 1.39 Fab 0.01 Fac 5.08 Fbc 0.28 Fabc 64.86 Frep Ftab 5,59 =

Figura 2.10 2.4. PTRATUL LATIN I GRECO-LATIN N ANALIZA DATELOR Ptratul latin reprezint un plan experimental incomplet pentru analiza a trei factori prin folosirea unui model trifactorial ANOVA, n cazul verificat al lipsei interaciunii ntre factori. n acest fel se msoar efectele pe care le au diferitele nivele ale anumitor variabile simultan, n timp ce efectele altor variabile ar trebui meninute la un nivel constant, sau aa cum se ntmpl n prelucrrile obinuite, ignorate i considerate fr o influen esenial asupra rezultatelor proiectrilor experimentale. Construcia ptratelor latine se bazeaz pe teoria corpurilor Galois, iar denumirea lor provine de la folosirea literelor din alfabetul latin pentru desemnarea nivelelor factorului al treilea (tratamentul). Organizarea experimentului dup aceast metod presupune mprirea n n tratamente, n rnduri i n coloane astfel nct fiecare tratament s apar o singur dat n fiecare rnd sau coloan corespunztoare nivelurilor celor dou variabile independente (respectiv din rnd i coloan). Tratamentele vor fi distribuite n mod aleator n celulele tabelului dar niciodat pe linie ori coloan nu vom avea aceeai liter. Tabelele pot avea diverse forme:TABEL 2 9 A B C B C A C A B C B A D TABEL 2.10 B C D A A D C B D A B C A B C D E TABEL 2.11 B C D E A C D E A B D E A B C E A B C D

Spre exemplu, Primria dorete s aprecize, nainte de diversele licitaii pentru obinerea dreptului de folosire a panourilor publicitare, valoarea amplasamentului acestora n locurile

102

Metode cantitative n marketing

amenajate n acest scop. Pentru o firm care liciteaz, Tabelul 2.9 poate conine a) pe linii cele trei alternative pentru zona n care sunt amplasate: centru, intermediar, periferie; b) n coloana ntia zilele cuplate (sau oricare) luni, mari i miercuri ca nceputul sptmnii de lucru, considernd similitudini n comportamentul subiecilor n aceste zile dar deosebiri fa de cele din coloana a II-a, care cuprinde zilele joi i vineri, sau de weekend din coloana a III-a, zilele smbt i duminic. Tratamentul poate consta din trimiterea unor observatori (studeni sau personal auxiliar instruit) n cursul dimineii (alternativa A), zilei (B) sau serii (C). Problema const n utilizarea eficient a resurselor umane i de timp ori bani. n loc de a obine informaii privind numrul de ceteni, maini mici i mari care se deplaseaz prin faa panourilor n discuie din 3 zone x 3 zile omogene x 3 segmente omogene ale zilei, ce nseamn 27 de surse de date ce trebuie investigate, experimentatorul care utilizeaz ptratele latine consider c sunt suficiente doar 9. Sigurana acestei convingeri rezult din proiectarea atent i tratamentul adecvat al acestor surse. Astfel n zonele cercetate nu se fac observaii n toate zilele i la orice or, ci dup o planificare experimental atent spre exemplu: n zona central, la nceputul sptmnii doar dimineaa (tratament A), n timpul sptmnii, la prnz i n weekend doar seara, n timp ce simultan, n zona a II-a (intermediar), la nceputul sptmnii n timpul prnzului, n zilele de joi-vineri, seara; pentru zonele situate n periferie, la nceputul sptmnii, seara, n timpul sptmnii, dimineaa, iar n weekend, la mijlocul zilei. Una dintre ipotezele importante de lucru este aceea c ntre variabilele analizate (inclusiv cu tratamentul) nu exist interaciuni. Panourile publicitare pot fi vzute n orice fel de zon n orice perioad de timp din sptmn sau zi. Dar poate c importante pentru Primrie sunt panourile plasate pe 4 mari artere de circulaie identificate ca fiind interesante pentru strbaterea localitii cercetate. De altfel, nu zilele sau chiar sptmnile sunt importante deoarece nchirierea se face pe termen lung, aa c variabila din coloan trebuie s fie alta, spre exemplu poziia panoului publicitar (pe trotuar, la nivelul de 3-5 m, 5-8 m i peste 8 metri. Tratamentul poate consta n locul n care este situat panoul n sensul A-foarte aproape de centru, B-la distan de 2 km de centru, C-5 km de centru, D-foarte departe de centru. Aceasta nseamn c vom avea (pentru tabelul 210): 4 rnduri 4 coloane 4 forme ale tratamentului = 43 = 64 observaii. Aceste 64 de observaii se reduc la 16 deoarece avem 4 forme ale tratamentului (A, B, C, D) iar tratamentul este unul singur! Rezult c vom avea: 16 date observate n tabel = 42 = n2 uniti de test. Prin intermediul acestui tip de proiectare pot fi controlate simultan dou sau mai multe variabile independente care pot afecta concret rspunsul unitilor experimentale. Acest control simultan permite nlturarea efectelor variabilelor respective asupra erorii experimentale. Calculele analizei dispersionale mpart dispersia total n efectele distincte ale tratamentului, coloanei, rndului i eroarea experimental. Rolul ptratelor latine n studiile de pia este acela c prin organizarea experimentului se reduc cheltuielile materiale i umane (datorit tratamentului) iar controlul simultan permite nlturarea efectelor variabilelor de segmentare alese asupra erorii experimentale.

n cazul de mai jos, scopul este acela ca Primria s estimeze valoarea locurilor unde vor fi plasate postere i pe care le va nchiria ctre firmele de publicitate din ora. Pentru aceasta, trebuie fcute msurtori ale traficului dus-ntors din

Analiza dispersional

103

dreptul acelui loc unde va fi instalat posterul. Pentru a rezolva aceast problem trebuie s se apeleze la proceduri manageriale de organizare i control precum i la proceduri de experimente statistice pentru implementarea programului de lucru i obinerea datelor la faa locului i nu n ultimul rnd, tratarea datelor pentru obinerea de informaii i cunotine. Definim problema drept nevoia de a msura ori evalua i ierarhiza punctele de trafic unde merit s fie afiate posterele. Aceasta nseamn numrarea persoanelor, mainilor mari-mici-medii, autobuzelor i sistematizarea informaiilor rezultate din datele culese la faa locului. Ipotezele de lucru sunt: (1) rezultatele msurtorilor difer lunar sau la un interval de timp de dou luni i n mod sigur, cele fcute primvara difer de cele fcute vara i mai ales n cursul unei zile; (2) rezultatele msurtorilor n locuri diferite variaz n zilele unei sptmni (Luni de Mari, Miercuri); (3) iar ziua de Luni din prima sptmn a lunii difer, ca trafic de ziua de Luni de celelalte ale lunii; (4) conceptul de medie ascunde diferenele i nu corespunde realitii spre exemplu gospodin medie, salariu mediu, cultur medie, etc. TABELUL 2.12Ore 6-9 9 12 12 15 15 18 18 21 21 23 S1 Joi Smbt Vineri Luni Miercuri Mari S2 Smb-t Vineri Joi Miercuri Mari Luni S3 Vineri Miercuri Mari Joi Luni Smbt S4 Luni Mari Miercuri Smbt Vineri Joi S5 Miercuri Joi Luni Mari Smbt Vineri S6 Mari Luni Smbt Vineri Joi Miercuri Not: S semnifica sector la care este ataat numrul sect.

Modelul matematic este urmtorul:

x i j = +i + j + k +i j ,k i =j =k = n k

(2.67)

n care fiecare variabil observat xijk este egal cu o medie a populaiei care sufer abaterea j liniei i , abaterea coloanei , abaterea datorat tratamentului k i a unei erori experimentale ijk. Dup ilustrarea a nc dou exemple de ptrate greco latine tabelele 2.13 i 2.14, pentru exemplificare vom reduce problema la ptratul latin 4*4*4. TABELUL 2.13 / TABELUL 2.14Ore Sect. 1 Sect. 2 Sect. 3 Sect. 4 Sect. 5 Sect. 6 6-9 A / Joi B/ Smbt C/ Vineri D / Luni E/Miercuri F / Marti 9-12 B/ Smbt C / Vineri 12 - 15 15 18 18 - 21 21 - 23 C/ D / Luni E / Mier- F / Marti Vineri curi A / Joi E/Mier- F / Marti D / Luni curi E / Mier- F / Marti A / Joi D / Luni B/ curi Smbt F / Marti E/Mier- B / C / Vineri A / Joi curi Smbt A / Joi D /Luni F / Marti B / C Smbt /Vineri D /Luni B / C/ A / Joi E/MierSmbt Vineri curi

104 PAN A = B= OU 1, 7, 13 2, 8, 14

Metode cantitative n marketing

C= 3,9,15

D= E= 4,10,16 5,11,17

F= 6,12,18

LH S1 S2 S3 S4 S5 S6 U

A L D J V M S m

B D V S M J m L

C S M V J m L D

D V J M m L D S

E J S m L D M V

F M m L D S V J

G m L D S V J M

Se explicitez seturile de ipoteze statistice pentru situaia descris la nceputul acestui subpunct pentru tabelul 2.15.: TABELUL 2.15Zona OBS.

Reperele orare800-1200 1200-1600 1600-2000 2000-2400

Ti. 318 313 328 321 1.280

Zona 1 Zona 2 Zona 3 Zona 4 T.j

85 73 75 82 315

B D C A

79 81 78 70 308

A B D C

76 84 92 79 331

C A B D

78 D 75 C 83 A 90 B 326

Legend: A Luni, B Mari, C Miercuri, D Joi. Rnd (zona interviului) H0 numrul de persoane care i amintesc reclama este aproape acelai indiferent de zon;( i , = 0 ) i

H1

numrul de persoane care i amintesc reclama este diferent, n zone diferite.( i , 0 ) i

Coloan (reperele orare) H0 numrul de persoane care i amintesc reclama este semnificativ statistic egal cu media, indiferent de reperele orare;( ) j , = 0 j

H1

numrul de persoane care i amintesc reclama este diferit, pe repere orare diferite.( j , ) 0 j

Tratament (ziua din sptmn)

Analiza dispersional

105

H0

numrul de persoane care i amintesc reclama este aproape acelai indiferent de ziua din sptmn;( ) k , k = 0

H1

numrul de persoane care i amintesc reclama este diferit n zile diferite;( k , 0 ) k

Se calculeaz numrul de grade de libertate df1 pentru fiecare factor de influen i numrul de grade de libertate df2 pentru ntregul tabel. df1 = r - 1 = c - 1 = k - 1 = n - 1 = 4 - 1 = 3 df2 = (n2 - 1) - (r - 1) - (c - 1 ) - (k - 1) = n2 - 3n + 2 = (n - 1)(n - 2) = 6 pentru = 0,05 avem Ft(3,6) = 4,76 Se determin factorul de corecie C:C=2 Ti j

r c

(2.67)

C=

1.28 02 = 102.400 16

Se determin suma ptratelor pe fiecare factor de influen

SPR =

2 ...... +321 3182 + - 102.400 =30 4

m T2 S P= R i . - C i =1

c

(2.68)

S P =CSPC =

n T2 .j

j =1

r

-C

(2.69)

315 2 + ....... + 326 2 - 102 .400 = 82 4

106

Metode cantitative n marketing

Se calculeaz suma ptratelor SP pe tratament, care este cel de-al treilea factor. Pentru aceasta, vom calcula numrul totalul de persoane care i-au amintit reclama pe zi, indiferent de loc sau moment al zilei. Luni Mari Miercuri Joi Total general, A = 79 + 84 + 83 + 82 = 328; B = 92 + 90 + 85 + 81 = 348; C = 76 + 70 + 75 + 75 = 296; D = 79 + 78 + 73 + 78 = 308; = 1.280.

Se determin suma ptratelor tratamentului:

SPTratamen t =

2 2 328 +.....+308 - 102.400=392 4

tr 2 Tt r a t S P T r at = a m e -nC t k =1

k

(2.70)

Se determin suma ptratelor pe ntregul tabel:

SP= T

i =1 j = 1

m n

x i2j- C

(2.71)

S T =8 2 +7 2 +... +9 2 - 1 2 0 =5 4 P 0 .4 0 2 5 3 0

Se determin suma ptratelor pe eroarea experimental: SPE = SPT - SPR - SPC SPTratament SPE = 524 - 30 - 82 - 392 = 20 Se determin media ptratelor MP fiecrui factor de influen :MPR = SPR df 1

(2.72)

(2.73)

Analiza dispersional M PR = 30 = 10 3

107

MPC =

SPC

df 1 82 M PC = = 27 .33 3 SPTratamen t df 1

(2.74)

MPTratamen t =MPTratamen t =

(2.75)

392 = 130 ,67 3

Se determin media ptratelor pentru eroarea experimental:SPE MPE = df 2MPE = 20 =3,33 6

(2.76)

Se determin raportul Fisher calculat pentru fiecare factor de influen (folosind formulele 2.18, 2.27).:Fr= MPR MPEFr = 1 0 = 3,0 0 3,3 3

Fc =

M PC M PEFc = 2 ,3 7 3 = 8,2 1 3,3 3

F tratamen t =

MPTratamen t MPE

(2.77)

F tratamen t =

130 ,67 = 39 ,24 3,33

Se compar valoarea tabelar cu valoarea calculat: Fr < 4,76; Fc > 4,76; Ftratament > 4,76 Concluziile sunt urmtoarele: nu sunt diferene semnificative ntre cei ce i-au reamintit reclamele ei fiind intervievai n zone diferite n schimb ziua este variabila care arat diferene semnificative, se pare c mari i luni memoria este mai proaspt fa de joi i miercuri, iar diferene mai mici dar semnificative statistic se regsesc la nivelul orelor n cursul zilei. Calculele realizate utiliznd ANOVA prin MicrosoftEXCEL sunt redate cu explicaiile de rigoare n textul integrat mai jos: TABELUL 2.16

108 A 1 2 3 4 5 6 7

Metode cantitative n marketing

BRnd 1 Rnd 2 Rnd 3 Rnd 4

C 85 73 75 82

D 79 81 78 70

E 76 84 92 79

F 78 75 83 90

G B D C A

HTRATAMENT

I C A B D

J D C A B

Coloa- Coloa- Coloa Coloana 1 na 2 na 3 na 4

A B D C

Se apeleaz din meniul Tools, Data Analysis i se alege : 8 Anova: Without Two-Factor Replication 9 10 n ecranul aprut se introduce: Output Range $B$14 Input Range $A$1:$E$5 11 se bifeaz: Lab el 12 13 14 Anova: Two-Factor Without Replication 15 16 SUM Count Sum Average Variance MARY 17 1 4 318 79.5 15 18 2 4 313 78.25 26.25 19 3 4 328 82 55.33 20 4 4 321 80.25 68.25 21 22 1 4 315 78.75 32.25 23 2 4 308 77 23.33 24 3 4 331 82.75 48.92 25 4 4 326 81.5 43 26 27 28 29 ANOV ASource of Variation SS df MS F PF crit value

30 31 32 33 34 J 1 2 3 4 5 6

Rows Columns Error Total K Rand 1 Rand 2 Rand 3 Rand 4 L A B C D

29.5 81.5 413 524 M 1 79 85 76 78

3 9.833 0.2143 0.884 3.862 3 27.167 0.592 0.635 3.862 9 45.889 15 N 2 84 81 75 73 O 3 83 92 75 78 P 4 82 90 70 79 Q Total rind 328 348 296 308

Analiza dispersional 7 Pentru tratament, datele din tabelul de mai sus sunt obinute prin functiile: 8 9 Pentru M2: =IF(F2="A",+B2,IF(G2="A",

109

+C2,IF(H2="A",+D2,IF(I2="A",+E2))))10 .. 11 Pentru P5: =IF(F5="D",+B5,IF(G5="D",

+C5,IF(H5="D",+D5,IF(I5="5",+E5))))12 13 Se apeleaz din meniul Tools, Data Analysis si se alege : 14 Anova: Two- Without Factor Replicati on 15 16 n ecranul aprut se introduce: Input Range $K$1:$P$5 17 se bifeaz: Output Label Range $K$21 18 19 20 21 Anova: Two-Factor Without Replication 22 23 SUMMAR Vari Count Sum Average Y ance 24 1 4 328 82 4.67 25 2 4 348 87 24.67 26 3 4 296 74 7.33 27 4 4 308 77 7.33 28 29 1 4 318 79.5 15 30 2 4 313 78.25 26.25 31 3 4 328 82 55.33 32 4 4 321 80.25 68.25ANOVA Source of Variation Rows Columns Error Total

SS 392 29.5 102.5 524

df

Pvalue 3 130.66 11.47 0.00 7 2 3 9.833 0.86 0.49 5 9 11.389 MS F 15

F crit 3.863 3.863

A B C D n C40 funcia este: =C34 -C30 -C31- L37

F

G H I EXIST DI FE RE NE?

110 39 SSE = 40 SSE = 41 MSE = 42 MSE = 43

Metode cantitative n marketing

SST SSR SSC- SSTR 21 SSE/[(r-1)(r- 2)] 3.5

Frnd Fcoloan Ftratament Fteoretic

2.81 7.76 37.33 4.76

NU DA DA

n C42 functia este: =C40/6

n G39 funcia este=E30/C42 n G40 funcia este: =E31/C42 n G41 funcia este: =N37/C42 n H39 funcia este: =IF(G39