14
28/10/2015 1 Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa» Indici di associazione per caratteri ordinati Se la tabella si riferisce a caratteri ordinati è possibile costruire indici che oltre a misurare l’intensità dell’associazione ne misurano il verso. Tra due caratteri ordinati possono sussistere due tipi di relazioni: – Relazione diretta (concordanza): a modalità di ordine elevato di un carattere corrispondono più frequentemente modalità di ordine elevato dell’altro carattere. – Relazione inversa (discordanza): a modalità elevate di un carattere corrispondono modalità di ordine basso dell’altro carattere e viceversa.

Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

Embed Size (px)

Citation preview

Page 1: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

1

Metodi statistici per le ricerche di mercato

Prof.ssa Isabella MingoA.A. 2015-2016

Facoltà di Scienze Politiche, Sociologia, Comunicazione

Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa»

Indici di associazione per caratteri ordinati • Se la tabella si riferisce a caratteri ordinati è possibile costruire

indici che oltre a misurare l’intensità dell’associazione nemisurano il verso.

• Tra due caratteri ordinati possono sussistere due tipi direlazioni:– Relazione diretta (concordanza): a modalità di ordine

elevato di un carattere corrispondono più frequentementemodalità di ordine elevato dell’altro carattere.

– Relazione inversa (discordanza): a modalità elevate di uncarattere corrispondono modalità di ordine basso dell’altrocarattere e viceversa.

Page 2: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

2

Indici di concordanza e discordanza

• Possono assumere :– valori positivi , nel caso di concordanza tra i caratteri– valori negativi , nel caso di discordanza

• I più noti:– Indice Gamma di Goodman e Kruskal– Indice b di Kendall– Indice d di Sommer– Indice rho di Spearman

Tali indici variano fra -1 e 1zero indica assenza di associazione +1 indica che l’ordinamento dei due caratteri è sempre concorde-1 indica che l’ordinamento è sempre discorde.valori prossimi a 1 in valore assoluto indicano forte relazione

Indice rho di Spearman

• E’ un indice di cograduazione tra graduatorie, particolarmente indicato quando i caratteri ordinati presentano un numero elevato di modalità.

• Per calcolare l’indice è necessario ordinare gli individui in senso decrescente per ognuno dei due caratteri e attribuire il rango.

• L’indice si definisce come:

dove d indica la differenza tra i ranghi cioè i posti nelle due graduatorie ordinate.

• L’indice assume valori tra -1 e + 1- Il valore 0 implica indipendenza tra x e y– L’opposta graduatoria ( = -1) implica discordanza tra x e y .– E’ uguale ad 1 quando le unità presentano lo stesso rango in

entrambe le graduatorie cioè nel caso di perfetta cograduazione.

Page 3: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

3

Cograduazione: esempio

Misure simmetriche

-,779-,779

-,931

20

Tau-b di KendallGammaCorrelazione diSpearman

Ordinale perordinale

N. di casi validi

Valore

Piemonte 5 12 -7 49Valled'Aosta 1 18 -17 289

Liguria 12 9 3 9Lombardia 4 16 -12 144TrentinoAlto Adige 3 20 -17 289

FriuliVeneziaGiulia

9 15 -6 36

Veneto 6 19 -13 169EmiliaRomagna 2 17 -15 225

Marche 7 14 -7 49Toscana 8 13 -5 25Umbria 10 11 -1 1Lazio 11 8 3 9Campania 18 3 15 225Abruzzo 14 10 4 16Molise 13 7 6 36Puglia 19 5 14 196Basilicata 16 6 10 100Calabria 17 1 16 256Sicilia 20 2 18 324Sardegna 15 4 11 121

2568

12

345

6

78

91011121314151617181920

Livelloterritorale

grad.attiv.femm.

grad.Tassodisocc. d d2 = 1 – [6*2568)/20*(400-1)] =-0,931

Esercizio

I. Mingo 2015-2016

Calcolare il coefficiente di graduazione tra le valutazionidei clienti riguardo all’ assistenza post vendita e allaconsulenza alla vendita rilevate per ripartizionegeografica

calcoli

Page 4: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

4

Indici di concordanza e discordanza : uso del software

I. Mingo 2015-2016

Rmer 2015-2016

Indici di concordanza e discordanza: uso del software

Anche per la correlazione di Spearman esistono dei test statistici per verificare se la correlazione calcolataè stata casualmente estratta da una popolazione con correlazione nulla. Di questi test ci occuperemo nella parte sulla statistica inferenziale.

Page 5: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

5

Un grafico per studiare la relazione tra caratteriquantitativi: lo Scatter-Plot o Grafico diDispersione Rappresenta la distribuzione unitaria doppia di 2 caratteri

quantitativi

Sull’asse delle ascisse (X) e su quello delle ordinate (Y)sono riportati rispettivamente i valori numerici dellemodalità assunti dalle due variabili rilevate su ogni u.s.

L’insieme di punti così ottenuto si chiama nuvola di puntie consente di studiare la dispersione delle u.s. e la lorosomiglianza

La forma della nuvola può suggerire l’esistenza e la formadella relazione tra i due caratteri

Rmer 2015-2016

Esempio

Distribuzione Unitaria Doppia

Unità Statistica

VenditeSpesa per

pubblicità su radio e TV

1 973 02 1119 03 875 254 625 255 910 306 971 307 931 358 1177 359 882 40

10 982 4011 1628 4512 1577 4513 1044 5014 914 5015 1329 5516 1330 5517 1405 6018 1436 6019 1521 6520 1741 6521 1866 7022 1717 70

Scatter Plot

0

500

1000

1500

2000

0 10 20 30 40 50 60 70 80

Spesa per pubblicità radio e TV

Vend

ite

U.S

Rmer 2015-2016

Page 6: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

6

Interdipendenza tra due caratteri quantitativi

• Si considera la distribuzione unitaria di 2 caratteri quantitativi X e Y

• Si analizza l’associazione dei due caratteri attraverso l’analisi dello scatter plot o mediante indici simmetrici che valutano la presenza di Concordanza: u.s. con valori piccoli (grandi) di un

carattere presentano più frequentemente valori piccoli (grandi) dell’altro carattere

Discordanza: u.s. con valori piccoli (grandi) di un carattere possiedono più frequentemente valori grandi (piccoli) dell’altro carattere

.. .si puo analizzare l’interdipendenza graficamente

1. Concordanza: nuvola allungata verso alto a destra

2. Discordanza: nuvola allungata verso alto a sinistra

3. Assenza di interdipendenza lineare: punti sparsi

Relazione diretta (concordanza)

05

10152025303540

0 2 4 6 8 10 12 14

Variabile X

Var

iabi

le Y

Relazione inversa (discordanza)

-20

-15

-10

-5

0

5

10

0 2 4 6 8 10 12 14

Variabile X

Varia

bile

Y

Page 7: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

7

Interdipendenza tra due caratteri quantitativi

• Per misurare il legame che esiste tra due caratteri quantitativi si utilizza la covarianza, definita come la media dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie:

n

MyMxn

iyixi

xy

1

)()(

Questo valore sarà :•Nullo nel caso di indipendenza statistica•Positivo in caso di concordanza perché al crescere della X anche la Y crescerà di conseguenza le differenze avranno lo stesso segno.•Negativo in caso di discordanza, perché all’aumentare della X corrisponderà una diminuzione della Y e viceversa.•se dividiamo la covarianza per il prodotto delle deviazioni standard delle 2 variabili, otteniamo un valore standardizzato, che oscilla fra –1 e +1: il coefficiente di correlazione r di Pearson

IL Coefficiente di correlazione lineare di Bravais e Pearson

• è una misura della relazione lineare esistente tra due variabili ovvero una misura della l’interdipendenza che esiste tra le due distribuzioni.

r misura una relazione simmetrica di tipo lineare cha varia tra -1 e +1 . Convenzionalmente:

Page 8: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

8

Rappresentare graficamente la relazione tra vendite e spese per pubblicità. Che cosa si può dedurre?Calcolare il coefficiente di correlazione tra i due caratteri .

I. Mingo 2015-2016

Esercizio

Step per calcolare il coefficiente di correlazione

FSSC

1. Calcolare la media aritmetica di ciascun carattere2. Calcolare per ciascuna modalità di ciascun carattere gli

scarti dalla rispettiva media3. Ottenere la covarianza

• Moltiplicare per ciascuna modalità gli scarti dei due caratteri ottenuti al punto 2.

• Sommare i prodotti così ottenuti.• Dividere questa somma dei prodotti per il numero di unità

statistiche.4. Ottenere gli scarti quadratici medi

• Elevare al quadrato gli scarti dalla media di ciascuna modalità• Sommare per ogni carattere i quadrati così ottenuti• Dividere ciascuna di queste somme per il numero di unità

statistiche per ottenere le varianze.• Estrarre le radici quadrate per ottenere gli scarti quadratici

medi-

5. Ottenere r1. Dividere la covarianza (ottenuta al punto 3) per il prodotto degli

scarti quadratici medi dei due caratteri (ottenuti al punto 4).

Page 9: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

9

Correlazione e relazione lineare

I. Mingo 2015-2016

Correlazione e relazione lineare

r=0,976r=0,002

Le caratteristiche dei punti-unità espresse dalledue variabili (le due dimensioni del pianocartesiano) possono essere riassunte da unasola la retta.

Non è possibile individuare una rettache riassuma le due variabili poichéesse sono indipendenti.

I. Mingo 2015-2016

Page 10: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

10

Correlazione: esempi

Correlazioni

-,897 ,976 -,337

-682,661 2617,602 -45,033

-35,930 137,769 -2,37020 20 20

Correlazione di PearsonSomma dei quadrati edei prodotti incrociatiCovarianzaN

tasso didisocc.

Tasso diattività delle

donne

Tasso didisoccupazion

e giovanile

Minorennidenunciati

per 100minorenni

in età 14-17anni

Tasso di disoccupazione

3020100

Tass

o di

atti

vità

del

le d

onne

50

40

30

20

Tasso di disoccupazione

3020100

Tass

o di

dis

occu

pazio

ne g

iova

nile

70

60

50

40

30

20

10

0

Tasso di disoccupazione

3020100

Min

oren

ni d

enun

ciat

i per

100

min

oren

ni

6

5

4

3

2

1

Uso del software : la correlazione

I. Mingo 2015-2016

Page 11: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

11

Analisi della dipendenza lineare tra due variabili quantitative

I. Mingo 2015-2016

• L’analisi della dipendenza è asimmetrica: date due variabiliquantitative, X e Y, si è interessati a studiare se e in che misura lavariabile Y (variabile dipendente ) sia influenzata dalla X (variabileindipendente).

• Scelta la variabile indipendente X e quella dipendente Y, la rappresentazione grafica della distribuzione unitaria doppia di tali variabili attraverso il grafico di dispersione, consente di individuare la eventuale relazione lineare tra X ed Y.

• Si è visto che è’ possibile tracciare una retta, detta interpolante, tra i punti dello scatterplot tale che si avvicini a tutti i punti riproducendo, con una certa approssimazione, la nuvola.

I. Mingo 2015-2016

La funzione di una retta è la seguente:Y=a+bX

dove:• a è l’intercetta della retta sull’asse delle ordinate Y, cioè è il punto in

cui la retta interseca l’asse Y e quindi è il valore di Y che corrisponde ad un valore di X=0;

• b è il coefficiente angolare della retta , cioè il valore che indica la sua inclinazione. Se b>0 la retta è ascendente, ossia inclinata dal basso a sinistra verso l’alto a destra; se b<0 la retta è discendente, ossia inclinata dal basso a destra verso l’alto a sinistra.

Nello studio empirico della relazione di dipendenza lineare tra X ed Y l’obiettivo è quello di individuare per ciascun punto Pi un nuovo punto che sia il più vicino possibile al punto Pi pur giacendo sulla retta che passa nella nuvola di punti.

La funzione della retta

Page 12: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

12

I. Mingo 2014-2015

La differenza tra il valore yi osservato e quello teorico è definito residuo

La funzione della retta interpolante

La migliore retta individuabile è quella che rende minimi tali residui

La relazione lineare tra X e Y e la retta di regressione

I. Mingo 2014-2015

Come individuare questa retta?Secondo il metodo dei minimi quadrati la migliore retta è quella che

rende minima la somma dei quadrati dei residui: questa retta vienechiamata retta di regressione.

Page 13: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

13

Come si calcola la retta di regressione: che cosa sono i parametri a e b?

I. Mingo 2014-2015

Il coefficiente di regressione e il coefficiente di correlazione

I. Mingo 2015-2016

Page 14: Metodi statistici per le ricerche di mercato · popolazione con correlazione nulla. ... Nello studio empirico della relazione di dipendenza ... La funzione della retta interpolante

28/10/2015

14

Come si interpreta Il coefficiente di regressione

I. Mingo 2015-2016

푦푖 = −2,46 + 1,19푥푖

EsercizioRiprendendo la tabella 5 dell’esercizio precedente calcolare il coefficiente di regressione tra le vendite (variabile dipendente) e le spese in pubblicità (variabile indipendente), e l’intercetta della retta di regressione. Scrivere l’equazione della retta di regressione.

b=20,03/16,81=1,19

푎 = 푀(푌) − 푏푀(푋) a=10,83-(1,19*11,17)=-2,4623