41
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Embed Size (px)

Citation preview

Page 1: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Metodi Quantitativi per Economia, Finanza e Management

Lezione n°5

Page 2: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Tipologie di dati

• Qualitativi dati espressi in forma verbale, solitamente classificati in categorie

• Quantitativi dati espressi in forma numerica. si distinguono in:– discreti dati caratterizzati da una quantità finita o infinita

numerabile di classi di misura– continui risposta numerica derivamte da un processo di

misurazione che fornisce indicazioni puntuali all’interno di un continuum

• Territoriali

• Date

Page 3: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Nominale usato per dati qualitativi, che vengono così classificati in categorie distinte senza alcun ordine implicito (es. professione del cliente)

• Ordinale le categorie presentano un ordine implicito; consente di stabilire una relazione d’ordine tra le diverse categorie, ma nessuna asserzione numerica, ovvero si può dire che un determinato valore è più grande di un altro, ma non di quanto

Tipologie di datiqualitativi

Page 4: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Scala di rapporti con questa tipologia si può dire di quanto una categoria è maggiore di un’altra; è fissato un valore “0” della scala.

es. Le variabili spesa media e tempo impiegato sono misurate a livello di rapporto,ovvero rientrano in una scala di valutazione comparativa

• Scala di intervalli presenta le stesse caratteristiche della precedente, ma non possiede un valore “0” fissato.

es. In una indagine sui clienti di un supermercato, il loro livello di soddisfazione può essere adeguatamente rappresentato mediante una scala di valutazione compresa tra 1 e 9, ciò che posso asserire è che la differenza tra 2 e 3 è la medesima di quella tra 8 e 9, ma non che 8 sia il doppio di 4.

Tipologie di datiquantitativi

Page 5: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

L’analisi statistica dei dati

Statistica descrittiva insieme dei metodi che riguardano la rappresentazione e sintesi di un insieme di dati al fine di evidenziarne le caratteristiche principali

Statistica inferenziale insieme dei metodi che permettono la stima di una caratteristica di una popolazione basandosi sull’analisi di un campione

Totalità degli elementi presi in esame dallaindagine

La parte di popolazioneselezionata per l’analisi

Misura riassuntiva,calcolata sui dati campionari,utile per descrivere unacaratteristica non nota della popolazione

Page 6: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Statistica descrittiva univariata

Nella statistica descrittiva univariata possiamo trovare due principali metodologie usate per rappresentare i dati analizzati:

• Distribuzioni di frequenza

• Misure di sintesi:

– Misure di tendenza centrale e non centrale;

– Misure di dispersione;

– Misure della forma della distribuzione

Page 7: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Le distribuzioni di frequenza

• Frequenza assoluta: è un primo livello di sintesi dei dati- consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati

• Distribuzione di frequenza: insieme delle modalità e delle loro frequenze

• Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate.

I due tipi di frequenze vengono usati con dati quantitativi, qualitativi ordinali, quantitativi discreti.

p= n/ N

Page 8: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Rappresentazione grafica var.qualitative:

Diagr. a barre: nell’asse delle ascisse ci sono le categorie, senza un ordine preciso; in quello delle ordinate le frequenze assolute/relative corrispondenti alle diverse modalità

Diagr. a torta: la circonferenza è divisa proporzionalmente alle frequenze

0

50

100

150

200

250

casalinga dirigente studente

Diagramma a barre-professione intervistato Diagramma a torta

Le distribuzioni di frequenza

Page 9: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Diagramma delle frequenze

220170

30

10057

30

0

100

200

300

• Rappresentazione grafica var.quantitative discrete:

Diagr. delle frequenze: nell’asse delle ascisse ci sono i valori assunti dalla var. discreta (quindi ha un significato quantitativo); l’altezza delle barre è proporzionale alle frequenze relative o assolute del valore stesso

Istogramma: nell’asse delle ascisse ci sono le classi degli intervalli considerati; l’asse delle ordinate rappresenta la densità di frequenza; l’area del rettangolo corrisponde alla frequenza della classe stessa.

0

0,02

0,04

0,06

istogramma

Le distribuzioni di frequenza

Page 10: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Misure di sintesi

Misure di tendenza centrale:• Media aritmetica• Mediana• Moda Misure di tendenza non centrale:• Quantili• PercentiliMisure di dispersione:• Campo di variazione• Differenza interquantile• Varianza• Scarto quadratico medio• Coefficiente di variazioneMisure di forma della distribuzione:• Skewness• Kurtosis

Page 11: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Misure di Tendenza Centrale

Tendenza Centrale

Media Mediana Moda

n

xx

n

1ii

Valore centrale delle osservazioni ordinate

Valore più frequente

Media Aritmetica

Page 12: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Media Aritmetica

• La misura di tendenza centrale più comune

• Media = somma dei valori diviso il numero di valori

• Influenzata da valori estremi (outlier)

0 1 2 3 4 5 6 7 8 9 10

Media = 3

0 1 2 3 4 5 6 7 8 9 10

Media = 4

35

15

5

54321

4

5

20

5

104321

Page 13: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Mediana

• In una lista ordinata, la mediana è il valore “centrale” (50% sopra, 50% sotto)

• Non influenzata da valori estremi

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

Page 14: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Moda

• Valore che occorre più frequentemente

• Non influenzata da valori estremi

• Usata sia per dati numerici che categorici

• Può non esserci una moda

• Ci può essere più di una moda

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

No Moda

Page 15: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori

25% 25% 25% 25%

• Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso

• Q2 coincide con la mediana (50% sono minori, 50% sono maggiori)

• Solo 25% delle osservazioni sono maggiori del terzo quartile

Q1 Q2 Q3

Misure di Tendenza Non Centrale

Page 16: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Box Plot

Mediana(Q2)

XmassimoX

minimo Q1 Q3

25% 25% 25% 25%

12 30 45 57 70

Differenza Interquartile 57 – 30 = 27

OUTLIERS: Q1 - 1,5 * Differenza interquartileQ3 + 1,5 * Differenza interquartile

Page 17: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Stesso centro,

diversa variabilità

Misure di Variabilità

Variabilità

Varianza Scarto Quadratico

Medio

Coefficiente di Variazione

Campo di Variazione

Differenza Interquartile

• Le misure di variabilità forniscono informazioni sulla dispersione o variabilità dei valori.

Page 18: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Campo di Variazione

• La più semplice misura di variabilità

• Differenza tra il massimo e il minimo dei valori osservati:

Campo di variazione = Xmassimo – Xminimo

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Campo di Variazione = 14 - 1 = 13

Esempio:

Page 19: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Ignora il modo in cui i dati sono distribuiti

• Sensibile agli outlier

7 8 9 10 11 12

Campo di Var. = 12 - 7 = 5

7 8 9 10 11 12

Campo di Var. = 12 - 7 = 5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Campo di Var. = 5 - 1 = 4

Campo di Var = 120 - 1 = 119

Campo di Variazione

Page 20: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Differenza Interquartile

• Possiamo eliminare il problema degli outlier usando la differenza interquartile

• Elimina i valori osservati più alti e più bassi e calcola il campo di variazione del 50% centrale dei dati

• Differenza Interquartile = 3o quartile – 1o quartile

IQR = Q3 – Q1

Page 21: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Media dei quadrati delle differenze fra ciascuna osservazione e la media

– Varianza della Popolazione:

Varianza

N

μ)(xσ

N

1i

2i

2

dove = media della popolazione

N = dimensione della popolazione

xi = iimo valore della variabile X

μ

Page 22: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Scarto Quadratico Medio

• Misura di variabilità comunemente usata

• Mostra la variabilità rispetto alla media

• Ha la stessa unità di misura dei dati originali

– Scarto Quadratico Medio della Popolazione:

N

μ)(xσ

N

1i

2i

Page 23: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Scarto quadratico medio piccolo

Scarto quadratico medio grande

Scarto Quadratico Medio

Page 24: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Media = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Dati B

Dati A

Media = 15.5 s = 0.926

11 12 13 14 15 16 17 18 19 20 21

Media = 15.5 s = 4.570

Dati C

Scarto Quadratico Medio

Page 25: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Viene calcolato usando tutti i valori nel set di dati

• Valori lontani dalla media hanno più peso (poichè si usa il quadrato delle deviazioni dalla media)

• Le stesse considerazioni valgono anche per il calcolo della Varianza

Scarto Quadratico Medio

Page 26: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Coefficiente di Variazione

• Misura la variabilità relativa

• Sempre in percentuale (%)

• Mostra la variabilità relativa rispetto alla media

• Può essere usato per confrontare due o più set di dati

misurati con unità di misura diversa

100%x

sCV

Page 27: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Azione A:

– Prezzo medio scorso anno = $50

– Scarto Quadratico Medio = $5

• Azione B:

– Prezzo medio scorso anno = $100

– Scarto Quadratico Medio = $5

Entrambe le azioni hanno lo stesso scarto quadratico medio, ma

l’azione B è meno variabile rispetto al suo prezzo

10%100%$50

$5100%

x

sCVA

5%100%$100

$5100%

x

sCVB

Coefficiente di Variazione

Page 28: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Forma della Distribuzione

• La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

Distribuzione Simmetrica

0123456789

10

1 2 3 4 5 6 7 8 9F

req

uen

za0

20

40

60

80

100

120

Page 29: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro.

Distribuzione con Asimmetria Positiva

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9

Fre

qu

en

za

Distribuzione con Asimmetria Negativa

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9

Fre

qu

en

za

Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi.

Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi.

Forma della Distribuzione

Page 30: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

• Descrive come i dati sono distribuiti

• Misure della forma

– Simmetrica o asimmetrica

Media = Mediana Media < Mediana Mediana < Media

Obliqua a destraObliqua a sinistra Simmetrica

Misure di Forma della Distribuzione

Asimmetria negativa Simmetria Asimmetria positiva

Page 31: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. – γ=0 ditribuzione simmetrica;– γ<0 asimmetria negativa (mediana>media);– γ>0 asimmetria positiva (mediana<media).

Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica).– β=3 se la distribuzione è “Normale”;– β<3 se la distribuzione è iponormale (rispetto alla distribuzione

di una Normale ha densità di frequenza minore per valori molto distanti dalla media);

– β>3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media).

Misure di Forma della Distribuzione

Page 32: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Basic Statistical Measures

Location Variability

Mean 106.1410 Std Deviation 81.01306

Median 103.2900 Variance 6563

Mode 0.0000 Range 523.69000

    Interquartile Range 118.62500

IMPORTO NETTO UNITARIO

Page 33: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

IMPORTO NETTO UNITARIO

Page 34: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

IMPORTO NETTO UNITARIO

Page 35: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Basic Statistical Measures

Location Variability

Mean 138.0247 Std Deviation 64.29397

Median 129.1100 Variance 4134

Mode 149.0000 Range 521.77000

    Interquartile Range 82.62000

IMPORTO NETTO UNITARIO

Page 36: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Analisi di Concentrazione

μ.......321 nxxxxEquidistribuzione:

01.......321 nxxxxμNnx

Max concentrazione:

Per caratteri quantitativi trasferibili

NF

ii

N

1jj

i

1j

j

x

x

iQ2. Calcolare le quantità:

nxxxx .......3211. Ordinare le osservazioni

Page 37: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

CURVA DI CONCENTRAZIONE REDD. >=0QI

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

FI0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

20%

50%

60%

90%

Analisi di Concentrazione

Page 38: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

CURVA DI CONCENTRAZIONE REDD. < 0QI

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

FI0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

20%

40%

Analisi di Concentrazione

Page 39: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Statistica descrittiva bivariata

Indaga la relazione tra due variabili misurate. Si distingue rispetto alla tipologia delle variabili indagate:

• var. qualitative/quantitative discrete: tavole di contingenza (o a doppia entrata)

• var. quantitative: analisi di correlazione lineare

• una var. qualitativa e una quantitativa: confronto tra le medie

Page 40: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Tavole di contingenzaSono tabelle a doppia entrata; i valori riportati all’interno della tabella sono le

frequenze congiunte assolute, e la loro somma è pari al totale dei casi osservati.

Dalla tabella si possono ricavare inoltre le distribuzioni marginali, sommando per riga e per colonna le frequenze congiunte; le frequenze relative congiunte, pari al rapporto tra le frequenze assolute congiunte e il totale dei casi osservati.

Sesso * Età Crosstabulation

25 22 22 17 86

29.1% 25.6% 25.6% 19.8% 100.0%

32.1% 40.0% 53.7% 36.2% 38.9%

11.3% 10.0% 10.0% 7.7% 38.9%

53 33 19 30 135

39.3% 24.4% 14.1% 22.2% 100.0%

67.9% 60.0% 46.3% 63.8% 61.1%

24.0% 14.9% 8.6% 13.6% 61.1%

78 55 41 47 221

35.3% 24.9% 18.6% 21.3% 100.0%

100.0% 100.0% 100.0% 100.0% 100.0%

35.3% 24.9% 18.6% 21.3% 100.0%

Count

% within Sesso

% within Età

% of Total

Count

% within Sesso

% within Età

% of Total

Count

% within Sesso

% within Età

% of Total

M

F

Sesso

Total

18-25 26-35 36-50 Over 50

Età

Total

Page 41: Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Dalle tabelle di contingenza si possono ricavare ulteriori distribuzioni unidimensionali :– Frequenze subordinate ovvero la frequenza di osservare il carattere x

dato il carattere y e viceversa. Formalmente:

P y|x (xi,yj) = P (xi,yj) / P x(xi)

P x|y (xi,yj) = P (xi,yj) / P y(yj)

Indipendenza statistica se al variare di X le distribuzioni subordinate (Y|X)= xi sono tutte uguali tra loro,si può concludere che la distribuzione del carattere Y non dipende da X. Nel caso di indipendenza statistica, la frequenza relativa congiunta è pari al prodotto delle marginali corrispondenti

P(xi,yj)=Px (xi)Py(yj)

L’indipendenza stat. è un concetto simmetrico: se vale per X, vale anche per Y. Se si verifica, vuol dire che l’analisi bivariata di X (Y) non dà informazioni aggiuntive rispetto all’analisi univariata.

Tavole di contingenza