201
Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l. Economia Aziendale 6 febbraio 2010 1

Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

  • Upload
    lamnhan

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Testi e soluzioni dei compiti di esame di STATISTICA 1

c.l. Economia Aziendale

6 febbraio 2010

1

Page 2: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Elenco

1. Compito del 17.12.1998

2. Compito del 08.01.1999

3. Compito del 26.01.1999

4. Compito del 10.02.1999

5. Compito del 08.06.1999

6. Compito del 23.06.1999

7. Compito del 13.07.1999

8. Compito del 28.09.1999

9. Compito del 14.12.1999

10. Compito del 11.01.2000

11. Compito del 02.02.2000

12. Compito del 17.02.2000

13. Compito del 03.05.2000

14. Compito del 06.06.2000

15. Compito del 22.06.2000

16. Compito del 12.09.2000

17. Compito del 28.09.2000

18. Compito del 15.12.2000

19. Compito del 15.01.2001

20. Compito del 31.01.2001

21. Compito del 15.02.2001

22. Compito del 06.04.2001

23. Compito del 07.06.2001

24. Compito del 26.06.2001

25. Compito del 11.07.2001

26. Compito del 20.09.2001

27. Compito del 19.12.2001

28. Compito del 09.01.2002

29. Compito del 23.01.2002

30. Compito del 12.02.2002

31. Compito del 04.04.2002

32. Compito del 11.06.2002

33. Compito del 26.06.2002

34. Compito del 16.07.2002

35. Compito del 17.12.2002

36. Compito del 08.01.2003

37. Compito del 23.01.2003

38. Compito del 10.02.2003

39. Compito del 23.04.2003

40. Compito del 29.05.2003

41. Compito del 04.06.2003

42. Compito del 25.06.2003

43. Compito del 17.07.2003

44. Compito del 05.09.2003

45. Compito del 18.09.2003

46. Compito del 17.12.2003

47. Compito del 13.01.2004

48. Compito del 27.01.2004

49. Compito del 10.02.2004

50. Compito del 15.04.2004

51. Compito del 28.05.2004

52. Compito del 03.06.2004

53. Compito del 18.06.2004

54. Compito del 07.07.2004

55. Compito del 14.09.2004

56. Compito del 15.12.2004

57. Compito del 11.01.2005

58. Compito del 26.01.2005

59. Compito del 10.02.2005

60. Compito del 31.05.2005

61. Compito del 09.06.2005

62. Compito del 28.06.2005

63. Compito del 13.07.2005

64. Compito del 16.12.2005

65. Compito del 19.01.2006

66. Compito del 02.02.2006

2

Page 3: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

67. Compito del 16.02.2006

68. Compito del 16.03.2006

69. Compito del 31.05.2006

70. Compito del 21.06.2006

71. Compito del 12.09.2006

72. Compito del 18.01.2007

73. Compito del 01.02.2007

74. Compito del 15.02.2007

75. Compito del 30.03.2007

76. Compito del 31.05.2007

77. Compito del 05.06.2007

78. Compito del 26.06.2007

79. Compito del 10.07.2007

80. Compito del 07.09.2007

81. Compito del 19.12.2007

82. Compito del 16.01.2008

83. Compito del 31.01.2008

84. Compito del 13.02.2008

85. Compito del 21.04.2008

86. Compito del 18.06.2008

87. Compito del 02.07.2008

88. Compito del 03.09.2008

89. Compito del 18.12.2008

90. Compito del 15.01.2009

91. Compito del 29.01.2009

92. Compito del 12.02.2009

93. Compito del 21.04.2009

94. Compito del 10.06.2009

95. Compito del 24.06.2009

96. Compito del 08.07.2009

97. Compito del 09.09.2009

98. Compito del 16.12.2009

99. Compito del 27.01.2010

3

Page 4: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

1 Compito del 17.12.1998

1.1 Testo

(1) Un’azienda sita in Firenze manda usualmente un proprio funzionario nelle sedi di Roma, Siena eBologna. Il viaggio sempre effettuato con le Ferrovie dello Stato: Firenze-Roma il 20% delle volte,Firenze-Bologna il 55 % delle volte e il rimanente 25% Firenze-Siena. Il funzionario partito di primamattina ha comunicato solamente di essere arrivato in ritardo. (I) Quale la probabilit che esso sia aSiena? (II) E che sia a Roma? Ricorrere alla Tabella 1 delle statistiche annuali di percorrenza.

Tabella 1: Statistiche annuali di percorrenza (numero treni nel 1997) sulle tratte considerate.Tratta Treni puntuali Treni totali

Firenze-Siena 2714 3252Firenze-Bologna 6911 9897Firenze-Roma 7555 9524

(2) In una classe delle medie superiori 3 studenti hanno elevate capacit ed elevato impegno, 6 studentiimpegno regolare e capacit elevate, 11 studenti con elevato impegno e capacit regolari ed 3 studenti conimpegno e capacit regolari. Un nuovo docente chiama tre studenti per un’interrogazione orale. Quale laprobabilit che i tre studenti siano: uno appartenente con elevato impegno e capacit, un’altro con grupporegolare impegno ed elevate capacit, un’altro con regolare capacit ?

(3) Nella Tabella 2 sono riportate le tonnellate di marmo estratte da 3 cave differenti (A,B,C) in 4 mesi.Calcolare media, varianza, coeff. di variazione per il mese I, poi per il mese II . Calcolare un’adeguatoindice di connessione e ricavare la percentuale di variabilita spiegata dalla differenza tra cave.

Tabella 2: Tonnellate di marmo (in centinaia) estratte da tre cave differenti.Cava - Mese I II III IV

A 4.773 4.116 5.6833 2.9673B 7.0678 3.2368 8.2897 7.5859C 2.1041 2.3533 1.204 1.7398

(4) Un’azienda produce fogli di materiale plastico trasparente di dimensione 3 m per 8 m, e con spes-sore assimilabile ad una variabile casuale gaussiana con media 0.528 mm e varianza uguale a 0.0124 .Il prodotto ha mediamente 0.1 difetti per m2. Al momento della consegna ogni foglio esaminato dalcompratore che chiede un risarcimento economico pari al numero di difetti riscontrati per lire 262 pi 799se il foglio ha spessore non incluso nell’intervallo [ 0.467 , 0.567 ]. Quale il valore atteso del risarcimentoeconomico per un foglio prodotto da tale azienda? Si commenti brevemente la scelta della funzione dimassa di probabilit per la variabile casuale ‘numero di difetti’.

1.2 Soluzioni

(1) P(Ritardo) = 0.2486465(I) P(Siena|Ritardo) = 0.1663372(II) P(Roma|Ritardo) = 0.1662930

(2) P(1o = IE e CE) = 3/23, P(2o = IR e CE| 1o = IE e CE) = 6/22, P(3o = CR| 2o = IR e CE,1o =IE e CE) = 14/21. Siccome non interessa l’ordine occorre moltiplicare per le permutazioni di questi 3elementi (3! = 6). Risultato =3/23*6/22*14/21*6 = 0.142293

(3)Media(I) = 4.6483 Media(II) = 3.2354Varianza(I) = 4.1142 Varianza(II) = 0.5179CV(I) = 0.43636 CV(II) = 0.22242DevB = 44.17483 DevT = 64.18549 η2 = 0.688237

4

Page 5: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(4)E(Risarcimento) = 262*E(difetti) + 799*P(spessore /∈ (0.467,0.567))= 262*0.1*3*8+799*0.65499885 = 1152.1441

5

Page 6: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

2 Compito del 08.01.1999

2.1 Testo

(A) Una macchina industriale per la verniciatura impiega un certo solvente chimico. La verniciaturaottimale richiede una quantit di solvente compresa tra 19.3071 e 26.1249 kg. Assumendo che la quantitX di solvente impiegata dalla macchina sia assimilabile ad una variabile casuale Gaussiana con mediaµ e varianza σ2, (1) come regolare il dispositivo di verniciatura perch la la probabilit dell’evento E1 =X < 19.3071 sia uguale a 0.0205 e la probabilit dell’evento E2 = X > 26.1249 sia uguale a 0.0181?Come sarebbe possibile ridurre i costi dovuti al solvente pur ottenendo una verniciatura ottimale?

(B) Un’azienda produce guanti in gomma, con un numero medio di micro-lacerazioni pari a 0.5239 perguanto. Quale la probabilit che una coppia di guanti rechi complessivamente pi di 2 micro-lacerazioni?

(C) In una falegnameria industriale sono prodotti assi di legno con uno spessore che assimilabile aduna variabile casuale Gaussiana. Usando i dati in tabella, (1) effettuare il test bilaterale dell’ipotesinulla H0 : σ2 = 1.838 a tre diversi valori di probabilit dell’errore di primo tipo: 0.10, 0.05, 0.01. (2)Commentare brevemente i risultati ottenuti.

Tabella 1: Campione di 10 osservazioni (spessori in mm).

32.0009 29.5421 30.632 29.8283 33.4661 28.4688 28.4654 28.3078 26.9319 31.3147

(D) Su 28 salumerie operanti in un certo comune e con medesimo ammontare di vendite, 14 appartengonoalla catena di negozi Appia e 14 alla catena di negozi Aurelia. Lo spessore della fetta di salume sidistribuisce come una variabile casuale Gaussiana, nella catena di negozi Appia con media 0.2235 evarianza 0.16, mentre nella catena Aurelia con media 0.3782 e varianza 0.25. Quale la probabilit che unafetta di salume adulterata sia stata acquistata in un negozio della catena Aurelia dato che il suo spessoredi 0.3266 mm?

2.2 Soluzioni

(A)(1) µ = 22.67387 σ = 1.64753(2) µ = 19.3071 σ = 0

(B) P (X > 2) = 1− [P (X = 0) +P (X = 1) +P (X = 2)] = 0.0893005 da calcolare per X ∼ Poisson(λ =2 ∗ 0.5239 = 1.0478).

(C) valore campionario della statistica test = 19.179671.(I) α = 0.1: regione accettazione = [3.32511, 16.91898]α = 0.05: regione accettazione = [2.70039, 19.02277]α = 0.01: regione accettazione = [1.73493, 23.58935](II) Al diminuire di α = P (rifiutare|H0) aumenta 1−α = P (accettare|H0) e quindi aumenta l’ampiezzadella regione di accettazione.

(D) P (Aurelia|x = 0.3266) =f(0.3266|Aurelia)

f(0.3266|Aurelia) + f(0.3266|Appia)= 0.4513417

Note: f(0.3266|Aurelia) e f(0.3266|Appia) sono le densit della distribuzione normale corrispondente; leprobabilit a priori P (Aurelia) e P (Appia), essendo entrambe 1/2 sono state semplificate.

6

Page 7: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

3 Compito del 26.01.1999

3.1 Testo

( A ) Un produttore di nastri magnetici deve consegnare un lotto di 1174 unit. Prima di inviare il lotto,vengono estratti casualmente e controllati 18 pezzi. Nel caso in cui non siano riscontrati difetti, il lottoviene spedito, altrimenti si procede al controllo di ogni nastro.Quale e la probabilita che il lotto non sia consegnato se si assume che:1) vi siano 22 nastri con difetti nel lotto;2) vi siano 25 nastri con difetti nel lotto

( B ) Il fatturato annuale di 5 aziende toscane e risultato nel 1997 pari a:

2.9638 ; 2.0367 ; 1.2293 ;2.433 ; 2.7007 miliardi di lire

1) Procedere al calcolo di un appropriato indice di variabilita;2) Rappresentare graficamente la concentrazione del fenomeno.

( C ) Un catalizzatore chimico e impiegato per aumentare il prodotto utile di una reazione (in Kg).La reazione e ripetuta in analoghe condizioni per 7 volte senza catalizzatore e per altre 7 volte con ilcatalizzatore. Sapendo che il catalizzatore non modifica la varibilita dei risultati, si effettui un test delleipotesi per saggiare se vi siano differenze significative imputabili al catalizzatore. Effettuare i calcoli alivello di significativita : 0.10 ed 0.01.

Tabella 1: Campione di 7 osservazioni (spessori in mm).

Senza: 2.3482 5.0204 4.6712 3.8549 1.2232 3.1651 5.1555Con: 9.402 6.2065 6.7958 7.5236 9.8812 8.2425 9.2238

( D ) Il carico di rottura in Kg di una barra di materiale plastico assimilabile ad una variabile casualegamma, con parametro α = 26 e β incognito. Una barra prodotta con un nuovo procedimento ha mostratoun carico di rottura pari a 62.1 Kg. Impiegando il rapporto di verosimiglianza, saggiare l’ipotesi nullaH0 : β = 0.26 verso l’alternativa H1 : β nell’insieme 0.15, 0.30, 0.50, con significativit uguale a 0.10, ein seguito con con significativit pari a 0.01 (si usi un chiquadro con un grado di libert). La funzione didensit di probabilit gamma definita da:f (x;α, β) = βα

Γ(α) · xα−1 · e(−β·x).

3.2 Soluzioni

(A)

(1) P (NC) = 1− P (X = 0) = 1−

(220

)(1174− 22

18

)(

117418

) = 1− 0.709622

(2) P (NC) = 1− P (X = 0) = 1−

(250

)(1174− 25

18

)(

117418

) = 1− 0.676847

Se si utilizza l’approssimazione binomiale i risultati vengono leggermente diversi.

(B)

(1) R =∆

2M=

0.8266

2 ∗ 2.2727= 0.181854

(2)i 1 2 3 4 5pi 0.2 0.4 0.6 0.8 1qi 0.1081 0.2874 0.5015 0.7392 1

7

Page 8: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C) Occorre fare un confronto fra medie per dati non appaiati.x = 3.63407, y = 8.1822, s2

X = 2.17446, s2Y = 1.95372, s2

p = 2.06409Valore campionario della statistica test = 5.92246α = 0.1: regione accettazione = [−1.7823, 1.7823]α = 0.01: regione accettazione = [−3.0545, 3.0545]

(D) valore campionario della statistica test = 4.1961763α = 0.1: regione accettazione = [0, 2.7055435]α = 0.01: regione accettazione = [0, 6.6348966]

8

Page 9: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

4 Compito del 10.02.1999

4.1 Testo

( A ) Dall’urna U contenente palline di tre colori diversi (Tabella 0) sono estratte due palline conreimmissione. Se le due palline sono uguali allora si procede ad una terza estrazione da U.(1) Quale e la probabilita di procedere alla terza estrazione?(2) Quale e la probabilita che al termine dell’esperimento statistico si abbia almeno una pallina nera trale estratte?

Tabella 0: Urna U.Bianche Rosse Nere

2 3 5

( B ) Si considerino 3 monete sbilanciate. In tabella 1 sono riportati i valori numerici impressi sulle duefacce di ogni moneta e la relative probabilita. Per un lancio simultaneo delle tre monete, si calcoli:(I) La distribuzione campionaria del campo di variazione C;(II) La probabilita dell’evento P [C ≥ 2].

Tabella 1: Caratteristiche di tre monete sbilanciate.Faccia 1 Faccia 2 Prob. Faccia 1

Moneta 1: 79 80 0.27Moneta 2: 78.5 80.5 0.41Moneta 3: 80 81 0.40

(C) Il tempo richiesto per completare in corsa un giro di pista assimilabile ad una variabile casualegaussiana. Utilizzando i tempi ottenuti da un campione di 7 atleti (Tabella 2), eseguire il test delleipotesi sulla media con H0 : µ = 123.6848 ed alternativa H1 : µ > 123.6848. Si impieghi un livello disignificativi uguale a 0.10, ed in seguito 0.05.

Tabella 2: Tempi ottenuti da un campione di 7 atleti (secondi).122.202 122.0359 135.6836 125.0614 125.7182 134.2323 126.1651

( D ) Il diametro esterno in millimetri dei tubi prodotti da un’azienda e assimilabile ad una variabilecasuale X con funzione di densita di probabilita:

f (X;α, β) =3.308 · α(

3 · α+ (X − β)2)2

con parametro α = 0.09 e β incognito. Una tubo prodotto dall’azienda ha diametro pari a 10.864 milli-metri. Impiegando il rapporto di verosimiglianza, saggiare l’ipotesi nulla H0 : β = 10 verso l’alternativaH1 : β nell’insieme 9, 11, 12, con significativit uguale a 0.10, e in seguito con con significativit pari a0.01 (si usi un chiquadro con un grado di libert).

4.2 Soluzioni

(A)III estraz :0.38Almeno una nera :0.815

(B)Valori: 0.5; 1; 1.5; 2; 2.5Probabilita:0.1723; 0.2584; 0.2277; 0.0956; 0.246Probabilita evento:0.3416

(C)Valore campionario della statistica test = 1.8549265

9

Page 10: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

α = 0.10: Regione di rifiuto = (1.4398,+∞)α = 0.05: Regione di rifiuto = (1.9432,+∞)

(D)Valore campionario della statistica test = 5.03774α = 0.10: Regione di rifiuto = (2.7055,+∞)α = 0.01: Regione di rifiuto = (6.6349,+∞)

10

Page 11: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

5 Compito del 08.06.1999

5.1 Testo

(A) In un mazzo regolare di 52 carte, due carte sono estratte senza reimmissione. (I) Sapendo che laprima non una figura e che superiore a 5, calcolare la probabilit che essa non sia un 9 di colore rosso. (II)Sapendo che la prima un 9, quale la probabilit che la seconda carta sia di picche?

( B ) Nella Tabella 1 riportato il numero di blocchi di marmo estratti da 3 cave differenti (1,2,3) in 3mesi differenti (1,2,3). Calcolare un’adeguato indice di associazione e spiegare brevemente il risultatoottenuto.

Tabella 1: Numero di blocchi di marmo estratti da tre cave differenti.

Cava - Mese 1 2 31 4 2 02 4 5 03 0 15 12

(C) L’effetto di un nuovo integratore alimentare viene saggiato impiegando un gruppo di 5 corridoriciclisti. In Tabella 2 sono riportati i tempi di percorrenza della pista senza e con il nuovo integratore.Effettuare il test delle ipotesi (con significativit 0.10) che l’integratore diminuisca il tempo di percorrenza.La decisione finale sarebbe cambiata scegliendo un valore di significativit uguale a 0.01 ?

Tabella 2: Campione di 5 osservazioni (tempi).

Corridore I II III IV VSenza: 61 64 55 63 62Con: 57 56 53 52 50

(D) Si ipotizzi che il voto medio negli esami universitari dipenda linearmente dal numero di ore dedicate alsonno, a parit di ore di studio effettuate. Impiegare il metodo dei minimi quadrati per stimare coefficientidel modello impiegando i dati in Tabella 3, e verificare statisticamente l’ipotesi formulata.

Tabella 3: Campione di 5 osservazioni (tempi).

Voto Medio: 18 30 20.5 27.5 23.7Ore sonno: 5.9 7.8 5.9 7.1 7.1

5.2 Soluzioni

(A)(1) P(1a non(9Rosso)|1a non(Figura) e maggiore di 5) = 1-2/(5*4) = 0.9(2) P(2a picche|1a = 9) = 1/4 = 0.25

(B) Valori dei principali indici di associazioneC1 C2 C1rel C2rel T CP χ2

0.18747 0.73168 0.1406 0.51737 0.26767 0.590495 22.4848

(C) Dati appaiati. Valore campionario della statistica test = -3.8162586α = 0.1: regione critica = (−∞,−1.533206)α = 0.01: regione critica = (−∞,−3.746947)

(D)

(1) β1 = 5.55086 β0 = −13.58381 σ2 = 3.514926(2) Valore campionario della statistica test = 4.947204; regione accettazione (-3.182446,3.182446).

11

Page 12: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

6 Compito del 23.06.1999

6.1 Testo

(A) Una fotocopiatrice mediamente compie 3.67 errori per 1000 cm2 di area fotocopiata. Copiando unfoglio di dimensioni 21.7 cm per 29.7 cm:(I) quale la probabilit che non vi siano errori?(II) Quale la probabilit che il numero di errori sia compreso tra 3 e 5 (inclusi)?

(B) Un dado arrotondato ha probabilit 0.275 di fermarsi su di uno spigolo e probabilit 0.12083 perciascuna delle sei facce recanti i numeri da 1 a 6. In un esperimento casuale se il dado al primo lancio siferma sullo spigolo lanciato una seconda volta.(I) Quale complessivamente la probabilit di non osservare alcun esito numerico?(II) Quale complessivamente la probabilit di osservare il 6?

(C) In Tabella 1 sono riportate le misure di durezza relative ad un campione casuale di 5 leghe metallichedifferenti, effettuate con il metodo tradizionale e con un nuovo metodo elettronico economico. (I) Calcolareun conveniente indice di associazione. (II) E’ ragionevole impiegare il nuovo metodo ? Perch?

Tabella 1: Campione di 5 misurazioni effettuate con due metodi differenti.

Tradizionale: 6.8 6.2 4.3 9.4 4Elettronico: 6.3 6.5 3.7 6.1 4.2

(D) Un idrante agricolo eroga una media di 1201 Kg di acqua ad ogni operazione di irrigazione. InTabella 2 sono riportati i valori di un campione casuale di 5 misurazioni. Assumendo il modello normale,(I) calcolare l’intervallo di confidenza (livello 90%) della varianza. (II) Sottoporre a test l’ipotesi che lavarianza sia uguale a 531.1 (alfa = 0.05), in alternativa ad un valore maggiore.

Tabella 2: Campione di 5 misurazioni dei Kg di acqua erogata all’irrigazione.

1193.4 1157.6 1243.5 1159.7 1213.1

6.2 Soluzioni

(A) X ∼ Poisson(λ = 2.365278)(I) P (X = 0) = 0.0939232(II) P (3 ≤ X ≤ 5) = 0.387572

(B)(I) P (X1 = N

⋂X2 = N) = 0.075625

(II) P (X1 = N⋃X2 = N) = 0.1540625

(C)(I) ρ = 0.757525

(D) Nota: µ nota(I) Intervallo = (505.819,4888.508)(II) Valore campionario della statistica test = 10.54353; regione critica = (11.070498,+∞)

12

Page 13: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

7 Compito del 13.07.1999

7.1 Testo

(A) L’ufficio federale americano di investigazione effettua un controllo sulla regolarit delle assunzioni inuna azienda. Nei precedenti 10 anni, vi sono state 1271 domande da parte di bianchi e di neri, conassunzioni riassunte in Tabella 1.

Tabella 1: Assunzioni per razza, dati decennali.

Bianchi NeriAssunti 274 127Rifiutati 583 287

Utilizzando le frequenze in tabella:(I) Quale la probabilit di assunzione per un bianco? E quale per un nero?(II) Quale la probabilit che un nuovo assunto sia nero?

(B) Un reagente chimico prodotto in lotti. Sia X la variabile casuale associata alla qualit del lotto, confunzione di massa di probabilit riportata in Tabella 2.

Tabella 2: Funzione di massa di probabilit.X -2 0 2p(X) 0.269 0.494 0.237

L’utile ricavabile dalla vendita di un lotto all’estero dato da Y1 = 5x3 +100, mentre dalla vendita in ItaliaY2 = 2x+ 50. Sapendo che la probabilit di effettuare la vendita di un lotto all’estero 0.192,(I) Quale l’utile atteso dalla vendita di un lotto?(II) Quale la varianza dell’utile per la vendita all’estero, e quale la varianza complessiva?

(C) In uno studio sulla prontezza di riflessi, un campione casuale di 5 individui devono premere unpulsante appena udito un segnale di allarme. In Tabella 3 sono riportati i tempi di risposta, assimilabiliad una gaussiana con varianza 25 ms2.(I) Calcolare la stima puntuale e quella per intervallo (confidenza 90%) del parametro incognito.(II) Effettuare il test d’ipotesi che il parametro sia uguale a 50 ms, in alternativa ad un valore maggiore( α = 0.05 ).

Tabella 3: Campione di 5 osservazioni.77 74 77 66 79

( D ) Un’azienda produce componenti elettronici la cui durata assimilabile ad una variabile casualegamma, con parametro α = 26 e β incognito. Un componente si guastato dopo 63.5 ore di funzionamento.Saggiare l’ipotesi nulla H0 : β = 0.26 verso l’alternativa H1 : β nell’insieme 0.15, 0.30, 0.50, ricorrendoal rapporto di verosimiglianza con significativit uguale a 0.10, e in seguito con con significativit pari a0.01. La funzione di densit di probabilit gamma definita da:f (x;α, β) = βα

Γ(α) · xα−1 · e(−β·x).

7.2 Soluzioni

(A)

(I) P (A|B) =274

274 + 583= 0.319720, P (A|N) =

127

127 + 287= 0.3067633

(II) P (N |A) =127

127 + 274= 0.3167082

(B)(I) E(Y ) = 59.2508

13

Page 14: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(II) V (Y1) = 8.07962 V (Y2) = 807.9616 V (Y ) = 531.8312

(C)(I) µ = 74.6, Intervallo per µ = [70.822,78.178](II) Valore campionario della statistica test = 11.0015; regione critica = (1.6448,+∞)

(D) valore campionario della statistica test = 3.524α = 0.05: regione accettazione = [0, 3.84146]α = 0.01: regione accettazione = [0, 6.6349]

14

Page 15: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

8 Compito del 28.09.1999

8.1 Testo

(A) In un’intervista telefonica, 10 soggetti hanno riferito le proprie spese mensili alimentari (Tabella 1,migliaia di lire). Calcolare:(1) L’istogramma di frequenze relative con intervalli di base [500,750), [750,1500),[1500,5000] ed effet-tuarne la rappresentazione grafica.(2) La mediana, il venticinquesimo ed il settantacinquesimo percentile, il coefficiente di variazione.

Tabella 1: Spese mensili alimentari di 10 soggetti (migliaia di lire).

707.1 721.6 504.5 1078.7 1141.6 1411.5 1772.5 1814.6 1504.2 1817

(B) Il numero atteso di reattori chimici venduti in un anno uguale a 1.458.(1) Quale la probabilita di vendere almeno 3 reattori in due anni?(2) Se in seguito ad un cambiamento del mercato il tasso di vendita dovesse diventare 6.384, quale sarebbeil valore atteso del numero di reattori venduti in due anni? Quale la probabilita di non vendere alcunreattore?

(C) In un confronto sul reddito pro-capite in due citta diverse, si vuole calcolare il rapporto tra le varianzenelle due citta considerate. Disponendo dell’informazione campionaria riportata in Tabella 2, calcolarel’intervallo di confidenza (livello 95%) per il rapporto delle varianze citta A su B.

Tabella 2: Campione di 5 osservazioni per citta (in milioni).Citta A 2.25 1.94 1.74 1.45 2.31Citta B 2.72 3.18 2.54 2.56 2.16

( D ) In un esperimento statistico, una moneta che reca sulle facce rispettivamente il numero 1 ed ilnumero 2 e lanciata una volta, e l’esito riportato e 2. Sia θ la probabilita di un risultato pari ad 1 e 1− θdi un esito pari a 2.(1) Sottoporre a test l’ipotesi H0 : θ = 0.95 in alternativa a H1 : θ = 0.0148, con significativita del 5%.(2) Calcolare la potenza del test e discutere i risultati ottenuti.

8.2 Soluzioni

(A)Ordinata 1 :0.0012Ordinata 2 :0.0004Ordinata 3 :0.0001143Mediana 3 :1276.6Q1 = 714.35 ; Q3 =1638.35Coeff. variazione :0.39409 (usando la varianza corretta)

(B)Pr. almeno 3 reattori in 2 anni :0.5577Attesa due anni dopo cambiamento :12.77Pr. vendita nessun reattore :0.000002851

(C)Media A: 1.938Dev.std A: 0.3581Var A : 0.1283Media B : 2.632Dev.std B : 0.3689Var B : 0.1361

15

Page 16: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

rapporto varianze: 0.9423Intervallo : 0.09811 ; 9.0506

(D)RifiutoPotenza = 0.9852

16

Page 17: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

9 Compito del 14.12.1999

9.1 Testo

(A) Tre tennisti A, B e C partecipano ad un torneo. L’ordine degli incontri e stabilito mediante il lanciodi una moneta. I tennisti che hanno ottenuto un esito identico giocano per primi. I lanci sono effettuatiin ordine alfabetico, prima il tennista A e poi il B, mentre il tennista C lancia la moneta solo se i primidue lanci hanno dato esito diverso. Sapendo che la probabilita dell’evento testa e 0.898:1) Quale e la probabilite che A e C giochino insieme?2) Quale e la probabilita che B e C giochino insieme dato che il lancio di A ha dato esito croce?

(B) Ad un campione casuale di 7 studenti universitari e stato chiesto di indicare il numero di ore di sonnoprima dell’esame di statistica ed il voto ottenuto il giorno successivo all’esame (Tabella 1).

Tabella 1: Campione di 7 studenti. Voto d’esame ed ore di sonno nella notte precedente.Ore: 9.44 9.54 6 6.27 6.79 7.94 10.15Voto: 25.52 23.5 18.47 23.58 25.51 29.54 18.48

(1) Rappresentare graficamente i risultati in tabella.(2) Calcolare un indice relativo di associazione tra voto e ore di sonno.(3) Discutere brevemente i risultati ottenuti.

(C) In uno studio sulle vendite annuali di formaggio nei supermercati, sono stati ottenuti i valori relativiad un campione casuale di 5 supermercati di caratteristiche similari. Impiegando i dati riportati in tabellaed assumendo un modello normale:(1) Effettuare la stima della media con affidabilita 0.99.(2) Calcolare l’informativita ottenuta.

Tabella 2: Campione di 5 supermercati: vendite in migliaia di Kg.153.8 143.4 149.9 147.3 151.6

( D ) Un corriere di Firenze consegna pacchi in tre regioni del nord Italia. Il 6% delle volte si reca inLombardia ed il numero medio di pacchi da consegnare e 54. Il 17% delle volte consegna in Veneto ed ilnumero medio di pacchi e 58. In Piemonte il numero medio di pacchi per consegna e di 17. Il corrieredecide di partire nonostante abbia smarrito i documenti di consegna.Verso quale regione deve dirigersi avendo da consegnare 56 pacchi? Perche ?

9.2 Soluzioni

(A)Pro[AC] = 0.0916Pro[BC|A==C] = 0.8064

(B)Correlaz: -0.019Stat test: 0.0017Valore critico: 6.6

(C)Media : 149.2Varianza : 16.16Int.inf : 140.9Int.sup : 157.5Informativita : 16.6

(D)Lombardia : 0.0513192

17

Page 18: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Veneto : 0.0514066Piemonte: 4.6802e-014Denominatore : 0.0118183Post Lombardia : 0.260541Post Veneto : 0.73269Post Piemonte : 0

18

Page 19: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

10 Compito del 11.01.2000

10.1 Testo

(A) Un’azienda produce fuochi d’artificio a doppia camera. Se la camera C1 esplode, la probabilita chela camera C2 esploda e 0.841. Se la camera C1 non esplode, la probabilita che non esploda C2 0.723.Sapendo che la camera C1 non esplode con probabilita 0.138:1) Qual e la probabilita che effettuando il lancio non avvengano scoppi?2) Avendo effettuato un lancio ed udito un solo scoppio, quale e la probabilita che esso sia avvenuto perl’esplosione di C2?

(B) In una citta vi sono 5 autoscuole. Il numero di promossi all’esame di guida durante il 1999 e riportatoin Tabella 1. Impiegando i dati riportati:(1) Valutare l’equidistribuzione nel numero dei promossi per le autoscuole considerate.(2) Rappresentare graficamente i valori componenti il calcolo effettuato al punto (1).

Tabella 1: Campione di 5 autoscuole: numero di promossi all’esame.A1 A2 A3 A4 A5490 100 360 490 170

(C) I risultati di un’indagine finanziaria sull’evasione fiscale in 1828 aziende sono stati riassunti per classidi dimensione aziendale (D, numero di dipendenti) e per classi di ammontare evaso (M, milioni).

Tabella 2: Numero di aziende indagate per classi di evasione (M) e di dimensione (D).D: [1,50] (50,200] (200,∞)M:0 18 78 13

(0 , 99] 290 426 297(99,∞) 270 191 245

(1) Tabellare la funzione di massa di probabilita condizionata di D dato M=0.(2) Calcolare un indice di interconnessione relativo tra M e D che colga qualsiasi tipo di associazioneeventualmente esistente.

(D) Un’azienda effettua uno studio sull’efficacia del trattamento vitaminico SUPERLAV. Il rendimentolavorativo e stato misurato su di un campione casuale di 4 segretarie che hanno assunto per un meseil preparato SUPERLAV ed su un secondo campione casuale di 3 segretarie che non hanno assuntoSUPERLAV. Impiegando i dati riportati in tabella 2 ed assumendo un modello normale per la variabilecasuale rendimento lavorativo:(1) Decidere circa l’efficacia del preparato SUPERLAV con probabilit di un errore di tipo I pari a 0.01,assumendo che il preparato SUPERLAV non diminuisca il rendimento.(2) Come aumentare la potenza senza cambiare la dimensione dei due campioni? Con quali ulteriorieffetti?

Tabella 3: Rendimento lavorativo di due campioni di segretarie.Con SUPERLAV 36 49 48 55

Senza SUPERLAV 54 43 39

10.2 Soluzioni

(A)Pro[0 botti] = 0.099774

P [C2|un solo scoppio] =0.038226

0.175284= 0.21808

(B)

19

Page 20: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Pi : 0.2Pi : 0.4Pi : 0.6Pi : 0.8Pi : 1Qi : 0.06211Qi : 0.1677Qi : 0.3913Qi : 0.6957Qi : 1R : 0.3416

(C)C1Rel: 0.12706C2Rel: 0.16237Cp: 0.22381Tschup: 0.026365

(D)Media1 : 47Media2 : 45.3333Var 1 : 63.3333Var 2 : 60.3333Test stat : 0.276869Valore critico : 3.36493

20

Page 21: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

11 Compito del 02.02.2000

11.1 Testo

(A) La serratura a combinazione di una valigia e composta da due cifre. Per aprire la valigia occorrescegliere un numero tra 1 e 8 sulla prima ed un numero tra 1 e 9 sulla seconda cifra. Avendo a disposizionetre soli tentativi, e verificando l’apertura ad ogni estrazione:(1) Quale e la probabilita di trovare la combinazione estraendo completamente a caso le due cifre per unmassimo di tre volte?(2) Quale e la probabilita di trovare la combinazione estraendo a caso le due cifre per un massimo di trevolte tenendo conto delle combinazioni gia provate?

(B) La serie storica del numero di forme di grana padano richieste al distributore italiano in un semestree riportato in Tabella 1 sotto forma di numeri indice a base fissa (base = sesto mese).(1) Calcolare il numero indice del terzo mese con base uguale al primo mese.(2) Sapendo che il totale del numero di forme richieste nel semestre e di 3340, calcolare il numero dirichieste relative al sesto mese.

Tabella 1: Numeri indice del semestre (M = mese).M1 M2 M3 M4 M5 M6625 633.33 250 666.67 508.33 100

(C) Un macchinario produce chiodi di lunghezza nominale pari a 6 cm. Un campione casuale di 7 chiodie stato misurato per valutare la qualita dei chiodi prodotti. Assumendo un modello di tipo normale perY (lunghezza del chiodo):(1) sottoporre a test l’ipotesi che il valore atteso della lunghezza sia uguale alla lunghezza nominale(α = 0.05);(2) spiegare formalmente come si potrebbe sottoporre a test l’ipotesi che la varianza nella lunghezza deichiodi prodotti sia inferiore of uguale al valore 0.6 verso l’alternativa che sia superiore al suddetto valore.

Tabella 2: Lunghezze (cm) in un campione di 7 chiodi.6.6 4.4 6.6 5.1 6.4 5.8 4.4

(D) In uno studio sulla relazione tra investimento pubblicitario, X, e fatturato aziendale mensile, Y, sonostati registrati i valori relativi ad un campione casuale di 5 aziende (vedi Tabella 3). Ipotizzando che ilfatturato sia assimilabile ad una variabile casuale gaussiana:(1) Rappresentare graficamente i dati in tabella.(2) Assumendo che E[Y ] = β0 + β1X effettuare la stima puntuale dei parametri.(3) Sottoporre a test l’ipotesi che il coefficiente della spesa pubblicitaria sia nullo (α = 0.01).(4) Assumendo che un’azienda investa 167.7 milioni di lire in un certo mese, quale e l’intervallo diconfidenza (livello 0.95) per il valore del fatturato osservabile in tale mese?

Tabella 3: Fatturato osservato (miliardi) per investimento effettuato (milioni).Fatturato 4.78 4.75 4.79 3.13 3.37

Investimento 192 183 188 107 116

11.2 Soluzioni

(A)Pro1 = 0.041091Pro2 = 0.041667

(B)

M1IM3 : 0.4M6 : 120

21

Page 22: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C)Media1 : 5.6143Var 1 : 0.9681Test stat : -1.0372Critical value : 2.44691

(D)β0 = : 1.02893β1 = 0.0199432TeststaT : 25.2531TeststaF : 637.721Prob : 0.000136169Attesa Y : 4.3734IntervInf : 4.14085IntervaSup : 4.60595

22

Page 23: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

12 Compito del 17.02.2000

12.1 Testo

(A) I motori appena assemblati sono sottoposti ad una prova di funzionamento in cui il numero di girispinto al massimo. Se il dispositivo di raffreddamento non funziona correttamente il motore si guasta conprobabilita 0.87. Se il raffreddamento funziona correttamente, il motore si guasta con probabilita 0.11.Sapendo che la probabilita di un guasto al dispositivo di raffreddamento e 0.26:(1) Calcolare la probabilita di esaminare un motore funzionante in cui il dispositivo di raffreddamentofunziona regolarmente.(2) Calcolare la probabilita di trovare il raffreddamento guasto esaminando un nuovo motore che si eguastato durante la prova.

(B) In uno studio condotto su 200 ospedali Americani, e stato riportato il numero di neonati nel 1972 edil numero di avvistamenti di cicogne nel medesimo anno.(1) Calcolare un indice relativo per valutare il grado di associazione tra avvistamenti e neonati.(2) Come interpretare i risultati ottenuti?

Tabella 1: Numero di ospedali classificati per numero di neonati ed avvistamenti.Avvistamenti [0, 50] [51,∞)

Neonati[0, 50] 43 17

[51,∞) 14 126

(C) Un macchinario viene impiegato per riempire di marmellata barattoli di vetro. Mediamente, laquantita di marmellata erogata in un’operazione e di 125 grammi. Assumendo un modello di tipo normaleper Y (grammi erogati), ed impiegando i risultati provenienti da un campione di 7 barattoli (Tabella 2):(1) calcolare l’intervallo di confidenza per la varianza (livello 0.95);(2) spiegare formalmente come si potrebbe sottoporre a test l’ipotesi che la varianza della quantita erogatasia inferiore of uguale al valore 84.7 verso l’alternativa che sia superiore al suddetto valore.

Tabella 2: Grammi di marmellata erogati in un campione casuale di 7 barattoli.110 111.7 113.3 141.7 117.3 132.8 134.4

(D) Una moneta e stata ripetutamente lanciata a turno da 200 individui fino ad ottenere il primo esito ditipo testa. In Tabella 3 e riportato il numero di insuccessi X prima di osservare testa (dati raggruppati).Sottoporre a test (α = 0.05) l’ipotesi che la forma della distribuzione di X sia geometrica con parametroπ = 0.41 (probabilita di osservare testa).

Tabella 3: Frequenze assolute degli individui per classi di numero di insuccessi.Frequenze 49 67 84

Numero di insuccessi 0 1 [2,∞)

12.2 Soluzioni

(A)(1) P (M

⋂R) = P (M |R)P (R) = (1− 0.11) ∗ (1− 0.26) = 0.6586

(2) P (R|M) =P (M |R)P (R)

P (M)=

0.87 ∗ 0.26

0.3076= 0.73537

(B)C1rel : 0.518C2rel : 0.626CHI2 : 78.38

23

Page 24: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Tschu : 0.3919

(C)VarStim : 146.59l1 : 64.084l2 : 607.24Chisq1 : 1.6899Chisq2 : 16.013

(D)Attesa 0 = 82Attesa 1 = 48.38Attesa > 1 = 69.62Valore campionario della statistica test = 23.4169regione critica = (5.99146,+∞)

24

Page 25: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

13 Compito del 03.05.2000

13.1 Testo

(A) Uno studente decide di recarsi negli Stati Uniti, acquistando il biglietto meno costoso. La probabilitache tale biglietto sia della compagnia AIR FRANCE e uguale a 0.27, che sia della KLM e 0.1, che siadi altre compagnie e 0.63. La probabilita che il bagaglio dello studente sia irreparabilmente danneggiatodurante il viaggio aereo e uguale a 0.92 se il biglietto e di AIR FRANCE, oppure 0.12 se della KLM o dialtre compagnie. La probabilta di ricevere pieno risarcimento dato un danno irreparabile e uguale a 0.88se il biglietto di AIR FRANCE, mentre e 0.7 con biglietto KLM oppure di altre compagnie.(1)Quale la probabilita che lo studente effettui il viaggio con AIR FRANCE, riscontri un danno irrepa-rabile al bagaglio e riceva pieno risarcimento?(2) Sapendo che lo studente, effettuato il viaggio, ha riscontrato danni irreparabili al bagaglio, quale e laprobabilita che abbia viaggiato con AIR FRANCE ?

(B) La compagnia AEROFLOP durante il 1999 ha venduto un totale di 2001 biglietti aerei Firenze-SanFrancisco. In Tabella 1 sono riportati i numeri di biglietti venduti per classe di viaggio: super economica,economica, famiglia, lavoro, e lusso.(1) Calcolare il primo ed il terzo quartile della distribuzione dei biglietti venduti.(2) Rappresentare graficamente il grado di equidistribuzione delle vendite per tipo di biglietto e calcolareun indice riassuntivo.

Tabella 1: Distribuzione dei biglietti venduti per classe di viaggio (costo in migliaia di lire).Classe: Super Econ. Econ. Famiglia Lavoro Lusso

Costo Biglietto: 870 1050 1350 1600 2500Numero Biglietti: 508 300 134 107 952

(C)La compagnia aerea FASTFLIGHT dichiara di avere venduto nel periodo 1994-1998 meta dei bigliettitransoceanici totali venduti nel mondo. Un campione casuale di 84047 titolari di biglietto stato estrattotra coloro che nel quinquennio citato hanno effettuato voli transoceanici, e 41924 hanno dichiarato di avervolato con FASTFLIGHT. Sottoporre a test statistico la dichiarazione della compagnia FASTFLIGHTin alternativa all’ipotesi che il numero di biglietti venduti sia inferiore al dichiarato (α = 0.05);

(D) Il carburante richiesto da un aereo di tipo JUMBO per compiere un volo di 1000 miglia a pienocarico dipende, tra le altre cose, da quante ore di volo il JUMBO ha effettuato in passato. Il carburanteconsumato Y da un campione casuale di 5 aerei JUMBO stato misurato su di un volo di 1000 miglia apieno carico , e per ogni aereo stato riportato il numero di ore X di volo gi effettuate (Tabella 2).(1) Rappresentare graficamente i dati in tabella.(2) Assumendo che E[Y ] = β0 + β1X effettuare la stima puntuale dei parametri.(3) Quale e il valore atteso del consumo per un aereo JUMBO con 13.9 ore di volo all’attivo?

Tabella 2: Consumo osservato (centinaia di Kg) ed ore di volo (in centinaia).Consumo: 29.9 35.6 29.1 38 26.1

Ore: 19 16 6 17 9

13.2 Soluzioni

(A)Pro1 = 0.21859Pro 2 = 0.73929

(B)Pi : 0.2539Pi : 0.4038Pi : 0.4708Pi : 0.5242Pi : 1

25

Page 26: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Qi : 0.1267Qi : 0.217Qi : 0.2688Qi : 0.3179Qi : 1R : 0.2254

(C)P : 0.49882P0 : 0.5sqrt(P0Q0/n) : 0.0017247Z : -0.68642Zcritico : -1.6449

(D)β0 = 24.6097β1 = 0.532109E[Y] : 32.0061

26

Page 27: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

14 Compito del 06.06.2000

14.1 Testo

(A) Uno pescatore sportivo si reca al lago GETFISH a pescare trote. Un pescatore della zona riferisce chesi pescano mediamente 3 trote in due ore. Si assuma che il numero di pesci pescati in intervalli di temponon sovrapposti siano indipendenti e che il numero medio di pesci pescati in un intervallo di tempo siaproporzionale alla sua ampiezza. Quanti minuti il pescatore sportivo deve dedicare alla pesca per pescarealmeno una trota con probabilita 0.84?

(B) La probabilita di pescare trote al lago GETFISH in una giornata dipende dal clima. Siano definiti glieventi: W = clima piovoso, C = piu di 15 kg di pesce pescati, T = pescato contenente trote. Impiegandoi dati riportati in Tabella 1, calcolare:(1) La probabilita di pescare trote in una giornata piovosa.(2) La probabilita che la giornata sia piovosa sapendo che vi sono trote tra il pesce che e stato pescato.

Tabella 1: Tavola dei valori di probabilita per diverse combinazioni di eventi.Evento Probabilta

W ∩ C ∩ T 0.423W ∩ C ∩ T 0.1795W ∩ C ∩ T 0.1813W ∩ C ∩ T 0.0769W ∩ C ∩ T 0.0294W ∩ C ∩ T 0.0125W ∩ C ∩ T 0.0685W ∩ C ∩ T 0.0291

(C) La quantita di pesce (in Kg) pescata in una giornata sul lago GETFISH da un pescatore sportivoe assimilabile ad una variabile casuale Gaussiana. In Tabella 2 sono riportati i Kg di pesce pescati daun campione casuale di 4 pescatori sportivi che impiegano la canna da pesca SUPERFISHING, ed i Kgpescati da un campione casuale di 4 sportivi che usano la canna BADFISHING.Sottoporre a test statistico l’ipotesi che non ci siano differenze di pescato imputabili alla scelta dellacanna da pesca (α = 0.05 e medesima varianza σ2 incognita).

Tabella 2: Peso in Kg del pescato da due campioni di sportivi.SUPERFISHING 17.28 22.76 16.65 19.87BADFISHING: 17.61 22.84 22.5 19.6

(D) Il lago GETFISH contiene principalmente 3 tipi di pesce: trota, pescegatto, alborella. In Tabella3 e riportata la distribuzione di frequenze relativa ad un campione di pesci la cui grandezza e 4607.Sottoporre a test (α = 0.05) l’ipotesi che le probabilita di pescare una trota, un pescegatto, un alborellasiano rispettivamente uguali a 0.2, 0.1, 0.5.

Tabella 3: Distribuzione di frequenze in un campione di pesci.Trota Pescegatto Alborella Altro

Osservata 1073 462 966 2106Ipotizzata 0.2 0.1 0.5 0.2

14.2 Soluzioni

(A)Numero di minuti: 73.3

(B)Prob[W ∩ T ] : 0.6043Prob[W | T ] : 0.8606

27

Page 28: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C)Differenza medie : -1.4975Denominatore : 1.8677statistica t empirica : -0.80179t tabellato : 2.4469

(D)Attesa T = 921.4Attesa P = 460.7Attesa A = 2303.5Attesa Altro = 921.4Chi = 2324.53Valore critico = 7.81473

28

Page 29: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

15 Compito del 22.06.2000

15.1 Testo

(A) Il numero di clienti serviti nella pizzeria PIZZAFLAT in 2 giorni lavorativi e assimilabile ad unavariabile casuale di Poisson con media 68. Assumendo che vi siano 25 giorni lavorativi in un mese:(1) Calcolare il coefficiente di variazione del numero di clienti serviti in un mese.(2) Calcolare la probabilita che in un mese siano serviti meno di 821 clienti o piu di 879 clienti ricorrendoad una conveniente approssimazione.

(B) La pizzeria PIZZAFLAT ha commissionato un’indagine per conoscere le preferenze dei potenzialiclienti. In un campione casuale di 7360 consumatori abituali, gli intervistati hanno indicato la propriapreferenza e la propria eta (Tabella 1).(1) Il tipo di pizza preferita dipende dall’eta del cliente?(2) Quale e la probabilita che un cliente chieda una pizza margherita dato che la sua eta e un puntonell’insieme 16, ..., 25 anni?

Tabella 1: Distribuzione degli intervistati per classe di eta e preferenza di pizza.Pizza margherita Altre pizze

≤ 15 295 44216, ..., 25 736 2944

> 25 293 2650

(C) Nella pizzeria PIZZAFLAT, il miscelatore di impasto deve erogare una quantita nominale di lievitopari a 7 grammi per pizza. In Tabella 2 sono riportati i grammi di lievito per pizza misurati in uncampione casuale di 5 pizze. Assumendo che la variabile grammi erogati sia assimilabile ad una variabilecasuale Gaussiana:(1) Sottoporre a test statistico l’ipotesi il miscelatore funzioni correttamente (α = 0.05).(2) Come regolereste teoricamente il dispositivo (media e varianza) per minimizzare i costi di produzionedovuti al lievito?

Tabella 2: Quantita di lievito per pizza (in g) in un campione casuale di 5 pizze.3.08 3.56 4.92 4.12 4.09

(D) Si assuma che il fatturato della pizzeria PIZZAFLAT nell’anno 2001 dipenda solo da tre scenarirelativi all’economia del paese: recessione (R), stasi (S), espansione (E). Per ognuno degli scenari, ilfatturato di PIZZAFLAT nel trimestre gennaio-marzo e assimilabile ad una variabile casuale gaussianacon varianza 260 e con media µR = 50.6, µS = 100.5, µE = 250.6. Ammettendo che al termine del primotrimestre PIZZAFLAT abbia fatturato 91.5 milioni:(1) Valutare la bonta dell’ipotesi R (α = 0.05).(2) Calcolare la probabilita che lo scenario sia di tipo S, ammettendo che a priori le probabilita diverificarsi degli scenari siano rispettivamente P [R] = 0.2, P [S] = 0.3 e P [E] = 0.5.

15.2 Soluzioni

(A)Coefficiente di variazione: 0.0343Probabilita evento (via Gaussiana): 0.3199

(B)C1rel : 0.1285C2rel : 0.2277CHI2: 381.4436Probab. : 0.2

(C)

29

Page 30: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Media : 3.954Dev.std : 0.6889Statistica t empirica : -9.8869t Student : 2.7764

(D)Likelihood R : 0.000991569Max Lik.denom : 0.0211726Loglikelihood Rapporto (LR): 0.0468327-2 LR = 6.12235Valore critico = 3.84146P [S|x] =0.969723

30

Page 31: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

16 Compito del 12.09.2000

16.1 Testo

(A) Un investitore decide di comperare azioni sul mercato petrolifero. Il numero di azioni che riesce arastrellare assimilabile ad una variabile casuale X che assume valori 1000,3000,5000 con funzione dimassa di probabilit: p(X=1000) = 0.413, p(X=3000) = 0.421, p(X=5000) = 0.166. Si assuma che ad unanno di distanza una singola azione renda una valore Z, variabile casuale che assume valori 1.1,1.3,1.6con funzione di massa di probabilit: p(Z=1.1) = 0.29, p(Z=1.3) = 0.292, p(Z=1.6) = 0.418. Assumendoche il valore ad un anno sia dato da Y = Z ·X, e che Z ed X siano indipendenti:(1) Trovare la funzione di massa di probabilita di Y .(2) Calcolare il valore atteso ed il coefficiente di variazione di Y .

(B) Il mercato petrolifero dominato da 7 compagnie, che producono barili (in milioni) secondo quantoriportato in tabella.(1) Calcolare la concentrazione.(2) Rappresentare la Curva di Lorentz.

OilAsia OilAfrica CheapOil MixOil PexOil PetrOil SineOil24 384 162 492 450 96 401

(C) Una compagnia di trivellazione effettua uno studio per valutare la profondit a cui situato il petrolio.Impiegando 5 metodi diversi, ottiene i valori in tabella.

i=1 2 3 4 51379.8 1380 1382.2 1380.9 1381.3

Impiegando i risultati in tabella:(1) si assuma il modello yi = µ+ εi in cui µ la vera profondit e εi l’errore commesso dal i-esimo metodoche fornisce l’indicazione yi; stimare µ con i minimi quadrati.(2) Sottoporre a test (α = 0.1) l’ipotesi µ = 1350 metri, assumendo che la distribuzione degli errori(indipendenti) sia N(0,1).

(D) Si assuma che la profondit a cui si guastano le trivelle di perforazione petrolifera sia assimilabile aduna variabile casuale Gaussiana, come media µ e varianza σ2. Se il coefficiente di variazione costante epari a 2.4%:(1) Quanto deve essere grande il campione perch l’informativit dell’intervallo di confidenza (livello 0.95)sia almeno pari a 15.7 se la µ = 883?(2) Come cambierebbe il risultato ottenuto in (1) se il valore della media fosse 883 + 100?

16.2 Soluzioni

(A)Valori : 1100,3300,5500,1300,3900,6500,1600,4800,8000Probabilita : 0.11977,0.12209,0.04814,0.120596,0.122932,0.048472,0.172634,0.175978,0.069388Attesa : 3427CV : 60.135

(B)Pi : 0.14286,0.28571,0.42857,0.57143,0.71429,0.85714,1Qi : 0.011946,0.059731,0.14037,0.33151,0.53111,0.7551,1R : 0.39008

(C)Media: 1380.8Denominatore : 0.44721

31

Page 32: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Statistica Z empirica : 68.96Z critico : 1.6449

(D) Nota: il CV nel testo espresso in percentuale, cio CV = 2.4%.Dimensione campione 1: 27.997Dimensione campione 2: 34.698

32

Page 33: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

17 Compito del 28.09.2000

17.1 Testo

(A) In uno studio sulla qualit dei panettoni prodotti da un’azienda, un campione casuale di 400 panettonistato analizzato contando il numero di canditi ed il numero di uvette presenti per panettone. Impiegandoi dati riportati in tabella :(1) Quantificare il grado di associazione presente tra le due variabili.(2) Saggiare l’ipotesi che la dipendenza statistica sia nulla (α = 0.05).

Canditi: [0, 50] (50,200]Uvette:[0, 50] 70 20

(50, 200] 40 270

(B) Il processo di cottura dei panettoni causa la diminuzione del peso. Per studiare il fenomeno, uncampione casuale di 5 panettoni stato pesato prima della cottura e dopo la cottura. Impiegando i datiin tabella:(1) Effettuare la stima puntuale della diminuzione media di peso.(2) Saggiare l’ipotesi che la diminuzione di peso sia superiore a 141 (con α = 0.05), assumendo la normalitdella variabile casuale oggetto di studio.

Prima: 995 1007 1014 1003 994Dopo: 831 856 797 767 778

(C) Il peso dei panettoni prodotti da una macchina industriale assimilabile ad una variabile casualegaussiana. La certificazione di qualit del processo produttivo richiede che la probabilit di ottenere unpanettone di peso inferiore a 1415.7 sia pari a 0.01.(1) Assumendo che la varianza sia 17, come regolare il processo produttivo perch sia soddisfatto il requisitodi certificazione ed al contempo il costo del prodotto sia minimo?(2) Se un panettone di peso inferiore alla soglia viene pagato lire 12500 e un panettone di peso superiorealla soglia viene pagato 18500, quale il valore atteso del pagamento per un generico panettone ?

(D) Due macchinari M1 ed M2 producono panettoni. Il numero medio di canditi per Kg di panettonepari a 21.5 per il macchinario M1 e 31.5 per M2.(1) Quale il valore atteso del numero di canditi in un generico panettone da 2.250 Kg prodotto dalmacchinario M2?Un panettone di 1.323Kg risulta bruciato al termine della lavorazione e l’esame rivela che contiene 27canditi (bruciati). Assumendo che su 100 panettoni prodotti, 68 escano dal macchinario M1:(2) Quale la probabilit che il panettone bruciato e sottoposto ad esame sia stato prodotto dal macchinarioM1?

17.2 Soluzioni

(A)(1) C2: 0.60671C1: 0.4525C1rel: 0.4525C2rel: 0.60671CHI2: 147.238795CP: 0.518708Tschu: 0.368097(2) Chiempi: 147.238795Val.Critico: 3.841459

(B)Stima : -196.8Statistica t : 3.3689P.Value : 0.014036

33

Page 34: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C)Media: 1425.291778Attesa:18440

(D)Attesa: 70.875Probabilit a posteriori: 0.97519

34

Page 35: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

18 Compito del 15.12.2000

18.1 Testo

(A) La compagnia di assicurazione ASSOSIC ha promosso uno studio sull’associazione esistente tra statodi salute e preferenza alimentare. Impiegando i risultati riportati in Tabella 1:(1) Calcolare un adeguato indice di interconnessione.(2) Ricavare la distribuzione condizionata (frequenze relative) della preferenza alimentare data la modalit‘Sano’ dello stato di salute.

Tabella 1: Numero di persone per stato di salute e preferenza alimentare.Preferenza alimentare: Dolce Salato Piccante

Stato di salute:Sano 10 40 20

Malato 10 4 50

(B) A met del ciclo produttivo, un lotto di sugo BELMONTE ha un valore di acidit che assimilabilead una variabile casuale normale con media 4.5 e coefficiente di variazione (non espresso in percentuale)0.2222. Se l’acidit compresa tra 3.2 e 8.23 allora il lotto viene trattato termicamente, altrimenti essoviene scartato. Se l’acidit di un lotto compresa tra 4.86 e 6.19 allora il lotto inscatolato con marchioGRANDE CHEF dopo trattamento termico.(1) Quale la probabilit che un lotto sia inscatolato?(2) Quale la probabilit che un lotto sia trattato termicamente ma non inscatolato GRANDE CHEF?

(C) Il numero di scatole di conserva (in migliaia) prodotte da un macchinario HIGHSCAT in una setti-mana assimilabile ad una variabile casuale gaussiana. Un campione casuale di 6 macchinari ha fornito idati settimanali riportati in Tabella 2.(1) Effettuare la stima per intervallo della media (livello di confidenza 0.99) e calcolare l’informativit.(2) Quale elemento pivotale si potrebbe usare per calcolare la stima intervallare della varianza, sesapessimo che la media 4?

Tabella 2: Numero di scatole di conserva (in migliaia).4.6 3.6 2.6 3.6 4.6 2.6

(D) Il numero medio quadrimestrale di reattori venduti da un funzionario pari a 1.6. Il numero dicollaboratori che l’azienda in media mette a disposizione del funzionario in un certo anno pari 5 se nelprecedente anno il funzionario ha venduto 2 o pi reattori altrimenti uguale a 2.8. Si assuma l’indipendenzadi eventi riferiti ad intervalli di tempo non sovrapposti e la linearit della media rispetto all’ampiezzadell’intervallo di tempo.(1) Sapendo che il funzionario ha venduto nei 3 quadrimestri rispettivamente 0, 2, 1 reattori, Quale laprobabilit che al funzionario siano assegnati il successivo anno 0 oppure 1 collaboratore?(2) Sapendo che per il 2001 l’azienda ha assegnato un numero di collaboratori ≤ 1, quale la probabilitche il funzionario abbia venduto nel 2000 un numero di reattori ≥ 2?

18.2 Soluzioni

(A)(1) C2: 0.5607C1: 0.507908C1rel: 0.507908C2rel: 0.5607CHI2: 42.127493CP: 0.489068Tschu: 0.314384Freq. condiz: 0.14286 Freq. condiz: 0.57143 Freq. condiz: 0.28571

(B)

35

Page 36: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

R1 : 0.31391R2 : 0.58921

(C)Media: 3.6Devianza: 4Varianza: 0.8scarto: 0.894427t stud.: 4.03214Estremo1: 2.12767Estremo2: 5.07233Informativit: 2.94466

(D)Lambda anno: 4.8Probabilit (1): 0.040428Probabilit (2): 0.7773

36

Page 37: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

19 Compito del 15.01.2001

19.1 Testo

(A) Un carico di rottame metallico che giunge nella fonderia THESTEEL viene pesato con una delle 3bilance (B1,B2,B3) e quindi viene mandato ad uno dei due forni (F1, F2) per la fusione. Impiegando idati relativi all’anno 2000 (Tabella 1):(1) Quale la probabilit che un carico sia pesato con B3 e fuso con F2?(2) Sapendo che un carico stato fuso con F2 quale la proabilit che sia stato pesato con B3?

Tabella 1: Numero di carichi di rottame del 2000 classificati per macchinario di pesatura e forno difusione.

Macchinario: B1 B2 B3Forno:

F1 1100 2200 560F2 2000 290 1000

(B) Nella fonderia THESTEEL, durante il 2000, sono stati impiegati 5 macchinari per produrre acciaio.Nel medesimo anno, ogni macchinario ha richiesto un certo numero di interventi di riparazione (Tabella2).(1) Valutare il grado di equidistribuzione del numero di interventi mediante un opportuno indice.(2) Effettuare una rappresentazione grafica adeguata all’indice riassuntivo calcolato in (1)

Tabella 2: Numero di interventi effettuati per i macchinari M1, M2, M3, M4, M5.Macchinario: M1 M2 M3 M4 M5

Numero Interventi: 13 37 19 104 6

(C) Nella fonderia THESTEEL, un forno di fusione funziona a carbone. La quantit di carbone richiestaper un carico di rottami metallici assimilabile ad una variabile casuale gaussiana. Un campione casualedi 3 fusioni ha fornito i dati riportati in Tabella 3.(1) Effettuare la stima per intervallo della media (livello di confidenza 0.90). Effettuare nuovamente lastima per intervallo della media (livello di confidenza 0.90) assumendo che la varianza sia uguale a 0.36.(2) Impiegare gli intervalli ottenuti per effettuare il test delle ipotesi che la media sia uguale a 29.82.

Tabella 3: Tonnellate di carbone.30 13 13

(D) Un forno di fusione nella fonderia THESTEEL produce una colata che pu contenere impurit. L’am-ministratore della THESTEEL dichiara che 60% delle colate contiene impurit. Per saggiare quantodichiarato, stato esaminato un campione di 150 colate, e 85 sono risultate contenere impurit.(1) Saggiare l’ipotesi che il valore dichiarato dall’amministratore sia il valore esatto (α = 0.1), conalternativa che il valore sia di 57.5 %.(2) Calcolare la potenza del test.

19.2 Soluzioni

(A)Prob. marginale forno: ; 0.53986 ; 0.46014Prob. marginale macchin.: ; 0.43357 ; 0.34825 ; 0.21818Congiunta F1 by macch.: ; 0.15385 ; 0.30769 ; 0.078322Congiunta F2 by macch.: ; 0.27972 ; 0.040559 ; 0.13986(1) Prob.: 0.13986(2) Denominatore: 0.46014Prob.: 0.30395

37

Page 38: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B)Pi : 0.2Pi : 0.4Pi : 0.6Pi : 0.8Pi : 1Qi : 0.03352Qi : 0.1061Qi : 0.2123Qi : 0.419Qi : 1R : 0.6145

(C)Media: 18.6667Varianza: 96.3333Dev.std: 9.81495t-stud: 2.91999Estremo1-t: 2.12008Estremo2-t: 35.2133Dev.std nota: 0.6Z: 1.64485Estremo1-z: 18.0969Estremo2-z: 19.2365

(D)Media0: 90Varianza0: 36Devstd0: 6Z critico: -1.2816Z empirico: -0.83333Valore critico conteggio: 82.311Media1: 86.25Varianza1: 36.656Devstd1: 6.0544Potenza: 0.25764

38

Page 39: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

20 Compito del 31.01.2001

20.1 Testo

(A) L’azienda SOLAS produce lampadine da alimentare a 220 Volt. In un test condotto su 10000lampadine alimentate a 330 Volts, ci si aspetta che si guastino 2.8 lampadine in due ore.(1) Per quanti minuti si puo proseguire nell’esperimento perche la probabilita che non si guastinolampadine sia 0.11?(2) Specificare le assunzioni impiegate per ottenere la risposta a (1).

( B ) La SOLAS possiede 3 stabilimenti per la produzione di lampadine da 60 W. La Tabella 1 ripor-ta il numero di contratti effettuati dai tre stabilimenti nei 3 quadrimestri del 2000 (1,2,3). Calcolareun’adeguato indice di interconnessione e spiegare brevemente il risultato ottenuto.

Tabella 1: Numero di ordini per stabilimento-quadrimestre.

Quadrimestre 1 2 3Stabilimento

1 5 4 02 2 6 03 0 10 14

(C) La SOLAS produce lampadine da 60 W. In una relazione tecnica inerente l’anno 2000 la direzionedichiara che il coefficiente di variazione percentuale della durata di una lampadina e pari a 3.5 ore. Uncampione casuale di 7 lampadine prodotte nel 2000 ha fornito i dati di durata riportati in Tabella 1.Assumendo un modello di tipo normale per Y (durata di una lampadina) con E[Y ] = 103, effettuare untest statistico per saggiare la bonta di quanto dichiarato nella relazione tecnica (α = 0.05);

Tabella 1: Durata (ore) di un campione di 7 lampadine.106 101 106 107 99 103 102

(D) Il Chief Executive Officer della SOLAS ha analizzato i dati annuali relativi al decennio 1990-1999,stimando il valore dei coefficienti β0 e β1 nel modello di regressione del fatturato annuo (Y , miliardi) sul

numero di settimane annue di pubblicita televisiva (X). Le stime ottenute sono β0 = −22.7 e β1 = 6.2.Sapendo che la devianza residua e risultata pari a 2549.8, e che

∑xi = 151.7,

∑x2i = 2596.9:

(1) Stimare la varianza di β0 e di β1.(2) Calcolare l’intervallo di stima di y quando x = 13.1, assumendo che i termini di errore sianonormalmente distribuiti, indipendenti e con medesima varianza (1− α = 0.95).

20.2 Soluzioni

(A)Numero di minuti: 94.6

(B)C2: 0.757502C1: 0.585366C1rel: 0.439024C2rel: 0.535635CHI2: 23.52619CP: 0.60382Tschu: 0.286905

(C)Varianza : 12.996Test stat.: 4.2321Crit. val. inf : 1.6899

39

Page 40: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Crit. val. sup : 16.013

(D)Var β0 = : 279.995Var β1 = 1.07819Intervallo di stima: (15.058249,101.98175)

40

Page 41: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

21 Compito del 15.02.2001

21.1 Testo

1Un famoso lanciatore di coltelli interpella l’agenzia assicurativa Xsafe per una polizza di responsabilitaprofessionale. Per stabilire il premio, la Xsafe decide di analizzare la seguente serie storica, che riportail numero di incidenti causati da lanciatori di coltelli, durante manifestazioni o allenamenti, in Europanegli ultimi 50 anni.

Anno 1950-59 1960-69 1970-79 1980-89 1990-99Num. incidenti 7208 7064 6199 5406 2811

(a) Costruire la serie di numeri indici a base mobile e commentare i risultati ottenuti.(b) Trasformare la serie di numeri indici a base mobile in quella a base fissa al 1970-79 e commentare irisultati ottenuti.

2E noto che la precisione nel lancio di un coltello dipende dal livello di adrenalina presente nel sangue dellanciatore, che deve essere al di sotto di un certo livello di guardia (LG) nei 5 minuti prima del lancio.In generale, la probabilita che LG sia superato e 0.0513 . Esiste un test che, in pochi secondi, verifica seun individuo supera LG, ma non e completamente affidabile: se un lanciatore supera LG, il test fornisceesito positivo (corrispondente al superamento della soglia) nel 98.99 % dei casi, mentre se un lanciatorenon supera LG, fornisce esito positivo nel 9.01 % dei casi. L’ordine professionale dei lanciatori decidedi utilizzare il test solo se la probabilita che il lanciatore sia sotto il livello di guardia, dato che il test erisultato negativo, e almeno 0.99. Ritenete che l’ordine professionale decidera di utilizzare il test?

3Considerando un esperimento ipotetico in cui si pone il punto di mira sullo 0 di una retta orizzontale,l’errore commesso su tale retta da un lanciatore professionista si distribuisce normalmente con medianapari a 0 ed il terzo quartile pari a 12 cm. Se il lanciatore vuole lanciare il coltello accanto all’orecchiodestro del proprio aiutante, qual e la distanza minima alla quale deve mirare per essere certo di evitaredi colpirlo con probabilita 0.9912 ?

4L’assicurazione Xsafe scopre che la maggioranza dei lanciatori di coltelli italiani proviene da due scuole:la Cut&Kill e la Cross–eyed. Decide quindi di analizzare due campioni casuali composti, rispettivamente,da 68 e 112 lanciatori estratti dalle due scuole, ai quali e chiesto di effettuare un lancio verso un bersaglioimmobile. Viene quindi misurato l’errore (X) commesso rispetto alla direzione orizzontale, ottenendo iseguenti risultati.

Media campionaria Varianza campionaria correttaCross–eyed 1.078 18Cut&Kill 1.864 20

Verificare con un test opportuno l’ipotesi che i lanciatori della Cross–eyed sbaglino meno di quelli dellaCut&Kill (con α = 0.05) e specificare quali assunzioni si ritengono necessarie.

21.2 Soluzioni

1

Anno 1950-59 1960-69 1970-79 1980-89 1990-99

t−1It - 98.00 87.75 87.21 52.00

70−79It 116.28 113.95 100.00 87.21 45.35

41

Page 42: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

2P (< LG|−) =0.9994

3σ = 17.7912Distanza minima = 42.2552 cm.

4test unilaterale con H1: µ1 < µ2

Testoss =-1.165 zα =-1.645Accetto H0

42

Page 43: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

22 Compito del 06.04.2001

22.1 Testo

(A) Un broker effettua un investimento. Si considerino gli eventi A1 = “investimento molto produttivo,e A2 = “investimento produttivo, con A1 ⊆ A2.Sapendo che la probabilit di effettuare un investimento molto produttivo pari a 0.0967 e che l’investimentisia produttivo 0.6050:(1) Calcolare la probabilit che si realizzi l’evento E1 = A1 ∩A2.(2) Calcolare la probabilit che si realizzi E2 = A1 ∩A2 (spiegare).

( B ) L’ammontare (miliardi) delle fatture protestate alla SuperBroker nel quinquennio 1990-1994 ripor-tato in Tabella 1.

Tabella 1: Ammontare (miliardi delle fatture protestate).

1990 1991 1992 1993 199414 19 9 12 22

(1) Calcolare i numeri indici a base mobile (NON PERCENTUALI) per il quinquennio considerato.(2) Calcolare un’opportuna media dei valori degli indici calcolati al punto (1).

(C) In una valutazione comparativa, le capacit previsive di due dipendenti (A e B) della SuperBroker sonostate messe a confronto. Ogni dipendente esprime il valore che prevede assumeranno 5 titoli di riferimentoin borsa dopo 180 giorni. In Tabella 2, sono riportati gli scostamenti zA,i e zB,i, con i = 1, . . . , 5, deivalori previsti da quelli effettivamente realizzati. Assumendo (!) che le variabili casuali zA,i e zB,i sianoindipendentemente ed identicamente distribuite come normali con media 0 e varianza rispettivamentepari a σ2

A e σ2B :

(1) Quantificare la precisione previsiva dei dipendenti A e B mediante una opportuna statistica campio-naria.(2) Sottoporre a test l’ipotesi che la precisione di A sia identica a quella di B. (α = 0.01)

Tabella 2: Scarti dal valore realizzato dei titoli.A 3.11 0.06 0.32 -1.74 2.91B -3.04 8.36 -4.28 10.59 -7.19

(D) Alla SuperBroker si desidera investigare sull’ammontare delle spese sostenute nel 2000 dalle famiglieitaliane per spostamenti effettuati mediante la societ FRENITALIA. Assumendo che la spesa annuale(centinaia di migliaia di lire) relativa agli spostamenti per una generica famiglia italiana sia assimilabilead una variabile casuale normale con varianza 40.03:(1) Determinare il numero di famiglie da intervistare per ottenere un intervallo di confidenza la cuiinformativit sia 10 e per il quale la affidabilit sia 0.99.(2) Se la varianza fosse ignota, come cambierebbe l’informativit?

22.2 Soluzioni

(A)(1) P [E1] = 0.5083(2) P [E2] = 0.0967

(B)(1)Indici = 1.357, 0.474, 1.333, 1.833(2) Geometrica = 1.119; Aritmetica = 1.249

(C)(1) Varianza con denominatore 5 : 4.25, 52.28(2) Statistica test F: 0.081Valori critici F5,5 = 0.07, 14.94

43

Page 44: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(D)(1) z = 2.57, n = 11

44

Page 45: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

23 Compito del 07.06.2001

23.1 Testo

(A) La quantit di conservante presente in un campione di n = 10 bottiglie di succo di frutta risultatapari a: 12 , 12 , 19 , 15 , 20 , 24 , 24 , 23 , 12 , 12.(1) Calcolare la moda e la mediana.(2) Costruire l’istogramma di frequenze relative con intervalli di base pari a [10, 19.5), [19.5, 22.5),[22.5, 28].

(B) Nel laboratorio chimico ANACHEM la funzione di massa di probabilit relativa all’errore X commessoquantificando il contenuto di mercurio in una soluzione standard ha valore 0.2216 in x = −0.25, e 0.7784in x = 0.25. Per un campioni casuali di 3 misurazioni:(1) Ricavare la distribuzione campionaria del massimo campionario degli errori.(2) Calcolare il valore atteso e la varianza della statistica al punto (1).

(C) Al laboratorio ANACHEM, si effettua uno studio sulla presenza di metanolo in un campione di 3bottiglie di vino (Tabella 1). Il vino di ogni bottiglia viene esaminato con il metodo 1 (senza filtro) e conil metodo 2 (con filtro). Assumendo che la concentrazione di metanolo sia assimilabile ad una variabilecasuale gaussiana :(1) Saggiare statisticamente l’ipotesi che i due metodi non comportino differenze (prob. errore I tipo =0.01) in alternativa a che la media per il metodo 2 sia maggiore a quella del metodo 1.(2) Assumendo che la varianza delle differenze sia σ2 = 4, calcolare la potenza del test (α = 0.05) in cuil’alternativa prevede che la differenza tra media del metodo 2 e media del metodo 1 sia pari a 5.

Tabella 1: Contenuto di metanolo con due metodi.

Metodo 1: 19.7 21.1 18.7Metodo 2: 23.3 26.4 24.9

(D) Alla ANACHEM si desidera investigare sulla valore medio di antibiotico bovino presente in cartonidi latte da 1 litro. Assumendo che la variabile ‘contenuto di antibiotico’ sia assimilabile ad una gaussianacon varianza 10:(1) Determinare il numero cartoni da esaminare per ottenere un intervallo di confidenza la cui informativitsia 3.7 e per il quale la affidabilit sia 0.99.(2) Cosa cambierebbe nei calcoli precedenti se la varianza fosse ignota?

23.2 Soluzioni

( A )Moda : 12Mediana : 17H1 : 0.063158H2 : 0.033333H3 : 0.054545

(B)x = -0.25 : 0.01088x = 0.25 : 0.9891Media : 0.2446Varianza : 0.002691

(C)Diff medie: 5.03333Varianza: 1.74333Dev.std: 1.32035t-empirico: 6.60277t-critico: 6.96456

45

Page 46: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

d-critico 1.64485potenza: 0.977453

(D)Numero di cartocci: 20

46

Page 47: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

24 Compito del 26.06.2001

24.1 Testo

(A) Alla NetIntern si effettua uno studio sul numero di accessi alle pagine Web in base alla fascia orariaed al tipo di pagina (Tabella 1).(1) Valutare quantitativamente l’interconnessione.(2) Quale la moda della distribuzione condizionata alla fascia oraria del pomeriggio?

Tabella 1: Numero di accessi per fascia oraria ed argomento.Fascia oraria: mattino pomeriggio notteArgomento:

Sport 10 50 20Altro 7 2 40

(B) Alla NetIntern, uno studio estensivo effettuato su 575000 pagine Web ha rivelato che solo 163 paginetrattano di criptogeni. Assumendo che all’avvio del programma di accesso al Web venga selezionatacasualmente una pagina:(1) Quale la probabilit che in un avvio non compaia l’argomento criptogeni?(2) Quale la probabilit che su trecento accensioni pi di una selezioni l’argomento criptogeni?

(C) In uno studio estensivo la NetIntern ha valutato che il tempo medio di connessione via modem di unutente serale pari a 42 minuti. Per quantificare la variabilit del fenomeno, la NetIntern ha misurato iltempo di connessione di un campione casuale di 3 utenti come scostamento dalla media 42. Ha ottenutoi valori: 1.7, -1, 0 minuti. Impiegando i risultati dello studio:(1) Effettuare la stima puntuale della varianza.(2) Effettuare la stima per intervallo del coeff. di variazione percentuale (livello di confidenza = 0.95).

(D) Alla NetIntern si desidera investigare sulla velocit di trasmissione dati ottenuta impiegando dueprotocolli software differenti, ALFA e BETA. Sui calcolatori di un un campione casuale di 3 centri dicalcolo sono stati installati i due software, e si sono ottenuti i valori di velocit riportati in Tabella 2.(1) Saggiare statisticamente l’ipotesi che i due software non comportino differenze di velocit (prob. erroreI tipo = 0.01) in alternativa a che vi siano differenze.(2) Assumendo che la varianza delle differenze sia σ2 = 4, calcolare la potenza del test (α = 0.05) in cuil’alternativa prevede che la differenza sia pari a 5.

Tabella 2: Tempi di trasmissione.

ALFA: 19.7 17.9 20.3BETA: 24.3 27.3 26.1

24.2 Soluzioni

(A)(1) C2: 0.602026C1: 0.550448C1rel: 0.550448C2rel: 0.602026CHI2: 46.754161CP: 0.515771Tschu: 0.25628Riga contenente: 50

(B)Prob 1 : 0.9997Prob 2 : 0.003418

(C)S2 : 1.29667

47

Page 48: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Intervallo CV = [0.015359,0.101089]

(D)Diff medie: 6.6Varianza: 6.24Dev.std: 2.498t-empirico: 4.57628t-critico: 9.92484d-critico 1.64485potenza: 0.99638

48

Page 49: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

25 Compito del 11.07.2001

25.1 Testo

(A) La compagnia UNPROFIT ha ricevuto sottoscrizioni per sovvenzionare gli interventi sanitari in sudAfrica. In Tabella 1 sono riportati i valori delle sottoscrizioni e le frequenze assolute dei versamenti.(1) Calcolare il rapporto di concentrazione R.(2) Rappresentare la spezzata di Lorenz (diagramma).

Tabella 1: Distribuzione delle sottoscrizioni (milioni di lire).Valore sottoscrizione : 0.500 1 0.250 10 5Numero Versamenti: 501 350 119 169 862

(B) Alla UNPROFIT si ricevono sottoscrizioni per interventi sanitari in sud Africa. La probabilit diricevere una sottoscrizione pari a X ≤ x data dalla funzione in Tabella 2.(1) Calcolare la differenza interquartile.(2) Calcolare la probabilit che un versamento abbia valore inferiore-uguale a 0.300 oppure sia superiorea 2.5.

Tabella 2: Probabilit dell’evento X ≤ x (milioni di lire).Probabilit Intervallo della x0 + 2.6 · x [0,0.05)

0.086667 + 0.86667 · x [0.05,0.5)0.50316 + 0.033684 · x [0.5,10)

0.83984 + 1.6016 · 10−5 · x [10, 10000)1.0 [10000,∞)

(C) Alla UNPROFIT stato esaminato un campione casuale di 5 container contenenti granaglia direttain sud Africa. Il peso in tonnellate risultato pari a: 60, 62, 52, 63, 65. Assumendo che il peso di ognicontainer sia assimilabile ad una variabile casuale gaussiana con momento secondo rispetto all’originepari a 5000:(1) Saggiare statisticamente l’ipotesi che mediamente un container pesi 70 tonnellate (prob. errore I tipo= 0.1) in alternativa a che la media sia inferiore a 70 tonnelate.(2) Calcolare il p-value della statistica media campionaria.

(D) Alla UNPROFIT stato effettuato uno studio sulla propensione ai versamenti di solideriat per la salutein sud Africa. In nord Italia 3052 intervistati su 12992 hanno dichiarato di effettuare annualmente versa-menti. Al sud, 3161 intervistati su 15993 hanno dichiarato di effettuare versamenti annuali. Assumendoche i due campioni siano casuali:(1) Effettuare un test statistico per saggiare se vi siano differenze tra propensione al nord ed al sud Italianei confronti dei versamenti annuali (α = 0.07).(2) Se l’interesse si fosse limitato a due piccoli paesi, il primo situato in nord Italia e costituito di 39abitanti, il secondo al sud con 18 abitanti, ed i campioni fossero stati di 5 e di 7 persone, come si sarebbedovuto procedere per effettuare il test?

25.2 Soluzioni

(A)Pi : 0.05947Pi : 0.3098Pi : 0.4848Pi : 0.9155Pi : 1Qi : 0.004487Qi : 0.04227

49

Page 50: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Qi : 0.09506Qi : 0.7451Qi : 1R : 0.4547

(B)Q0.75 −Q0.25 : 7.14Prob. : 0.7593

(C)Media: 60.4Varianza: 100Dev.std: 10z-empirico: -2.14663z-critico: -1.28P-value 0.0159116

(D)pnord: 0.2349psud: 0.1976dev.std.diff: 0.00484687z-empirico: 7.69568z-critico: -1.81

50

Page 51: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

26 Compito del 20.09.2001

26.1 Testo

(A) La vasca HOTTUB possiede un dispositivo di riscaldamento dell’acqua. Si definiscano le variabilicasuali seguenti: X riferita al riscaldamento (0 spento, 1 acceso), Y numero di bagnanti in vasca, Zriferita alla presenza di nuvole (0 assenti, 1 presenti). Conoscendo i valori di probabilit per gli eventiriportati in Tabella 1:(1) Quale la probabilit che il riscaldamento sia acceso e che i bagnanti siano 2?(2) Si assuma che la vasca sia aperta 22 ore al giorno e che il numero Y di bagnanti in vasca in unagiornata sia distribuita come una Poisson. Se il riscaldamento acceso, il tasso pari a 0.1 bagnanti per ora,se il riscaldamento spento il tasso 0.1

2 . La probabilit di accensione del riscaldamento a priori pari a 0.6.Avendo saputo che vi sono stati 2 bagnanti in vasca nella giornata del 15 Agosto, quale la probabilit chesia stato acceso il riscaldamento?

Tabella 1: Probabilit di alcuni eventi di interesse.

Evento (X,Y, Z) Prob.(1, 2, 0) 0.0483(1, 2, 1) 0.1126

(B) stato effettuato uno studio per valutare se il dispositivo automatico di riscaldamento dell’acqua nellavasca HOTTUB venga acceso in dipendenza dalla presenza di nuvole in cielo. In Tabella 2 riportato ilnumero giorni in cui stata riscaldata l’acqua con e senza nuvole in cielo, analogamente per i giorni in cuil’acqua non stata riscaldata.

Tabella 2: Numero di giorni per tipologia di giornata e di acqua.

Nuvoloso SerenoRiscaldata 901 230

Non Riscaldata 120 161

(1) Valutare il grado di interconnessione tra riscaldamento e nuvolosit.(2) Come ci si aspetterebbe di modificare Tabella 2 qualora la nuvolosit fosse un antecedente perfetto perspiegare il riscaldamento dell’acqua (esempio: Nuvoloso implica Riscaldamento)?

(C) Un campione casuale di 26 vasche HOTTUB stato esaminato per valutare a quanto ammonta lavariabilit nel numero di ore di funzionamento prima che si guasti una delle guarnizioni della vasca. Lestatistiche campionarie derivate dell’esperimento sono:

∑26i=1 xi = 2625,

∑26i=1 x

2i = 266109. Assumendo

per le variabili casuali Xi una distribuzione di tipo normale:(1) Calcolare il valore del coefficiente di variazione campionario non percentuale.(2) Assumendo che la media di popolazione sia 100 ore, sottoporre a test l’ipotesi che il coefficiente divariazione (non percentuale) della popolazione si pari al 0.045 (α = 0.1) in alternativa a che sia maggioredi tale valore.

(D) La vasca HOTTUB prodotta impiegando una sostanza chimica S che aumenta la resistenza dellasuperficie alla rottura in accordo al modello di regressione lineare semplice Yi = β0 + β1xi + ui, in cuiY il carico di rottura ed X la concentrazione di sostanza S. Si assuma che la varianza d’errore σ2 sianota e pari a 33.3. In uno studio sulla resistenza sono stati scelti tre valori di concentrazione X dellasostanza S: 0.25, 0.5, 0.75 (g/Kg). Impiegando i dati ipotetici di Tabella 3, scegliere il pi conveniente deitre esperimenti in modo che l’intervallo di previsione per x0 = 1 (livello 0.93) abbia informativit ugualeo inferiore a 1.

Tabella 3: Esperimenti sulla resistenza.

Esperimento n x∑i(xi − x)2

E1 250 0.5 982E2 500 0.5 1733E3 1000 0.5 3853

51

Page 52: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

26.2 Soluzioni

(A)(1)Probabilit che il riscaldamento sia acceso e che i bagnanti siano 2: 0.1609(2) Probabilit che il riscaldamento sia stato acceso dato che i bagnanti sono stati 2: 0.6664

(B)(1)C2 = 0.3298, C1 = 0.2357,C1rel = 0.2357, C2rel = 0.3298,CHI2 = 153.6, CP = 0.3132Tschu = 0.1087(2)

Nuvoloso SerenoRiscaldata 1131 0

Non Riscaldata 0 281

(C)(1)Media = 100.9615Varianza = 43.39846Coeff. Variazione Campionario= 0.0652501

(2) Impiegando la media di popolazione, S2 =∑26i=1 x

2i

n − 2µ∑26i=1 xin + µ2, quindi:

la varianza campionaria 42.65385la statistica test Chi quadro 54.76543Chi Quadro critico 35.56317

(D)Per le dimensioni campionarie in gioco il t di Student numericamente indistinguibile dalla normalestandardizzata.z: 1.811911La differenza tra estremi dell’intervallo di previsioneE1: 1.364009E2: 0.968339E3: 0.6824018I due esperimenti E2 ed E3 soddisfano il requisito ma, per quanto noto, E2 il meno costoso in termini dinumero di unit statistiche coinvolte, dunque il prescelto.

52

Page 53: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

27 Compito del 19.12.2001

27.1 Testo

1Sei stato assunto da Blockbuster, dove ti chiedono di decidere quale calendario promuovere per il 2002,tra quello di George Clooney e quello di Brad Pitt. Decidi di intervistare un campione casuale di 453ragazze tra le clienti di Blockbuster, chiedendo loro di scegliere tra l’acquisto di un calendario di GC odi BP: 203 preferiscono GC e 250 BP. (1) Stimare la proporzione di ammiratrici di GC con confidenzapari a 0.99; (2) calcolarne l’informativita.

2Hai cambiato citta e lavoro e sei stato assunto come manager della discoteca GoGo; devi decidere seesporre una gigantografia di GC o BP. Intervisti un campione di 297 ragazze tra coloro che entranouna sera in discoteca, ma qui 193 preferiscono GC e 104 BP. (1) Ti viene un dubbio: la proporzione diammiratrici di GC tra le ragazze clienti di Blockbuster (vedi esercizio 1) e veramente diversa da quelladelle frequentatrici del GoGo, o la differenza osservata e dovuta al caso (fissare α = 0.05)? (2) Arriverestealla stessa conclusione calcolando un intervallo di confidenza?

3Come manager del GoGo, devi analizzare il problema delle risse in discoteca. In una sera a caso, laprobabilita che il buttafuori sia Ugo e pari a 0.320 , che sia Pietro e 0.047 . La probabilita che avvengauna rissa e pari a 0.599 se e di turno Ugo, mentre e pari a 0.364 se sono di turno Pietro o altri buttafuori.La probabilita che la rissa sia prontamente sedata e uguale a 0.860 se e di turno Ugo, mentre e pari a0.836 con Pietro oppure con altri buttafuori. (1) Qual e la probabilita che una sera a caso sia di turnoUgo e non si verifichino risse? (2) Sapendo che la rissa e stata prontamente sedata, quale e la probabilitache sia stato di turno Ugo?

4Finalmente sei stato assunto come direttore delle risorse umane dalla societa FIND. Decidi di effettuareuna verifica sull’assegnazione dei premi di produzione ai dipendenti. La tabella seguente riporta ladistribuzione di frequenza del valore dei premi (in milioni di lire) rispetto al settore di provenienza.

Premi in milioni1 5 10 Totale

Settore A 78 29 15 122Settore B 19 37 88 144Totale 97 66 103 266

(1) Calcolare un indice di connessione tra il valore del premio ed il settore di appartenenza; (2) calcolarela percentuale di variabilita spiegata dalla differenza tra i settori.

27.2 Soluzioni

1p = 0.4481Intervallo di confidenza per p: [0.3879; 0.5083]Informativita = 0.1204

2Test d’ipotesi bilaterale sulla differenza tra proporzioni con H0 : pB − pG = 0.σpB−pG = 0.0373pG = 0.6498Zoss = −5.4117Zcrit = ±1.9600Rifiuto H0

53

Page 54: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

3P(Ugo, nessuna rissa)= 0.128P(Ugo | rissa, sedata) = 0.443

4Si calcola η per la dipendenza in mediaM = 5.4774MA = 3.0574MB = 7.5278devB = 1319.8774 . devW = 2746.4872 . devTOT = 4066.3647η = 0.5697 Variab spiegata = 32.4584 %

54

Page 55: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

28 Compito del 09.01.2002

28.1 Testo

(A) In Tabella 1 sono riportati i numeri indici a base mobile relativi al fatturato dell’azienda TOMATISInc. per il primo semestre del 2000. Si calcoli:

1) il numero indice 1I6 percentuale;2) il fatturato del mese di gennaio 2000, sapendo che il fatturato semestrale pari a 1214.

Tabella 1: Numeri indici percentuali a base mobile del fatturato mensile.Mese 1 2 3 4 5 6Indice - 91 100 100 100 104

(B) Alla TOMATIS Inc. si sta effettuando uno studio per confrontare il costo per minuto della pubblicitin TV. In un campione casuale di 5 regioni stato rilevato il costo in emittenti pubbliche e private comeda tabella seguente:

Tabella 2: Costo per minuto di pubblicit in emittenti private e pubbliche.Private 97 97 98 103 102

Pubbliche 105 108 106 111 111

1) Si calcoli un adeguato indice di associazione.2) Si sottoponga a verifica (α = 0,05) l’ipotesi che non ci siano differenze di costo medio per i due tipi diemittenti, assumendo che la differenza tra i costi sia normalmente distribuita.

(C) Facendo riferimento ai dati della tabella 2 ed assumendo che il prezzo della pubblicit per minu-to nelle emittenti pubbliche Y sia determinato da quello stabilito nelle emittenti private x secondo larelazione,Yi = β0 + β1xi + ei (con gli ei ∼ N(0, σ2) indipendentemente distribuiti):

1) determinare l’intervallo di confidenza per σ2 (livello 0.90);2) cosa cambierebbe in (1) se β0 e β1 fossero noti?

(D) L’introduzione nel 2002 delle nuove norme di sicurezza per il lavoro in aziende conserviere riduceil numero medio mensile di infortuni per 1000 dipendenti da 32.5461 a 0.3079. Per un’azienda di 32dipendenti:

1) valutare la probabilit di avere meno di 2 infortuni in azienda nel 2002;2) sapendo che nel 2001 si sono verificati 2 infortuni e che la probabilit dell’introduzione 0.040, determinarela probabilit che la nuova normativa sia gi stata introdotta nel 2001.

28.2 Soluzioni

(A)1) Dalla relazione 1I6 =1 I22I33I44I55I6 si ha 1I6 percentuale = 94.64.2) Il valore di x1 217.31348.

(B)1) Codevianza = 28.6, Devianze: 33.2, 30.8. Il coeff. di correlazione lineare 0.89438.2) Stima varianza = 1.7. Stima errore standard della differenza = 0.5831. t empirico = 15.0919. t critico= 2.7764.

(C) Dal modello di regressione la stima dei due parametri 22.5723 e 0.8614.1) La somma dei residui al quadrato diviso per sigma2 un χ2

3. Quantili del χ23: 0.3518463 e 7.814728, da

cui l’intervallo [0.7885944,17.515177].2) Il χ2 avrebbe 5 gradi di libert.

(D) Assumendo un modello di Poisson, ottenuti i due parametri conteggio medio per anno per totaledipendenti, si ottengono i valori di probabilit:

55

Page 56: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

1) 0.99353772) 0.000528446

56

Page 57: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

29 Compito del 23.01.2002

29.1 Testo

(A) La probabilit che un quattordicenne impieghi un veicolo per spostarsi 0.67. La probabilit che ilveicolo sia un motorino 0.95. La probabilit che il quattordicenne causi un danno mentre alla guida di unveicolo diverso dal motorino 0.69; se il veicolo un motorino allora essa 0.15. In Tabella 1 sono riportate ledistribuzioni di probabilit per il valore del danno Y causato in dipendenza dal tipo di veicolo. Si calcolino:

1) la distribuzione del valore del danno senza distinzione per tipologia di veicolo.2) la probabilit che 5 quattordicenni su 10 casualmente scelti impieghino un veicolo che non un motorinoe causino un danno.

Tabella 1: Distribuzione di probabilit per il valore del danno (centinaia di euro) condizionatamente altipo di veicolo adoperato.

Valore Danno: 0.1 1 5Se motorino: 0.15 0.3 0.55

Se altri veicoli: 0.75 0.15 0.1

(B) Alla YUMAMOTO Inc. sono state vendute motociclette di 4 cilindrate differenti (Tabella 2). Siottengano:1) i quantili 0.33 e 0.88.2) la rappresentazione grafica della funzione di distribuzione.

Tabella 2: Frequenze di vendita per 4 cilindrate differenti (centimetri cubici).Cilindrata: 900 500 250 125

Moto vendute: 846 449 652 620

(C) Il comune di S.DONNINO prender provvedimenti se la frequenza degli incidenti dovuti ai motorinisuperiore al 10%. Nell’ultimo anno,il numero di incidenti causati da motorini stato 60 dei totali 349dovuti a veicoli.

1) Calcolare l’errore standard della stima puntuale.2) Calcolare il p-value assumendo che la varianza della variabile frequenza relativa sia 0.0007.

(D) Per valutare le velocit massime di tre marche di motorini differenti sono stati provati campioni di 2motorini appartenenti a 3 marche differenti (Tabella 3):

1) La tipologia di motorino determina cambiamenti medi di velocit?;2) Assumendo che la velocit sia normalmente distribuita ed abbia la medesima varianza σ2 per ognimarca, effettuare la stima per intervallo di σ2 (1− α = 95%).

Tabella 3: Velocit per tipologia di motorino.ASPES 51 61

GALLETTO 66 56AQUILOTTO 46 66

29.2 Soluzioni

(A) Siano rispettivamente V , M , D le variabili casuali uso Veicolo, veicolo tipo Motorino, Danno. Y ilvalore del danno.1) Siano V = v, v; M = m,m; D = d, d. Le probabilit sono P (V = v) = 0.67, P (M = m|V = v) = 0.95,P (D = d|V = v,M = m) = 0.69, P (D = d|V = v,M = m) = 0.15. Allora, con i = m,m,

P (Y = y|V = v,D = d) =∑i

P (Y = y|D = d, V = v,M = i)P (M = i|D = d, V = v)

57

Page 58: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

dove

P (M = i|D = d, V = v) =P (D = d|M = i, V = v)P (M = i|V = v)

P (D = d|V = v)

e

P (D = d|V = v) =∑i

P (D = d|V = v,M = i)P (M = i|V = v) = 0.69 ∗ 0.05 + 0.15 ∗ 0.95 = 0.177.

Quindi P (M = m|D = d, V = v) =0.15 ∗ 0.95

0.177= 0.80508 e P (M = m|D = d, V = v) =

0.69 ∗ 0.05

0.177=

0.19496.Infine P (Y = 0.1|V = v,D = d) = 0.26695, P (Y = 1|V = v,D = d) = 0.27076, P (Y = 5|V = v,D =d) = 0.462292) La probabilit che un quattordicenne causi un danno spostandosi con un veicolo non motorino

P (M = m,D = d, V = v) = P (D = d|V = v,M = m)P (M = m|V = v)P (V = v) = 0.023115.

Assumendo l’indipendenza di eventi relativi a quattordicenni differenti, la variabile causale che conta glieventi binomiale, da cui il risultato 0.00000141794.

(B) Dopo avere ordinato in senso crescente i valori di cilindrata e diviso per il totale delle vendite, siottiene la distribuzione di frequenze relative. Il pi piccolo valore tra quelle x che soddisfano F (x) ≥ q ilquantile xq.1) x0.33 = 250; x0.88 = 9002) Frequenze cumulate: =0.24152707, = 0.4955201 = 0.6704324

(C)1) La stima puntuale del parametro proporzione di incidenti dovuta a motorini ha errore standard0.02019698.2) Stima puntuale della proporzione 0.1719198; p-value= 0.003280798

(D)1) Il coeff. Di Gini 0.3162278, η2 0.12) La migliore stima della varianza S2 la pooled per i tre gruppi che viene 100. In tal caso 3S2/σ2 ∼ χ2

3.L’intervallo dato da [32.09104, 1390.206]

58

Page 59: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

30 Compito del 12.02.2002

30.1 Testo

La New.Net decide di proporsi come fornitore di accessi ad Internet. Effettua quindi un’analisi del mercatorilevando la distribuzione degli utenti riportata nella tabella seguente.

Fornitori Tin Ciaoweb Libero Kataweb TiscaliNum. utenti 4442 1885 3500 2401 6275

(1) Valutare il grado di concentrazione degli utenti mediante un indice opportuno.(2) Effettuare una rappresentazione grafica dell’indice cal colato.

2Agli utenti New.Net viene proposto un concorso a premi via Web. Nel sito del concorso ci sono due porteed il concorrente deve sceglierne una. Nella prima sono lanciati due dadi: se esce (6,6) si vince 16 euro,altrimenti si vince 2 euro. Nella seconda porta viene lanciata 9 volte una moneta: se esce testa 7 volte sivince 160 euro, altrimenti si vince 2 euro.(1) Calcolare la vincita attesa.(2) Estraendo a caso un utente c he ha vinto 2 euro, calcolare la probabilita che questi abbia scelto laprima porta .

3Per impostare una campagna pubblicitaria la New.Net consulta un noto esperto: questi suggerisce unapubblicita mediante un banner su un noto portale, asserendo che tale tipo di pubblicita non e notata solodal 28.30 % degli internauti. La New.Net effettua quindi un’indagine su un campione di 427 utenti, dacui risulta che 148 non hanno notato il banner.(1) Verificare, al livello di significativita del 5%, l’ipotesi che la frequenza relativa di coloro che non notanoil banner sia quella dichiarata dall’esperto contro un’ipotesi alternativa che tale frequenza sia maggiore;(2) Calcolare la probabilita dell’errore di seconda specie nel caso in cui l’ipotesi alternativa ponga talefrequenza relativa pari a 0.39 .

4Per valutare la diversita di comportamento degli utenti si misura la durata delle connessioni (in minuti)per Tin e Tiscali su un campione di 60 accessi per Tin e di 70 per Tiscali. La varianza osservata e 121.31per Tin e 34.91 per Tiscali. Sapendo che in generale la durata delle connessioni e distribuita normalmentecon media 17 , (1) calcolare gli intervalli di confidenza (1 − α = 0.95) del coefficiente di variazione perentrambi i portali; (2) tali intervalli suggeriscono una diversita tra le due popolazioni ?

30.2 Soluzioni

1pi = 0.20 0.40 0.60 0.80 1.00qi = 0.1019 0.2316 0.4208 0.6609 1.0000R = 0.2924

2Vincita attesa = 7.7491P(porta1| vincita)= 0.5112

3Test d’ipotesi unilaterale su una proporzioneZoss = 2.9177Zcrit = 1.6449 Rifiuto H0

β = 0.0009

4

59

Page 60: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Tin: (0.5499 ; 0.7888 )Tiscali: (0.2983 ; 0.4165 )

60

Page 61: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

31 Compito del 04.04.2002

31.1 Testo

(A) Al magazzino MYMOTOR sono disponibili volanti di ricambio. La casa produttrice consegna il 4.5%di volanti difettosi.

1) Assumendo che la MYMOTOR abbia ricevuto 31 volanti, quale la probabilit che ve ne siano 6 difettosi?2) Un meccanico acquista 2 volanti di ricambio alla MYMOTORS che ne ha in magazzino 6. Quale laprobabilit che vi sia almeno un volante difettoso tra quelli acquistati dal meccanico, sapendo che nelmagazzino della MYMOTOR vi sono al massimo 2 volanti difettosi?

(B) In un esperimento riguardante un dispensatore di bevande stato considerato un campione casuale di1000 richieste di bevanda. Per ogni richiesta stata memorizzata la tipologia di bevanda (variabile Y) ela temperatura esterna (variabile X, bassa=-1, media=0, alta=1). In Tabella 2 riportata la distribuzionecongiunta delle frequenze relative.

Tabella 1: Distribuzione congiunta della tipologia di bevanda e della temperatura esterna.Y: 1 2 3 4X:-1 0.039 0.173 0.023 0.2160 0.052 0.061 0.057 0.1131 0.047 0.043 0.003 0.172

1) Data una temperatura esterna di valore medio, ricavare la distribuzione della tipologia di bevanda?2) Calcolare un opportuno indice per valutare il grado di associazione tra temperatura esterna e bevandaprescelta.

(C) Si consideri la variabile diametro relativa al foro filettato di un bullone. Un campione casuale didimensione pari a 39 proveniente dall’azienda SECURHOLE ha fornito le seguenti statistiche campionarie:media = 13.1, varianza corretta = 4. Un campione casuale di dimensione pari a 20 proveniente dall’aziendaPERFECTHOLE ha fornito le seguenti statistiche campionarie: media = 14.4 e varianza corretta = 4.1.Assumendo la normalit della variabile casuale diametro:

1) Effettuare la stima del rapporto tra varianze con affidabilit 0.95.2) Assumendo che le varianze delle due popolazioni siano uguali a σ2, effettuare la stima puntuale di σ2.

(D)Considerando il problema ( C), in particolare il punto (2):

1) saggiare statisticamente l’uguaglianza del diametro medio dei bulloni prodotti dalle due aziende(probabilit di accettare l’ipotesi di lavoro quando essa di fatto vera = 0.99).2) Se la varianza fosse nota cosa cambierebbe nel test al punto (1)?

31.2 Soluzioni

(A.1) Conoscendo la probabilit che il produttore consegni un volante difettoso, il modello adeguato allaprobabilizzazione del numero di volanti difettosi consegnati alla MYMOTOR dato il totale dei consegnatibinomiale: 0.001933762.(A.2) Dato il numero dei difettosi nel magazzino, il modello dei difettosi acquistati ipergeometrico. Tut-tavia, occorre ricavare la distribuzione del numero dei difettosi in magazzino e marginalizzare opportu-namente: 0.08679442

(B.1) Ottenuta la distribuzione marginale della variabile X, si divida la congiunta p(X = 0, Y )/p(X = 0)per ogni Y : 0.1837456, 0.2155477, 0.2014134, 0.3992933.(B.2) Uno degli indici di interconnessione stocastica adeguato, C1= 0.2879636, C2= 0.3722192, C1rel =0.2159727, C2rel= 0.2631987, chi2=0.1384086, CP=0.3488376, Tcshuprov=0.05656162.

(C.1) Il rapporto tra varianze 0.9756098. I quantili di F sono 0.4748059 e 2.342687. L’intervallo dato da[0.416449,2.054755].

61

Page 62: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C.2) La migliore stima di σ2 la varianza pooled per i due gruppi, che viene 4.033333

(D.1) La differenza tra medie -1.3, la deviazione standard della differenza 0.5523454. Il t-empirico -2.3536,il t-critico (alfa=0.01) 2.66487.(D.2) La statistica test sarebbe distribuita normalmente ed il test risultante pi potente. Cambierebbeanche σ2 se diversa da quella stimata.

62

Page 63: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

32 Compito del 11.06.2002

32.1 Testo

1Un’agenzia di viaggi pubblicizza vacanze in un’isola tropicale affermando che il numero medio di ore algiorno di pieno sole e 10. Effettuate un periodo di vacanze di 20 giorni sull’isola e rilevate un numeromedio di ore al giorno di pieno sole pari a 7.50 con una deviazione standard corretta di 1.28. Se il numerodi ore di pieno sole fosse distribuito normalmente:(a) avreste motivo di lamentarvi di essere stati ingannati? (porre α = 0.05)(b) E se la varianza del numero di ore di pieno sole fosse stata nota e pari ad 1?

2Si supponga che la probabilita che una hostess di una compagnia aerea sia gentile e 0.79 , mentre taleprobabilita e pari a 0.49 per uno stewart. Gli equipaggi vengono formati estraendo a caso due individuidel personale, con una probabilita, ad ogni estrazione, di selezionare una hostess pari 0.75 (0.25 per unostewart).(a) Calcolare la probabilita che un equipaggio estratto a caso, nessuno sia gentile.(b) Sapendo che un viaggiatore e stato servito da una sola persona e che questa e stata gentile, calcolarela probabilita che il viaggiatore sia stato servito da una hostess.

3Si vuole delineare il profilo del turista italiano. Si effettua un’indagine campionaria rilevando le preferenzein termini di localita (X = mare, montagna, altro) e di tipo di alloggio (Y=albergo, villaggio, altro). Idati rilevati sono riportati nella tabella seguente.

Y Albergo Villaggio AltroXMare 68 205 17Montagna 130 42 22Altro 76 21 138

(a) Calcolare un (solo) indice di interconnessione relativo tra le due variabili.(b) Derivare, in base alle frequenze relative, la distribuzione di probabilita condizionata del tipo di alloggiodato che X = mare.

4Si vuole studiare se il numero di giorni trascorsi in vacanza nell’anno precedente (X) sia una variabileinfluente per il numero di giorni trascorsi in vacanza nell’anno successivo (Y). La tabella seguente riportai dati rilevati su un campione casuale di 5 individui.

X 14 18 18 14 16Y 13 20 19 15 20

(a) Calcolare i coefficienti di regressione.(b) Verificare l’ipotesi che X non abbia effetto su Y, specificando le assunzioni necessarie. (N.B. Pervelocizzare i calcoli si tenga presente che

∑xi = 80

∑yi = 87

∑x2i = 1296

∑y2i = 1555 )

32.2 Soluzioni

1Test d’ipotesi unilaterale sulla media.(a)toss = −8.7287tcrit = −1.7291Rifiuto H0

(b)zoss = −11.1803

63

Page 64: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Zcrit = −1.6449Rifiuto H0

2P(H) = 0.75 ; P(S)= 0.25(a) P (G) = P (G|H)P (H) + P (G|S)P (S) = 0.715 P (G,G) = 0.081225(b) P (H | G) = 0.82867

3(a)C1 = 0.6485 C2 = 0.7246C1r = 0.4864 C2r = 0.5124CM = 0.3242 CP = 0.5868 CTschuprov = 0.3713

(b)Albergo Villaggio Altro

Y |Mare 0.2345 0.7069 0.0586

4(a) Modello di regressione semplice : β = 1.3750 e α = −4.6000(b) s2 = 3.6500 e

∑(xi − x)2 = 16.0000

toss = 2.8788tcrit = ±3.1824 gdl=2Accetto H0

64

Page 65: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

33 Compito del 26.06.2002

33.1 Testo

(A) In Tabella 1 sono riportati i numeri indici (percentuali) a base fissa 2Ij relativi alle spese per lamateria prima presso l’azienda HOTMILK per il secondo semestre del 2001. Determinare:

1) il numero indice 1I6 percentuale;2) Rappresentare graficamente la serie semestrale interpretando brevemente l’andamento riscontrato.

Tabella 1: Numeri indici del semestre.Mese 1 2 3 4 5 6Indice 92 100 103 103 107 110

(B) Alla HOTMILK si sta effettuando uno studio per valutare il tempo di pulitura richiesto dai recipientidi sterilizzazione con un nuovo metodo termico. Ad un campione casuale di 5 recipienti stata applicatala pulitura a 150 gradi (Tabella2):

Tabella 2: Tempi di pulitura.Tempi 10 13 9 10 11

1) Riassumere i risultati sperimentali con un indice di posizione ed uno di variabilit (indice relativo).2) Sapendo che la varianza relativa ai tempi di pulitura con il metodo standard pari a 5 minuti quadrati,valutare se la nuova procedura termica diminuisce significativamente la varianza del tempo di pulitura(α= 0,05, modello normale per la variabile casuale tempo).

(C) Considerando il latte imbottigliato alla HOTMILK, il numero atteso di batteri per litro pari a 20se sterilizzato in modo standard, oppure 2.5 se sterilizzato con procedura HIGHGRADE. Si consideri unbicchiere di latte da 10 centilitri versato da una bottiglia prodotta alla HOTMILK:

1) Quale il numero di batteri attesi se la procedura HIGHGRADE, quale se la procedura standard?2) Si assuma che la probabilit che una bottiglia da un litro sia sterilizzata con il vecchio metodo sia paria 0.5. Se l’analisi rivelasse che il bicchiere di latte in (1) contiene 7 batteri, quale sarebbe la probabilitche la bottiglia da cui stato versato sia stata sterilizzata con la procedura HIGHGRADE?

(D) In un esperimento sulla qualit del latte stato contato il numero di batteri presenti in un campionedi 7 autobotti per il trasporto latte della HOTMILK. Si assuma che il numero di batteri dipenda dallatemperatura di sterilizzazione secondo la relazione Yi = β0 + β1xi + ei, (con gli ei ∼ N(0, σ2) e indipen-dentemente distribuiti). Sapendo che i parametri stimati con il metodo dei minimi quadrati sono risultati

pari a β0 = 2839.18 e β1 = −18.96 e σ2 = 78.67,che la media delle x 105 e che la devianza delle x 700:

1) Determinare l’intervallo di confidenza per (livello 0.90);2) Calcolare l’intervallo entro cui si situa con affidabilit 90% il numero atteso di batteri alla temperaturadi 112 gradi.

33.2 Soluzioni

(A)

1) 1I6 =2 I6/2I1 ∗ 100 = 110/92 ∗ 100 = 119.6.2) Situando i mesi sulle ascisse e gli indici sulle ordinate possiamo concludere che le spese sono aumentateal passare dei mesi.

(B)

1) La media aritmetica = 10.6. Varianza = 1.84. CV = 12.8%2) Stima varianza corretta = 2.3. Chi-quadro empirico = 1.84. Chi-quadro critico = 0.7107. Accettol’ipotesi nulla.

65

Page 66: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C) Si consideri il modello di Poisson per il conteggio dei batteri.

1) Essendo 10 centilitri = 0.1 litri i due valori attesi sono 0.25 e 2.0, rispettivamente.2) X = numero batteri in un bicchiere di latte da 10 centilitri; H = 1 se sterilizzato con HIGHGRADE,0 se sterilizzato con procedura standard. Assumendo che X abbia distribuzione di Poisson (ovviamentecon un λ diverso a seconda del metodo, come chiarito nel punto precedente) abbiamo: X|H = 1 ∼Poisson(λ1 = 0.25), X|H = 0 ∼ Poisson(λ0 = 2), P (H = 1) = 0.5 e P (H = 0) = 0.5.Allora, utilizzando la formula di Bayes, P (H = 1|X = 7) = P (X = 7|H = 1)P (H = 1)/P (X =7) = 0.000002744, dove: P (X = 7|H = 1) = 0.00000000943139, P (X = 7|H = 0) = 0.003437087,P (X = 7) = P (X = 7|H = 1)P (H = 1) + P (X = 7|H = 0)P (H = 0) = 0.001718548 (formula dellaprobabilit marginale).

(D)

1) La varianza stimata ha 7-2=5 gradi di libert, da cui l’intervallo basato sul chi-quadro [35.53, 343.39]2) Si tratta dell’intervallo di previsione per il valore atteso =715.6, ovvero [707.35, 723.86]

66

Page 67: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

34 Compito del 16.07.2002

34.1 Testo

1L’azienda produttrice di gelati FRITZ sa che il 21% dei propri clienti preferisce il gusto limone, il 31%fragola ed il 48% cioccolato. L’8% dei clienti che preferiscono il gusto limone acquista il gelato al bar,mentre tale percentuale scende al 5% per coloro che preferiscono fragola e al 3% per cioccolato. (a) Sesi sceglie un cliente a caso che ha comprato il gelato al bar, determinare la probabilita che questi abbiascelto il gusto limone.(b) Sapendo che, per ciascun gelato venduto al bar, la FRITZ guadagna 0.25 euro per un gelato al limoneed il doppio per gli altri gusti, calcolare il guadagno atteso da un gelato venduto al bar.

2Si effettua un’indagine campionaria per verificare una relazione tra gusto di gelato preferito e tendenzepolitiche. Si misura la preferenza di gusto (X = limone, fragola, cioccolato) e la tendenza politica(Y=Sinistra, Centro, Destra). Le frequenze rilevate riportate nella tabella seguente.

Y Sinistra Centro DestraXLimone 46 161 26Fragola 152 39 33Cioccolato 64 30 168

(a) Calcolare un (solo) indice di interconnessione relativo tra le due variabili.(b) Derivare, in base alle frequenze relative, la distribuzione di probabilita condizionata delle tendenzepolitiche dato che X = limone.

3La FRITZ ha acquistato un nuovo macchinario che distribuisce le amarene nelle coppe di gelato. La dittafornitrice asserisce che il macchinario distribuisce il numero di amarene prestabilito il 98% delle volte. LaFRITZ effettua un’indagine su un campione di 500 coppe di gelato, da cui risulta che 36 presentano unnumero di amarene diverso da quello preimpostato.(a) Verificare, al livello di significativita del 5%, l’ipotesi che la frequenza relativa degli errori sia quelladichiarata dalla ditta fornitrice del macchinario ;(b) Come avreste dovuto procedere se il campione di coppe fosse stato di dimensione 10?

4Si vuole studiare se il numero di cartelloni pubblicitari esposti contemporaneamente in una citta (X) siauna variabile influente per il numero di bar che, in quella citta, richiedono una fornitura della FRITZ(Y). La tabella seguente riporta i dati rilevati su un campione casuale di 5 citta.

X 14 18 18 14 16Y 13 20 19 15 20

(a) Calcolare i coefficienti di regressione.(b) Verificare l’ipotesi che X non abbia effetto su Y, specificando le assunzioni necessarie.(N.B. Per velocizzare i calcoli si tenga presente che

∑xi = 80

∑yi = 87

∑x2i = 1296

∑y2i =

1555 )

34.2 Soluzioni

1(a) Formula di Bayes. B= comprato al barP(B)= 0.0467P(limone |B)=0.3597

67

Page 68: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(b) P(fragola |B) + P(cioccolato |B)= 0.3319 + 0.3084 =0.6403Y=guadagno dalla vendita al bar di un gelato

Y =

0.25 p = 0.35970.50 p = 0.6403

E[Y ] = 0.25 · 0.3597 + 0.50 · 0.6403 = 0.41 euro.

2(a)C1 = 0.6735 C2 = 0.7245C1r = 0.5051 C2r = 0.5123CM = 0.3368 CP = 0.5867 CTschuprov = 0.3712

(b)Albergo Villaggio Altro

Y |Mare 0.1974 0.6910 0.1116

3(a) toss = 8.3054Zcrit = 1.6449Rifiuto H0

(b) Calcolo del p-value mediante distribuzione binomiale

4(a) Modello di regressione semplice : β = 1.3750 e α = −4.6000(b) s2 = 3.6500 e

∑(xi − x)2 = 16.0000

toss = 2.8788tcrit = ±3.1824 gdl=2Accetto H0

68

Page 69: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

35 Compito del 17.12.2002

35.1 Testo

Esercizio 1La probabilit di superare un esame, se non si seguono regolarmente le lezioni, 0.69 , mentre se le lezionisono seguite regolarmente 0.87 . Il 76 % degli studenti ha superato l’esame in questione.

In quale proporzione essi hanno seguito regolarmente le lezioni?

Esercizio 2Il management del gruppo STARTEL, una compagnia che produce elettronica per le telecomunicazioni,sta mettendo a punto un piano di ristrutturazione. La sua attenzione rivolta in particolare alla produzionedi telefoni cellulari, riguardo alla quale sta confrontando i dati di produttivit pervenuti dai responsabilidei 4 stabilimenti del gruppo.

Tabella: Principali statistiche sulla produttivit dei 4 stabilimenti del gruppo STARTEL. I dati di basesui quali sono state calcolate le statistiche sono a cadenza mensile.

Stabilimento China 1 China 2 Reno LimerickNumero mesi 20 14 30 12Media mensile 67.4 68.6 48.1 87.3

Varianza mensile 46.6 28.8 40.2 64.5

Si valuti come la produttivit spiegata dagli stabilimenti attraverso un opportuno indice.

Esercizio 3Il responsabile marketing della STARTEL Italia ha commissionato alla NELSON, un’agenzia di ricerche dimercato, una rilevazione campionaria per conoscere quanto le famiglie italiane spenderanno in elettronicadi consumo (telefonia, computer, hi-fi, ecc.) nei prossimi 2 anni (2002-2003). Le principali statistichecampionarie sul campione casuale semplice intervistato sono riportate in tabella.

Tabella: Principali statistiche campionarie sulla spesa delle famiglie italiane in elettronica di consumonel 2002-2003 (valori in Euro)

Famiglie intervistate 1o quartile mediana 3o quartile media varianza (non corretta)1543 0 894.2 1060.3 713.8 218628

(A) Costruire l’intervallo di confidenza al 99.5 % per la vendita media, specificando le ipotesi e i principalirisultati teorici utilizzati per ricavarlo.(B) Alla NELSON stata commissionata una rilevazione analoga per il mercato spagnolo. Per stabilirela dimensione del campione da intervistare, la NELSON decide di sfruttare i risultati della rilevazioneitaliana, accrescendo prudenzialmente la varianza (non corretta) del 30 %. Su questa base, quanto deveessere n per ottenere un intervallo al 99.5 % per la spesa media di informativit pari a 34 ?

Esercizio 4Dalla rilevazione effettuata in Italia di cui all’esercizio precedente emerso che non tutte le famiglie hannointenzione di fare acquisti di elettronica di consumo. In particolare fra le 1543 famiglie intervistate, quelleche non hanno intenzione di acquistare nel biennio 2002-2003 il tipo di beni indicati sono state 424 .

(A) Sottoporre a test l’ipotesi nulla secondo la quale la percentuale di coloro che non hanno intenzionedi acquistare del 30 % contro l’alternativa che sia del 26 % mediante il p-value.(B) Sulla base dei dati di cui al punto (A) determinare la potenza del test.

35.2 Soluzioni

Esercizio 1

69

Page 70: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Siano E = ”esame superato”; S = ”lezioni seguite regolarmente”. Si risolve attraverso la formula dellaprobabilit totale:

P (E) = P (E|S)P (S) + P (E|S)[1− P (S)]

da cui sapendo P (E) = 0.76, P (E|S) = 0.87, P (E|S) = 0.69 si ricava P (S) = 0.38889.

Esercizio 2Si risolve calcolando quanta parte della variabilit complessiva della produttivit spiegata dalla variabile”stabilimento” (che forma i gruppi)

η2 =DevBDevT

=14570.8

17886= 0.81465.

Per il calcolo di DevB si dispone delle medie (xj) e delle numerosit (nj) di ciascun gruppo: prima sicalcola x = 63.1447 mediante la propriet di associativit e poi si applica la relativa formula. Il calcolo diDevT deve essere fatto mediante

DevT = DevB +DevW = 14570.8 + 3315.2

DevW si trova prima trasformando le varianze (V arj) di ciascun gruppo in devianze mediante Devj =V arjnj (valori ottenuti: 932 , 403.2 , 1206 , 774 ) e poi calcolando DevW =

∑j Devj .

Esercizio 3

(A) Il campione sufficientemente elevato per invocare il teorema del limite centrale (ed altre proprietasintotiche) e considerare come pivot

X − µS/√n≈ N(0, 1).

Poiche x = 713.8, s2 = 218769.78, s = 467.73,√n = 39.28, z = 2.807, l’intervallo al 99.5 % risulta

[680.38 ,747.22 ].

(B) Nelle condizioni dell’esercizio, l’informativit data da I =2zs√n

. Poiche l’aumento prudenziale della

varianza non corretta fornisce s2 = 284400.72, s = 533.29 ed inoltre I = 34, z = 2.807, si ottienen = 7755.

Esercizio 4

(A) Nelle ipotesi dell’esercizio, come variabile test si pu utilizzare

p− p√pq/n

≈ N(0, 1)

dove: sotto H0 p = 0.3, sotto H1 p = 0.26. Poiche p = 424/1543 = 0.2748, n = 1543,√p0q0/n = 0.01167,

allora il valore della statistica test sotto H0 -2.161 , mentre il p-value P (p− p0√p0q0/n

< −2.161|H0) =

0.01535.

(B) Considerato α = 0.05 allora Regione di rifiuto perp− p0√p0q0/n

= (−∞, z = −1.645). Poniamo inoltre

s0 =√p0q0/n ed s1 =

√p1q1/n. Allora

γ = P (p− p0

s0< z|H1) = P (p < p0+zs0|H1) = P (

p− p1

s1<p0 + zs0 − p1

s1|H1) = P (Z < 1.864|H1) = 0.96882

70

Page 71: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

36 Compito del 08.01.2003

36.1 Testo

Esercizio 1La BIGFRUIT una compagnia Neozelandese che produce ed esporta frutta. La produzione di kiwi,proveniente per il 34 % dal consorzio NORD e per la parte restante dal consorzio SUD, commercializzatain piccole cassette da 15 pezzi ciascuna. Per la stagione corrente i controlli effettuati hanno mostrato chestata messa in commercio una media di 0.22 kiwi difettosi per cassetta nel consorzio NORD e una mediadi 0.477 kiwi difettosi per cassetta nel consorzio SUD.

(A) Presa a caso una cassetta di kiwi BIGFRUIT, calcolare la probabilit che essa contenga almeno unkiwi difettoso.(B) Sapendo che in una cassetta non stato trovato alcun kiwi difettoso, determinare la probabilit chequesta provenga dal consorzio NORD.

Esercizio 2La seguente tabella riporta la serie degli numeri indice a base mobile, rispetto all’anno precedente edespressi in percentuale, dei prezzi al consumo dei kiwi.

Anno 1996 1997 1998 1999 2000 2001 2002Indici a base mobile 108.9 95.9 106.6 91.6 102.5 107 105.3

(A) Calcolare la serie dei numeri indice a base fissa con base 2000 = 100.(B) La seguente tabella riporta il prezzo medio annuale (per kg e in $NZL) dei kiwi BIGFRUIT. Situttavia persa memoria dei prezzi 1996 e 1997. Completare la tabella.

Anno 1996 1997 1998 1999 2000 2001 2002Prezzo BIGFRUIT ... ... 0.7 0.68 0.52 0.79 0.83

Esercizio 3Esportando prevalentemente in Europa Continentale, le vendite della BIGFRUIT possono risentire deltasso di cambio $NZL-Euro. La tabella seguente riporta alcune statistiche calcolate sui dati annuali delperiodo 1985-2001 (V = Vendite BIGFRUIT in milioni di $NZL in Europa Continentale; T = tasso dicambio $NZL-Euro).

Statistiche Media(V ) Media(T ) Dev(V ) Dev(T ) Codev(V, T )Valori 3282 1.71 161225 3.3 -620.3

(A) Si formuli un opportuno modello di regressione e se ne stimino i parametri (Aiuto: per la stima di

σ2 si utilizzi la relazione Dev(residui) = Dev(y)− β21Dev(x)).

(B) Si sottoponga a test l’ipotesi che le vendite non siano significativamente influenzate dal tasso dicambio.

Esercizio 4La BIGFRUIT sta sperimentando un programma di lotta integrata per diminuire la quantit di pesticidiutilizzati nella coltivazione dei kiwi. Per la lotta contro il pico-parassita, due campioni casuali di piantesono stati sottoposti al trattamento tradizionale e a quello di lotta integrata con i risultati riportati nellaseguente tabella (variabile rilevata = numero di pico-parassiti catturati dalle trappole messe su ciascunapianta).

Statistiche piante Q1 mediana Q3 media varianzacorrettaTradizionale 28 1809 1911 2011 1921 15057

Lotta integrata 23 1697 1787 1853 1805 29366

(1) Si formuli un opportuno modello e si sottoponga a test l’ipotesi nulla che il nuovo programma di lottaintegrata non sia migliore del vecchio (α = 0.005 ).(2) Si calcoli il p-value utilizzando le tavole a disposizione.

71

Page 72: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

36.2 Soluzioni

Esercizio 1

Xi = numero di kiwi difettosi nel consorzio i, con i = N,S. Allora (X|N) ∼ Bi(n = 15, pN ) e (X|S) ∼Bi(n = 15, pS). Da E(X|N) = npN = 0.22 ed E(X|S) = npS = 0.477 si ricava pN = 0.01467 epS = 0.0318.

(A) P (X ≥ 1) = 1− P (X = 0) = 1− 0.67887 = 0.32113 dove P (X = 0) = P (X = 0|N)P (N) + P (X =0|S)P (S) = 0.80121 ∗ 0.34 + 0.61585 ∗ 0.66 = 0.67887

(B) P (N |X = 0) =P (X = 0|N)P (N)

P (X = 0)=

0.80121 ∗ 0.34

0.67887= 0.40127

Esercizio 2

(A) Per gli anni t > 2000 si utilizza iterativamente la relazionextx00

=xtxt−1

xt−1

x00partendo da x00/x00 =

100 e x01/x00 = 107. Per gli anni t < 2000 si utilizza iterativamente la relazionextx00

=xt/xt+1

x00/xt+1=

xt+1/x00

xt+1/xtpartendo da x00/x00 = 100 e x00/x99 = 102.5. Cos facendo si ottiene la serie

Anno 1996 1997 1998 1999 2000 2001 2002Indici a base 2000 104.2 99.9 106.5 97.6 100 107 112.7

(B) 97I98 = x98/x97 implica x97 = x98/97I98 = 0.7/1.066 = 0.6567. Sfruttando tale risultato x96 =x97/96I97 = 0.6567/0.959 = 0.6847.

Esercizio 3

Modello: Vi = β0 + β1Ti + ui dove ui ∼ (0, σ2), con le solite ipotesi sugli ui

(A) β1 =Codev(V, T )

Dev(T )=−620.3

3.3= −188; β0 = V − β1T = 3282 − −188 ∗ 1.71 = 3603.4; σ2 =

[Dev(V )− β21Dev(T )]/(n− 2) = (161225−−1882 ∗ 3.3)/(17− 2) = 2975.2

(B) H0 : β1 = 0 contro H1 : β1 6= 0. Come statistica test si utilizzaβ1 − β1

σ(β1)∼ T (n − 2), dove

σ2(β1) =σ2

Dev(T ). Il valore campionario della statistica test sotto H0

β1

σ(β1)=−188

30.026= −6.2602

(σ2(β1) =σ2

Dev(T )=

2975.2

3.3= 901.56) mentre la regione di accettazione [-2.1314 ,2.1314 ].

Esercizio 4

(A) Si supponga XT ∼ (µT , σ2) e XL ∼ (µL, σ

2). Allora H0 : µT −µL = 0 contro H1 : µT −µL > 0. Nelle

condizioni dell’esercizio, come variabile test si pu utilizzare T =(XT −XL)− (µT − µL)√

S2p(1/nT + 1/nL)

∼ T (n− 2). Il

valore campionario della statistica test sotto H0XT −XL√

S2p(1/nT + 1/nL)

=1921− 1805√

21481.45(1/28 + 1/23)= 2.81,

dove (S2p =

S2T (nT − 1) + S2

L(nL − 1)

nT + nL − 2=

15057 ∗ 27 + 29366 ∗ 22

49= 21481.4) mentre la regione di rifiuto

(2.68,+∞].

(B) p− value = P (T > 2.8124|H0) = 0.003527 con la T oppure 0.002458 con la Normale.

72

Page 73: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

37 Compito del 23.01.2003

37.1 Testo

Esercizio 1Al Manicomio del gelato, famosa gelateria gestita da un gelataio matto, un inserviente robot sceglie acaso uno tra tre possibili gusti: nocciola, cioccolato e pistacchio con probabilita rispettivamente 0.17 ,0.48 e 0.35 . Il gelataio matto aggiunge una ciliegia al gelato preparato dal robot con probablita 0.43 seil gelato e alla nocciola, 0.52 se il gelato e al cioccolato oppure non aggiunge nulla.(a) Con quale probabilita si riesce ad avere un gelato senza la ciliegina?(b) Sapendo che ci e toccata la ciliegina sul gelato, con che probabilita ci e capitato un gelato al gusto dinocciola ?

Esercizio 2Il gelataio matto afferma di regalare una cialda ai clienti totalmente a caso. Sono stati osservati i clientidella gelateria durante un weekend registrandone il sesso e se avevano ottenuto o meno la cialda in regalo.I dati osservati sono riportati nella seguente tabella.

Cialda in regaloSesso Si No TotaleMaschio 31 55 86Femmina 153 22 175Totale 184 77 261

(a) Calcolare un indice descrittivo che misuri l’indipendenza stocastica dell’assegnazione della cialda inregalo dal sesso del cliente.(b) Considerando i dati osservati come un campione casuale, calcolare un intervallo di confidenza al 99%per la probabilita di ricevere una cialda in regalo.

Esercizio 3Considerando i dati nella tabella dell’esercizio precedente come un campione casuale,(a) verificare statisticamente che la proporzione di clienti di sesso femminile del Manicomio del gelato siapari a quella maschile, contro l’ipotesi che sia superiore (α = 0.05).(b) Fissando nell’ipotesi alternativa la proporzione di femmine a 0.55, calcolare la probabilita dell’erroredi seconda specie. Il valore ottenuto mette in discussione il test statistico? Commentare.

Esercizio 4Supponiamo di avere una popolazione di 5 numeri: 1, 3, 5, 7, 9 e si supponga di estrarre un campionedi dimensione 3.(a) Descrivere la distribuzione campionaria della mediana campionaria.(b) La statistica del punto (a) viene utilizzata per stimare la mediana; calcolare la distorsione dellostimatore.

37.2 Soluzioni

Esercizio 1ΩG = N,CC,P per il gusto e ΩC = C,C per la ciliegina.P (N) = 0.1700 P (CC) = 0.4800 P (P ) = 0.3500P (C|N) = 0.4300 P (C|CC) = 0.5200 P (C|P ) = 0P (C|N) = 0.5700 P (C|CC) = 0.4800 P (C|P ) = 1(a) P (C) = P (C|N) · P (N) + P (C|CC) · P (CC) + P (C|P ) · P (P ) = 0.6773

(b) P (N |C) = P (C|N)·P (N)P (C) = 0.2265

Esercizio 2(a)C1 = 0.4541 C2 = 0.5296

73

Page 74: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

C1r = 0.4541 C2r = 0.5296CM = 0.4541/2 CP = 0.4680(b) Intervallo di confidenza. p = 0.7050Intervallo di confidenza per p: [0.6323; 0.7777]

Esercizio 3(a) Test d’ipotesi unilaterale su una proporzione conH0 : p = 0.5 vs H1 : p > 0.5p = 0.6705 e σ0 = 0.0309Zoss = 5.5090Zcrit = 1.6449Rifiuto H0

(b) β = P (P < C0|H1) = P (P < 0.5 + 1.6449σ0|H1) == P (P < 0.5509|H1) = P (Z < 0.0295) = 0.5117Il valore di β e elevato, ma, avendo rifiutato H0, non si corre il rischio di commettere un errore di secondotipo.

Esercizio 4(a) Ω = (1, 3, 5)(1, 3, 7), (1, 3, 9), (1, 5, 7), (1, 5, 9), (1, 7, 9), (3, 5, 7), (3, 5, 9), (3, 7, 9), (5, 7, 9)

Me =

3 p = 310

5 p = 410

7 p = 310

(b) E[Me] = 5.00 Mediana = M = 5d =M− E[Me] = 0

74

Page 75: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

38 Compito del 10.02.2003

38.1 Testo

Esercizio 1Siete un manager di una azienda. Per favorire un buon clima lavorativo, lo scorso anno avete offertopasticcini in quantita variabile. Fate una verifica sull’efficacia dell’incentivo misurando negli ultimi 8mesi le variabili: X = spesa mensile per pasticcini in euro e Y = indicatore di produttivita. I dati sonoriportati nella tabella seguente.

X 196 232 187 203 245 242 191 238Y 59 53 64 62 47 49 65 51

(a) Calcolare un indice che misuri la dipendenza lineare tra X e Y e commentare.(b) Si stimi un modello di regressione semplice specificando le ipotesi necessarie.Si tenga presente che:

∑xi = 1734,

∑yi = 450,

∑x2i = 380132,

∑y2i = 25666.

Esercizio 2Da un vostro collaboratore, ricevete un fax che contiene la seguente frase: “ Abbiamo condotto < numeroilleggibile forse di 3 cifre > interviste telefoniche, rilevando il possibile interesse all’acquisto del nostronuovo prodotto. I risultati indicano che la percentuale di persone interessate all’acquisto e compresa trail 18% e il 29% con confidenza 90% ”. Secondo voi, quante persone sono state intervistate?(Suggerimento: per ricavare p, si noti che l’intervallo di confidenza e simmetrico rispetto a p)

Esercizio 3Si consideri le seguenti funzioni:

F1(x) =

0 x ≤ 018x

2 altroveF2(x) =

1− e−3x 0 ≤ x <∞0 altrove

(a) Quali di queste e una funzione di ripartizione?(b) Calcolare la mediana della variabile aleatoria la cui funzione di ripartizione e stata individuata alpunto precedente.

Esercizio 4Si conduce un esperimento per valutare l’efficacia del profumo al bergamotto sulla produttivita. Vieneindividuato un campione di 5 impiegati, a cui viene misurata la produttivita in due giornate scelte a caso,in una delle quali viene diffuso nel suo ufficio un leggero profumo di bergamotto. I dati ottenuti sonoriportati nella tabella seguente.

Impiegato A B C D EProduttivita senza bergamotto 70 81 60 66 73Produttivita con bergamotto 81 81 62 69 78

(a) Ipotizzando che l’indicatore di produttivita si distribuisca normalmente, si valuti, mediante opportunotest, se il profumo migliora in media la produttivita (α = 0.05).(b) Si calcoli la potenza del test fissando nell’ipotesi alternativa l’incremento medio di produttivita pari a8.5. (Considerare nella tavola il valore piu prossimo a quello che cercate, ricordando che la distribuzionesimmetrica).

38.2 Soluzioni

Esercizio 1Coefficiente di correlazione ρ = −0.9727Ipotesi classiche. Coefficienti di regressione α = 116.788 β = −0.2793.

Esercizio 2

75

Page 76: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

La variabile di interesse ha distribuzione binomiale.

Se n e abbastanza grande, l’intervallo per il parametro p e ⇒ p± zα\2√

p(1−p)n

Data la simmetria dell’intervallo rispetto a p, p = 0.233 . zα\2 = 1.645

0.287− 0.178 = 0.1092 · 1.645√

0.233·0.767n da cui n ∼= 162.

Esercizio 3(a) F2 e una funzione di ripartizione; F1 non lo e in quanto non tende a 1.(b) X continua. Me=mediana t.c. 0.5 = P (X ≤Me) = F (Me) = 1− e−2Me ⇒Me = 0.231

Esercizio 4(a) Test unilaterale per il confronto tra medie in campioni dipendenti.Pongo D= (Prod con bergamotto) - (Prod senza bergamotto)H0 : µD = 0 vs H1 : µD > 0d = 4.200 σD = 4.207 .toss = 2.232 e tα = 2.132Rifiuto H0

(b) 1− β = P (d > C0|H1) = P (d > 0 + 2.132σD|H1) == P (d > 4.011|H1) = P (t > −2.386) = 0.962N.B. Questo il valore esatto; l’uso delle tavole comporta necessariamente un’approssimazione.

76

Page 77: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

39 Compito del 23.04.2003

39.1 Testo

Esercizio 1La VEDALEC spa una catena di supermercati. I responsabili di tale catena per una certa zona territorialehanno in progetto di cambiare l’orario di apertura dei punti vendita situati nella zona di competenza. Persaggiare il gradimento nei confronti del nuovo orario stata effettuata una rilevazione campionaria pressola clientela VEDALEC. Il risultato della rilevazione riportato nella seguente tabella.

Favorevoli Contrari TotaleMaschi 285 355 640

Femmine 401 288 689Maschi e femmine 686 643 1329

(A) Si sottoponga a test l’ipotesi nulla che ”la maggioranza non favorevole” al nuovo orario di apertura.(B) Si determini la potenza del test in corrispondenza dell’ipotesi alternativa ”il 53 % della clientelafavorevole” al nuovo orario.

Esercizio 2I responsabili VEDALEC hanno giudicato interessante approfondire se, in relazione al problema di cuial precedente esercizio, maschi e femmine tendono a manifestare un diverso gradimento nei confronti delnuovo orario.

(A) Si vuole misurare il diverso gradimento di maschi e femmine per il nuovo orario di apertura: siproponga uno stimatore e se ne indichi la distribuzione (approssimata). Si fornisca inoltre una stimadelle grandezza d’interesse e della deviazione standard dello stimatore utilizzato.(B) Si determini un intervallo di confidenza al 90 % per valutare la differenza di gradimento del nuovoorario fra maschi e femmine.

Esercizio 3Si assuma che i clienti VEDALEC siano alcuni milioni e che, estratto casualmente un cliente, la probabilitche questo sia favorevole al nuovo orario sia esattamente quella stimata al punto A dell’esercizio 1. Estrattia caso 383 clienti:

(A) Determinare media e varianza del numero di favorevoli al nuovo orario fra i 383 estratti.(B) Utilizzando opportune approssimazioni, si determini l’intervallo, simmetrico rispetto alla media, entroil quale si colloca il numero di favorevoli fra i 383 estratti col 98 % di probabilit.

Esercizio 4Sulla base dei dati della rilevazione VEDALEC di cui all’esercizio 1, si misuri il grado di associazione frasesso e giudizio sul nuovo orario mediante un opportuno indice. Commentare il risultato.

39.2 Soluzioni

Esercizio 1

X ∼ Be(p), dove 1 = ’favorevole’ e 0 = ’non favorevole’. H0 : p ≤ 0.5 (da trasformare nella pratica inH0 : p = 0.5) contro H1 : p > 0.5.

(A) La dimensione del campione autorizza a considerare come statistica test

Z0 =p− p0√p0q0/n

H0≈ N(0, 1)

dove p0 = 0.5. Poiche α = 0.05 allora la regione di rifiuto per Z0 (z = 1.6449,+∞); inoltre p =686/1329 = 0.5162, p0 = 0.5 ed n = 1329 implicano

√p0q0/n =

√0.5 ∗ 0.5/1329 =

√0.000188 = 0.0137

e quindi z − empirico = (p− p0)/√p0q0/n = 1.1795.

77

Page 78: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Poniamo s0 =√p0q0/n = 0.0137 e s1 =

√p1q1/n =

√0.53 ∗ (1− 0.53)/1329 =

√0.000187 = 0.0137.

Allora

γ = P (p− p0

s0> z|H1) = P (p > p0+zs0|H1) = P (

p− p1

s1>p0 + zs0 − p1

s1|H1) = P (Z > −0.5435|H1) = 0.70659

Esercizio 2

(A) Come stimatore di pM − pF si pu utilizzare XM - XF , la cui distribuzione, in base alla dimensionedei campioni di maschi e di femmine, pu essere approssimata da

N(pM − pF ,pMqMnM

+pF qFnF

).

Pertanto possiamo stimare pM con xM = 285/640 = 0.4453, pF con xF = 401/689 = 0.582, pMqM/nMcon xM (1 − xM )/nM = 0.4453(1 − 0.4453)/640 = 0.000386, pF qF /nF con xF (1 − xF )/nF = 0.582(1 −0.582)/689 = 0.000353 e infine pM−pF con 0.4453−0.582 = −0.1367 e σ(XM−XF ) con

√0.000386 + 0.000353 =√

0.000739 = 0.027185.

(B) Dato che α = 0.9 allora z = 1.6449, che unito a quanto detto sopra porta all’intervallo di confidenzacercato [−0.1367− 1.6449 ∗ 0.0272,−0.1367 + 1.6449 ∗ 0.0272] = [−0.1814,−0.092].

Esercizio 3

(A) In base alle ipotesi dell’esercizio, l’opinione espressa da ciascun estratto, Xi si distribuisce come unaBernoulli(p) e il numero di favorevoli X =

∑ni=1Xi come una Binomiale(n, p). Allora E(X) = np =

383 ∗ 0.516 = 197.696 e V (X) = npq = 383 ∗ 0.516 ∗ 0.484 = 95.65.

(B) Il numero di unit abbastanza grande per giustificare l’approssimazione Binomiale(n, p) ≈ N(np, npq),per cui l’intervallo cercato [np− z√npq, np+ z

√npq] = [197.696− 2.326 ∗ 9.78, 197.696 + 2.326 ∗ 9.78] =

[174.944, 220.448].

Esercizio 4

nij Favorevoli Contrari n∗ij Favorevoli Contrari

Maschi 285 355 Maschi 330.35 309.65Femmine 401 288 Femmine 355.65 333.35

C1 = C1rel = 0.1365, C2 = C2rel = 0.13667, χ2 = 24.82362, φ2 = T = 0.01868, Cp = 0.135411.

78

Page 79: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

40 Compito del 29.05.2003

40.1 Testo

Esercizio 1In base alle quotazioni dell’ORO (X1) e del PALLADIO (X2) in un certo periodo, quotazioni espresse inEuro per grammo, sono stati determinati i seguenti momenti: E(X1) = 9.75, E(X2) = 4.16, σ(X1) = 0.82,σ(X2) = 0.49, ρ(X1, X2) = 0.53 (si assuma che i momenti riportati siano quelli ”veri”, non quellicampionari). Supponiamo di acquistare un portafoglio metalli pregiati costituito da 5.9 kg di ORO e 5.1kg di PALLADIO.

(A) Si determini il valore atteso e la deviazione standard del portafoglio acquistato.(B) Si determini la probabilit che il valore del portafoglio salga sopra i 78483 Euro (prezzo al qualeil portafoglio stato acquistato) assumendo che le quotazioni dei due metalli si distribuiscano in modoNormale.

Esercizio 2La quotazione di due titoli azionari del settore bancario, BANCA AQUILA e BANCA PECORA, stataoggetto di osservazione per un periodo di 78 settimane. La seguente tabella riporta alcune statistichecalcolate sui rendimenti settimanali (riportati su base annuale) delle due azioni confrontate con quelledell’intero settore bancario:

media dev. st. corretta 1o quartile mediana 3o quartileBANCA AQUILA 28.55 36.8 1.67 26.13 57.89BANCA PECORA 2.31 19.57 -9.97 -0.41 11.69

Settore bancario 8.13 9.92 1.07 7.85 14.27

(A) Per le sue analisi, un tizio vi ha chiesto un intervallo, affidabile al 98 %, per il rapporto fra le volatilitdei 2 titoli bancari (N.B. dopo avergli chiesto una spiegazione il tizio vi ha detto che per volatilit doveteintendere la deviazione standard). Utilizzando gli strumenti statistici da voi conosciuti, rispondetealla sua richiesta dopo aver formulato le assunzioni necessarie, ivi inclusa l’assunzione che i rendimentidelle due azioni siano indipendenti.(B) La rivista specializzata PUNTO FINANZA pubblica periodicamente le proprie valutazioni. Per lavolatilit del titolo Banca Aquila la rivista ha pubblicato 3 stelle (ogni stella rappresenta una volatilitpari a 10). Secondo voi la rivista ha previsto la volatilit in modo corretto? Si risponda alla domandaformulando il problema in termini di test delle ipotesi ed esplicitando le assunzioni necessarie.

Esercizio 3Con riferimento ai dati dell’esercizio precedente:

(A) Si sottoponga a test l’affermazione, contenuta in un articolo di PUNTO FINANZA, ”i due titolibancari considerati sopra si equivalgono dal punto di vista del rendimento medio”. Si risponda alladomanda dopo aver formulato le assunzioni necessarie, ivi inclusa l’assunzione che i rendimenti delle dueazioni siano indipendenti.(B) Si calcoli la potenza del test utilizzato al punto precedente, in corrispondenza di una formulazionedell’ipotesi alternativa ”rendimento di Banca Pecora inferiore di 7 punti a quello di Banca Aquila”.

Esercizio 4Partendo dai dati sui quali sono state calcolate le statistiche dell’esercizio 2, PUNTO FINANZA hastimato con i minimi quadrati un modello lineare per analizzare in che modo i rendimenti di BANCAPECORA sono legati a quelli dell’intero settore bancario. Del modello ha pubblicato soltanto le seguentistime: β0 = −0.441, β1 = 0.338.

(A) Si fornisca la stima dei minimi quadrati di σ.(B) Si calcoli l’intervallo di previsione per il rendimento di Banca Pecora nel caso in cui il mercato abbiaun rendimento pari a 27 .

79

Page 80: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

40.2 Soluzioni

Esercizio 1

(A) Valore atteso e varianza del portafoglio metalli preziosi possono essere ricavati facilmente dalle for-mule dei momenti per combinazioni lineari di v.c.: E(port.) = E(p1X1 + p2X2) = p1E(X1) + p2E(X2)V (port.) = V (p1X1 + p2X2) = p2

1V (X1) + p22V (X2) + 2p1p2C(X1, X2). Sostituendo p1 = 5900, p2 =

5100, E(X1) = 9.75, E(X2) = 4.16, V (X1) = 0.822 = 0.67, V (X2) = 0.492 = 0.24, C(X1, X2) =ρσ(X1)σ(X2) = 0.53 ∗ 0.82 ∗ 0.49 = 0.213 si ottiene E(port.) = 78741, σ(port.) =

√V (port.) =√

42466816.72 = 6516.66.

(B) Si sfrutta la propriet che la combinazione di v.c. Normali a sua volta Normale. Quindi, in base aicalcoli fatti sopra, P (port. > 78483) = P (Z > (78483− 78741)/6516.66) = P (Z > −0.0396) = 0.5158.

Esercizio 2

(A) X = rendimento di BANCA AQUILA, Y = rendimento di BANCA PECORA: si assume X ∼N(µX , σ

2X), Y ∼ N(µY , σ

2Y ) indipendenti. Prima si costruisce l’intervallo di confidenza per σ2

X/σ2Y

utilizzando come pivotσ2X

σ2Y

S2Y

S2X

∼ F (n − 1,m − 1), ovvero [s2X

s2Y c2

,s2X

s2Y c1

] = [2.0708, 6.038] dove s2X =

36.82 = 1354.24, s2Y = 19.572 = 382.9849 sono ricavati dalle statistiche della tabella mentre c1 = 0.5856

e c2 = 1.7076 sono ricavati dalle tavole della F (77, 77) (1− α = 0.95); poi si fa la radice quadrata dei 2estremi di tale intervallo per ricavare quello cercato [1.439 , 2.4572 ].

(B) Come sopra si assume X ∼ N(µ, σ2) e si sottopone a test H0 : σ = 30 contro H1 : σ 6= 30. Come v.c.test si utilizza (n− 1)S2/σ2 ∼ χ2(n− 1), che sotto H0 vale ((n− 1)S2/σ2

0 |H0) ∼ χ2(n− 1). La regione diaccettazione per la statistica indicata (scegliendo α = 0.05) data da [54.6234 ,103.1581 ], da confrontarecol valore campionario (n− 1)s2/σ2

0 = (78− 1) ∗ 36.82/302 = 115.8628.

Esercizio 3

(A) Le assunzioni sono identiche a quelle formulate al punto A dell’esercizio precedente. Si deve sottoporrea test H0 : µX−µY = 0 contro H1 : µX−µY 6= 0. Considerata la dimensione dei campioni a disposizione,

si pu utilizzare la v.c. testX − Y − (µX − µY )√

S2X/m+ S2

Y /n≈ N(0, 1), che sotto H0 vale (

X − Y√S2X/m+ S2

Y /n|H0) ≈

N(0, 1). Indicando per brevit s =√s2X/m+ s2

Y /n =√

36.82/78 + 19.572/78 = 4.7193, la regionedi accettazione per la statistica X − Y (scegliendo α = 0.05) allora data da [c1, c2] = [−zs, zs] =[−9.2497, 9.2497], dove z = 1.96. La regione di accettazione deve essere confrontata col valore campionariox− y = 28.55− 2.31 = 26.24.

(B) La formulazione dell’alternativa µX−µY = 7. Allora γ = P (campione ∈ R|H1) = 1−P (campione ∈A|H1) = 1− P (c1 ≤ X − Y ≤ c2|H1) = 1− P [(c1 − 7)/s ≤ Z ≤ (c2 − 7)/s|H1) = 1− P [−3.4432 ≤ Z ≤0.4767|H1) = 1− (0.6832− 0.0003) = 0.3171.

Esercizio 4

(A) y = BANCA PECORA e x = settore bancario, la stima dei minimi quadrati di σ pu essere ottenutacon la formula seguente: σ2 = (dev(y)−β2

1dev(x))/(n−2) = (29489.8373−0.3382 ∗7577.2928)/(78−2) =376.6339, da cui σ = 19.4071. Le due devianze sono calcolate dalle deviazioni standard: dev(x) =(n− 1)s2

X = (78− 1) ∗ 9.922 = 7577.2928, dev(y) = (n− 1)s2Y = (78− 1) ∗ 19.572 = 29489.8373.

(B) m = E[y(x0)] = β0 + β1x0 = −0.441 + 0.338 ∗ 27 = 8.685, s2 = σ2( E[y(x0)]) = (1/n + (x −x0)2/dev(x))σ2 = (1/78 + (8.13− 27)2/7577.2928) ∗ 376.6339 = 22.5277, da cui s = 4.7463. L’intervalloallora [m− ts,m+ ts] = [−0.7681, 18.1381], dove t = 1.9917.

80

Page 81: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

41 Compito del 04.06.2003

41.1 Testo

Esercizio 1Sia Ω uno spazio campionario e siano A e B due eventi di Ω, con P (A) = 0.36 e P (A

⋃B) = 0.91 . Si

calcoli P (B) nei seguenti due casi:(a) I due eventi sono indipendenti.(b) I due eventi sono incompatibili. In questo caso sono indipendenti?

Esercizio 2In un sondaggio condotto su 100 fiorentini e stato rilevato che 48 si recheranno a votare per il prossimoreferendum e 52 no. Per la validita del referendum piu del 50% degli aventi diritto deve recarsi alle urne.(a) Calcolare l’intervallo di confidenza per la proporzione di coloro che andranno a votare (1−α = 0.95).(b) E’ possibile affermare che il quorum verra raggiunto? Rispondere al quesito utilizzando un appropriatotest d’ipotesi (α = 0.05).

Esercizio 3Si vuole verificare se il reddito lordo medio dei non intenzionati a votare e superiore di quello degliintenzionati a votare. Il sondaggio ha fornito i seguenti risultati.

Statistiche calcolate sul campione sottoposto a sondaggio

Intenzionati a votare Non intenzionati a votareNumerosita 48 52Media del reddito 18457 21475Devianza del reddito 1992729600 3701505600

(a) Sia X2 il reddito medio campionario dei non intenzionati a votare e X1 quello degli intenzionati avotare. Indicare la distribuzione campionaria di X2 −X1 specificando le assunzioni necessarie.(b) Si sottoponga a verifica l’ipotesi ”il reddito medio dei non intenzionati a votare non e superiore aquello degli intenzionati a votare” (α = 0.01).(c) Calcolare la potenza del test nel caso in cui l’ipotesi alternativa sia ”il reddito medio dei non votantisupera quello dei votanti di 5000 euro”, assumendo che la varianza ”vera” del reddito sia 41515149 per ivotanti e 71182745 per i non votanti.

Esercizio 4La stessa indagine dell’esercizio 2 e stata condotta a Milano su un campione di 140 residenti: 41 intervi-stati hanno dichiarato che intendono recarsi alle urne e 99 no.(a) Indicare uno stimatore corretto della differenza tra la proporzione di votanti a Firenze e a Milano edla sua deviazione standard. Fornire una stima di tale deviazione standard.(b) Verificare se i risultati campionari evidenziano una diversa tendenza alla partecipazione al referendumtra milanesi e fiorentini.

41.2 Soluzioni

Esercizio 1P (A

⋃B) = P (A) + P (B)− P (A

⋂B) = P (A) + P (B)− P (A)P (B), da cui: P (B) = 0.8594

P (A⋃B) = P (A) + P (B), da cui P (B) = 0.5500

Esercizio 2p = 0.4800(a) Intervallo di confidenza per p: [0.3821; 0.5779]

81

Page 82: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(b) Test d’ipotesi unilaterale su una proporzione con H0 : p ≥ 0.5 e H1 : p < 0.5.Zoss = −0.4000, Zcrit = −1.6449, Accetto H0

Esercizio 3

a) Assumendo che Xi ∼ N(µi, σ2), i = 1, 2, si ha che

(X2 −X1)− (µ2 − µ1)

Spooled√

1/m+ 1/n∼ T (m+ n− 2);

oppure, assumendo che Xi ∼ N(µi, σ2i ), i = 1, 2, e sfruttando la dimensione sufficientemente grande dei

due campioni, si ha che(X2 −X1)− (µ2 − µ1)√

S22/n+ S2

1/m≈ N(0, 1)

(b) Test d’ipotesi unilaterale su differenza tra medie per (campioni indipendenti): H0 : µ2−µ1 ≤ 0 controH1 : µ2 − µ1 > 0.s1 =6511.413 , s2 =8519.304 , spooled = 7622.627 , numeratore(Z) = x2−x1 = 3018.000 , denominatore(Z) =

spooled√

1/m+ 1/n = 1525.746 , Zoss =1.978 Zcrit = 2.326 , Accetto H0

oppures1 =6511.413 , s2 =8519.304 , numeratore(Z) = x2−x1 = 3018.000 , denominatore(Z) =

√s2

1/m+ s22/n

= 1524.862 , Zoss =1.979 Zcrit = 2.326 , Accetto H0

(c) Potenza: 0.8459

Esercizio 4

(a) Stimatore: pM − pF . σ(pM − pF ) :pM qMnM

+pF qFnF

=0.0630

(b) Test d’ipotesi bilaterale sulla differenza tra proporzioni con H0 : pF − pM = 0 e α = 0.05.pF = 0.4800 pM = 0.2929, per cui, sotto H0 σ(pF − pM ) =

√pq(1/m+ 1/n) = 0.0632 dove p =

(pFm+ pMn)/(m+ n) = 0.3708Zoss = (pF − pM )/σ(pF − pM ) = 2.9591Zcrit = ±1.9600Rifiuto H0

82

Page 83: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

42 Compito del 25.06.2003

42.1 Testo

Esercizio 1L’UNIONE INDUSTRIALI di Lecco ha effettuato, presso le imprese associate, una rilevazione congiun-turale per conto della CONFINDUSTRIA. A ciascuna impresa stato chiesto se, rispetto al semestre incorso, nel prossimo si aspetta ordinativi in calo, stabili o in crescita. Le risposte sono riportate nellaseguente tabella.

In calo Stabili In crescita TotaleTendenza ordinativi 32 72 28 132

Si consideri la v.c. che associa alla ”tendenza degli ordinativi”, secondo le classi indicate, rispettivamentei valori -1, 0 ed 1 con probabilit uguali alle frequenze relative ricavabili dalla tabella.

(A) Si disegni la funzione di massa della v.c.(B) Si determini il valore atteso e la deviazione standard della v.c.(C) Si disegni la funzione di ripartizione della v.c.

Esercizio 2L’UNIONE INDUSTRIALI di Lecco ha anche chiesto a ciascuna delle 132 imprese associate di indicare,in percentuale, di quanto variato il proprio fatturato nel semestre in corso rispetto a quello precedente.Le principali statistiche della rilevazione sono riportate nella seguente tabella.

media varianza corretta 1o quartile mediana 3o quartileVariazione % fatturato -1.5 240.57 -13.08 -2.46 10.48

Si indichi con X la variazione del fatturato rispetto al semestre precedente e si assuma che la suadistribuzione sia approssimativamente normale.

(A) Fornire una stima puntuale e una stima per intervallo (1− α = 0.9) della deviazione standard di X.(B) Sfruttando le informazioni di questa rilevazione si determini la dimensione del campione da intervi-stare nel caso in cui si voglia ottenere un intervallo di confidenza per la media di X di ampiezza 4.42 allivello di confidenza 0.99 .

Esercizio 3Negli ultimi 10 giorni lavorativi, all’UNIONE INDUSTRIALI di Lecco sono giunte le seguenti richiestedi CIG (Cassa integrazione guadagni):

Lu 2 Ma 3 Me 4 Gio 5 Ve 6 Lu 9 Ma 10 Me 11 Gio 12 Ve 13Richieste di CIG 3 5 5 5 6 2 7 5 8 6

(A) Si scelga, fra quelli noti, il modello probabilistico pi opportuno per rappresentare la v.c. ”numero dirichieste giornaliere di CIG” e stimarne il parametro.(B) Sulla base del campione sottoporre a test l’affermazione, fatta dall’UNIONE INDUSTRIALI di Lecco,”in questo periodo si riceve una media di 4.7 richieste di CIG al giorno” contro l’affermazione alterna-tiva ”la media delle richieste giornaliere di CIG inferiore a quanto dichiarato” (α = 0.1). Malgrado ladimensione del campione sia modesta, si risolva il problema ricorrendo ad opportune approssimazioni.

Esercizio 4Si considerino i dati e il problema di cui all’esercizio 3:

(A) Si determini la potenza del test costruito all’esercizio precedente in corrispondenza dell’ipotesialternativa ”il numero medio di richieste giornaliere di CIG 4.2 ”.(B) Nelle condizioni di cui al punto A si determini la dimensione del campione necessaria per ottenereuna potenza del test pari a 0.87 .

83

Page 84: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

42.2 Soluzioni

Esercizio 1

Sia X la v.c. considerata. Le soluzioni si ricavano in base al prospetto di calcolo sotto riportato: lafunzione di massa data dalle prime due righe; E(X) = −0.0303; V (X) = E(X2) − E(X)2 = 0.4545 −−0.03032 = 0.4536; σ(X) =

√V (X) =

√0.4536 = 0.6735; la funzione di ripartizione riportata nelle

ultime due righe.

x -1 0 1 altrove Totalef(x) 0.2424 0.5455 0.2121 0 1

xf(x) -0.2424 0 0.2121 0 E(X) = -0.0303x2f(x) 0.2424 0 0.2121 0 E(X2) = 0.4545

x < −1 ∈ [−1, 0) ∈ [0, 1) ≥ 1F (x) 0 0.2424 0.7879 1

Esercizio 2

(A) Stima puntuale: s =√

240.57 = 15.5103. Stima per intervallo: 1. prima si costruisce l’intervallo perσ2 mediante il pivot (n− 1)S2/σ2 ∼ χ2(n− 1): [(n− 1)s2/c2, (n− 1)s2/c1] = [198.5652, 298.5468], doven = 132, S2 = 240.57, α = 0.1, c1 = 105.5602, c2 = 158.7119; 2. poi si fa la radice dei due estremi pertrovare l’intervallo per σ: [14.0913, 17.2785].

(B) L’ampiezza dell’intervallo per µ data da A = 2zσ/√n. Ricavando n si ottiene n = (2zσ/A)2 =

18.07782 = 326.8068 ' 327 dove α = 0.01, z = 2.5758, A = 4.42 e σ stimato con 15.5103 .

Esercizio 3

Sia X la v.c. ”numero di richieste giornaliere di CIG”. Si assume X ∼ Poisson(λ).

(A) λ = x = 52/10 = 5.2.

(B) H0 : λ = λ0 contro H1 : λ < λ0, dove λ0 = 4.7. Ricorrendo all’approssimazione normale si haX ' N(λ, λ/n) per cui, sotto H0, (X|H0) ≈ N(λ0, λ0/n). Per decidere si confronta z − empirico =(x − λ0)/

√λ0/n = 0.7293 contro R = (−∞, z = −1.2816) oppure x = 5.2 contro R = (−∞, c =

λ0 + z√λ0/n = 3.8214, dove α = 0.1, n = 10, λ0/n = 0.47,

√λ0/n = 0.6856.

Esercizio 4

Rispetto all’esercizio precedente abbiamo H1 : λ = λ1, dove λ1 = 4.2.

(A) γ = P (X ∈ R|H1) = P (X < c|H1) = P [(X − λ1)/√λ1/n < (c − λ1)/

√λ1/n|H1] = P (Z <

−0.5842) = 0.2796, dove c = 3.8214, λ1/n = 0.42 e√λ1/n = 0.6481.

(B) Sfruttando i passaggi visti sopra abbiamo γ = P [Z < (c − λ1)/√λ1/n|H1]. Essendo γ = 0.87

allora, dalle tavole, (c − λ1)/√λ1/n = 1.1264. Sostituendo a c la sua espressione (non il suo valore,

perche questo calcolato con n = 10, non con l’n da trovare!) cio c = λ0 + z√λ0/n, possiamo ricavare n:

1.1264 = (c− λ1)/√λ1/n =

√n(λ0 − λ1)/

√λ1 + z

√λ0/√λ1 =

√n0.244 +−1.3557, da cui

√n = 10.1735

e n = 103.5002 ' 104.

84

Page 85: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

43 Compito del 17.07.2003

43.1 Testo

Esercizio 1 Un’associazione di consumatori ritiene che troppe confezioni di gelato IceIce siano sottopeso.Un rappresentante si reca in un supermercato e ne compra 8 a caso.(a) Se nel bancofrigo del supermercato c’erano in tutto 26 confezioni, di cui 11 sottopeso, qual e laprobabilita che nel campione acquistato ve ne siano piu di 6 sottopeso?(b) Si supponga ora di non sapere quante delle 26 confezioni del bancofrigo siano sottopeso, ma solo chela loro proporzione e identica a quella prodotta dalla IceIce. Si vuole sottoporre a test l’ipotesi H0 chela proporzione delle confezioni sottopeso sia 0.5 contro l’ipotesi alternativa che sia > 0.5 utilizzando laregola decisionale ”si rifiuta H0 se il campione ha piu di 6 confezioni sottopeso”. Calcolare la probabilitadi commettere un errore di primo tipo utilizzando la definizione

Esercizio 2 Si decide di valutare anche il peso delle confezioni. Si comprano 5 nuove confezioni a caso.Il peso delle confezioni campionate e riportato nella tabella seguente.

Peso in grammi 495.5 498.8 501.2 499.2 500.0

(a) Verificare se il peso medio delle confezioni di gelato sia pari a 500gr contro l’ipotesi che sia inferiore(α = 0.05), ipotizzando che il peso si distribuisce normalmente.(b) Determinare l’intervallo di confidenza per la deviazione standard del peso delle confezioni (1 − α =0.99).

Esercizio 3 La IceIce si giutifica dicendo che il problema si limita al macchinario che confeziona il gustocioccolato. L’associazione effettua quindi un’indagine estesa, classificando le confezioni sia per peso chegusto. Le frequenze ottenuti sono riportate nella tabella seguente.

Sottopeso Non sottopesoCioccolato 36 26Altri gusti 31 32

(a) Sulla base delle frequenze riportate ricavare le distribuzioni probabilita condizionate del peso datocioccolato e del peso dato altri gusti.(b) Verificare la veridicita della giustificazione delle IceIce mediante un test del confronto fra proporzioniin sottopeso per i due gusti (α = 0.05).

Esercizio 4 Ancora una volta si decide di esaminare il peso delle confezioni. Si estraggono due campionidi confezioni, uno al cioccolato, l’altro di altri gusti. Alcune statistiche dei due campioni sono riportatinella tabella seguente.

Gusto numero osservazioni media deviazione standard correttaCioccolato 5 494.80 2.80Altri gusti 5 500.20 3.70

(a) Sottoporre a test l’ipotesi di uguaglianza fra le varianze del peso per i due gusti (α = 0.01).(b) Calcolare un intervallo di confidenza per la differenza del peso medio delle confezioni nei due gusti(1− α = 0.95)

43.2 Soluzioni

Esercizio 1(a) P (X ≥ 7) = P (X = 7) + P (X = 8) = 0.00317 +0.00011 = 0.00327 , calcolata dalla ipergeometricacon N =26 , K =11 , n =8(b) α = P (campione ∈ R|H0) = P (X ≥ 7|H0) = P (X = 7|H0) + P (X = 8|H0) = 0.01428 +0.00082

85

Page 86: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

=0.01510 , calcolata dalla ipergeometrica con N =26 , K = Np0 = 13 , n =8

Esercizio 2(a) Test d’ipotesi unilaterale su una media, con varianza ignota.H0 : µ = 500 vs H1 : µ < 500x = 498.9400, toss = −1.1127 e tα = −2.1318Accetto H0

(b) L’intervallo deriva da quello per la varianza, media ignota.1.2215 ≤ σ2 ≤ 87.6954 .1.1052 ≤ σ ≤ 9.3646 .

Esercizio 3(a)P (sottop.|ciocco.) = 0.5806 P (nonsottop.|ciocco.) = 0.4194P (sottop.|altri) = 0.4921 P (nonsottop.|altri) = 0.5079

(b) Test per il confronto tra proporzioni. Chiamo pc la proporzione di sottopeso delle confezioni alcioccolato e pa quella degli altri gusti.H0 : pc − pa = 0 vs H1 : pc − pa > 0pc = 0.5806 pa = 0.4921zoss = 0.9970Zcrit = 1.6449Accetto H0

Esercizio 4(a) Test per il confronto tra varianze.H0 : σ2

c = σ2a vs H1 : σ2

c 6= σ2a

σ2c = 7.8400 σ2

a = 13.6900Foss = 0.5727Fcrit,α/2 = 0.0432 Fcrit,(1−α/2) = 23.1545Accetto H0

(b) Intervallo di confidenza per la differenza di medie, sapendo, che le variabili sono Normali e, dalpunto precedente, che le varianze sono uguali.−10.1852 ≤ µc − µa ≤ −0.6148.

86

Page 87: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

44 Compito del 05.09.2003

44.1 Testo

Esercizio 1Una legge di un Paese straniero stabilisce che il limite di velocit sulle strade extra-urbane deve essere fissatosecondo criteri statistici. Una rilevazione effettuata su un certo tratto di strada misurando la velocit dipercorrenza dei veicoli, secondo i criteri stabiliti in tale legge, ha fornito i risultati della seguente tabella.

Velocit (km/h) [0,50) [50,60) [60,70) [70,90) [90,110) [110,150] TotaleAutovetture 97 583 1587 2780 198 1 5246

(A) Si rappresenti graficamente la distribuzione della velocit.(B) Supponendo di disporre soltanto dei dati della tabella, si determini a quale valore dovrebbe esserefissato il limite di velocit, che secondo la legge deve essere pari al terzo quartile della distribuzione di talevariabile.

Esercizio 2Un’analisi grafica della distribuzione della velocit di cui al precedente esercizio suggerisce che la stessapu essere rappresentata abbastanza bene mediante una distribuzione Normale.

(A) Si ricavi il valore dei parametri di tale distribuzione uguagliando i valori teorici della mediana e delloscarto interquartile ai corrispondenti valori empirici.(B) In base alla distribuzione normale ottenuta, entro quale intervallo, simmetrico rispetto alla media,compresa la velocit del 80 % delle autovetture?

Esercizio 3Al fine di limitare gli incidenti stata introdotta una nuova disposizione di legge. La seguente tabellaconfronta il numero di incidenti rilevati su un certo tratto di strada nelle stesse 5 settimane del 2002 edel 2003:

Settimana 4a Giugno 1a Luglio 2a Luglio 3a Luglio 4a LuglioIncidenti anno 2002 17 28 20 19 20Incidenti anno 2003 19 17 16 19 14

(A) Si sottoponga a test l’ipotesi nulla che, in media, il nuovo provvedimento legislativo non abbiadiminuito il numero di incidenti, specificando le ipotesi necessarie.(B) Si determini la potenza del test in corrispondenza dell’ipotesi alternativa ”nel tratto di strada consi-derato si avuta in media una diminuzione di 8 incidenti alla settimana” (pur non essendo completamentegiustificata si utilizzi l’approssimazione Normale della v.c. test considerata).

Esercizio 4Per aumentare il livello di sicurezza, sono stati aumentati i controlli sulle strade, con particolare riguardoal livello di alcool nel sangue. A questo proposito, in uno studio condotto su un campione di 67 individuidi sesso maschile stato utilizzato il modello di regressione y = β0 + β1x + u per valutare la relazionefra x = tasso di alcool nel sangue in g/l e y = tempi di reazione ad uno stimolo (come un ostacolo

in avvicinamento) in secondi. Le stime ottenute sono state β0 = 0.287, β1 = 0.7696, σ = 0.05017,

σ(β0) = 0.01277, σ(β1) = 0.01829, Cov(β0, β1) = −0.0002.

(A) Si costruisca un intervallo di confidenza al 99 % per σ.(B) Si stimi il residuo per l’osservazione di coordinate (xi, yi) = (1.1959 , 1.2278 ).(C) Si sottoponga a test l’ipotesi nulla che ”ad un livello di alcool nel sangue pari a 0.8 g/l (limite dilegge) i tempi medi di reazione sono pari a 0.9 secondi”.

44.2 Soluzioni

Esercizio 1

(A) Variabile continua raggruppata in classi: rappresentazione grafica istogramma.

87

Page 88: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Velocit (km/h) [0,50) [50,60) [60,70) [70,90) [90,110) [110,150) TotaleAutovetture 97 583 1587 2780 198 1 5246

ampiezza di classe (basi) 50 10 10 20 20 40densit di frequenza (altezze) 1.94 58.3 158.7 139 9.9 0.025

(B) La classe contenente Q3 [70 , 90 ], che ha densit 139 e lascia a sinistra una frequenza pari a 2267 .Allora Q3 = 70 + (0.75 ∗ 5246− 2267)/139 = 81.996.

Esercizio 2

(A) Per le caratteristiche della distribuzione Normale abbiamo µ = mediana empirica, Q3 = µ + σz0.75

e Q1 = µ + σz0.25 = µ − σz0.75, da cui µ = mediana empirica = 72.561 , σ = (Q3 − Q1)/(2z0.75) =(63.979− 81.996)/(2 ∗ 0.674) = 13.356.

(B) 0.8 = P (a ≤ X ≤ b) = P [(a − µ)/σ ≤ (X − µ)/σ ≤ (b − µ)/σ] = P (−z ≤ Z ≤ z). Dalle tavolez = 1.282 e quindi a = µ− σz = 55.445, b = µ+ σz = 89.678.

Esercizio 3

Test per dati appaiati. Si lavora sulle differenze D = X2002 − X2003 ipotizzando D ∼ N [µD, σ2], con

H0 : µD ≤ 0 vs H1 : µD > 0. L’ipotesi nulla, sulla base della teoria, trasformata in H0 : µD = 0 e ilcampione estratto da D risulta

Settimana 4a Giugno 1a Luglio 2a Luglio 3a Luglio 4a Lugliod -2 11 4 0 6

(A) La v.c. test D, la cui distribuzione, nelle assunzioni di cui sopra, data in generale da [D −µD]/[SD/

√n] ∼ T (n− 1). Allora 0.05 = P [campione ∈ R|H0] = P [D > c|H0], dove c = 0 + tSD/

√n =

6.3556 (t = 2.7764, SD = 5.1186, n = 5), da confrontare col valore campionario d = 3.8.

(B) γ = P [campione ∈ R|H1] = P [D > c|H1] = P [(D − 8)/(SD/√n) > (c − 8)/(SD/

√n)|H1] = P [T >

−0.7184|H1] = 0.7439 se si usa la T (4) oppure = 0.7637 se si usa l’approssimazione Normale.

Esercizio 4

(A) Pivot: (n − 2)σ2/σ2 ∼ χ2(n − 2). L’intervallo al 99 % per σ2 [σ2(n − 2)/c2, σ2(n − 2)/c1] =

[0.001668, 0.004154], dove c1 = 39.3831, c2 = 98.1051, σ2 = 0.002517 e n = 67. Per trovare l’intervalloper σ basta fare la radice dei due estremi dell’intervallo per σ2: [0.040837, 0.064453].

(B) ui = yi − β0 − β1xi = 1.2278− 0.287− 0.7696 ∗ 1.1959 = 0.020435.

(C) Per brevit si indichi E(y|x = 0.8) = β0 + β10.8 = m. Allora H0 : m = 0.9 vs H1 : m 6= 0.9. La v.c.

test m = β0 + β10.8, il cui valore campionario 0.287 + 0.7696 ∗ 0.8 = 0.9027, la cui deviazione standard

pu essere stimata con σ(m) =

√σ2(β0) + 0.82σ2(β1) + 2 ∗ 0.8 ∗ Cov(β0, β1) =

√5.72e− 005 = 0.00756 e

la cui distribuzione, nelle assunzioni di cui sopra, data in generale da [m−m]/σ(m) ∼ T (n− 2). Allora0.95 = P [campione ∈ A|H0] = P [c1 ≤ m ≤ c2|H0], dove c1 = 0.9− tσ(m) = 0.8849, c2 = 0.9 + tσ(m) =0.9151 (t = 1.9971 ), da confrontare col valore campionario m = 0.9027.

88

Page 89: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

45 Compito del 18.09.2003

45.1 Testo

Esercizio 1Un dirigente della GIKE-sport ha deciso di analizzare il comportamento di acquisto dei clienti del princi-pale punto vendita. Dopo aver estratto un campione casuale di scontrini relativi al semestre INVERNALEottobre-marzo, su suggerimento ha iniziato a studiare la variabile X = logaritmo naturale dell’importodi uno scontrino. Dai dati del campione ha ricostruito la seguente distribuzione di frequenza per X.

x [2.3,3.4) [3.4,4.1) [4.1,4.7) [4.7,5.3) [5.3,6) [6,7] Totalen. scontrini 44 47 39 25 14 1 170

(A) Si rappresenti graficamente la distribuzione di X rilevata nel campione.(B) Un cliente sta pagando la merce acquistata ad una cassa riservata a coloro che spendono meno di200 Euro (N.B. arrotondato, il logaritmo naturale di 200 5.3). Ipotizzando che il cliente sia stato estrattocasualmente secondo la distribuzione di probabilit ricavabile dalla tabella, determinare la probabilit cheegli spenda meno di 60 Euro (N.B. arrotondato, il logaritmo naturale di 60 4.1).

Esercizio 2Il dirigente della GIKE-sport ha proseguito nell’analisi. Dal grafico di cui al punto precedente egli hanotato che la distribuzione di X pu essere bene approssimata da una Normale. Sul campione ha alloracalcolato le seguenti statistiche:

Media Varianza corretta Mediana4.036 0.828 4.022

(A) Si suggerisca, fornendone l’espressione analitica, uno stimatore per la media di X e uno per ladeviazione standard di X, giustificando la scelta. In base a questi si fornisca la stima della media e lastima della deviazione standard dello stimatore della media.(B) Si determini l’intervallo di confidenza al 98 % per la media di X.

Esercizio 3Con riferimento al testo dell’esercizio precedente:

(A) Si determini quanto avrebbe dovuto essere la dimensione del campione per avere un intervallo per lamedia di X, al livello di confidenza indicato, di ampiezza pari a 0.092 .(B) Si determini l’intervallo di confidenza al 99 % per la deviazione standard di X.

Esercizio 4Il dirigente ha infine deciso di confrontare quanto spende la clientela ESTIVA rispetto a quella INVER-NALE. Ha estratto un campione casuale di scontrini relativi al semestre ESTIVO aprile-settembre, e sullogaritmo naturale dell’importo ha calcolato le seguenti statistiche campionarie:

totale scontrini Media Varianza corretta Mediana170 4.471 3.073 4.459

(A) Si sottoponga a test l’ipotesi nulla ”la variabilit del logaritmo naturale della spesa uguale nei dueperiodi”.(B) Si sottoponga a test l’ipotesi nulla ”mediamente i clienti spendono pi in inverno che in estate”.

45.2 Soluzioni

Esercizio 1

(A) Variabile continua raggruppata in classi: rappresentazione grafica istogramma.

89

Page 90: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

x [2.3,3.4) [3.4,4.1) [4.1,4.7) [4.7,5.3) [5.3,6) [6,7] Totalen. scontrini 44 47 39 25 14 1 170

ampiezza di classe (basi) 1.1 0.7 0.6 0.6 0.7 1densit di frequenza (altezze) 40 67.143 65 41.667 20 1

(B) S = spesa; X = lnS. Allora P (S < 60|S < 200) = P (X < 4.1|X < 5.3) = P [(X < 4.1)⋂

(X <5.3)]/P (X < 5.3) = P (X < 4.1)/P (X < 5.3) = (44 + 47)/(44 + 47 + 39 + 25) = 0.587.

Esercizio 2

(A) Siano µX = E(X) e σ2X = V (X). Allora µX = X =

∑ni=1Xi/n e σ2

X = S2X =

∑ni=1(Xi−X)2/(n−1)

sono stimatori dei parametri corrispondenti dalle ottime propriet. Allora x = 4.036 e, poich V (X) =

σ2X/n, abbiamo σ(X) =

√V (X) =

√σ2X/n =

√0.828/170 = 0.07.

(B) Il pivot (X − µX)/(SX/√n) ∼ T (n− 1). L’intervallo per µX al 98 %: [x− tsX/

√n, x+ tsX/

√n] =

[3.872, 4.2], dove x = 4.036, sX = 0.91, n = 170, t = 2.349.

Esercizio 3

(A) A = ampiezza intervallo. Utilizzando la N(0, 1) come distribuzione approssimata del pivot (ricordareche n incognito) allora, n = (2zsX/A)2 = 2118, dove z = 2.3263, A = 0.092 e sX = 0.9099 una stima diσX .

(B) Il pivot S2X(n − 1)/σ2

X ∼ χ2(n − 1). Intervallo per σ2X al 99 %: [(n − 1)s2

X/c2, (n − 1)s2X/c1] =

[0.6358, 1.1159], dove sX = 0.9099, n = 170, c1 = 125.4012, c2 = 220.1025. Corrispondente intervallo perσX : [0.7973, 1.0563], dove gli estremi sono la radice quadrata degli estremi dell’intervallo per σ2

X .

Esercizio 4

Y = ln(spesa estiva)

(A) H0 : σ2Y /σ

2X = 1 contro H1 : σ2

Y /σ2X 6= 1. La v.c. pivot (S2

Y /S2X |H0) ∼ F (m − 1, n − 1), da cui:

regione accettazione [0.7389 ,1.3533 ], da confrontare col valore campionario 3.073 /0.828 = 3.7114 .

(B) L’ipotesi in oggetto pu, in ultima analisi, essere testata sottoponendo a test H0 : µX − µY = 0 vsH1 : µX −µY < 0. Viste le dimensioni dei due campioni e la possibilit di rifiutare l’ipotesi di cui al punto(A), ragionevole utilizzare la v.c. test (X−Y )/

√S2X/n+ S2

X/m|H0 ≈ N(0, 1). In questo caso: la regione

di rifiuto [−∞,−1.6449] da confrontare col valore campionario -2.8716 (√S2X/n+ S2

X/m = 0.1515).Nel caso in cui l’ipotesi di cui al punto (A) venga accettata, l’ipotesi pu essere testata mediante la v.c. test

(X−Y )/√S2p(1/n+ 1/m)|H0 ∼ T (n+m−2), la regione di rifiuto [−∞,−1.6494] da confrontare col valore

campionario -2.8716 (s2p = (s2

X(n− 1) + s2Y (m− 1))/(n+m− 2) = 1.9505,

√s2p(1/n+ 1/m) = 0.1515).

In realt si pu dimostrare che il valore campionario delle due statistiche, nel caso in cui m = n, identico;cambia solo, leggermente, la regione critica per effetto della diversa distribuzione.

90

Page 91: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

46 Compito del 17.12.2003

46.1 Testo

Esercizio 1Ad un centro trasfusionale si presentano donatori dell’associazione LA-VIE e di altre associazioni. Leinformazioni a disposizione del centro trasfusionale sono le seguenti: 1) ogni 100 donatori, 62 sono associatiLA-VIE e 38 di altre associazioni; 2) il numero medio di donazioni annue 3.2 per i donatori LA-VIE e0.9 per i donatori di altre associazioni. Assumendo che il numero di donazioni in un anno si distribuiscesecondo una Poisson:

(A) Calcolare la probabilit che un donatore faccia almeno 2 donazioni;(B) Calcolare la probabilit che un donatore appartenga ad altre associazioni sapendo che egli ha fattoalmeno 2 donazioni.

Esercizio 2Prima di effettuare un prelievo di sangue, ai donatori viene misurato il livello di emoglobina. Le misura-zioni effettuate sui donatori che si sono presentati una mattina hanno dato i risultati riportati in tabella(dati in g/dl).

Maschi 15.2 15.2 14.1 15.2 13.9Femmine 14.5 14.7 13.8

(A) Calcolare, in percentuale, quanta parte della variabilit del livello di emoglobina spiegata dal sesso ecommentare il risultato.(B) Riempiendo la tabella seguente, fare un esempio di situazione in cui il sesso spiega il 100% dellavariabilit del livello di emoglobina.

Maschi ...... ...... ...... ...... ......Femmine ...... ...... ......

Esercizio 3Con riferimento ai dati dell’esercizio precedente, si assuma che il livello di emoglobina si distribuiscanormalmente sia nei maschi che nelle femmine.

(A) Si determini un intervallo di confidenza al 99.5 % per la deviazione standard del livello di emoglobinanei maschi.(B) Si assuma che la deviazione standard sia la stessa nei due sessi. Con l’obiettivo di stimare taledeviazione standard, si scelga un opportuno stimatore, se ne fornisca l’espressione analitica, se ne indichila distribuzione e si fornisca la stima puntuale del parametro in oggetto.

Esercizio 4Con riferimento ai dati dell’esercizio 2 e mantenendo le assunzioni di normalit e di uguaglianza delledeviazioni standard fra maschi e femmine:

(A) Si sottoponga a test l’ipotesi nulla che maschi e femmine hanno lo stesso livello di emoglobina control’ipotesi che quella dei maschi sia maggiore (α = 0.1 ).(B) Si determini la potenza del test per l’ipotesi nulla di cui al punto precedente, in corrispondenzadell’ipotesi alternativa ”il livello di emoglobina dei maschi superiore di 0.63 g/dl a quello delle femmine”,assumendo che la deviazione standard nei due sessi nota e pari a 0.854 .

46.2 Soluzioni

Esercizio 1

Indichiamo LA-VIE = L. Sappiamo che: P (L) = 0.62, P (L) = 0.38, X|L ∼ Poisson(λL = 3.2), X|L ∼Poisson(λL = 0.9).

91

Page 92: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Mediante la formula della probabilit marginale si ha: P (X ≥ 2) = P (X ≥ 2|L)P (L) + P (X ≥2|L)P (L) = 0.60031, dove:P (X ≥ 2|L) = 1− [P (X = 0|L) + P (X = 1|L)] = 0.8288P (X ≥ 2|L) = 1− [P (X = 0|L) + P (X = 1|L)] = 0.22752P (X = 0|L) = exp(−λL) = 0.04076, P (X = 1|L) = exp(−λL)λL = 0.13044,P (X = 0|L) = exp(−λL) = 0.40657, P (X = 1|L) = exp(−λL)λL = 0.36591.

(B) P (L|X ≥ 2) = P (X ≥ 2|L)P (L)/P (X ≥ 2) = 0.14402 (gli elementi per il calcolo sono stati trovatial punto precedente).

Esercizio 2

Indichiamo MASCHIO = M e FEMMINA = F.

(A) yM = 73.6/5 = 14.72, yF = 43/3 = 14.3333, y = 116.6/8 = 14.575, da cui Dev(B) = 0.2803,Dev(T ) = 2.475. Il sesso spiega quindi il 11.33 % della variabilit complessiva.

(B) Affinch il sesso spieghi il 100% della variabilit complessiva occorre che la devianza within sia 0, cioche non ci sia variabilit sia fra i maschi che fra le femmine. Esempio:

Maschi 14.5 14.5 14.5 14.5 14.5Femmine 13.4 13.4 13.4

Esercizio 3

Indichiamo con X ed Y , rispettivamente, il livello di emoglobina dei maschi e delle femmine.

(A) Pivot: S2X(5−1)/σ2, la cui distribuzione, in base alle assunzioni fatte, χ2(4). Intervallo di confidenza

per σ2: [4s2X/c2, 4s

2X/c1] = [0.10643, 12.06625] dove c1 = 0.14487 e c2 = 16.42394 sono ricavati dalle

tavole della χ2(4), mentre s2X = 0.437. L’intervallo per σ si ottiene facendo la radice quadrata dei due

estremi dell’intervallo precedente: [0.32624 , 3.47365 ].

(B) Stimatore per la varianza comune σ2: varianza campionaria pooled S2P = [S2

X(5 − 1) + S2Y (3 −

1)]/(5 + 3− 2), dove S2X e S2

Y sono rispettivamente le varianze campionarie di X e di Y . Distribuzione:S2P (5+3−2)/σ2 ∼ χ2(6). Come stimatore di σ possiamo considerare la radice quadrata di S2

P . Sostituendoi valori campionari s2

X = 0.437 e s2Y = 0.22333 si ottiene s2

P = 0.36578 e la stima cercata risultasP = 0.6048.

Esercizio 4

(A) H0 : µX−µY = 0, H1 : µX−µY > 0. V.c. test [(X−Y )− (µX−µY )]/√S2P (1/m+ 1/n) ∼ T (6), che

sotto H0 diviene (X − Y )/√S2P (1/m+ 1/n) ∼ T (6). La regione di rifiuto per la statistica di cui sopra

[t = 1.43976,+∞], mentre il valore campionario 0.87544 (S2P (1/m+1/n) = 0.19508,

√S2P (1/m+ 1/n) =

0.44168).

(B) Essendo σ nota occorre prima ricalcolare la regione di rifiuto. V.c. test [(X − Y ) − (µX −µY )]/

√σ2(1/m+ 1/n) ∼ N(0, 1), che sotto H0 diviene (X−Y )/

√σ2(1/m+ 1/n) ∼ N(0, 1). La regione

di rifiuto per la statistica di cui sopra [z = 1.28155,+∞].Indichiamo ora s =

√σ2(1/m+ 1/n) =

√0.38897 = 0.62367. Allora γ = P (X ∈ R|H1) = P ((X−Y )/s >

z|H1) = P ((X − Y ) > sz|H1) = P ((X − Y − 0.63)/s > z − 0.63/s|H1) = P (Z > 0.27141|H1) = 0.39304.

92

Page 93: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

47 Compito del 13.01.2004

47.1 Testo

Esercizio 1 Volete valutare se sia necessario acquistare un software anti-spam nella vostra societa. Inun giorno qualunque, chiedete al tecnico di contare quanto sia lo spam in arrivo nelle caselle email delvostro dominio. Il tecnico vi riferisce di aver trovato 10 mail spam su un totale di 18 mail analizzate.(a) Scegliendo a caso 6 mail tra quelle analizzate, qual e la probabilita che non troviate alcuna spam?(b) Qual e la probabilita che, leggendo una mail dopo l’altra, estratta a caso con reimmissione da un pctra quelle analizzate, la prima spam sia la 7?

Esercizio 2 Effettuate una ricerca sullo spam ricevuto in un giorno in 5 uffici. In un giorno scelto a caso,avete rilevato i dati riportati nella tabella seguente.

Uffici A B C D ENum. spam 424 129 192 241 27

(a) Valutare il grado di concentrazione del numero di e-mail spam tra i vostri uffici mediante un indiceopportuno.(b) Rappresentate graficamante la curva di Lorenz.

Esercizio 3 Installate una versione di prova del software antispam su 5 computer dei 10 di un ufficio.Per valutarne l’efficacia, si confrontano il numero di email spam in arrivo in un giorno a caso tra i duegruppi di pc, ciascuno con un indirizzo email. I dati ottenuti sono riportati nella tabella seguente.

N. e-mail spam in pc con software 24 6 14 8 5N. e-mail spam in pc senza software 48 13 13 10 5

Si ipotizzi che il numero di email spam in arrivo, con e senza software, si distribuisca normalmente condeviazione standard 7 e che il software sia reputato efficace se rende minore in media il numero di emalspam ricevute.(a) Si verifichi l’efficacia del software anti-spam (α = 0.05).(b) Vi comunicano un intervallo di confidenza della differenza tra numero medio di spam senza softwaree con software: [−10.48;−2.32]. Calcolarne il livello di confidenza.

Esercizio 4 Si vuole ora confrontare il numero di email spam con e senza software, indirizzo per indirizzo:utilizzando solo i 5 computer dell’ufficio ancora senza software, si contano le email spam in arrivo, in ungiorno, prima di installare il software anti-spam e, successivamente, dopo avervi installato il software. Idati ottenuti sono riportati nella tabella seguente.

N. spam prima dell’installazione 45 13 21 14 12N. spam dopo l’installazione 17 10 13 8 8

(a) Ipotizzando che il numero di email spam in arrivo, con e senza software, si distribuisca normalmentecon varianza ignota, si calcoli l’interv allo di confidenza per la media della differenza del numero di spamin arrivo (prima - dopo), con 1− α = 0.95.(b) Se, invece di effettuare un opportuno test, si decidesse di valutare efficace il software se la mediacampionaria della differenza tra il numero di spam prima e dopo e superiore a 3 , a quanto ammonterebbela probabilita di commettere un errore del primo tipo? (Approssimare in base alle tavole).

47.2 Soluzioni

Esercizio 1(a) X ha distribuzione ipergeometrica.P (X = 0) = 0.0015.(b) Y ha distribuzione geometrica. p= 0.5556.P (Y = 7) = 0.0043.

93

Page 94: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Esercizio 2Calcolo dell’indice relativo della concentrazione.Per prima cosa ordinare i dati: Ufficio E B C D Api = 0.20 0.40 0.60 0.80 1.00qi = 0.0267 0.1540 0.3435 0.5814 1.00R = 0.4472

Esercizio 3Sia X1 ∼ N(µ1, 49) = num. spam con softwareSia X2 ∼ N(µ2, 49) = num. spam senza software(a) Test d’ipotesi unilaterale per confronto tra medie con varianza nota.H0 : µ1 − µ2 = 0 vs H1 : µ1 − µ2 < 0X1 = 11.400 , X2 = 17.800 ,zoss = −1.4456 zcrit = −1.6449⇒ Accetto H0

(b) Intervallo di confidenza per confronto tra medie con varianza nota:

(x1 − x2)± zα2

(√

σ21

n1+

σ22

n2

Da cui (x1 − x2) + zα2

(√

σ21

n1+

σ22

n2= −2.3200

zα2

= ±0.9216 1− α = 0.6433

Esercizio 4Sia X1 ∼ N(µ1, 49) = num. spam prima dell’installazione Sia X2 ∼ N(µ2, 49) = num. spam dopol’installazioneSia XD = X1 −X2

Dati campionari xD: 28 3 8 6 4 XD = 9.8000 Var. campionaria corretta = 107.2000

(a) Intervallo di confidenza per una media, varianza ignota: xD ± tα2 ,4√

S2D

n−1

L’intervallo cercato: [−3.0559; 22.6559].(b) P (XD > 3.0000 | H0) = 0.2762

94

Page 95: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

48 Compito del 27.01.2004

48.1 Testo

Esercizio 1Relativamente al credito verso le persone fisiche, la BANCA DEL PONTE attiva nelle linee mutui casa ecredito al consumo. Dalle valutazioni effettuate risulta che se un credito va in sofferenza, la banca perdemediamente il 17 % del credito nei mutui casa e il 26 % nel credito al consumo. Tuttavia questa solouna valutazione media, dato che la perdita percentuale su un credito una variabile casuale che risultaN(17, 5) nei mutui casa e N(26, 34) sul credito al consumo.Sapendo che nel 2003 sono andati in sofferenza crediti per 278 milioni nei mutui casa e 105 milioni nelcredito al consumo (valori in Euro) e che le perdite percentuali sono indipendenti:

(A) Determinare la distribuzione della perdita complessiva, ivi compresi i suoi parametri, nel 2003.(B) Determinare il valore al di sopra del quale la perdita complessiva 2003 si colloca con probabilit del2.5 %.

Esercizio 2L’ufficio titoli della BANCA DEL PONTE sta valutando l’andamento in borsa di due titoli azionari dellostesso settore. Sui rendimenti settimanali (espressi in percentuale e su base annua) rilevati negli ultimi 2anni e sulla differenza fra tali rendimenti sono state calcolate le seguenti statistiche:

Titolo BigGas TerGas BigGas− TerGasn. osservazioni 104 104 104

media 27.2 16.9 10.3varianza corretta 2415 1186 1446

(A) Possiamo concludere che due titoli hanno la stessa varianza?(B) Dai dati riportati in tabella ricavare il valore campionario del coefficiente di correlazione fra i ren-dimenti dei due titoli. Indicare quale delle ipotesi necessarie per applicare il test di cui sopra messa indubbio dal valore calcolato.

Esercizio 3Con riferimento ai dati dell’esercizio precedente si assuma che la variabile differenza D = BigGas −TerGas ∼ N(µD, σ

2D).

(A) Fornire un intervallo di confidenza al 90 % per la differenza media dei rendimenti dei due titoli.(B) Sottoporre a test l’ipotesi che il titolo BigGas ha avuto un rendimento medio superiore rispetto aTerGas (α = 0.1 ).

Esercizio 4La relazione fra i rendimenti dei due titoli stata studiata anche analizzando la combinazione fra i lorosegni, ricavando la tabella seguente:

BigGas\TerGas - + Totale- 18 14 32+ 11 61 72

Totale 29 75 104

(A) Si calcoli l’indice di associazione C1 relativo e si commenti il risultato.(B) Mantenendo la numerosit complessiva rilevata, si faccia un esempio di situazione in cui l’indiceindicato al punto (A) sarebbe stato 1.

48.2 Soluzioni

Esercizio 1

X1 ∼ N(17, 5) e X2 ∼ N(26, 34) sono le perdite percentuali, c1 = 278 e c2 = 105 le sofferenze. X1 e X2

sono indipendenti.

95

Page 96: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) La perdita complessiva combinazione lineare delle perdite nelle due linee di credito:X = c1X1+c2X2 ∼ N(µ = 7456, σ2 = 761270), dove in base alle ipotesi µ = E(X) = c1E(X1)+c2E(X2),σ2 = V (X) = c21V (X1) + c22V (X2).

(B) Bisogna trovare b tale che P (X > b) = 0.025. 0.025 = P (X > b) = P [Z > (b − µ)/σ = z]. Dalletavole z = 1.96 implica b = µ+ σz = 9166.084 (σ = 872.508).

Esercizio 2

(A) Assunzioni: X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ

22), X1 e X2 indipendenti. Ipotesi: H0 : σ2

1/σ22 = 1,

H1 : σ21/σ

22 6= 1. La v.c. test S2

1/S22 che sotto H0 ha distribuzione F (m− 1, n− 1) = F (103, 103). Valore

campionario della statistica test = 2415/1186 = 2.0363; regione di accettazione [0.6781, 1.4746].

(B) In generale V (X1 − X2) = V (X1) + V (X2) − 2C(X1, X2). Sostituendo in questa relazione i valoricampionari e ricavando C(X1, X2) abbiamo C(X1, X2) = [V (X1) + V (X2) − V (X1 −X2)]/2 = [2415 +1186− 1446]/2 = 1077.5. Da questo ricavo ρ = C(X1, X2)/[σ(X1)σ(X2)] = 1077.5/(49.1426 ∗ 34.4384) =0.6367. Un valore campionario di ρ cos elevato mette in forte dubbio l’ipotesi di indipendenza fra X1 eX2.

Esercizio 3

Assunzioni: D = X1 −X2 ∼ N(µD, σ2D) (dati appaiati).

(A) Pivot: (D − µD)/(SD/√n), la cui distribuzione, in base alle assunzioni fatte, T (n − 1) = T (103).

Intervallo di confidenza per µD: [d−tsd/√n, d+tsd/

√n] = [4.11103, 16.48897] dove t = 1.65978, d = 10.3

s2d = 1446, sd = 38.02631

√n = 10.19804.

(B) Ipotesi: H0 : µD = 0, H1 : µD > 0. La v.c. test D/(SD/√n) che sotto H0 ha distribuzione

T (n− 1) = T (103). Valore campionario della statistica test = 2.76229; regione di rifiuto [1.28982,+∞].

Esercizio 4

(A) C1rel = 0.34911n∗ij - +

- 8.92 23.08+ 20.08 51.92

(B) Va bene una qualsiasi situazione un cui su una delle due diagonali ci sia 0. Esempio:BigGas\TerGas - + Totale

- 49 0 49+ 0 55 55

Totale 49 55 104

96

Page 97: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

49 Compito del 10.02.2004

49.1 Testo

Esercizio 1Nella vostra citta hanno aperto un piccolo casino. Dopo due settimane, un vostro amico vi confida chela perdita attesa di un cliente, secondo quando dichiarato dal casino, e 237 euro; secondo voi, invece,tale media e 289 euro. Volendo verificare se il casino abbia dichiarato il vero e sapendo che la perdita sidistribuisce normalmente con varianza 9216, effettuate un’indagine su 50 clienti ed ottenete una mediacampionaria pari a 263.(1) Concludereste che la dichiarazione del casino sia falsa (α = 0.01)?(2) Calcolare quanti clienti avreste dovuto intervistare per garantirvi una probabilita di commettere unerrore del secondo tipo inferiore a 0.01.

Esercizio 2La tabella seguente riporta la distribuzione frequenza della variabile X = numero di vincite con le slotmachine Lucky in una serata.

Xi 3 1 2 0ni 25 79 88 173

(1) Calcolare la mediana e il coefficiente di variazione di X.(2) Calcolare gli stessi indici per Y = numero di vincite con le slot machine LuckyPlus in una serata,sapendo che Y = 2 + 2X.

Esercizio 3Una delle roulette ha una ruota composta da 38 buche: una con 0, una con 00, e le altre con numeri da1 a 36. Il croupier fa girare la ruota e se esce 0 o 00 il banco vince. Un visitatore si ferma ad osservare892 giri: 0 o 00 escono ben 71 volte.(1) Ha ragione il visitatore di supporre che la roulette sia truccata (α = 0.01)?(2) In base a quanto osservato, si stimi, con affidabilita 0.90, la probabilita che il banco vinca in unasingola giocata.

Esercizio 4Per promuovere il casino, si regalano gettoni per le slot-machine mediante un gioco: si deve scegliere acaso tra due scatole apparentemente identiche. Nella prima c’e un dado: se in sei lanci non esce mai 6,si vincono 100 gettoni. Altrimenti non si vince nulla. Nella seconda c’e un’urna con 36 palline, di cui 6rosse. Si devono estrarre 6 palline in blocco: se nessuna e rossa si vincono 100 gettoni. Altrimenti non sivince nulla.(1) Calcolare la probabilita di vincere 100 gettoni.(2) Verificare se le variabili X = numero di gettoni vinti e Y = scatola scelta, sono indipendenti.

49.2 Soluzioni

Esercizio 1Test sulla media, varianza nota, con H0 : µ = 237 H1 : µ = 289.σ = 96

(1) x = 263 α = 0.01. zα = 2.33. zoss = 1.9151. Accetto H0.

(2) β = P ( Accettare H0 | H1 vera) =0.01.

Accetto H0 se zoss = x−µ0

σ/√n< 2.33 ovvero se x < 2.33·96√

n+ 237

Chiamo c = 2.33·96√n

+ 237

97

Page 98: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

β = P (x < c | H1 vera ) = 0.01.

Dato che β = P (Z < c−µ1

σ/√n| H1) = 0.01, se e solo se c−µ1

σ/√n

= −2.33.

( 2.33·96√n

237)−(289)

96/√n

= −2.33. n = 74.0129⇒ n = 75.

Esercizio 2La distribuzione ordinata dei dati e la seguente

X(i) 0 1 2 3ni 173 79 88 25Ni 173 252 340 365

(1) n =365 (dispari) N+12 = 183 MedianaX = 1

µX = 0.904 σX = 0.990 CVX = 1.095

(2) Y = 2 + 2X. Usando le proprieta di media, mediana e varianza,

MedianaY = 4 µY = 3.808 σY = 1.980 CVY = 0.520

Esercizio 3Sia p la probabiita che il banco vinca in una singola giocata.Se la roulette non truccata p = 2

38 = 0.053(1) Test su una proporzione, con H0 := 0.053 H1 : p > 0.053 α = 0.05 .p = 0.080 zoss = 3.607 zcrit = 1.645 Rifiuto H0.

(2) Intervallo di confidenza per p.zα/2 = ± 1.645 da cui : [0.06469 ; 0.0945 ]Esercizio 4(1) ΩY = 1, 2 con P (Y = 11) = P (Y = 2) = 0.5Se Y = 1⇒ X | (Y = 1) ∼ Bin(6, 1/6), se Y = 2⇒ X | (Y = 2) ∼ Ipergeometrica.P (X = 100 | Y = 1) = 0.335 P (X = 100 | Y = 2) = 0.305P (X = 100) = 0.5 · P (X = 100 | Y = 1) + 0.5 · P (X = 100 | Y = 2) = 0.320(2) Dato che P (X = 100 | Y = 1) 6= P (X = 100 | Y = 2), X e Y non sono indipendenti.

98

Page 99: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

50 Compito del 15.04.2004

50.1 Testo

Esercizio 1Le quotazioni di borsa del titolo SMART sono state confrontate con quelle dell’intero mercato nel qualeil titolo quotato. Negli ultimi 5 anni sono stati rilevati i seguenti valori (rendimenti percentuali espressiin base annua):

Anno 1999 2000 2001 2002 2003rendimento SMART -15.5 4.3 3.2 7.3 15.9rendimento mercato -12.9 0.9 12.3 2.4 10.6

(A) Fornire un’opportuna rappresentazione grafica dei dati rilevati.(B) Mediante un opportuno indice statistico, mettere in evidenza il grado di associazione fra rendimentodi SMART e rendimento del mercato. Commentare il risultato.

Esercizio 2Con riferimento ai dati dell’esercizio 1, si assuma che la differenza D = rendimento di SMART menorendimento del mercato sia distribuita secondo una N(µD, σ

2D).

(A) Sottoporre a test l’ipotesi nulla che, in media, il rendimento di SMART uguagli il rendimento delmercato (α = 0.01).(B) Se la differenza tra i due rendimenti medi sotto l’ipotesi alternativa fosse uguale a 3.1 , che valoreassumerebbe la potenza del test assumendo che la vera varianza σ2

D sia esattamente quella osservata?

Esercizio 3Con riferimento ai dati dell’esercizio 1, approfondire l’analisi mediante un modello di regressione lineareche faccia dipendere il rendimento di SMART dal rendimento del mercato.

(A) Determinare i coefficienti della retta di regressione.(B) Determinare i residui di regressione relativi agli ultimi due semestri.

Esercizio 4Il rischio di un investimento dato dalla volatilit, generalmente misurata con la deviazione standard riferitaad un certo periodo di tempo.

(A) Secondo voi, il fatto che i dati a disposizione siano medie annuali invece che giornaliere sottostimao sovrastima la volatilit quinquennale? Motivare la risposta.(B) Trascurando le considerazioni fatte al precedente punto (A), sulla base dei dati a disposizione calcolateun intervallo di confidenza al 95 % per la volatilit del titolo SMART.

50.2 Soluzioni

Esercizio 1

Simboli: X = ”rendimento del mercato”, Y = ”rendimento di SMART”.

(A) ”Scatterplot” dei 5 punti individuati dalle coppie dei rendimenti relativi a ciascun anno.

(B) Dai dati si ricavano i seguenti valori campionari: coefficiente di correlazione ρ = codev(x, y)/√dev(x)dev(y) =

0.84402, dove codev(x, y) = 388.808, dev(x) = 401.252, dev(y) = 528.872, x = 2.66, y = 3.04.

Esercizio 2

Test sulla differenza fra medie per dati appaiati. Assunzioni: D = Y −X ∼ N(µD, σ2D).

(A) Ipotesi: H0 : µD = 0, H1 : µD 6= 0. La v.c. test (D − µD)/√S2D/n che per le assunzioni fat-

te distribuita come una T (n − 1). Sotto H0, dove dobbiamo metterci per costruire A/R, abbiamo

99

Page 100: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

D/√S2D/n|H0 ∼ T (n − 1). Valore campionario della statistica test sotto H0: d/

√s2D/n = 0.1376;

regione di accettazione [−4.6041, 4.6041] (d = 0.38, s2D = 38.127,

√S2D/n = 2.7614)

(B) Notare le differenze rispetto al punto (A): 1. Si assume σ2D = 38.127, cio varianza nota; 2. H1 : µD =

3.1 (il test cio a una coda, non a due). Questo costringe a ricalcolare anche la regione di accettazione.Assumendo di conoscere la varianza, la v.c. test (D − µD)/

√σ2D/n distribuita come una N(0, 1). Sotto

H0, dove dobbiamo metterci per costruire A/R, abbiamo D/√σ2D/n|H0 ∼ N(0, 1). Regione di rifiuto

(z = 2.3263,+∞). γ = P (campione ∈ R|H1) = P (D/√σ2D/n > z|H1) = P (D > z

√σ2D/n|H1).

Standardizzando D sotto H1 abbiamo alla fine γ = P (Z > z−µD1/√σ2D/n) = P (Z > 1.2037) = 0.1143,

dove µD1 = 3.1,√σ2D/n = 2.7614.

Esercizio 3

(A) β1 = codev(x, y)/dev(x) = 0.96899, β0 = y − β1x = 0.46249

(B) Dopo aver calcolato i valori teorici y4 = β0 + β1x4 = 2.78806 e y5 = β0 + β1x5 = 10.73376 abbiamo iseguenti residui: u4 = y4 − y4 = 4.51194, u5 = y5 − y5 = 5.16624.

Esercizio 4

(A) Il fatto di considerare medie annuali sottostima la volatilit quinquennale. Infatti, ragionando nonsulle deviazioni standard ma sulle devianze, la volatilit quinquennale legata alla devianza totale delrendimento nei 5 anni, mentre quella calcolata sulle medie annuali invece legata alla devianza between,che come sappiamo sempre non superiore a quella totale.

(B) Pivot: S2(n−1)/σ2 che ha una distribuzione χ2(n−1). Intervallo per σ2: [s2(n−1)/c2, s2(n−1)/c1] =

[47.46104, 1091.7666], dove s2 = 132.218, c1 = 0.48442, c2 = 11.14329. Per ricavare l’intervallo per σbasta fare la radice quadrata degli estremi dell’intervallo precedente: [6.8892, 33.04189].

100

Page 101: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

51 Compito del 28.05.2004

51.1 Testo

Esercizio 1La CORNACCHINI & MINGOZZI ha in progetto di costruire e vendere posti auto privati in una zona diMilano. A questo scopo commissiona alla BINGHIRILLI una ricerca di mercato in cui viene chiesto, allefamiglie della zona che non dispongono di posto auto di propriet, se nei prossimi 4 anni hanno intenzionedi acquistarne uno. Si indichi p = probabilit che una famiglia decida di acquistare un posto auto.

(A) Quanto deve essere la dimensione del campione per ottenere un intervallo di confidenza per p, allivello di confidenza 0.95 , di ampiezza 0.046 ? (Si supponga di non disporre di alcuna informazioneausiliaria per rispondere a questa domanda).(B) A prescindere dal calcolo fatto al punto A, sono state intervistate 1397 famiglie, delle quali 69 hannomanifestato intenzione di acquistare un posto auto. Fornire una stima per intervallo per p al livello diconfidenza 0.95 .

Esercizio 2Con riferimento al problema dell’esercizio precedente, la BINGHIRILLI ha valutato in circa 43 -mila ilnumero di persone della zona che non hanno ancora un posto auto di propriet. Quindi, ognuna delle 43-mila famiglie pu decidere di acquistare o non acquistare un posto auto nei prossimi 4 anni. Supponiamoche dalla indagine di mercato sia emerso che p = probabilit che una famiglia decida di acquistare unposto auto = 0.0494 .

(A) Indicare come si distribuisce la variabile casuale ”numero totale di famiglie che decidono di acquista-re”. Nel rispondere, indicare i valori dei parametri della distribuzione ed esplicitare le approssimazioniutilizzate nel caso in cui se ne faccia uso.(B) Calcolare la probabilit che la CORNACCHINI & MINGOZZI riesca a vendere tutti i 2038 posti autoche vuole costruire. Nel calcolo si assuma che ogni famiglia acquisti al massimo un posto auto e che nonesistano altri posti auto sul mercato.

Esercizio 3L’ osservatorio indipendente Anti-STROZZO sta analizzando se e come i tassi d’interesse sui mutui im-mobiliari sono legati alla durata del finanziamento. L’osservatorio ha preso come riferimento un campionedi contratti di mutuo a tasso fisso (per ragioni di omogeneit dell’analisi i dati sono relativi all’ultimo annoe per importi compresi fra 100-mila e 200-mila Euro) dal quale sono state ricavate le seguenti statistichecampionarie (i tassi d’interesse sono espressi in percentuale, la durata in anni):

dimensione del campione = 263 media(durata) = 19.97 mediana(durata) = 20.11media(tasso) = 5.97 mediana(tasso) = 5.97 devianza(durata) = 9626.44

devianza(tasso) = 405.67 codevianza(tasso,durata) = 1871.61

(A) Formulare un opportuno modello lineare per studiare il problema illustrato e stimarne tutti iparametri.(B) Si fornisca una stima della deviazione standard del coefficiente angolare. Indicare a quale scopo utilefornire una stima di tale grandezza.

Esercizio 4Con riferimento all’esercizio precedente:

(A) Calcolare il p-value che si ottiene nel sottoporre a test l’ipotesi nulla che, tendenzialmente, ”all’au-mentare di 1 anno della durata, il tasso d’interesse aumenta di 0.197 punti percentuali”. Il valore calcolatoche decisione fa prendere in merito all’ipotesi H0?(B) Determinare l’intervallo di previsione del tasso d’interesse per un mutuo di durata pari a 24 anni.

51.2 Soluzioni

Esercizio 1

101

Page 102: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

X = ”famiglia decide di acquistare entro 4 anni” ∼ Be(p)

(A) Calcolo della dimensione del campione in funzione dell’ampiezza dell’intervallo di confidenza per p:n = (z/A)2 = 1816, dove z = 1.96 il quantile 0.975 della N(0,1) (ricordare che α = 0.05 ) e A = 0.046l’ampiezza dell’intervallo.

(B) Intervallo di confidenza per p: il pivot da usare nella pratica (X−p)/√X(1−X)/n la cui distribuzione

approssimativamente N(0, 1). L’intervallo allora [x−z√x(1− x)/n, x+z

√x(1− x)/n] = [0.038, 0.0608],

dove x = 69 /1397 = 0.0494 , z = 1.96,√x(1− x)/n =

√3.4e− 005 = 0.005797 .

Esercizio 2

Xi = ”famiglia i-ma decide di acquistare entro 4 anni”∼ Be(p = 0.0494); n= 43000 il numero complessivodi famiglie considerate.

(A) X = totale di famiglie intenzionate ad acquistare =∑ni=1Xi ∼ Bi(n = 43000, p = 0.0494) (somma

di Bernoulli).

(B) In base al testo, la probabilit di vendere tutti i posti auto esattamente la probabilit che coloro chedecidono di acquistare, X, sia ≥ 2038 . Per il calcolo si ricorre, valendo tutti i presupposti, all’approssi-mazione Normale della Binomiale: P (X ≥ 2038) = P [(X − np)/√npq ≥ (2038− 2124.2)/

√2019.2645] =

P (Z ≥ −1.9183) = 0.9725 .

Esercizio 3

(A) Modello lineare: yi = β0 +β1xi+εi, dove εi ∼ N(0, σ2), y il tasso d’interesse e x la durata del mutuo.

Stimatori dei minimi quadrati dei parametri: β1 = codev(x, y)/dev(x) = 1871.61/9626.44 = 0.19442,

β0 = y−β1x = 5.97− 0.19442 ∗ 19.97 = 2.08735, σ2 = [dev(y)− β21dev(x)]/(n− 2) = (405.67− 0.194422 ∗

9626.44)/(263− 2) = 0.16009.

(B) Si tratta di stimare σ(β1), la cui importanza sta nel fornire una misura del grado di precisione dello

stimatore utilizzato nello stimare il parametro incognito. Poich V (β1) = σ2/dev(x), allora σ(β1) =√σ2/dev(x) =

√2e− 005 = 0.00408.

Esercizio 4

(A) Nel modello precedente si tratta di sottoporre a test H0 : β1 = 0.197 contro H0 : β1 6= 0.197.

la v.c. test β1. La distribuzione campionaria data da (β1 − β1)/σ(β1) ∼ T (n − 2) e sotto H0 diviene

(β1−0.197)/σ(β1)|H0 ∼ T (n−2). Per una dimensione campionaria cos elevata si pu tuttavia approssimare

T (n − 2) ' N(0, 1). Il valore campionario della statistica test sotto H0 allora z − camp = (β1 −0.197)/σ(β1) = (0.19442− 0.197)/0.00408 = −0.6317.p − value = P (’valore campionario della statistica test ancora pi spostato verso H1 rispetto a quello

rilevato’|H0) = 2P [(β1 − 0.197)/σ(β1]) > | − 0.6317||H0] = 2P (Z > 0.6317) = 2 ∗ 0.26379 = 0.52758

(B) Per brevit usiamo i seguenti simboli: parametro da stimare θ = β0 + β1x0, stimatore θ = β0 + β1x0,

varianza dello stimatore V (θ) = σ2[1/n+ (x− x0)2/dev(x)].

Pivot: (θ − θ)/σ(θ) che ha una distribuzione T (n − 2) ≈ N(0, 1) (n elevato). Intervallo per θ: [θ −zσ(θ), θ + zσ(θ)] = [6.6954, 6.8116], dove z = 1.96, θ = 6.7535, σ(θ) =

√0.00088 = 0.02964.

102

Page 103: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

52 Compito del 03.06.2004

52.1 Testo

Esercizio 1Si estrae un campione casuale di dimensione n = 35 da una popolazione X Normale con media µ incognitae deviazione standard σ = 8. Per determinare il valore di µ si sa inoltre che P (X ≤ 64) = 0.876,(a) Indicare la distribuzione campionaria di X, ivi compreso il valore assunto dai parametri.(b) Calcolare la probabilita di ottenere una media campionaria superiore a 51.

Esercizio 2Si vuole stabilire se le aziende dell’Italia centro settentrionale abbiano profitti superiori a quelli dell’Italiameridionale. Allo scopo vengono estratti due campioni casuali di aziende, 5 nel Centro-Nord e 5 nel SudItalia, rilevandone il profitto settimanale (in migliaia di euro). I dati sono riportati nella tabella seguente:

Profitto settimanale in migliaia di euro.Aziende del Centro-Nord 19.5 27.6 32.2 32.5 31.1Aziende del Sud Italia 28.2 32.6 26.6 32.2 30.1

Si ipotizzi che la variabile profitto di distribuisca secondo una Normale.(a) Si sottoponga a test l’ipotesi che i due gruppi di aziende abbiano la stessa varianza (con α = 0.05).(b) Si costruisca un intervallo di confidenza per la differenza delle medie dei profitti delle due popolazioni(1− α = 0.95).

Esercizio 3Si consideri ora il campione di 10 aziende dell’esercizio precedente come un intero campione casualeestratto dal settore oggetto di studio. Per fornire una descrizione del campione rispetto alla sola variabileprofitto settimanale,(a) si calcoli il terzo quartile del profitto settimanale;(b) si costruisca l’istogramma per tale variabile, utilizzando le seguenti classi: [15 − 25) , [25 − 27),[27− 30), [30− 40).

Esercizio 4In un nuovo studio, vengono estratti casualmente due campioni di aziende: 113 aziende del Sud ed al-trettante del Centro-Nord.(a) Tra le aziende estratte, hanno registrato un trend positivo nei profitti 56 aziende del Sud e 62 delCentro-Nord. Tale differenza di comportamento dovuta ad un trend peggiore nelle aziende del Sud? Sirisponda alla domanda formulando il problema in termini di test d’ipotesi ed utilizzando il p-value.(b) Nei due campioni di aziende estratte, il tasso di crescita del profitto risultato avere media 12 e va-rianza campionaria corretta 32 nel Centro-Nord, mentre risultato avere media 8, e varianza campionariacorretta 20 nel Sud. Sottoporre a test l’ipotesi nulla che i tassi medi nelle due aree geografiche sianoidentici, contro l’ipotesi che il tasso medio di crescita sia superiore al Centro-Nord (α = 0.05).

52.2 Soluzioni

Esercizio 1Dato che P (X ≤ 64) = 0.876, allora P (Z ≤ 64−µ

8 ) = 0.876 ⇒ 64−µ8 = 1.1552 ⇒ X ∼ N(54.7584, 64).

(a) X ∼ N(54.7584, 1.8286).(b) P (X ≥ 51) = 0.9973.

Esercizio 2X1 = Profitto aziende del Centro-Nord, X2 = Profitto aziende del Sud.(a) Test confronto tra varianze.

103

Page 104: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

s21 = 29.557, s2

2 = 6.598Foss = 4.4797, Fcrit = 0.1041; 9.60453, Accetto H0

(b) Intervallo di confidenza per la differenza tra medie con campioni indipendentix1 = 28.58, x2 = 29.94, s2

1 = 29.557, s22 = 6.598, tα/2 = ±2.306

Intervallo: [−7.5611 ; 4.8411].

Esercizio 3Dati: 19.5 27.6 32.2 32.5 31.1 28.2 32.6 26.6 32.2 30.1(a) Dati ordinati: 19.5 26.6 27.6 28.2 30.1 31.1 32.2 32.2 32.5 32.6Q3 = 32.2(b) Frequenze: 1 1 2 6 Ampiezza classi: 10 2 3 10Densita di frequenza: 0.1 0.5 0.7 0.6 .

Esercizio 4(a) p1 = Proporzione di aziende con trend positivo al Sudp2 = Proporzione di aziende con trend positivo al Centro-NordTest sulla differenza tra due proporzioni con n grande.H0 : p1 − p2 = 0 H1 : p1 − p2 < 0p1 = 0.4956 p2 = 0.5487 p = 0.5221zoss = −0.799, p-value = 0.2121 Accetto H0

(b) X1 = Tasso di crescita delle aziende del Centro-NordX2 = Tasso di crescita delle aziende del SudTest confronto tra medie con campioni indipendenti.H0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0x1 = 12, x2 = 8, s2

1 = 32, s22 = 20

toss = 5.8965, tcrit = 1.6517 Rifiuto H0

104

Page 105: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

53 Compito del 18.06.2004

53.1 Testo

Esercizio 1La PIPPOLI&NINNOLI spa ha attivato da alcuni mesi un numero verde a disposizione dei propri clientiper una serie di servizi. Per verificare il grado di utilizzo del numero nella fascia oraria di punta (9.00-13.00), i responsabili hanno raccolto un campione di chiamate relative a 30 giorni lavorativi. Il tempostato diviso in intervalli di lunghezza costante prefissata e la variabile misurata , appunto, il numero dichiamate ricevute per intervallo di tempo. Il campione sintetizzato nella seguente tabella:

numero chiamate 0 1 2 3 4 5 6 7 8 9frequenza 49 150 262 332 278 159 118 53 26 13

(A) Rappresentare graficamente la distribuzione della variabile numero di chiamate nel campione, tenendopresente che l’ottica quella di confrontare la distribuzione ottenuta con quella teorica delle variabili casualia voi note.(B) Calcolare il 90o percentile della variabile numero di chiamate nel campione.

Esercizio 2Il campione di cui all’esercizio precedente stato poi utilizzato per fare inferenza statistica.

(A) Fra quelli noti, scegliere il modello (distribuzione) che vi sembra pi opportuno per rappresentare lavariabile d’interesse e fornire una stima puntuale del parametro o dei parametri del modello scelto.(B) Sottoporre a test l’ipotesi nulla (formulata dai responsabili prima dell’attivazione del servizio) che ilnumero medio di chiamate per intervallo 3.6 (α = 0.01).

Esercizio 3L’analisi della durata delle chiamate effettuate al numero verde della PIPPOLI&NINNOLI ha rivelatouna certa differenza fra quelle effettuate da privati e quelle effettuate da aziende: quelle dei privati duranoin media 6.85 minuti, con una deviazione standard 2.06; quelle delle aziende durano in media 7.05 minuti,con una deviazione standard 2.82. Sapendo che ogni 100 chiamate se ne ricevono 65 da privati e le altreda aziende e assumendo che la durata delle chiamate abbia distribuzione normale:

(A) Calcolare la probabilit che una chiamata presa a caso duri pi di 9.73 minuti.(B) Sapendo che una chiamata durata pi di 9.73 minuti, calcolare la probabilit che questa sia stataeffettuata da un’azienda.

Esercizio 4Nei 30 giorni in cui sono stati raccolti i dati di cui agli esercizi precedenti, a conclusione della telefonataal numero verde sono state effettuate alcune domande per valutare il grado di soddisfazione relativo alservizio reso. In base alle risposte date il grado di soddisfazione stato tradotto in un punteggio. L’obiettivoanalizzare, mediante un modello di regressione lineare, se il punteggio ottenuto legato alla durata dellachiamata. Le principali statistiche campionarie sono riportate nella seguente tabella.

dimensione del campione = 471 media(durata) = 9.65 mediana(durata) = 6.9media(punteggio) = -0.62 mediana(punteggio) = -0.6 devianza(durata) = 35981

devianza(punteggio) = 184193 codevianza(punteggio,durata) = 11676

(A) Si espliciti nel modo pi completo possibile il modello utilizzato e se ne stimino i parametri (ricordare

che devianza(residui) = (devianza(y)− β21devianza(x)).

(B) Mediante il calcolo del p-value, sottoporre a test l’ipotesi nulla che non vi sia relazione fra gra-do di soddisfazione e durata della chiamata, contro l’alternativa che il grado di soddisfazione aumentiall’aumentare della durata.

53.2 Soluzioni

Esercizio 1

105

Page 106: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

X = ”numero di chiamate nell’intervallo prefissato”

(A) Calcolo e disegno della distribuzione delle frequenze relative. Conviene utilizzare un ”diagramma aspaghetti”, dove ciascuno spaghetto rappresenta la frequenza relativa fi in corrispondenza del numero dichiamate xi di volta in volta considerato.

xi 0 1 2 3 4 5 6 7 8 9ni 49 150 262 332 278 159 118 53 26 13fi 0.034 0.104 0.182 0.231 0.193 0.11 0.082 0.037 0.018 0.009

(B) posizione 90o percentile = (n+ 1)0.9 = (1440 + 1)0.9 = 1296.9. 90o percentile: x(0.90) = 6.

Esercizio 2

(A) Modello di Poisson: si suppone allora X ∼ Po(λ). λ = x = 4981/1440 = 3.459.

(B) H0 : λ = 3.6 contro H1 : λ 6= 3.6. La v.c. test X. La sua distribuzione campionaria sotto H0 data da(X − λ0)/

√λ0/n|H0 ≈ N(0, 1) (λ0 il valore di λ sotto H0). 1− α = 0.99 = P (−z ≤ (X − λ0)/

√λ0/n ≤

z|H0). Valore campionario: (x−λ0)/√λ0/n = −2.8194; regione di accettazione: [−z, z] = [−2.576, 2.576]

(√λ0/n =

√0.0025 = 0.05).

Esercizio 3

Eventi: A = ”chiama un’azienda”, A = ”chiama un privato”. X v.c. ”durata chiamata”. X|A ∼ N(µA =7.05, σA = 2.82); X|A ∼ N(µA = 6.85, σA = 2.06).

(A) Formula delle probabilit marginali (o totali): P (X > c = 9.73) = P (X > c|A)P (A) + P (X >c|A)P (A) = 0.17097 ∗ 0.35 + 0.08105 ∗ 0.65 = 0.11252 (per il calcolo di P (X > c|A) e P (X > c|A)ricordare che X|A e X|A hanno distribuzione normale).

(B) Formula di Bayes: P (A|X > c) = P (X > c|A)P (A)/P (X > c) = 0.17097 ∗ 0.35/0.11252 = 0.5318.

Esercizio 4

(A) Modello lineare: yi = β0 +β1xi+ εi, dove εi ∼ N(0, σ2), y il punteggio e x la durata della telefonata.

Stimatori dei minimi quadrati dei parametri: β1 = codev(x, y)/dev(x) = 11676/35981 = 0.3245, β0 =

y − β1x = −0.62 − 0.3245 ∗ 9.65 = −3.75147, σ2 = [dev(y) − β21dev(x)]/(n − 2) = (184193 − 0.32452 ∗

35981)/(471− 2) = 384.66.

(B) H0 : β1 = 0 contro H0 : β1 > 0. La v.c. test β1. La distribuzione campionaria sotto H0 data

da (β1 − 0)/σ(β1)|H0 ∼ T (n − 2), dove σ(β1) =√σ2/dev(x) =

√384.66/35981 =

√0.01069 = 0.1034.

Per una dimensione campionaria cos elevata si pu tuttavia approssimare T (n − 2) ' N(0, 1). Il valore

campionario della statistica test sotto H0 allora z − camp = (β1 − 0)/σ(β1) = 0.3245/0.1034 = 3.1385.p − value = P (”valore campionario della statistica test ancora pi spostato verso H1 rispetto a quello

rilevato”|H0) = P [(β1 − 0)/σ(β1) > 3.1385|H0] = P (Z > 3.1385) = 0.00085.

106

Page 107: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

54 Compito del 07.07.2004

54.1 Testo

Esercizio 1Per la progettazione di una politica economica a favore della famiglia stato commissionato uno studiospecifico. Viene effettuata un’indagine ad hoc misurando, su un campione di 203 giovani famiglie, alcunevariabili demografiche ed economiche. La tabella seguente riporta la composizione del campione rispettoal numero di figli.

Numero di figli 0 1 2 3 oltre 3frequenza 62 63 35 28 15

(a) Si calcoli la media e la mediana del numero di figli, sapendo che il numero totale di figli nella classeoltre 3 48 .(b) Si sottoponga a test l’ipotesi (nulla) che la proporzione di famiglie senza figli in Italia sia ≤ 0.3(α = 0.01).

Esercizio 2Si vuole stabilire se le famiglie con almeno due figli abbiano redditi superiori a quelle con 0 o 1 figlio.Allo scopo vengono estratti due campioni casuali di 5 famiglie, uno dalla sottopopolazione di famigliecon almeno due figli e l’altro da quella con meno di 2 figli, rilevandone il reddito annuale (in migliaia dieuro). I dati sono riportati nella tabella seguente:

Reddito delle famiglie con almeno due figli 34.5 41.1 53 48.8 40Reddito delle famiglie con meno di due figli 28.1 36.8 28.6 39.1 32.2

Si ipotizzi che il reddito si distribuisca secondo una Normale.(a) Si sottoponga a test l’ipotesi che la varianza del reddito sia uguale nei due gruppi di famiglie (conα = 0.05).(b) Si costruisca un intervallo di confidenza per la differenza delle medie dei redditi delle due popolazioni(1− α = 0.95).

Esercizio 3Nell’indagine riportata nell’esercizio 1, stata rilevata anche la variabile Y sulla preferenza tra due tipidi interventi pubblici a sostegno della famiglia: Y = 0 per ’incentivi monetari a pioggia’ e Y = 1 per’incrementi nei servizi alla famiglia’ (asili nido, spazi gioco, eccetera); con X viene indicata la variabiledicotomizzata (0− 1) relativa al numero di figli. I dati sono riportati nella tabella seguente.

Y ↓ X → 0: Meno di 2 figli 1: Almeno di 2 figli0: Incentivi a pioggia 69 391: Incremento dei servizi 56 39

(a) Utilizzando la definizione frequentista di probabilit (si assuma che il numero di prove sia sufficien-temente elevato) si ricavi la funzione di massa della variabile casuale doppia (X,Y ) e se ne calcoli ilcoefficiente di correlazione.(b) Si sottoponga a test l’ipotesi nulla che la proporzione di famiglie con almeno due figli non sia supe-riore fra coloro che preferiscono incremento dei servizi rispetto a quelli favorevoli ad incentivi a pioggia(α = 0.05).

Esercizio 4Si consideri l’esperimento di estrazione casuale di famiglie dal campione riportato all’esercizio 3, in modosimilare all’estrazione di palline da un’urna.(a)Indicare la distribuzione di probabilit della variabile X. Se si estrae a caso una famiglia dal campione,sapendo che la famiglia estratta preferisce un incremento dei servizi, qual’ la probabilit che abbia almeno2 figli?(b) Si estrae (con reimmissione) 10 famiglie dal campione: qual la probabilit che al massimo 3 abbianoalmeno 2 figli? Per il calcolo si utilizzi un’opportuna approssimazione della distribuzione di probabilit.

107

Page 108: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

54.2 Soluzioni

Esercizio 1(a) Calcolo della mediana: la posizione della mediana (N + 1)∗0.5 = (203 + 1)∗0.5 = 102. Confrontandotale valore con le frequenze cumulate si ricava immediatamente che il valore della Mediana 1.

Media = Totale/N = (0*62+1*63+2*35+3*28+48)/203 = 265/203 = 1.305419

(b) Definisco la variabile dicotomica X: X = 1 se la famiglia non ha figli, X = 0 altrimenti. Test suuna proporzione con n grande. H0 : p ≥ 0.3 contro H1 : p > 0.3 da trasformare in H0 : p = 0.3 controH1 : p > 0.3. p = 62/203 = 0.3054187. Il valore campionario delle statistica test (standardizzata) sottoH0 zoss = (p− 0.3)/

√0.3(1− 0.3)/203 = 0.1684748; la regione di rifiuto [zcrit,+∞) = [2.3263,+∞) per

cui accetto H0.

Esercizio 2X1 = Reddito famiglie con almeno 2 figli, X2 = Reddito famiglie con meno di 2 figli.(a) Test confronto tra varianze: H0 : σ2

1/σ22 = 1 contro H0 : σ2

1/σ22 6= 1.

x1 = 43.48, x2 = 32.96 s21 = 54.337, s2

2 = 23.913. Valore della statistica test sotto H0: Foss = s21/s

22 =

2.2723; regione di accettazione [0.1041, 9.6045] (da trovare dalle tavole della F (4, 4) per cui accetto H0.(b) Intervallo di confidenza per la differenza tra medie con campioni indipendentix1 = 43.48, x2 = 32.96, s2

1 = 54.337, s22 = 23.913, tα/2 = ±2.306

Intervallo: [1.3975 ; 19.6425].

Esercizio 3(a) Funzione di massa della variabile doppia (X,Y ):

Y ↓ X → 0: Meno di 2 figli 1: Almeno di 2 figli Totale0: Incentivi a pioggia 0.3399 0.1921 0.5321: Incremento dei servizi 0.2759 0.1921 0.468Totale 0.6158 0.3842 1

Calcolo del coefficiente di correlazione: E(X) = 0.3842, E(Y ) = 0.468, V (X) = 0.6158 ∗ 0.3842 = 0.2366,V (Y ) = 0.532 ∗ 0.468 = 0.2490, C(X,Y ) = E(XY ) − E(X)E(Y ) = 0.1921 − 0.468 ∗ 0.3842 = 0.01229,Corr(X,Y ) = C(X,Y )/[σ(X)σ(Y )] = 0.01229/

√0.2366 ∗ 0.2490 = 0.050634

(b) p1 = proporzione di famiglie con almeno 2 figli tra coloro che preferiscono un incremento dei servizi;p2 = proporzione di famiglie con almeno 2 figli tra coloro che preferiscono un incentivo a pioggia. Testsulla differenza tra due proporzioni con n grande. H0 : p1 − p2 = 0 contro H1 : p1 − p2 > 0. p1 =39/(39 + 69) = 0.3611; p2 = 39/(39 + 56) = 0.4105; p = (39 + 39)/(39 + 39 + 69 + 56) = 0.3842;m = 69 + 39 = 108, n = 56 + 39 = 95. Il valore osservato della statistica test sotto H0 zoss =((p1 − p2) − 0)/

√pq(1/m+ 1/n) = −0.7220; la regione di rifiuto [zcrit,+∞) = [1.6449,+∞), per cui

accetto H0.

Esercizio 4(a) Distribuzione marginale di X2:

X2 → 0: Meno di 2 figli 1: Almeno di 2 figliprobabilit 0.616 0.384

P (X = 1|Y = 1) = P (X = 1⋂Y = 1)/P (Y = 1) = 0.1921/0.468 = 0.4105.

(b) Y = ’numero di famiglie che, su 10 estrazioni, hanno almeno 2 figli’ ha distribuzione Binomiale(n =10, p = 0.3842). Nel testo si consiglia di utilizzare l’approssimazione Normale, per cui Y ≈ N(µ = np =10 ∗ 0.3842 = 3.842, σ2 = npq = 10 ∗ 0.3842 ∗ 0.6158 = 2.3659). Allora P (Y ≤ 3) = P (Z ≤ −0.5474) =0.2920

108

Page 109: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

55 Compito del 14.09.2004

55.1 Testo

Esercizio 1La WINorLOSS una grossa agenzia di giochi e scommesse. Utilizzando un campione casuale di giocateal LOTTO ha elaborato la seguente tabella, in cui sono riportate le frequenze e altre statistiche.

Giocate (Euro) (0, 5] (5, 20] (20, 50] (50, 100] > 100 Totale Media (Var. corretta)1/2

Maschi 42 42 44 28 41 197 61.127 80.832Femmine 18 49 44 34 13 158 38.723 39.283

(A) Rappresentare graficamente la distribuzione marginale della variabile giocate nel campione, tenendopresente che l’ottica di tale rappresentazione confrontare la distribuzione ottenuta con quella teorica dellevariabili casuali a voi note.(B) 1) Poisson; 2) Normale; 3) nessuna delle due. Sia sulla base del grafico costruito che di conside-razioni teoriche, scegliete fra le 3 alternative proposte il modello probabilistico che vi sembra pi opportunoper rappresentare la variabile giocate. Motivare la risposta.

Esercizio 2Con riferimento ai dati dell’esercizio 1:

(A) Limitatamente a coloro che giocano pi di 50 Euro, stimare la probabilit che un giocatore preso a casosia un Maschio e fornire una stima della deviazione standard dello stimatore utilizzato.(B) Determinare l’intervallo di confidenza al 95% per la probabilit di cui al punto precedente.

Esercizio 3Con riferimento ai dati dell’esercizio 1:

(A) Nel giocare al LOTTO, non tutti i maschi giocano la stessa somma e, allo stesso modo, non tutte lefemmine giocano la stessa cifra. In altri termini, le giocate presentano in ciascuno dei due sessi una certavariabilit. Utilizzando i dati del campione possibile stabilire se la variabilit delle giocate la stessa nei duesessi? Formulare il problema in termini di test delle ipotesi.(B) Costruire l’intervallo di stima al 98% per la differenza fra quanto giocano in media i maschi rispettoalle femmine.

Esercizio 4In un’altra analisi, la WINorLOSS ha messo in relazione le giocate con l’et del giocatore per capirese vi una qualche relazione. Ha formulato alcuni modelli lineari nei coefficienti e quello che ha datorisultati migliori fa dipendere il logaritmo naturale della giocata (y) dal logaritmo naturale dell’et (x). Lestatistiche calcolate sul campione sono le seguenti:

n = 1521

n

n∑i=1

xi = 3.6111

n

n∑i=1

yi = 3.954

1

n

n∑i=1

(xi − x)2 = 0.1381

n

n∑i=1

(yi − y)2 = 24.4921

n

n∑i=1

(xi − x)(yi − y) = 0.001

(A) In base al modello formulato le giocate sono legate all’et del giocatore?(B) In base al modello formulato, quanta parte della variabilit del logaritmo naturale delle giocate spiegatadalla variabile x?(Aiuto: Ricordare che σ2 = [Dev(y)− β2

1Dev(x)]/(n− 2))

55.2 Soluzioni

Esercizio 1

X = ”giocata in Euro”

109

Page 110: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Calcolo e disegno dell’istogramma delle densit relative. Notare che per il calcolo della densit dell’ul-tima classe la classe va chiusa (possibilmente ad un valore ragionevole). Le densit sono state moltiplicateper 100 per evitare troppi decimali.

classi (0, 5] (5, 20] (20, 50] (50, 100] [100, 500] TotaleFrequenze marginali 60 91 88 62 54 355

Frequenze marginali relative 0.169 0.2563 0.2479 0.1746 0.1521 1densit relative×100 3.3803 1.7089 0.8263 0.3493 0.038

(B) La risposta pi opportuna nessuna delle due. Infatti la Poisson da escludere perch la variabilecontinua; la Normale non appropriata per l’elevata asimmetria che emerge dall’istogramma.

Esercizio 2

X ∼ Be(p), dove X = 1 se maschio e 0 se femmina.

(A) p = X stimatore di p dalle ottime propriet. La stima puntuale p = x = 69/116 = 0.5948. La

deviazione standard di tale stimatore σ(p) =√pq/n =

√0.5948 ∗ 0.4052/116 =

√0.00208 = 0.04558

(B) Pivot: (p− p)/σ(p) ≈ N(0, 1). In base ai calcoli di cui al punto precedente, l’intervallo di confidenza

richiesto [p− zσ(p), p+ zσ(p)] = [0.5055, 0.6842], dove z = 1.96.

Esercizio 3

Assunzioni: X1 = ”giocata in Euro di un maschio” ∼ N(µ1, σ21), X2 = ”giocata in Euro di una femmina”

∼ N(µ2, σ22). In realt le dimensioni campionarie sono abbastanza grandi da permettere di essere un po’

elastici su tali assunzioni.

(A) Test delle ipotesi: H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. La v.c. test S2

1/S22 che sotto H0 ha

distribuzione F (n1 − 1, n2 − 1) = F (196, 157) Il valore campionario della statistica test allora s21/s

22 =

6533.81/1543.15 = 4.2341, da confrontare con la regione di accettazione [0.7443, 1.3503].

(B) Intervallo di confidenza per µ1 − µ2 per dati non appaiati. Essendo la dimensione campionariasufficientemente elevata possiamo utilizzare il pivot [(X1 −X2)− (µ1 − µ2)]/

√s2

1/n1 + s22/n2 ≈ N(0, 1).

Calcoli: x1 − x2 = 61.127 − 38.723 = 22.404, s =√s2

1/n1 + s22/n2 =

√42.93336 = 6.55236, z = 2.326.

Allora l’intervallo [(X1 −X2)− zs, (X1 −X2) + zs] = [7.1609, 37.6471].

Esercizio 4

Prima alcuni calcoli: dev(x) = 0.138 ∗ 152 = 20.976, dev(y) = 24.492 ∗ 152 = 3722.784, codev(x, y) =

0.001 ∗ 152 = 0.152, β1 = codev(x, y)/dev(x) = 0.00725, σ2 = [Dev(y)− β21Dev(x)]/(n− 2) = 24.82.

(A) H0 : β1 = 0 contro H0 : β1 > 0. La v.c. test β1, la cui distribuzione campionaria sotto H0 data

da (β1 − 0)/σ(β1)|H0 ∼ T (n − 2), dove σ(β1) =√σ2/dev(x) =

√24.82/20.976 =

√1.18319 = 1.08774.

Per una dimensione campionaria cos elevata si pu tuttavia approssimare T (n − 2) ' N(0, 1). Il valore

campionario della statistica test sotto H0 allora z− camp = (β1 − 0)/σ(β1) = 0.00725/1.08774 = 0.0067,da confrontare con la regione di accettazione [-1.96,1.96].(B) In pratica si chiede l’indice R2 = Dev(regressione)/Dev(totale) che nel caso in oggetto pu esserecalcolato come corr(x, y)2 = Codev(x, y)2/[Dev(x)Dev(y)] = 2.959e− 07.

110

Page 111: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

56 Compito del 15.12.2004

56.1 Testo

Esercizio 1La ditta GGP, produttrice di palline da golf, vuole immettere sul mercato un nuovo modello di palline.Decide di far analizzare da alcuni professionisti i 5 modelli di palline pi venduti sul mercato. Nella tabellaseguente sono riportati i giudizi medi dei professionisti per i 5 modelli di palline in termini di Durezzaall’impatto e Resa al lancio.

Marca Strata Nike Callaway Titleist WilsonDurezza all’impatto 51.6 59.7 82 82.9 37Resa al lancio 21.5 68.6 77.9 69.3 31.4

(a) Calcolare un indice descrittivo di associazione tra le due variabili considerate.(b) Calcolare la mediana della variabile Resa al lancio. Indicare inoltre quale delle due variabili presentamaggiore variabilit confrontando gli indicatori opportuni.

Esercizio 2La GGP decide di condurre un esperimento per verificare la qualit del nuovo modello di palline da golfin termini di distanza percorsa. L’esperimento consite nel far lanciare le palline da una macchina conun angolo ed una velocit prestabiliti. Assumendo che la distanza percorsa dalla pallina si distribuiscanormalmente con varianza (secondo il parere di un esperto) assumibile pari a 5600 cm2,(a) di quanti lanci deve essere composto l’esperimento se la GGP desidera ottenere una stima per intervallocon confidenza per la distanza media percorsa 99 % ed ampiezza massima 23 cm?(b) Per problemi atmosferici, si riesce ad effetture un esperimento di soli 32 lanci, osservando una distanzapercorsa media pari a 2050 cm ed una varianza campionaria corretta pari a 2025 cm2. Calcolare unastima della distanza media con confidenza 99 %.

Esercizio 3La GGP ritiene che sia vantagioso immettere sul mercato il nuovo modello di palline solo se le distanzamedia del lancio dalla macchina superiore a 1957 cm.(a) Sulla base dei risultati dell’esperimento riportati nell’esercizio 2(b), consigliereste alla GGP di lanciareil nuovo modello di palline? (porre il livello di significativit α = 0.05 )(b) Dato che la variabilit del lancio determina anch’essa la qualit del nuovo modello in termini di preci-sione, la GGP ritiene di poter vendere il nuovo modello di palline ad un prezzo elevato solo se la variabilitrisulta inferiore a quella degli altri modelli di palline GGP, pari a 1369 cm2. Cosa consigliate alla GGP?(porre il livello di significativit α = 0.05 )

Esercizio 4Pare che il macchinario che stampa il marchio della GGP sul nuovo modello di palline sia difettoso: daindicazioni fornite da un tecnico, sembra che la probabilit di produrre una pallina non marchiata sia paria 0.01 .(a) Qual la probabilit che in una confezione di 15 palline ve ne sia almeno una non marchiata?(b) L’operaio addetto alla macchina ritiene per che la probabilit che la macchina produca palline nonmarchiate superiore a quanto dichiarato dal tecnico. Per verificare chi abbia ragione, viene effettuata unindagine analizzando un campione casuale di 203 palline: tra le palline analizzate sono state trovate 20non marcate. Dareste ragione al tecnico o all’operaio? (porre il livello di significativit α = 0.05 )

56.2 Soluzioni

Esercizio 1Le due variabili sono quantitative. Chiamo X = Durezza all’impatto e Y = Resa.(a) MediaX = 62.64 MediaY = 53.74 VarX = 314.6424 VarY = 517.0264Coefficiente di correlazione = ρXY = 0.8271 .(b) MedianaY = 68.6 .Confronto mediante i coefficienti di variazione: CVD = 0.2832 CVR = 0.4231

111

Page 112: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Esercizio 2Chiamo X = Distanza percorsa dalla pallina.(a) X ∼ N(µ, 5600). Livello di confidenza = 1− α = 0.99 zα/2 = ± 2.58

Ampiezza dell’intervallo = 2 · zα/2 · 74.8331√n

= 23 . Da cui n = 282

(b) X ∼ N(µ, σ2) con varianza ignota. tn−1,α2= ± 2.744 .

Intervallo di confidenza: [2028.1716 ; 2071.8284].

Esercizio 3(a) Test su una media con varianza ignota.H0 : µ = 1957 H1 : µ > 1957valore osservato = 11.6908 valore critico = 1.6955Rifiuto H0 consiglio di immettere il nuovo modello sul mercato(b) Test su una varianza con media ignota.H0 : σ2 = 1369 H1 : σ2 < 1369valore osservato = 45.8546 valore critico = 19.2806Accetto H0, consiglio di non immettere il nuovo modello sul mercato con prezzo elevato

Esercizio 4Chiamo X = Presenza del marchio sulla pallina ⇒ X ∼ Ber(p)(a) Chiamo Y = Numero di palline non marchiate in una confezione ⇒ Y ∼ Bin(n, p), con n = 15 e p =0.01P (Y ≥ 1) = 1− P (Y = 0) = 1− n!

0!n!p0(1− p)n = 0.1399

(b) Test su una proporzione con n grande.H0 : p = 0.01 H1 : p > 0.01p = 0.0985zoss = 12.676, zcrit = 1.6449 Rifiuto H0

112

Page 113: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

57 Compito del 11.01.2005

57.1 Testo

Esercizio 1. La Questura, per proprie finalit, ha costruito la seguente distribuzione di probabilitcongiunta per le variabili casuali X e Y (entrambe possono assumere solo valori 0 o 1):

Y = 0 Y = 1

X = 0 0.282 0.021X = 1 0.56 0.137

(A) Ricavare le distribuzioni di probabilit condizionata di Y dato X = 0 e di Y dato X = 1. Commentarebrevemente il risultato.(B) Calcolare il coefficiente di correlazione fra X e Y .

Esercizio 2. Per stimare il numero di partecipanti a manifestazioni pubbliche che si tengono in unacerta zona di propria competenza, la Questura ha suddiviso l’intera zona in un 17364 aree della stessasuperficie. Utilizzando come informazione campionaria i conteggi delle persone che si trovano in uncampione di queste aree possibile stimare il totale dei partecipanti.I conteggi effettuati durante una manifestazione politica nelle 76 aree che formano il campione sono statisintetizzati nella seguente tabella:

persone conteggiate 0 1 2 3 4 5 6 7 Totalefrequenza 7 14 13 22 8 7 3 2 76

(A) Rappresentare graficamente la distribuzione della variabile ’numero di persone conteggiate per area’,considerando che l’ottica di tale rappresentazione deve essere quella di confrontare la distribuzioneottenuta con quella teorica delle variabili casuali a voi note.(B) 1) Bernoulli; 2) Poisson; 3) Normale. Sia sulla base del grafico costruito che di considerazioni teoriche,scegliete fra le 3 alternative proposte il modello probabilistico che vi sembra pi opportuno per la variabile’numero di persone conteggiate per area’ e stimarne il parametro o i parametri.

Esercizio 3. Con riferimento ai dati e al problema di cui all’esercizio precedente:

(A) Ricordando che l’intera zona di competenza composta, in base alla suddivisione della Questura, da17364 aree, costruire uno stimatore del numero totale di persone presenti alla manifestazione in oggetto.Fornire una stima sia della grandezza d’interesse che della deviazione standard dello stimatore utilizzato.(B) Costruire un intervallo di confidenza al 98% per il numero totale di persone presenti alla manifesta-zione.

Esercizio 4. Il contratto degli addetti alla pubblica sicurezza (p.s.) prevede indennizzi in caso di incidentiche provochino agli stessi danni fisici. Indicata con X la variabile indennizzo (per singolo addetto e persingolo evento) in manifestazioni sportive e con Y l’analoga variabile in altro tipo di manifestazioni, idati campionari relativi agli indennizzi sono stati elaborati nelle seguenti statistiche sintetiche (dati inmigliaia di Euro):

m = 141

m

m∑i=1

xi = 2.5241

m− 1

m∑i=1

(xi − x)2 = 0.077

n = 131

n

n∑i=1

yi = 2.151

n− 1

n∑i=1

(yi − y)2 = 0.115

Ipotizzando la normalit delle distribuzioni degli indennizzi:(A) Sottoporre a test l’uguaglianza delle varianze delle due distribuzioni (α = 0.02).(B) Sottoporre a test l’ipotesi nulla che i due tipi di manifestazioni comportano in media gli stessiindennizzi contro l’alternativa in cui quelli per manifestazioni sportive risultano maggiori (α = 0.05).

113

Page 114: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

57.2 Soluzioni

Esercizio 1

(A) Si devono costruire 2 funzioni di massa: fY (y|X = 0) e fY (y|X = 1). Calcolo: fY (0|X = 0)esattamente P (Y = 0|X = 0) = P (X = 0, Y = 0)/P (X = 0) = 0.282/(0.282 + 0.021) = 0.9307. Gli altrisi calcolano in modo analogo. Risultati:

y fY (y|X = 0) y fY (y|X = 1)

0 0.9307 0 0.80341 0.0693 1 0.1966

(B) ρ(X,Y ) = C(X,Y )/√V (X)V (Y ) = 0.026874/

√0.211191 ∗ 0.133036 = 0.1603. Infatti: 1) si nota

che X e Y sono due v.c. di Bernoulli, cio X ∼ Be(0.697) e Y ∼ Be(0.158). Quindi E(X) = 0.697,V (X) = 0.697 ∗ (1 − 0.697) = 0.211191, E(Y ) = 0.158, V (Y ) = 0.158 ∗ (1 − 0.158) = 0.133036. 2)Per la covarianza, C(X,Y ) = E(XY ) − E(X)E(Y ) = 0.137 − 0.697 ∗ 0.158 = 0.026874, dove E(XY ) =0 ∗ 0 ∗ 0.282 + 0 ∗ 1 ∗ 0.021 + 1 ∗ 0 ∗ 0.56 + 1 ∗ 1 ∗ 0.137 = 0.137.

Esercizio 2

(A) Grafico della distribuzione delle frequenze relative:

x 0 1 2 3 4 5 6 7 Totalefrequenza 7 14 13 22 8 7 3 2 76

frequenza relativa 0.0921 0.1842 0.1711 0.2895 0.1053 0.0921 0.0395 0.0263 1

(B) Fra quelli considerati il modello probabilistico pi ragionevole il modello di Poisson: X ∼ Poisson(λ).

Stimatore di λ dalle ottime propriet la media campionaria: λ = x = 205/76 = 2.6974.

Esercizio 3

(A) Sia N = 17364 il numero totale di pezzi in cui la Questura ha suddiviso l’area d’interesse. Al punto(B) stato stimato (λ) il numero medio di persone per area. Il totale T sar allora dato da: T = Nλ e

potr essere stimato dallo stimatore T = Nλ. Stima puntuale: T = Nλ = 17364 ∗ 2.6974 = 46837.1053;deviazione standard dello stimatore: σ(T ) = σ(Nλ) = Nσ(λ) = N

√λ/n, che pu essere stimata con

σ(T ) = N

√λ/n = 17364 ∗

√2.6974/76 = 3271.2453.

(B) Poich T = Nλ, per costruire un intervallo di confidenza per T basta costruirne uno per λ e poi tra-

sformarlo opportunamente nel corrispondente intervallo per T . Intervallo per λ: pivot (X−λ)/√X/n ≈

N(0, 1); intervallo: [x − z√x/n, x + z

√x/n] = [2.2591, 3.1356], dove x = 2.6974, n = 76, z = 2.3263,

α = 0.02. Intervallo per T = Nλ: [N ∗ 2.2591, N ∗ 3.1356] = [39227.0506, 54447.1599].

Esercizio 4

X = ”indennizzo evento sportivo” ∼ N(µX , σ2X), Y = ”indennizzo altri eventi” ∼ N(µY , σ

2Y ); X e Y

indipendenti.

(A) Test delle ipotesi: H0 : σ2X/σ

2Y = 1 contro H1 : σ2

X/σ2Y 6= 1. La v.c. test S2

1/S22 che sotto H0

ha distribuzione F (n1 − 1, n2 − 1) = F (13, 12) Il valore campionario della statistica test allora s21/s

22 =

0.077/0.115 = 0.6696, da confrontare con la regione di accettazione [0.2525, 4.0999].

(B) Test delle ipotesi: H0 : µX−µY = 0 contro H1 : µX−µY > 0 per dati non appaiati. La v.c. test X−Ye, ipotizzando σX = σY , la distribuzione sotto H0 della v.c. test la seguente: (X−Y )/[Sp

√1/m+ 1/n] ∼

T (m + n − 2), dove S2p = [(m − 1)S2

X + (n − 1)S2Y ]/(m + n − 2). Il valore campionario della statistica

test allora (x− y)/[sp√

1/m+ 1/n] = 3.14641, da confrontare con la regione di rifiuto [1.7081,+∞] (peri calcoli: m = 14, n = 13, x = 2.524, y = 2.15, s2

X = 0.077, s2Y = 0.115, s2

p = 0.09524, sp = 0.30861,

sp√

1/m+ 1/n = 0.11887).

114

Page 115: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

58 Compito del 26.01.2005

58.1 Testo

Esercizio 1Siano X ed Y due variabili casuali con la seguente distribuzione di probabilit congiunta:

X 0 1 2Y0 0.32 0.18 0.061 0.16 0.09 0.19

(a) Calcolare il valore atteso e la mediana della variabile X. Rappresentare graficamente la sua funzionedi ripartizione.(b) Si derivino le tre distribuzioni condizionate di Y data X e sulla base di queste si deduca se Y e Xsono stocasticamente indipendenti.

Esercizio 2Alla gara dei 3000 siepi partecipano 9 atleti, tra i quali due italiani. Assumendo che tutti i partecipantiabbiano la stessa probabilit di vittoria,(a) qual la probabilit che i due italiani si classifichino nelle prime tre posizioni?(b) Sapendo che nel superamento di una barriera un atleta (di cui non si conosce la nazionalit) cade edcostretto ad abbandonare la corsa, qual la probabilit che vinca un italiano?

Esercizio 3Le misure ottenute da un certo atleta nel lancio del peso sono assimilabili ad una v.c. X con distribuzionenormale. I due atleti classificatisi alle prime due posizioni in una certa gara hanno ottenuto i seguentirisultati (i valori riportati sono misurati in metri):

Atleta primo classificato 20.2 16.7 19.9Atleta secondo classificato 17.5 19.1 16.1

(a) Si calcoli una stima per intervallo della lunghezza media di lancio del primo classificato con confidenza0.99 .(b) In base ai risultati ottenuti si verifichi se in media il vincitore pi bravo del secondo classificato(α = 0.01).

Esercizio 4Si vuole studiare l’uso e l’efficacia della pappa reale per migliorare le prestazioni di un atleta:(a) In uno studio su un campione casuale di 109 atleti, si rileva che 54 fanno uso di pappa reale. Sapendoche il 31 % della popolazione italiana usa la pappa reale, possibile affermare, sulla base dei risultaticampionari, che la proporzione degli atleti che ne fa uso superiore a quella della popolazione italiana?(α = 0.1)(b) Si effettua un esperimento ad hoc su un campione casuale di 4 lanciatori del disco che vengonosottoposti ad un mese di trattamento con pappa reale. La lunghezza del miglior lancio in una giornatadi allenamento viene misurata all’inizio dello studio e, successivamente, dopo il mese di trattamento conpappa reale. I valori relativi al miglior lancio in una giornata di allenamento dei 4 atleti prima e dopo iltrattamento sono riportati nella tabella seguente:

Valori medi prima del trattamento 47.2 41.4 44.7 41.1Valori medi dopo il trattamento 50.8 43.9 42.7 42.8

Si valuti l’efficacia del trattamento (α = 0.05), specificando le assunzioni necessarie.

58.2 Soluzioni

Esercizio 1(a)

115

Page 116: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

X 0 1 2p(x) 0.48 0.27 0.25F(x) 0.48 0.75 1

E[X] = 0.77 Mediana[X] = 1.(b) Le distribuzioni condizionate non sono tutte identiche tra loro, per cui le due variabili non sonoindipendenti.

P (Y | X = 0) P (Y | X = 1) P (Y | X = 0) P (Y )0 0.667 0.667 0.24 0.561 0.333 0.333 0.76 0.44

Esercizio 2(a) Chiamo X = Numero di atleti italiani classificatisi nelle prime 3 posizioni.⇒ X ∼ Ipergeometrica con N = 9 N1 = 2, n = 3.

Quindi P (X = 2) =(N1

2 )(N−N1n−2 )

(Nn)= 0.0833

(b) L’informazione incompleta tale da non modificare la mia conoscenza sulla nazionalit del vincitore,quindi non modifica la probabilit di verificarsi dell’evento:P ( vince un italiano | qualcuno caduto ) = P ( vince un italiano ) = 0.2222

Esercizio 3X1 = Lunghezza del lancio in metri del primo classificato(a) Stima per intervallo della media di X1. X1 ∼ N(µ1, σ

21). Varianza ignota.

X = 18.9333 Varianza campionaria corretta = 3.7633 t2,α2 = ±9.9248Intervallo di confidenza: [7.8174 ; 30.0492].(b) X2 = Lunghezza del lancio in metri del primo classificato ∼ N(µ2, σ

22)

Si assume l’uguaglianza delle due varianze: σ21 = σ2

2 .Test confronto tra medie con campioni indipendenti.H0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0α = 0.01 x1 = 18.9333, x2 = 17.5667, s2

1 = 3.7633, s22 = 2.2533

toss = 0.965, tcrit = 3.7469 gdl = 4 Accetto H0

Esercizio 4(a) Chiamo X la variabile dicotomica X = 1 se l’atleta fa uso di pappa reale e X = 0 altrimenti.X ∼ Bin(p)Test su una proporzione con n grande.H0 : p = 0.31 H1 : p > 0.31α = 0.1 p = 0.4954zoss = 4.1855, zcrit = 1.2816 Rifiuto H0

(b) Chiamo D = lancio migliore dopo il trattamento – lancio migliore prima del trattamento

D 3.6 2.5 -2 1.7

Test confronto tra medie con campioni dipendentiH0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0xD = 1.45, σ2

D = 5.8967toss = 1.1942, tcrit = 2.3534 Accetto H0

116

Page 117: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

59 Compito del 10.02.2005

59.1 Testo

Esercizio 1La MAGNA–MAGNA spa produce pizze surgelate. L’esperienza ha mostrato che il peso alla commer-cializzazione non sempre uguale a quanto rilevato alla data di fabbricazione, anche quando il prodottoviene conservato correttamente. Un’analisi estensiva ha mostrato che la variazione percentuale delpeso fra la fabbricazione e la commercializzazione in media del -4.1%, con una deviazione standard 4.7.Assumendo che la variazione percentuale di peso ha una distribuzione normale:

(A) Determinare la distribuzione del peso alla commercializzazione per una pizza che alla data difabbricazione pesa 238g.(B) Determinare quale deve essere il peso di fabbricazione se si vuole che, alla commercializzazione, soloil 2.5% delle pizze pesi meno dei 250g dichiarati nella confezione.

Esercizio 2Per ridurre le variazioni di peso successive alla produzione, la MAGNA–MAGNA sta studiando la possibi-lit di modificare il processo produttivo delle pizze surgelate. In particolare, l’uso di un nuovo addensantenell’impasto ha prodotto, su un campione di 5 pizze, i risultati riportati in tabella (i valori rappresentanola variazione percentuale di peso fra la data di fabbricazione e quella di commercializzazione). Tenen-do presente che per situazione usuale si intende quella dell’analisi estensiva sintetizzata nell’esercizioprecedente:

pizza 1 2 3 4 5variazione % del peso 3.4 -0.9 4.1 -1.8 -4.5

(A) Verificare se il nuovo ingrediente effettivamente efficace nel limitare il calo medio di peso rispetto allasituazione usuale (livello di significativit = 0.005).(B) Verificare se la varianza del nuovo procedimento significativamente diversa da quella usuale (livellodi significativit = 0.05).

Esercizio 3La MAGNA–MAGNA effettua controlli di qualit anche sulla presenza di eventuali difetti estetici presentinelle pizze prodotte, quali bruciacchiature, bolle, residui di lavorazione, ecc. I controlli effettuati su uncampione di 20 pizze hanno prodotto i risultati riportati in tabella (A = ’nessun difetto visibile’, D =’difetti lievi’, DD = ’difetti importanti’):

D DD D A DD A A A A A D A DD A A A A A A D

(A) Sintetizzare i dati osservati in una distribuzione di frequenza, in modo che si possano confrontare irisultati con quelli di campioni di dimensioni diverse.(B) Calcolare un opportuno indice di posizione.

Esercizio 4Alcuni tecnici vorrebbero utilizzare il campione di cui all’esercizio precedente per stimare la proporzionedi pizze con difetti estetici ma ritengono che il campione sia di dimensioni troppo limitate.

(A) Calcolare la dimensione del campione per ottenere un intervallo di confidenza per la proporzione dipizze con difetti di ampiezza 0.18 al livello di confidenza 0.98.(B) E’ stato estratto un campione di dimensione pari a quella calcolata al punto A, dal quale si rilevatoche il 38.6% delle pizze presenta difetti estetici. Fornire una stima puntuale della grandezza d’interesse(la proporzione di pizze con difetti) e una stima della deviazione standard dello stimatore utilizzato.

59.2 Soluzioni

Esercizio 1

117

Page 118: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) X = variazione % del peso ∼ N(µX = −4.1, σX = 4.7). Allora il peso alla commercializzazione diuna pizza da 238g la v.c. Y = 238(1 +X/100). Poich si tratta di una trasformazione lineare di una v.c.Normale abbiamo Y ∼ N(µY = 228.242, σY = 11.186), dove µY = 238(1 + µX/100) e σY = 238/100σX .

(B) Y = peso alla commercializzazione; P0 = peso alla fabbricazione (incognito). Allora, indicato cony = 250 il peso in g dichiarato nella confezione si ha: 0.025 = P (Y < y) = P (P0(1 + X/100) < y) =P [X < 100(y/P0 − 1)] = P [Z < [100(y/P0 − 1) − µX ]/σX ] (dopo aver standardizzato ambo i membri).Poich il termine [100(y/P0−1)−µX ]/σX uno z che lascia a sx una probabilit 0.025, dalle tavole si ricava[100(y/P0−1)−µX ]/σX = z = −1.96, da cui P0 = 100y/(zσX +µX +100) = 100∗250/86.6882 = 288.39.

Esercizio 2

Assunzioni: X = variazione % di peso col nuovo addensante ∼ N(µ, σ2).

(A) Test di H0 : µ = −4.1 contro H1 : µ > −4.1. V.c. test (X − µ)/(S/√n) ∼ T (n − 1), che sotto H0

diviene (X − −4.1)/(S/√n)|H0 ∼ T (n − 1). Calcoli: n = 5, x = 0.3/5 = 0.06, s2 = 52.652/4 = 13.163,

s = 3.6281, s/√n = 1.6225; valore campionario = (x−−4.1)/(s/

√n) = 2.5639, regione di rifiuto al 0.5%:

(4.6041,+∞).

(B) Test di H0 : σ2 = 4.72 contro H1 : σ2 6= 4.72. V.c. test (n − 1)S2/σ2 ∼ χ2(n − 1), che sotto H0

diviene (n − 1)S2/4.72 ∼ χ2(n − 1). Dai valori riportati al punto A si ricava: valore campionario =(n− 1)S2/4.72 = 2.3835, regione di accettazione al 5%: [0.4844, 11.1433].

Esercizio 3

(A) Distribuzione delle frequenze relative o percentuali:

modalit A D DDfrequenze relative 0.65 0.2 0.15

(B) Come indice di posizione possibile calcolare sia la moda che la mediana: moda = A, mediana = A.

Esercizio 4

X = ”pizza con difetti estetici” ∼ Be(p).

(A) Dimensione del campione pu essere calcolata con la formula n = (z/A)2 = 167.034 da arrotondare a168 (nei calcoli A = 0.18 l’ampiezza dell’intervallo, 0.02 il livello di confidenza e z = 2.326 dalle tavole).

(B) Si vuole stimare la proporzione di pizze con difetti. Uno stimatore dalle buone propriet p = X. Lastima puntuale allora p = x = 0.386 la cui deviazione standard σ(p) =

√pq/n pu essere stimata con

σ(p) =√pq/n =

√pq/n =

√0.00141 = 0.0376.

118

Page 119: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

60 Compito del 31.05.2005

60.1 Testo

Esercizio 1. La CIABATTI spa una societ che produce piccoli mobili (mobili tv e computer, carrelli,piccole scaffalature, ecc.). L’impresa possiede stabilimenti sia in Italia che altri Paesi, ma sta valutando lapossibilit di delocalizzare interamente le proprie produzioni in un paese dell’Est europeo, dove ritiene chei costi siano pi bassi. Si tratta per di valutare se questo non vada a discapito della qualit. Per verificarequesto, un nuovo prodotto stato messo in produzione sia in uno stabilimento italiano che in uno collocatoin Romania. Il test comparativo ha dato i risultati mostrati in tabella.

stabilimento italiano stabilimento rumenonumero difettosi 6 27

numero non difettosi 129 139

Indicate con p1 e p2 le proporzioni di prodotti difettosi, rispettivamente, nello stabilimento italiano e inquello rumeno (di cui la tabella costituisce un campione) rispondere alle seguenti domande:(A) La qualit delle produzioni fra i due stabilimenti diversa? Formulare il problema in termini di testdelle ipotesi su p1 − p2 ed effettuare il test (α = 0.02).(B) Calcolare il p–value del test costruito al punto precedente. Il p–value ottenuto che considerazionisuggerisce?

Esercizio 2. Relativamente ai costi, una delle variabili di maggiore importanza riguarda come notoquelli relativi al personale. La tabella seguente mostra alcune statistiche relative alla retribuzioni orariedei dipendenti dei due stabilimenti (valori monetari espressi in euro).

stabilimento italiano stabilimento rumenonumero dipendenti 58 63

media retribuzioni orarie 16.54 3.89√varianza corretta delle retribuzioni orarie 2.92 1.32

Dopo aver specificato le assunzioni necessarie:(A) Fornire una stima puntuale della differenza fra le retribuzioni orarie medie nei due stabilimenti edella deviazione standard dello stimatore utilizzato.(B) Costruire l’intervallo di confidenza (1− α = 0.9) per la differenza fra le retribuzioni orarie medie.

Esercizio 3. Naturalmente l’analisi del costo del lavoro deve essere pi correttamente valutata in terminidi produttivit. Per analizzare questo aspetto la CIABATTI ha raccolto alcuni bilanci di imprese italianedirettamente concorrenti e per ciascuna societ ha calcolato l’indicatore valore aggiunto/costo del personale(in pratica il reciproco dell’indice CLUP). I dati sono riportati in tabella.

Valore dell’indicatore [0,0.7] (0.7,1.2] (1.2,1.5] (1.5,1.9] (1.9,2.5] (2.5,3.5]Frequenza 1 6 5 7 6 4

(A) Rappresentare graficamente la distribuzione.(B) Calcolare lo scarto interquartile.

Esercizio 4. Con riferimento al test comparativo di cui all’esercizio 1:

(A) Ilie, nuovo addetto alla qualit dello stabilimento rumeno, ha il compito di saggiare la qualit di solo 6fra i 166 totali prodotti nel suo stabilimento per il test comparativo. Calcolare la probabilit che Ilie nontrovi prodotti difettosi.(B) Utilizzando le informazioni ricavabili dai dati dell’esercizio 1, calcolare quanto devono essere le di-mensioni n1 ed n2 dei due campioni (cio il numero totale di prodotti in ciascuno dei due stabilimentiper il test comparativo) se si vuole un intervallo di confidenza per p1 − p2 di ampiezza 0.142 al livello diconfidenza 0.98 e si assume n1 = n2.

119

Page 120: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

60.2 Soluzioni

Esercizio 1

Assunzioni: X1 = ’difettoso/non difettoso stabilimento italiano’∼ Be(p1), X2 = ’difettoso/non difettosostabilimento rumeno’∼ Be(p2).(A) Test per H0 : p1 − p2 = 0 contro H1 : p1 − p2 6= 0 (α = 0.02). La v.c. test (standardizzata)[X1 − X2 − (p1 − p2)]/

√p1q1/n1 + p2q2/n2 la distribuzione , approssimativamente, N(0, 1). Sotto H0

abbiamo [X1−X2−0]/√pq(1/n1 + 1/n2)|H0 ≈ N(0, 1), dove p la stima pooled di p sotto H0 e q = 1− p.

Regione di accettazione per la statistica standardizzata = [−2.326, 2.326], con cui occorre confrontare ilvalore campionario -3.2645 della statistica test. (Calcoli: x1 = 6/135 = 0.0444, x2 = 27/166 = 0.1627,p = (6 + 27)/(135 + 166) = 33/301 = 0.1096, q = 1− 0.1096 = 0.8904,

√pq(1/n1 + 1/n2) =

√0.001311 =

0.036209.)

(B) p−value = 2P ([X1−X2−0]/√pq(1/n1 + 1/n2) > |−3.2645||H0) = 2P (Z > 3.2645) = 2∗5e−04 =

0.001.

Esercizio 2

Assunzioni: X1 = ’retribuzione oraria stabilimento italiano’∼ [µ1, σ21 ], X2 = ’retribuzione oraria stabili-

mento rumeno’[µ2, σ22 ]. Le dimensioni campionarie sono abbastanza elevate da poter utilizzare criteri di

inferenza di tipo asintotico senza dover specificare la forma delle distribuzioni delle due v.c. Parametrosu cui fare inferenza: µ1 − µ2.

(A) Stimatore puntuale di µ1 − µ2: X1 − X2, la cui distribuzione campionaria approssimata data da[X1 − X2 − (µ1 − µ2)]/

√S2

1/n1 + S22/n2 ≈ N(0, 1). Stima puntuale: x1 − x2 = 16.54 − 3.89 = 12.65.

Stima della deviazione standard dello stimatore:√s2

1/n1 + s22/n2 =

√2.922/58 + 1.322/63 =

√0.1747 =

0.4179.

(B) L’output dell’esercizio precedente serve anche per costruire l’intervallo di confidenza per µ1 − µ2

all’1 − α = 0.9: [x1 − x2 − z√s2

1/n1 + s22/n2, x1 − x2 + z

√s2

1/n1 + s22/n2] = [11.9626, 13.3374], dove

z = 1.645.

Esercizio 3

(A) Istogramma di frequenza (assolute o relative a scelta dello studente):

Valore dell’indicatore [0,0.7] (0.7,1.2] (1.2,1.5] (1.5,1.9] (1.9,2.5] (2.5,3.5]Densit assolute 1.429 12 16.667 17.5 10 4Densit relative 0.049 0.414 0.575 0.603 0.345 0.138

(B) Q1 = 1.215, Q3 = 2.175. Quindi lo scarto interquartile Q3 −Q1 = 0.96.

Esercizio 4

(A) X = ’numero difettosi fra quelli di Ilie’ ∼ Ipergeometrica(N = 166,K = 27, n = 6). Allora P (X =0) = 0.3386. Se si fosse utilizzata l’approssimazione binomiale (di cui, nelle condizioni dell’esercizio,esistono i presupposti) avremmo avuto X ∼ Binomiale(n = 6, p = 0.1627) e quindi P (X = 0) = 0.3447.

(B) L’ampiezza dell’intervallo di confidenza per p1− p2 data da A = 2z√x1(1− x1)/n1 + x2(1− x2)/n2.

Assumendo n1 = n2 e, in base alle informazioni dell’esercizio 1, x1 = 0.0444 e x2 = 0.1627 possiamoricavare n1 (ed n2 che uguale) come incognita: n1 = [2z

√x1(1− x1) + x2(1− x2)/A]2 = 191.8099 ' 192.

(Calcoli:√x1(1− x1) + x2(1− x2) =

√0.178665 = 0.4227 e z = 2.326, dato che α = 0.02).

120

Page 121: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

61 Compito del 09.06.2005

61.1 Testo

Esercizio 1. L’ASSOFIDI un’associazione che vigila sul mondo del credito al consumo. In uno studiol’associazione ha presentato un’analisi comparativa sul credito al consumo fra Nord–Est e Sud. In uncommento ha dichiarato che ’. . . a livello territoriale, l’importo medio dei finanziamenti concessi risultatosostanzialmente uguale nelle due aree, con una variabilit pi elevata nella prima’. La tabella seguentesintetizza i dati campionari sui quali sono basate tali considerazioni (valori monetari espressi in euro).

Nord–Est Sudnumero finanziamenti 126 146

media dell’importo finanziato 357.49 330.51mediana dell’importo finanziato 360.59 332.02√

varianza corretta dell’importo finanziato 125.44 73.56

(A) Sottoporre a test l’affermazione di ASSOFIDI sulle medie dei finanziamenti concessi nelle due areeterritoriali (α = 0.1).(B) Determinare l’intervallo di confidenza al livello di confidenza 0.998 per la differenza fra le medie degliimporti finanziati nelle due aree territoriali.

Esercizio 2. In base ai dati dell’esercizio 1:

(A) Costruire l’intervallo di confidenza per il rapporto fra le deviazioni standard degli importi finanziatinelle due aree territoriali (1− α = 0.98).(B) Utilizzando le informazioni desumibili dai dati dell’esercizio 1, quale dovrebbe essere la dimensionedel campione al Sud per ottenere un intervallo di confidenza per la media di ampiezza 16.53 al livellodi confidenza 0.998? Nel calcolo si assuma che la varianza dell’importo finanziato al Sud sia identica aquella rilevata nel campione.

Esercizio 3. ASSOFIDI ha comunicato inoltre che, come numero, il 56.6% dei crediti sono stati erogatinel Nord–Est e il rimanente 43.4% al Sud. Assumendo che, nelle due aree territoriali considerate, l’am-montare degli importi finanziati siano indipendenti e abbiano distribuzione normale con momenti identicia quelli rilevabili dal campione:

(A) Calcolare la probabilit che, estratto a caso un finanziamento, questo riguardi un importo maggioredi 469 euro.(B) Calcolare la probabilit che un finanziamento superiore 469 euro venga effettuato al Nord–Est.

Esercizio 4. La ricerca di ASSOFIDI di cui all’esercizio 1 risultata interessante anche per un interlocutoreamericano, che per in base alla sua esperienza desidera qualche informazione supplementare.

(A) L’interlocutore preferisce ragionare sulle mediane piuttosto che sulle medie: possibile fornirgli il valoredelle due mediane (al Nord–Est e al Sud) se si utilizza come unit monetaria il dollaro americano (1 euro= 1.25 dollari)? Se s, calcolare quali sono i valori; se no, dire perch.(B) L’interlocutore preferisce ragionare sul coefficiente di variazione piuttosto che sulla deviazione stan-dard: possibile fornirgli il valore dei due coefficienti di variazione (al Nord–Est e al Sud) se si utilizzacome unit monetaria il dollaro americano (1 euro = 1.25 dollari)? Se s, calcolare quali sono i valori; seno, dire perch.

61.2 Soluzioni

Esercizio 1

Assunzioni: X1 = ’importo finanziato nel Nord-Est’∼ N(µ1, σ21), X2 = ’importo finanziato nel Sud’∼

N(µ2, σ22).

(A) Test per H0 : µ1 − µ2 = 0 contro H1 : µ1 − µ2 6= 0 (α = 0.1). La v.c. test (standardizzata)[X1 − X2 − (µ1 − µ2)]/

√S2

1/n1 + S22/n2 la cui distribuzione , approssimativamente, N(0, 1) (n1 ed

121

Page 122: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

n2 sono sufficientemente elevate da poter utilizzare criteri di inferenza asintotici). Sotto H0 abbiamo[X1 −X2 − 0]/

√S2

1/n1 + S22/n2|H0 ≈ N(0, 1). Regione di accettazione per la statistica standardizzata

= [−1.645, 1.645], con cui occorre confrontare il valore campionario 2.1201 della statistica test. (Calcoli:x1 = 357.49, x2 = 330.51, s1 = 125.44, s2 = 73.56, s2

1 = 15735.19, s22 = 5411.07,

√s2

1/n1 + s22/n2 =√

161.9446 = 12.7257.)

(B) Intervallo di confidenza per µ1−µ2 (livello di confidenza 1−α = 0.998): [x1−x2−z√s2

1/n1 + s22/n2, x1−

x2 + z√s2

1/n1 + s22/n2] = [−12.3454, 66.3054] (Calcoli: z = 3.09; gli altri dati all’esercizio precedente.)

Esercizio 2

Assunzioni: le stesse dell’esercizio precedente.

(A) Intervallo di confidenza per σ21/σ

22 (livello di confidenza 1−α = 0.98): [c1s

21/s

22, c2s

21/s

22] = [1.9368, 4.3421]

(Calcoli: c1 = 0.666, c2 = 1.4932; gli altri dati all’esercizio precedente.) Il corrispondente intervallo diconfidenza per σ1/σ2 allora [1.3917, 2.0838].

(B) Utilizzando le informazioni desumibili dal campione si ricava n = (2zs/A)2 = 27.5042 = 756.45 ' 757,dove: z = 3.09 (α = 0.002), s = 73.56, A = 16.53.

Esercizio 3

Assunzioni: X = ’importo finanziamento’, S = ’finanziamento effettuato al Sud’; abbiamoX|S ∼ N(µS =330.51, σS = 73.56), X|S ∼ N(µS = 357.49, σS = 125.44), P (S) = 0.434, P (S) = 0.566.

(A) Formula della probabilit marginale (o totale): P (X ≥ 469) = P (X ≥ 469|S)P (S) + P (X ≥469|S)P (S) = 0.0299 ∗ 0.434 + 0.187 ∗ 0.566 = 0.1188.

(B) Formula di Bayes: P (S|X ≥ 469) = P (X ≥ 469|S)P (S)/P (X ≥ 469) = 0.187 ∗ 0.566/0.1188 =0.8909.

Esercizio 4

(A) La mediana un operatore equivariante: considerata una trasformazione strettamente crescente, ’lamediana della trasformazione la trasformazione della mediana’. Quindi: Me(importo in dollari) =Me(1.25×importo in euro) = 1.25 × Me(importo in euro). Al Nord–Est: Me(importo in dollari) =1.25× 360.59 = 450.7375; al Sud: Me(importo in dollari) = 1.25× 332.02 = 415.025.

(B) Dalle propriet della media e della deviazione standard abbiamo in definitiva che CV (importo indollari) = CV (importo in euro). Infatti: µ(importo in dollari) = µ(1.25×importo in euro) = 1.25 ×µ(importo in euro) e σ(importo in dollari) = σ(1.25×importo in euro) = 1.25 × σ(importo in euro),per cui CV (importo in dollari) = σ(importo in dollari)/µ(importo in dollari) = 1.25 × σ(importo ineuro)/[1.25 × σ(importo in euro)] = σ(importo in euro)/µ(importo in euro) = CV (importo in euro).Allora: al Nord–Est CV (importo in dollari) = 125.44/357.49 = 0.3509 e al Sud CV (importo in dollari) =73.56/330.51 = 0.2226.

122

Page 123: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

62 Compito del 28.06.2005

62.1 Testo

Esercizio 1Considerate la seguente distribuzione di probabilit discreta:

YX 0 1 20 0.05 0.10 0.031 0.21 0.11 0.192 0.08 0.15 0.08

(a) Calcolate P (X < 2 ∩ Y > 0); P (X < 2 | Y = 1).(b) Calcolate Var[Y ] e Var[Y | X = 1].

Esercizio 2Alcune aziende stanno sperimentando l’orario flessibile, in cui ogni impiegato pu scegliere l’orario di lavoropi adatto alle proprie esigenze, entro certi limiti. Si ritiene che l’orario flessibile riduca l’assenteismo.L’azienda CUP ha registrato nel periodo 2000-03 un numero medio di giorni di assenza pari a 6.3 l’anno.Nel 2004 la Cup ha introdotto l’orario flessibile. Alla fine del 2005 stato estratto un campione di 101impiegati, registrando in media 5.3 giorni di assenza con varianza campionaria corretta 8.41 giorni2. Siassuma che la variabile giorni di assenza abbia distribuzione Normale.(a) Potreste affermare che l’orario flessibile ha ridotto l’assenteismo rispetto al 2000-03? (livello disignificativit α = 0.05)(b) Riportate una stima per intervallo della varianza del numero di giorni di assenza (livello di confidenza1− α = 0.99).

Esercizio 3La CUP vuole verificare se vi siano differenze in termini di puntualit tra i dipendenti della filiale CUP-1ste quelli della CUP-2nd. A tal fine, rileva la variabile scarto in minuti = orario di arrivo del dipendente- orario ufficiale di inizio lavoro del personale su un campione di 5 dipendenti della CUP-1st e di altri 5dipendenti della CUP-2nd. I dati sono riportati nella tabella seguente:

Scarto in minuti per dipendente CUP-1st -23 40 57 -10 1Scarto in minuti per dipendente CUP-2nd 42 -10 -5 12 23

Si noti che con dipendente puntuale si intende dipendente non in ritardo rispetto all’orario ufficiale diinizio lavoro.Assumendo che gli scarti in minuti si distribuiscano normalmente con uguale varianza nota e pari a 302.5:(a) stimare un intervallo di confidenza di livello 0.90 che confronti le medie degli scarti in minuti nelledue filiali.(b) si effettui un test d’ipotesi per capire se i dipendenti della CUP-2sd siano pi puntuali di quelli dellaCUP-1st, utilizzando il p–value.

Esercizio 4La CUP ritiene che il livello di assenteismo sia diferrenziato per settore. Nella tabella seguente riportaalcune statistiche per i 4 settori della filiale CUP-1st.

Settore media gg. assenza n. dipendentiSettore A 6.7 35Settore B 4.7 51Settore C 3.8 20Settore D 8.5 12

(a) Calcolare il numero medio di giorni di assenza nella intera filiale CUP-1st.(b) Un dirigente ha intenzione di penalizzare i settori con alto livello di assenteismo e propone come

123

Page 124: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

variabile d’interesse Y = (numero di giorni di assenza)2. possibile ottenere per ciascun settore la mediadella variabile Y utilizzando i dati riportati in tabella? Se s, effettuare il calcolo, altrimenti spiegare ilmotivo.

62.2 Soluzioni

Esercizio 1

(a) P (X < 2∩Y > 0) = P (X = 0∩Y = 1)+P (X = 0∩Y = 2)+P (X = 1∩Y = 1)+P (X = 1∩Y = 2) == 0.10 + 0.03 + 0.11 + 0.19 = 0.43.

P (X < 2 | Y = 1) = P (X < 2 ∩ Y = 1)/P (Y = 1) = (0.10 + 0.11)/(0.10 + 0.11 + 0.15) = 0.583

(b)Y assume valori 0, 1, e 2 con probabilit 0.34 , 0.36 e 0.30 rispettivamente.Quando X = 1, Y assume valori 0, 1, e 2 con probabilit 0.41 , 0.22 e 0.37 rispettivamente.

Da cui E[Y ] = 0 · 0.34 + 1 · 0.36 + 2 · 0.30 = 0.96Var[Y ] = (0− 0.96)2 · 0.34 + (1− 0.96)2 · 0.36 + (2− 0.96)2 · 0.30 = 0.6384.

E[Y | X = 1] = 0 · 0.41 + 1 · 0.22 + 2 · 0.37 = 0.96 Var[Y | X = 1] = (0− 0.96)2 · 0.41 + (1− 0.96)2 · 0.22 +(2− 0.96)2 · 0.37 = 0.7784.

Esercizio 2

X = numero di giorni di assenza ∼ N(µ, σ2).(a) Test d’ipotesi: H0 : µ = 6.3 contro H1 : µ < 6.3, α = 0.05. Varianza ignota ma n grande.zoss = 5.3−6.3√

8.41/101= −3.465. zcrit = −1.645. Rifiuto H0.

(b)Media ignota: (n−1)S2

σ2 ∼ χ2n−1.

χ2n−1,α/2 = 67.3275, χ2

n−1,1−α/2 = 140.1697 (sono indicati i quantili della distribuzione - come da ta-

vole).Intervallo di confidenza: [5.9999 ; 12.4912].

Esercizio 3

X1 = scarto in minuti per la CUP-1st ∼ N(µ1, 302.5); X2 = scarto in minuti per la CUP-2nd∼ N(µ2, 302.5). Campioni indipendenti.

(a) X1 − X2 ∼ N(µ1 − µ2,

σ21

n1+

σ22

n2

)con n1 = n2 = 5 e σ2

1 = σ22 = 302.5.

x1 = 13 x2 = 12.4 zα/2 = ±1.645. Da cui l’intervallo cercato [−17.495 ; 18.695].

(b) Test d’ipotesi: H0 : µ1 = µ2 contro H1 : µ1 > µ2, α = 0.05. Varianza nota.

Variabile test (sotto H0): Z = X1−X2√σ21n1

+σ22n2

∼ N(0, 1).

zoss = (13−12.4)−0√2∗302.5/5

= 0.0545. p-value ' P (Z > 0.05) = 1− 0.51994 = 0.48006. Accetto H0.

Esercizio 4

(a) µCUP = (6.7 · 35 + 4.7 · 51 + 3.8 · 20 + 8.5 · 12)/118 = 5.5271.

(b) Non possibile effettuare il calcolo, in quanto la Y non una trasformazione lineare della X.

124

Page 125: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

63 Compito del 13.07.2005

63.1 Testo

Esercizio 1. Nel mese di maggio la COXXA ha condotto una ricerca sui bilanci delle societ di capitale consede nella provincia di Siena. Durante il convegno in cui ha presentato i risultati della ricerca, un relatoredella COXXA ha affermato che ’. . . nel 2003 il settore agricolo ha mostrato una redditivit mediamentesuperiore rispetto agli altri’. Tali conclusioni sono basate sulle statistiche (presentate in tabella) relativea due campioni di bilanci, dove la redditivit misurata con l’indice ’ROI = reddito operativo/capitaleinvestito’ espresso il percentuale.

Agricoltura Altri settorinumero bilanci 56 215

media ROI 9.35 4.36√varianza corretta del ROI 6.19 5.5

(A) Sottoporre a test l’affermazione di COXXA sulla maggiore redditivit media del settore agricolo(α = 0.1).(B) Determinare la potenza del test costruito al punto precedente, in corrispondenza dell’ipotesi alter-nativa ’la differenza fra i ROI medi (agricoltura – altri settori) pari a 1.3’. Nel calcolo si assuma che levarianze campionarie coincidano con quelle vere.

Esercizio 2. In base ai dati dell’esercizio 1:

(A) Fornire stima puntuale e per intervallo (1−α = 0.998) della deviazione standard del ROI nel settoreagricolo.(B) Si assuma ora che il vero valore della deviazione standard del ROI in agricoltura sia esattamentequello stimato al punto precedente. In tale caso, quanto vale il terzo quartile del suo stimatore?

Esercizio 3. Analizzando pi in dettaglio il ROI del settore agricolo, la COXXA ha ricavato la distribu-zione di frequenza riportata nella seguente tabella.

Valore del ROI [-5,0] (0,4] (4,6] (6,8] (8,12] (12,20] TotaleFrequenza 3 7 4 9 17 16 56

Supponendo di disporre dei soli dati riportati in tabella:(A) Determinare la moda del ROI in agricoltura.(B) Determinare la mediana del ROI in agricoltura.

Esercizio 4. Un politico intervenuto al convegno non ha chiaro il modo in cui la COXXA ha trattole conclusioni di cui all’esercizio 1. Con questo pretesto ha ’agganciato’ alcuni interlocutori della societdurante il buffet: gli hanno parlato anche del concetto di ’distribuzione campionaria’ ma alla fine non neha ricavato molto.In questo ambito si assuma che una variabile casualeX assuma solo valori nell’insieme 8, 32, 16, ciascunodei quali con probabilit 1/3. Supponendo di estrarre con reimmissione campioni di dimensione n = 2:

(A) Ricavare la distribuzione campionaria della media campionaria.(B) La media campionaria uno stimatore corretto della media della variabile casuale X? Giustificare larisposta.

63.2 Soluzioni

Esercizio 1 Assunzioni: X1 = ’ROI del settore agricolo’∼ N(µ1, σ21), X2 = ’ROI degli altri settori’∼

N(µ2, σ22).

(A) Test per H0 : µ1 − µ2 = 0 contro H1 : µ1 − µ2 > 0 (α = 0.1). La v.c. test (standardizzata)[X1 − X2 − (µ1 − µ2)]/

√S2

1/n1 + S22/n2 la cui distribuzione , approssimativamente, N(0, 1) (n1 ed

n2 sono sufficientemente elevate da poter utilizzare criteri di inferenza asintotici). Sotto H0 abbiamo[X1 −X2 − 0]/

√S2

1/n1 + S22/n2|H0 ≈ N(0, 1). Regione di accettazione per la statistica standardizzata

125

Page 126: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

= (−∞, z.critico = 1.282], con cui occorre confrontare il valore campionario 5.4941 della statistica test.(Calcoli: x1 = 9.35, x2 = 4.36, s1 = 6.19, s2 = 5.5, s2

1 = 38.32, s22 = 30.25,

√s2

1/n1 + s22/n2 =

√0.8249 =

0.9082.)

(B) In base al testo σ1 = s1 = 6.19 e σ2 = s2 = 5.5. Seppure con questa modifica facile verificareche la regione di rifiuto R rimane inalterata, anche se adesso deve essere riferita alla variabile test[X1−X2−0]/

√σ2

1/n1 + σ22/n2 che sotto H0 ha una distribuzione N(0, 1). Potenza = γ = P (campione ∈

R) = P ([X1 − X2 − 0]/√σ2

1/n1 + σ22/n2 > z.critico|H1). Sotto H1, la distribuzione di [X1 − X2 −

0]/√σ2

1/n1 + σ22/n2 non pi (approssimativamente) N(0, 1), dato che sotto H1 si ha µ1 − µ2 = 1.3,

non pi µ1 − µ2 = 0. Allora, in pratica, bisogna ’togliere la standardizzazione basata su H0 e metterequella sotto H1’. Riprendendo i passaggi: γ = P ([X1 − X2 − 0]/

√σ2

1/n1 + σ22/n2 > z.critico|H1) =

P (X1 − X2 > z.critico ∗√σ2

1/n1 + σ22/n2|H1) = P ([X1 − X2 − 1.3]/

√σ2

1/n1 + σ22/n2 > z.critico −

1.3/√σ2

1/n1 + σ22/n2|H1) = P (Z > 1.282− 1.3/0.9082|H1) = P (Z > −0.1498|H1) = 0.55953.

Esercizio 2 Assunzioni: X = ’ROI del settore agricolo’∼ N(µ, σ2).

(A) Stima puntuale di σ: s = 6.19. Intervallo di confidenza per σ2 relativo al settore agricolo (livellodi confidenza 1 − α = 0.998): [(n − 1)s2/c2, (n − 1)s2/c1] = [22.6216, 74.8089] (Calcoli: c1 = 28.1731,c2 = 93.1675 dalle tavoleχ2(n− 1); n = 56, s2 = 38.32). Il corrispondente intervallo di confidenza per σallora [4.7562, 8.6492].

(B) In pratica si richiede il valore x tale che P (S > x) = 0.75, assumendo di conoscere che σ = 6.19.Nel calcolo opportuno ricondursi ad una variabile di cui ’si sa maneggiare la distribuzione’, ovvero (n−1)S2/σ2 ∼ χ2(n − 1). Allora 0.75 = P (S < x) = P (S2 < x2) = P ((n − 1)S2/σ2 < (n − 1)x2/σ2 = c).Quindi c = (n − 1)x2/σ2 il quantile 0.75 della χ(n − 1) dove n = 56: dalle tavole c = 61.665, da cui siricava x =

√cσ2/(n− 1) =

√42.9637 = 6.5547.

Esercizio 3

Valore del ROI [-5,0] (0,4] (4,6] (6,8] (8,12] (12,20] TotaleFrequenza 3 7 4 9 17 16 56

Densit 0.6 1.75 2 4.5 4.25 2

(A) Moda (per modalit raggruppate in classi) = valore centrale della classe con densit pi alta = 7.(B) Mediana (per modalit raggruppate in classi) = 9.1765.

Esercizio 4

(A) Per determinare la distribuzione campionaria basta fare: 1) la lista di tutti i possibili campionidi dimensione n = 2 con ripetizione; 2) calcolare di ognuno la corrispondente probabilit e la statisticadesiderata (nell’esercizio la media); 3) tabulare la distribuzione ottenuta. Risultato:

x 8 12 16 20 24 32 Totale

P (X = x) 0.1111 0.2222 0.1111 0.2222 0.2222 0.1111 1

(B) Dai dati dell’esercizio si ha che E(X) = 18.6667 mentre dalla distribuzione campionaria di cui soprasi ricava immediatamente che E(X) = 18.6667. La media campionaria allora uno stimatore corretto diE(X). Si poteva anche rispondere argomentando che la media campionaria in generale uno stimatorecorretto di E(X) (purch la media di X, come nel caso dell’esercizio, esista).

126

Page 127: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

64 Compito del 16.12.2005

64.1 Testo

Esercizio 1Il sig. Rossi afferma di avere poteri extrasensoriali e di poter indovinare il risultato del lancio di unacomune moneta da 1 euro.(a) Se il sig. Rossi dicesse il falso, quale sarebbe la probabilit che egli indovini il risultato del lancio dellamoneta per 4 volte di seguito e sbagli solo alla 5a volta?(b) Il sig. Rossi viene sottoposto ad un esperimento composto da 10 prove: noto che, per ciascuna prova,la probabilit di indovinare il risultato 0.5 se non si hanno poteri extrasensoriali e 0.68 con poteri extra-sensoriali. Ponendo come equiprobabile il fatto che il sig. Rossi possa avere o meno poteri extrasensoriali,quale la probabilit che egli indovini esattamente 7 risultati?

Esercizio 2Un istituto di ricerca interessato a valutare quale sia la proporzione di italiani che credono di avere poteriextrasensoriali.(a) L’Istituto desidera ottenere una stima per intervallo con un errore di al massimo ±0.1 per taleproporzione, al livello di confidenza 0.99. Quale dovrebbe essere la dimensione del campione?(b) Per motivi contingenti, l’indagine viene effettuata su un campione di 221 individui, di cui 77 hannodichiarato di avere poteri extrasensoriali. Sapendo che la proporzione di inglesi che ritengono di averepoteri extrasensoriali 0.07 , si verifichi se gli italiani ritengono di avere poteri extrasensoriali in proporzionesuperiore agli inglesi. (α = 0.01)

Esercizio 3Al sig. Rossi viene chiesto di effettuare una prova multipla, composta da due esperimenti: al primo, X,egli pu ottenere un punteggio di 0, 1 e 10; al secondo, Y , egli pu ottenere un punteggio di 0 e 1. Latabella seguente riporta la distribuzione delle frequenze relative congiuntamente per i due esperimenti.

X = 0 X = 1 X = 10Y = 0 0.28 0.14 0.16Y = 1 0.04 0.11 0.27

(a) Calcolare un indice di associazione tra i punteggi ottenuti nei due esperimenti.(b) Sia W una variabile casuale N(µ, σ2) avente moda e 90o percentile identici a quelli della distribuzionecondizionata di X dato Y = 0. Si determini il valore dei parametri µ e σ2.

Esercizio 4Sia X ∼ N(µ, σ2). Si estrae un campione di dimensione n = 111 da tale popolazione e si intende stimareµ mediante uno dei seguenti stimatori:

T1 = 8X1 T2 =1

n

n∑i=1

Xi T3 =X3 +Xn−3

2

(a) Calcolare la distorsione dei tre stimatori.(b) Calcolare la varianza dei tre stimatori ed effettuare una scelta motivata tra i tre stimatori proposti,sulla base anche di quanto ottenuto al punto (a).

64.2 Soluzioni

Esercizio 1(a) Se il sig. Rossi dice il falso, allora egli indovina a caso l’esito del lancio di una moneta con probabilit0.5.Ogni lancio una prova bernoulliana con X = 1 se egli indovina. Le prove sono indipendenti. Y = numerodi lanci fino al primo errore.P (Y = 5) = 0.55 = 0.0312(b) X = 1 se il sig. Rossi ha poteri extrasensoriali, 0 altrimenti. X ∼ Ber(0.5).

127

Page 128: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Y = Numero di risultati indovinati su n = 10 prove ∼ Bin(n, p).Y | X = 0 ∼ Bin(n, 0.5), e Y | X = 1 ∼ Bin(n, 0.68).P (Y = 7) = P (Y = 7 | X = 0)P (X = 0) + P (Y = 7 | X = 1)P (X = 1) = 0.1908.

Esercizio 2Chiamo X = 1 se l’unit statistica ritiene di avere poteri extrasensoriali e 0 altrimenti. Allora X ∼ Ber(p).(a) Si desidera che zα

2

√p(1−p)n ≤ 0.1 con livello di confidenza = 1 − α = 0.99 . Posta la varianza di X

pari al suo valore massimo, ossia p(1− p) = 0.25 , si ottiene n = 167(b) Test su una proporzione con n grande.H0 : p = 0.07 H1 : p > 0.07α = 0.01 p = 0.3484zoss = 16.2218, zcrit = 2.3263 Rifiuto H0

Esercizio 3(a) X e Y sono due variabili quantitative. Un indice di associazione lineare ρ.E(X) = 4.55 E(Y ) = 0.42 V ar(X) = 22.5475 V ar(Y ) = 0.2436.CovXY = 0.899 ρXY = 0.3836(b) Distribuzione condizionata di X | Y = 0

X = 0 X = 1 X = 10prob 0.48 0.24 0.28

Moda di X | Y = 0: 0 90o percentile: 10W ∼ N(0, σ2) con P (W ≤ 10) = 0.75.Da cui σ2 = 60.8875

Esercizio 4(a) Per le propriet del valore atteso, E(T1) = 8µ per cui D = E(T1)− µ = 7µ.E(T2) = µ per cui D = 0.E(T3) = µ+µ

2 = µ per cui D = 0.(b) Per le propriet della varianza

V ar(T1) = 82σ2. V ar(T2) = σ2

n . V ar(T3) = 14σ

2 + 14σ

2 = 12σ

2.

128

Page 129: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

65 Compito del 19.01.2006

65.1 Testo

Esercizio 1. Sia X una distribuzione Normale, con media µ = 4 e deviazione standard σ = 3, da cuiviene estratto un campione casuale semplice di dimensione n = 3.

(A) Determinare la distribuzione campionaria di ciascuno dei seguenti stimatori della media:

T1 =2X1 +X2

3T2 =

X1 +X2 +X3 − 0.2

3

(B) Dovendo sceglierne uno, quale fra i due stimatori di µ risulta preferibile? Giustificare la risposta.

Esercizio 2. SNOWBUZZ spa progetta e costruisce attrezzature sportive per lo sci. Attualmente stastudiando nuovi materiali per lo sci di fondo. La scorsa settimana i tecnici dell’impresa hanno svoltouna prova comparativa nella quale hanno confrontato i nuovi sci con quelli attualmente in produzione inun test di scorrevolezza su due prove indipendenti di sci. I risultati del test sono riassunti in tabella: inumeri riportati sono i secondi impiegati a percorrere un tratto di pista innevato.

Nuovi sci 23.8 19.3 23.1 33.2 26.7Vecchi sci 30.9 20.2 37 27.3 24.1

Facendo le opportune assunzioni sulla variabile casuale ’tempo impiegato a percorrere il tratto di pista’rispondere alle seguenti domande:(A) I nuovi sci sono piu veloci dei vecchi? (α = 0.05). (Ai fini della formulazione delle ipotesi, tenerepresente che si vuole evitare di produrre i nuovi sci se non sono piu veloci dei vecchi.)(B) Calcolare il p-value del test di cui al punto precedente assumendo che le vere varianze risultinoidentiche a quelle calcolate.

Esercizio 3. Con riferimento all’esercizio precedente, si considerino ora solo i dati relativi ai nuovi sci esi indichi con X la variabile casuale ’tempo di percorrenza del tratto di pista innevato’.

(A) Fra quelle note, scegliere la distribuzione che vi sembra piu adatta per la variabile X e stimarne iparametri.(B) Assumendo ora che i parametri stimati al punto precedente coincidano con il valore vero degli stessi,determinare il terzo quartile di X.

Esercizio 4. La velocita di uno sci non e pero l’unico aspetto da tenere presente: risultano assaiimportanti anche stabilita, controllo, maneggevolezza e altre caratteristiche che risultano tuttavia nonfacilmente misurabili in modo oggettivo. A questo proposito SNOWBUZZ spa si serve di alcuni atleti dialto livello come tester: dal loro giudizio viene ricavato un indice sintetico, chiamato FUN, per valutarela bonta dei nuovi attrezzi relativamente questo insieme di caratteristiche. Elaborando i test effettuati estato valutato che: per i nuovi sci il FUN ha media 4.5 e deviazione standard 1.9; per i vecchi il FUN hamedia 4.9 e deviazione standard 2.1. Si assuma che il FUN abbia distribuzione Normale sia per i vecchiche per i nuovo sci.

(A) Un atleta sta provando un paio di sci: egli lo ha scelto casualmente fra due paia, di cui uno del vecchiotipo e uno del nuovo. Nessuno ci ha pero informati sul tipo scelto dall’atleta. Calcolare la probabilitache l’atleta attribuisca un FUN superiore a 5.5.(B) Con riferimento alla situazione di cui al punto precedente, sapendo che l’atleta ha attribuito un FUNsuperiore a 5.5, calcolare la probabilita che gli sci testati siano del nuovo tipo.

65.2 Soluzioni

Esercizio 1 Assunzioni: X ∼ N(µ = 4, σ = 3). X = (X1, X2, X3) campione casuale semplice estrattoda X.

(A) I due stimatori proposti sono combinazioni lineari di X1, X2, X3 e quindi di v.c normali indipendenti.La loro distribuzione e allora Normale con media e varianza calcolabile in base alle proprieta dei valori

129

Page 130: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

attesi. E(T1) =2µ+ µ

3= 4; E(T2) =

µ+ µ+ µ− 4

3= 3.93333; V (T1) =

4σ2 + σ2

9= 5; V (T2) =

σ2 + σ2 + σ2

9= 3

(B) T1 e corretto ma la sua varianza e maggiore di quella di T2. La scelta puo allora basarsi sull’MSE:MSE(T1) = V (T1) + bias(T1)2 = 5 + 02 = 5, MSE(T2) = V (T2) + bias(T2)2 = 3 +−0.066672 = 3.00444.Preferibile quello con MSE piu piccolo.

Esercizio 2 Assunzioni: X1 = ’tempo impiegato dai nuovi sci’∼ N(µ1, σ21), X2 = ’tempo impiegato dai

vecchi sci’∼ N(µ2, σ22).

(A) Test per H0 : µ1−µ2 = 0 contro H1 : µ1−µ2 < 0 (α = 0.05). Stante l’esigua dimensione campionariaoccorre assumere σ1 = σ2. La v.c. test da utilizzare quindi [X1 − X2 − (µ1 − µ2)]/[Sp

√1/n1 + 1/n2]

la cui distribuzione T (n1 + n2 − 2). Sotto H0 abbiamo [X1 −X2 − 0]/[Sp√

1/n1 + 1/n2]|H0 ∼ T (n1 +n2 − 2). Regione di rifiuto per la statistica standardizzata = (−∞, t.critico) = (−∞,−1.8595), concui occorre confrontare il valore campionario −0.72495 della statistica test. (Calcoli: n1 = n2 = 5,

x1 = 25.22, x2 = 27.9, s21 = 26.857, s2

2 = 41.475, s2p =

s21(n1 − 1) + s2

2(n2 − 1)

n1 + n2 − 2= 34.166, sp = 5.84517,

sp√

1/n1 + 1/n2 = 3.69681)

(B) In base al testo dell’esercizio σ21 = s2

1 = 26.857 e σ22 = s2

2 = 41.475. Dato che le varianze sono adessonote la statistica test diviene [X1−X2−(µ1−µ2)]/

√σ2

1/n1 + σ22/n2 la cui distribuzione e N(0, 1). Sotto

H0 abbiamo [X1 −X2 − 0]/√σ2

1/n1 + σ22/n2 ∼ N(0, 1). p-value = P ([X1 −X2 − 0]/

√σ2

1/n1 + σ22/n2 <

z.camp|H0) = P (Z < z.camp|H0) = 0.23424, dove z.camp = [x1−x2− 0]/√σ2

1/n1 + σ22/n2 = −0.72495,√

σ21/n1 + σ2

2/n2 =√

13.6664 = 3.69681.

Esercizio 3 Assunzioni: X = ’tempo impiegato dai nuovi sci’∼ N(µ, σ2).

(A) µ = x = 25.22; σ2 = s2 = 26.857 (alte info:∑5i=1 x

2i = 3287.67).

(B) In base al testo, X ∼ N(µ = 25.22, σ = 5.18237). Si tratta di trovare il valore Q3 tale che P (X ≤Q3) = 0.75. Standardizzando (la distribuzione di X e Normale) e facendo i conti si ha: Q3 = µ+σz0.75 =25.22 + 5.18237 ∗ 0.674 = 28.71546.

Esercizio 4 Assunzioni: X =’FUN’; N =’nuovi sci’. X|N ∼ N(µ1 = 4.5, σ1 = 1.9), X|N =∼ N(µ2 =4.9, σ2 = 2.1). P (N) = P (N) = 0.5.

(A) P (X > 5.5) = P (X > 5.5|N)P (N) + P (X > 5.5|N)P (N) = 0.34344, dove P (X > 5.5|N) = P (Z >0.52632) = 0.29933 e P (X > 5.5|N) = P (Z > 0.28571) = 0.38755.

(B) P (N |X > 5.5) =P (X > 5.5|N)P (N)

P (X > 5.5)= 0.43579.

130

Page 131: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

66 Compito del 02.02.2006

66.1 Testo

Esercizio 1. Sia X una variabile casuale, avente media µ = 3 e deviazione standard pari a σ = 4, da cuiviene estratto un campione casuale semplice di dimensione n = 4.

(A) Cosa e possibile dire circa la distribuzione campionaria dei seguenti stimatori di µ?

T1 =7X1 + 5X2

12T2 =

6X2 + 2X3 + 12X4

20

(B) Dovendo sceglierne uno, quale fra i due stimatori di µ risulta preferibile? Giustificare la risposta.

Esercizio 2. BV spa e una piccola societa che commercializza vini. In collaborazione con alcunepizzerie–ristoranti della zona ha rilevato per alcuni giorni dati relativi agli abbinamenti fra tipologia divino (bianco/rosso) e pasto ordinato (pizza/altro). I dati raccolti (numero di clienti) sono riportati intabella.

VinoPasto rosso biancopizza 57 46altro 134 60

Oggetto d’interesse e la differenza di comportamento, relativamente alla tipologia di vino scelto, fra chiordina pizza e chi non la ordina. Si indichino con p1 e p2 le proporzioni di clienti che ordinano vini rossi,rispettivamente, fra chi consuma pizza e chi consuma altro e si assuma che queste due popolazioni sianoindipendenti.(A) Proporre uno stimatore puntuale per p1 − p2 e se ne indichi la distribuzione campionaria. Sulla basedi questo fornire una stima puntuale di p1 − p2 e una stima della deviazione standard dello stimatoreutilizzato.(B) E possibile concludere che le proporzioni p1 e p2 sono diverse? Impostare il problema come test delleipotesi e risolverlo utilizzando il p–value.

Esercizio 3. Con riferimento al campione di cui all’esercizio precedente, BV spa ha calcolato che i clientiche hanno ordinato pizza hanno speso in media 26.28 Euro con una deviazione standard 6.89 Euro, mentrecoloro che non hanno ordinato pizza hanno speso in media 38.71 Euro con una deviazione standard 10.26Euro.

(A) I dati a disposizione consentono di ricavare quanto hanno speso in media tutti i clienti inclusi nelcampione? Se sı calcolare il valore, altrimenti spiegare il perche.(B) Fornire una stima per intervallo (1−α = 0.98) della differenza di spesa media fra i due tipi di pasto.

Esercizio 4. A scopo promozionale, BS spa ha indetto un concorso fra vini. Al termine della gara, i duevini finalisti sono stati giudicati da 6 enologi mediante assegnazione di un punteggio. I punteggi assegnatidagli enologi a ciascuno dei vini sono riportati in tabella.

EnologoVino Dario Carlo Piero Rocco Gianni EnricovinoA 7 4.3 7 3 3.3 3.5vinoB 6.4 4.9 7.2 5.3 2.4 4.4

Specificando le assunzioni necessarie:(A) I due vini differiscono quanto a punteggio medio? (α = 0.1)(B) Utilizzando le informazioni che e possibile ricavare dalla tabella, quanti enologi occorrerebbe inter-pellare (in una eventuale futura rilevazione) per ottenere un intervallo di confidenza per la differenza dipunteggio medio fra i due vini che abbia ampiezza 0.48 al livello di confidenza 0.9?

131

Page 132: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

66.2 Soluzioni

Esercizio 1 Assunzioni: X ∼ N(µ = 3, σ = 4). X = (X1, X2, X3, X4) campione casuale sempliceestratto da X.

(A) I due stimatori proposti sono combinazioni lineari di X1, X2, X3, X4, v.c. indipendenti. La lorodistribuzione ha allora media e varianza calcolabile in base alle proprieta dei valori attesi. E(T1) =7µ+ 5µ

12= 3; E(T2) =

6µ+ 2µ+ 12µ

20= 3; V (T1) =

49σ2 + 25σ2

144= 0.5139 ∗ σ2 = 8.222; V (T2) =

36σ2 + 4σ2 + 144σ2

400= 0.46 ∗ σ2 = 7.36.

(B) Sia T1 che T2 sono corretti: quindi per entrambi l’MSE coincide con la varianza. Preferibile quellocon varianza piu piccola.

Esercizio 2 Assunzioni: X1 ∼ Be(p1), X2 ∼ Be(p2).

(A) ’Buon’ stimatore di p1 − p2 e X1 − X2, la cui distribuzione campionaria e, approssimativamente,N(p1− p2, p1q1/n1 + p2q2/n2) (q1 = 1− p1, q2 = 1− p2). Stima puntuale di p1− p2 e p1− p2 = −0.1373,mentre una stima della sua deviazione standard e data da:

√p1q1/n1 + p2q2/n2 =

√0.00350066 =

0.059166 (calcoli: p1 = x1 = 57/103 = 0.5534, p2 = x2 = 134/194 = 0.6907).

(B) Test per H0 : p1 − p2 = 0 contro H1 : p1 − p2 6= 0. La v.c. test eX1 −X2√

pq(1/n1 + 1/n2), che sotto

H0 ha una distribuzione, approssimativamente, N(0, 1) (p = (X1n1 + X2n2)/(n1 + n2) e il p–pooled e

q = 1 − p). Allora: valore campionario della statistica test e zcamp =x1 − x2√

pq(1/n1 + 1/n2)= −2.35071,

per cui p − value = 2P (Z > |zcamp||H0) = 2P (Z > | − 2.35071||H0) = 2 ∗ 0.00937 = 0.01874 (calcoli:

p = 0.6431, q = 1− 0.6431 = 0.3569,√pq(1/n1 + 1/n2) =

√0.00341 = 0.05841 .

Esercizio 3

(A) La media della spesa per l’intero campione si ricava dalla proprieta di associativita della media:

x =x1n1 + x2n2

n1 + n2=

26.28 ∗ 103 + 38.71 ∗ 194

103 + 194=

10216.58

297= 34.3993.

(B) Assunzioni: X1 ∼ (µ1, σ21) e X2 ∼ (µ2, σ

22), dove X1 e X2 indicano, rispettivamente, la spesa per pasti

a base di pizza e a base di altro. La dimensione campionaria e sufficientemente elevata da poter invocare

proprieta asintotiche anche senza assunzioni sulle distribuzioni. PivotX1 −X2 − (µ1 − µ2)√

S21/n1 + S2

2/n2

la cui distri-

buzione e, approssimativamente, N(0, 1). Intervallo di confidenza per µ1−µ2:

[x1 − x2 − z

√s2

1/n1 + s22/n2, x1 − x2 + z

√s2

1/n1 + s22/n2

]=

[−14.76043,−10.09957] (calcoli: 1 − α = 0.98, α = 0.02, z = 2.326, s21 = 47.4721, s2

2 = 105.2676,√s2

1/n1 + s22/n2 =

√1.00351 = 1.00175).

Esercizio 4 Assunzioni: trattasi di dati appaiati, per cui D = X1 − X2 ∼ N(µD, σ2D), dove X1 =

’giudizio sul vinoA’ e X2 = ’giudizio sul vinoB’.

(A) Test per H0 : µD = 0 contro H1 : µD 6= 0. La v.c. test eD − 0

SD/√n

, che sotto H0 ha una distribuzione

T (n−1). Allora: valore campionario della statistica test e tcamp =d− 0

sD/√n

= −0.88644, mentre la regione

di accettazione e [−2.015, 2.015] (calcoli: di = 0.6,−0.6,−0.2,−2.3, 0.9,−0.9, d = −2.5/6 = −0.41667,sD =

√1.32567 = 1.15138, sD/

√n = 0.47005).

(B) n = (2zsd/A)2

= 7.891052 = 62.26864 ' 63 (calcoli: 1 − α = 0.9, α = 0.1, z = 1.645, sd = 1.15138,A = 0.48).

132

Page 133: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

67 Compito del 16.02.2006

67.1 Testo

Esercizio 1Il Belushi’s bar famoso a Londra per i suoi aperitivi. La probabilit di trovare tutti i tavoli occupatialle happy hours 0.81 . Inoltre, noto che il numero di tavoli liberati dai clienti in tale fascia oraria sidistribuisce secondo una Poisson con varianza pari a 7.4 in un intervallo temporale di 20 minuti.(a) Qual la probabilit che recandosi per un aperitivo al Belushi’s bar ci si sieda ad un tavolo entro unminuto dall’ingresso nel bar (nessun altro in attesa di un tavolo)?(b) Sapendo che un vostro amico non ha aspettato neanche un minuto per ottenere un tavolo, qual laprobabilit che il locale fosse pieno?

Esercizio 2Si vuole misurare la spesa per tavolo dei visitatori del Belushi’s bar. I dati riportati nella seguentetabella riguardano il conto per tavolo in un campione di 4 tavoli da due persone occupati da amici ed inun campione di 4 tavoli occupati da coppie di fidanzati.

Fidanzati 18.00 16.00 21.00 19.00Amici 7.00 15.00 14.00 10.00

(a) Si indichi se il valore 18.00 : (i) un parametro, (ii) una modalit, (iii) una frequenza assoluta, (iv)una frequenza percentuale.(b) Si calcoli il primo quartile della spesa per tavolo, indipendentemente dal tipo di occupanti.

Esercizio 3Si considerino i dati riportati all’esercizio precedente.(a) Si calcoli l’intervallo di confidenza (1−α = 0.95) della varianza del conto per tavolo nei tavoli occupatida amici. Si specifichino le assunzioni necessarie.(b) Si verifichi se nei tavoli occupati da amici la spesa per tavolo sia mediamente inferiore a quella dellecoppie. Si specifichino le assunzioni necessarie.(α = 0.05)

Esercizio 4Si consideri la seguente tabella (incompleta).

X (−∞, 0) [0, 1) [1, 2) [2, 3) [3,+∞)F (x) 0.04 0.27 0.71

(a) Si completi la tabella in modo che siano soddisfatte le condizioni affinch F (x) possa essere la funzionedi ripartizione di una variabile discreta X. Se ne derivi la funzione di massa di probabilit.(b) In base a quanto ottenuto al punto (a), calcolare il valore atteso e la varianza della variabile X.

67.2 Soluzioni

Esercizio 1(a) Sia A l’evento tutti i tavoli sono occupati e A l’evento complementare. P (A) = 0.81, mentre P (A) =1− P (A) = 0.19X =numero di tavoli liberati in un intervallo temporale IX ∼ Poi(λ) con λ20 = 7.4 se I= 20 minuti. Per I=1 minuto, λ1 = 0.37(a) Se il locale non pieno, la probabilit di non aspettare pari a 1. Se il locale pieno, la probabilit di nonaspettare corrisponde alla probabilit che in un intervallo di 1 minuto si liberi almeno un tavolo ovvero

P (X ≥ 1) = 1− P (X1min = 0) = 1− (e−λ1 λ01

0! ) = 0.3093Si indichi con B l’evento non aspettare per avere un tavolo.Allora, P (B) = 1 · P (A) + P (A) · P (X ≥ 1) = 0.4405

(b) P (A | B) = P (A∩B)P (B) = P (A)·P (X≥1)

P (B) = 0.5687

133

Page 134: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Esercizio 2(a) Una modalit.(b) N = 8. N · 1

4 = 2.0 . Si cercano le unit 2a e 3a nella distribuzione ordinata.La modalit relativa alla seconda unit : 10 quella relativa alla terza : 14 . Il primo quartile la media tra idue: 12

Esercizio 3(a) Si assume che la variabile X = conto per tavolo si distribuisca secondo una N(µ, σ2).Intervallo di confidenza per la varianza con media ignotax = 11.5, σ2 = 13.6667 gdl= 3 , χ2

α/2 = 0.2158 χ21−α/2 = 9.3484

Intervallo: [4.3858 ; 189.9953].(b) Si assume che la variabile X1 = conto per tavolo di fidanzati si distribuisca secondo una N(µ1, σ

2) eche X2 = conto per tavolo di fidanzati si distribuisca secondo una N(µ2, σ

2).Test confronto tra medie con campioni indipendenti.H0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0α = 0.05 x1 = 18.5, x2 = 11.5, s2

1 = 4.3333, s22 = 13.6667

toss = 3.2998, tcrit = 1.9432 gdl = 6 Rifiuto H0

Esercizio 4(a) La tabella completa la seguente:

X (−∞, 0) [0, 1) [1, 2) [2, 3) [3,+∞)F (x) 0 0.04 0.27 0.71 1

La funzione di massa di probabilit :

X 0 1 2 3 otherwisef(x) 0.04 0.23 0.44 0.29 0

(b)E[X] = 1.98 , V ar[X] = 0.6796

134

Page 135: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

68 Compito del 16.03.2006

68.1 Testo

Esercizio 1. AT e un’azienda che effettua servizio di trasporto urbano in una grande citta. Durante lastagione invernale gli autisti AT hanno ricevuto un timer per registrare i tempi effettivi di percorrenzasu certe tratte e in certe fasce orarie dei giorni feriali. Dall’elaborazione del campione raccolto e stataricavata la seguente tabella: la parte sinistra riguarda distribuzioni di frequenza, la parte destra alcunestatistiche. Si evidenzia che ciascun tempo di percorrenza misurato dagli autisti e stato espresso (per mo-tivi di confrontabilita) come ’scostamento percentuale rispetto al tempo di percorrenza fissato dall’orarioufficiale’. La tabella si riferisce a tale variabile, da ora in poi indicata con X.

X = Scostamento % rispetto all’orario ufficialetabella di frequenza (modalita in classi) statistiche

Meteo [−10, 0) [0, 10) [10, 25) [25, 50) [50, 100) [100, 200) media√

var. correttapioggia 16 25 43 26 11 20 59.3 131

no pioggia 60 186 122 111 72 38 31.4 47.6totale 76 211 165 137 83 58

(A) Dai dati della tabella e possibile ricavare l’esatta media campionaria della variabile X nell’interocampione a disposizione? Se sı effettuare il calcolo, altrimenti spiegare perche non e possibile.(B) Ricavare quanti viaggi, in percentuale, hanno una durata che si discosta di oltre il 30% da quantoprefissato dall’orario ufficiale (qualora risulti necessario suddividere una classe, assumere distribuzioneuniforme delle frequenze all’interno della stessa).

Esercizio 2. A partire dalla tabella di frequenza relativa alla variabile X si costruisca una nuovavariabile casuale Y nel modo seguente: 1) si assegni a ciascuna delle classi, in ordine crescente, un numeroprogressivo intero a partire da 0; 2) si ricavi la distribuzione di probabilita corrispondente definendo laprobabilita come frequenza relativa nel campione.

(A) Rappresentare graficamente la funzione di massa di probabilita della variabile casuale Y |pioggia.(B) Calcolare media e deviazione standard della variabile casuale Y |pioggia.

Esercizio 3.

(A) I dati del campione fanno pensare che i tempi medi di percorrenza (espressi come scostamentopercentuale) quando piove e quando non piove siano diversi. Indicando con θ la differenza fra i tempimedi di percorrenza nei giorni di pioggia rispetto a quelli in cui non piove, proporre uno stimatore puntualedi θ e se ne indichi la distribuzione campionaria (almeno approssimata). Sulla base di questo fornire unastima puntuale di θ e una stima della deviazione standard dello stimatore proposto.(B) E possibile concludere che, mediamente, la pioggia provoca un aumento dei tempi di percorrenza(espressi come scostamento percentuale)? Impostare il problema come test delle ipotesi e risolverloutilizzando il p–value.

Esercizio 4.

(A) Costruire l’intervallo di confidenza (1− α = 0.99) per la deviazione standard della variabile casualeX in caso di pioggia (si assuma X distribuita in modo normale).(B) AT ha in programma di ripetere fra 2 anni una rilevazione analoga. Facendo uso delle informazionia disposizione, da quante osservazioni dovrebbe essere composto il campione in presenza di pioggia peravere un intervallo di confidenza per la media con margine di errore pari a ±9 al livello di confidenza1− α = 0.9?

68.2 Soluzioni

Esercizio 1

135

Page 136: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) E possibile applicando la proprieta associativa della media aritmetica: x = (x1n1 +x2n2)/(n1 +n2) =(59.3 ∗ 141 + 31.4 ∗ 589)/(141 + 589) = 26855.9/730 = 36.79.

(B) I viaggi che si discostano per meno del 30% sono pari alla frequenza cumulata fino a 30, data dallasomma di due componenti: 1) la frequenza cumulata fino a 25; 2) la frequenza da 25 a 30 (da calcolaresfruttando l’ipotesi di distribuzione uniforme all’interno della classe). Quindi 452 + 27.4 = 479.4, che inpercentuale corrisponde a 479.4/730 = 65.67%. I viaggi che si discostano per piu del 30% sono allora il34.33%.

Esercizio 2

(A, B) Funzione di massa (da disegnare) della variabile Y |pioggia e prospetto di calcolo di media evarianza della stessa (nota: per brevita si omette il condizionamento |pioggia):

y 0 1 2 3 4 5 totalef(y) 0.1135 0.1773 0.305 0.1844 0.078 0.1418 1

yf(y) 0 0.1773 0.6099 0.5532 0.3121 0.7092 2.361702y2f(y) 0 0.1773 1.2199 1.6596 1.2482 3.5461 7.851064

da cui consegue che E(Y ) = 2.361702, V (Y ) = E(Y 2) − E(Y )2 = 7.851064 − 2.3617022 = 2.273427,σ(Y ) =

√V (Y ) = 1.507789

Esercizio 3. Simbologia e assunzioni: X1 = ’tempo percorrenza (come scostamento % rispetto all’orarioufficiale) con pioggia’ ∼ [µ1, σ

21 ]; X2 = ’tempo percorrenza (come scostamento % rispetto all’orario

ufficiale) senza pioggia’ ∼ [µ2, σ22 ].

(A) Il parametro d’interesse e θ = µ1−µ2. Stimatore proposto e X1−X2, la cui distribuzione campionaria

(approssimata in base alla ’elevata’ dimensione del campione) e espressa daX1 −X2 − (µ1 − µ2)√

S21/n1 + S2

2/n2

N(0, 1). La corrispondente stima puntuale di µ1−µ2 e allora x1− x2 = 59.3− 31.4 = 27.9; la deviazionestandard dello stimatore proposto puo essere stimata con

√s2

1/n1 + s22/n2 =

√1312/141 + 47.62/589 =√

125.556 = 11.205.

(B) Test per H0 : µ1−µ2 = 0 contro H1 : µ1−µ2 > 0. La variabile test eX1 −X2 − (µ1 − µ2)√

S21/n1 + S2

2/n2

che sotto

H0 ha una distribuzione, approssimativamente, N(0, 1). Allora: valore campionario della statistica test

e zcamp =x1 − x2√

s21/n1 + s2

2/n2

= 2.49, per cui p− value = P (Z > zcamp|H0) = P (Z > 2.49|H0) = 0.00639.

Esercizio 4. Assunzioni: X ∼ N(µ, σ2).

(A) Il pivot per σ2 e (n − 1)S2/σ2, la cui distribuzione e χ2(n − 1). L’intervallo di confidenza perσ2 e quindi [(n − 1)s2/c2, (n − 1)s2/c1] = [12858.34, 23869.1], da cui si ottiene che quello per σ e[√

12858.34,√

23869.1] = [113.3946, 154.4963] (calcoli: α = 0.01, c1 = 100.6548, c2 = 186.8468, s = 131,s2 = 17161, n = 141).

(B) In base all’intervallo di confidenza per µ si ottiene n = (2zs/A)2

= 23.94182 = 573.2078 ' 574(calcoli: α = 0.1, z = 1.645, s = 131, A = 2 ∗ 9 = 18).

136

Page 137: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

69 Compito del 31.05.2006

69.1 Testo

Premessa: Da mesi si sono diffuse voci di irregolarita nell’amministrazione della PinOIL company, tantoche l’assemblea degli azionisti ha deciso di sostituire il vertice del management. Prima di iniziare il propriolavoro, il nuovo management ha pero deciso di fare esaminare i conti della PinOIL al fine conoscere la realesituazione dell’impresa. L’analisi della contabilita e stata commissionata alla AAC, una multinazionaleche si occupa di revisione dei conti e che fino ad ora non aveva mai avuto rapporti di affari con PinOIL.

Esercizio 1. Nell’impossibilita di vagliare tutte le scritture contabili, AAC ha proceduto con controllia campione. Nel caso specifico, AAC ha esaminato un campione di 631 operazioni, dalle quali e emersoche il 9.23% sono irregolari. Sapendo che, nella prassi dei controlli contabili, viene considerato fisiologicoun tasso di irregolarita del 7%, rispondere alle seguenti domande.

(A) Le scritture della PinOIL presentano un tasso di irregolarita superiore a quello considerato fisiologico?Rispondere impostando il problema come test delle ipotesi e risolverlo utilizzando il p–value.(B) Calcolare la potenza del test per un livello di significativita del 1% ed una l’ipotesi alternativa ’leoperazioni irregolari sono il 11%’.

Esercizio 2. Sono state poi analizzate solo scritture ritenute irregolari. L’obiettivo era saggiare, medianteun modello di regressione, se la percentuale irregolare, calcolata rispetto al valore dichiarato, e legata aquest’ultimo. Si indichi con A l’ammontare dichiarato (in milioni di Euro) e con P la percentuale, rispettoad A, identificata come irregolare. Sono state calcolate le seguenti statistiche campionarie: n = 102,

1

n

n∑i=1

pi = 12.521,1

n

n∑i=1

ai = 1.01,1

n

n∑i=1

(pi−p)2 = 1.695,1

n

n∑i=1

(ai−a)2 = 0.538,1

n

n∑i=1

(ai−a)(pi−p) =

0.168.

(A) Il modello evidenzia un legame di P con A? (α = 0.01).(B) Costruire un intervallo di confidenza per la deviazione standard della componente residua del modello(1− α = 0.99).

Esercizio 3. La squadra AAC che ha revisionato i conti e stata divisa in due team: uno per la parteoperativa, l’altro per la parte finanziaria della contabilita PinOIL. In termini relativi, e stato valutatoche il 73.8% delle operazioni PinOIL riguardano la gestione operativa mentre le rimanenti hanno naturafinanziaria. Alla fine del controllo ciascuno dei due team ha prodotto un prospetto nel quale ha rias-sunto le principali statistiche risultanti dalla propria attivita di ispezione. La variabile misurata e P =percentuale irregolare rispetto all’ammontare dichiarato.

Prospetto del team ’gestione operativa’.valori di P [0, 10] (10, 20] (20, 30] [30, 50) > 50 media = 23.49

frequenze relative 0.197 0.248 0.277 0.228 0.05√

var. corretta = 14.79

Prospetto del team ’gestione finanziaria’.valori di P [0, 10] (10, 20] (20, 30] [30, 50) > 50 media = 14.91

frequenze relative 0.407 0.346 0.148 0.099 0√

var. corretta = 10.85

(A) Calcolare lo scarto interquartile della variabile P nell’ambito della gestione operativa.(B) Dai dati a disposizione, e possibile ricostruire un’unica tabella delle frequenze relative congiunte perle variabili P e tipologia della gestione (nelle due modalita operativa e finanziaria)? Se sı effettuarel’operazione altrimenti spiegare il perche.

Esercizio 4. Nella situazione di cui all’esercizio precedente, si assuma che i due campioni siano costituiti,rispettivamente, da 101 operazioni di carattere ’operativo’ e 81 operazioni di carattere ’finanziario’ e chela variabile P abbia distribuzione Normale (quest’ultima non e completamente giustificata).

(A) Sottoporre a test l’ipotesi nulla che le deviazioni standard della variabile P fra le due gestioni sianouguali (α = 0.1).

137

Page 138: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Sfruttando le informazioni a disposizione, si dica quanto dovrebbe essere grande il campione dioperazioni esaminate nella gestione operativa per ricavare un intervallo di confidenza per la media di Pdi ampiezza 3 al livello di confidenza 0.98.

69.2 Soluzioni

Esercizio 1

Assunzioni: X =’Una scrittura contabile e irregolare’∼ Be(p).

(A) Test di H0 : p = 0.07 contro H1 : p > 0.07. La v.c. test e (X − p0)/√p0q0/n, che sotto H0 ha

distribuzione, approssimativamente, N(0, 1). p − value = P ((X − p0)/√p0q0/n > zcamp|H0) = P (Z >

2.1955) = 0.01406. Calcoli utili:√p0q0/n =

√0.00010317 = 0.01016, zcamp = (x − p0)/

√p0q0/n =

(0.0923− 0.07)/0.01016 = 2.1955. Per brevita si e posto 0.07 = p0.

(B) Calcolo potenza per H0 : p = 0.07 contro H1 : p = 0.11 e α = 0.01. La variabile test e descritta sopra.0.01 = P (X ∈ R|H0) = P ((X − p0)/

√p0q0/n > zcritico|H0) = P (Z > zcritico) implica che la regione

critica per la variabile standardizzata e (zcritico,∞) = (2.3263,∞). Potenza = P ((X − p0)/√p0q0/n >

zcritico|H1) = P (X > p0 +√p0q0/nzcritico|H1) = P ((X − p1)/

√p1q1/n > (p0 +

√p0q0/nzcritico −

p1)/√p1q1/n|H1) = P (Z > −1.3138) = 0.90554. Calcoli utili:

√p1q1/n =

√0.00016 = 0.01246. Per

brevita si e posto 0.11 = p1

Esercizio 2

Assunzioni: Modello di regressione lineare semplice pi = β0 + β1ai + ui, dove ui ∼ N(0, σ2).

(A) Test di H0 : β1 = 0 contro H1 : β1 6= 0 (α = 0.01). La v.c. test e (β1 − 0)/√σ2/dev(x), che

sotto H0 ha una distribuzione T (n − 2). 0.01 = P (campione ∈ R|H0) implica 0.99 = P (campione ∈A|H0) = P (−t ≤ (β1 − 0)/

√σ2/dev(x) ≤ t|H0) = P (−t ≤ T ≤ t|H0). La regione di accettazione

per la variabile standardizzata e [−t, t] = [−2.6259, 2.6259]. Il valore campionario della statistica test

e (β1 − 0)/√σ2/dev(a) = 1.78715. Calcoli utili: n = 102, dev(a) = n ∗ 0.538 = 54.876, dev(p) =

n ∗ 1.695 = 172.89, codev(a, p) = n ∗ 0.168 = 17.136, β1 = codev(p, a)/dev(a) = 0.312268, σ2 = (dev(p)−β2

1dev(a)/(n− 2) = 1.67539,√σ2/dev(a) =

√0.03053 = 0.17473.

(B) Il pivot per σ2 e (n − 2)σ2/σ2, con distribuzione χ2(n − 2). L’intervallo al (1 − α) = 0.99 per σ2

e [(n − 2)σ2/c2, (n − 2)σ2/c1] = [1.1953, 2.4884], per σ e [√

1.1953,√

2.4884] = [1.0933, 1.5775]. Calcoliutili: c1 = 67.3276, c2 = 140.1695.

Esercizio 3.

(A) Q1 sta nella classe 10,20, per cui Q1 = 10 + (0.25 − 0.197)/0.0248 = 12.1371. Q3 sta nella classe30, 50, per cui Q3 = 30 + (0.75− 0.722)/0.0114 = 32.4561. Scarto interquartile = Q3 −Q1 = 20.319.(B) Le frequenze riportate nei due prospetti sono frequenze relative condizionate. Moltiplicandole per lecorrispondenti frequenze relative marginali (rispettivamente 0.738 per la gestione operativa e 0.262 perla finanziaria) si ottengono quelle congiunte:

valori di PTipo gestione [0, 10] (10, 20] (20, 30] [30, 50) > 50

operativa 0.1454 0.183 0.2044 0.1683 0.0369finanziaria 0.1066 0.0907 0.0388 0.0259 0

Esercizio 4. Assunzioni: X1 ∼ N(µ1, σ21), X2 ∼ N(µ2, σ

22), dove X1, X2 indipendenti; 1 = ’operativa’,

2 = ’finanziaria’; si e posto X invece di P .

(A) Test di H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1 (α = 0.1). La v.c. test e S2

1/S22 , che sotto H0 ha

una distribuzione F (n1 − 1, n2 − 1). 0.9 = P (campione ∈ R|H0) implica 0.9 = P (campione ∈ A|H0) =P (−c1 ≤ S2

1/S22 ≤ c2|H0) = P (c1 ≤ F ≤ c2|H0). La regione di accettazione e [c1, c2] = [0.7069, 1.4259].

Il valore campionario della statistica test e s21/s

22 = 218.7441/117.7225 = 1.8581. Calcoli utili: n1 = 101,

n2 = 81.

138

Page 139: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) In base all’intervallo di confidenza per µ si ottiene n = (2zs/A)2

= 22.93782 = 526.1422 ' 527(calcoli: α = 0.02, z = 2.326, s = 14.79, A = 3).

139

Page 140: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

70 Compito del 21.06.2006

70.1 Testo

Premessa: AzTraMe spa e una societa che effettua raccolta di rifiuti urbani. In collaborazione con alcunitecnici, uno dei comuni serviti da AzTraMe sta cercando di pianificare in modo piu sistematico l’attivitasvolta.

Esercizio 1. All’interno del comune, AzTraMe vuole allocare sul territorio 12 piazzole identiche per laraccolta dei rifiuti. I tecnici ritengono che in ogni piazzola verra portata, ogni giorno, una media di 432kg di rifiuti con una deviazione standard pari a 43 kg.Assumendo che la quantita di rifiuti raccolta ogni giorno in ciascuna piazzola si distribuisca Normalmentee che le quantita raccolte in piazzole diverse siano indipendenti, sfruttare le congetture dei tecnici perrispondere alle seguenti domande.

(A) Dopo aver indicato come si distribuisce la quantita totale di rifiuti depositati ogni giorno nell’insiemedelle 12 piazzole, ivi compreso il valore dei parametri, si calcoli la probabilita che, in una data giornata,vengano superati i 5400 kg di rifiuti totali.(B) Se, invece di essere indipendenti, le quantita raccolte fossero positivamente correlate (cioe tutte concovarianza maggiore di 0) la probabilita di cui al punto precedente subirebbe variazioni? Argomentare larisposta senza effettuare calcoli.

Esercizio 2. Dopo aver raggiunto nell’anno passato gli obiettivi del decreto Ronchi, il comune in questio-ne ha pianificato per l’anno in corso di incrementare ulteriormente la percentuale di raccolta differenziata(RD) in rapporto al totale dei rifiuti solidi urbani (RSU). A questo fine sta monitorando l’andamentodelle raccolte: quelle effettuate nei primi tre mesi dell’anno hanno consentito di predisporre la seguentetabella.

RD/RSU% (classi) [20, 30] (30, 35] (35, 40] (40, 45] (45, 50] (50, 60]frequenza 1 12 28 14 5 1

(A) Rappresentare graficamente la distribuzione della percentuale di RD, tenendo presente che l’ottica equella di un confronto con l’andamento grafico delle distribuzioni delle variabili casuali a voi note.(B) Determinare lo scarto interquartile della percentuale di RD.

Esercizio 3. L’obiettivo del comune per l’anno in corso e quello di portare la percentuale di RD oltre il36% in rapporto al totale dei RSU. Nelle raccolte effettuate nei primi tre mesi dell’anno, la percentualemedia di RD e stata pari a 38.2, con una deviazione standard (corretta) pari a 4.83. Assumendo chela percentuale di RD sui RSU si distribuisca in modo normale, si utilizzino i dati relativi alle raccolteeffettuate (considerati come un casuale semplice) per rispondere alle seguenti domande.

(A) Calcolare l’intervallo al livello di confidenza 1−α = 0.98 per la deviazione standard della percentualedi RD.(B) In base all’informazione del campione, gli obiettivi di raccolta differenziata verranno raggiunti? Sirisponda alla domanda formulando il problema in termini di test delle ipotesi (α = 0.1).

Esercizio 4. Nella situazione di cui all’esercizio precedente, punto (B), si assuma ora che: α sia fissatoallo stesso valore; l’ipotesi nulla sia la stessa; l’ipotesi alternativa sia ’la percentuale media di raccoltadifferenziata e pari a 37’; la deviazione standard campionaria della percentuale di RD raccolta coincidacon quella vera.

(A) Se fosse vera l’ipotesi nulla, quale sarebbe la probabilita di prendere la decisione errata? Rispondereargomentando.(B) Se invece fosse vera l’ipotesi alternativa, quale sarebbe la probabilita di prendere la decisione errata?Rispondere argomentando.

140

Page 141: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

71 Soluzioni

Esercizio 1 Assunzioni: Xi = ’quantita rifiuti al giorno nella piazzola i’∼ N(µ = 432, σ2 = 432) peri = 1, . . . , 12.

(A) T = ’Totale rifiuti al giorno nelle 12 piazzole’ =

12∑i=1

Xi ∼ N(µT = 12µ, σ2T = 12σ2), dove µT =

12µ = 12∗432 = 5184, σ2T = 12σ2 = 12∗432 = 22188. P (T > 5400) = P (Z > (5400−µT )/σT ) = P (Z >

1.45) = 0.07352. Calcoli utili: σT = 148.9564.

(B) Chiamiamo T ∗ la somma delle Xi in presenza di correlazioni positive fra le Xi. Sfruttando le proprieta

dei momenti, e possibile verificare che µT∗ = µT , mentre σ2T∗ > σ2

T . Infatti µT∗ = E(T ∗) =∑i

E(Xi) =

µT mentre σT∗ = V (T ∗) =∑i

V (Xi) + 2∑∑i<j

Cov(Xi, Xj) >∑i

V (Xi) = σ2T , dato che le covarianze

sono per assunzione tutte positive. Questo implica che, rispetto al punto precedente, la probabilitaaumenta. Infatti P (T ∗ > 5400) = P (Z > (5400− µT∗)/σT∗) > P (Z > (5400− µT )/σT ) = P (T > 5400),dato che (5400− µT∗)/σT∗ < (5400− µT )/σT .

Esercizio 2

(A) Istogramma delle frequenze relative (le frequenze cumulate servono per il punto (B)):

RD/RSU% (classi) [20, 30] (30, 35] (35, 40] [40, 45) [45, 50) [50, 60]Densit relative 0.0016 0.0393 0.0918 0.0459 0.0164 0.0016

Frequenze cumulate 1 13 41 55 60 61

(B) Q1 sta nella classe 35,40, per cui Q1 = 35 + (15.25 − 13)/5.6 = 35.4018. Q3 sta nella classe 40, 45,per cui Q3 = 40 + (45.75− 41)/2.8 = 41.6964. Scarto interquartile = Q3 −Q1 = 6.2946.

Esercizio 3 Assunzioni: X = ’RD/RSU in percentuale’ ∼ N(µ, σ2).

(A) Il pivot per σ2 e (n − 1)S2/σ2, con distribuzione χ2(n − 1). L’intervallo al (1 − α) = 0.98 per σ2 e[(n− 1)s2/c2, (n− 1)s2/c1] = [15.8378, 37.3413], per σ e [

√15.8378,

√37.3413] = [3.9797, 6.1108]. Calcoli

utili: c1 = 37.4849, c2 = 88.3794.

(B) Test di H0 : µ = 36 contro H1 : µ > 36 (α = 0.1). La variabile test e (X − 36)/(S/√n), che sotto H0

ha una distribuzione T (n−1). 0.1 = P (campione ∈ R|H0) implica che la regione di rifiuto e (1.2958,∞).Il valore campionario della statistica test e (x−36)/(s/

√n) = 3.5575. Calcoli utili: n = 61,

√n = 7.8102,

s = 4.83, s/√n = 0.6184.

Esercizio 4 Assunzioni: X = ’RD/RSU in percentuale’ ∼ N(µ, σ2 = 23.329). Test di H0 : µ = 36 controH1 : µ = 37. Per brevita indichiamo 36 = µ0 e 37 = µ1. La variabile test e (X − µ0)/(σ/

√n), che sotto

H0 ha una distribuzione N(0, 1).

(A) L’evento ’decisione errata|ipotesi nulla vera’, ovvero ’campione ∈ R|H0’, e per definizione l’errore diprimo tipo. La sua probabilita α e il livello di signicativita, fissato nell’esercizio a 0.1.

(B) L’evento ’decisione errata|ipotesi alternativa vera’, ovvero ’campione ∈ A|H1’, e per definizionel’errore di secondo tipo. La sua probabilita β, e da calcolare in base ai dati.Prima occorre determinare R. 0.1 = P (campione ∈ R|H0) implica che la regione di rifiuto per la variabilestandardizzata e (zcritico = 1.282,∞), mentre quella di accettazione e (−∞, zcritico = 1.282].β = P (’campione ∈ A|H1) = P ((X − µ0)/(σ/

√n) ≤ zcritico|H1) = P (X ≤ µ0 + σ/

√nzcritico|H1) =

P ((X−µ1)/(σ/√n) ≤ (µ0 +σ/

√nzcritico−µ1)/(σ/

√n)|H1) = P (Z ≤ zcritico+(µ0−µ1)/(σ/

√n)|H1) =

P (Z ≤ −0.335) = 0.36863. Calcoli utili: σ/√n = 0.6184, (µ0 − µ1)/(σ/

√n) = −1.617.

141

Page 142: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

72 Compito del 12.09.2006

72.1 Testo

Premessa: Gourmet spa gestisce una catena di ristoranti di fascia medio–alta. Il management dellasocieta ha commissionato una serie di rilevazioni per guidare le proprie strategie.

Esercizio 1. Da tempo la scelta della lista vini e centralizzata a livello di catena, con l’obiettivo dicontenere i costi. Ai clienti consumatori di vino e stato chiesto: ’Nel complesso, come giudica la nostralista vini?’. Le risposte sono state elaborate nella seguente tabella.

Giudizio insufficiente sufficiente medio buono ottimoFrequenza 18 52 71 59 40

(A) Quali indici di posizione (di tipicita) ha senso costruire per la variabile ’Giudizio’? Argomentare larisposta e calcolare tali indici.(B) Ha senso calcolare il terzo quartile della variabile ’Giudizio’? Se sı effettuare il calcolo, altrimentispiegare il perche.

Esercizio 2. In base ai dati dell’esercizio precedente, costruire la variabile casuale X che associa allemodalita del ’Giudizio’, nell’ordine indicato, i numeri interi da −2 a +2 inclusi. Si derivino le relativeprobabilita in base alle frequenze relative ricavabili dalla tabella. Trattando la X come una pura esemplice variabile casuale:

(A) Disegnare la funzione di ripartizione di X.(B) Calcolare media e deviazione standard di X.

Esercizio 3. Per seguire meglio le esigenze della clientela, il management ha deciso di decentrare lascelta della lista vini ai singoli esercizi. Una rilevazione analoga a quella di cui all’esercizio 1 e stataripetuta dopo tale provvedimento. Per valutare la decisione, i giudizi espressi dai singoli clienti sono statiopportunamente sintetizzati, ricavando un ’voto’ (su una scala continua da 0 a 10) alla lista vini di ciascunristorante. I voti ottenuti dai 5 esercizi del campione prima e dopo il provvedimento di decentramentosono riportati in tabella. Si assuma che la variabile voto si distribuisca normalmente.

Ristorante Abete Bra Cantoni Duecento Ercolevoto ante–decentramento 6.7 4.4 3.4 4.9 7.2voto post–decentramento 7.3 3.7 1.4 3.6 5.7

(A) Il provvedimento di decentramento ha modificato il voto medio? Rispondere formulando il problemain termini di test delle ipotesi (α = 0.01).(B) Fornire una stima per intervallo della deviazione standard del voto dopo il decentramento (1− α =0.99).

Esercizio 4. Lo studente si concentri ora sul campione rilevato in seguito all’operazione di decentra-mento e assuma che la deviazione standard ’vera’ sia esattamente quella stimata dal campione. Primadella rilevazione corrispondente, un manager ha espresso la seguente opinione: ’Il voto medio dopo ildecentramento sara inferiore a 5’.

(A) Il campione da ragione al manager? Rispondere formulando il problema in termini di test delle ipotesi(α = 0.1).(B) Si calcoli la potenza del test dell’ipotesi di cui al punto (A) in corrispondenza dell’alternativa ’il votomedio dopo il decentramento e 4.3’.

72.2 Soluzioni

Esercizio 1 Il ’Giudizio’ e una variabile qualitativa ordinabile. Questa considerazione e la base perrisolvere (A) e (B).

142

Page 143: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Come indici di posizione (tipicita) hanno senso sia la moda (che non sfrutta la possibilita di ordinarele osservazioni) che la mediana (la quale invece sfrutta la possibilita di ordinare le osservazioni): Moda= medio, Mediana = medio.

(A) Ha senso calcolare il terzo quartile perche: al pari della mediana, la statistica in oggetto richiede chela variabile sia almeno ordinabile: Terzo quartile = buono.

Esercizio 2

(A) Costruzione della funzione di ripartizione (solo valori corrispondenti ai ’salti’ del grafico) piu prospettodi calcolo dei momenti E(X) e σ(X):

x −2 −1 0 1 2f(x) 0.075 0.217 0.296 0.246 0.167 1

F (x) 0.075 0.292 0.588 0.833 1

xf(x) −0.15 −0.217 0 0.246 0.333 0.212x2f(x) 0.3 0.217 0 0.246 0.667 1.429

(B) Dalle ultime due righe del prospetto di calcolo precedente si ricava: E(X) = 0.212, V (X) = E(X2)−E(X)2 = 1.429− 0.2122 = 1.384, σ(X) = 1.1764.

Esercizio 3

(A) Test sulla differenza fra medie per dati appaiati. Poniamo X1 = ’voto ante-decentramento’, X2 =’voto post-decentramento’. Si assume D = X2 − X1 ∼ N(µD, σ

2D). Test di H0 : µD = 0 contro

H1 : µD 6= 0 (α = 0.01). La variabile test e (D − 0)/(SD/√n), che sotto H0 ha una distribuzione

T (n − 1). 0.99 = P (campione ∈ A|H0) implica che la regione di accettazione e (−4.6041, 4.6041). Ilvalore campionario della statistica test e (d − 0)/(sD/

√n) = −2.1946. Calcoli e valori utili: n = 5,√

n = 2.2361, sD = 0.9985, sD/√n = 0.4465, d = −0.98, tabella delle differenze di:

di = x2i − x1i 0.6 −0.7 −2 −1.3 −1.5

(B) Assunzioni: X = ’voto post-decentramento’ ∼ N(µ, σ2). Il pivot per σ2 e (n − 1)S2/σ2, con distri-buzione χ2(n− 1). L’intervallo al (1−α) = 0.99 per σ2 e [(n− 1)s2/c2, (n− 1)s2/c1] = [1.3601, 97.6477],per σ e [

√1.3601,

√97.6477] = [1.1662, 9.8817]. Calcoli e valori utili: c1 = 0.207, c2 = 14.8603.

Esercizio 4 Assunzioni: X = ’voto post-decentramento’ ∼ N(µ, σ = 2.248).

(A) Test di H0 : µ = 5 contro H1 : µ < 5. Per brevita indichiamo 5 = µ0. La variabile test e(X − µ0)/(σ/

√n), che sotto H0 ha una distribuzione N(0, 1). 0.1 = P (campione ∈ R|H0) implica che la

regione di rifiuto e (−∞,−1.282). Il valore campionario della statistica test e (x−µ0)/(σ/√n) = −0.6565.

Calcoli e valori utili: n = 1.0053,√n = 5, σ/

√n = 2.236, x = 4.34.

(B) Per brevita indichiamo 4.3 = µ1. γ = P (campione ∈ R|H1) = P ((X − µ0)/(σ/√n) < zcritico|H1) =

P (X < µ0 + σ/√nzcritico|H1) = P ((X − µ1)/(σ/

√n) < (µ0 + σ/

√nzcritico − µ1)/(σ/

√n)|H1) = P (Z <

zcritico + (µ0 − µ1)/(σ/√n)|H1) = P (Z < −0.585) = 0.2792. Calcoli e valori utili: (µ0 − µ1)/(σ/

√n) =

0.6963.

143

Page 144: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

73 Compito del 18.01.2007 (solo studenti PT)

73.1 Testo

Premessa: ENEIDE spa e una societa italiana che archivia dati contabili, a partire da documenti cartaceio da files pdf, trasferendoli su supporto informatico. Per la digitalizzazione dei dati, la societa disponedi un centro situato in Bulgaria, al quale si riferiscono gli esercizi seguentiEsercizio 1.Un controllo di qualita effettuato su un campione casuale semplice di 200 bilanci, ha mostrato che 6 diquesti presentavano errori di digitalizzazione.

(A) In base al campione, fornire una stima per intervallo (1 − α = 0.99) della probabilita di trovare unbilancio con errori di digitalizzazione.(B) Le condizioni e il risultato del punto precedente fanno sorgere dei dubbi circa la procedura impiegataper effettuare la stima per intervallo: in particolare, p appare piuttosto vicino al bordo dello spazioparametrico, per cui l’approssimazione normale della distribuzione binomiale, di norma utilizzata perrispondere all’esercizio precedente, non sembra completamente appropriata. Utilizzando le informazionidi cui sopra, quando dovrebbe essere grande il campione affinche la varianza (stimata) della variabilenumero di errori di digitalizzazione nel campione sia almeno pari a 10?

Esercizio 2.Si considerino i dati di cui all’esercizio precedente. Si assuma che la vera proporzione di bilanci digitalizzatiin modo errato sia esattamente quella ricavabile dal campione.

(A) Si calcoli la probabilita che, su 100 bilanci estratti a caso e con reimmissione, quelli errati siano 1 almassimo.(B) Il calcolo di cui al punto precedente poteva essere effettuato, seppure in modo approssimato, ricorrendoa qualche altra distribuzione? Effettuare i calcoli e verificare l’accuratezza dell’approssimazione o delleapprossimazioni utilizzate.

Esercizio 3.Gli obiettivi dei responsabili sono di stare sotto il 3% come percentuale di bilanci con errori di digita-lizzazione. Per verificare se l’obiettivo e‘ stato raggiunto, sono stati estratti casualmente altri bilanciportando la numerosita complessiva del campione a 1100. Di questi 45 sono risultati errati.

(A) In base al campione, e possibile stabilire se l’obiettivo e stato raggiunto? Rispondere utilizzando ilp-value.(B) Determinare la potenza del test in corrispondenza di H1 : p = 0.02 e α fissato a 0.01.

Esercizio 4.Gli informatici di ENEIDE hanno progettato alcune soluzioni per migliorare la digitalizzazione dei do-cumenti in formato pdf, al fine di ridurre gli errori. La nuova metodologia e stata comparata con quellausuale attraverso un test su due campioni casuali semplici indipendenti di documenti: la nuova ha fallito45 volte su 300; quella usuale, invece, ha sbagliato 56 volte su 310.

(A) Fornire una stima puntuale del miglioramento ottenuto con la nuova procedura rispetto a quellausuale. Dare anche una stima puntuale della deviazione standard dello stimatore utilizzato.(B) La nuova procedura e migliore della vecchia? Rispondere impostando il problema in termini di testdelle ipotesi.

73.2 Soluzioni

Esercizio 1. Assunzioni: X =’bilancio con errori?’∼ Be(p).

(A) Intervallo di confidenza per p al livello di confidenza del 0.99%: [p − z√pq/n, p + z

√pq/n =

[−0.0011, 0.0610]. Valori utili: p = 6/200 = 0.03, q = 0.97,√pq/n = 0.01206, n = 200, z = 2.576.

(In funzione dell’esercizio seguente, notare l’estremo di sx dell’intervallo fuori dallo spazio parametrico!)

144

Page 145: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Y =’numero bilanci con errori su n estratti’∼ Bi(n, p = 0.03) (si assume p uguale a quello campio-nario). Allora V (Y ) = npq. Per avere V (Y ) = npq > 10 basta prendere n > 10/(pq) = 343.64 e quindin = 344.

Esercizio 2.

(A) Y =’numero bilanci con errori su 100 estratti’∼ Bi(n = 100, p = 0.03) (si assume p uguale a quellocampionario). Si vuol calcolare P (Y ≤ 1) = P (Y = 0) + P (Y = 1) = 0.04755 + 0.1471 = 0.1946 (contieffettuati mediante la funzione di massa della binomiale).

(B) Le approssimazioni che vengono in mente per la Bi(n = 100, p = 0.03) sono Po(λ = 3) (dove λ = np)e N(µ = 3, σ2 = 2.91) (dove µ = np, σ2 = npq).Con la Poisson: P (Y ≤ 1) = P (Y = 0) + P (Y = 1) = 0.04979 + 0.1494 = 0.1991.Con la Normale (utilizzando l’approssimazione per la continuita): P (Y ≤ 1) ' P (Y ≤ 1.5) = 0.1896.Le approssimazioni tengono ai 2 decimali.

Esercizio 3. Assunzioni: X =’bilancio con errori?’∼ Be(p).

(A) Test di H0 : p = 0.03 contro H1 : p < 0.03. Indichiamo 0.03 = p0. Statistica test sotto H0:(p − p0)/

√p0q0/n|H0 ≈ N(0, 1). p − value = P ((p − p0)/

√p0q0/n < zcamp|H0) = P (Z < 2.1210) =

0.98304. Valori e calcoli utili: p = 45/1100 = 0.04091,√p0q0/n = 0.00514.

(B) Potenza del test per H0 : p = 0.03 contro H1 : p = 0.02 con α = 0.01. Statistica test sotto H0:(p − p0)/

√p0q0/n|H0 ≈ N(0, 1). zcrit = −2.3263, γ = P ((p − p0)/

√p0q0/n < zcrit|H1) = P (p <

p0 + zcrit ∗√p0q0/n = c = 0.01803|H1) = P ((p − p1)/

√p1q1/n < (c − p1)/

√p1q1/n|H1) = P (Z <

−0.4656|H1) = 0.32075.

Esercizio 4. X1 = ’errori metodologia usuale’ ∼ Be(p1), X2 =’errori metodologia alternativa’ ∼ Be(p2)Gli informatici di ENEIDE hanno progettato alcune soluzioni per migliorare la digitalizzazione dei do-cumenti in formato pdf, al fine di ridurre gli errori. La nuova metodologia e stata comparata con quellausuale attraverso un test su due campioni casuali semplici indipendenti di documenti: la nuova ha fallito45 volte su 300; quella usuale, invece, ha sbagliato 56 volte su 310.

(A) Miglioramento: p1 − p2 stimato con lo stimatore p1 − p2. La distribuzione dello stimatore e, ap-prossimativamente, N(p1 − p2, p1q1/n1 + p2q2/n2). Stima puntuale: p1 − p2 = 45/300 + 56/310 =0.15 − 0.1806 = −0.0306, stima della deviazione standard dello stimatore:

√p1q1/n1 + p2q2/n2 =√

0.00090246 = 0.030041.(B) Test di H0 : p1 − p2 = 0 contro H1 : p1 − p2 < 0. α = 0.05. Statistica test sotto H0: [(p1 − p2) −0]/√pq(1/n1 + 1/n2)|H0 ≈ N(0, 1) dove p = (45 + 56)/(300 + 310) = 0.1656 e la stima pooled di p.

zcrit = −1.645. Valore campionario statistica test sotto H0: zcamp = [(p1− p2)−0]/√pq(1/n1 + 1/n2) =

−1.018.

145

Page 146: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

74 Compito del 01.02.2007 (solo studenti PT)

74.1 Testo

Premessa: Una fondazione ha commissionato uno studio sul fumo di sigaretta. Nell’ambito dello studio,un campione di sigarette di marche diverse e stato sottoposto ad una serie di analisi chimiche. In basedati rilevati rispondere alle domande.

Esercizio 1. Per ciascuna sigaretta e stata misurata la quantita emessa di monossido di carbonio (CO)espressa in mg. Le misurazioni effettuate sono state sintetizzate nella seguente tabella.

13.6 16.6 23.5 5.4 15 12.3 16.3 15.4 14.4 10 10.2 18.517.5 15.9 8.5 13.9 10.2 9.0 13.0 9.5 12.6 10.6 14.9 4.9

(A) Calcolare mediana e scarto interquartile della quantita di CO emessa (esplicitare l’unita di misura).(B) Rappresentare graficamente la distribuzione di frequenza della CO emessa (si utilizzino 4 classi,scegliendone da soli gli estremi).

Esercizio 2. Il campione di sigarette esaminato e stato poi suddiviso in 2 gruppi: quelle con dicitura lighte le altre (normali). Le statistiche ricavate sulle misurazioni di CO nei due gruppi sono state sintetizzatenella seguente tabella.

Tipo sigaretta Numero osservazioni Media(CO) Varianza corretta(CO)1/2

normale 16 14.2 4.3light 8 10.6 3.0

(A) E possibile concludere che le sigarette light producono mediamente meno CO di quelle normali?(α = 0.01). Formulare le assunzioni necessarie per effettuare il test.(B) Il test effettuato al punto precedente si basa su una particolare assunzione riguardante le varianze.Sottoporre a verifica se questa assunzione tiene (α = 0.1).

Esercizio 3. Sono stati effettuati alcuni calcoli per simulare l’assunzione di CO di un fumatore. Nellasimulazione si e assunto che la CO emessa da ciascun tipo di sigaretta si distribuisce in modo normalecon momenti pari a quelli ricavabili dalla tabella precedente.

(A) Si consideri un fumatore di light che fuma 20 sigarette al giorno. Si calcoli la probabilita che talefumatore superi, in un giorno, i 200 mg di CO (soglia considerata a rischio dall’OMS).(B) Quante sigarette light occorrerebbe fumare in un giorno affinche la probabilita di superare la sogliaOMS sia il 5%? (Spiegare in dettaglio il procedimento e scrivere l’equazione risolutiva senza effettuare icalcoli)

Esercizio 4. La CO emessa da ciascuna sigaretta e stata messa in relazione con la quantita di ca-trame (in mg) presente nella stessa. Sono state ricavate le seguenti statistiche: numero osservazio-ni = 24; media(CO) = 13.00; Varianza distorta(CO)1/2 = 4.15; media(catrame) = 12.68; Varianzadistorta(catrame)1/2 = 5.16; Correlazione(CO, catrame) = 0.9575.

(A) Formulare un modello di regressione lineare che evidenzi se la quantita di CO emessa e legata allaquantita di catrame e stimarne i coefficienti. (Suggerimento: ricordare che lo stimatore dei minimi

quadrati di σ2 e ricavabile anche come [Devianza(y)− β21Devianza(x)]/(n− 2)).

(B) In base al modello, e possibile stabilire se la quantita di CO emessa e legata in modo significativoalla quantita di catrame? (α = 0.01).

74.2 Soluzioni

Esercizio 1. La chiave di tutto l’esercizio e ordinare le osservazioni (meglio se in ordine crescente).4.9 5.4 8.5 9 9.5 10 10.2 10.2 10.6 12.3 12.6 13

13.6 13.9 14.4 14.9 15 15.4 15.9 16.3 16.6 17.5 18.5 23.5

(A) posizione(Me) = 0.5(n+ 1) = 0.5(24 + 1) = 12.5; Me = (13 + 13.6)/2 = 13.3.

146

Page 147: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

posizione(Q1) = 0.25(n+ 1) = 0.25(24 + 1) = 6.25; Q1 = (10 + 10.2)/2 = 10.1posizione(Q3) = 0.75(n+ 1) = 0.75(24 + 1) = 18.75; Q3 = (15.4 + 15.9)/2 = 15.65

(B)Classi Frequenza Ampiezza Densita

[0,5] 1 5 0.2(5,10] 5 5 1

(10,15] 11 5 2.2(15,25] 7 10 0.7

Esercizio 2. Assunzioni: X1 =’mg CO di 1 sigaretta normale’ ∼ N(µ1, σ21), X2 =’mg CO di 1 sigaretta

light’ ∼ N(µ2, σ22).

(A) Test di H0 : µ1 − µ2 = 0 contro H1 : µ1 − µ2 > 0. Si assume inoltre che σ21 = σ2

2 . Statistica testX1−X2, che sotto H0 si distribuisce come [(X1−X2)−0]/[Sp

√1/n1 + 1/n2]|H0 ∼ T (n1 +n2−2), dove

S2p e la varianza pooled. Regione di rifiuto: [2.51, infty); valore campionario della statistica test sotto H0:

2.1137. Valori e calcoli utili: gl = n1 +n2− 2 = 22; s2p = s2

1(n1− 1) + s22(n2− 1)/(n1 +n2− 1) = 15.4704

sp = 3.933, sp√

1/n1 + 1/n2 = 1.703, s21 = 18.49, s2

2 = 9.

(B) Test di H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. Statistica test S2

1/S22 , che sotto H0 si distribuisce

come S21/S

22 |H0 ∼ F (n1 − 1, n2 − 1). Regione di accettazione: [0.3695, 3.5107]; valore campionario della

statistica test sotto H0: 2.0544.

Esercizio 3. Assunzioni: X =’mg CO di 1 sigaretta light’ ∼ N(µ = 10.6, σ = 3).

(A) Y =’mg CO di n sigarette light’=∑ni=1Xi, dove Xi =’mg CO dell’i-ma sigaretta light’ ∼ N(µ =

10.6, σ = 3). Per le proprieta dei valori attesi, V (Y ) =∑ni=1E(Xi) = n ∗ 10.6 V (Y ) =

∑ni=1 V (Xi) +∑∑

i6=j C(Xi, Xj) =∑ni=1 V (Xi) = n ∗ 32 = 9n. Nell’ultima formula le covarianze sono 0 perche la CO

prodotta da ciascuna sigaretta e indipendente dalle altre. Per le proprieta della Normale, Y ∼ N(µY =10.6n, σ2

Y = 9n). Per n = 20 sigarette si ha Y ∼ N(µY = 212, σ2Y = 180), per cui P (Y > 200) = P (Z >

−0.89) = 0.81445.(B) Si tratta di calcolare n tale che P (Y > 200) = 0.05. Allora 0.05 = P (Y > 200) = P (Z >(200 − 10.6n)/

√9n = z). Dalle tavole z = 1.645 per cui (200 − 10.6n)/

√9n = 1.645. Da questa si

puo ricavare n. Facendo i calcoli (non richiesti) n = 16.9513 da arrotondare a 16.Attenzione: non va bene fare Y = nX ∼ N(nµ, n2σ2) al posto di Y =

∑ni=1Xi ∼ N(nµ, nσ2).

Esercizio 4. Modello di regressione lineare yi = β0 + β1xi + ui, dove ui ∼ N(0, σ2), y = CO, x =catrame.

(A) β1 = Cov(x, y)/V ar(x) = 20.5039/26.6256 = 0.7701, β0 = y − β1x = 13 − 0.7701 ∗ 12.68 = 3.2354,

σ2 = [Dev(y)− β21Dev(x)]/(n− 2) = 413.34− 0.77012 ∗ 639.01 = 1.5631.

(B) Test di H0 : β1 = 0 contro H1 : β1 6= 0. α = 0.01. Statistica test sotto H0: [β1−0]/√σ/Dev(x)|H0 ≈

T (n− 2). Regione accettazione: [−2.8188, 2.8188]. Valore campionario statistica test sotto H0: tcamp =

[β1 − 0]/√σ/Dev(x) = 15.5706.

147

Page 148: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

75 Compito del 15.02.2007 (solo studenti PT)

75.1 Testo

Esercizio 1. Un’analista sta osservando i bilanci 2006 di 5 grossi alberghi appartenenti ad un’unicacatena. Molte cose sono strutturate in modo simile fra i diversi alberghi, ma i singoli esercizi godono dialcuni margini di autonomia su certi aspetti della gestione. In particolare l’analista sta valutando se esisteuna relazione fra profittabilita (misurata da MON/Ricavi in %) e propensione ad esternalizzare alcunefasi della gestione (valutata con Costi Esterni/Costi Totali in %). I dati sono raccolti nella seguentetabella.

Indicatore Torino Milano 1 Milano 2 Genova VeronaMON/Ricavi % 10.0 19.3 16.9 9.6 15.0

Costi Esterni/Costi Totali % 12.1 15.3 31.9 17.0 24.5

(A) Iniziare l’analisi mettendo in evidenza l’eventuale relazione attraverso un grafico.(B) A scopo puramente puramente descrittivo, fornire un indice statistico per valutare la relazione i dueindicatori.

Esercizio 2. L’analisi di cui al punto precedente puo essere approfondita mediante la regressione.

(A) Formulare un opportuno modello lineare che risponda alle esigenze dell’analista (si veda il testodell’esercizio 1) e stimarne i coefficienti.(B) Fornire una stima per intervallo della variabilita intorno alla retta di regressione (α = 0.05).

Esercizio 3. Con riferimento all’esercizio precedente:

(A) E possibile concludere che la profittabilita e legata in modo significativo alla propensione ad ester-nalizzare? (α = 0.1)(B) Calcolare i residui di regressione per Torino e Milano 1.

Esercizio 4. Sia X una variabile casuale. La sua distribuzione e stata tabulata nella seguente tabella.x -2 -1 0 1 2 3

f(x) 0.1 0.4 0.3 0.1 0 0.1

(A) La distribuzione data nella tabella e ben definita? Rispondere argomentando in modo opportuno.(B) Calcolare i principali valori attesi della variabile X in modo da misurarne tendenza centrale e variabi-lita. In base alla risposta alla domanda (A), prima di effettuare i calcoli puo essere necessario aggiustarela distribuzione in tabella se questa non e ben definita.

75.2 Soluzioni

Esercizio 1.

(A) Semplice scatterplot o diagramma x, y, dove X = indicatore dei costi, Y = indicatore di profittabilita.

(B) Calcolo del coefficiente di correlazione. Prospetto di calcolo:Torino Milano 1 Milano 2 Genova Verona Somma Media

x 12.1 15.3 31.9 17.0 24.5 100.80 20.16y 10.0 19.3 16.9 9.6 15.0 70.80 14.15x2 146.41 234.09 1017.61 289.00 600.25 2287.36 457.47y2 99.25 372.18 284.46 92.11 226.18 1074.18 214.84xy 120.55 295.17 538.03 163.15 368.46 1485.35 297.07

Allora: n = 5, M(X) = 20.16, M(Y ) = 14.15, V (X) = 457.47−20.162 = 51.05 V (Y ) = 214.84−14.152 =14.57, σ(X) = 7.1447, σ(Y ) = 3.8176 C(X,Y ) = 297.07− 20.16 ∗ 14.15 = 11.7788, ρ = 11.7788/(7.1447 ∗3.8176) = 0.4318.

148

Page 149: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Esercizio 2. Modello di regressione lineare yi = β0 + β1xi + ui, dove ui ∼ N(0, σ2), y = indicatore diprofittabilita, x = indicatore dei costi.

(A) β1 = Cov(x, y)/V ar(x) = 11.7788/51.05 = 0.2307, β0 = y − β1x = 14.15 − 0.2307 ∗ 20.16 = 9.4995,

σ2 = [Dev(y)− β21Dev(x)]/(n− 2) = (72.8711− 0.23072 ∗ 255.232)/(5− 2) = 19.7604.

(B) Intervallo di confidenza per σ2 o per σ. Pivot: σ2(n−2)/σ2 distribuito come χ2(n−2). Intervallo perσ2: [σ2(n − 2)/c2, σ

2(n − 2)/c1] = [6.3413, 274.7111] Intervallo per σ: [2.5182, 16.5744]. Valori e calcoliutili: gl = n− 2 = 3, c1 = 0.2158, c2 = 9.3484.

Esercizio 3.

(A) Test di H0 : β1 = 0 contro H1 : β1 6= 0. α = 0.1. Statistica test sotto H0: [β1− 0]/√σ/Dev(x)|H0 ≈

T (n− 2). Regione accettazione: [−2.3534, 2.3534]. Valore campionario statistica test sotto H0: tcamp =

[β1 − 0]/√σ/Dev(x) = 0.2307. Valori e calcoli utili: β1 = 0.2307, σ2 = 19.7604, Dev(x) = 255.232,

σ(β1) =√σ/Dev(x) = 0.2782.

(B) Calcolo residui stimati ui (solo i primi due erano richiesti)Torino Milano 1 Milano 2 Genova Verona

yi = β0 + β1xi 12.2916 13.0300 16.8604 13.4222 15.1528ui -2.3291 6.2620 0.0057 -3.8250 -0.1136

Esercizio 4.x -2 -1 0 1 2 3 Sommaf(x) 0.1 0.4 0.3 0.1 0 0.1 1xf(x) -0.2 -0.4 0 0.1 0 0.3 -0.2x2f(x) 0.4 0.4 0 0.1 0 0.9 1.8

(A) La distribuzione di X e ben definita in quanto rispetta le due caratteristiche fondamentali che deveavere affinche lo sia, ovvero: 1. f(x) ≥ 0 per ogni valore di x;

∑x f(x) = 1.

(B) Dal prospetto di calcolo sopra riportato: E(X) = −0.2, V (X) = E(X2) = E(X)2 = 1.8− (−.2)2 =1.76.

149

Page 150: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

76 Compito del 30.03.2007 (solo studenti PT)

76.1 Testo

Esercizio 1. Un’agenzia ministeriale ha formato un pool di 6 esperti per decidere quale linea strategicaseguire in merito alla gestione delle somme destinate al nuovo regime del TFR. Ognuno degli esperti havalutato entrambe le strategie in esame: una piu prudente, l’altra piu rischiosa. Al termine, le valutazionidi ciascuno degli esperti sono state sintetizzate nei punteggi di cui alla seguente tabella.

EspertoStrategia A. Aranci B. Bianco C. Celestino G. Grigioni R. Rossi V. VerdiPrudente 4.5 4.0 6.5 6.7 3.0 6.1Rischiosa 3.2 3.7 4.9 7.8 2.6 5.6

(A) E possibile stabilire se una delle due strategie e giudicata significativamente migliore dell’altra?Formulare il problema in termini di test delle ipotesi (α = 0.1).(B) Specificare in dettaglio le assunzioni formulate per rispondere alla domanda precedente.

Esercizio 2.

(A) In merito alla nuova gestione del TFR, gli esperti del ministero avevano preventivato che, entromarzo 2007, oltre il 35% del personale avrebbe gia deciso di aderire al nuovo regime. Da una rilevazionea campione commissionata allo scopo e emerso che, su 1505 intervistati, 560 sono gia propensi ad aderire.In base a tale informazione, e possibile ritenere che le aspettative ministeriali sono giuste? Risponderemediante il calcolo del p–value e commentare il risultato.(B) Un’altra indagine, effettuata per conto dei sindacati, ha evidenziato che su 780 operai intervistatiil 33% ha intenzione di aderire, mentre la percentuale dei propensi all’adesione risulta il 47% fra i 560impiegati intervistati. Fornire stima puntuale e per intervallo (1 − α = .98) per valutare la diversapropensione ad aderire fra le due categorie di dipendenti.

Esercizio 3. Un dirigente sindacale, che non ha una chiara percezione del concetto di rischio, vi hachiesto consulenza privata. Cercate di fargli capire il concetto proponendogli la seguente situazione.Avete 100 euro da investire in una qualsiasi combinazione (portafoglio) fra 2 titoli: (a) un bond senzarischio, che rende il 2.5% fisso l’anno; (b) un’azione rischiosa, che in media rende il 4% l’anno con unadeviazione standard del 10%. Tenendo presente un orizzonte temporale di un anno e che non e possibileindebitarsi:

(A) Quale ripartizione dei 100 euro fra i 2 titoli risulta la migliore se uno vuol massimizzare il rendimentoatteso del portafoglio? Quale ripartizione dei 100 euro fra i 2 titoli risulta la migliore se uno vuolminimizzare il rischio (misurato dalla deviazione standard) del portafoglio? Rispondere argomentando.(B) Quale ripartizione dei 100 euro risulta ottimale se uno vuole massimizzare il rendimento ma, contem-poraneamente, vuole che la probabilita di avere un rendimento negativo del portafoglio sia non piu del10%? Nel rispondere si assuma che il rendimento dell’azione rischiosa abbia distribuzione normale.

Esercizio 4. Si consideri il rendimento del titolo rischioso menzionato nell’esercizio precedente, e si assu-ma che esso abbia distribuzione normale con la media e la deviazione standard indicati. Pur consapevoliche non e sensato andare a stimare delle quantita che invece sono note, rispondere alle seguenti domande.Avendo a disposizione un campione casuale di 10 osservazioni e con riferimento alle statistiche/stimatorivisti nel corso:

(A) Per stimare il rendimento medio, quale stimatore suggerite? Rispondere argomentando. Calcolarel’MSE dello stimatore suggerito.(B) Per stimare la varianza, quale stimatore suggerite? Rispondere argomentando. Calcolare l’MSE dellostimatore suggerito.

76.2 Soluzioni

Esercizio 1.

150

Page 151: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) X1 =’giudizio sulla strategia prudente’, X2 =’giudizio sulla strategia rischiosa’. Per come e rilevatoil campione si tratta di effettuare un test sulla differenza fra medie per dati appaiati. Quindi: D =X1 −X2 ∼ N(µD, σ

2D).

(A) Test di H0 : µD = 0 contro H0 : µD 6= 0. La variabile test e (sotto H0) (D − 0)/(SD/√n) che sotto

H0 ha distribuzione T (n− 1).

EspertoStrategia A. Aranci B. Bianco C. Celestino G. Grigioni R. Rossi V. VerdiPrudente 4.5 4.0 6.5 6.7 3.0 6.1Rischiosa 3.2 3.7 4.9 7.8 2.6 5.6

di 1.3 0.3 1.6 -1.1 0.4 0.5d2i 1.69 0.09 2.56 1.21 0.16 0.25

Dalla tabella, d = 3.0/6 = 0.5, dev(d) =∑ni d

2i − n ∗ d = 5.96 − 6 ∗ 0.52 = 4.46, s2

d = dev(d)/(n −1) = 4.46/5 = 0.892, sd = 0.9444575; valore campionario della statistica test sotto H0, tcamp = (d −0)/(sd/

√n) = 1.2968 (sd/

√n = 0.38557), regione di accettazione [−2.01505, 2.01505]. Quindi i dati

raccolti non autorizzano a ritenere che una strategia sia significativamente migliore dell’altra.

Esercizio 2.

(A) Assunzioni: X = ’lavoratore propenso ad aderire’ ∼ Be(p). Test di H0 : p = 0.35 contro H0 :p > 0.35. Poniamo p0 = 0.35. Statistica test (sotto H0) Z = (p − p0)/

√p0q0/n che sotto H0 ha una

distribuzione, approssimativamente, N(0, 1). Valore campionario della statistica test sotto H0, zcamp =

(p − p0)/√p0q0/n = 1.7969 dove p = 560/1505 = 0.372093,

√p0q0/n =

√0.35 ∗ (1− 0.35)/1505 =√

0.0001511628 = 0.01229483. p − value = P [Z > 1.769|H0] = 0.03617, che porta a dar ragione alministero se si sceglie un α maggiore di tale valore (ad esempio l’usuale 0.05).

(B) Assunzioni: X1 = ’operaio propenso ad aderire’ ∼ Be(p1), X2 = ’impiegato propenso ad aderire’∼ Be(p2). Stima per intervallo e intervallo di confidenza per p2 − p1. Stima puntuale: p2 − p1 =0.47 − 0.33 = 0.14. Quindi si stima che fra i due gruppi di dipendenti c’e una differenza, a favore deglioperai, di circa 14 punti percentuali in merito alla propensione ad aderire. Stima per intervallo: [(p2 −p1)−z

√p2q2/n2 + p1q1/n1, (p2− p1)+z

√p2q2/n2 + p1q1/n1] = [0.07712, 0.20288], dove p2q2/n2 = 0.47∗

(1− 0.47)/560 = 0.0004448214, p1q1/n1 = 0.33 ∗ (1− 0.33)/780 = 0.0002834615,√p2q2/n2 + p1q1/n1] =√

0.000728283 = 0.02699, z = 2.33 dato che 1− α = 0.98.

Esercizio 3.

(A) Indico con c la somma investita nel titolo rischioso; quindi 100 − c sara la somma investita inquello non rischioso. Rendimento del portafoglio ad un anno: X = (100 − c) ∗ 0.025 + cX2, doveX2 ∼ [0.04, 0.10] e il rendimento del titolo rischioso. Per le proprieta dei valori attesi: µX = E(X) =(100− c)∗0.025 + cE(X2) = (100− c)∗0.025 + c0.04 = 2.5 + 0.015c risulta massimo se si investe tutto neltitolo rischioso, cioe c = 100; σ2

X = V (X) = c2V (X2) = c2 ∗ 0.102, che risulta minimo se non si investeniente nel titolo rischioso e tutto in quello non rischioso (quindi c = 0).

(B) Si e capito che piu si punta su quello rischioso e piu, mediamente(!), si guadagna. Se pero si vuoleP (X < 0) = 0.10 allora, includendo l’assunzione di normalita, 0.10 = P (X < 0) = P [(X − µX)/σX <(0− µX)/σX ] = P [Z < (0− µX)/σX ]. Dalle tavole si trova che z = (0− µX)/σX = −1.28. Sostituendole formule di µX e σX ricavo c: (0− 2.5− 0.015c)/(0.1 ∗ c) = −1.28, da cui c = 22.12 euro.

Esercizio 4.

(A) Uso X, dato che e stimatore efficiente di µ. Siccome e corretto allora MSE(X;µ) = V (X) = σ2/n =0.102/10 = 0.001.

(B) Uso S2∗∗, dato che e stimatore efficiente di σ2 e si conosce la media. Siccome e corretto allora

MSE(S2∗∗;σ

2) = V (S2∗∗) = 2 ∗ σ4/n = 2 ∗ .104/10 = 0.00002.

151

Page 152: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

77 Compito del 31.05.2007 (solo studenti PT)

77.1 Testo

Premessa: RAPAnet e una societa che offre servizi via internet, wap e simili. Uno di questi consistenell’invio di contenuti (tipo suonerie per cellulari o files mp3) agli iscritti al servizio. Per usufruire deiservizi gli iscritti pagano una quota settimanale: ogni settimana possono decidere se pagare (scalando laquota dalla scheda telefonica) o uscirne definitivamente.

Esercizio 1. RAPAnet vuole valutare se esiste differenza di comportamento fra coloro che dispongonodi scheda TIM e di scheda WIND. Su un campione di utenti che si sono iscritti nel mese di dicembre 2006sono state rilevate le seguenti statistiche (iscritti = iscritti nel mese di dicembre 2006; usciti = usciti dalservizio entro 5 settimane dall’iscrizione).

Scheda telefonica n. iscritti n. uscitiTIM 3969 669WIND 1986 378

(A) Si fornisca stima puntuale e per intervallo per valutare la differente propensione ad uscire dal serviziofra i clienti TIM e WIND.(B) I dati mostrano una maggiore propensione ad uscire dal servizio da parte dei clienti WIND? Calcolareil p-value e commentare il risultato.(C) Si calcoli la potenza del test ottenuto ponendo α = 0.02 e l’ipotesi alternativa secondo la quale ladifferenza fra WIND e TIM circa la probabilita di abbandonare il servizio entro le 5 settimane e pari a2.3 punti percentuali.

Esercizio 2. Si assuma che le probabilita di uscire dal servizio entro le 5 settimane, separatamente per iclienti TIM e WIND, siano identiche a quelle desumibili dai dati dell’esercizio 1. Si assuma anche, comee noto a RAPAnet, che il 63% dei propri clienti sia TIM e il rimanente WIND.

(A) Preso a caso un cliente, calcolare la probabilita che questo esca dal servizio entro 5 settimanedall’iscrizione.(B) Su 100 clienti estratti casualmente e con reimmissione, indicare come si distribuisce (compreso il valoredei parametri) la variabile ’numero di usciti dal servizio entro 5 settimane dall’iscrizione’. Calcolarne iquartili (1o, 2o, 3o).

Esercizio 3. In un’altra analisi RAPAnet ha utilizzato i dati rilevati per quantificare la relazione frainvestimento pubblicitario (su motori di ricerca, banner e simili) e numero di nuove iscrizioni al servizio.I dati degli ultimi 5 mesi sono riassunti in tabella.

Variabile gennaio febbraio marzo aprile maggiospesa (milioni euro) 0.28 0.1 0.28 0.24 0.23nuovi iscritti (migliaia) 36.1 18.6 38.8 29.4 29.6

(A) Aiutate RAPAnet formulando un modello che risponda alle sue esigenze. Stimarne i parametri.(B) Valutare l’indice R2 e commentare il risultato.(C) Per il mese di giugno RAPAnet ha in progetto di investire 0.22 milioni di euro in pubblicita. Fornireuna previsione, puntuale e per intervallo (α = 0.2), su quanti saranno i nuovi iscritti al servizio nel mese.

77.2 Soluzioni

Esercizio 1 Assunzioni: X1 = ’utente TIM esce entro 5 settimane’ ∼ Be(p1); X2 = ’utente WIND esceentro 5 settimane’ ∼ Be(p2); X1, X2 indipendenti.

(A) Stima puntuale e per intervallo di p2 − p1. Stimatore puntuale: X2 −X1; stima puntuale x2 − x1 =

0.0218. Pivot: [(X2−X1)−(p2−p1)]/√X2(1−X2)/n2 +X1(1−X1)/n1 con distribuzione campionaria

(approssimata) N(0, 1); intervallo di confidenza al 95% di probabilita: [x1−x2− z ∗se, x1−x2 + z ∗se] =[9e− 04, 0.0426], dove se =

√x2(1− x2)/n2 + x1(1− x1)/n1, z = 1.96.

152

Page 153: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Ipotesi: H0 : p2 − p1 = 0 contro H1 : p2 − p1 > 0. Statistica test (sotto H0): [(X2 −X1) − 0]/se0,la cui distribuzione sotto H0 e N(0, 1), dove se0 =

√pq(1/n2 + 1/n1) e p = (x2n2 + x1n1)/(n2 + n1)

e la stima pooled di p. Nelle condizioni dell’esercizio, p − value = P (Z > zcamp) = 0.0186, dovezcamp = [(x2 − x1)− 0]/se0 = 2.084.

(C) γ = P (campione ∈ R|H1). Facendo i conti, la regione di rifiuto per la statistica test di cui al puntoprecedente e (zcrit = 2.054,∞) (α = 0.02). Allora γ = P (campione ∈ R|H1) = P ([(X2 −X1)− 0]/se0 >zcrit|H1) = P ([(X2 − X1) > zcrit ∗ se0|H1) = P ([(X2 − X1) > 0.0215|H1). Sotto H1 abbiamo che,approssimativamente, [(X2−X1)− 0.023]/se ≈ N(0, 1) (vedi sopra per se), per cui γ = P ([(X2−X1) >0.0215|H1) = P ([(X2 −X1)− 0.023]/se > (0.0215− 0.023)/0.0106|H1) = P (Z > −0.142) = 0.55657.

Calcoli e valori utili: x1 = 669/3969 = 0.169, x2 = 378/1986 = 0.19, se =√x2(1− x2)/n2 + x1(1− x1)/n1 =√

3.531e− 05 + 3.531e− 05 =√

0.00011291 = 0.0106; p = (x2n2 +x1n1)/(n2 +n1) = (378+669)/(1986+3969) = 0.1758, q = 0.8242, se0 =

√pq(1/n2 + 1/n1) =

√0.00010947 = 0.0105.

Esercizio 2 Notazione e assunzioni: T = TIM , W = WIND; X|T = ’utente TIM esce entro 5settimane’ ∼ Be(p1 = 0.169); X|W = ’utente WIND esce entro 5 settimane’ ∼ Be(p2 = 0.19). Sappiamoche P (T ) = 0.63, P (W ) = 0.37.

(A) P (X = 1) = P (X = 1|T )P (T )+P (X = 1|W )P (W ) = 0.169∗0.63+0.19∗0.37 = 0.17661. In pratica,quindi, la v.c. X =’utente esce entro 5 settimane ∼ Be(p = 0.17661)’.

(B) Nelle condizioni dell’esercizio, la v.c. Y =’n. clienti su 100 che abbandonano il servizio entro 5settimane’∼ Bi(n = 100, p = 0.17661). I quantili possono essere calcolati utilizzando l’approssimazionenormale Bi(n = 100, p = 0.17661) ' N(np = 17.661, npq = 14.542): Q1 = 15.09, Q2 = Me = µ = 17.66,Q3 = 20.23.

Esercizio 3

(A) Modello lineare: yi = β0 + β1xi + εi, εi ∼ N(0, σ2), dove X = spesa, Y = n. nuovi iscritti. Stime:

β1 = cod(x, y)/dev(x) = 101.7792, β0 = y−β1x = 7.4979, σ2 =∑ni=1 ε

2i /(n−2) = dev(y)−β2

1dev(x)/(n−2) = 5.6035.

(B) Nel modello lineare semplice R2 = ρ2 = 0.96492 = 0.9311.

(C) Stima puntuale e per intervallo di E(y|x0), che per brevita indicheremo con θ. Stimatore puntuale:

θ = β0 + β1x0; stima puntuale β0 + β1x0 = 29.8893. Pivot: [θ − θ]/σ(θ) con distribuzione campionaria

T (n− 2), dove σ2(θ) = σ2(1/n+ (x0 − x)2/dev(x)); intervallo di confidenza al 95%: [28.15, 31.63], dovet = 1.6377.

Calcoli e valori utiliVariabile gennaio febbraio marzo aprile maggio Sommaxi 0.28 0.1 0.28 0.24 0.23 1.13yi 36.1 18.6 38.8 29.4 29.6 152.5x2i 0.0784 0.01 0.0784 0.0576 0.0529 0.2773y2i 1303.21 345.96 1505.44 864.36 876.16 4895.13xiyi 10.108 1.86 10.864 7.056 6.808 36.696

da cui: x = 1.13/5 = 0.226, y = 152.5/5 = 30.5, dev(x) =∑ni=1 x

2i −nx2 = 0.2773−5∗0.2262 = 0.02192,

dev(y) =∑ni=1 y

2i −ny2 = 4895.13−5∗30.52 = 243.88, cod(x, y) =

∑ni=1 xiyi−nxy = 36.696−5∗0.226∗

30.5 = 2.231, ρ = cod(x, y)/√dev(x)dev(y) = 0.9649, σ2(θ) = σ2(1/n + (x0 − x)2/dev(x)) = 1.1299,

σ(θ) = 1.063.

153

Page 154: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

78 Compito del 05.06.2007 (solo studenti PT)

78.1 Testo

Premessa: La AllMart e una grossa catena di prodotti di consumo.

Esercizio 1. AllMart vuole quantificare la relazione fra sconti concessi alla clientela nelle offerte periodi-che e volumi venduti. L’analisi di una serie di offerte fra loro comparabili ha fornito i risultati in tabella(legenda: sconto % medio = sconto percentuale medio dell’offerta; variazione % volumi = differenzapercentuale dei volumi venduti durante l’offerta rispetto alla media).

Variabile offerta 1 offerta 2 offerta 3 offerta 4 offerta 5sconto % medio 34 34 11 22 14variazione % volumi 23 23 -5 17 7

(A) Esiste una relazione significativa fra volumi venduti e sconto medio concesso? (α = 0.05)(B) Nella prossima offerta, AllMart intende proporre una percentuale di sconto medio pari al 22%. Fornireuna previsione, puntuale e per intervallo (α = 0.1), sulla variazione percentuale dei volumi rispetto allivello medio.

Esercizio 2. Per incentivare la clientela, AllMart usa anche un sistema di raccolta punti. La situa-zione al 31.12.2006 di un particolare punto vendita, relativamente ai punti raccolti da ciascun cliente, eschematizzata nella seguente tabella.

punti per cliente [0,100] (100,300] (300,600] (600,1000] oltre 1000numero clienti 6255 3892 973 834 1946

(A) Rappresentare graficamente la distribuzione della variabile numero di punti raccolti per cliente.(B) Ricavare una misura di tendenza centrale e una misura di variabilita della variabile numero di puntiper cliente.

Esercizio 3. AllMart gestisce anche una propria carta di credito, utilizzabile anche in altri punti venditaesattamente come una comune carta di credito. AllMart ritiene che nonostante le condizioni piuttostovantaggiose i clienti non la usino a sufficienza. A titolo di esperimento, ha selezionato un campione casualedi utenti 2005, offrendo a ognuno di loro di togliere la commissione annuale 2006 se in tale anno avesserosuperato i 2000 euro di utilizzo. I dati campionari sull’utilizzo della carta sono sono stati elaborati comeschematizzato in tabella (valori monetari in euro; dev. st. = radice quadrata della varianza campionariacorretta).

dimensione media media media (della diffe- dev. st. dev. st. dev. st. (della diffe-(del 2005) (del 2006) renza 2006− 2005) (del 2005) (del 2006) renza 2006− 2005)

141 1648 1744 96 380 435 450

(A) Mediante un opportuno test delle ipotesi, verificare se il provvedimento fa incrementare in modosignificativo l’utilizzo medio della carta. (α = 0.01)(B) Sfruttando le informazioni a disposizione, indicare quanto dovrebbe essere grande il campione perottenere un intervallo di confidenza per il parametro d’interesse di ampiezza 0.69 al livello di confidenza1− α = 0.9.

Esercizio 4. Sia X ∼ N(µ, σ = 17). L’obiettivo e stimare µ: a questo scopo si raccomanda di utilizzareun buon stimatore.

(A) E stato estratto un campione di dimensione n = 7. Calcolare la probabilita di commettere un erroredi stima, in valore assoluto, superiore a 8.2.(B) E possibile effettuare lo stesso calcolo di cui al punto precedente, magari in via approssimata,rimuovendo l’assunzione di normalita della variabile X? Argomentare la risposta.

154

Page 155: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

78.2 Soluzioni

Esercizio 1. Assunzioni: modello lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), dove Y = variazione %volumi, X = sconto % medio.

(A) Esiste una relazione significativa se β1 e diverso da 0. Quindi test di H0 : β1 = 0 contro H1 : β1 6= 0.

Variabile test β1, con la seguente distribuzione campionaria: (β1 − β1)/σ(β1) ∼ T (n − 2). Sotto H0:

(β1 − 0)|H0/σ(β1) ∼ T (n − 2). Per α = 0.05 e n − 2 = 3 la regione di accettazione e [−3.1824, 3.1824],

mentre il valore campionario della statistica test sotto H0 e (β1 − 0)/σ(β1) = 4.608014.

(B) Stima puntuale e per intervallo di E(y|x0), che per brevita indicheremo con θ. Stimatore puntuale:

θ = β0 + β1x0; stima puntuale β0 + β1x0 = 11.96153. Pivot: [θ − θ]/σ(θ) con distribuzione campionariaT (n− 2); intervallo di confidenza al 95%: [6.8031, 17.1100], dove per α = 0.1 e n− 2 = 5 si ha t = 2.3534.

Calcoli e valori utiliofferta1 offerta2 offerta3 offerta4 offerta5 Somma

xi 34 34 11 22 14 115yi 23 23 -5 17 7 65x2i 1156 1156 121 484 196 3113y2i 529 529 25 289 49 1421xiyi 782 782 -55 374 98 1981

da cui: n = 5, x = 115/5 = 23, y = 65/5 = 13, dev(x) =∑ni=1 x

2i − nx2 = 3113 − 5 ∗ 232 = 468,

dev(y) =∑ni=1 y

2i − ny2 = 1421− 5 ∗ 132 = 576, cod(x, y) =

∑ni=1 xiyi − nxy = 1981− 5 ∗ 23 ∗ 13 = 486,

β1 = cod(x, y)/dev(x) = 486/468 = 1.038462, β0 = y − β1x = 13 − 1.038462 ∗ 23 = −10.88463 σ2 =

(dev(y) − β21dev(x))/(n − 2) = (576 − 1.0384622 ∗ 468)/(5 − 2) = 23.76908, σ =

√23.76908 = 4.875354,

σ(β1) = σ/√dev(x) = 4.875354/

√468 = 0.22536, (β1 − 0)/σ(β1) = 1.038462/0.22536 = 4.608014,

θ = β0 + β1x0 = −10.88463 + 1.038462 ∗ 22 = 11.96153, σ2(θ) = σ2(1/n+ (x0−x)2/dev(x)) = 23.76908 ∗(1/5 + (22− 23)2/468) = 4.804605, σ(θ) =

√4.804605 = 2.19194.

Esercizio 2.

(A) Istogramma, da costruire in base ai dati della tabella seguente (N.B.: la classe > 1000 e stata chiusaa 2500 punti).

(B) Indice di tendenza centrale: Me = 100 + (6950 − 6255)/19.4600 = 135.71. Indice di variabilita:∆Q = Q3 − Q1 = 385.72 − 55.56 = 330.16, dove Q1 = 0 + 3475/62.5500 = 55.56, Q3 = 300 + (10425 −10147)/3.2433 = 385.72.

classi [0,100] (100,300] (300,600] (600,1000] > 1000freq 6255 3892 973 834 1946ampiezza 100 200 300 400 1500densita 62.5500 19.4600 3.2433 2.0850 1.2973freq. cumulate 6255 10147 11120 11954 13900

Esercizio 3. Test per dati appaiati (il campione e lo stesso nei due anni). Notazione e assunzioni:D = utilizzo2006− utilizzo2005 ∼ N(µD, σ

2D).

(A) Ipotesi: H0 : µD = 0 contro H1 : µD > 0. Statistica test (sotto H0): (D − 0)/(SD/√n), la cui

distribuzione sotto H0 e T (n − 1). Regione di rifiuto per α = 0.01 e n − 1 = 140: (2.3533,∞); valorecampionario della statistica test sotto H0: (d− 0)/(sD/

√n) = (96− 0)/(450/

√141) = 2.5332.

(B) In base al valore di α = 0.9 si ha z = 1.645. Per σ si sfrutta quanto si conosce, ovvero la stima paria 450. Quindi n = (2zσ/A)2 = (2 ∗ 1.645 ∗ 450/0.69)2 = 4603823.

Esercizio 4.

(A) Si stima µ mediante X, la cui distribuzione, nelle condizioni dell’esercizio, e N(µ, σ2/n = 41.2857).Allora P (|X − µ| > 8.2) = 1 − P (|X − µ| ≤ 8.2). Ma P (|X − µ| ≤ 8.2) = P (−8.2 ≤ X − µ ≤ 8.2) =

155

Page 156: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

P (−8.2/√

41.2857 ≤ (X − µ)/(σ/√n) ≤ 8.2/

√41.2857) = P (−1.276 ≤ Z ≤ 1.276) = 0.79945, per cui la

probabilita richiesta viene 0.20055.(B) No. Il campione ha dimensione troppo ridotta per poter utilizzare approssimazioni di sorta, tipoteorema del limite centrale.

156

Page 157: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

79 Compito del 26.06.2007 (solo studenti PT)

79.1 Testo

Premessa: COWSTER e un sito web specializzato in software musicale creato da Jill Bates. Per usufruiredei servizi del sito e necessario iscriversi, ricevendo una login e una password di accesso.

Esercizio 1. Per valutare a quale ritmo stanno procedendo le nuove iscrizioni al sito, nel primo trimestre2007 COWSTER ha raccolto il campione casuale semplice sintetizzato nella tabella che segue. La variabilerilevata e X = ’numero di nuove iscrizioni al secondo’ (nell’orario di maggior traffico in rete).

Nuove iscrizioni al secondo 0 1 2 3 4 >4Frequenza 862 732 294 79 16 0

(A) Rappresentare graficamente la distribuzione della variabile nel campione tenendo presente l’obiettivodi scegliere un opportuno modello probabilistico per la variabile X.(B) Limitando la scelta a Bernoulli, Poisson, Normale scegliere quello che vi sembra piu adatto comemodello probabilistico per X. In base alla scelta fatta e sfruttando i dati del campione spiegare i passinecessari per calcolare la probabilita e quindi frequenza assoluta teorica della classe > 4. Non effettuarei conti.

Esercizio 2. Jill Bates aveva previsto che, nel primo trimestre 2007, il numero di nuove iscrizioni alsecondo avrebbe superato, in media, 0.78. In base ai dati e al modello di cui all’esercizio 1:

(A) La previsione di Jill Bates si e avverata? (α = 0.01).(B) Calcolare la potenza del test di cui al punto precedente in corrispondenza dell’ipotesi alternativa ’lenuove iscrizioni sono in media 0.84 al secondo’.

Esercizio 3. COWSTER ha cercato di stimare se e in che misura il numero di nuovi iscritti alla settimana(espresso in logaritmo naturale) e legato al numero di contenuti (programmi, files, forums, etc.) messi adisposizione degli utenti. La stima dei coefficienti del modello di regressione lineare semplice formulatoha fornito le stime riportate in tabella (s.e. = standard error):

dimensione campione β0 s.e.(β0) β1 s.e.(β1) σ2 s.e.(σ2)202 9.5833 0.6886 0.0647 0.0326 15.1557 1.5156

(A) In base ai dati della tabella, il numero di nuovi iscritti e legato in modo significativo al numero dicontenuti? Rispondere calcolando il p-value.(B) Determinare l’intervallo di confidenza per σ al livello di confidenza 0.01.

Esercizio 4. Si assuma che il numero di nuovi iscritti al secondo X sia distribuito secondo una Po(λ =0.64) e che il numero di nuovi iscritti in intervalli di tempo disgiunti siano indipendenti.

(A) Specificare la distribuzione (ivi compreso il valore dei parametri) del numero di nuovi iscritti in unintervallo di tempo di un minuto. Motivare la risposta in base alla teoria.(B) Calcolare la probabilita che in un minuto vengano effettuate almeno 34 nuove iscrizioni.

79.2 Soluzioni

Esercizio 1

(A) Rappresentazione grafica della distribuzione della variabile X nel campione: diagramma ’a spaghetti’delle frequenze relative, da costruire in base alle elaborazioni seguenti (righe xi ed fi).

xi = Nuove iscrizioni al secondo 0 1 2 3 4 > 4 Totaleni = Frequenza 862 732 294 79 16 0 1983fi = Frequenza relativa 0.4347 0.3691 0.1483 0.0398 0.0081 0 1xini 0 732 588 237 64 0 1621

157

Page 158: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Fra le tre alternative l’unica ragionevole appare X ∼ Po(λ). Allora frequenza teorica(X > 4) =N ∗ P (X > 4), dove P (X > 4) = 1 − P (X ≤ 4) = 1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X =3) + P (X = 4)]. Ciascuna di queste probabilita puo essere calcolata tramite la funzione dei massa dellaPoisson, f(x) = λx exp(λ)/x!, sostituendo a λ la stima (che puo essere ricavata dal campione comex = 1621/1963 = 0.81745) e ad x, di volta in volta, i valori da 0 a 4. Risultato finale (non richiesto)P (X > 4) = 1983 ∗ 0.001549849 = 3.07335, che puo essere arrotondato a 3.

Esercizio 2 Notazione e assunzioni: X ∼ Po(λ).

(A) Test di H0 : λ = 0.78 contro H1 : λ > 0.78. Per comodita indichiamo 0.78 = λ0. Variabiletest X che nelle condizioni dell’esercizio ha distribuzione approssimativamente N(λ, λ/n). Sotto H0:(X − λ0)/

√λ0/n ≈ N(0, 1). Per α = 0.01 la regione rifiuto e (zcrit = 2.326,∞), mentre il valore della

statistica test (sotto H0) nel campione e zcamp = 1.8882. I risultati campionari non sembrano pertantosufficienti a dare ragione a Bates.

(B) Calcolo potenza in corrispondenza di H1 : λ = 0.84. Per comodita indichiamo 0.84 = λ1. γ =P (campione ∈ R|H1) = P ([X − λ0]/

√λ0/n > zcrit|H1) = P (X > λ0 + zcrit

√λ0/n|H1) = P (X >

0.82614|H1). Sotto H1 abbiamo che, approssimativamente, (X − λ1)/√λ1/n ≈ N(0, 1), per cui γ =

P (X > 0.82614|H1) = P ([X − λ1]/√λ1/n > (0.82614− λ1)/

√λ1/n|H1) = P (Z > −0.67351) = 0.74969.

Calcoli e valori utili: x = 1621/1963 = 0.81745,√λ0/n =

√0.000393343 = 0.019832887,

√λ1/n =√

0.000423601 = 0.02058156.

Esercizio 3. Assunzioni: Modello lineare: yi = β0 + β1xi + εi, εi ∼ N(0, σ2), dove X = ’indicatorenumero di contenuti’, Y = ln(n. nuovi iscritti).

(A) Test di H0 : β1 = 0 contro H0 : β1 6= 0 Statistica test β1 la cui distribuzione e in generale data da

(β1 − β1)/σ(β1) ∼ T (n − 2), mentre sotto H0 (β1 − 0)/σ(β1)|H0 ∼ T (n − 2). Per n = 202 i gradi diliberta della T sono 200, valore per cui possiamo approssimarla con una N(0, 1) nei calcoli. p− value =

2P (β1 > |0.0647||H0) = 2P ([β1 − 0]/σ(β1)/1.98467|H0) = 2P (Z > 1.98467) = 0.04718, significativo perα = 0.05, non significativo per α = 0.01. Il conto con la T (200) avrebbe dato p− value = 0.04855.

(B) Pivot per σ2: (n − 2)σ2/σ2 distribuito χ2(n − 2). Intervallo per σ2: [(n − 2)σ2/c2, (n − 2)σ2/c1] =[11.875, 19.910], dove n = 202, σ2 = 15.1557, c1 = 152.241, c2 = 255.264 (α = 0.01). Intervallo per σ:[3.446, 4.462].

Esercizio 4. Assunzioni: X = ’n. iscritti in 1 secondo’ ∼ Po(λX = 0.64).

(A) Y = ’n. iscritti in 1 minuto’ ∼ Po(λY = 60∗0.64 = 38.4) per la proprieta di additivita della Poisson,dato che Y e la somma di 60 v.c. Xi ∼ Po(0.64) indipendenti.

(B) E possibile effettuare il calcolo utilizzando l’approssimazione normale Po(38.4) ≈ N(38.4, 38.4), datoche λY e sufficientemente elevato. P (Y ≥ 34) = P ([Y − 38.4]/

√38.4 ≥ [34 − 38.4]/

√38.4) = P (Z ≥

−0.71) = 0.76116.

158

Page 159: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

80 Compito del 10.07.2007 (solo studenti PT)

80.1 Testo

Premessa: SCAMS e un’impresa di cosmetici e affini.

Esercizio 1. SCAMS sta attualmente testando un nuovo principio antirughe, siglato PJ11, frutto dellasua attivita di ricerca. Nel comparare la sua allergenicita con quella della molecola attualmente incommercio, su due distinti campioni casuali semplici di modelli animali, ha ricavato i seguenti risultati(l’unita di misura e omessa).

Molecola Numero osservazioni Media Varianza correttaPJ11 26 30.12 9.53Attuale 26 34.48 18.68

Assumendo che la misura di allergenicita utilizzata si distribuisca in modo normale:(A) Sottoporre a test se l’allergenicita presenta la stessa variabilita nelle due molecole (α = 0.01).(B) Il risultato del test ha conseguenze sul procedimento di test per la differenza fra le allergenicita mediedelle due molecole? Quali e perche? Spiegare adeguatamente.

Esercizio 2. Si risponda alle seguenti domande a prescindere dal risultato dell’esercizio precedente:

(A) E possibile stabilire se la nuova molecola presenta un livello di allergenicita inferire a quella attual-mente in commercio? (α = 0.05).(B) Assumendo che la deviazione standard sia la stessa per entrambe le molecole, se ne effettui una stimaper intervallo (1− α = 0.95).

Esercizio 3. Lo studio della PJ11 e stato motivato dai problemi che l’attuale molecola sembra avercausato in connessione con l’esposizione solare. Per saggiare se questo e vero i laboratori SCAMS hannoeffettuato un esperimento che ha dato i risultati riportati in tabella.

Esposizione al sole (ore) 0.5 1 1.5 2 2.5 3Misura allergenicita 17.3 16.4 12.3 20.2 18.5 22.7

(A) In base ai dati della tabella, e possibile stabilire se il livello di allergenicita e veramente legato alladurata dell’esposizione solare? (α = 0.1)(B) Quanta parte della variabilita del livello di allergenicita e ’spiegata’ dalla durata dell’esposizione alsole?

Esercizio 4. I ricercatori SCAMS hanno letto uno studio in base al quale, in generale, l’ipersensibilitaverso questo tipo di prodotti risulta maggiore per i soggetti di pelle chiara. Dallo studio emerge che laprobabilita che un soggetto sia ipersensibile al prodotto e del 12.5% per le persone di pelle chiara e il4.4% per le altre. Per una popolazione di riferimento composta per il 30.9% con pelle chiara:

(A) Calcolare la probabilita che un soggetto preso a caso nella popolazione manifesti ipersensibilita versoil prodotto.(B) Calcolare la probabilita che su 10 soggetti presi casualmente, ci sia piu di 1 soggetto ipersensibile.

80.2 Soluzioni

Esercizio 1. Notazione e assunzioni: X1 =’misura allergenicita della PJ11’, X2 =’misura allergenicitadi quella venduta attualmente’; X1 ∼ N(µ1, σ

21), X2 ∼ N(µ2, σ

22); i due campioni casuali estratti sono

indipendenti.

(A) Test di H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. Variabile test: S2

1/S21σ

22/σ

21 . Sotto H0: S2

1/S21 |H0 ∼

F (n1 − 1, n2 − 1). Regione accettazione: [0.3451, 2.8981]. Valore campionario della statistica test sottoH0: 0.51017.

(B) In termini generali, l’accettazione dell’ipotesi di uguaglianza fra le due varianze permette di assu-mere, nel test sulla differenza fra le medie, che le varianze di X1 ed X2 sono uguali, ovvero σ2

1 = σ22 .

159

Page 160: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Cio e importante perche le dimensioni dei due campioni non sono sufficienti a poter utilizzare il test,basato sull’approssimazione normale ma che richiede n1 ed n2 sufficientemente elevati, che non richiedel’assunzione dell’uguaglianza delle varianze. Si fa comunque notare che, per quanto riguarda il caso inoggetto in cui n1 = n2, il valore della statistica test e identico nei due test, dato che n1 = n2 implicaS2pooled(1/n1 + 1/n2) = S2

1/n1 + S22/n2 (verificare da soli scrivendo le formule, assumendo n1 = n2 e

facendo le opportune semplificazioni).

Esercizio 2 Notazione e assunzioni: identiche a quelle dell’esercizio 1 con l’aggiunta di σ21 = σ2

2 .

(A) Test diH0 : µ1−µ2 = 0 controH1 : µ1−µ2 < 0. Variabile test (X1−X2)−(µ1−µ2)/(Spooled√

1/n1 + 1/n2).

Sotto H0: (X1 −X2)− 0/(Spooled√

1/n1 + 1/n2)|H0 ∼ T (n1 + n2 − 2). Regione rifiuto: (−∞,−1.6759).Valore campionario della statistica test sotto H0: -4.18573. Il PJ11 appare mediamente meno allergenicodel principio attivo attualmente in commercio.

(B) Intervallo di confidenza per il σ comune ad entrambe le variabili casuali. Pivot per σ2: (n1 +n2 − 2)S2

pooled/σ2 che ha distribuzione χ2(n1 + n2 − 2). Intervallo di confidenza per σ2: [(n1 + n2 −

2)s2pooled/c2, (n1+n2−2)s2

pooled/c1] = [9.87466, 21.79566]. Intervallo di confidenza per σ: [3.14240, 4.66858].

Calcoli e valori utili per gli esercizi 1 e 2: n1 = n2 = 26, s21 = 9.53, s2

2 = 18.68, s2pooled = s2

1/n1 + s22/n2 =

14.105, spooled = 3.75566, spooled√

1/n1 + 1/n2 =√

1.085 = 1.04163, c1 = 32.3574, c2 = 71.4202.

Esercizio 3. Assunzioni: Modello lineare: yi = β0 +β1xi+εi, εi ∼ N(0, σ2), dove X = ’h. di esposizioneal sole’, Y =misura di allergenicita.

(A) Test di H0 : β1 = 0 contro H0 : β1 6= 0. Variabile test (β1−β1)/σ(β1). Sotto H0 (β1−0)/σ(β1)|H0 ∼T (n − 2). Regione accettazione: [−2.1318, 2.1318]. Valore campionario della statistica test sotto H0:1.5891. L’esposizione solare sembra effettivamente accrescere il grado di allergenicita ma non in misurasignificativa (probabilmente per l’esigua dimensione del campione).

(B) L’indice R2 fornisce quanto richiesto. Nella regressione semplice puo essere calcolato come ρ2 =0.622092 = 0.38700

Calcoli e valori utili:Somma

xi 0.5 1 1.5 2 2.5 3 10.5yi 17.3 16.4 12.3 20 18.5 22.7 107.4x2i 0.25 1 2.25 4 6.25 9 22.75y2i 299.29 268.96 151.29 408 342.25 515.29 1985.12xiyi 8.65 16.4 18.45 40 46.25 68.1 198.25

da cui: x = 10.5/6 = 1.75, y = 107.4/6 = 17.9, dev(x) =∑ni=1 x

2i − nx2 = 22.75 − 6 ∗ 1.752 = 4.375,

dev(y) =∑ni=1 y

2i − ny2 = 1985.12 − 6 ∗ 17.92 = 62.66, cod(x, y) =

∑ni=1 xiyi − nxy = 198.25 − 6 ∗

1.75 ∗ 17.9 = 10.3; β1 = codev(x, y)/dev(x) = 2.35429, σ2 = [dev(y) − β21dev(x)]/(n − 2) = 9.60271,

σ(β1) =√σ2/dev(x) =

√2.19491 = 1.48152, ρ = cod(x, y)/

√dev(x)dev(y) = 0.62209.

Esercizio 4.

(A) A =’pelle chiara’; B =’manifesta ipersensibilita’. P (B) = P (B|A)P (A) + P (B|A)P (A) = 0.125 ∗0.309 + 0.044 ∗ 0.691 = 0.069029.

(B) X =’numero ipersensibili su 10 persone estratte a caso’ ∼ Bi(n = 10, p = 0.069029). P (X > 1) =1− P (X ≤ 1) = 1− [P (X = 0) + P (X = 1)] = 1− (0.489059 + 0.362624) = 0.148316

160

Page 161: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

81 Compito del 07.09.2007 (solo studenti PT)

81.1 Testo

Premessa: Un gruppo di ricerca ha condotto uno studio su un piccolo campione di societa del settoreorafo in collaborazione con una sede provinciale di un’associazione nazionale di imprese.

Esercizio 1. Uno degli obiettivi dello studio e stato quello di investigare l’eventuale relazione fra per-formances reddituali (misurate mediante l’indicatore MON/RICAV I espresso in percentuale) e la pro-pensione ad innovare (misurata attraverso un indicatore elaborato sulla base delle risposte ad un questio-nario). La tabella riporta alcune statistiche ricavate da tale elaborazione (PERF sta per performancesreddituali; INN sta per propensione ad innovare).

n media(PERF ) dev.st(PERF ) media(INN) dev.st(INN) correlazione(PERF, INN)16 7.4 9 5.7 1.5 0.313

Formulare un opportuno modello statistico e rispondere alle seguenti domande:(A) La propensione ad innovare tende a far incrementare in modo significativo le performances reddituali?(α = 0.02).(B) Costruire l’intervallo di confidenza al 99% per la deviazione standard dei residui del modello.

Esercizio 2. Un’altra analisi a mirato a verificare l’eventuale relazione delle performances con il ruolodell’imprenditore. Il campione e stato diviso in due gruppi: uno costituito dalle imprese in cui l’impren-ditore e anche colui che dirige l’impresa in modo esclusivo; le altre, in cui la direzione dell’impresa eaffidata, completamente o parzialmente, ad altri. La tabella seguente riporta alcune statistiche.

Gruppo numero media(PERF )√

varianza corretta(PERF )imprese con imprenditore dirigente 7 18 12.01

altre imprese 9 16.6 7.79

(A) I due gruppi differiscono in quanto a redditivita media? (α = 0.05).(B) Il test precedente si basa su una determinata assunzione circa le varianze. Specificare quale esottoporre a verifica tale ipotesi (α = 0.1).

Esercizio 3. Per cercare di interpretare lo studio effettuato in un contesto piu generale, gli autorihanno elaborato i dati di bilancio delle imprese orafe presenti nel database AIDA ottenendo la seguentedistribuzione dell’indicatore MON/RICAV I:

MON/RICAV I % (classi) < 0 [0, 10) [10, 15) [15, 20) [20, 30) ≥ 30Frequenza 20 50 44 50 56 10

(A) Ricavare dalla tabella un indice di variabilita.(B) Assumendo densita costante all’interno di ciascuna classe, ricavare la percentuale di imprese conindicatore superiore a 22.

Esercizio 4. Si consideri una popolazione composta da 4 unita statistiche aventi modalita, rispettiva-mente, 3, 6, 9, 60 di una variabile X. Supponendo di estrarre campioni senza reimmissione di dimensione3:

(A) Costruire la distribuzione della media e della mediana campionaria.(B) Come stimatore della media di X, quale delle sue statistiche di cui sopra e piu efficiente? Motivarela risposta.

81.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y = PERF ,X = INN .

161

Page 162: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Ipotesi: H0 : β1 = 0 contro H1 : β1 > 0. Statistica test (sotto H0): (β1 − 0)/se(β1), dove se(β1) =σ/√dev(x), la cui distribuzione sotto H0 e T (n− 2). Valore campionario della statistica test (sotto H0):

1.2331. Regione di rifiuto: (2.2638,∞).

(B) Pivot per σ2: (n−2)σ2/σ2 con distribuzione χ2(n−2). Intervallo per σ2 al 0.01%: [37.3262, 286.9019].Corrispondente intervallo per σ: [6.1095, 16.9382].

Valori e calcoli utili: n = 16, gl = (n − 2) = 14, dev(x) = nV ar(x) = 36, dev(y) = nV ar(y) =

1296, codev(x, y) = corr(x, y)√dev(x)dev(y) = 67.608, β1 = codev(x, y)/dev(x) = 1.878, se(β1) =

σ/√dev(x) = 1.523, σ2 = (dev(y)− β2

1dev(x))/(n− 2) = 83.502; c1 = 4.075, c2 = 31.319.

Esercizio 2 Assunzioni: X1 = ’performances imprese con imprenditore dirigente’ ∼ N(µ1, σ21); X2 =

’performances altre imprese’ ∼ N(µ2, σ22); X1, X2 indipendenti.

(A) Ipotesi: H0 : µ1−µ2 = 0 contro H1 : µ1−µ2 6= 0. Essendo i due campioni di dimensione relativamenteesigua, si assume σ2

1 = σ22 , e si utilizza la statistica test (sotto H0): [(X1 −X2)− 0]/(Sp

√1/n1 + 1/n2),

la cui distribuzione sotto H0 e T (n1 + n2 − 2), dove S2p = (S2

1n1 + S22n2)/(n2 + n1) e la stima pooled

delle due varianze assunte uguali. Valore campionario della statistica test (sotto H0): 0.2817. Regione diaccettazione: (−2.1448, 2.1448).(B) Come detto, il test di cui sopra si basa sull’assunzione σ2

1 = σ22 . Si vuole sottoporla a test. Ipotesi:

H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. Statistica test (sotto H0): S2

1/S22 , la cui distribuzione sotto H0 e

F (n1 − 1, n2 − 1). Valore campionario della statistica test (sotto H0): 2.3769. Regione di accettazione:(0.2411, 3.5806).

Calcoli e valori utili: x1 = 18, x2 = 16.6, s21 = 144.2401, s2

2 = 60.6841, s2p = (S2

1(n1 − 1) + S22(n2 −

1))/(n2 + n1 − 2) = 97.2398, sp√

1/n1 + 1/n2 = 4.9695.

Esercizio 3

(A) L’indice di variabilita piu semplice da ricavare e lo scarto interquartile. Q1 = 7.5, Q3 = 21.518implicano Q3 −Q1 = 14.018.

(B) Dalle frequenze cumulate si ricava che 22, lascia alla sua sinistra il 76.2% della frequenza complessivae quindi il 23.8% alla sua destra

Esercizio 4

(A) Si fa la lista dei campioni senza reimmissione che si possono ottenere; per ciascuno si calcolano lestatistiche d’interesse (nel mostro caso media e mediana). Tabulando si ottengono le seguenti distribuzionicampionarie:

media campionaria mediana campionariavalori 6 23 24 25 valori 6 9prob 0.25 0.25 0.25 0.25 prob 0.5 0.5

(B) Per stabilire quale dei due e piu efficiente per stimare E(X) = 19.5, occorre calcolare e comparareil loro MSE. Usando il prospetto di calcolo che segue (riferito a mediana, ma un procedimento analogopuo essere usato per media) si ottiene MSE(media) = 61.25, MSE(mediana) = 146.25.x 6 9 Sommaf(x) 0.5 0.5 1xf(x) 3 4.5 7.5x2f(x) 18 40.5 58.5

bias(mediana) = E(mediana) − 19.5 = −12, V (mediana) = E(mediana2) − E(mediana)2 = 2.25, dacui MSE(mediana) = V (mediana) + bias(mediana)2 = 146.25.

162

Page 163: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

82 Compito del 19.12.2007 (solo studenti PT)

82.1 Testo

Premessa: PINGUIN e una multinazionale che commercializza audio e video via web. Da alcuni mesi eentrata nel mercato italiano mediante un’alleanza strategica con TELECOM ITALIA.

Esercizio 1. Una delle preoccupazioni principali del management e la diffusa pratica di scaricare illegal-mente musica e film. Sfruttando l’alleanza con TELECOM ITALIA, la PINGUIN sta cercando di capirese una legge approvata di recente (finalizzata a reprimere in modo incisivo tale pratica) ha effettivamenteridotto il download illegale. Su un campione casuale di 238 servers dedicati ad internet, TELECOM ITA-LIA ha confrontato i volumi di traffico con una serie di siti ritenuti potenziali fonti di materiale illegale,3 mesi prima e 3 mesi dopo l’entrata in vigore della legge, ottenendo le statistiche riportate in tabella(dev. st. denota la radice quadrata della varianza campionaria corretta; l’unita di misura e omessa).

media media media della diffe- dev. st. dev. st. dev. st. della diffe-prima dopo renza dopo - prima prima dopo renza dopo - prima1371.5 1279.6 -91.9 727.8 746.1 614.7

(A) La nuova legge ha diminuito in misura significativa il livello medio verso i siti ritenuti potenziali fontidi materiale illegale? (α = 0.02).(B) Calcolare la potenza del test di cui al punto precedente in corrispondenza dell’ipotesi alternativa inbase alla quale il livello medio e variato di −89 (si assuma che le varianze del campione coincidano conquelle della intera popolazione).

Esercizio 2. I server italiani della PINGUIN sono in ogni momento sottoposti ad un certo lavoro. Permonitorare la situazione, i suoi tecnici utilizzano un indice di carico, indicato con W (weight). Alcunidati raccolti nelle fasce di maggior traffico (serale e fine settimana) sono riportati nella seguente tabella.

W (classi) < 10 [10, 40) [40, 60) [60, 80) [80, 110) ≥ 110Frequenza % 13.2 19.8 21 20.4 19.8 5.8

(A) Calcolare mediana e scarto interquartile di W .(B) Si assuma ora che il W abbia una distribuzione normale avente mediana a scarto interquartile paria quelli appena calcolati. Quanto valgono i parametri della distribuzione di W?

Esercizio 3. Il management della PINGUIN tiene continuamente sotto controllo i propri conti, per adessoin perdita. La struttura dei costi e sostanzialmente sotto controllo: per arrivare agli utili ci sarebbe perobisogno di aumentare i ricavi.

Variabile trim. 1 trim. 2 trim. 3 trim. 4 trim. 5ricavi (milioni euro) 70 73 74 96 108utile (milioni euro) -10.8 -5.5 -8.9 -6.6 -8

(A) Formulare un opportuno modello che colleghi gli utili ai volumi fatturati e stimarne i parametri.(B) In base al modello stimato, a quale livello dei ricavi si colloca il punto di pareggio dei conti?(C) Si valuta che il prossimo trimestre i ricavi saliranno del 8.7% rispetto all’ultima rilevazione trimestrale.Calcolarne il valore e costruire il corrispondente intervallo di stima per l’utile (1− α = 0.9).(D) Quanta parte della variabilita dell’utile riesce a spiegare il modello costruito?

82.2 Soluzioni

Esercizio 1. Test per dati appaiati (il campione e lo stesso nei due periodi considerati). Notazionee assunzioni: D = dopo − prima ∼ (µD, σ

2D). Data l’elevata dimensione campionaria, per effetto del

teorema del limite centrale non e necessario assumere la normalita di D.

(A) Ipotesi: H0 : µD = 0 contro H1 : µD < 0. Statistica test (sotto H0): (D − 0)/(SD/√n), la cui

distribuzione sotto H0 e approssimabile con una N(0, 1). Regione di rifiuto per α = 0.02: (−∞,−2.0537);valore campionario della statistica test sotto H0: −2.3064.

163

Page 164: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Valori utili: d = −91.9, sD = 614.7, n = 238, sD/√n = 39.8451.

(B) Calcolo potenza per H1 : µD = −89, α di cui sopra e σD = sD = 614.7. La regione R e quella costruitasopra. Indichiamo il valore critico con z0, il valore di µD sotto H1 con µD1, e lo standard error σD/

√n

con se. γ = P (campione ∈ R|H1) = P [(D − 0)/se < z0|H1] = P [D < z0se|H1] = P [(D − µD1)/se <(z0se− µD1)/se|H1] = P [Z < z0 − µD1/se|H1] = P (Z < 0.18|H1) = 0.5714

Esercizio 2.

(A) Indice di tendenza centrale: Me = 56.19. Indice di variabilita: ∆Q = Q3 −Q1 = 53.03.Calcoli: Me = 40 + (50 − 33)/1.05 = 56.19. Q1 = 10 + (25 − 13.2)/0.66 = 27.879, Q3 = 80 + (75 −74.4)/0.66 = 80.909.

classe < 10 [10, 40) [40, 60) [60, 80) [80, 110) ≥ 110frequenza % 13.2 19.8 21 20.4 19.8 5.8ampiezza 30 20 20 30densita 0.66 1.05 1.02 0.66freq. % cumulata 13.2 33 54 74.4 94.2 100

(B) Si assume X ∼ N(µ, σ), dove X ha Me e ∆Q pari a quelli calcolati sopra. Per come e definito, unqualsiasi quantile α-esimo, indichiamolo con x(α), deve soddisfare α = P [X ≤ x(α)]. Essendo X normaleabbiamo α = P [X ≤ x(α)] = P [(X − µ)/σ ≤ (x(α) − µ)/σ] = P [Z ≤ z(α)] cosicche z(α) si trova dalletavole e si ottiene la relazione (x(α)− µ)/σ = z(α). Quindi: per la mediana Me = x(0.5) = µ+ σz(0.5);per lo scarto interquartile ∆Q = x(0.75)−x(0.25) = µ+σz(0.75)− [µ+σz(0.25)] = σ[z(0.75)− z(0.25)].Sostituendo i valori di Me, ∆Q, z(0.25) = −0.674, z(0.5) = 0, z(0.75) = 0.674 si ottiene µ = Me = 56.19,σ = ∆Q/[z(0.75)− z(0.25)] = 39.311.

Esercizio 3. Assunzioni: modello lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), dove X = ricavi, Y = utili.

(A) β1 = codev(x, y)/dev(x) = 0.033, β0 = y − β1x = −10.7346, σ2 = (dev(y) − β21dev(x))/(n − 2) =

5.2059,

(B) Il punto di pareggio corrisponde al punto in cui utile = 0. Impostando 0 = β0 + β1x si ottiene

x = −β0/β1 = 325.7624.

(C) Intervallo di stima per y in corrispondenza di x0 = 108∗ (1 + 8.7%) = 117.396. Pivot: [y0− y0]/σ(y0)con distribuzione campionaria T (n − 2); intervallo di confidenza al 95%: [y0 − tσ(y0), y0 + tσ(y0)] =[−14.77, 1.04], dove per α = 0.1 e n− 2 = 3 si ha t = 2.3534.

(D) R2 = ρ2 = codev(x, y)/[dev(x)dev(y)] = 0.0732.Calcoli e valori utili

trim. 1 trim. 2 trim. 3 trim. 4 trim. 5 Sommaxi 70 73 74 96 108 421yi -10.8 -5.5 -8.9 -6.6 -8 -39.8x2i 4900 5329 5476 9216 11664 36585y2i 116.64 30.25 79.21 43.56 64 333.66xiyi -756 -401.5 -658.6 -633.6 -864 -3313.7

da cui: n = 5, x = 84.2, y = −7.96, dev(x) =∑ni=1 x

2i −nx2 = 1136.8, dev(y) =

∑ni=1 y

2i −ny2 = 16.852,

codev(x, y) =∑ni=1 xiyi − nxy = 37.46, σ = 2.2816, y0 = β0 + β1x0 = −6.8661; V (y0) = σ2[1 + 1/n +

(x− x0)2]/dev(x) = 11.2934, σ(y0) = 3.3606.

164

Page 165: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

83 Compito del 16.01.2008 (solo studenti PT)

83.1 Testo

Premessa: DOMAC e una catena di supermercati che commercializza anche linee proprie di prodotti.

Esercizio 1. In un supermercato DOMAC e stato svolto in test di gradimento su un particolare tipodi merendina (brioche). Dopo aver tolto le confezioni, gli addetti all’esecuzione del test hanno fattoassaggiare la brioche DOMAC e quella leader del mercato ad un campione casuale di consumatori,chiedendo a ciascuno di esprimere la propria preferenza per l’una o per l’altra: 68 hanno preferito laDOMAC, 88 quella leader.

(A) La brioche DOMAC e giudicata significativamente migliore di quella leader? (α = 0.02)(B) Quanto vale la potenza del test costruito al punto precedente in corrispondenza dell’ipotesi alternativa’la percentuale di coloro che preferiscono DOMAC e il 62%’?

Esercizio 2. Il risultati del test di gradimento non hanno completamente soddisfatto i responsabiliDOMAC: per questo il procedimento di realizzazione delle brioches e stato in parte modificato. Inseguito a tale modifica e stato effettuato un test di gradimento analogo al precedente (su un campionecasuale semplice differente) nel quale 80 hanno preferito la DOMAC, 70 quella leader. In che misura ecambiato il gradimento nei confronti della brioche DOMAC rispetto alla versione precedente?

(A) Fornire stima puntuale e standard error della quantita d’interesse.(B) Il nuovo metodo ha apportato cambiamenti significativi, in termini di gradimento, rispetto al prece-dente? Rispondere mediante il p-value commentando il risultato.

Esercizio 3. I responsabili DOMAC hanno in mente una nuova strategia mirata alla qualita. In taleambito si vorrebbe incrementare la percentuale di burro rispetto agli altri grassi (e noto infatti che ilburro, rispetto ad altri grassi presenti nei dolciumi, presenta una qualita complessivamente migliore). Mai consumatori riescono effettivamente, al gusto, a percepire la differenza? E stato effettuato un piccoloesperimento, variando la percentuale di burro nell’impasto (a parita di grassi complessivi) e registrandoil gradimento ottenuto in corrispondenza di ciascuna percentuale. Considerando il gradimento comevariabile dipendente e la percentuale di burro come variabile indipendente, un tecnico ha stimato apartire dai dati un modello di regressione lineare semplice dal quale ha ricavato la seguente tabella.

gradimento 36 40 30 55 35residui stimati -0.6 2.1 -9.2 14.5 -6.8

Dopo aver formulato il modello utilizzato dal tecnico:(A) Fornire una stima per intervallo della deviazione standard dei residui (1− α = 0.95).(B) Quanta parte della variabilita complessiva del gradimento e spiegata dal modello? Commentare.

Esercizio 4. Una popolazione composta da N = 4 unita presenta le seguenti modalita della variabilequantitativa X: 6, 30, 33, 90. Assumendo di estrarre campioni casuali senza reimmissione di dimensionen = 3, rispondere alle seguenti domande:

(a) Costruire la distribuzione campionaria della media e della mediana campionaria;(b) Quale dei due stimatori e pi efficiente per stimare la media di X? Motivare la risposta.

83.2 Soluzioni

Esercizio 1. Notazione: X =’singolo consumatore preferisce DOMAC’ ∼ Be(p).

(A) Ipotesi: H0 : p = 0.5 contro H1 : p > 0.5. Indichiamo 0.5 con p0. Statistica test (sotto H0):(p − p0)/

√p0q0/n), la cui distribuzione sotto H0 e approssimabile con una N(0, 1). Regione di rifiuto

per α = 0.02: (2.054,∞); valore campionario della statistica test sotto H0: −1.60128.

(B) Calcolo potenza per H1 : p = 0.62, α di cui sopra. Indichiamo 0.62 con p1. La regione R e quellacostruita sopra. Indichiamo il valore critico con z0, lo standard error sotto H0 con s0 =

√p0q0/n, quello

165

Page 166: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

sotto H1 con s1 =√p1q1/n. γ = P (campione ∈ R|H1) = P [(p−p0)/s0 > z0|H1] = P [p > p0+z0s0|H1] =

P [(p− p1)/s1 > (p0 + z0s0 − p1)/s1|H1] = P (Z > −0.972|H1) = 0.83448.Valori utili: p = 0.4359, s0 =

√p0q0/n =

√0.0016 = 0.04003, s1 =

√p1q1/n =

√0.00151 = 0.03886.

Esercizio 2. Notazione: X1 =’singolo consumatore preferiva DOMAC (vecchio tipo)’ ∼ Be(p1);X2 =’singolo consumatore preferisce DOMAC (nuovo tipo)’ ∼ Be(p2).La misura di quanto e cambiato il gradimento per DOMAC fra le due rilevazioni e p2 − p1.

(A) Stimatore puntuale: p2−p1, la cui distribuzione, nelle condizioni dell’esercizio, e approssimativamenteN(p2 − p1, p2q2/n2 + p1q1/n1). Stima puntuale: p2 − p1 = 0.09743; corrispondente standard error√p2q2/n2 + p1q1/n1 = 0.05688.

(B) Ipotesi: H0 : p2 − p1 = 0 contro H1 : p2 − p1 6= 0. Statistica test (sotto H0): (p2 − p1 −0)/√pq(1/n1 + 1/n2), la cui distribuzione sotto H0 e approssimabile con una N(0, 1) e p indica la stima

pooled di p sotto H0. p-value = 2P ((p2− p1−0)/√pq(1/n1 + 1/n2) > |zcamp||H0) = 2P (Z > 1.70497) =

0.0882.Valori utili: p2 = 0.53333, se2 = p2q2/n2+p1q1/n1 = 0.00324; p = ppooled = 0.48366,

√pq(1/n1 + 1/n2) =√

0.00327 = 0.05715.

Esercizio 3. Assunzioni: modello lineare yi = β0 + β1xi + ui, ui ∼ N(0, σ2), dove X = percentualeburro, Y = indice di gradimento.

(A) Stima per intervallo di σ. Pivot: σ2(n − 2)/σ2 la cui distribuzione e χ2(n − 2). Intervallo per σ2:[37.00097, 1602.90807]; intervallo per σ: [6.08284, 40.03633].

(B) Si deve calcolare l’indice R2 = dev(REGR)/dev(y) = 0.04658 e commentare.Calcoli e valori utili:

Sommayi 36 40 30 55 35 196ui -0.6 2.1 -9.2 14.5 -6.8 0y2i 1296 1600 900 3025 1225 8046u2i 0.36 4.41 84.64 210.25 46.24 345.9

da cui: n = 5, y = 39.2, dev(y) =∑ni=1 y

2i − ny2 = 362.8, dev(RES) =

∑ni=1 u

2i = 345.9, σ2 =

dev(RES)/(n− 2) = 115.3, dev(REGR) = dev(y)− dev(RES) = 16.9.

Esercizio 4.

(A)Lista campioni (n = 3) probabilita media mediana(6, 30, 33) 0.25 23 30(6, 30, 90) 0.25 42 30(6, 33, 90) 0.25 43 33(30, 33, 90) 0.25 51 33

da cui e possibile tabulare le distribuzioni della media e della mediana campionarie (tabella seguente).

(B)Lo stimatore piu efficiente e quello con MSE piu piccolo. Dalle distribuzioni campionarie costruite epossibile ricavare il prospetto di calcolo per la media, il bias, la varianza e quindi l’MSE dei due stimatori.

media medianax 23 42 43 51 x 30 33f(x) 0.25 0.25 0.25 0.25 1 f(x) 0.5 0.5 1xf(x) 5.75 10.5 10.75 12.75 39.75 xf(x) 15 16.5 31.5x2f(x) 132.25 441 462.25 650.25 1685.75 x2f(x) 450 544.5 994.5

µ = 39.75; E(media) = 39.75, bias(media) = 0, V (media) = 105.6875 MSE(media) = V (media) +bias(media)2 = 105.6875; E(mediana) = 31.5, bias(mediana) = −8.25, V (mediana) = 2.25MSE(mediana) =V (mediana) + bias(mediana)2 = 70.3125. E piu efficiente la mediana.

166

Page 167: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

84 Compito del 30.01.2008 (solo studenti PT)

84.1 Testo

Premessa: SENA e una societa che distribuisce energia elettrica.

Esercizio 1. Uno dei piani tariffari proposti da SENA per la clientela domestica prevede un sistema disconti sulla bolletta a seconda dei consumi. Tale sistema e riassunto nella seguente tabella (consumi abimestre espressi in kw).

fascia consumo (kw) < 270 [270, 330) [330, 360) ≥ 360sconto (in euro) 0 2 4 8

Si assuma che il consumo si distribuisca secondo una normale con media 290 e deviazione standard 68.(A) Determinare la percentuale di clienti in ciascuna delle 4 fasce di consumo.(B) Valutare l’ammontare totale degli sconti concessi assumendo un bacino di 151000 clienti.

Esercizio 2. Da circa 4 mesi SENA ha rivisto il proprio piano tariffario pubblicizzando che, mediamente,per i clienti non sarebbe cambiato niente. Molti cittadini hanno pero protestato. Un’agenzia apposita-mente incaricata ha allora raccolto due campioni casuali indipendenti di bollette, uno precedente e l’altrosuccessivo all’adeguamento tariffario, in modo da verificare se le cose stanno come dice SENA oppure se,come sostengono in molti, i costi sono mediamente aumentati.

Statistiche dimensione media campionaria√

varianza correttacosti prima 101 66 28costi dopo 121 71 41

(A) Chi ha ragione: SENA o chi protesta? Rispondere mediante il p-value commentando il risultato.(B) Relativamente alla variabilita dei costi, invece, c’e stato qualche cambiamento rispetto alla situazioneprecedente? (α = 0.1)

Esercizio 3. Di recente si e verificata una serie di guasti. Per cercare di capirne le ragioni, l’ing. Marinoha bisogno del valore di un certo indicatore, Y , al momento del guasto. Tale indicatore e pero didifficile rilevazione per cui sta facendo prove per vedere se e possibile ricavarlo, almeno con una certaapprossimazione, da grandezze piu facilmente misurabili. Utilizzando una di tali grandezze come variabileindipendente, l’ing. ha stimato un modello di regressione lineare semplice ricavando la seguente tabella:

valori misurati di y 144 133 132 192 226 222valori stimati di y 123 144 164 185 206 227

(A) Quali parametri del modello e possibile stimare dai dati? Fornirne una stima per intervallo (1−α =0.95).(B) La variabile indipendente utilizzata riesce a spiegare bene la y? Fornire una misura e commentare ilrisultato.

Esercizio 4. Da una variabile casuale X avente media µ e varianza σ2 vengono estratti due campionicasuali semplici in modo completamente indipendente. Il primo campione ha dimensione n1, mentre ilsecondo ha dimensione n2 con n1 < n2. Per stimare µ ci sono in ballo 4 stimatori: X1, X2, (X1 +X2)/2,(n1X1 + n2X2)/(n1 + n2).

(a) Quanto vale la distorsione di ciascuno dei 4 stimatori?(b) Fra i 4 stimatori qual e il piu efficiente? Argomentare la risposta.

84.2 Soluzioni

Esercizio 1. Notazione: X =’consumo a bimestre in kw’ ∼ N(µ = 290, σ = 68).

(A) La percentuale di clienti in una singola fascia e in pratica la relativa probabilita moltiplicata per 100.Considerando una generica fascia di estremi [a, b] abbiamo P (a ≤ X ≤ b) = P [(a− µ)/σ ≤ (X − µ)/σ ≤(b − µ)/σ) = P (z1 ≤ Z ≤ z2). Poiche conosciamo a, b, µ, σ e possibile calcolare z1 e z2 e completare ilconto mediante uso delle tavole.

167

Page 168: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Per ricavare il numero di clienti in ciascuna fascia occorre moltiplicare le probabilita calcolate sopraper il numero complessivo di clienti. Per ricavare lo sconto totale occorre moltiplicare lo sconti di ciascunafascia per il relativo numero di clienti e sommare.

fascia consumo (kw) < 270 [270, 330) [330, 360) ≥ 360 Totalesconto (in euro) 0 2 4 8probabilita 0.38433 0.33748 0.12654 0.15164 1% clienti 38.4 33.7 12.7 15.2 100n. clienti 58034.4 50959.3 19108.2 22898.1 151000sconto totale 0 101918.6 76432.6 183184.9 361536.1

Esercizio 2. Notazione: X1 =’costo vecchia bolletta’ ∼ N(µ1, σ1); X2 =’costo nuova bolletta’ ∼N(µ2, σ2) con campioni indipendenti.

(A) Test di H0 : µ2 − µ1 = 0 contro H1 : µ2 − µ1 > 0. Statistica test: (X2 − X1)/√S2

1/n1 + S22/n2

che sotto H0 e in base alla dimensione del campione si distribuisce, approssimativamente, come unaN(0, 1). Valore campionario della statistica test 1.07446, p-value = P ([X2 − X1]/

√S2

1/n1 + S22/n2 >

1.07446|H0) = 0.14131.

(B) Ipotesi: H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. Statistica test: S2

1/S22 , la cui distribuzione sotto

H0 e F (n1 − 1, n2 − 1). Valore campionario della statistica test 0.46639, da confrontare con la regione diaccettazione [0.72689, 1.3685] (α = 0.1).

Valori utili: s21 = 784, s2

2 = 1681,√s2

1/n1 + s22/n2 =

√21.65494 = 4.65349.

Esercizio 3. Assunzioni: modello lineare yi = β0 + β1xi + ui, ui ∼ N(0, σ2), dove X = variabileindipendente (quella di facile misura), Y = variabile dipendente (quella di difficile misura).

(A) I dati a disposizione si riferiscono esclusivamente ad yi e ad yi, per cui consentono solo di fareinferenza su σ. Infatti manca completamente (e non e neppure ricavabile) l’informazione campionariasulla variabile indipendente. Pivot: σ2(n − 2)/σ2 la cui distribuzione e χ2(n − 2). Intervallo per σ2:[184.86467, 4252.52082]; intervallo per σ: [13.59649, 65.21135]. (1− α = 0.95)

(B) L’indice in questione e R2 = dev(REGR)/dev(y) = 0.78703 da commentare.Calcoli e valori utili:

Sommayi 144 133 132 192 226 222 1049yi 123 144 164 185 206 227 1049ui 21 -11 -32 7 20 -5 0y2i 20736 17689 17424 36864 51076 49284 193073u2i 441 121 1024 49 400 25 2060

da cui: n = 6, y = 174.83, dev(y) =∑ni=1 y

2i − ny2 = 9672.83, dev(RES) =

∑ni=1 u

2i = 2060, σ2 =

dev(RES)/(n− 2) = 515, dev(REGR) = dev(y)− dev(RES) = 7612.83.

Esercizio 4. Notazione: X ∼ [µ, σ2]. Si puo rispondere ad entrambe le domande ricordando: che la mediacampionaria di un campione casuale semplice di dimensione n ha media µ e varianza σ2/n; le seguentiproprieta dei valori attesi E(c1X1 + c2X2) = c1E(X1) + c2E(X2), V (c1X1 + c2X2) = c21V (X1) + c22V (X2)(quest’ultima valida solo se X1 e X2 sono incorrelate; nel nostro caso lo sono in quanto i 2 campioniindipendenti).

(A) Sono tutti stimatori corretti per cui il loro bias e 0. Infatti: i primi due sono medie campionarie, percui E(X1) = µ, E(X2) = µ.E[(X1 +X2)/2] = 1/2E(X1) + 1/2E(X2) = µ/2 + µ/2 = µ.E[(n1X1+n2X2)/(n1+n2)] = n1/(n1+n2)E(X1)+n2/(n1+n2)E(X2) = n1/(n1+n2)µ+n2/(n1+n2)µ =µ.

(B) Lo stimatore piu efficiente e quello con MSE piu piccolo. Essendo corretti l’MSE coincide con lavarianza.I primi due sono medie campionarie, per cui V (X1) = σ2/n1, V (X2) = σ2/n2.

168

Page 169: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

V [(X1 +X2)/2] = 1/4V (X1) + 1/4V (X2) = 1/4σ2/n1 + 1/4σ2/n2 = σ2[1/n1 + 1/n2]/4.V [(n1X1 +n2X2)/(n1 +n2)] = [n1/(n1 +n2)]2V (X1) + [n2/(n1 +n2)]2V (X2) = [n1/(n1 +n2)]2σ2/n1 +[n2/(n1 + n2)]2σ2/n2 = σ2/(n1 + n2).Impostando un po’ di disequazioni si ottiene che V (X1) > V (X2) > V [(X1 + X2)/2] > V [(n1X1 +n2X2)/(n1 + n2)], per cui l’ultimo e il piu efficiente.

169

Page 170: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

85 Compito del 13.02.2008 (solo studenti PT)

85.1 Testo

Premessa: MONTESALUTE e un centro ospedaliero.

Esercizio 1. Il centro ospedaliero e convenzionato con un moderno day care, al quale i pazienti possonorecarsi i giorni seguenti alla dimissione dal reparto per ulteriori controlli e completare la degenza. Estato calcolato che le persone dimesse dal reparto di MEDICINA si recano al day care in media per 1.4giorni, contro una media di 0.81 giorni per quelle provenienti da CHIRURGIA. Assumendo che il 66%dei pazienti siano dimessi da MEDICINA ed il resto da CHIRURGIA e che il numero di giorni di accessoal day care si distribuisca secondo una Poisson.

(A) Calcolare la probabilita che, preso a caso un paziente, questo non si rechi al day care.(B) Si assuma, fra MEDICINA e CHIRURGIA, un totale di 24700 pazienti ricoverati all’anno e che ognipaziente si comporti in modo indipendente dagli altri. Specificare la distribuzione del numero totale dipazienti che in un anno si recano al day care calcolandone media e deviazione standard.

Esercizio 2. Per limitare l’accesso al servizio di PRONTO SOCCORSO di pazienti che non ne hannorealmente necessita, una recente legge regionale ha introdotto il pagamento di un ticket. La seguentetabella riporta alcuni dati campionari relativi al numero giornaliero di accessi al pronto soccorso prima edopo l’introduzione del ticket.

numero giorni media degli accessi al giorno√

varianza corretta degli accessi al giornosenza ticket 27 68.3 18.9con ticket 24 37.6 10.5

Assumendo che il numero giornaliero di ricoveri si distribuisca in modo approssimativamente normale:(A) Fornire stima puntuale e per intervallo (1 − α = 0.95) per valutare in che misura il numero mediogiornaliero di accessi e cambiato.(B) L’intervallo di cui al punto precedente si basa su una particolare assunzione circa le varianze senza econ ticket. Tale assunzione e giustificata? (α = 0.02)

Esercizio 3. Un paio di anni fa e stata effettuato un pesante riassetto del reparto di CHIRURGIA perridurre il rischio di infezioni, rischio ritenuto eccessivo in base ai dati raccolti. I due campioni a confronto,prima e dopo il provvedimento di riorganizzazione, hanno fornito i seguenti risultati:

Statistiche pazienti ricoverati di cui hanno contratto infezioneprima 2582 207dopo 1819 92

(A) Il riassetto ha avuto l’effetto sperato? (α = 0.05).(B) Calcolare la potenza del test di cui al punto precedente in corrispondenza di un’ipotesi alternativa diriduzione del tasso di infezione di -1.3 punti percentuali.

Esercizio 4. Il management sta monitorando il tasso di arrivo dei pazienti allo sportello di accettazione alfine di migliorare servizio e gestione del personale. Nella fascia oraria di maggiore accesso e‘ stato rilevatoil numero di pazienti che ogni due minuti si presenta allo sportello ottenendo le seguenti statistiche:

Arrivi (ogni 2’) 0 1 2 3 4 5 6 7 8Frequenza 1178 2865 3691 2923 1944 939 366 131 55

(a) Rappresentare graficamente la distribuzione di frequenza.(b) Calcolare e riportare correttamente sul grafico 25o, 50o e 75o percentile.

85.2 Soluzioni

Esercizio 1. Notazione: X =’giorni accesso al day care’; M =’dimesso da MEDICINA’, C =’dimessoda CHIRURGIA’.

170

Page 171: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) X|M ∼ Po(λM = 1.4), X|C ∼ Po(λC = 0.81), P (M) = 0.66, P (C) = 1 − P (M) = 0.34.P (non recarsi al day care) = P (X = 0) = P (X = 0|M)P (M) + P (X = 0|C)P (C) = 0.31401, doveP (X = 0|M) = 0.2466 e P (X = 0|C) = 0.44486 sono calcolati mediante la funzione di massa dellaPoisson.

(B) Ognuno dei pazienti puo decidere se recarsi o no al day care. La distribuzione di tale variabile eallora una Be(p = 0.68599) (vedi sopra). Il numero totale Y di coloro che si recano al day care segueallora una distribuzione Bi(n = 24700, p = 0.68599) che ha media E(Y ) = np = 16943.95 e deviazionestandard σ(Y ) =

√npq =

√5320.57 = 72.94.

Esercizio 2. Notazione: X1 =’numero accessi al giorno senza ticket’ ∼ N(µ1, σ1); X2 =’numero accessial giorno col ticket’ ∼ N(µ2, σ2).

(A) Stima puntuale per µ2 − µ1: x2 − x1 = −30.7. Intervallo per µ2 − µ1. Stante l’esigua dimensionecampionaria non rimane che usare il seguente pivot: [X2 − X1 − (µ2 − µ1)]/[sp

√1/n1 + 1/n2] la cui

distribuzione e T (n1 + n2 − 2). Intervallo per 1− α = 0.98: [−39.4573,−21.9427].

(B) Ipotesi: H0 : σ21/σ

22 = 1 contro H1 : σ2

1/σ22 6= 1. Statistica test: S2

1/S22 , la cui distribuzione sotto

H0 e F (n1 − 1, n2 − 1). Valore campionario della statistica test 3.24, da confrontare con la regione diaccettazione [0.38428, 2.67071] (α = 0.02).

Valori utili: s21 = 357.21, s2

2 = 110.25, sp =√

[s21(n1 − 1) + s2

2(n2 − 1)]/(n1 + n2 − 2) =√

241.29 =

15.53351, sp√

1/n1 + 1/n2 = 4.3578, tcamp = 2.0096.

Esercizio 3. Notazione: X1 =’paziente prima contrae infezione’ Be(p1), X2 =’paziente dopo contraeinfezione’ Be(p2).

(A) Test di H0 : p2 − p1 = 0 contro H1 : p2 − p1 < 0. Statistica test [(p2 − p1) − 0]/s0 che sotto H0

ha distribuzione approssimativamente N(0, 1) (per brevita abbiamo posto: p = stimatore pooled di p;s0 =

√pq(1/n1 + 1/n2)). Valore campionario della statistica test −3.84174 da confrontare con la regione

di rifiuto [−∞,−1.645] (α = 0.05).

(B) Calcolo potenza del test di cui sopra per H1 : p2 − p1 = −0.013. Indichiamo: valore critico =zcrit, −0.013 = a. γ = P (campione ∈ R|H1) = P ([(p2 − p1) − 0]/s0 < zcrit|H1) = P ((p2 − p1) <zcrits0|H1) = P ([(p2 − p1) − a]/s1 < (zcrits0 − a)/s1|H1) = P (Z < 0.04446|H1) = 0.51773, dove s1 =√p1q1/n1 + p2q2/n2.

Calcoli e valori utili: p1 = 0.08017, p2 = 0.05058, p = 0.06794, s0 =√

5.934e− 05 = 0.0077031,s1 =

√5.496e− 05 = 0.0074134.

Esercizio 4.(A) Disegno del diagramma ’a spaghetti’.

(B) Calcolo mediana e quartili che devono essere riportati sul grafico. Q1 = 1, Me = 2, Q3 = 3.Si illustra solo il calcolo di Q1: gli altri sono analoghi. Posizione di Q1: (N + 1) ∗ 0.25 = 3523.25. Con-trollando per le cumulate si ottiene che l’osservazione di posto 3523 ha modalita 1, mentre l’osservazionedi posto 3524 ha modalita 1 da cui il risultato.

Arrivi 0 1 2 3 4 5 6 7 8Freq. 1178 2865 3691 2923 1944 939 366 131 55Freq. cum 1178 4043 7734 10657 12601 13540 13906 14037 14092

171

Page 172: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

86 Compito del 21.04.2008 (solo studenti PT)

86.1 Testo

Premessa: Si parla di Fisco ed Agenzia delle Entrate (in breve, Agenzia).

Esercizio 1. L’Agenzia delle Entrate effettua ogni anno un certo numero di accertamenti fiscali neiconfronti dei professionisti. Oggetto dell’accertamento e l’ammontare di ricavi non dichiarato: si indichicon X il valore, in Euro, contestato dall’Agenzia al contribuente come mancata dichiarazione. Unaprocedura di accertamento puo andare incontro a due tipi di esiti: o a totale favore del contribuente, chein tal caso subisce una contestazione di ammontare X pari a zero (questo accade nel 32.8% dei casi);oppure a sfavore del contribuente, che in tal caso subisce una contestazione vera e propria per un certo Xpositivo (questa evenienza accade nella restante percentuale dei casi). Assumendo che, in questa secondaevenienza, X si distribuisca in modo Normale con media 9000 e deviazione standard 1300:

(A) Preso a caso un professionista oggetto di accertamento calcolare la probabilita che questo riceva unacontestazione per un ammontare non superiore a 10100 Euro.(B) Si sa che l’ammontare contestato ad un professionista oggetto di accertamento non supera 10100euro. Calcolare la probabilita che l’accertamento si sia chiuso a totale favore del contribuente.

Esercizio 2. Gli accertamenti effettuati sui piccoli professionisti con partita IVA fra 2004 e 2005 sonostati suddivisi in 2 gruppi, a seconda che quella professionale sia svolta come attivita unica o principaleoppure come attivita secondaria (ad esempio, perche l’attivita principale e quella di docente universitario).Da ciascuno dei due gruppi e stato estratto un campione casuale semplice che ha fornito i risultati intabella.

Accertamenti totali di cui condannati per evasioneAttivita principale 253 129Attivita secondaria 159 102

(A) La probabilita che un accertamento si evolva in una vera e propria condanna e la stessa in entrambii gruppi di contribuenti? Rispondere utilizzando il p-value.(B) Sfruttando le informazioni del campione di cui sopra, calcolare quanti contribuenti occorrerebbeinserire in ciascuno dei due campioni (attivita principale e attivita secondaria) per avere un intervallo diconfidenza per la probabilita di subire una contestazione di ampiezza 0.079 al livello di confidenza 0.98in ciascuno dei due gruppi.(C) Perche, pur avendo imposto la stessa ampiezza e lo stesso livello di confidenza, si ottengono risultatidiversi nei due gruppi? Argomentare, spiegando anche perche uno maggiore dell’altro.

Esercizio 3. L’Agenzia delle Entrate sta mettendo a punto un nuovo studio di settore ultra semplificato,dedicato ai professionisti titolari di partita IVA il cui volume di affari annuale e inferiore a 30000 Euro.Lo studio di settore in questione si basa su un solo input, il valore dei costi sostenuti nell’anno fiscale:in base a tale valore si vuole stimare l’ammontare (presunto) dei ricavi utilizzando opportunamente uncerto modello statistico. Allo scopo, l’Agenzia ha effettuato una rilevazione campionaria dalla quale sonostati ricavati i seguenti dati (costi e ricavi espressi in migliaia di Euro):

n media(costi) dev.st(costi) media(ricavi) dev.st(ricavi) correlazione(ricavi, costi)567 5005 2925 20036 6094 0.948

(A) Formulare il modello e stimarne tutti i coefficienti.(B) Un professionista, nell’anno fiscale ha dichiarato costi per 2200 Euro. L’accertamento dell’Agenzianei suoi confronti, si basa su un particolare intervallo, per i ricavi, calcolato in corrispondenza di quellivello dei costi: solo se i ricavi dichiarati dal professionista sono inferiori al minimo di detto intervalloscatta l’accertamento fiscale. Allo scopo, vi sembra piu appropriato l’intervallo di previsione o l’intervallodi stima? Motivare la risposta.(C) Effettuare il calcolo dell’intervallo di cui al punto precedente per 1− α = 0.99.

172

Page 173: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

86.2 Soluzioni

Esercizio 1. Notazione: C = ’contribuente subisce contestazione’; X =’importo contestato dall’Agenziadelle Entrate’. Allora: P (C) = 0.328, P (X = 0|C) = 1, X|C ∼ N(9000, 1300).

(A) Formula della probabilita marginale: P (X ≤ 10100) = P (X ≤ 10100|C)P (C)+P (X ≤ 10100|C)P (C) =0.86645.

(B) Formula di Bayes: P (C|X ≤ 10100) = P (X ≤ 10100|C)P (C)/P (X ≤ 10100) = 0.37856.

Calcoli e valori utili: P (X ≤ 10100|C) = P (Z ≤ 0.846) = 0.80127, P (X ≤ 10100|C) = 1, P (C) = 0.672,P (C) = 0.328.

Esercizio 2. Notazione: X1 =’professionista (attivita principale) riconosciuto evasore?’ ∼ Be(p1),X2 =’professionista (attivita secondaria) riconosciuto evasore?’ ∼ Be(p2). Campioni casuali sempliciindipendenti.

(A) Test di H0 : p1 − p2 = 0, contro H0 : p1 − p2 6= 0. Statistica test (sotto H0): (p1 − p2 −0)/√pq(1/n1 + 1/n2) la cui distribuzione e, approssimativamente, N(0, 1) e p e la stima pooled di

p. Valore campionario della statistica test zcamp = −2.6207, per cui p − value = 2P [(p1 − p2 −0)/√pq(1/n1 + 1/n2) > |zcamp||H0] = 2P (Z > 2.6207|H0) = 2 ∗ 0.00439 = 0.00878.

(B) Sfruttare il campione significa utilizzare p1 e p2 per dimensionare n1 ed n2. Per entrambi i gruppipossiamo usare la formula che lega n all’ampiezza dell’intervallo, ovvero A = 2z

√pq/n da cui si ricava

n = pq(2z/A)2. Applicandola ad entrambi si ricava n1 = 866.813 ≈ 867, n2 = 797.693 ≈ 798.

(C) Il diverso risultato dipende dal diverso valore di pq. Poiche la varianza dello stimatore p e pq/n,piu bassa e la valutazione di pq meno osservazioni sono necessarie per raggiungere una certa precisione(ampiezza) a parita di α.

Calcoli e valori utili: p1 = 129/253 = 0.5099, p2 = 102/159 = 0.6415, p = (p1n1 + p2n2)/(n1 + n2) =0.5607, q = 1− p = 0.4393,

√pq(1/n1 + 1/n2) =

√0.5607 = 0.050227, A = 0.079, α = 0.02, z = 2.3263.

Esercizio 3. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y = ricavi,X = costi.

(A) β1 = 1.9751, β0 = 10151, σ2 = 3775129.

(B) Sembra piu appropriato l’intervallo di stima, dato che l’accertamento deve mirare a fornire, in corri-spondenza del livello dei costi dichiarato 2200 Euro, una stima puntuale dei ricavi di quel professionista,non del valore medio.

(C) Livello di confidenza: 0.99. Intervallo di stima per y in corrispondenza di x0 = 2200: [9466, 19526].L’intervallo di previsione e invece [14204, 14788].

Valori e calcoli utili: n = 567, gl = (n− 2) = 565, dev(x) = nV ar(x) = 4851039375, dev(y) = nV ar(y) =

21056586012, codev(x, y) = corr(x, y)√dev(x)dev(y) = 9581195824, β1 = codev(x, y)/dev(x) = 1.9751,

β0 = y − β1x = 10151, σ2 = (dev(y) − β21dev(x))/(n − 2) = 3775129, stima y(x0) = β0 + β1x0 =

14496; varianza (stimata) per il calcolo dell’intervallo di stima = σ2[1/n + (x − x0)2 + 1] = 3787910.15,corrispondente standard error = 1946.26, varianza (stimata) per il calcolo del’intervallo di previsione= σ2[1/n+(x−x0)2] = 12781.05, corrispondente standard error = 113.05; entrambi gli intervalli (stima eprevisione) hanno la seguente struttura [stima− t s.e., stima+ t s.e.], dove stima = 14496, t = 2.5846(puo essere calcolato dalle tavole della Normale, visto l’n elevato), s.e. sta per i due standard errors.

173

Page 174: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

87 Compito del 18.06.2008 (solo studenti PT)

87.1 Testo

Premessa: Bunny Pizza e una societa che distribuisce pizze calde a domicilio su ordinazione telefonica.Alle pizze si possono abbinare anche bevande e/o gelati ma questi non vengono distribuiti separatamente.

Esercizio 1. Quante pizze vengono ordinate per ciascuna ordinazione? Per studiare questo aspetto,Bunny Pizza ha elaborato un campione casuale di ordinazioni ricavando la seguente tabella.

Pizze ordinate per ordinazione 1 2 3 4 5 6Numero ordinazioni 780 550 220 110 50 20

(A) Determinare media e deviazione standard della variabile d’interesse.(B) Bernoulli, Poisson, Normale, nessuna delle tre. Dovendo scegliere la distribuzione teorica piu adattaa rappresentare il fenomeno studiato, quale fra queste quattro opzioni vi sembra giusta? Argomentare larisposta.

Esercizio 2. Con riferimento al campione di cui all’esercizio precedente:

(A) Fornire una stima per intervallo del numero medio di pizze ordinate per ordinazione (1− α = 0.98).(B) Specificare le assunzioni utilizzate per rispondere al punto A, il pivot utilizzato e la sua distribuzionecampionaria.

Esercizio 3. Pizza Express ha in corso trattative per acquisire Bunny Pizza. A questo proposito, lastessa Pizza Express ha fatto svolgere una rilevazione per capire se vi sono differenze di gradimento, daparte della clientela, nei confronti delle due compagnie. La rilevazione, effettuata su due distinti campionicasuali semplici, ha fornito i risultati sintetizzati in tabella.

Societa n media varianza correttaPizza express 41 6.3 2.3Bunny Pizza 41 6.9 2.7

Specificando le assunzioni necessarie:(A) Le due compagnie differiscono in modo significativo in quanto a gradimento dei propri clienti? (α =0.05).(B) Il test di cui al punto precedente si basa su una particolare assunzione riguardante le deviazionistandard nei due gruppi? Specificare l’assunzione e sottoporla a test (α = 0.05).

Esercizio 4. X e una variabile casuale normale, avente media µ = −5 e varianza a σ = 10, da cui vieneestratto un campione casuale semplice di dimensione n = 4. Per stimare µ, la scelta e ristretta ai seguentistimatori:

T1 =X1 +X2 + 2X3

4T2 =

X1 +X2

2

(A) Ricavare quanto e‘ possibile dire sulla loro distribuzione campionaria.(B) Quale dei due stimatori e piu efficiente? Argomentare la risposta

87.2 Soluzioni

Esercizio 1.(A) media = 1.9364, deviazione standard = 1.1285. Calcoli in base al seguente prospetto.

xi 1 2 3 4 5 6 Sommani 780 550 220 110 50 20 1730xini 780 1100 660 440 250 120 3350x2ini 780 2200 1980 1760 1250 720 8690

da cui media = 3350/1730 = 1.9364, media quadratica2 = 8690/1730 = 5.0231, varianza = 5.0231 −1.93642 = 1.2734, deviazione standard =

√1.2734 = 1.1285.

174

Page 175: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Nessuma delle tre. Infatti: 1) Bernoulli nemmeno a parlarne; 2) Normale non va bene perche discretae molto asimmetrica a sinistra; 3) Poisson non va bene perche manca lo zero.

Esercizio 2. Assunzioni: X = numero ordinazioni ∼ (µ, σ2).

(A)(B) Stima per intervallo di µ: pivot (X −µ)/(s/√n) ≈ N(0, 1) in base al teorema del limite centrale;

intervallo per µ all’ 1− α = 0.98: [1.8733, 1.9995].

Calcoli e valori utili: n = 1730, x = 1.9364 s2 = 1.2741, s = 1.1288, z = 2.326, s/√n = 0.02714.

Esercizio 3. Assunzioni: X1 =’gradimento per Bunny Pizza’∼ N(µ1, σ21); X2 =’gradimento per Pizza

Express’∼ N(µ2, σ22). I campioni estratti dalle due variabili casuali sono indipendenti.

(A) Test di H0 : µ1−µ2 = 0 contro H1 : µ1−µ2 6= 0. In base alla dimensione del campione, relativamentebassa, si assume σ2

1 = σ22 e lo si chiama σ2. Variabile test: [(X1 −X2) − (µ1 − µ2)]/(sp

√1/n1 + 1/n2)

distribuita come T (n1 + n2 − 2). Sotto H0: [(X1 − X2) − 0]/(sp√

1/n1 + 1/n2)|H0 distribuita comeT (n1+n2−2). Regione di accettazione [−1.9901, 1.9901]; valore campionario della statistica test −1.7181.

(B) Come indicato, il test di cui al punto (A) si basa sull’assunzione σ21 = σ2

2 che puo essere sottopostaa test. Quindi test di H0 : σ2

1/σ22 = 1 contro H1 : σ2

1/σ22 6= 1. Variabile test: S2

1/S22σ

22/σ

21 distribuita

come F (n1− 1, n2− 1). Sotto H0: S21/S

22 |H0 distribuita come F (n1− 1, n2− 1). Regione di accettazione

[0.5333, 1.8752]; valore campionario della statistica test 0.8519.

Valori e calcoli utili: s2p = [s2

1(n1 − 1) + s21(n1 − 1)]/(n1 + n2 − 2) = 2.5, sp = 1.5811, sp

√1/n1 + 1/n2 =

0.3492;

Esercizio 4. Assunzioni: X ∼ (µ = −5, σ = 10). X = (X1, X2, X3, X4) campione casuale sempliceestratto da X.(A) I due stimatori proposti sono combinazioni lineari di X1, X2, X3, X4 e quindi di v.c. indipendentiaventi stesse media e varianza. Della loro distribuzione e possibile solo calcolare media e varianza in

base alle proprieta dei valori attesi. E(T1) =µ+ µ+ 2µ

4= µ = −5; E(T2) =

µ+ µ

2= µ = −5;

V (T1) =σ2 + σ2 + 22σ2

16=

6

16σ2 = 37.5; V (T2) =

σ2 + σ2

4=

2

4σ2 = 50.

(B) T1 e T2 sono ambedue corretti, quindi i loro MSE coincidono con le rispettive varianze. E preferibilequello con MSE piu piccolo e quindi T1.

175

Page 176: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

88 Compito del 02.07.2008 (solo studenti PT)

88.1 Testo

Premessa: La Confindustria sta studiando l’andamento del sistema economico nel prossimo futuro in basealle aspettative degli imprenditori. I dati utilizzati sono stati raccolti presso un campione di associatidurante la recente assemblea nazionale.

Esercizio 1. Come sara l’economia italiana nei prossimi 5 anni? Questo dipende, chiaramente, dacome evolvera l’intero sistema economico internazionale. I ricercatori hanno formulato 3 possibili scenariper l’economia internazionale: recessione, stasi, espansione. Secondo i dati raccolti, tali scenari hannoprobabilita, rispettivamente, 0.2, 0.49, 0.31. Si assuma che X, la variazione annuale media del PILitaliano nei 5 anni, abbia, nei tre scenari, distribuzione Normale con deviazione standard 0.92 e media,rispettivamente, −1.7, 0.4, 3.9.

(A) Determinare la probabilita che X sia inferiore a 1.5.(B) Se X risulta minore di 1.5 qual e la probabilita che lo scenario realmente realizzato sia quello di stasi?

Esercizio 2. Ad una domanda riguardante le aspettative per la propria impresa nei prossimi 5 anni, gliassociati dovevano rispondere con un voto da 1 (il peggiore) a 5 (il migliore). I dati raccolti sono statiriassunti nella seguente tabella.

Voto 1 2 3 4 5Frequenze relative 0.05 0.1 0.33 0.4 0.12

(A) Rappresentare graficamente i risultati ottenuti.(B) Sintetizzare la distribuzione fornendo, a propria scelta, un indice di tendenza centrale ed uno divariabilita.

Esercizio 3. Il voto espresso sulle aspettative per la propria impresa e stato raggruppato in base alsettore di attivita economica.

Settore osservazioni media varianza correttaManifatturiero 367 3.61 0.5776Servizi 373 3.74 0.9216

(A) In media, le aspettative differiscono in modo significativo nei due settori? Rispondere mediante ilp-value.(B) Perche le caratteristiche della variabile (vedi anche esercizio 2) rendono poco realistica l’assunzioneche la variabile voto abbia distribuzione normale? E perche, nonostante cio, e possibile utilizzare lavariabile test impiegata al punto (A)?

Esercizio 4. Un’altra analisi ha mirato a verificare se le aspettative dell’imprenditore (espresse mediantela variabile voto analizzata in precedenza) sono in qualche misura legate alla sua eta. Alcuni dati relativial settore manifatturiero sono sintetizzati in tabella.

n media(aspettative) dev.st(aspettative) media(eta) dev.st(eta) correlazione(aspettative, eta)337 3.603 0.607 50.345 9.22 −0.163

(A) Formulare un modello utile all’analisi e stimarne tutti i coefficienti.(B) Esiste una relazione significativa fra le aspettative e l’eta dell’imprenditore? (α = 0.01)

88.2 Soluzioni

Esercizio 1. Assunzioni e simbologia: R =’recessione’, S =’stasi’, E =’espansione’; X =’variazioneannuale media del PIL italiano nei 5 anni’; P (R) = 0.2, P (S) = 0.49, P (E) = 0.31; X|R ∼ N(µR =−1.7, σR = 0.92), X|S ∼ N(µS = 0.4, σS = 0.92), X|E ∼ N(µE = 3.9, σE = 0.92). Poniamo c = 1.5.

176

Page 177: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Formula della probabilita marginale: P (X < c) = P (X < c|R)P (R) + P (X < c|S)P (S) P (X <c|E)P (E) = 0.63456.

(B) Formula di Bayes: P (S|X < c) = P (X < c|S)P (S)/P (X < c) = 0.68268.

Calcoli e valori utili: P (X < c|R) = P (Z < 3.478) = 0.99975, P (X < c|S) = P (Z < 1.196) = 0.88408,P (X < c|E) = P (Z < −2.609) = 0.00454.

Esercizio 2.

(A) Diagramma a spaghetti per le frequenze relative.

(B) Visto che la variabile ha un range limitato (le modalita sono comprese in 1 - 5) non ci possono esserevalori anomali. Possiamo utilizzare media (= 3.44) e deviazione standard (= 0.9932). Benche menointeressanti, hanno senso anche mediana e scarto interquartile.

Prospetto di calcolo:Voto (xi) 1 2 3 4 5 SommaFrequenze relative (fi) 0.05 0.1 0.33 0.4 0.12 1xifi 0.05 0.2 0.99 1.6 0.6 3.44x2i fi 0.05 0.4 2.97 6.4 3 12.82

da cui σ2 = 12.82− 3.44 = 0.9864.

Esercizio 3. Assunzioni e simbologia: X1 =’aspettative di un imprenditore del manifatturiero’ ∼N(µ1, σ1), X2 =’aspettative di un imprenditore dei servizi’ ∼ N(µ2, σ2). Campioni casuali sempliciindipendenti.

(A) Test di H0 : µ1 − µ2 = 0, contro H0 : µ1 − µ2 6= 0. In base alle dimensioni campionarie elevate, lastatistica test e: [(X1 −X2) − (µ1 − µ2)]/

√s2

1/n1 + s22/n2 la cui distribuzione e, approssimativamente,

N(0, 1); sotto H0: [(X1 − X2) − 0]/√s2

1/n1 + s22/n2|H0 ≈ N(0, 1). Valore campionario della statistica

test zcamp = −2.0441, per cui p− value = 2P [[(X1−X1)− 0]/√s2

1/n1 + s22/n2 > |zcamp||H0] = 2P (Z >

2.0441|H0) = 2 ∗ 0.02047 = 0.04094.

(B) L’assunzione di normalita e forzata in quanto il voto e una variabile casuale discreta che puo assumeresolo 5 valori. E possibile utilizzare la variabile test di cui sopra in base al teorema del limite centraleapplicato a ciascuno dei due campioni, data la loro elevata dimensione.

Calcoli e valori utili:√s2

1/n1 + s22/n2 =

√0.004045 = 0.063597.

Esercizio 4. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y =’aspettative’,X =’eta’.

(A) β1 = −0.0107, β0 = 4.1433, σ2 = 0.3608.

(B) Test di H0 : β1 = 0 contro H1 : β1 6= 0. Variabile test [β1 − β1]/σ(β1) distribuita come T (n − 2).

Sotto H0: [β1 − 0]/σ(β1) distribuita come T (n − 2). Regione di accettazione: [−2.5758, 2.5758] (valoricalcolabili con le tavole della normale per l’elevata dimensione del campione); valore campionario dellavariabile test −3.0238.

Valori e calcoli utili: n = 337, dev(x) = nV ar(x) = 28647.8308, dev(y) = nV ar(y) = 124.1673,

codev(x, y) = corr(x, y)√dev(x)dev(y) = −307.4235, β1 = codev(x, y)/dev(x) = −0.0107, β0 = y−β1x =

4.1433, σ2 = (dev(y) − β21dev(x))/(n − 2) = 0.3608, σ(β1) =

√σ2/dev(x) =

√1.2594354276e− 05 =

0.003549.

177

Page 178: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

89 Compito del 03.09.2008 (solo studenti PT)

89.1 Testo

Premessa: La provincia di Roma dispone di un Osservatorio Congiunturale. Uno degli attuali temi ’caldi’riguarda il fronte prezzi, in particolare quello dei generi di prima necessita, come la pasta.

Esercizio 1. L’Osservatorio dispone dei dati relativi ai controlli effettuati dalla Camera di Commercio.Su un campione di 140 controlli presi in esame, in 29 sono stati riscontrati fenomeni di speculazione suiprezzi.

(A) Fornire stima puntuale e standard error (stima della deviazione standard dello stimatore utilizzato)per la probabilita di trovare un esercizio che specula sui prezzi.(B) Quale dimensione campionaria e necessaria affinche l’intervallo di confidenza, per la probabilita di cuisopra, abbia ampiezza 0.07 al livello di confidenza 0.98? Nel calcolo utilizzare l’informazione ricavabiledal campione a disposizione.

Esercizio 2. Si assuma che la probabilita che un esercizio speculi sui prezzi sia pari a 0.21. Si estragganocasualmente due esercizi, in modo indipendente, e sia Y il totale, fra questi, di quelli che speculano.

(A) Tabulare la funzione di massa di Y .(B) Disegnare la funzione di ripartizione di Y .

Esercizio 3. L’Osservatorio ha anche cercato di capire se le variazioni di prezzo hanno riguardato ilmercato in modo omogeneo oppure no. A tale scopo, dopo accurata analisi ha suddiviso il mercato indue segmenti: la pasta di marca e le altre. Per ciascuna referenza del campione ha calcolato la variazionepercentuale del prezzo nell’arco di un anno esatto (giugno 2007 - maggio 2008) riassumendo i dati raccoltinella seguente tabella.

Segmento dimensione campione media varianza correttaPasta di marca 11 42.2 112.5Altra pasta 12 44.7 141.1

Si assuma che la variazione percentuale del prezzo abbia distribuzione normale.(A) La variabilita della variabile rilevata e la stessa nei due segmenti (α = 0.02)?(B) In media, i due segmenti hanno visto variare i loro prezzi in modo analogo (α = 0.05)?

Esercizio 4. L’Osservatorio ha anche tentato di mettere in relazione il consumo di pasta con il suoprezzo (medio) al kg. I dati rilevati negli ultimi 6 mesi sono riassunti nella seguente tabella.

Mese gennaio febbraio marzo aprile maggio giugnoConsumo pasta (migliaia ton) 8.9 8.8 8.4 8.2 8.1 8Prezzo (medio) (centesimi al kg) 72 75 80 83 87 91

(A) Formulare un opportuno modello per mettere in relazione il consumo di pasta col livello dei prezzi.Stimarne i parametri.(B) Prevedere quale sarebbe il consumo di pasta se il prezzo (medio) salisse a 104 centesimi al kg, fornendoil valore puntuale e il relativo intervallo (α = 0.02).

89.2 Soluzioni

Esercizio 1. Assunzioni e simbologia: X =’l’esercizio specula’ ∼ Be(p).

(A) Stima puntuale di p: p = 0.2071; standard error: σ(p) = 0.034251.

(B) n = 726.

Valori e formule utili: p =∑ni=1 xi/n = 29/140 = 0.2071; σ(p) =

√pq/n =

√0.2071 ∗ 0.7929/140 =√

0.001173 = 0.034251; n = (2z/A)2pq = (2∗2.326/0.07)2 ∗0.2071∗0.7929 = 725.57 ' 726 dove α = 0.02.

178

Page 179: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Esercizio 2. In pratica, Y ∼ Bi(n = 2, p = 0.21).

(A) Y puo assumere solo valori 0, 1, 2; le rispettive probabilita possono essere calcolate utilizzando la

funzione di massa della binomiale.y 0 1 2f(y) 0.6241 0.3318 0.0441

(B) Grafico della funzione di ripartizione, tabulata come:y (−∞, 0) [0, 1) [1, 2) [2,∞)F (y) 0 0.6241 0.9559 1

Esercizio 3. Assunzioni e simbologia: X1 =’variazione prezzo pasta di marca’∼ N(µ1, σ1), X2 =’variazioneprezzo altra pasta’ ∼ N(µ2, σ2). Campioni casuali semplici indipendenti.

(A) Test di H0 : σ21/σ

22 = 1, contro H1 : σ2

1/σ22 6= 1. La statistica test e S2

1/S22σ

22/σ

21 la cui distribuzione

e F (n1 − 1, n2 − 1); sotto H0: S21/S

22 |H0 ∼ F (n1 − 1, n2 − 1). Valore campionario della statistica test

0.7973; zona di accettazione [0.2096, 4.5393].

(B) Test di H0 : µ1 − µ2 = 0, contro H0 : µ1 − µ2 6= 0. In base alle esigue dimensioni campionarieoccorre assumere σ1 = σ2, assunzione confortata dall’esito del test di cui al punto (A). La statistica

test e [(X1 − X2) − (µ1 − µ2)]/√s2p(1/n1 + 1/n2) la cui distribuzione e T (n1 + n2 − 2); sotto H0:

(X1 −X2)/√s2p(1/n1 + 1/n2) ∼ T (n1 + n2 − 2). Valore campionario della statistica test −0.5304; zona

di accettazione [−2.0739, 2.0739].

Calcoli e valori utili: n1 = 11, n2 = 12, x1 = 42.2, x2 = 44.7, s21 = 112.5, s2

2 = 141.1; s2p = [s2

1(n1 − 1) +

s22(n2 − 1)]/(n1 + n2 − 2) = 127.481;

√s2p(1/n1 + 1/n2) =

√22.2126 = 4.713.

Esercizio 4. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y =’consumi’,X =’prezzo (medio)’.

(A) β1 = −0.0509, β0 = 12.5404, σ2 = 0.00828.

(B) Previsione e relativo intervallo per y in corrispondenza di x0 = 104. Previsione: y0 = 7.2461. Perl’intervallo: pivot: [y0 − y0]/σ(y0) con distribuzione campionaria T (n− 2); intervallo: [y0 − tσ(y0), y0 +tσ(y0)] = [6.7446, 7.7476], dove per α = 0.02 e n− 2 = 4 si ha t = 3.7469.

Calcoli e valori utili:Mese gennaio febbraio marzo aprile maggio giugno Sommaxi 72 75 80 83 87 91 488yi 8.9 8.8 8.4 8.2 8.1 8 50.4x2i 5184 5625 6400 6889 7569 8281 39948y2i 79.21 77.44 70.56 67.24 65.61 64 424.06xiyi 640.8 660 672 680.6 704.7 728 4086.1

da cui: n = 6, x = 81.3333, y = 8.4, dev(x) =∑ni=1 x

2i − nx2 = 257.333, dev(y) =

∑ni=1 y

2i − ny2 = 0.7,

codev(x, y) =∑ni=1 xiyi − nxy = −13.1, σ = 0.090995, y0 = β0 + β1x0 = 7.2461; V (y0) = σ2[1/n+ (x−

x0)2/dev(x)] = 0.0179, σ(y0) = 0.1338.

179

Page 180: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

90 Compito del 18.12.2008 (solo studenti PT)

90.1 Testo

Premessa: Un’impresa sta effettuando un importante investimento in formazione del proprio personale.Il grado di preparazione dei dipendenti e valutato mediante prove scritte.

Esercizio 1. La parte del personale che ha ottenuto un risultato insufficiente alla prima prova, compostada 201 dipendenti, ha dovuto ripeterla una seconda volta. I risultati sono riassunti nella seguente tabella:

media media media della diffe- dev. st. dev. st. dev. st. della diffe-1a prova 2a prova renza 2a − 1a 1a prova 2a prova renza 2a − 1a

19.5 20.6 1 7.3 7.3 6.2

Assumendo che i punteggi ottenuti abbiano distribuzione normale:(A) In media, ci sono differenze significative fra i risultati delle due prove? Rispondere mediante il p-valuee commentare il risultato.(B) Fornire una stima per intervallo della deviazione standard dei punteggi ottenuti nella prima prova(1− α = 0.95).

Esercizio 2. Alcuni dirigenti hanno sollevato perplessita sul questionario, ritenendolo eccessivamentedifficile. Per questo motivo, quello della seconda prova e stato somministrato anche ad un campionecasuale semplice di funzionari, che hanno riportato i risultati di cui alla seguente tabella:

Funzionario F1 F2 F3 F4 F5 F6Punteggio 37.5 33.3 33.2 36.8 37.5 26.4

(A) Il punteggio dei funzionari, in media, e risultato significativamente migliore di quello dipendenti chehanno ripetuto la seconda prova? (α = 0.01)(B) Fornire una stima per intervallo della media dei punteggi ottenuti dai funzionari (1− α = 0.9).

Esercizio 3. L’analisi di due domande del questionario, ritenute di particolare interesse, ha fornito irisultati riassunti nella seguente tabella (i valori all’interno della tabella sono frequenze congiunte relative;il punteggio a ciascuna domanda e negativo se la risposta e sbagliata, 0 se viene lasciata in bianco, positivose e giusta):

Punteggi domanda 14Punteggi domanda 12 −1 0 7

−1 0.09 0 0.040 0.07 0.2 0.047 0.05 0.04 0.47

(A) Calcolare il coefficiente di correlazione fra i punteggi ottenuti nelle due domande.(B) Tabulare e rappresentare graficamente la distribuzione delle frequenze relative del punteggio alladomanda 14 per quelli che hanno risposto in modo corretto alla 12.

Esercizio 4. Ciascuna delle domande del questionario era composta da 6 possibili risposte, di cui unacorretta e le altre sbagliate.

(A) Calcolare il valore atteso del punteggio ottenuto ad una domanda se un dipendente da sempre unarisposta anche se a caso. In base al risultato del calcolo, in caso di dubbio e meglio tirare a caso o lasciarela risposta in bianco? Motivare.(B) Su un totale di 50 domande, quante risposte corrette riesce a dare un dipendente che da sempre unarisposta a caso? Se si pensa che questa quantita sia una variabile casuale calcolarne media e varianza; sesi pensa sia un valore fisso calcolarne il valore.

90.2 Soluzioni

Esercizio 1.

180

Page 181: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Test per dati appaiati (il campione e lo stesso nei due periodi considerati). Assunzioni: D =punteggio 2a prova − punteggio 1a prova ∼ N(µD, σ

2D). Ipotesi: H0 : µD = 0 contro H1 : µD 6= 0.

Statistica test (sotto H0): (D − 0)/(SD/√n), la cui distribuzione e approssimabile con una N(0, 1) dato

l’n sufficientemente elevato. p − value = 2P [(D − 0)/(SD/√n) > |zcamp||H0] = 2P (Z > 2.2867|H0) =

0.022214.Valori utili: d = 1, sD = 6.2, n = 201, sD/

√n = 0.4373, zcamp = (d− 0)/(sD/

√n) = 2.2867.

(B) Assunzioni: X = punteggio 1a prova ∼ N(µ, σ2). Pivot per σ2: (n − 1)S2/σ2 la cui distribuzionee χ2(n − 1). Intervallo per σ2: [(n − 1)s2/c2, (n − 1)s2/c1] = [44.2134, 65.4958] da cui intervallo per σ:[6.6493, 8.0929].Valori utili: s = 7.3, s2 = 53.29, n = 201, c1 = 162.73, c2 = 241.06.

Esercizio 2.

(A) Assunzioni: X = ’Punteggio del singolo funzionario’ ∼ N(µX , σ2); Y = ’Punteggio del singolo

dipendente’ ∼ N(µY , σ2); si assume che le due varianze siano uguali perche uno dei due campioni non

ha dimensione elevata. Ipotesi: H0 : µX − µY = 0 contro H1 : µX − µY > 0. Statistica test (sotto H0):

(X − Y − 0)/√S2p(1/nX + 1/nY ), la cui distribuzione e T (nX + nY − 2) (ma puo essere approssimata

con la N(0, 1)). Regione di rifiuto: (2.3263,∞); valore campionario della statistica test 4.5056.Valori utili: x = 34.1167, y = 20.6, sX = 4.2696, sY = 7.3, nX = 6, nY = 201, s2

p = 52.4349,√S2p(1/nX + 1/nY ) =

√9 = 3.

(B) Assunzioni: identiche a quelle del punto (A) (per comodita si toglie l’indiceX alla media). Pivot per µ:(X−µ)/(S/

√n) la cui distribuzione e T (n−1). Intervallo per µ: [x−ts/

√n, x+ts/

√n] = [30.6044, 37.629].

Valori utili: x = 34.1167, s = 4.2696, n = 6, t = 2.015.

Esercizio 3.

(A) Assunzioni: X =’punteggio domanda 12’; X = ’punteggio domanda 14’. ρ(X,Y ) = C(X,Y )/(σXσY ) =0.6415. Dal prospetto di calcolo sottostante: E(X) = 3.79, E(X2) = 27.57, V (X) = 13.2059, σX = 3.634,E(Y ) = 3.64, E(Y 2) = 27.16, V (Y ) = 13.9104, σY = 3.7297, E(XY ) = 22.49, C(X,Y ) = 8.6944.

x f(x) xf(x) x2f(x) y f(y) yf(y) y2f(y) xyf(x, y) y−1 0.13 −0.13 0.13 −1 0.21 −0.21 0.21 x −1 0 7

0 0.31 0 0 0 0.24 0 0 −1 0.09 0 −0.287 0.56 3.92 27.44 7 0.55 3.85 26.95 0 0 0 0

1 3.79 27.57 1 3.64 27.16 7 −0.35 0 23.03

(B)y −1 0 7

f(y|X = 7) 0.0893 0.0714 0.8393dove f(y|X = 7) = f(7, y)/fX(7).

Esercizio 4.

(A) Se un dipendente risponde a caso su 6 possibili risposte, avra un probabilita p = 1/6 = 0.1667 diindovinare (e quindi di prendere −1) e q = 0.8333 di sbagliare (prendendo quindi 7). Il valore atteso eallora E(X) = −1 ∗ 0.1667 + 7 ∗ 0.8333 = 0.3333. Il fatto che sia positivo spinge, in caso di incertezza, atirare a caso, piuttosto che a non rispondere.

(B) Il numero di risposte esatte ha una distribuzione Bi(n = 50, p = 0.1667). Il valore atteso e quindinp = 8.3333 e la varianza e npq = 6.9444.

181

Page 182: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

91 Compito del 15.01.2009 (solo studenti PT)

91.1 Testo

Premessa: Get the World (GTW) e una grossa societa che si occupa di viaggi e vacanze con una fortepresenza in Italia. Una ricerca si e focalizzata su Milano.

Esercizio 1. GTW ha cercato di capire se i profitti delle agenzie di viaggio sparse su territorio della cittasono in qualche modo legate alla quantita di personale che vi lavora. A livello operativo, questo potrebbefornire indicazioni per eventuali accorpamenti o, all’opposto, parcelizzazioni della rete di vendita. Irisultati (riferiti al 2008, utili in migliaia di euro) sono riassunti nella seguente tabella:

Agenzia N. 1 N. 2 N. 3 N. 4 N. 5 N. 6Personale 8 8 9 7 5 6

Utili 166 53 90 -24 -25 101

(A) Formulare un opportuno modello statistico che risponda alle esigenze illustrate nel testo. Stimarnetutti i parametri.(B) I profitti sono legati in modo significativo alla quantita di personale (α = 0.02)? Con riferimento aquanto illustrato nel testo, l’esito del test suggerisce qualche indicazione operativa?(C) Ricavare la devianza di regressione e indicare, in percentuale, quanta parte della variabilita dellavariabile dipendente e spiegata dal modello.

Esercizio 2. Con riferimento ai dati dell’esercizio precedente, si assuma che gli utili 2008 di ciascunaagenzia seguano una distribuzione approssimativamente normale.

(A) Fornire una stima per intervallo (α = 0.05) della media degli utili.(B) Fornire una stima puntuale e per intervallo (α = 0.05) della deviazione standard degli utili.(C) Nel procedimento per risolvere il punto A, sarebbe cambiato qualcosa se la deviazione standard fossestata nota? Nel procedimento per il punto B, sarebbe cambiato qualcosa se la media fosse stata nota?Spiegare in modo sintetico.

Esercizio 3. I clienti che hanno effettuato la loro vacanza 2008 con GTW sono stati ricontattati tele-fonicamente dopo il loro ritorno. E stato loro chiesto se sono soddisfatti della vacanza effettuata. Lerisposte sono state rielaborate nella seguente tabella (frequenze relative congiunte):

Tipo vacanzaSoddisfazione Mare Italia Arte Italia Altro Italia Europa Altro

Sı 0.34 0.22 0.11 0.06 0.15No 0.01 0.03 0.01 0.01 0.06

(A) Fornire tutti gli indici di tendenza centrale che hanno senso per la distribuzione della variabile ’tipovacanza’.(B) Si utilizzi adesso la definizione frequentista di probabilita. Le variabili ’Tipo vacanza’ e ’Soddisfazione’sono indipendenti? Se sı spiegare il perche. Se no, calcolare il valore che le frequenze congiunte relativeavrebbero dovuto avere in tale caso (e sufficiente calcolarne 5 a scelta).(C) Si utilizzi ancora la definizione frequentista di probabilita. Su 176 clienti estratti casualmente e inmodo indipendente, quanto vale la probabilita che gli insoddisfatti siano piu di 16?

91.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y =’utili’,X =’numero dipendenti’.

(A) β1 = 26.57, β0 = −130.25, σ2 = 5124.83.

(B) Test di H0 : β1 = 0 contro H1 : β1 6= 0. Statistica test (sotto H0): (β1−0)/σ(β1) che sotto H0 ha unadistribuzione T (n − 2). Valore campionario statistica test 1.2216; regione di accettazione per α = 0.02:[−3.7469, 3.7469]. Indicazione operativa: nessuna indicazione particolare.

182

Page 183: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C) dev(REG) = 7647.5103; R2 = 0.2717.

Calcoli e valori utili:Agenzia N. 1 N. 2 N. 3 N. 4 N. 5 N. 6 Sommaxi 8 8 9 7 5 6 43yi 166 53 90 -24 -25 101 361x2i 64 64 81 49 25 36 319y2i 27556 2809 8100 576 625 10201 49867xiyi 1328 424 810 -168 -125 606 2875

da cui: n = 6, x = 7.1667, y = 60.1667, dev(x) =∑ni=1 x

2i − nx2 = 10.833, dev(y) =

∑ni=1 y

2i −

ny2 = 28146.83, codev(x, y) =∑ni=1 xiyi − nxy = 287.83, dev(RES) = dev(y) − β1

2dev(x) = 20499.32,

σ2 = dev(RES)/(n−2) = 5124.83, σ = 71.59, V (β1) = σ2/dev(x) = 473.06, σ(β1) = 21.75, dev(REG) =dev(y)− dev(RES) = 7647.5103, R2 = dev(REG)/dev(y) = 0.2717.

Esercizio 2. Assunzioni: X = ’utile per agenzia’ ∼ N(µ, σ2).

(A) Pivot per µ: (X − µ)/(s/√n) la cui distribuzione e T (n − 1). Intervallo per µ con α = 0.05:

[x− ts/√n, x+ ts/

√n] = [−18.57, 138.9].

(B) Pivot per σ: (n − 1)S2/σ2 la cui distribuzione e χ2(n − 1). Intervallo per σ2 con α = 0.05: [(n −1)s2/c2, (n− 1)s2/c1] = [2193.4, 33862.41]; Intervallo per σ: [46.83, 184.02].(C) Se σ fosse stato noto, il pivot per µ sarebbe stato (X − µ)/(σ/

√n) con distribuzione N(0, 1). Se µ

fosse stato noto, il pivot per σ sarebbe stato nS2∗∗/σ

2 con distribuzione χ2(n). Di conseguenza sarebberocambiati entrambi i procedimenti.Valori utili: n = 6, x = 60.1667, s2 = 5629.37, s = 75.03, t = 2.5706, c1 = 0.8312, c2 = 12.8325.

Esercizio 3.

(A) La variabile in oggetto e qualitativa sconnessa. Di conseguenza ha senso solo la moda: MareItalia.(B) Affinche siano indipendenti e necessario che, in ogni casella, la congiunta sia pari al prodotto dellecorrispondenti marginali. Si vede subito che questo non e vero: quindi non sono indipendenti. Incaso di indipendenza le congiunte relative sarebbero esattamente il prodotto delle marginali relativecorrispondenti:

Tipo vacanzaSoddisfazione Mare Italia Arte Italia Altro Italia Europa Altro

Sı 0.308 0.22 0.1056 0.0616 0.1848 0.88No 0.042 0.03 0.0144 0.0084 0.0252 0.12

0.35 0.25 0.12 0.07 0.21 1

(C) Sia X =’cliente insoddisfatto’. Si nota immediatamente che X ∼ Be(p = 0.12) per cui il totale degliinsoddisfatti su 176 estrazioni indipendenti ha distribuzione Bi(n = 176, p = 0.12). Utilizzando l’appros-simazione N(µ = np = 21.12, σ2 = npq = 18.5856) della binomiale si ottiene: P (X > 16) = P (X ≥ 17) wapprossimazione normale con correzione per la continuita P (X ≥ 16.5) = P (Z > −1.0717) = 0.8581.

183

Page 184: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

92 Compito del 29.01.2009 (solo studenti PT)

92.1 Testo

Premessa: The Spangler Company e una societa estera attiva nel settore moda e sport che commercializzain punti vendita di media e grande dimensione. Ha in progetto di aprire punti vendita anche in Italia ela prima scelta e Bologna.

Esercizio 1. Una delle questioni affrontate dalla societa e la quella dei prezzi di vendita (che, in generale,e bene siano remunerativi ma non fuori mercato). Per studiare il legame del prezzo di un certo articolocon la dimensione del negozio, sono stati rilevati i seguenti dati presso un campione casuale semplice dipunti vendita della concorrenza:

Negozio Univ Deca Mart Rebo CultPrezzo vendita (euro) 300 295 216 371 218

Superficie negozio (migliaia di mq) 0.67 0.81 1.14 0.4 1.12

(A) Formulare un opportuno modello statistico che risponda alle esigenze illustrate nel testo. Stimarnetutti i parametri.(B) Il modello evidenzia la presenza di economie di scala? In altre parole, il prezzo di vendita tende adiminuire in modo significativo al crescere della dimensione? (α = 0.05)(C) Il punto vendita che si ha intenzione di aprire a Bologna e di 0.98 migliaia di mq. In corrispondenzadi tale valore, fornire previsione puntuale e per intervallo (α = 0.1) per il prezzo di vendita dell’articoloin questione.

Esercizio 2. Per studiare il tipo di clientela che frequenta il punto vendita aperto, Spangler ha consideratoi dati degli scontrini emessi durante i primi 12 mesi di apertura ottenendo la seguente tabella.

Importo (euro) [0, 40) [40, 100) [100, 150) [150, 350) [350, 630) [630, 1750)n. scontrini 5370 5770 2920 5940 3250 3340

(A) Rappresentare graficamente la distribuzione dell’importo per scontrino.(B) Fornire un opportuno indice di posizione e di variabilita dell’importo per scontrino.

Esercizio 3. La fascia tardo-pomeridiana dei giorni prefestivi e quella piu critica per quanto riguarda lanumerosita del personale presente nel punto vendita. La tabella che segue sintetizza i risultati di alcuneispezioni a campione per la variabile X = ”numero di persone in fila ad una cassa” in tale fascia.

Osservazioni Media Mediana Varianza Corretta199 1.87 2 2.07

Assumendo che la variabile X abbia una distribuzione di Poisson:(A) E vero (come affermava il responsabile del punto vendita prima che venissero effettuate le ispezioni)che, mediamente, il numero di persone in fila e superiore a 1.68? Impostare il problema come test delleipotesi (α = 0.1).(B) Calcolare la potenza del test effettuato al punto precedente in corrispondenza dell’ipotesi alternativa”il numero di medio di persone in fila e 1.81”.(C) Si assuma che: 2 casse siano aperte nel punto vendita; per ciascuna cassa il numero di persona in filaabbia una distribuzione di Poisson con parametro pari a quello stimato dal campione; il numero di personein fila a casse diverse siano indipendenti (tale assunzione non e realistica). Calcolare la probabilita che ilnumero totale di persone in fila alle casse sia superiore a 2.

92.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 +β1xi + εi, εi ∼ N(0, σ2), in cui Y =’prezzo vendita(euro)’, X =’superficie punto vendita (migliaia di mq)’.

(A) β1 = −205.71, β0 = 450.33, σ2 = 98.81.

184

Page 185: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Test di H0 : β1 = 0 contro H1 : β1 < 0. Statistica test (sotto H0): (β1 − 0)/σ(β1) che sotto H0 hauna distribuzione T (n− 2). Valore campionario statistica test −12.9416; regione di rifiuto per α = 0.05:(−∞,−2.3534).(C) Previsione e relativo intervallo per y in corrispondenza di x0 = 0.98. Previsione: y0 = 248.7317. Perl’intervallo: pivot: [y0 − y0]/σ(y0) con distribuzione campionaria T (n− 2); intervallo: [y0 − tσ(y0), y0 +tσ(y0)] = [236.8245, 260.6389], dove per α = 0.1 e n− 2 = 3 si ha t = 2.3534.

Calcoli e valori utili:Negozio Univ Deca Mart Rebo Cult Sommaxi 0.67 0.81 1.14 0.4 1.12 4.14yi 300 295 216 371 218 1400x2i 0.4489 0.6561 1.2996 0.16 1.2544 3.819y2i 90000 87025 46656 137641 47524 408846xiyi 201 238.95 246.24 148.4 244.16 1078.75

da cui: n = 5, x = 0.828, y = 280, dev(x) =∑ni=1 x

2i − nx2 = 0.3911, dev(y) =

∑ni=1 y

2i − ny2 = 16846,

codev(x, y) =∑ni=1 xiyi−nxy = −80.45, dev(RES) = dev(y)−β1

2dev(x) = 296.44, σ2 = dev(RES)/(n−

2) = 98.81, σ = 9.94, V (β1) = σ2/dev(x) = 252.67, σ(β1) = 15.9, y0 = β0 + β1x0 = 248.7317;

V (y0) = σ2[1/n+ (x− x0)2/dev(x)] = 25.6002, σ(y0) = 5.0597.

Esercizio 2.

(A) Istogramma da costruire in base alla tabella seguente.(B) Indice di tendenza centrale: Me = 136.9. Indice di variabilita: ∆Q = Q3 −Q1 = 294.78.Calcoli: Me = 100 + (13295 − 11140)/58.4 = 136.9. Q1 = 40 + (6647.5 − 5370)/96.17 = 53.28, Q3 =150 + (19942.5− 14060)/29.7 = 348.06.

Importo (euro) [0, 40) [40, 100) [100, 150) [150, 350) [350, 630) [630, 1750]frequenza 5370 5770 2920 5940 3250 3340ampiezza 40 60 50 200 280 1120densita 134.25 96.17 58.4 29.7 11.61 2.98

freq. % cumulata 5370 11140 14060 20000 23250 26590

Esercizio 3. Notazione: X = ’numero di persone in fila ad una cassa’ ∼ Po(λ).

(A) Ipotesi: H0 : λ = 1.68 contro H1 : λ > 1.68. Indichiamo 1.68 con λ0. Statistica test (sotto H0):(X −λ0)/

√λ0/n), la cui distribuzione sotto H0 e approssimabile con una N(0, 1). Regione di rifiuto per

α = 0.1: (1.282,∞); valore campionario della statistica test sotto H0: 2.0679.

(B) Calcolo potenza per H1 : λ = 1.81, α di cui sopra. Indichiamo 1.81 con λ1. La regione di rifiuto equella costruita sopra. Indichiamo il valore critico con z0, lo standard error sotto H0 con s0 =

√λ0/n,

quello sotto H1 con s1 =√λ1/n. γ = P (campione ∈ R|H1) = P [(X − λ0)/s0 > z0|H1] = P [X >

λ0 + z0s0|H1] = P [(X − λ1)/s1 > (λ0 + z0s0 − λ1)/s1|H1] = P (Z > −0.1284|H1) = 0.5511.Valori utili: X = 1.87, s0 =

√λ0/n =

√0.0084 = 0.0919, s1 =

√λ1/n =

√0.0091 = 0.0954.

(C) Xi =’numero di persone in fila alla cassa i’∼ Po(λi = 1.87), i = 1, . . . , 2. Quindi X =’totale

persone in fila alle casse’=∑ki=1Xi ∼ Po(λ =

∑ki=1 λi = 3.74), dove k = 2. P (X > 2) = 1 − P (X ≤

2) = 1 −∑2x=0 P (X = x) = 1 − 0.27873 = 0.72127 (Probabilita della Poisson necessarie nel calcolo:

P (X = 0) = 0.02375; P (X = 1) = 0.08884; P (X = 2) = 0.16613).

185

Page 186: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

93 Compito del 12.02.2009 (solo studenti PT)

93.1 Testo

Premessa: Spar-X e una catena di supermercati. Da alcuni anni ha istituito una tessera punti al finedi fidelizzare la clientela; fra l’altro, l’uso della tessera permette di ’tracciare’ il comportamento dellaclientela. I dati di cui ai testi seguenti si riferiscono ad un punto vendita in provincia di Brescia.

Esercizio 1. Dai dati a disposizione sono strati estratti due distinti campioni casuali: uno relativo acoloro che hanno usato la tessera punti, uno per coloro che non l’hanno usata. La seguente tabella riportale statistiche principali relative alla variabile ’importo speso’ (in Euro).

dimensione media√

varianza correttaHanno usato tessera 177 55.6 15.99

Non hanno usato tessera 177 52.4 15.88

Si assuma che la variabile d’interesse abbia distribuzione normale.(A) Gli importi spesi dalle due tipologie di clienti sono mediamente gli stessi? Effettuare il test mediantein p-value.Si assuma ora che: i valori dei parametri delle distribuzioni dell”importo speso’, nelle due popolazioni(coloro che usano e non usano la tessera) siano pari a quelli stimati dal campione; fra tutti i clienti soloil 35.6% faccia uso della tessera punti.(B) Preso a caso un cliente, calcolare la probabilita che egli spenda piu di 48 euro.(C) Sapendo che un cliente ha speso meno di 48 euro, qual e la probabilita che egli abbia esibito la tesserapunti?

Esercizio 2. La tessera punti permette di monitorare la frequenza con cui i clienti si recano ad effettuarela spesa. I dati relativi alla scorsa settimana sono riassunti nella seguente tabella (ogni giorno vienecontato una sola volta, anche se il cliente vi si e recato piu volte; sono stati esclusi i clienti con tesserapunti che nella settimana non hanno fatto la spesa).

Giorni spesa nella settimana 1 2 3 4 5 6Numero clienti 89 152 113 65 21 9

(A) Rappresentare graficamente la distribuzione della variabile ’numero di giorni di spesa nella settimana’.(B) Calcolare media e deviazione standard della variabile di cui al punto (A).

Esercizio 3. Uno dei comportamenti attesi a priori, a parita di altre condizioni, e che tanto piu spessoun cliente va a fare la spesa, tanto minore e la quantita che egli compra ciascuna volta. E vero? Ein che misura? A questo scopo sono stati valutati, con riferimento alla settimana, l’importo medio perciascuna spesa (’spesa totale / numero di spese’ nella settimana) e la frequenza con cui il cliente fa laspesa nell’arco della settimana. La seguente tabella riporta le principali statistiche (im = importo spesomedio, ns = numero spese) .

n media(ns) dev.st(ns) media(im) dev.st(im) correlazione(ns, im)202 2.436 1.147 64.41 17.73 −0.519

(A) Formulare un opportuno modello per studiare come l’importo della spesa dipende dal numero di voltein cui il cliente si reca a fare la spesa. Stimarne tutti i parametri.(B) Sottoporre a test se quanto atteso a priori, circa il diminuire edio della spesa all’aumentare dellafrequenza delle spese, e vero (α = 0.01).(C) Fornire l’intervallo di confidenza (α = 0.05) per la deviazione standard dei residui.

93.2 Soluzioni

Esercizio 1.

186

Page 187: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(A) Assunzioni: X =’importo speso da chi usa tessera’∼ N(µX , σ2X), Y =’importo speso da chi non usa

tessera’∼ N(µY , σ2Y ). Test di H0 : µX − µY = 0 contro H0 : µX − µY 6= 0 per campioni indipendenti.

Statistica test [X−Y −(µX−µY )]/√S2X/nX + S2

Y /nY (i due campioni hanno numerosita sufficientemente

elevata). Sotto H0 la statistica test e [X − Y − 0]/√S2X/nX + S2

Y /nY con distribuzione approssimata

N(0, 1). p − value = 2P [(X − Y − 0)/√S2X/nX + S2

Y /nY > |zcamp|] = 2P (Z > 1.8892) = 2 ∗ 0.0294 =0.0589. Calcoli e valori utili: nX = nY = 177, x = 55.6, y = 52.4 sX = 15.99, sY = 15.88 zcamp =

[x− y − 0]/√s2X/nX + s2

Y /nY = 1.8892,√s2X/nX + s2

Y /nY =√

2.8692 = 1.6939.

(B) (C) Assunzioni: U =’usa tessera’, N = ’non usa tessera’, X =’spesa’, P (U) = 0.356, P (N) = 0.644,X|U ∼ N(µU = 55.6, σU = 15.99), X|N ∼ N(µN = 52.4, σN = 15.88).(B) P (X > 48) = P (X > 48|U)P (U) + P (X > 48|N)P (N) = 0.6353.(C) P (U |X ≤ 48) = P (X ≤ 48|U)P (U)/(X ≤ 48) = 0.3097.Calcoli e valori utili: P (X > 48|U) = P (Z > −0.4753) = 0.6827, P (X > 48|N) = P (Z > −0.2771) =0.6091, P (X ≤ 48|U) = 0.3173, P (X ≤ 48|N) = 0.3909.

Esercizio 2.

(A) Diagramma a spaghetti: le ascisse sono modalita (giorni di spesa alla settimana), le ordinate sono lefrequenze (numero di clienti corrispondenti a ciascuna delle modalita).(B) M(X) = 1151/449 = 2.5635, M(X2) = 3603/449 = 8.0245, V (X) = M(X2) −M(X)2 = 1.4531,σ(X) = 1.2054.

xi 1 2 3 4 5 6 Sommani 89 152 113 65 21 9 449xini 89 304 339 260 105 54 1151x2ini 89 608 1017 1040 525 324 3603

Esercizio 3. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui Y =’importo spesa(media settimanale)’, X =’numero spese (settimanali)’.

(A) β1 = −8.0226, β0 = 83.9529, σ2 = 231.98.

(B) Test di H0 : β1 = 0 contro H1 : β1 < 0. Variabile test [β1 − β1]/σ(β1). Sotto H0: [β1 − 0]/σ(β1)distribuita come T (n − 2). Regione di rifiuto per α = 0.01: (−∞,−2.3451) valore campionario dellavariabile test −8.5868.

(C) Pivot: σ2(n− 2)/σ2 con distribuzione χ2(n− 2). Intervallo (α = 0.05) per σ2: [192.4644, 285.108] eper σ: [13.8732, 16.8851] (valori utili: c1 = 162.728, c2 = 241.0579).

Valori e calcoli utili: n = 202, dev(x) = nV ar(x) = 265.75, dev(y) = nV ar(y) = 63499.29, codev(x, y) =

corr(x, y)√dev(x)dev(y) = −2132.02, β1 = codev(x, y)/dev(x) = −8.0226, β0 = y − β1x = 83.9529,

σ2 = (dev(y)− β21dev(x))/(n− 2) = 231.98, σ(β1) =

√σ2/dev(x) =

√0.8729 = 0.93429.

187

Page 188: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

94 Compito del 21.04.2009 (solo studenti PT)

94.1 Testo

Premessa: CARS e una rete di concessionarie.

Esercizio 1. CARS valuta periodicamente in che misura la richiesta di un preventivo si trasformanell’ordine di una macchina nuova. La seguente tabella confronta la situazione rilevata nel 2007 conquella del 2008 su due diversi campioni di clienti (sono state considerate solo le auto per uso personale efamiliare).

2007 2008Preventivi richiesti 1069 1111Di cui trasformati in ordini 260 227

Assumendo che ogni preventivo sia richiesto indipendentemente dagli altri, si risponda alle seguentidomande.(A) Con riferimento al 2008, fornire la stima di massima verosimiglianza della probabilita che un preven-tivo si trasformi in un ordine. Valutare il corrispondente standard error.(B) Sempre con riferimento al 2008, calcolare la probabilita che, su 200 preventivi, quelli convertiti inordini siano almeno 38 (si assuma che la probabilita che un singolo preventivo venga convertito sia paria quella stimata sul campione).(C) La probabilita che un preventivo si trasformi in un ordine e significativamente cambiata fra 2007 e2008? Impostare il problema come test delle ipotesi ed effettuarlo mediante in p-value.

Esercizio 2. Una delle maggiori lamentele dei clienti di CARS riguarda il valore residuo della macchinaal momento in cui i clienti decidono di cambiarla. Anche se, ovviamente, questo dipende piu dallacasa madre che dalla concessionaria, un dipendente di CARS (sta preparando l’esame di statistica!) haugualmente effettuato una piccola valutazione. La tabella seguente mostra i dati di un campione dimacchine diesel dello stesso modello (valore residuo = valore al momento del cambio / prezzo di acquistoin %; eta espressa in anni).

Macchina 1 2 3 4 5 6Eta 2.3 2.2 2.7 3.9 1.2 1.7Valore residuo 44 55 48 32 67 54

(A) Formulare un opportuno modello che colleghi il valore residuo all’eta del veicolo e stimarne tutti iparametri.(B) Fornire l’intervallo di previsione al 0.05 relativamente al valore residuo di un’auto con un’eta di 4.5anni.(C) Stimare il valore dei residui corrispondenti alle prime due osservazioni del campione.

Esercizio 3. La seguente tabella mostra la distribuzione della variabile casuale doppia (X,Y ).

y = −1 y = 0 y = 1x = −1 0.109 0.262 0.043x = 1 0.295 0.088 0.203

(A) X e Y sono indipendenti? Se sı, argomentare la risposta, altrimenti calcolare le probabilita congiuntein caso di indipendenza e in corrispondenza delle marginali ricavabili dalla tabella.(B) Tabulare la distribuzione condizionata di Y |X = −1. Calcolarne media e deviazione standard.

94.2 Soluzioni

Esercizio 1.

(A) Assunzioni: X =’preventivo 2008 convertito?’∼ Be(p). Lo stimatore di massima verosimiglianza dip e p = X, stimatore corretto di p con varianza pq/n. Quindi: p = 227/1111 = 0.2043 e la stima di p e√pq/n =

√0.000146 = 0.0121 e lo standard error.

188

Page 189: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Assunzioni di cui sopra. Y = ’numero preventivi convertiti su 200’∼ Bi(n = 200, p = 0.2043).Usando l’approssimazione Normale N(np = 40.86, npq = 32.51) abbiamo P (Y ≥ 38) ≈ P (Y ≥ 37.5) =P (Z ≥ −0.589) = 0.72216 (≈ indica la correzione per la continuita).

(C) Assunzioni: X1 =’preventivo 2007 convertito?’∼ Be(p1), X2 =’preventivo 2008 convertito?’∼ Be(p2).Test di H0 : p1−p2 = 0 contro H1 : p1−p2 6= 0. Statistica test sotto H0: [X1−X2−0]/

√pq(1/n1 + 1/n2)

con distribuzione approssimata N(0, 1) (p = stimatore pooled del p comune sotto H0). Valore campionariodella statistica test sotto H0: zcamp = 2.1797; p − value = 2P [(X1 − X2 − 0)/

√pq(1/n1 + 1/n2) >

|zcamp||H0] = 2P [Z > 2.1797|H0] = 2 ∗ 0.014639 = 0.029277.

Calcoli e valori utili: n1 = 1069, n2 = 1111 x1 = 260/1069 = 0.2432, x2 = 227/1111 = 0.2043,p = (260 + 227)/(1069 + 1111) = 0.2234,

√pq(1/n1 + 1/n2) =

√0.000318 = 0.01785. zcamp = (x1 −

x2)/√pq(1/n1 + 1/n2) = 2.1797.

Esercizio 2. Modello di regressione lineare yi = β0 +β1xi+ui, ui ∼ N(0, σ2), in cui Y =’valore residuo’,X =’eta’.

(A) β1 = −11.93, β0 = 77.83, σ2 = 20.85.

(B) Intervallo di previsione per y in corrispondenza di x0 = 4.5 per α = 0.05. Pivot (y0 − y0)/σ(y0) condistribuzione T (n− 2). L’intervallo richiesto e allora [9.9288, 38.3941].

(C) Residui sono stimati con ui = yi − yi, dove yi = β0 + β1xi.

Calcoli e valori utili:Macchina 1 2 3 4 5 6 Sommaxi 2.3 2.2 2.7 3.9 1.2 1.7 14yi 44 55 48 32 67 54 300x2i 5.29 4.84 7.29 15.21 1.44 2.89 36.96y2i 1936 3025 2304 1024 4489 2916 15694xiyi 101.2 121 129.6 124.8 80.4 91.8 648.8ui -6.3975 3.4099 2.3727 0.6832 3.4845 -3.5528 0

da cui: n = 6, x = 2.3333, y = 50, dev(x) =∑ni=1 x

2i − nx2 = 4.293, dev(y) =

∑ni=1 y

2i − ny2 = 694,

codev(x, y) =∑ni=1 xiyi − nxy = −51.2, dev(RES) = dev(y)− β1

2dev(x) = 83.42, σ2 = dev(RES)/(n−

2) = 20.85, σ = 4.57, y0 = β0 + β1x0 = 24.16, σ2(y0) = σ2(1/n+(x0−x)2/dev(x)) = 26.28. σ(y0) = 5.13.

Esercizio 3.(A) Se fossero indipendenti, le frequenze congiunte sarebbero pari al prodotto delle marginali corrispon-denti, come dalla seguente tabella. Evidentemente X e Y non sono indipendenti.

y = −1 y = 0 y = 1x = −1 0.1673 0.1449 0.1018 0.414x = 1 0.2367 0.2051 0.1442 0.586

0.404 0.35 0.246 1

(B) Distribuzione di Y |X = −1 e prospetto di calcolo dei momenti richiesti come da seguente tabella.y -1 0 1

f(y|X = −1) 0.2633 0.6329 0.1039 1yf(y|X = −1) −0.2633 0 0.1039 −0.1594y2f(y|X = −1) 0.2633 0 0.1039 0.3671

da cui E(Y |X = −1) = −0.1594, V (Y |X = −1) = E(Y 2|X = −1) − E(Y |X = −1)2 = 0.3671 −−0.15942 = 0.3417, σ(Y |X = −1) =

√V (Y |X = −1) = 0.5846.

189

Page 190: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

95 Compito del 10.06.2009 (solo studenti PT)

95.1 Testo

Premessa: Si parla della Serie A di calcio e di una parte del business che vi ruota intorno.

Esercizio 1. La lega di serie A sta analizzando il business che ruota intorno ai gadgets (magliette,sciarpe ed altri oggetti) venduti con i marchi delle squadre di A: lo studio mira a capire in che misura ivolumi venduti sono legati al numero di tifosi. La tabella seguente riporta alcune statistiche calcolate sudati 2007 (V indica i volumi venduti presi in logaritmo, T il numero di tifosi presi in logaritmo; per purainformazione, si nota che la valutazione di entrambe le poste citate sconta forti elementi di incertezza).

n media(T ) media(V ) dev.st(T ) dev.st(V ) correlazione(V, T )16 13.39 16.38 1.51 1.44 0.81

Si formuli un opportuno modello che risponda alle esigenze espresse nel testo e si risponda alle seguentidomande.(A) Stimare tutti i parametri mediante il metodo dei minimi quadrati.(B) Indicare quanta parte della variabilita della variabile dipendente e spiegata dal modello considerato.(C) Sulla base del modello stimato, valutare il residuo per il dato campionario relativo alla SAMPDORIA(T = 13.7, V = 15.9). La squadra indicata si e comportata meglio o peggio di come previsto dal modello?(D) Costruire l’intervallo di previsione (α = 0.01) in corrispondenza del valore della variabile indipendenterilevato per la SAMPDORIA (punto (C) precedente).

Esercizio 2. Una rilevazione telefonica mira a valutare se vi siano differenze comportamento, relativa-mente all’acquisto di gadgets delle squadre di serie A, fra chi segue la propria squadra prevalentementeallo stadio e chi invece la vede soprattutto in pay-tv (i dati in tabella sono riferiti alla spesa in gadgetseffettuata in un anno, valori in euro).

intervistati media√

varianza correttatifosi da pay-tv 121 32.7 19.7tifosi da stadio 244 37.3 21.4

(A) Sottoporre a test l’ipotesi che non vi sia differenza, circa la spesa in gadgets, fra quando mediamentespendono le due categorie di tifosi (usare il p-value commentando in breve il risultato).(B) Determinare l’intervallo di confidenza per α = 0.02 riguardo alla deviazione standard della spesa ingadgets fra i tifosi da pay-tv.

Esercizio 3. I dati a disposizione hanno consentito di valutare che coloro che hanno visto almenouna partita di serie A nell’anno sono: il 63.2% fra i maschi, il 39.7% fra le femmine (la popolazione diriferimento e quella fra 18 e 65 anni). Considerando che in Italia, nella fascia di eta indicata, i maschisono il 47%:

(A) Presa a caso una persona che nell’anno ha visto almeno una partita di serie A, trovare al probabilitache questa sia una femmina.(B) Tabulare le probabilita congiunte dei 4 eventi ottenuti combinando il sesso con il fatto di avere vistoo no una partita di serie A nell’anno (seguire il seguente schema).

Almeno una partita vista nell’annoSesso Sı NoMaschio ?? ??Femmina ?? ??

95.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui y = V , X = T .

(A) β1 = 0.7725, β0 = 6.0369, σ2 = 0.815.

190

Page 191: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) R2 = 0.6561.

(C) Residuo SAMPDORIA: uSAMP = −0.7195. Essendo il residuo di segno negativo si e comportatapeggio di come previsto dal modello.(D) Intervallo di previsione per y in corrispondenza di x0 = 13.7 con α = 0.01. Pivot (y0− y0)/σ(y0) condistribuzione T (n− 2). L’intervallo cercato e [15.9336, 17.3053].

Valori e calcoli utili: n = 16, dev(x) = nV ar(x) = 36.4816, dev(y) = nV ar(y) = 33.1776, codev(x, y) =

corr(x, y)√dev(x)dev(y) = 28.1802, β1 = codev(x, y)/dev(x) = 0.7725, β0 = y − β1x = 6.0369, σ2 =

(dev(y)− β21dev(x))/(n− 2) = 0.815, dev(RES) = dev(y)− β2

1dev(x) = 11.4098, dev(REG) = dev(y)−dev(RES) = 11.4098, R2 = dev(REG)/dev(y) = 0.6561, (per brevita l’etichetta SAMP viene sostituita

con 0) y0 = y0 = β0 + β1x0 = 16.6195, u0 = y0 − y0 = −0.7195, V (y0) = σ2(1/n+ (x0 − x)2/dev(x)) =

0.0531 σ(y0) =

√V (y0) = 0.2304, α = 0.01, gl = n − 2 = 14, t = 2.9768, intervallo di previsione

[y0 − tσ(y0), y0 + tσ(y0)] = [15.9336, 17.3053]

Esercizio 2.

(A) Assunzioni: X1 =’Spesa dei tifosi da pay-tv’∼ N(µ1, σ21); X2 =’Spesa dei tifosi da stadio’∼ N(µ2, σ

22).

Test di H0 : µ1−µ2 = 0 contro H0 : µ1−µ2 6= 0. Statistica test sotto H0: (X1−X2−0)/√S2

1/n1 + S22/n2

con distribuzione approssimata N(0, 1) (n1 ed n2 sono infatti sufficientemente elevati). Valore campiona-rio della statistica test sotto H0: zcamp = −2.0401; p − value = 2P [(X1 −X2 − 0)/

√S2

1/n1 + S22/n2 >

|zcamp||H0] = 2P [Z > 2.0401|H0] = 2 ∗ 0.020672 = 0.041343.

(B) Assunzioni: quelle di cui sopra per X1 (cui per comodita si toglie il pedice 1). Pivot per σ2:(n− 1)S2/σ2 distribuito come χ2(n− 1). Intervallo per σ2 (con α = 0.02): [(n− 1)s2/c2, (n− 1)s2/c1] =[292.989943, 535.769016]; intervallo per σ: [17.11695, 23.14668].

Calcoli e valori utili: n1 = 121, n2 = 244 x1 = 32.7, x2 = 37.3, s1 = 19.7, s2 = 21.4,√s2

1/n1 + s22/n2 =√

5.084241 = 2.25483 zcamp = (x1−x2)/√s2

1/n1 + s22/n2 = −2.0401; n−1 = 120, c1 = 86.92, c2 = 158.95.

Esercizio 3. Assunzioni: M =’Maschio’, F =’Femmina’, A =’Almeno una partita vista in un anno’;P (A|M) = 0.632, P (A|F ) = 0.397, P (M) = 0.47.

(A) P (F |A) = P (A|F )P (F )/P (A) = 0.4146, dove P (A) = P (A|F )P (F ) + P (A|M)P (M) = 0.5074.

(B) Calcolo delle probabilita congiunte secondo la regola delle probabilita composte.

Almeno una partita vista nell’annoSesso Sı NoMaschio 0.297 0.173Femmina 0.2104 0.3196

191

Page 192: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

96 Compito del 24.06.2009 (solo studenti PT)

96.1 Testo

Premessa: Pan-One e una multinazionale del settore alimentare. Fra i diversi prodotti, ha anche unalinea di merendine per bambini (target: eta da scuola dell’obbligo).

Esercizio 1. Le merendine della Pan-One sono pubblicizzate da piu di un anno con gli stessi spot;attualmente e in fase di test la nuova campagna pubblicitaria. Un piccolo campione di bambini, che nonha mai visto ne il vecchio ne il nuovo spot, e stato selezionato per un giudizio comparato (la seguentetabella riporta le loro valutazioni convertite in punteggi).

Anna Bernardo Carolina Daniela Enrico FabioVecchio spot 5.5 8 6.6 4.1 6.5 7.1Nuovo spot 6.8 7 7.9 5.1 8.9 8.7

(A) Fornire una stima della differenza di gradimento fra nuovo e vecchio spot; calcolare anche lo standarderror (stima della deviazione standard dello stimatore utilizzato).(B) Il gradimento medio e significativamente diverso fra i due spot? (α = 0.05)(C) Calcolare il coefficiente di correlazione fra i giudizi espressi dai bambini nei confronti dei due spot.Il valore ottenuto supporta la procedura inferenziale utilizzata ai punti A e B?

Esercizio 2. Pan-One due anni fa ha lanciato in Australia una nuova merendina che ha riscosso un ottimosuccesso. Si sta pensando di commercializzarla anche in Italia ma non e detto che i gusti siano analoghi.Su un campione di merendine e stato aumentato (ogni volta di un ammontare diverso e prestabilito)il contenuto di zucchero (rispetto alle merendine ’australiane’) per valutare le reazioni rispetto al gustodei bambini italiani. Ciascuna merendina e stata somministrata ad un diverso bambino che ha espressoun giudizio; questo e stato a sua volta convertito in un punteggio. Dal modello di regressione applicatosono stati ricavati i risultati riportati in tabella (n = 28; per il significato dello standard error si veda ilprecedente esercizio).

β0 β1 σ2

stima 13.904 −0.2 0.71standard error 1.132 0.033 0.197

(A) Il gradimento tende a diminuire in modo significativo all’aumentare della quantita di zucchero (α =0.05)?(B) Determinare l’intervallo di confidenza per α = 0.02 per la deviazione standard del termine di erroredella regressione.(C) Dalle statistiche riportate ricavare media e devianza di x.

Esercizio 3. Uno studio ha documentato che i bambini della scuola elementare consumano in media2.19 merendine al giorno mentre per quelli della scuola media la media e di 1.23 merendine al giorno.Assumendo che il numero di merendine consumate in un giorno segua una distribuzione di Poisson e che,nella fascia di eta presa in esame, il 65.7% dei bambini frequenti le elementari:

(A) Preso a caso un bambino, calcolare la probabilita che questo consumi piu di 2 merendine al giorno.(B) Calcolare le probabilita a posteriori che un bambino consumi piu di 2 merendine al giorno.

96.2 Soluzioni

Esercizio 1. Assunzioni. Essendo il campione lo stesso per i due spot, i dati sono chiaramente appaiati,per cui: D = Y −X ∼ N(µD, σ

2D), dove Y =’Punteggio nuovo’, X =’Punteggio vecchio’.

(A) Stima: d = y − x = 1.1; corrispondente standard error: σ(d) = sd/√n = 0.4633.

(B) Test di H0 : µD = 0 contro H0 : µD 6= 0; statistica test (sotto H0) (D − 0)/(SD/√n) che la cui

distribuzione sotto H0 e T (n−1). Valore campionario della statistica test: 2.3742; regione di accettazioneper α = 0.05: [−2.5706, 2.5706].

192

Page 193: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(C) ρ(x, y) = cod(x, y)/√dev(x)dev(y) = 0.6642. Si tratta di un valore relativamente elevato che supporta

la non indipendenza fra le osservazioni relative alle due merendine.

Calcoli e valori utili:

Anna Bernardo Carolina Daniela Enrico Fabio Sommaxi 5.5 8 6.6 4.1 6.5 7.1 37.8yi 6.8 7 7.9 5.1 8.9 8.7 44.4x2i 30.25 64 43.56 16.81 42.25 50.41 247.28y2i 46.24 49 62.41 26.01 79.21 75.69 338.56

xiyi 37.4 56 52.14 20.91 57.85 61.77 286.07di 1.3 −1 1.3 1 2.4 1.6 6.6d2i 1.69 1 1.69 1 5.76 2.56 13.7

d =∑ni=1 di = 1.1, dev(d) =

∑ni=1 d

2i−nd = 6.44 s2

d = dev(d)/(n−1) = 1.288, sd = 1.1349; dev(x) = 9.14,dev(y) = 10, codev(x, y) = 6.35.

Esercizio 2. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui y =’Giudizio’,x =’Quantita di zucchero’.

(A) Test di H0 : β1 = 0 contro H0 : β1 < 0. Statistica test sotto H0: (β1 − 0)/se(β1) che sotto H0 hadistribuzione T (n− 2). Valore campionario della statistica test −6.0606; regione di rifiuto per α = 0.05:(−∞,−1.7056).

(B) Pivot σ2(n − 2)/σ2 la cui distribuzione e χ2(n − 2). Intervallo di previsione per σ2 con α = 0.02:[0.4045, 1.5133]; corrispondente intervallo per σ: [0.636, 1.2302] (dalle tavole c1 = 12.1981, c2 = 45.6417)

(C) se(β1) = σ/√dev(x) implica dev(x) = σ2/se(β1)2 = 651.9743, se(β0) = σ

√1/n+ x2/dev(x) implica

x =

√dev(x)(se(β0)2/σ2 − 1/n) = 33.9619.

Esercizio 3. Assunzioni: E =’scuola elementare’, M =’scuola media’.

(A) P (X > 2) = P (X > 2|E)P (E) + P (X > 2|M)P (M) = 0.2897.

(B) P (E|X > 2) = P (X > 2|E)P (E)/P (X > 2) = 0.8495, P (M |X > 2) = 1− P (E|X > 2) = 0.1505.

Calcoli e valori utili:

P (E) = 0.657, P (M) = 0.343, P (X = 0|E) = 0.1119, P (X = 1|E) = 0.2451, P (X = 2|E) = 0.2684,P (X > 2|E) = 0.3746, P (X = 0|M) = 0.2923, P (X = 1|M) = 0.3595, P (X = 2|M) = 0.2211,P (X > 2|M) = 0.1271. Le probabilita condizionate che precedono sono calcolate facendo uso dellafunzione di massa della Poisson.

193

Page 194: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

97 Compito del 08.07.2009 (solo studenti PT)

97.1 Testo

Premessa: Si parla di turismo nella provincia di Ravenna.

Esercizio 1. La provincia di Ravenna ha attivato un progetto di monitoraggio dei flussi turistici in ’temporeale’ (di norma i dati giungono con un ritardo di mesi ed abbastanza alla rinfusa) in collaborazione congli alberghi. Alcuni di questi collaborano attivamente al progetto, altri no o solo in modo parziale. Laseguente tabella di frequenza riporta il quadro della situazione nel 2008 (RSA = Residenze Turisticoalberghiere).

CollaboraEsercizio sı no o solo parzialmenteAlberghi 3-5 Stelle 135 280Alberghi 1-2 Stelle e RSA 71 103

(A) Fornire una stima della probabilita che un qualsiasi esercizio collabori al progetto della provincia;fornire anche lo standard error (stima della deviazione standard) dello stimatore utilizzato.(B) La probabilita che un esercizio collabori al progetto e significativamente diversa fra i due tipi diesercizi? Rispondere mediante il p-value.

Esercizio 2. Utilizzando i listini prezzi comunicati e i dati strutturali a disposizione, si cerca di capirese le variazioni di prezzo fra 2008 e 2009 sono in qualche misura correlate alla dimensione dell’esercizioin termini di posti letto. La seguente tabella riporta alcune statistiche (P = variazione percentuale deiprezzi; L = posti letto) per un piccolo campione di imprese.

osservazioni media(P ) media(L) dev.st(P ) dev.st(L) correlazione(P,L)32 2.265 112.913 0.867 41.855 −0.158

(A) Le variazioni di prezzo sono significativamente legate alla dimensione dell’esercizio (α = 0.02)?(B) Determinare l’intervallo di confidenza, per α = 0.01, relativamente alla deviazione standard deltermine di errore della regressione.(C) Scomporre la devianza della variabile dipendente nelle due componenti residua e di regressionefornendo delle 3 i rispettivi valori.

Esercizio 3. Sui dati pervenuti per il giugno 2009, e stato analizzato il numero di pernottamenti percliente, ricavando la seguente tabella di frequenza (per brevita, pernottamenti piu brevi di 2 giorni e piulunghi di 10 giorni sono stati rimossi).

Pernottamenti per cliente 2 3 4 5 6 7 8 9 10Frequenze relative 0.17 0.12 0.09 0.42 0.09 0.04 0.03 0.02 0.02

(A) Rappresentare graficamente la distribuzione delle frequenze relative del numero di pernottamenti percliente.(B) Calcolare media e varianza della variabile indicata.(C) Si assuma che ogni pernottamento costi esattamente 69 euro (assunzione ovviamente non realistica).E possibile calcolare media e varianza della variabile costo dei pernottamenti (durante l’intera vacanza)per cliente? Se sı effettuare il calcolo, altrimenti spiegare il perche.

97.2 Soluzioni

Esercizio 1.

(A) Assunzioni: X =’Collabora?’∼ Be(p). Stima di p: p = 0.3497; corrispondente standard error:0.01965.

(B) Assunzioni: X1 =’Esercizio a 3-5 stelle collabora?’∼ Be(p1); X2 =’Esercizio a 1-2 stelle o RSAcollabora?’∼ Be(p2). Test di H0 : p1 − p2 = 0 contro H0 : p1 − p2 6= 0; statistica test (sotto H0)

(p1−X2−0)/√pq(1/n1 + 1/n2) la cui distribuzione e, approssimativamente, N(0, 1). Valore campionario

194

Page 195: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

della statistica test: zcamp = −1.9212; p − value = 2P ((X1 −X2 − 0)/√pq(1/n1 + 1/n2) > |zcamp|) =

2P (Z > 1.9212) = 2 ∗ 0.02736 = 0.05471.

Calcoli e valori utili:p =

∑ni=1 xi/n = 206/589 = 0.3497; se(p) =

√pq/n =

√0.000386 = 0.01965. p1 = 135/415 = 0.3253;

p2 = 71/174 = 0.40805; p = (p1n1 + p2n2)/(n1 +n2) = 0.3497;√pq(1/n1 + 1/n2) =

√0.00186 = 0.04307.

Esercizio 2. Modello di regressione lineare yi = β0 + β1xi + εi, εi ∼ N(0, σ2), in cui y = P , X = L.

(A) Test di H0 : β1 = 0 contro H1 : β1 6= 0; Statistica test (sotto H0) (β1−0)/se(β1) la cui distribuzione eT (n−2). Valore campionario della statistica test: tcamp = −0.8764; regione di accettazione per α = 0.02:[−2.4573, 2.4573].(B) Pivot σ2(n − 2)/σ2 la cui distribuzione e χ2(n − 2). Intervallo di previsione per σ2 con α = 0.01:[0.437, 1.7012]; corrispondente intervallo per σ: [0.661, 1.3043] (dalle tavole c1 = 13.7867, c2 = 53.672)(C) dev(y) = 24.054, dev(Res) = 23.4536, dev(Reg) = 0.6005.

Valori e calcoli utili: n = 32, dev(x) = nV ar(x) = 56058.9128, dev(y) = nV ar(y) = 24.054, codev(x, y) =

corr(x, y)√dev(x)dev(y) = −183.4736, β1 = codev(x, y)/dev(x) = −0.0033, β0 = y− β1x = 2.6345, σ2 =

dev(Res)/(n− 2) = 0.7818, dev(Res) = dev(y)− β21dev(x) = 23.4536, dev(Reg) = dev(y)− dev(Res) =

0.6005.

Esercizio 3. Assunzioni: X =’numero pernottamenti per cliente’.

(A) Diagramma a spaghetti, con in ascisse le modalita e in ordinate le frequenze relative.

(B) M(X) = 4.6, V (X) = 3.28.

(C) Y = 69∗X. In base alle proprieta delle statistiche in oggetto si ricava che M(Y ) = 69∗M(X) = 317.4,V (Y ) = 692 ∗ V (X) = 15616.08.

Calcoli e valori utili:xi 2 3 4 5 6 7 8 9 10 Sommafi 0.17 0.12 0.09 0.42 0.09 0.04 0.03 0.02 0.02 1xifi 0.34 0.36 0.36 2.1 0.54 0.28 0.24 0.18 0.2 4.6x2i 4 9 16 25 36 49 64 81 100x2i fi 0.68 1.08 1.44 10.5 3.24 1.96 1.92 1.62 2 24.44

da cuiM(X) =

∑8i=1 xifi = 4.6, M(X2) =

∑8i=1 x

2i fi = 24.44, V (X) = M(X2)−M(X)2 = 3.28.

195

Page 196: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

98 Compito del 09.09.2009 (solo studenti PT)

98.1 Testo

Premessa: Una piccola banca locale, la BDL, e stata oggetto di acquisizione da parte un gruppo nazionaleil quale sta progressivamente procedendo alla sua integrazione.

Esercizio 1. Agli analisti del gruppo non appare chiaro se la produttivita delle filiali BDL (valutatacome valore aggiunto / costo del personale espresso in %) sia in una qualche modo legata con la lorodimensione (misurata mediante il costo del personale stesso). La tabella seguente riporta i dati 2008.

Filiale 1 2 3 4 5Produttivita 4.7 4.7 2.8 6 5.3

Costo personale 590 590 320 450 360

(A) Formulare un opportuno modello che risponda alle esigenze degli analisti. Stimarne i parametri.(B) La produttivita varia in modo significativo con la dimensione? (α = 0.05).(C) Fornire l’intervallo di confidenza (α = 0.05) per la deviazione standard della componente residua.(D) Calcolare residui di regressione per le prime due osservazioni.

Esercizio 2. L’organizzazione BDL e stata oggetto di revisione al fine di aumentarne la produttivita.I dati della tabella (valori di produttivita per addetto di cui si omette l’unita di misura) confrontano leperformances delle diverse filiali prima e dopo tale revisione.

Filiale 1 2 3 4 5Produttivita ante riorganizzazione 6.1 5.8 5.6 5.3 8.1Produttivita post riorganizzazione 5.5 6.2 4 5.6 7.2

(A) La revisione organizzativa ha risultati in termini di miglioramento della produttivita? (α = 0.01).(B) Nella procedura di cui al punto (A), cosa sarebbe cambiato se tutti quei parametri che e statonecessario stimare per poter calcolare lo standard error utilizzato nella statistica test fossero stati noti?Effettuare i relativi calcoli assumendo che i valori dei parametri in oggetto siano pari alle stime.

Esercizio 3. Di quando in quando, per i motivi piu svariati qualche cliente intenta una causa contro labanca. Si assuma che, ogni anno, ciascuno dei clienti che ha un conto corrente di tipo professionale intentiuna causa con probabilita 0.021, mentre per ciascuno clienti avente un conto corrente di tipo personalefa causa con probabilita 0.007. Su una popolazione di conti correnti fatta da 4600 professionali e 8000personali e assumendo indipendenza di comportamento fra i correntisti:

(A) In totale, in un anno, quante cause si attendono mediamente? Con quale deviazione standard?(B) Determinare l’intervallo, simmetrico rispetto alla media, per il totale di cause intentate in un anno,che include il 98% di probabilita.

98.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + ui, ui ∼ N(0, σ2), in cui Y =’produttivita’,X =’costo personale’.

(A) β1 = 0.00304033, β0 = 3.2954, σ2 = 1.6911.

(B) Test di H0 : β1 = 0 contro H0 : β1 6= 0. La statistica test, sotto H0, e (β1 − 0)/σ(β1) condistribuzione T (n − 2). Valore campionario della statistica test: 0.5891; regione di accettazione perα = 0.05: [−3.1824, 3.1824].

(C) Pivot per σ2: (n − 2)σ2/σ2 la cui distribuzione e χ2(n − 2); intervallo per σ2 con α = 0.05:[0.5427, 23.5094]; corrispondente intervallo per σ: [0.7367, 4.8486] (c1 = 0.2158, c2 = 9.3484).

(D) I residui sono stimati con ui = yi − yi, dove yi = β0 + β1xi.

Calcoli e valori utili:

196

Page 197: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

Filiale 1 2 3 4 5 Sommaxi 590 590 320 450 360 2310yi 4.7 4.7 2.8 6 5.3 23.5x2i 348100 348100 102400 202500 129600 1130700y2i 22.09 22.09 7.84 36 28.09 116xiyi 2773 2773 896 2700 1908 11050yi 5.09 5.09 4.27 4.66 4.39 23.5ui −0.39 −0.39 −1.47 1.34 0.91 0

da cui: n = 5, x = 462, y = 4.7, dev(x) =∑ni=1 x

2i − nx2 = 63480, dev(y) =

∑ni=1 y

2i − ny2 = 5.66,

codev(x, y) =∑ni=1 xiyi−nxy = 193, dev(RES) = dev(y)−β2

1dev(x) = 5.0732, σ2 = dev(RES)/(n−2) =

1.6911, σ = 1.3004, σ(β1) =√σ2/dev(x) =

√2.66394e− 05 = 0.0052.

Esercizio 2. Assunzioni. Essendo il campione lo stesso per i due spot, i dati sono appaiati, percui: D = X − Y ∼ N(µD, σ

2D), dove X =’produttivita post riorganizzazione’, Y =’produttivita ante

riorganizzazione’.

(A) Test di H0 : µD = 0 contro H0 : µD > 0. La statistica test, sotto H0, e (D − 0)/(SD/√n) con

distribuzione T (n− 1). Valore campionario della statistica test: −1.2765; regione di rifiuto per α = 0.01:[3.7469,∞).

(B) La statistica D utilizzata al punto (A) ha come standard error sD/√n, dove sD serve a stimare σD.

Se quest’ultimo fosse stato noto, la statistica test (sotto H0) sarebbe stata (D − 0)/(σD/√n) che la cui

distribuzione sotto H0 e N(0, 1). Valore campionario della statistica test: −1.2765; regione di rifiuto perα = 0.01: [2.3263,∞).

Calcoli e valori utili:Filiale 1 2 3 4 5 Sommadi −0.6 0.4 −1.6 0.3 −0.9 −2.4d2i 0.36 0.16 2.56 0.09 0.81 3.98

da cui: n = 5, d = −0.48, dev(d) =∑ni=1 d

2i − nd

2= 2.828, sD =

√0.707 = 0.8408, sD/

√n = 0.376.

Esercizio 3. Assunzioni: A =’contro corrente di tipo professionale’, B =’contro corrente di tipo persona-le’; XA =’cliente tipo A fa causa?’∼ Be(pA = 0.021), XB =’cliente tipo B fa causa?’∼ Be(pB = 0.007);comportamenti dei correntisti indipendenti; nA = 4600, nB = 8000.

(A) YA =’cause totali da clienti tipo A’∼ Bi(nA, pA), YB =’cause totali da clienti tipo B’∼ Bi(nB , pB),cause totali = YA+YB . E(YA+YB) = E(YA)+E(YB) = nApA+nBpB = 96.6+56 = 152.6; V (YA+YB) =V (YA) + V (YB) = nApAqA + nBpBqB = 94.5714 + 55.608 = 150.1794 per l’indipendenza; σ(YA + YB) =12.2548.

(C) Dati i valori elevati di nA ed nB possiamo approssimare le due Bi di cui sopra con altrettanteN indipendenti e, quindi, la loro somma con una N(µ = 152.6, σ = 12.2548). L’intervallo e allora:[µ− σz, µ+ σz] = [124.09, 181.11], dove z = 2.3263 (α = 0.02)

197

Page 198: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

99 Compito del 16.12.2009 (solo studenti PT)

99.1 Testo

Premessa: Un’associazione di amministratori di condominio e una di consumatori hanno commissionatoinsieme una rilevazione campionaria al fine di conoscere e valutare aspetti non del tutto noti del rapportofra amministratori e condomini.

Esercizio 1. Nella rilevazione sono stati raccolti elementi per poter calcolare la dimensione media deicondomini amministrati da ciascun amministratore (in pratica numero appartamenti / numero condo-mini); inoltre e stato chiesto a ciascun amministratore di esprimere un punteggio sul grado di rissositacomplessivamente percepito circa i condomini da essi amministrati (0 = situazione assolutamente tran-quilla; 10 = situazione da ricovero). Il campione in esame (riferito a centri da 50-mila a 200-mila abitantidel centro-nord Italia) e composto da 82 unita; alcune statistiche sono riportate nella seguente tabella.

medie varianze-covarianze Dimensione RissositaDimensione 25.8 Dimensione 75.9 −10.587

Rissosita 4.79 Rissosita −10.587 3.34

Interessa valutare se il grado di rissosita percepito dagli amministratori e in qualche misura legato alladimensione media dei condomini amministrati.(A) Formulare un modello statistico che risponda alle esigenze espresse. Stimarne i parametri.(B) La rissosita dipende in modo significativo dalla dimensione? (α = 0.01).(C) Scomporre la devianza della variabile dipendente nelle sue componenti (di regressione e residua)fornendone i valori. Quale indicazione utile fornisce tale scomposizione?(D) Fornire l’intervallo di previsione al 1− α = 0.99 per la variabile dipendente in corrispondenza di unvalore 29.81 della variabile indipendente.

Esercizio 2. X e Y sono due variabili casuali. Si sa che: X ha media 5.4 e varianza 4.57; Y ha media8.4 e varianza 4.99; sono indipendenti e ciascuna delle due ha distribuzione normale.

(A) Si calcolino le probabilita congiunte degli eventi riportati a margine della seguente tabella:

Y ≤ 11.2 Y > 11.2X ≤ 5.2X > 5.2

(B) Si estraggono da X e da Y due campioni casuali semplici indipendenti: quello di X ha dimensione45; quello di Y ha dimensione 26. Indicare la distribuzione di X − Y , valore dei parametri compreso.

Esercizio 3. Una rilevazione grossolanamente simile a quella dell’esercizio (1) e stata fatta anche suicondomini. Ad un campione casuale semplice di intervistati e stato loro chiesto se si ritengono soddisfatti(molto o abbastanza) del loro amministratore. Fra i condomini che abitano in piccoli condomini (≤ 15appartamenti), gli intervistati sono stati 1062 di cui il 49.5% si e detto soddisfatto; fra i condomini cheabitano in medio grandi condomini (gli altri), gli intervistati sono stati 892 di cui il 45.7% si e dettosoddisfatto.

(A) La proporzione di condomini soddisfatti e significativamente diversa nei due gruppi di intervistati?Rispondere mediante il p-value.(B) Se le dimensioni dei due campioni, invece di quelle riportate sopra, fossero state rispettivamente 9 e12 sarebbe cambiato qualcosa nella procedura di test? Spiegare senza fare calcoli.

99.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + ui, ui ∼ N(0, σ2), in cui Y =’grado dirissosita’, X =’dimensione media’.

(A) β1 = −0.13949, β0 = 8.3887, σ2 = 1.9098.

198

Page 199: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(B) Test di H0 : β1 = 0 contro H0 : β1 6= 0. La statistica test, sotto H0, e (β1 − 0)/se(β1) condistribuzione T (n − 2). Valore campionario della statistica test: −7.9627; regione di accettazione perα = 0.01: [2.6387,−2.6387].

(C) dev(y) = 273.88, dev(REGR) = 121.0927, dev(RES) = 152.7873. R2 = 0.4421, per cui il modellospiega il 44.21% della variabilita della variabile dipendente.

(D) Intervallo di previsione al 1− α = 0.99 per y in corrispondenza di x0 = 29.81: [3.7874, 4.674].

Calcoli e valori utili:n = 82, x = 25.8, y = 4.79, dev(x) = var(x)n = 6223.8, dev(y) = var(y)n = 273.88, codev(x, y) =

cov(x, y)n = −868.13; dev(RES) = dev(y)− β21dev(x) = 152.7873; β1 = codev(x, y)/dev(x) = −0.13949,

β0 = y − β1x = 8.3887, σ2 = dev(RES)/(n − 2) = 1.9098, σ = 1.382; se(β1) =√σ2/dev(x) =√

0.000306861 = 0.0175, dev(REGR) = dev(y) − dev(RES) = 121.0927, R2 = dev(REGR)/dev(y) =

0.4421; y(x0) = β0 + β1x0 = 4.2307, se(y(x0)) = σ√

1/n+ (x− x0)2/dev(x) = 0.168, t = 2.63869.

Esercizio 2. Assunzioni. X ∼ N(µX = 5.4, σ2X = 4.57), Y ∼ N(µY = 8.4, σ2

Y = 4.99) indipendenti.

(A) Essendo indipendenti vale P (X ≤ 5.2, Y ≤ 11.2) = P (X ≤ 5.2)P (Y ≤ 11.2); allo stesso modoper le altre caselle. Per il fatto che la distribuzione e normale con i parametri specificati si ottieneP (X ≤ 5.2) = 0.46273, P (Y ≤ 11.2) = 0.89498, da cui

Y ≤ 11.2 Y > 11.2X ≤ 5.2 0.41413 0.0486X > 5.2 0.48084 0.05642

(B) X ∼ N(µX , σ2X/nX), Y ∼ N(µY , σ

2Y /nY ) indipendenti, per cui X−Y ∼ N(µX−µY = −3, σ2

X/nX +σ2Y /nY = 0.29348) dove nX = 45, nY = 26.

Esercizio 3. Assunzioni: X =’condomino in piccolo condominio soddisfatto’∼ Be(pX), Y =’condominoin medio-grande condominio soddisfatto’∼ Be(pY ).

(A) Test di H0 : pX − pY = 0 contro H1 : pX − pY 6= 0; statistica test sotto H0: [(X − Y ) −0]/√p(1/nX + 1/nY ) la cui distribuzione e, approssimativamente, N(0, 1) in base alle dimensioni campio-

narie sufficientemente elevate; valore campionario della statistica test sotto H0: zcamp = 1.6751; p-value

= 2P ([(X − Y )− 0]/√pq(1/nX + 1/nY ) > |zcamp||H0) = 2P (Z > 1.6751|H0) = 2 ∗ 0.04696 = 0.09392.

(B) Se le dimensioni dei due campioni, invece di quelle riportate sopra, fossero state rispettivamente 9 e12 la procedura di test utilizzata non sarebbe stata legittima, dato che l’approssimazione normale delladistribuzione della statistica test risulta valida, per il teorema del limite centrale, solo caso di dimensionicampionarie sufficientemente elevate.

Calcoli e valori utili:nX = 1062, nY = 892, x = 0.495, y = 0.457, p = (xnX + ynY )/(nX + nY ) = 933.334/1954 = 0.4777,√pq(1/nX + 1/nY ) =

√0.000515 = 0.02269.

199

Page 200: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

100 Compito del 27.01.2010

100.1 Testo

Premessa: TechnoHouse e una societa di intermediazione immobiliare attiva nel centro-nord Italia.

Esercizio 1. TechnoHouse sta mettendo in piedi una procedura “oggettiva” per una prima valutazione“automatica” del valore degli appartamenti in funzione della loro dimensione. Le caratteristiche degliappartamenti valutati dalla societa a Firenze (centro storico e zone collinari escluse) nel secondo semestre2009 sono riassunte nella seguente tabella. Entrambe le variabili sono prese in logaritmo naturale (v =ln(valore in euro); d = ln(dimensione in m2)).

1

62

62∑i=1

di1

62

62∑i=1

vi1

62

62∑i=1

(di − d

)2 1

62

62∑i=1

(vi − v)2 1

62

62∑i=1

(di − d

)(vi − v)

4.51 5.98 0.05146 0.036 0.03485

Si formuli un opportuno modello statistico finalizzato a quanto sopra indicato.(A) Stimarne tutti i parametri col metodo dei minimi quadrati.(B) Fornire la stima per intervallo (α = 0.05) per la deviazione standard della componente di residua.(C) Scomporre la devianza della variabile dipendente nelle sue componenti, di regressione e residua,fornendone i valori. Derivarne una misura della bonta del modello.(D) Fornire l’intervallo di previsione (α = 0.02) per il valore in euro di un appartamento di 112m2.

Esercizio 2. Si ritiene che, fra primo e secondo semestre 2009, in media ci sia stato un leggero calo deiprezzi per gli appartamenti del centro storico. La tabella seguente riporta i prezzi, in migliaia di euro,di due distinti campioni di compravendite effettivamente realizzate nei due periodi (per omogeneita ilconfronto e su appartamenti fra 90 e 100 m2).

Primo semestre 410 440 420 450 440Secondo semestre 520 470 500 500 500

Si assuma che i prezzi seguano una distribuzione Normale.

(A) L’opinione formulata nel testo dell’esercizio e confermata dai dati campionari? (α = 0.05)(B) Se, nei due distinti periodi, i prezzi degli appartamenti avessero distribuzioni con parametri pari aquelli stimati sui due campioni, quale delle due distribuzioni sarebbe piu bassa e larga? Perche?

Esercizio 3. Due variabili casuali hanno la seguente distribuzione congiunta.

YX 3 41 0.11 0.522 0.26 0.11

(A) X e Y sono incorrelate? Perche?(B) Si ricavi la funzione di massa di probabilita della variabile casuale W = X + Y .

100.2 Soluzioni

Esercizio 1. Modello di regressione lineare yi = β0 + β1xi + ui, ui ∼ N(0, σ2), in cui Y = v =ln(valore in euro), X = d = ln(dimensione in m2).

(A) β1 = 0.67723, β0 = 2.9257, σ2 = 0.0128.

(B) Pivot per σ2: (n − 2)σ2/σ2 la cui distribuzione e χ2(n − 2); intervallo all’1 − α = 0.95 per σ2:[0.0092, 0.019]; corrispondente intervallo per σ: [0.0961, 0.1378] (valori tavola χ2: c1 = 40.4817, c2 =83.2977).

(C) dev(y) = 2.232, dev(REGR) = 1.4633, dev(RES) = 0.7687, da cui R2 = 0.6556.

200

Page 201: Testi e soluzioni dei compiti di esame di STATISTICA 1 c.l ...local.disia.unifi.it/cipollini/webpage-new/pdf/Statistical... · c.l. Economia Aziendale 6 febbraio 2010 1. Elenco 1

(D) Intervallo di previsione al 1−α = 0.98 per y in corrispondenza di x0 = ln(112) = 4.7185: [6.0745, 6.1679];per derivare il corrispondente intervallo per il valore (invece del suo logaritmo naturale) basta esponenziarei due estremi: [434.6471, 477.1672] (valore tavola T : t = 2.39012).

Calcoli e valori utili:n = 62, x = 4.51, y = 5.98, dev(x) = var(x)n = 3.1905, dev(y) = var(y)n = 2.232, codev(x, y) =

cov(x, y)n = 2.1607; dev(RES) = dev(y) − β21dev(x) = 0.7687; β1 = codev(x, y)/dev(x) = 0.67723,

β0 = y − β1x = 2.9257, σ2 = dev(RES)/(n − 2) = 0.0128, σ = 0.1132; dev(REGR) = dev(y) −dev(RES) = 1.4633, R2 = dev(REGR)/dev(y) = 0.6556; y(x0) = β0 + β1x0 = 6.1212, se(y(x0)) =

σ√

1/n+ (x− x0)2/dev(x) = 0.0195.

Esercizio 2. Assunzioni: X =‘prezzo primo semestre’∼ N(µX , σ2), Y =‘prezzo secondo semestre’∼

N(µY , σ2) (varianze uguali) e campioni indipendenti.

(A) Test di H0 : µX − µY = 0 contro H0 : µX − µY < 0 per α = 0.05; la statistica test sotto H0 e

(X−Y −0)/√S2p(1/nX + 1/nY ) con distribuzione T (nX +nY −2); la regione di rifiuto e (−∞,−1.8595);

il valore campionario statistica test sotto H0 e −6.0758.

(B) La forma della distribuzione Normale (assunta per X ed Y in base al testo dell’esercizio) dipendeesclusivamente dalla varianza. Poiche si assume che i valori di σ2

X e σ2Y sono pari alle rispettive stime

(s2X = 270, s2

Y = 320), si deduce che σ2Y e maggiore per cui Y ha distribuzione piu bassa e larga.

Calcoli e valori utili:nX = nY = 5, x = 432, y = 498, s2

X = 270, s2Y = 320, s2

p = [s2X(nX−1)+s2

Y (nY −1)]/(nX+nY −2) = 295,√S2p(1/nX + 1/nY ) =

√118 = 10.8628.

Esercizio 3.

(A) X e Y sarebbero incorrelate se la loro covarianza fosse zero. Invece C(X,Y ) = E(XY )−E(X)E(Y ) =4.85− 1.37 ∗ 3.63 = −0.1231

(B) Dai valori in tabella si calcolano facilmente i possibili valori che W = X + Y puo assumere con lerispettive probabilita:

w 4 5 6f(w) 0.11 0.78 0.11

201