38
L’APPROCCIO SIMULAZIONE OTTIMIZZAZIONE (“SIMULATION–BASED OPTIMIZATION”) 171 2.6 L’APPROCCIO SIMULAZIONE OTTIMIZZAZIONE (“SIMULATION–BASED OPTIMIZATION”) La Simulazione e l’Ottimizzazione possono interagire e integrarsi quando si vuole determinare qual ` e la combinazione di dati di input di una simulazione che ot- timizza uno o pi` u indici di prestazione. In questo caso la funzione obiettivo del problema di ottimizzazione non ` e disponibile in forma analitica, o comunque non calcolabile con procedure deterministiche, ma il suo valore in corrispondenza di diversi valori delle variabili ` e ottenibile solamente attraverso il risultato di una simulazione. Potrebbero presentarsi casi in cui oltre la funzione obiettivo anche i vincoli non siano disponibili e la loro verifica pu` o essere effettuata solamente attraverso una simulazione. Infine, anche il valore di alcune variabili (uncontrolla- ble variables) del problema di ottimizzazione potrebbe essere ottenuto solamente attraverso una simulazione, ovvero dipendere dai dati di input della simulazione (controllable variables). Ovviamente lo scopo del processo di ottimizzazione ` e ben diverso da quello di analisi di scenario proprio della simulazione: infatti, come gi` a evidenziato nell’in- troduzione allo studio della Simulazione, nel primo caso si deve decidere quale configurazione del sistema ` e la migliore tra tutte le ammissibili (approccio “what– best”); nel secondo caso le configurazioni alternative del sistema sono date e ov- viamente in numero finito (approccio “what–if”). Si osservi che molto spesso questo numero non pu` o essere elevato a causa dell’alto costo computazionale dei run di simulazione. Per evidenziare l’importanza e l’attualit` a della simulazione ottimizzazione, ripor- tiamo di seguito alcune righe della prefazione del testo “Handbook on simulation optimization” di Michael C. Fu di recente pubblicazione [Fu, 2014]: Arguably, the two most powerful operations research/management science (OR/MS) techniques are simulation and optimization. [ ... ] Optimization dates back many centuries and is generally considered the older of the two siblings. Both approaches were propelled forward by the advent of the digital computer over half a century ago, leading up to the present golden age when both routinely address complex large-scale realworld problems and both are implemented in a large variety of computer software packages. However, combining the two techniques is a more recent development, and software effectively integrating the two is relatively limited; thus, simulation optimization remains an exciting and fertile area of research. Risulta molto evidente come attualmente l’approccio simulazione ottimizzazio- ne sia considerato uno strumento molto efficace per lo studio di problemi reali complessi e di grandi dimensioni che sempre pi´ u spesso si presentano in numerosi settori applicativi. Nella sua forma pi` u semplice un problema di Ottimizzazione e Simulazione pu` o essere formulato come segue: supponiamo di avere una misura di prestazione ot- M. Roma Sistemi di Servizio e Simulazione SAPIENZA Universit`a di Roma a.a. 2017-2018

SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

Embed Size (px)

Citation preview

Page 1: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

L’APPROCCIO SIMULAZIONE OTTIMIZZAZIONE (“SIMULATION–BASED OPTIMIZATION”) 171

2.6 L’APPROCCIO SIMULAZIONE OTTIMIZZAZIONE

(“SIMULATION–BASED OPTIMIZATION”)

La Simulazione e l’Ottimizzazione possono interagire e integrarsi quando si vuole

determinare qual e la combinazione di dati di input di una simulazione che ot-

timizza uno o piu indici di prestazione. In questo caso la funzione obiettivo del

problema di ottimizzazione non e disponibile in forma analitica, o comunque non

calcolabile con procedure deterministiche, ma il suo valore in corrispondenza di

diversi valori delle variabili e ottenibile solamente attraverso il risultato di una

simulazione. Potrebbero presentarsi casi in cui oltre la funzione obiettivo anche

i vincoli non siano disponibili e la loro verifica puo essere effettuata solamente

attraverso una simulazione. Infine, anche il valore di alcune variabili (uncontrolla-

ble variables) del problema di ottimizzazione potrebbe essere ottenuto solamente

attraverso una simulazione, ovvero dipendere dai dati di input della simulazione

(controllable variables).

Ovviamente lo scopo del processo di ottimizzazione e ben diverso da quello di

analisi di scenario proprio della simulazione: infatti, come gia evidenziato nell’in-

troduzione allo studio della Simulazione, nel primo caso si deve decidere quale

configurazione del sistema e la migliore tra tutte le ammissibili (approccio “what–

best”); nel secondo caso le configurazioni alternative del sistema sono date e ov-

viamente in numero finito (approccio “what–if”). Si osservi che molto spesso

questo numero non puo essere elevato a causa dell’alto costo computazionale dei

run di simulazione.

Per evidenziare l’importanza e l’attualita della simulazione ottimizzazione, ripor-

tiamo di seguito alcune righe della prefazione del testo “Handbook on simulation

optimization” di Michael C. Fu di recente pubblicazione [Fu, 2014]:

Arguably, the two most powerful operations research/management science

(OR/MS) techniques are simulation and optimization. [ ... ] Optimization

dates back many centuries and is generally considered the older of the two

siblings. Both approaches were propelled forward by the advent of the digital

computer over half a century ago, leading up to the present golden age

when both routinely address complex large-scale realworld problems and

both are implemented in a large variety of computer software packages.

However, combining the two techniques is a more recent development, and

software effectively integrating the two is relatively limited; thus, simulation

optimization remains an exciting and fertile area of research.

Risulta molto evidente come attualmente l’approccio simulazione ottimizzazio-

ne sia considerato uno strumento molto efficace per lo studio di problemi reali

complessi e di grandi dimensioni che sempre piu spesso si presentano in numerosi

settori applicativi.

Nella sua forma piu semplice un problema di Ottimizzazione e Simulazione puo

essere formulato come segue: supponiamo di avere una misura di prestazione ot-

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 2: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

172 SIMULAZIONE

tenuta in output da una simulazione e indichiamo tale misura con f . Il valore

che f assume dipende dal valore dei dati di input che denotiamo con x1, . . . , xn.

Per il problema di ottimizzazione questi ultimi saranno le variabili di decisione.

Poiche f e ottenuta dall’output di una simulazione, essa e, in generale, una varia-

bile aleatoria. Lo scopo sara pertanto quello di minimizzare/massimizzare il suo

valore atteso E (f(x1, . . . , xn)) su tutte le combinazioni possibili di x1, . . . , xn.

Naturalmente ci possono essere vincoli di vario tipo sulle variabili di decisione (i

dati di input) che limitano le combinazioni possibili (ammissibili) da considerare.

Sottolineamo ancora il fatto che la funzione obiettivo non e calcolata analitica-

mente o comunque in maniera deterministica, ma ottenuta come output di una

simulazione. Sara quindi necessario effettuare un certo numero di repliche indi-

pendenti della simulazione e utilizzare per la f il valore medio dei diversi valori

ottenuti in queste repliche (ovviamente in corrispondenza dei medesimi dati di

input).

In una forma piu generale un problema di simulazione ottimizzazione, puo essere

formalmente scritto nel seguente modo:

min E [f(x, z, ω)]

s.t. E [g(x, z, ω)] ≥ 0

xl ≤ x ≤ xuzl ≤ z ≤ zu

x ∈ IRn, z ∈ Zn,

dove f e funzione a valori reali, g e h sono funzioni a valori vettoriali. La funzione

f viene valutata attraverso la simulazione di particolari istanze delle variabili

continue x e delle variabili discrete z (input del modello) e della realizzazione

di varibili aleatorie, ovvero il vettore ω, che puo essere anch’esso funzione degli

input x e z. In pratica, l’introduzione del vettore ω serve per evidenziare l’effetto

stocastico della simulazione. Analogamente, i vincoli rappresentati dalla funzione

g sono valutati attraverso la simulazione. Inoltre ci possono essere vincoli che non

dipendono da variabili aleatorie (rappresentati dalla funzione h) e vincoli di tipo

box sulle variabili.

Uno schema complessivo dell’implementazione di una procedure di simulazione

ottimizzazione puo essere cosı sintetizzato: viene simulata una sequenza di confi-

gurazioni del sistema, ciascuna corrispondente ad una particolare scelta dei dati

di input. Ad ogni step della sequenza un algoritmo di ottimizzazione effettua

una ricerca nello spazio dei possibili dati di input (regione ammissibile) fino alla

determinazione della configurazione ottima. Quindi l’algoritmo di ottimizzazione

sceglie una configurazione iniziale e il simulatore effettua le repliche della simu-

lazione. Il risultato della simulazione e inviato all’algoritmo di ottimizzazione

e viene verificato un criterio di arresto. Se questo non e verificato, l’algoritmo

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 3: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

L’APPROCCIO SIMULAZIONE OTTIMIZZAZIONE (“SIMULATION–BASED OPTIMIZATION”) 173

di ottimizzazione determina una nuova configurazione da simulare e il processo

continua iterativamente fino al soddisfacimento del criterio di arresto.

Per una trattazione completa della “simulation–based optimization” si rimanda al

gia citato [Fu, 2014]. Riportiamo di seguito in estrema sintesi alcune osservazioni

importanti:

• il tempo totale di un’esecuzione dipende dal numero di configurazioni del

sistema che sono state esaminate (numero di iterazioni dell’algoritmo di

ottimizzazione), ma anche da tempo necessario per simulare ciascuna di

queste configurazioni;

• in caso di varianza elevata, sara necessario un numero di repliche adeguato

per ottenere l’accuratezza desiderata;

• esiste la possibilita di effettuare implementazioni parallele.

Molti simulatori includono “optimization packages”’ (spesso basati su algorim-

ti euristici) gia integrati con il simulatore e che prevedono una visulizzazione

di vario tipo durante le iterazioni dell’algoritmo. Un esempio e costituito da

tool OptQuestr for ARENAr disponibile all’interno del simulatore ARENAr (cfr.

paragrafo 2.7).

Disponendo di un proprio codice che implementa l’algoritmo di ottimizzazione

che si vuole utilizzare, sara ovviamente necessario creare un’interfaccia tra il

simulatore e l’algoritmo di ottimizzazione e questo spesso richiede tecnicalita che

possono essere non da banali da realizzare, soprattutto per la sincronizzazione

dei due tool. A titolo di esempio, il simulatore ARENAr permette di utilizzare

Microsoft Visual Basic (VBA) per realizzare tale interfaccia.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 4: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

174 SIMULAZIONE

2.7 SOFTWARE DI SIMULAZIONE (SIMULATORI)

Nel paragrafo 2.1.4 abbiamo fatto cenno ad alcuni pacchetti software di simula-

zionei. L’uso di tali simulatori e oggi diventato assai diffuso all’interno di diverse

realta della vita reale in ragione della loro generalita e flessibilita di uso. Faremo

riferimento a simulatori ad eventi discreti “general purpose”, ovvero non destinati

alla creazione di modelli di simulazione specifici bensı capaci di creare modelli di

simulazione di sistemi complessi anche molto diversi fra di loro. Tali simulatori

hanno ormai raggiunto un ottimo livello di adattabilita e facilita di uso. Sono di

solito basati su un’interfaccia grafica che permette di costruire un modello con

il semplice “drag and drop” di moduli predefiniti all’interno di appositi riquadri

di lavoro, ignorando l’esistenza del linguaggio nel quale il simulatore realizzera

il modello stesso. Inoltre, sono dotati di animazioni grafice anche tridimensio-

nali che permettono di osservare il funzionamento del sistema implementato nel

modello di simulazione. Tali animazioni sono molto utili se si vuole mostrare

tale funzionamento a persone che sono poco propense ad osservare tabelle spes-

so molto lunghe e piene di valori numerici poco significativi ad un occhio poco

esperto.

Abbiamo scelto i due seguenti simulatori:

• ARENAr http://www.arenasimulation.com

Prodotto dalla Rockwell Automation, e un simulatore oggi largamente uti-

lizzato, che attraverso un’interfaccia grafica consente sia di realizzare un

modello di simulazione, sia di effettuare i diversi run di una simulazione e

di analizzare i risultati ottenuti.

• SIMIOTM

http://www.simio.com

Prodotto dalla SIMIO LCC, anch’esso con una efficace interfaccia grafica

e basato su “oggetti intelligenti” che una volta costruiti, possono essere

riutilizzati in progetti diversi.

SIMIO e un simulatore di piu recente generazione e rappresenta un passaggio

dal paradigma della simulazione “process oriented” a quello della simulazione

“objects oriented”. Entrambi i simulatori sono dotati di strumenti di animazione e

visualizzazione 3D che permettono di osservare bene il funzionamento del sistema

reale.

Gli studenti posso scaricare dai rispettivi siti le versioni trial/studente delle

release piu recenti di entrambi.

Per ogni dettaglio sull’uso di ARENA si fa riferimento a [Kelton et al., 2004],

[Altiok, Melamed, 2007], [Rossetti, 2010] e alla User’s Guide.

Per ogni dettaglio sull’uso di SIMIO si fa riferimento a [Kelton et al., 2011],

[Joines, Roberts, 2012] e alla User’s Guide.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 5: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

SOFTWARE DI SIMULAZIONE (SIMULATORI) 175

2.7.1 ARENA

Si riporta una descrizione molto sintetica dei moduli che costituiscono i Basic

process di ARENA, ovvero i moduli: CREATE, PROCESS, DISPOSE, DECIDE,

ASSIGN, BATCH e SEPARATE.

• CREATE : genera le entita e le immette nel sistema. La generazione puo

avvenire secondo uno schema fissato o specificando la distribuzione di pro-

babilita dei tempi di interarrivo.

• PROCESS : rappresenta qualsiasi tipo di processamento di entita. Permet-

te anche di considerare l’utilizzazione di risorse (e dei relativi vincoli di

disponibilita) secondo tre schemi: size–delay, seize–delay–release e delay–

release.

• DISPOSE : espelle le entita dal sistema. Permette anche di specificare se

registrare le statistiche dell’ingresso delle entita.

• DECIDE : permette di controllare l’istradamento delle entita sulla base di

condizioni oppure sulla base di probabilita in corrispondenza per ciascuna

uscita.

• ASSIGN : esegue l’assegnazione di variabili e attributi. L’operazione di

assegnazione e effettuata quando un’entita attraversa il modulo.

• BATCH : permette di raggruppare entita. La costruzione del “batch” e

controllata dal numero delle entita o da attributi. Le entita che entrano nel

modulo vengono raggruppate e si avra una sola entita (gruppo) in uscita

dal modulo.

• SEPARATE : ha due funzioni: produrre una o piu copie di una entita,

oppure separare un gruppo di entita precedentemente raggruppate.

2.7.2 Modelli in ARENA

Si riportano di seguito i testi di alcuni esercizi svolti durante le esercitazioni. I

relativi modelli implementati con ARENA sono disponibili sul sito web del corso.

Si tratta di esempi molto introduttivi destinati solamente ad illustrare l’uso dei

moduli presenti nei Basic process di ARENA.

MODELLO 1. Un modello che rappresenti un sistema a coda M/M/1 con

media dei tempi di interarrivo pari a 60 minuti e media dei tempi di servizio pari

a 50 minuti.

MODELLO 2. Ad un istituto di credito arrivano richieste di erogazione di

mutui. La distribuzione dei tempi di interarrivo di tali tempi e esponenziale con

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 6: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

176 SIMULAZIONE

media 2 ore. La richiesta viene esaminata da un impiegato il cui tempo per

completare la pratica e distrbuito secondo una ditribuzione triangolare con valori

(1, 1.75, 3) ore. In genere, nell’88% dei casi la pratica va a buon fine, ovvero il

mutuo e concesso. Nel rimanente 12% dei casi, la risposta e negtiva.

MODELLO 3. Un’impresa per la trasformazione di semilavorati deve proces-

sare l’arrivo di 100 semilavorati. Questi dovranno passare attraverso 2 ulteriori

processi di lavorazione: detti Machining Center ed Inspection Station. Dopo tali

processi verra effettuato il controllo di qualita sul prodotto finito valutandone il

grado di finitezza. I dati relativi al problema sono:

• al primo processo produttivo i semilavorati arrivano uno alla volta con

intertempo di arrivo esponenziale (media pari ad 1 minuto);

• i tempi di processamento (espressi in minuti) al Machining Center sono

uniformemente distribuiti nell’intervallo [0.65, 0.70];

• i tempi di processamento (espressi in minuti) al Inspection Station sono

uniformemente distribuiti nell’intervallo [0.75, 0.80];

• con probabilita del 50% i pezzi controllati sono “perfect” ed escono dal

sistema attraverso un proprio canale;

• con probabilita del 20% i pezzi controllati sono “very good” ed escono dal

sistema attraverso un proprio canale;

• con probabilita del 5% i pezzi controllati sono “good” ed escono dal sistema

attraverso un proprio canale;

• con probabilita del 25% i pezzi controllati rientrano nel sistema e vengono

rilavorati sui due processi.

MODELLO 4. In un laboratorio di analisi di un ospedale il centro prelievi e

aperto dal lunedı al sabato dalle 7.30 alle 11.00. Gli utenti arrivano al centro con

intertempi di arrivo distribuiti esponenzialmente con media 7 minuti. Appena

arrivato al centro prelievi un utente deve ritirare un numero da una macchinetta

distributrice e poi deve attendere di essere chiamato allo sportello per l’accetta-

zione dove presentera la richiesta di analisi del proprio medico curante; gli utenti

sono chiamati in ordine di numero crescente e le operazioni per l’accettazione

sono eseguite in tempi distribuiti uniformemente tra 1 e 1.5 minuti. Dopo l’ac-

cettazione l’utente si reca all’ufficio cassa se deve pagare il ticket oppure, se e

esente da tale pagamento, si reca direttamente all’ambulatorio per il prelievo. Il

pagamento del ticket richiede tempi distribuiti uniformemente tra 0.5 e 1 minu-

to, mentre i tempi per effettuare i prelievi presso l’ambulatorio sono distribuiti

esponenzialmente con media 5 minuti.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 7: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

SOFTWARE DI SIMULAZIONE (SIMULATORI) 177

MODELLO 5. Una catena di montaggio costruisce apparecchi assemblando

due parti. Le due parti arrivanno alla catena dall’esterno da due ingressi diversi

(I1 e I2 ). Le singole parti arrivano alla catena di montaggio secondo due diverse

distribuzione di probabilita dei tempi di interarrivo: dall’ingresso I1 secondo una

distribuzione uniforme tra 0.4 e 0.7 ore, dall’ingresso I2 secondo una distribuzione

normale a media 0.5 ore e deviazione standard 0.2. Le singole parti, prima dell’as-

semblaggio subiscono un pretrattamento; i tempi necessari per questa operazione

sono distributi secondo la distribuzione normale a media 0.1 ore e deviazione

standard 0.03 per le parti che sono arrivate dall’ingresso I1 e a media 0.15 ore e

deviazione standard 0.04 per le parti arrivate dall’ingresso I2. L’assemblaggio e

effettuato in un tempo costante pari a 0.3 ore. Dopo l’assemblaggio c’e una lavo-

razione finale che richiede un tempo distribuito secondo la distribuzione normale

a media 0.6 ore e deviazione standard 0.13.

MODELLO 6. In una videoteca entrano clienti con tempi di interarrivo di-

stribuiti esponenzialmente con media 5 minuti. Una volta entrati i clienti scelgono

casualmente tra i tre diversi tipi di film (drammatico, commedia, azione). Il

tempo impiegato nella scelta ha distribuzione triangolare con valore minimo 1

minuto, massimo 10 minuti e valore piu probabile 5 minuti. Una volta effettuata

la scelta il cliente puo decidere se acquistare anche una pizza oppure dirigersi

direttamente alla cassa. Nel 25% dei casi la pizza viene acquistata e questo

richiede un tempo distribuito secondo una distribuzione triangolare con valore

minimo 0.5 minuti, massimo 2 minuti e valore piu probabile 1 minuto. Il tempo

necessario al pagamento alla cassa (con o senza la pizza) e anch’esso distribuito

secondo una distribuzione triangolare con valore minimo 1 minuto, massimo 4

minuti e valore piu probabile 2 minuti.

MODELLO 7. Un Computer consta di 1 CPU, 3 terminali, 1 unita Hard Disk

(HD) e 1 unita a nastro (Tape). In ciascun terminale siede un utente il quale

invia jobs alla CPU con intertempi distribuiti esponenzialmente (valore atteso

pari a 100 secondi). I jobs si accumulano in una coda (FIFO) prima di essere

processati dalla CPU. Ciascun job processato dalla CPU la tiene occupata per

un tempo distribuito esponenzialmente (valore atteso pari a 1 secondo). Un job

che lascia la CPU puo:

• con probabilita 20% ritornare al terminale che l’ha inviato;

• con probabilita 72% andare nella coda (FIFO) dell’ Hard Disk;

• con probabilita 8% andare nella coda (FIFO) dell’unit a nastro.

Ciascun job processato dall’Hard Disk necessita di un tempo distribuito espo-

nenzialmente (valore atteso pari a 1.39 secondi), dopodiche torna alla coda del-

la CPU. Analogamente ciascun job processato dall’unita a nastro necessita di

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 8: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

178 SIMULAZIONE

un tempo distribuito esponenzialmente (valore atteso pari a 12.50 secondi), poi

torna alla coda della CPU. Tutti i job prodotti dagli operatori sono tra loro

statisticamente indipendenti.

MODELLO 8. Un’azienda di vendite per corrispondenza riceve richieste di or-

dini con distribuzione esponenziale a media 9 minuti. Due operatori telefonici

accettano gli ordini. Per entrambi il tempo di servizio e distribuito secondo la

distribuzione triangolare con valore minimo 3 minuti, massimo 11 minuti e valore

piu probabile 7 minuti il primo operatore e valore minimo 2 minuti, massimo

11 minuti e valore piu probabile 8 minuti il secondo. Una volta terminata la

chiamata l’ordine viene passato all’addetto del reparto consegne che provvede a

preparare l’ordine e a caricarlo su un furgone. Tale operazione richiede un tem-

po distribuito secondo la distribuzione triangolare con valore minimo 5 minuti,

massimo 20 minuti e valore piu probabile 10 minuti. Prima di partire per le

consegne, il furgone attende che vi siano caricate le merci corrispondenti a 10

ordini. I tempi per le consegne sono distribuiti secondo la distribuzione triango-

lare con valore minimo 20 minuti, massimo 80 minuti e valore piu probabile 40

minuti. Per ciascun ordine consegnato il fattorino fornisce la notifica di avvenuta

consegna all’azienda che provvede ad inserire il cliente nella lista delle consegne

effettuate. Tale operazione avviene con un tempo distribuito secondo la distri-

buzione triangolare con valore minimo 1 minuto, massimo 4 minuti e valore piu

probabile 2 minuti. L’ultima operazione e l’emissione della fattura da inviare al

cliente che avviene con un tempo distribuito secondo la distribuzione triangolare

con valore minimo 0.8 minuti, massimo 2 minuti e valore piu probabile 1 minuto.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 9: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

RIFERIMENTI DEL CAPITOLO 2 179

2.8 RIFERIMENTI DEL CAPITOLO 2

La trattazione di questo capitolo e basata sul testo [Law, Kelton, 2000] che rappre-

senta un testo completo su tutti gli aspetti della simulazione e quindi utile anche

per approfondimenti. Per aspetti piu teorici si puo consultare il capitolo 11 del

testo [Ross, 2003a]. Fra i numerosi ulteriori testi sulla simulazione citiamo, ad

esempio, [Ross, 2002] e [Banks et al., 2001]. Il testo [Banks, 1998] riporta una

collezione di articoli che forniscono un’adeguata panoramica sulle metodologie e

le aree di applicazione della simulazione.

Per quanto riguarda il software di simulazione ARENA trattato nel paragrafo 2.7

si fa riferimento al testo [Kelton et al., 2004].

Segnaliamo inoltre il sito Web dell’Informs College on Simulation

http://www.informs-cs.org

e il sito dei proceedings delle conferenze annuali “Winter Simulation Conference”

http://www.informs-cs.org/wscpapers.html

nel quale si possono trovare molti articoli e survey aggiornate su diversi aspetti

della simulazione e su applicazioni della simulazione.

Banks, J. (1998). Handbook on Simulation. Principles, Methodology, Ad-

vances, Applications, and Practice. Wiley and Sons, New York.

Banks, J., J.S.Carson, Nelson, B., Nicol, D. (2001). Discrete–event

system simulation. Prentice Hall.

Fu, M. C. (2014). Handbook on Simulation Optimziation. Springer.

Law, A., Kelton, W. (2000). Simulation modeling and analysis. McGraw

– Hill, New York, third edition.

Kelton, W., Sadowski, R., Sturrock, D. (2004). Simulation with

Arena. McGraw – Hill, New York, third edition.

Ross, S. (2002). Simulation. Academic Press, San Diego, third edition.

Ross, S. (2003a). Introduction to probability models. Academic Press, San

Diego.

Ross, S. (2003b). Probabilita e statistica. Apogeo, Milano.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 10: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

180 SIMULAZIONE

2.9 ESERCIZI SULLA SIMULAZIONE

Esercizio 2.9.1 Applicare il metodo della trasformazione inversa per generare

cinque osservazioni casuali dalla distribuzione esponenziale con media pari ad 1,

a partire dai seguenti cinque numeri casuali generati dalla distribuzione uniforme

in [0, 1)

0.495 0.335 0.791 0.469 0.279

Esercizio 2.9.2 Si vuole effettuare una simulazione di un sistema di code M/M/3

in cui la frequenza media di arrivo e pari a 20 e la velocita di servizio e pari a

10, essendo interessati a stimare il numero medio di utenti presenti nel sistema.

Supponiamo che siano state effettuate 5 repliche indipendenti dalle quali si sono

ottenuti i seguenti risultati:

1a replica: 3.28

2a replica: 2.57

3a replica: 3.01

4a replica: 2.93

5a replica: 2.55

Calcolare la stima della media e l’intervallo di confidenza al 95%. Facendo rife-

rimento a tale intervallo di confidenza, trascurando il problema dello start up e

supponendo di voler ottenere un errore assoluto sulla stima della media inferio-

re a 0.2, determinare se le cinque repliche effettuate sono sufficienti ad ottenere

tale precisione. In caso negativo, applicando la procedura iterativa, determinare

il numero delle repliche necessarie per ottenere la precisione voluta sapendo che

nelle eventuali successive cinque repliche si ottengono i seguenti valori:

6a replica: 2.69

7a replica: 2.61

8a replica: 2.85

9a replica: 2.91

10a replica: 2.88

Esercizio 2.9.3 Applicare la procedura di Welch, con un valore di time window

k = 2, al seguente output di una simulazione

1a replica: 3.72 2.90 3.32 2.50 2.12 3.90 3.10 2.60

2a replica: 2.37 3.80 4.00 3.75 2.90 3.12 2.30 2.70

3a replica: 3.12 2.05 2.90 2.55 2.95 3.30 3.00 2.80

4a replica: 2.98 3.90 3.54 3.10 2.78 2.10 1.90 2.35

5a replica: 2.50 1.90 3.10 2.60 2.20 3.00 2.70 2.85

Dei valori Yj(2) ottenuti dalla procedura, (trascurando il problema dello startup)

determinare media e t intervallo di confidenza al 95%.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 11: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

3Elementi di statistica

In questo capitolo, sono riportati in breve alcuni elementi di Statistica di uso

comune all’interno della Simulazione che lo studente dovrebbe aver gia acquisito

nel suo curriculum di studi attraverso corsi specifici. Tali importanti aspetti non

sono stati trattati esplicitamente, ma considerati come prerequisiti gia in possesso

degli studenti e sono qui riportati per completezza di informazione. Pertanto

questo capitolo non fa esplicitamente parte del programma di esame.

3.1 ELEMENTI DI STATISTICA INFERENZIALE

In questo paragrafo verranno illustrati alcuni elementi di Statistica che sono essen-

ziali per procedere alla costruzione di un modello di simulazione e per effettuare

correttamente una simulazione. Si tratta essenzialmente della stima dei parame-

tri e dei test statistici, elementi chiave per l’analisi dell’input e dell’output di una

simulazione.

Infatti, per effettuare una simulazione di un sistema che presenta elementi stoca-

stici e necessario specificare le distribuzioni di probabilita che regolano i processi

che caratterizzano il sistema stesso. Se e possibile raccogliere dati reali (osser-

vazioni) sulle variabili aleatorie di interesse, essi possono essere utilizzati per

determinare queste distribuzioni facendo uso di tecniche di inferenza statistica

(analisi dell’input). Una volta stabilite tali distribuzioni, la simulazione procede

generando valori casuali da queste distribuzioni, ovvero, durante ogni esecuzione,

la simulazione genera osservazioni casuali di variabili aleatorie distribuite secondo

particolari distribuzioni di probabilita. Oltre che per progettare una simulazione,

e necessario l’uso di tecniche statistiche anche per interpretare i risultati ottenuti

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 12: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

182 ELEMENTI DI STATISTICA

da una simulazione (analisi dell’output).

La trattazione degli argomenti riportati in questo paragrafo sara sintetica e consi-

dera esclusivamente quegli elementi che risulteranno utili all’interno dello studio

della simulazione. Per ogni trattamento piu esteso e approfondito si rimanda ai

testi specifici come, ad esempio [Ross, 2003b].

3.2 STATISTICHE CAMPIONARIE E LORO DISTRIBUZIONE

In generale, nello studio di un fenomeno riguardante un insieme di elementi (po-

polazione) che presenta caratteristiche aleatorie, molto spesso si dispone solo di

informazioni su una parte di essi (campione) e si vogliono dedurre proprieta ge-

nerali riguardanti l’intera popolazione. L’inferenza statistica si occupa di questa

problematica e riveste un importante strumento di analisi.

Solitamente viene fatta l’assunzione che esiste una distribuzione di probabilita

della popolazione nel senso che se da essa vengono estratti casualmente alcu-

ni elementi, ad essi sono associate variabili aleatorie indipendenti identicamente

distribuite secondo tale distribuzione. In questo senso, un insieme di variabili

aleatorie X1, . . . , Xn di variabili aleatorie indipendenti tutte con la stessa distri-

buzione si dice campione di questa distribuzione. L’interesse principale risiede

nella possibilita di dedurre caratteristiche della distribuzione non nota sulla base

dei dati a disposizione. Naturalmente ci sono casi in cui della distribuzione della

popolazione non si conosce nulla (se non il fatto che essa e discreta o continua),

mentre in altri casi la distribuzione e nota ma non sono noti alcuni suoi parame-

tri. Esamineremo entrambi i casi, introducendo, innanzitutto alcuni elementi che

riguardano le statistiche campionarie e la loro distribuzione.

Dato un campione X1, . . . , Xn estratto da una popolazione, ogni funzione delle

osservazioni campionarie e chiamata statistica campionaria e i valori ottenuti da

una qualsiasi funzione dei soli valori osservati sono chiamati statistiche. I due

principali esempi di statistiche sono la media campionaria e la varianza campio-

naria.

3.2.1 Media campionaria e varianza campionaria

Sia dato un campione X1, . . . , Xn estratto da una popolazione, ovvero le Xi sono

variabili aleatorie indipendenti identicamente distribuite, e sia µ e σ2 rispetti-

vamente la loro media e la loro varianza (ovvero la media e la varianza della

popolazione).

La media campionaria e data daMedia cam-

pionaria

Xn =1

n

n∑i=1

Xi.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 13: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STATISTICHE CAMPIONARIE E LORO DISTRIBUZIONE 183

Xn e una variabile aleatoria funzione delle Xi e si verifica facilmente che risulta

E(Xn) = µ e V ar(Xn) =σ2

n.

La varianza campionaria e data da Varianza

campiona-

rias2n =

1

n− 1

n∑i=1

(Xi − Xn

)2e si verifica facilmente che risulta E(s2

n) = σ2.

3.2.2 Distribuzione (approssimata) della media campionaria

La distribuzione della media campionaria puo essere determinata grazie al Teo-

rema del limite centrale. Siano date le osservazioni X1, . . . , Xn estratte da una

distribuzione di probabilita. Le Xi sono variabili aleatorie indipendenti identica-

mente distribuite e sia µ e σ2 rispettivamente la loro media e la loro varianza.

Definendo la variabile aleatoria

Zn =

X1 + · · ·+Xn

n− µ

σ√n

,

e la sua funzione di distribuzione Fn(z) = P (Zn ≤ z), il Teorema del Limite

Centrale afferma che

limn→∞

Fn(z) =1√2π

∫ z

−∞e−

y2

2 dy, (3.2.1)

ovvero Fn(z) converge alla funzione di distribuzione della distribuzione Normale

standard. Questo risultato permette di ottenere l’importante proprieta riportata

nel seguente teorema riguardante la media campionaria Xn.

Proposizione 3.2.1 Sia X1, . . . , Xn un campione estratto da una distribu-

zione di probabilita a media µ e varianza σ2. Allora, per n sufficientemente

grande,Xn − µσ√n

(3.2.2)

e una variabile aleatoria distribuita approssimativamente secondo la distribu-

zione Normale standard.

Questo risultato si ricava immediatamente dal Teorema del Limite Centrale, os-

servando che la (3.2.1) puo essere interpretata nel seguente modo: per n sufficien-

temente grande, la variabile aleatoria Zn e distribuita approssimativamente come

una variabile Normale standard, indipendentemente dalla distribuzione delle Xi.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 14: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

184 ELEMENTI DI STATISTICA

Ricordando che il valore atteso di Xn e µ e che la sua deviazione standard e

pari a σ/√n, la Proposizione 3.2.1 afferma che se si normalizza Xn sottraendo

la sua media e dividendo per la sua deviazione standard, si ottiene una variabile

aleatoria che e approssimativamente distribuita secondo una Normale standard

purche n sia sufficientemente grande.

La problematica che nasce nell’utilizzare questo risultato sta nel fatto che non e

noto quanto deve essere grande n affinche l’approssimazione sia buona; natural-

mente questo dipende dalla distribuzione in questione. Osservazioni sperimentali

hanno portato a formulare la regola empirica comunemente adottata secondo la

quale quando n > 30, si ha in genere una buona approssimazione, qualsiasi sia la

distribuzione della popolazione considerata.

3.2.3 Distribuzioni delle statistiche di popolazioni normali

Assumiamo ora che la distribuzione della popolazione sia Normale a media µ e

varianza σ2 e sia X1, . . . , Xn un campione estratto da tale popolazione. In questo

caso ovviamente si ha che la variabile aleatoria (3.2.2) e una variabile Normale

standard per qualsiasi valore di n, ovvero vale il seguente risultato.

Proposizione 3.2.2 Sia X1, . . . , Xn un campione estratto da una distribuzio-

ne di probabilita Normale a media µ e varianza σ2. Allora

Xn − µσ√n

(3.2.3)

e una variabile aleatoria distribuita secondo la distribuzione Normale standard.

Si osservi che avendo assunto che le Xi sono variabili aleatorie normali, il ri-

sultato ora enunciato non vale piu in senso approssimato, come nel caso della

Proposizionea 3.2.1, ma e un risultato esatto che vale per qualsiasi valore di n

(non necessariamente grande).

Si puo inoltre dimostrare che vale il seguente importante risultato:

Teorema 3.2.1 Sia X1, . . . , Xn un campione estratto da una distribuzione

Normale a media µ e varianza σ2. Allora

i) Xn e s2n sono variabili aleatorie indipendenti;

ii) Xn e una variabile aleatoria normale con media µ e varianza σ2/n;

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 15: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STIMA DI PARAMETRI 185

iii) (n − 1)s2n

σ2e una variabile aleatoria distribuita secondo la distribuzione

Chi-quadro a n− 1 gradi di liberta (χ2n−1).

Questo teorema ha un’importante conseguenza che enunciamo nella seguente

proposizione.

Proposizione 3.2.3 Sia X1, . . . , Xn un campione estratto da una distribuzio-

ne di probabilita Normale a media µ. Allora

Xn − µsn√n

(3.2.4)

e una variabile aleatoria distribuita secondo la distribuzione t di Student con

n− 1 gradi di liberta (tn−1).

Confrontando la (3.2.3) e la (3.2.4) si nota che nella Proposizione 3.2.3 la variabile

aleatoria considerata differisce da quella considerata nella Proposizione 3.2.2 per

la presenza di sn al posto di σ. Quindi possiamo riepilogare i risultati fino ad ora

ottenuti dicendo che, data una popolazione Normale, se si normalizza la media

campionaria Xn sottraendo la sua media µ e dividendo per la sua deviazione

standard σ/√n, si ottiene una variabile aleatoria Normale standard; se invece si

divide per sn/√n, si ottiene una variabile aleatoria con distribuzione t di Student

con n− 1 gradi di liberta.

3.3 STIMA DI PARAMETRI

Supponiamo ora che la popolazione sia distribuita secondo una distribuzione di

probabilita nota, ma caratterizzata da uno o piu parametri incogniti. Siamo

in questo caso interessati a determinare tali parametri incogniti sulla base di un

campione X1, . . . , Xn. Si tratta di un problema di stima di parametri che consiste

nel determinare, sulla base del campione X1, . . . , Xn, un valore per ciascuno dei

parametri in modo che essi costituiscano la migliore approssimazione dei para-

metri incogniti. Esistono diversi metodi di stima che non sono altro che tecniche

per ricavare statistiche e che sono detti stimatori. Uno stimatore e quindi una Stimatori e

stimefunzione h(X1, . . . , Xn) delle osservazioni campionarie e il valore che tale funzione

assume in corrispondenza di una particolare realizzazione del campione e detto

stima. Se θ e un parametro incognito, si indichera con θ la stima di θ.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 16: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

186 ELEMENTI DI STATISTICA

In alcuni casi si determina un unico valore θ come migliore approssimazione pos-

sibile del parametro θ e tale valore viene detto stima puntuale. In altri casi, puoStima

puntuale essere preferibile calcolare due valori dello stimatore ovvero θ1 = h1(X1, . . . , Xn)

e θ2 = h2(X1, . . . , Xn) che definiscono un intervallo [θ1, θ2] tale che, in un cam-

pionamento ripetuto, il valore incognito θ apparterra all’intervallo in una deter-

minata percentuale di casi che e detta confidenza dell’intervallo. In questo casoStima per

intervalli si parla di stima per intevalli.

3.3.1 Proprieta degli stimatori

Continuando ad indicare con θ un parametro incognito, con θ una sua stima

e con h = h(X1, . . . , Xn) uno stimatore, riportiamo in questo paragrafo alcune

definizioni standard.

Definizione 3.3.1 Si definisce valore dell’errore di campionamento la diffe-

renza θ − θ. Si chiama distorsione di uno stimatore h la differenza E(h)− θ.

L’errore quadratico medio dello stimatore h e dato da EQM(h) = E(h− θ)2.

Definizione 3.3.2 Uno stimatore h = h(X1, . . . , Xn) si dice stimatore cor-

retto del parametro θ se risulta E(h) = θ. Se invece si ha E(h) 6= θ si dice che

h e uno stimatore distorto per θ. Uno stimatore h = h(X1, . . . , Xn) si dice

stimatore efficiente del parametro θ se

i) E(h) = θ

ii) V ar(h) ≤ V ar(h1) per ogni h1 stimatore corretto di θ.

3.3.2 Stima di media e varianza

Supponiamo di avere un campione casuale X1, . . . , Xn e di voler stimare stimare

la media µ e la varianza σ2 della popolazione mediante questo campione, ovvero

supponiamo che X1, . . . , Xn siano variabili aleatorie indipendenti identicamente

distribuite con E(Xi) = µ e V ar(Xi) = σ2, i = 1, . . . , n con µ e σ2 non note.

Uno stimatore corretto per la media µ e dato dalla media campionaria

µ = Xn =1

n

n∑i=1

Xi,

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 17: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STIMA DI PARAMETRI 187

in quanto risulta E(Xn) = µ. Uno stimatore corretto per la varianza σ2 e dato

dalla varianza campionaria

σ2 = s2n =

1

n− 1

n∑i=1

(Xi − Xn

)2,

in quanto risulta E(s2n) = σ2.

3.3.3 Metodi di stima

Esistono diversi metodi per stimare i parametri incogniti di una distribuzione.

Riporteremo brevemente nel seguito lo stimatore di massima verosimiglianza Stimatore

di massima

verosimi-

glianza

(Maximum Likelihood Estimator – MLE) che e molto utilizzato e per il quale

rimandiamo alla letteratura specifica per una trattazione completa. Riportiamo

di seguito una breve descrizione.

Date n osservazioni X1, . . . , Xn, assumiamo che esse siano ottenute da una distri-

buzione di probabilita continua avente densita fθ(x), dove θ e un parametro che

caratterizza la distribuzione. Nell’ipotesi che le osservazioni Xi sono indipendenti,

una misura della probabilita di aver ottenuto quelle osservazioni proprio da quella

distribuzione (se θ e il valore del parametro incognito) e data dalla funzione di

verosimiglianza

L(θ) = fθ(X1)fθ(X2) · · · fθ(Xn).

Nel caso di distribuzioni di probabilita discrete con funzione di probabilita data

da pθ(x), la funzione di verosimiglianza e definita da

L(θ) = pθ(X1)pθ(X2) · · · pθ(Xn).

Il metodo della massima verosimiglianza consiste nello scegliere come stimatore

del parametro incognito θ il valore θ che massimizza L(θ).

In generale, puo non essere facile massimizzare la funzione di verosimiglianza e

naturalmente la difficolta aumenta se la distribuzione ha piu di un parametro

e quindi la funzione L sara una funzione di piu variabili. Nell’effettuare que-

sta operazione di massimizzazione invece di considerare la funzione L(θ) si puo

considerare la funzione

`(θ) = lnL(θ)

ovvero il logaritmo della funzione di verosimiglianza (log-likelihood function) che Log-

likelihood

function

potrebbe essere piu facile da massimizzare. Infatti, poiche la funzione logaritmo

e una funzione strettamente crescente, un valore θ massimizza L(θ) se e solo se θ

massimizza `(θ). Si osservi, comunque, che l’operazione di massimizzazione non

e sempre facile e che potrebbe anche essere necessario ricorrere a metodi numerici

per risolvere l’equazione che si ottiene dall’annullamento della derivata.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 18: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

188 ELEMENTI DI STATISTICA

Esempio 3.3.3 Date n osservazioni X1, . . . , Xn dalla distribuzione esponenziale, deter-

minare con il metodo della massima verosimiglianza il parametro λ della distribuzione.

La funzione di verosimiglianza e data da

L(λ) = (λe−λX1)(λe−λX1) · · · (λe−λXn) = λne−λ∑ni=1Xi = λne−λnXn .

Uguagliando a zero la derivata (rispetto a λ) si ha

dL(λ)

dλ= nλn−1e−λnXn

(1− λXn

)= 0,

da cui si ha λ =1

Xn. Poiche si ha

d2L(λ)

dλ2< 0, λ e un punto di massimo per la funzione

L(λ). Il valore ottenuto per λ non ci sorprende perche la media campionaria e uno

stimatore corretto della media della distribuzione che e 1/λ.

Allo stesso risultato si puo arrivare considerando la funzione log-likelihood, ovvero

`(λ) = lnL(λ) = n lnλ− λn∑i=1

Xi.

Infatti si had`

dλ=n

λ−

n∑i=1

Xi = 0

per λ =1

Xned inoltre

d2`(λ)

dλ2= − n

λ2< 0.

Esempio 3.3.4 Date n osservazioni X1, . . . , Xn dalla distribuzione geometrica, determi-

nare con il metodo della massima verosimiglianza il parametro p ∈ (0, 1) della distribuzio-

ne. La distribuzione geometrica e una distribuzione di probabilita discreta caratterizzata

da

pp(x) =

{p(1− p)x se x = 1, 2, . . .

0 altrimenti.

La funzione di verosimiglianza e data da

L(p) = pp(X1)pp(X2) · · · pp(Xn) = p(1−p)X1p(1−p)X2 · · · p(1−p)Xn = pn(1−p)∑ni=1Xi .

Si ha

`(p) = lnL(p) = n ln p+

n∑i=1

Xi ln(1− p).

Annulliamo quindi la derivata della `(p), ottenendo

d`(p)

dp=n

p−

n∑i=1

Xi

1− p= 0.

Risolvendo l’equazione si ottiene

p =1

1 + Xn

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 19: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STIMA DI PARAMETRI 189

e poiche risultad2`(p)

dp2< 0,

allora p e un massimo per la `(p) e quindi anche per la funzione di massima verosimi-

glianza L(p).

Esercizio 3.3.5 Siano date n osservazioni indipendenti X1, . . . , Xn estratte dalla distri-

buzione di Poisson di parametro λ. Determinare lo stimatore di massima verosimiglianza

del parametro λ.

3.3.4 Stime per intervalli

Nei metodi di stima puntuale e sempre presente un errore θ − θ dovuto al fatto

che la stima θ in genere non coincide con il parametro θ. Sorge quindi l’esi-

genza di determinare una misura dell’errore commesso. Inoltre, dato il campio-

ne X1, . . . , Xn estratto da una distribuzione di probabilita caratterizzata da un

parametro incognito θ, qualunque sia lo stimatore h(X1, . . . , Xn) scelto per sti-

mare θ, esso dipende dal campione, ovvero lo stimatore fornira stime diverse in

corrispondenza di campioni diversi.

Queste due osservazioni fanno nascere l’esigenza di considerare stime per inter-

valli. Infatti, sulla base dei valori di θ ottenuti considerando un campione casuale

X1, . . . , Xn, si puo definire un intervallo in cui sono compresi i valori piu probabili

per il parametro θ, secondo un “livello di confidenza” fissato. Per fare cio si puo

procedere indirettamente utilizzando una statistica campionaria g(X1, . . . , Xn) la

cui distribuzione sia nota e non dipendente da θ. Naturalmente, visto che la g e

nota, fissato un livello di confidenza (1 − α), e possibile determinare due valori

g1 e g2, indipendenti da θ tali che, comunque scelto α ∈ (0, 1),

P (g1 ≤ g ≤ g2) = 1− α.

Lo scopo e quello di tradurre una probabilita su un intervallo per g in una pro-

babilita su intervallo per θ in modo da poter avere

P (h1 ≤ θ ≤ h2) = 1− α,

ovvero in modo tale che h1 e h2 rappresentino gli estremi dell’intervallo per θ.

Le distribuzioni note alle quali si fa di solito riferimento sono la distribuzione

Normale, la distribuzione t di Student e la distribuzione Chi–quadro.

Lo scopo sara quello di avere un valore ben superiore a 0.5 in modo che la pro-

babilita che il parametro θ appartenga all’intervallo [h1, h2] sia tale da assicurare

all’evento h1 ≤ θ ≤ h2 (evento che si verifica nel 100(1−α)% dei casi) una carat-

teristica di “sistematicita”, mentre all’evento complementare (che si verifica nel

100α% dei casi) una caratteristica di “accidentalita”.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 20: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

190 ELEMENTI DI STATISTICA

Formalmente si puo fornire la seguente definizione.

Definizione 3.3.6 Intervallo di confidenza. Dato un campione

X1, . . . , Xn, dato α ∈ (0, 1) e date le statistiche h1 = h1(X1, . . . , Xn) e

h2 = h2(X1, . . . , Xn) con h1 < h2, per le quali

P (h1 ≤ θ ≤ h2) = 1− α,

l’intervallo [h1, h2] si dice intervallo di confidenza per θ con livello di confidenza

pari ad (1− α).

Naturalmente tanto piu e piccolo α, tanto piu e ampio l’intervallo di confidenza

ad esso associato.

3.3.5 Stima per intervalli di una media

Siano date le osservazioni X1, . . . , Xn estratte da una distribuzione di probabilita

a media µ e varianza σ2. Assumiamo inizialmente che la media µ sia incogni-

ta mentre la varianza sia nota. Dalla Proposizione 3.2.1 sappiamo che per nCaso

varianza

nota

sufficientemente grande, la variabile aleatoria

Zn =Xn − µσ√n

(3.3.1)

e distribuita approssimativamente secondo la distribuzione Normale standard,

indipendentemente dalla distribuzione delle Xi. Quindi per n sufficientemente

grande risulta

P(−z1−α

2≤ Zn ≤ z1−α

2

)= P

(−z1−α

2≤ Xn − µ

σ√n

≤ z1−α2

)' 1− α,

dove z1−α2

e il punto critico (1 − α2 ) per una distribuzione Normale standard e

puo essere immediatamente determinato dai valori tabulati1

Segue che

P

(Xn − z1−α

2

σ√n≤ µ ≤ Xn + z1−α

2

σ√n

)' 1− α.

Quindi, per n sufficientemente grande, il valore incognito di µ si trova nell’inter-

vallo [Xn − z1−α

2

σ√n

, Xn + z1−α2

σ√n

]

1Sono ampiamente disponibili tabelle che, per una variabile Normale standard Z, riportano il valore di

P (Z ≤ z) = 1√2π

∫ z−∞ e−

y2

2 dy.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 21: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STIMA DI PARAMETRI 191

con un livello di confidenza pari a 1− α. Si parla di intervallo di confidenza del

100(1− α)%.

Ad esempio, per determinare un intervallo di confidenza al 95% per una media,

dato un campione X1, . . . , Xn, si trova il punto critico z1−α2

= z0.975 = 1.96 dalle

tabelle della distribuzione Normale standard e facilmente si ricava tale intervallo[Xn − 1.96

σ√n

, Xn + 1.96σ√n

].

Si noti che l’intervallo di confidenza puo contenere o meno il valore della media

µ. Questo implica che un singolo intervallo di confidenza, da un punto di vista

probabilistico, fornisce informazioni non complete. La corretta interpretazione

dell’intervallo di confidenza e la seguente: se si costruisce un numero molto elevato

di intervalli di confidenza al 100(1 − α)%, indipendenti e ciascuno basato su n

osservazioni, con n sufficientemente grande, una frazione di questi intervalli pari

ad 1 − α conterra µ. Questa frazione si chiama copertura per l’intervallo di

confidenza. Quindi solamente una proporzione α di casi dara luogo ad intervalli

che non contengono µ.

Osservazione 3.3.7 Affermare che l’intervallo di confidenza, ad esempio per

una media µ e al 100(1− α)% non significa che la probabilita che µ appartenga

a questo intervallo e pari a (1 − α)%; questo perche prima di osservare i dati si

puo parlare di probabilita che l’intervallo che si otterra contenga µ in quanto gli

estremi dell’intervallo sono variabili aleatorie. Dopo l’osservazione dei dati, ovvero

dopo aver determinato gli estremi dell’intervallo, si puo solamente affermare che

l’intervallo trovato contiene µ con il 100(1 − α)% di confidenza in quanto non

si ha a che fare con nessuna variabile aletoria (µ e incognita, ma costante e gli

estremi dell’intervallo, una volta determinati sono valori numerici).

Quanto esposto fino ad ora assume che la varianza σ2 sia nota. Se invece σ2 non

si conosce sono necessarie altre considerazioni. Infatti, anche se la varianza σ2 Caso

varianza

non nota

non e nota, considerando la varianza campionaria s2n, poiche si ha

limn→∞

s2n = σ2,

il Teorema del Limite Centrale continua a valere se nell’espressione (3.3.1) della

Zn sostituiamo σ2 con la sua stima s2n. Questo significa che, per n sufficientemente

grande la variabile

Zn =Xn − µsn√n

,

e approssimativamente distribuita secondo la distribuzione Normale standard.

Quindi di ha

P

(Xn − z1−α

2

sn√n≤ µ ≤ Xn + z1−α

2

sn√n

)' 1− α,

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 22: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

192 ELEMENTI DI STATISTICA

dove z1−α2

e il punto critico (1− α2 ) per una distribuzione normale standard.

Quindi, per n sufficientemente grande, con livello di confidenza 1 − α il valore

incognito di µ si trova nell’intervallo[Xn − z1−α

2

sn√n

, Xn + z1−α2

sn√n

].

Esempio 3.3.8 Siano dati i seguenti valori di dieci osservazioni 1.20, 1.50, 1.68, 1.89,

0.95, 1.49, 1.58, 1.55, 0.50, 1.09, da una distribuzione Normale a media e varianza non

note. Si ricava facilmente che X10 = 1.34 e s210 = 0.17. Volendo costruire un intervallo di

confidenza al 90% per la media si ha 1−α = 0.90, ovvero 1− α2

= 0.95. Dalla tavola dei

valori di P (Z ≤ z) per Z variabile Normale standard si ricava che risulta P (Z ≤ c) = 0.95

per c = 1.65, ovvero z1−α/2 = z0.95 = 1.65. Quindi gli estremi dell’intervallo richiesto

sono dati da

Xn ± z1−α2

√s2n

n= X10 ± z0.95

√s2

10

10= 1.34± 1.65

√0.017.

Pertanto l’intervallo di confidenza richiesto e dato da [1.12 , 1.55].

La difficolta nell’utilizzare questo tipo di intervallo di confidenza per µ sta nel

fatto che esso ha valore asintotico, ovvero per n sufficientemente grande e quindi

risulta approssimato. Inoltre il valore di n per cui la Fn(z) approssima bene

la funzione di distribuzione di una variabile Normale standard dipende dalla

distribuzione delle osservazioni Xi. Se si scelgono valori di n troppo piccoli si

ottiene una copertura di un intervallo di confidenza al 100(1 − α)% inferiore

a 1 − α. In questo caso, ovvero per valori piccoli di n si puo utilizzare una

definizione alternativa dell’intervallo di confidenza che fa riferimento non piu alla

distribuzione Normale standard, ma alla distribuzione t di Student a n− 1 gradi

di liberta. Dalla Proposizione 3.2.3 si ha che se le Xi sono variabili Normali, la

variabile

Zn =Xn − µsn√n

ha distribuzione t di Student con n − 1 gradi di liberta per ogni n > 1. Quindi,

per ogni n > 1 un intervallo di confidenza esatto al 100(1− α)% e dato da[Xn − tn−1,1−α

2

sn√n

, Xn + tn−1,1−α2

sn√n

],

dove tn−1,1−α2

e il punto critico 1− α2

per una distribuzione t di Student ad n− 1t intervallo

di confiden-

zagradi di liberta2. Questo intervallo si chiama t intervallo di confidenza.

2Anche in questo caso sono disponibili tavole che riportano valori tabulati di tali punti critici

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 23: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

STIMA DI PARAMETRI 193

Poiche risulta tn−1,1−α2> z1−α

2l’intervallo di confidenza definito in riferimento

alla distribuzione t di Student e piu ampio di quello definito in riferimento alla

distribuzione Normale standard.

Esempio 3.3.9 Volendo determinare il t intervallo di confidenza nel caso delle osserva-

zioni dell’Esempio 3.3.8 e sufficiente ricavare dai valori tabulati il valore di t9,0.95 che e

pari a 1.83. Quindi l’intervallo di confidenza richiesto e dato da [1.10 , 1.58].

Tuttavia anche questo secondo tipo di intervallo di confidenza presenta aspetti

problematici; infatti, nella sua definizione si assume che le osservazioni Xi sono

estratte da una distribuzione Normale e poiche questa assuzione, in generale, non

e verificata, anche questo tipo di intervallo di confidenza e, di fatto, approssimato.

In conclusione, possiamo dire che l’intervallo di confidenza definito in riferimento

alla distribuzione Normale standard e basato sul Teorema del Limite Centrale

e la copertura dipende dalla scelta di n. L’intervallo di confidenza definito in

riferimento alla distribuzione t di Student e approssimato perche influenzato dalla

distribuzione delle Xi che in generale non sono Normali; tuttavia questo secondo

tipo di intervallo di confidenza ha maggiore copertura dell’altro.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 24: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

194 ELEMENTI DI STATISTICA

3.4 TEST DELLE IPOTESI

Nel cercare di costruire un legame tra dati osservati e ipotesi teoriche sulle carat-

teristiche dell’intera popolazione si deve, in genere, prendere una decisione per il

raggiungimento di tale conclusione generale e nasce il problema di esprimere un

giudizio di plausibilita di un’ipotesi che si e specificata per la popolazione. Per

verificare la coerenza tra osservazioni e ipotesi fatta si fa uso di test statistici che

prendono nome di test delle ipotesi. In sintesi, possiamo dire che tali test devono

confrontare i valori osservati e i corrispondenti valori teorici attesi condiziona-

tamente all’ipotesi fatta. Le differenze che vengono riscontrate possono essere

ovviamente ricondotte a due possibilita:

• l’ipotesi specificata e corretta e la differenza riscontrata e puramente casua-

le;

• l’ipotesi specificata e errata e quindi non ci si puo aspettare che i due valori

siano “vicini”.

Il procedimento consiste nel confrontare due ipotesi: l’ipotesi da sottoporre a ve-

rifica e il suo complemento. Si indica con H0 il sottoinsieme dei valori individuati

dall’ipotesi da sottoporre a verifica che viene detta ipotesi nulla, mentre il suo

complemento si indica con H1 e viene detto ipotesi alternativa. Si osservi che se

un test di ipotesi non scarta l’ipotesi H0, questo non vuol dire che H0 e accettata

come vera, ma solamente che essa non deve essere scartata, ovvero che puo essere

considerata possibile.

Si parla di errore di I specie se il test porta a rifiutare un’ipotesi H0 quando questa

e corretta e di errore di II specie se il test porta ad accettare H0 quando questa e

falsa. Si noti che l’obiettivo non e quello di dire se l’ipotesi fatta e vera o falsa, ma

piuttosto di verificare se l’ipotesi fatta sia compatibile con i dati. In genere, c’e

un ampio margine di tolleranza nell’accettare H0, mentre per rifiutarla occorre

che i dati siano veramente poco probabili quando H0 dovesse essere corretta. Per

ottenere questo, si specifica un valore α, detto livello di significativita e si impone

che il test sia tale che, quando l’ipotesi H0 e corretta, la probabilita che essa venga

scartata e non superiore ad α. Quindi un test con livello di significativita pari

ad α deve essere tale che una probabilita di commettere un errore di I specie e

minore o uguale ad α.

Rimandiamo alla letteratura specifica per una trattazione generale dei test d’ipo-

tesi; nel seguito faremo esclusivamente riferimento al problema di decidere se le

osservazioni sono un campione indipendente di una particolare distribuzione di

probabilita con funzione di distribuzione F . Ovvero, si vuole utilizzare un test

delle ipotesi per avvalorare o smentire un’ipotesi fatta sulla distribuzione di pro-

babilita che meglio rappresenta tali dati. Quindi, date le osservazioni X1, . . . , Xn,

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 25: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

TEST DELLE IPOTESI 195

l’ipotesi da sottoporre a verifica e la seguente:

H0 ={X1, . . . , Xn sono variabili aleatorie indipendenti,

identicamente distribuite con funzione di distribuzione F}

Esistono diversi test di ipotesi; consideriamone brevemente nel seguito due, ri-

mandando alla letteratura specifica per una trattazione completa.

3.4.1 Test Chi–quadro

Siano X1, . . . , Xn variabili aleatorie indipendenti identicamente distribuite. Per

applicare il test si effettua il seguente procedimento: si suddivide il range della

distribuzione in k intervalli adiacenti

[a0, a1) , [a1, a2) , [a2, a3) , . . . [ak−1, ak) ,

dove puo anche essere a0 = −∞ e/o ak =∞. Si definisce ora Nj come il numero

delle Xi contenute nell’intervallo j-esimo, ovvero in [aj−1, aj) per j = 1, 2, . . . k.

Naturalmente risulta∑k

j=1Nj = n. Si calcola la proporzione pj che le Xi cadono

nell’intervallo j-esimo se le osservazioni fossero dalla distribuzione ipotizzata,

ovvero

pj =

∫ aj

aj−1

f(x)dx nel caso continuo∑aj−1≤xi<aj

p(xi) nel caso discreto

dove f(x) e la densita di probabilita della distribuzione ipotizzata nel caso con-

tinuo e p(xi) sono i valori della distribuzione di probabilita nel caso discreto. Si

definisce

χ2 =

k∑j=1

(Nj − npj)2

npj. (3.4.1)

Poiche npj e il numero atteso che n Xi cadano nell’j-esimo intervallo se l’ipotesi

H0 fosse vera, ci si puo aspettare che χ2 sia piccolo se la distribuzione ipotizzata

realizza un buon fitting delle X1, . . . , Xn e quindi l’ipotesi H0 e scartata se χ2 e

troppo grande.

Per effettuare praticamente il test dobbiamo considerare il caso in cui tutti i

parametri della distribuzione sono noti e il caso in cui questo non avviene. Il test

Chi-quadro puo essere effettuato in entrambi i casi.

Nel primo caso, se α e il livello di significativita del test, si vuole trovare la Caso para-

metri noticosiddetta “regione critica”, ovvero si vuole calcolare un valore z tale che

PH0(χ2 ≥ z) = α,

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 26: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

196 ELEMENTI DI STATISTICA

dove la notazione PH0 indica il condizionamento della probabilita al fatto che H0

sia vera. Il test dovra rifiutare l’ipotesi nulla quando il valore osservato per χ2 e

superiore a z. Il valore critico z puo essere ottenuto utilizzando il fatto che, se

l’ipotesi H0 e vera, allora χ2 per n → ∞ converge alla distribuzione Chi–quadro

con k− 1 gradi di liberta. Percio, per n grande, un test con livello di accuratezza

α e ottenuto scartando H0 se

χ2 > χ2k−1,1−α

dove χ2k−1,1−α e il punto critico 1− α per la distribuzione Chi–quadro con k − 1

gradi di liberta3.

Se invece, alcuni parametri fossero non noti, c’e da considerare il fatto che le pjCaso con

parametri

non noti

derivano dalla distribuzione ipotizzata, ma con parametri stimati. In particolare,

supponendo che siano presenti m parametri non noti e che siano stimati con il

metodo della massima verosimiglianza, si usano queste stime per calcolare

χ2 =

k∑j=1

(Nj − npj)2

npj,

dove rispetto alla (3.4.1), le pj sono state sostituite dalle pj che sono ottenute

utilizzando la distribuzione con i parametri stimati. In questo caso si puo dimo-

strare che, se l’ipotesi H0 e vera, allora χ2 per n→∞ converge alla distribuzione

Chi–quadro con k−1−m gradi di liberta (si perdono tanti gradi di liberta quanti

sono i parametri). Il test con livello di significativita α diventa il seguente: si

scarta H0 se

χ2 > χ2k−1−m,1−α,

dove χ2k−1−m,1−α e il punto critico 1 − α per la distribuzione Chi–quadro con

k − 1−m gradi di liberta

L’aspetto piu problematico nell’effettuare il test Chi–quadro e la scelta del nume-

ro e dell’ampiezza degli intervalli. E un problema difficile e non c’e una risposta

definitiva, ma solo delle linee guida da seguire per le quali si rimanda ai testi spe-

cifici. Diciamo solo che e opportuno scegliere gli intervalli in modo tale che risulti

p1 = p2 = · · · = pk (equiprobabilita) e, in questo caso, basandosi su osservazioni

empiriche si e visto che il test Chi-quadro e valido se k ≥ 3 e npj ≥ 5 nel caso con-

tinuo; nel caso discreto e opportuno avere tutti i valori npj approssimativamente

uguali e pari ad almeno a 5.

Nonostante queste difficolta il test Chi–quadro e molto utilizzato perche puo

essere applicato ad ogni distribuzione ipotizzata, mentre altri test non hanno

questa flessibilita.

3Sono disponibili tavole che riportano i valori di questi punti critici

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 27: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

TEST DELLE IPOTESI 197

Esercizio 3.4.1 Supponiamo di monitorare il numero di automobili che passano ad un

casello autostradale tra le 7.00 e le 7.05 di giorni feriali per 100 giorni, ottenendo il

seguente risultato (numero di auto/frequenza)

numero automobili: 0 1 2 3 4 5 6 7 8 9 10 11

frequenze: 12 10 19 17 10 8 7 5 5 3 3 1

Ovvero, in 12 casi e stato osservato il passaggio di 0 auto, in 10 casi e stato osservato

il passaggio di 1 auto, etc. Supponiamo di essere nella fase di analisi dell’input di una

simulazione e di voler quindi scegliere una distribuzione di input che meglio rappresenti

questi dati. A tale scopo, supponiamo di aver scelto come distribuzione teorica ipotizzata

la distribuzione di Poisson di parametro 3.64. Applicare il test di ipotesi Chi-quadro con

un livello di significativita α = 0.05 per valutare l’adattamento di questa distribuzione

ai dati, ovvero si assuma p(x) =e−λλx

x!, x = 0, 1, 2, . . ., con λ = 3.64. Nell’applicazione

del test considerare i seguenti 7 intervalli: [0, 2), [2, 3), [3, 4), [4, 5), [5, 6), [6, 7),

[7, 11]. Considerare i due casi in cui il parametro λ e stimato oppure e noto.

3.4.2 Test di Kolmogorov–Smirnov

Un altro test di ipotesi che viene spesso preso in considerazione e basato sul con-

fronto tra una funzione di distribuzione empirica e la funzione di distribuzione F

della distribuzione ipotizzata: si tratta del test di Kolmogorov–Smirnov che come

pregio maggiore ha quello di essere valido per ogni dimensione n del numero delle

osservazioni, mentre il test chi–quadro e valido in senso asintotico. L’inconve-

niente maggiore e invece rappresentato dalla limitata applicabilita del test che,

almeno nella sua forma originaria, e valido se tutti i parametri della distribuzione

ipotizzata sono noti, ovvero non stimati dai dati e se la distribuzione e continua.

Esistono estensioni del test al caso in cui i parametri sono stimati solo in riferi-

mento a particolari distribuzioni come la distribuzione normale e la distribuzione

esponenziale.

Siano X1, . . . , Xn variabili aleatorie indipendenti con funzione di distribuzione

F e siano dati i valori x1, . . . , xn i valori osservati di X1, . . . , Xn, ovvero siano

essi una realizzazione delle variabili aleatorie. Si puo definire un’approssimazione

empirica Fe della F nel seguente modo:

Fe(x) =|{i : xi ≤ x}|

n=

numero delle xi ≤ xn

.

Fe e la percentuale dei dati del campione che sono minori o uguali di x, ovvero

Fe e la funzione di ripartizione della variabile aleatoria discreta che assume con

la stessa probabilita gli n valori osservati.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 28: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

198 ELEMENTI DI STATISTICA

In pratica, ordinando le xi per valori crescenti in modo che si abbia

x(1) ≤ x(2) ≤ · · · ≤ x(n), risulta

Fe(x) =

0 se x < x(1)

i

nse x(i) ≤ x ≤ x(i+1)

1 se x(n) ≤ x.

Se F (x) e la funzione di distribuzione ipotizzata, una valutazione naturale della

“bonta” dell’approssimazione e data da una qualche misura di “vicinanza” tra le

funzioni Fe e F . Una misura dello scostamento puo essere definita da

D = max{∣∣∣Fe(x)− F (x)

∣∣∣} .D e detta statistica del test di Kolmogorov–Smirnov.

Considerando separatamente il caso in cui Fe(x) − F (x) ≥ 0 e il caso in cui

Fe(x) − F (x) ≤ 0, poiche F e una funzione non decrescente, si possono definire

le quantita D+ e D− e risulta

D+ = maxx

{Fe(x)− F (x)

}= max

1≤i≤n

{i

n− F (x(i))

}D− = max

x

{F (x)− Fe(x)

}= max

1≤i≤n

{F (x(i))−

i− 1

n

}.

Quindi si ha

D = max{D+ , D−

}.

Chiaramente, un valore grande di Dn indica che l’approssimazione non e molto

buona e quindi si scarta l’ipotesi H0 se

D > dn,1−α, (3.4.2)

dove dn,1−α sono costanti che, in generale, possono dipendere dalla distribuzione

ipotizzata e dove α e il livello di accuratezza del test.

E importante notare che se tutti i parametri della F sono noti e non stimati,

allora si puo dimostrare che la distribuzione di D non dipende dalla particolare

distribuzione ipotizzata e questo permette di utilizzare una sola tabella di valori

per dn,1−α per tutte le distribuzioni continue.

Sempre nel caso di tutti i parametri noti, e stato verificato che una buona

approssimazione si ottiene utilizzando al posto di (3.4.2) il seguente test(√n+ 0.12 +

0.11√n

)D > c1−α

dove c1−α sono costanti non dipendenti da n delle quali si dispone di valori

tabellati riportati nella Tabella 3.4.1.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 29: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

TEST DELLE IPOTESI 199

1− α 0.85 0.90 0.95 0.975 0.99

c1−α 1.138 1.224 1.358 1.480 1.628

Tabella 3.4.1 Valori delle costanti c1−α nel caso in cui tutti i parametri sono noti

Esistono alcuni casi particolari in cui il test di Kolmogorov–Smirnov puo essere

applicato anche se i parametri sono non noti, ovvero sono stimati. Due casi impor-

tanti in cui questo accade sono il caso in cui la distribuzione ipotizzata e Normale

con media µ e varianza σ2 non note, ma entrambe stimate rispettivamente con

Xn e s2n e il caso in cui la distribuzione ipotizzata e esponenziale di parametro

incognito λ essendo λ stimato con il metodo della massima verosimilianza ovvero

λ = 1/Xn.

1) Nel caso in cui la distribuzione ipotizzata e Normale con media e varian-

za stimate rispettivamente con Xn e s2n, si definisce la funzione F come

la funzione di distribuzione di una Normale a media Xn e varianza s2n.

Utilizzando questa funzione F si procede analogamente al caso precedente

calcolando D; cambia pero il test in quanto e stato visto che un buon livello

di accuratezza si ottiene scartando H0 se risulta(√n− 0.01 +

0.85√n

)D > c′1−α

dove c′1−α sono i valori riportati nella Tabella 3.4.2.

1− α 0.85 0.90 0.95 0.975 0.99

c′1−α 0.775 0.819 0.895 0.955 1.035

Tabella 3.4.2 Valori delle costanti c′1−α nel caso in cui la distribuzione ipotizzata e Normale

2) Nel caso in cui la distribuzione ipotizzata e esponenziale in cui il parametro

incognito λ e stimato con il metodo della massima verosimilianza ovvero

λ = 1/Xn, si definisce la funzione F come la funzione di distribuzione della

distribuzione esponenziale di parametro 1/Xn, ovvero F (x) = 1 − e−x/Xn ,

x ≥ 0, e si calcola D. In questo caso il test prevede di scartare H0 se(D − 0.2

n

)(√n+ 0.26 +

0.5√n

)> c′′1−α

dove c′′1−α sono i valori riportati nella Tabella 3.4.3.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 30: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

200 ELEMENTI DI STATISTICA

1− α 0.85 0.90 0.95 0.975 0.99

c′′1−α 0.926 0.990 1.094 1.190 1.308

Tabella 3.4.3 Valori delle costanti c′′1−α nel caso in cui la distribuzione ipotizzata e esponenziale

Esercizio 3.4.2 Nel definire una distribuzione di probabilita durante l’analisi dell’input

di una simulazione, si hanno a disposizione i seguenti dati:

81, 72, 94, 66.

Utilizzare il test di Kolmogorov-Smirnov per verificare l’ipotesi che la distribuzione espo-

nenziale con media 100 approssima bene questi dati con un livello di significativita α pari

al 2.5%.

3.4.3 Il p-value

Il risultato di un test delle ipotesi porta a scartare o meno l’ipotesi H0: essa si

scarta quando la statistica del test (ovvero χ2 nel test Chi–quadro o D nel test

Kolmogorv–Smirnov) superano il valore del punto critico. Tuttavia non viene

specificato quanto la statistica del test dista dal valore critico. Si puo allora

definire una probabilita che fornisce una misura della distanza della statistica del

test dal valore critico: si definisce p-value o p-dei-dati come l’estremo inferiore

dei livelli di significativita che porterebbe a rifiutare H0. Quindi se il livello α e

maggiore di tale probabilita (il p-value), l’ipotesi H0 viene scartata, altrimenti

non viene scartata. La probabilita data dal p-value fornisce quindi il livello di

significativita critico scendendo al di sotto del quale la decisione cambia da rifiuto

dell’ipotesi a non rifiuto.

Poiche il p-value e il livello di significativita al di sopra del quale si scarta H0,

valori grandi del p-value indicano un buon adattamento della distribuzione ipotiz-

zata ai dati, mentre valori piccoli del p-value indicano che il fitting non e buono.

Sulla base di cio, molti software operano calcolando il p-value in corrisponden-

za di diverse distribuzioni e decidono che la piu adatta a rappresentare i dati e

quella alla quale corrisponde il p-value piu grande. Questa opzione disponibile in

molti software deve essere tuttavia eventualemte utilizzata con estrema cautela,

in quanto e possibile che sulla sola base del valore del p-value non si abbiano

risposte adeguate.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 31: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

4

4.1 ESERCIZI DI RIEPILOGO

Esercizio 4.1.1 Dato un sistema M/M/2 con frequenza media di arrivo pari a λ

e velocita di servizio pari a µ, con λ < 2µ

• Scrivere le equazioni di Kolmogorov relative al processo di nascita e morte

al quale si puo ricondurre questo sistema;

• ricavare un’espressione di pn in funzione di λ e µ.

Esercizio 4.1.2 In un fast–food e previsto il servizio “drive”, ovvero si raggiunge

con l’auto una piattaforma e si viene serviti senza scendere dall’auto. Viene

servita un’auto alla volta e attualmente c’e spazio solamente per 3 auto in attesa.

Gli arrivi dei clienti sono poissoniani con in media 40 auto l’ora e i tempi di

servizio sono distribuiti esponenzialmente con media di 50 auto l’ora. Il profitto

medio che il gestore ricava dall’effettuazione di un servizio e di 0.50 Euro. Inoltre

il gestore puo affittare altri spazi auto a 9 Euro al giorno. Il fast–food e aperto

24 ore su 24. Determinare se e conveniente affittare posti auto aggiuntivi e, in

caso affermativo, calcolare quanti.

Esercizio 4.1.3 In un ciclo produttivo di un’industria c’e una stazione di ispezione

il cui servizio consiste nell’effettuare un controllo su un pezzo semilavorato e che

ha un ciclo operativo costante di 6 minuti. Gli arrivi alla stazione di ispezione

sono poissoniani alla media di 4 pezzi l’ora. Determinare

• il numero medio di pezzi presenti in coda in attesa di essere lavorati dalla

stazione di ispezione;

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 32: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

202

• il numero medio di pezzi presenti nel sistema;

• il tempo medio di attesa di un pezzo in coda prima di essere lavorato;

• il tempo medio di permanenza nel sistema.

Senza effettuare il calcolo diretto, ma utilizzando i valori gia calcolati, dedurre i

valori del tempo medio di attesa in coda e il numero medio di pezzi in coda nel

caso in cui i tempi di servizio fossero esponenziali.

Esercizio 4.1.4 Presso un ambulatorio medico arrivano i pazienti ad intervalli

medi di 20 minuti e sono necessari, in media 15 minuti per la visita medica. Si

assume che gli arrivi sono poissoniani e che i tempi di durata delle visite sono

esponenziali. Il medico desidera avere sufficienti posti a sedere tra la sala d’attesa

dell’ambulatorio e quello su cui siede il paziente durante la visita in modo che non

piu dell’1% dei pazienti deve attendere in piedi. Quante sedie dovra acquistare ?

Esercizio 4.1.5 Supponiamo che in 10 repliche indipendenti di una simulazione,

una variabile aleatoria assuma i seguenti valori Xj : 9.98, 10.07, 9.94, 10.22, 9.98,

10.01, 10.11, 10.01, 9.99, 9.92. Determinare la stima della media e l’intervallo t

di confidenza al 95%.

Esercizio 4.1.6 In un ufficio postale ci sono 6 sportelli cassa che operano dalle 8

alle 14. Assumiamo che i clienti arrivino secondo Poisson con frequenza di 2 al

minuto, e che i tempi di servizio di ciascun servente sono uniformemente distri-

buiti tra 2 e 3 minuti. Effettuando 10 repliche indipendenti di una simulazione,

si ottengono i seguenti valori per il numero medio degli utenti in coda

numero replica valore

1 1.49

2 1.64

3 1.95

4 1.45

5 1.51

6 1.55

7 1.88

8 1.36

9 1.78

10 1.46

Determinare se le 10 repliche effettuate sono sufficienti per stimare il numero

medio di utenti in coda con un errore relativo pari a 0.07 e un intervallo di

confidenza al 90%. Dire, inoltre, motivando la risposta, se si possono utilizzare

le formule per le misure di prestazione di un sistema di code M/G/s per studiare

questo problema.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 33: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

BIBLIOGRAFIA 203

Bibliografia

Altiok, T., Melamed, B. (2007). Simulation Modeling and Analysis with

ARENA. Academic Press, Amsterdam.

Banks, J. (1998). Handbook on Simulation. Principles, Methodology, Advances,

Applications, and Practice. Wiley and Sons, New York.

Banks, J., J.S.Carson, Nelson, B., Nicol, D. (2001). Discrete–event system

simulation. Prentice Hall.

Bertsekas, D., Gallager, R. (1991). Data Networks. Prentice Hall, Upper

Saddle River, NJ, second edition.

Bhat, U. (2008). An Introduction to Queueing Theory. Birkhauser, Boston.

Billingsley, P. (1979). Probability and mesaure. Wiley and Sons, New York.

Bratley, P., Fox, B., Schrage, L. (1987). A guide to simulation. Springer–

Verlag, New York, second edition.

Cooper, R. (1981). Introduction to queueing theory. North Holland, New York.

Fu, M., editor (2014). Handbook on Simulation Optimziation. Springer, New

York.

Gross, D., Harris, C. (1998). Fundamental of queueing theory. Wiley and

Sons, New York, third edition.

Hillier, F., Lieberman, G. (2001). Introduction to Operations Research.

McGraw – Hill, New York.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 34: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

204 BIBLIOGRAFIA

Joines, J., Roberts, S. (2012). Simulation Modeling with SIMIO: a workbook.

SIMIO LCC, Sewickley, second edition.

Kelton, W., Sadowski, R., Sturrock, D. (2004). Simulation with Arena.

McGraw – Hill, New York, third edition.

Kelton, W., Smith, J., Sturrock, D. (2011). Simio & Simulation. Modeling,

Analysis, Applications. McGraw – Hill, Boston, second edition.

Kleinrock, L. (1975). Queueing systems, vol. I: Theory. Wiley, New York.

Disponibile nella traduzione italiana: Sistemi a coda, Introduzione alla teoria

delle code, Hoepli, 1992.

Kleinrock, L. (1976). Queueing systems, vol. II: Computer Applications. Wiley,

New York.

Law, A., Kelton, W. (2000). Simulation modeling and analysis. McGraw –

Hill, New York, third edition.

Ross, S. (2002). Simulation. Academic Press, San Diego, third edition.

Ross, S. (2003a). Introduction to probability models. Academic Press, San Diego.

Ross, S. (2003b). Probabilita e statistica. Apogeo, Milano.

Rossetti, M. (2010). Simulation Modeling and Arena. Wiley, Hoboken.

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 35: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

Indice

Prefazione iii

Introduzione v

1 Teoria delle code 1

1.1 Generalita 3

1.1.1 Esempi reali di sistemi a coda 4

1.1.2 Componenti di un sistema di servizio 5

1.1.3 Notazione di Kendall 8

1.2 Problematiche di interesse e relazioni fondamentali 11

1.2.1 Definizioni e notazioni standard 11

1.2.2 Misure di prestazione 13

1.2.3 Relazioni fondamentali 17

1.3 Modelli stocastici dei processi di arrivo e di servizio 22

1.3.1 La distribuzione esponenziale e le sue proprieta 22

1.3.2 Il processo di Poisson 27

1.3.3 Altri modelli per processi di arrivo 32

1.4 Processi di nascita e morte 35

1.4.1 Preliminari 35

1.4.2 Proprieta di Markov. Catene di Markov a tempocontinuo 35

1.4.3 Processi di nascita e morte 37

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 36: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

206 INDICE

1.4.4 Le equazioni di Kolmogorov e la soluzionestazionaria 40

1.4.5 Equazioni di bilancio 45

1.4.6 Processi di sole nascite o sole morti 47

1.4.7 Sistemi a coda e processi di nascita e morte 50

1.5 Sistemi a coda basati su processi di nascita e morte 51

1.5.1 Sistemi con arrivi poissoniani: proprieta PASTA 52

1.5.2 Sistemi M/M/s 55

1.5.3 Sistemi M/M/s/K 68

1.5.4 Sistemi M/M/s/ · /U 74

1.5.5 Sistemi con velocita di servizio e frequenza di arrivodipendenti dallo stato 78

1.5.6 Sistemi M/M/∞ 81

1.6 Modelli di code con disciplina della coda basata su criteridi priorita 83

1.7 Sistemi a coda con distribuzioni non esponenziali 86

1.7.1 Sistemi M/G/1 86

1.7.2 Sistemi con arrivi non poissoniani 92

1.8 Reti di code 93

1.8.1 Generalita 93

1.8.2 Il processo delle partenze per i sistemi M/M/s 94

1.8.3 Serie di code 96

1.8.4 Reti di Jackson aperte 98

1.8.5 Reti di Jackson chiuse 106

1.9 Riferimenti del Capitolo 1 110

1.10 Esercizi di riepilogo 112

1.10.1 Esercizi sui sistemi a coda 112

1.10.2 Esercizi sulle reti di code 116

Appendice A: Formulario – Sistemi a coda 119

A.1 Modelli basati su processi di nascita e morte 119

A.1.1 Sistemi M/M/1 119

A.1.2 Sistemi M/M/s 120

A.1.3 Sistemi M/M/1/K 120

A.1.4 Sistemi M/M/s/K 121

A.1.5 Sistemi M/M/1/ · /U 121

A.1.6 Sistemi M/M/s/ · /U 122

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 37: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

INDICE 207

A.1.7 Sistemi con λ e µ dipendenti dallo stato – singoloservente 122

A.1.8 Sistemi con λ e µ dipendenti dallo stato –multiservente 123

A.1.9 Sistemi M/M/∞ 123

A.2 Modelli con distribuzioni non esponenziali 124

A.2.1 Sistemi M/G/1 124

A.2.2 Sistemi M/D/s 124

A.2.3 Sistemi M/Ek/1 124

A.3 Modelli con disciplina della coda basata su criteri dipriorita 125

A.3.1 Priorita senza interruzione del servizio 125

A.3.2 Priorita con interruzione del servizio – singoloservente 125

2 Simulazione 127

2.1 Generalita sui modelli di simulazione 128

2.1.1 Elementi di un modello di simulazione 128

2.1.2 Classificazione dei modelli si simulazione 130

2.1.3 Simulazione ad eventi discreti 130

2.1.4 Schema dello studio di un problema basato sullasimulazione 132

2.1.5 Applicazioni tipiche della simulazione 136

2.2 Analisi dell’input 137

2.2.1 Generalita 137

2.2.2 Scelta delle distribuzioni di input 138

2.2.3 Distribuzioni empiriche 139

2.2.4 Distribuzioni teoriche 140

2.2.5 Scelta di una distribuzione teorica 141

2.2.6 Scelta delle distribuzioni di input in assenza di dati 146

2.3 Generazione di osservazioni casuali 148

2.3.1 Generazione di numeri pseudocasuali condistribuzione uniforme 148

2.3.2 Generazione di osservazioni casuali da unadistribuzione di probabilita 150

2.4 Progettazione di una simulazione e analisi dell’output 156

2.4.1 Dati di output 156

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018

Page 38: SIMULATION{BASED OPTIMIZATION)roma/didattica/SSS17-18/parteI.pdf · \objects oriented". Entrambi i simulatori sono dotati di strumenti di animazione e visualizzazione 3D che permettono

208 INDICE

2.4.2 Transitorio e stato stazionario 157

2.4.3 Tipi di simulazioni 158

2.4.4 Simulazioni con terminazione: analisi del transitorio 159

2.4.5 Simulazioni senza terminazione: analisi dello statostazionario 163

2.5 Tecniche per la riduzione della varianza 167

2.5.1 Variabili antitetiche 167

2.5.2 Condizionamento 169

2.6 L’approccio simulazione ottimizzazione (“simulation–based optimization”) 171

2.7 Software di simulazione (SIMULATORI) 174

2.7.1 ARENA 175

2.7.2 Modelli in ARENA 175

2.8 Riferimenti del Capitolo 2 179

2.9 Esercizi sulla simulazione 180

3 Elementi di statistica 181

3.1 Elementi di Statistica inferenziale 181

3.2 Statistiche campionarie e loro distribuzione 182

3.2.1 Media campionaria e varianza campionaria 182

3.2.2 Distribuzione (approssimata) della mediacampionaria 183

3.2.3 Distribuzioni delle statistiche di popolazioni normali 184

3.3 Stima di parametri 185

3.3.1 Proprieta degli stimatori 186

3.3.2 Stima di media e varianza 186

3.3.3 Metodi di stima 187

3.3.4 Stime per intervalli 189

3.3.5 Stima per intervalli di una media 190

3.4 Test delle ipotesi 194

3.4.1 Test Chi–quadro 195

3.4.2 Test di Kolmogorov–Smirnov 197

3.4.3 Il p-value 200

4 201

4.1 Esercizi di riepilogo 201

M. Roma – Sistemi di Servizio e Simulazione – SAPIENZA Universita di Roma – a.a. 2017-2018