76

Click here to load reader

Aqfa probabilita

Embed Size (px)

DESCRIPTION

Analisi Qualitativa di Fenomeni Stazionari - Richiami di Teoria della Probabilità e dei Processi Aleatori

Citation preview

Page 1: Aqfa   probabilita

1

INTRODUZIONE ALLA TEORIA DELLA PROBABILITÀ

E DEI PROCESSI ALEATORI

DICAT – Università di Genova

Versione: 1.6

11.04.2011 Luigi Carassale

Page 2: Aqfa   probabilita

2

Sommario 1 Teoria della Probabilità ................................................................................................................ 5

1.1 Eventi e spazio campionario .................................................................................................. 5

1.2 Probabilità ............................................................................................................................. 6

1.2.1 Definizione classica (eventi equiprobabili, Laplace, 1812) ........................................... 6

1.2.2 Definizione empirica (frequentista, Von Mises 1920) ................................................... 7

1.2.3 Definizione assiomatica (Kolmogorov 1933) ................................................................ 8

1.3 Teoremi classici della probabilità.......................................................................................... 9

1.3.1 Teorema dell’evento complementare ............................................................................. 9

1.3.2 Teorema dell’evento totale ........................................................................................... 10

1.4 Probabilità condizionata e composta ................................................................................... 11

1.5 Variabili Aleatorie ............................................................................................................... 14

1.5.1 Definizione ................................................................................................................... 14

1.5.2 Distribuzione di probabilità ......................................................................................... 14

1.5.3 Funzione di probabilità (di una variabile aleatoria discreta) ........................................ 16

1.5.4 Densità di probabilità (di una variabile aleatoria continua) ......................................... 18

1.5.5 Valore atteso ................................................................................................................ 21

1.5.6 Momenti statistici di una variabile aleatoria ................................................................ 23

1.5.7 Funzione caratteristica di una variabile aleatoria continua .......................................... 26

1.6 Modelli di variabili aleatorie ............................................................................................... 26

1.6.1 Distribuzione normale (o Gaussiana) ........................................................................... 26

1.6.2 Distribuzione uniforme ................................................................................................ 28

1.6.3 Modello log-normale.................................................................................................... 28

1.6.4 Modello di Rayleigh..................................................................................................... 29

1.6.5 Modello di binomiale ................................................................................................... 29

1.6.6 Modello di Poisson....................................................................................................... 32

1.7 Rappresentazione della relazione probabilistica fra due grandezze .................................... 34

1.7.1 Distribuzione congiunta di probabilità ......................................................................... 34

1.7.2 Densità congiunta di probabilità .................................................................................. 34

1.7.3 Variabili aleatorie statisticamente indipendenti ........................................................... 36

Page 3: Aqfa   probabilita

3

1.7.4 Valore atteso ................................................................................................................ 37

1.7.5 Correlazione e covarianza ............................................................................................ 37

1.7.6 Modello normale bi-variato ......................................................................................... 39

1.7.7 Distribuzione condizionata di probabilità di una variabile aleatoria ........................... 40

1.8 Proprietà delle variabili aleatorie Gaussiane ....................................................................... 41

1.8.1 Indipendenza statistica di variabili non-correlate ........................................................ 41

1.8.2 Linearità dello spazio delle variabili Gaussiane .......................................................... 41

1.8.3 Teorema del limite centrale.......................................................................................... 42

2 Vettori Aleatori .......................................................................................................................... 44

2.1 Definizione .......................................................................................................................... 44

2.2 Momenti statistici ................................................................................................................ 44

2.3 Modello normale (Gaussiano) ............................................................................................. 45

2.4 Rappresentazione di vettori aleatori .................................................................................... 46

2.4.1 Analisi a componenti principali (PCA) ........................................................................ 46

2.5 Simulazione di vettori Gaussiani ......................................................................................... 47

3 Processi aleatori ......................................................................................................................... 49

3.1 Definizioni ........................................................................................................................... 49

3.1.1 Medie statistiche del primo ordine ............................................................................... 50

3.1.2 Medie statistiche del secondo ordine ........................................................................... 51

3.2 Processi aleatori stazionari .................................................................................................. 51

3.2.1 Medie temporali di una funzione campione ................................................................. 54

3.2.2 Processi aleatori ergodici ............................................................................................. 55

3.2.3 Rappresentazione nel dominio della frequenza di processi stazionari ......................... 55

3.3 Rappresentazione congiunta di una coppia di processi aleatori .......................................... 59

3.3.1 Medie statistiche congiunte del secondo ordine .......................................................... 59

3.3.2 Densità di Potenza spettrale incrociata ........................................................................ 61

3.3.3 Funzione di coerenza ................................................................................................... 61

3.4 Trasformazioni lineari di processi stazionari ...................................................................... 62

3.4.1 Derivazione di processi stazionari ............................................................................... 64

3.5 Momenti spettrali ................................................................................................................ 65

Page 4: Aqfa   probabilita

4

3.6 Modelli di processi stazionari .............................................................................................. 67

3.6.1 Processo armonico ....................................................................................................... 67

3.6.2 Processo a banda stretta ............................................................................................... 68

3.6.3 Processo a banda estesa................................................................................................ 69

3.6.4 Rumore bianco ............................................................................................................. 70

4 Analisi statistica di processi aleatori stazionari ......................................................................... 71

4.1 Analisi nel dominio del tempo - stima della funzione di autocorrelazione ......................... 72

4.2 Analisi nel dominio della frequenza - stima della funzione densità di potenza spettrale ... 72

5 Simulazione di processi aleatori ................................................................................................ 75

5.1 Metodo di Shinozuka........................................................................................................... 75

6 Risposta stazionaria di strutture lineari a un grado di libertàErrore. Il segnalibro non è

definito.

6.1 Modelli di azioni stazionarie ...................................... Errore. Il segnalibro non è definito.

6.1.1 Vento ................................................................... Errore. Il segnalibro non è definito.

6.1.2 Sisma ................................................................... Errore. Il segnalibro non è definito.

6.1.3 Onde .................................................................... Errore. Il segnalibro non è definito.

6.2 Soluzioni analitiche per la risposta stazionaria di un oscillatore sempliceErrore. Il

segnalibro non è definito.

6.2.1 1 D.O.F. - rumore bianco filtrato ........................ Errore. Il segnalibro non è definito.

6.2.2 1 D.O.F. - rumore bianco ideale.......................... Errore. Il segnalibro non è definito.

6.2.3 1 D.O.F. - eccitazione PSDF regolare ................. Errore. Il segnalibro non è definito.

6.2.4 1 D.O.F. - eccitazione PSDF decrescente ........... Errore. Il segnalibro non è definito.

7 Processi non stazionari ...................................................... Errore. Il segnalibro non è definito.

8 Identificazione Dinamica (ID) .......................................... Errore. Il segnalibro non è definito.

9 Sistemi non lineari ............................................................ Errore. Il segnalibro non è definito.

Equation Chapter (Next) Section 1

Page 5: Aqfa   probabilita

5

1 Teoria della Probabilità Il concetto di probabilità, utilizzato a partire dal '600, è diventato con il passare del tempo la base di

diverse discipline scientifiche. I primi studi che portarono successivamente a concetti legati alla

probabilità possono essere trovati a metà del XVI secolo in Liber de ludo aleæ di Girolamo Cardano

(scritto nel 1526, ma pubblicato solo un secolo e mezzo dopo, nel 1663) e in Sulla scoperta dei dadi

di Galileo Galilei (pubblicato nel 1656). In particolare, Galileo spiegò il motivo per cui, lanciando

tre dadi, il 10 sia più probabile del 9 nonostante che entrambi i risultati si ottengano da un uguale

numero di combinazioni.1

La nascita del concetto moderno di probabilità viene attribuita a Blaise Pascal (1623-1662) e Pierre

de Fermat (1601-1665).2 Nel 1657 Christiaan Huygens (1629-1695) scrisse un Libellus de

ratiociniis in ludo aleæ, il primo trattato sul calcolo delle probabilità, nel quale introduceva il

concetto di valore atteso. Nel 1713 viene pubblicato postumo Ars conjectandi di Jakob Bernoulli,

dove veniva dimostrato il teorema che porta il suo nome, noto anche come legge dei grandi numeri.

Successivamente, de Moivre pervenne ad una prima formulazione, poi generalizzata da Pierre

Simon Laplace (1749-1827), del Teorema del limite centrale. La teoria della probabilità raggiunse

così basi matematicamente solide e, con esse, il rango di nuova disciplina.

1.1 Eventi e spazio campionario

In teoria della probabilità si considera un fenomeno osservabile esclusivamente dal punto di vista

della possibilità o meno del suo verificarsi, prescindendo dalla sua natura. Un ruolo centrale in

questo contesto è svolto dal concetto di evento.

Si consideri una singola osservazione o misura di un fenomeno (es. la tensione di snervamento in un

provino metallico soggetto alla prova di trazione, il numero di studenti in un aula, la velocità del

vento in un determinato luogo e in un dato istante). Se il fenomeno in esame è deterministico, il

risultato dell’osservazione (o dell’esperimento) può essere predetto con esattezza. Se il fenomeno è

aleatorio, il risultato dell’osservazione non è noto a priori; tuttavia è possibile identificare un

insieme , che contiene tutti i possibili risultati dell’esperimento. L’insieme è chiamato spazio

campionario; gli elementi di sono detti punti campionari.

Si definisce evento, E, un insieme di punti campionari (e quindi di risultati possibili

dell’osservazione). Lo spazio campionario Ω contiene tutti i possibili punti campionari, quindi gli

eventi sono sottoinsiemi dello spazio campionario. Si definisce evento elementare l’evento che

contiene un solo punto campionario; evento certo, quello che contiene tutti i punti campionari (cioè

coincide con lo spazio campionario); evento impossibile, quello che non contiene punti campionari.

Gli eventi vengono normalmente indicati con lettere maiuscole. Dati due eventi A e B, si indica con

AB la loro unione, ovvero l'evento costituito dal verificarsi dell'evento A oppure dell'evento B. Si

indica con AB la loro intersezione, ovvero l'evento costituito dal verificarsi sia dell'evento A che

1 Il 9 si ottiene con le sei combinazioni (1,2,6), (1,3,5), (1,4,4), (2,2,5), (2,3,4), (3,3,3), il 10 con le sei combinazioni

(1,3,6), (1,4,5), (2,2,6), (2,3,5), (2,4,4), (3,3,4). Tuttavia, mentre una combinazione di tre numeri uguali può presentarsi

in un solo modo, una con due numeri uguali può presentarsi in tre modi diversi, una con tre numeri diversi in sei modi

diversi. Si può quindi ottenere il 10 in 27 modi (6+6+3+6+3+3), il 9 in 25 modi (6+6+3+3+6+1).

2 Il Cavalier de Méré (un accanito giocatore passato alla storia per questo) aveva calcolato che ottenere almeno un 6 in 4

lanci di un dado era equivalente ad ottenere almeno un doppio 6 in 24 lanci. Tuttavia, visto che giocando secondo tale

convinzione invece di vincere perdeva, scrisse a Pascal lamentando che la matematica falliva di fronte all'evidenza

empirica. Da ciò scaturì una corrispondenza tra Pascal e Fermat in cui iniziò a delinearsi il concetto di probabilità

nell'accezione frequentista.

Page 6: Aqfa   probabilita

6

dell'evento B. Se AB = i due eventi A e B vengono detti mutuamente esclusivi o incompatibili

(non possono verificarsi simultaneamente). Il complemento di un evento A rispetto a Ω, Ω\A, è detto

negazione di A e indica il suo non verificarsi (ovvero il verificarsi dell'evento complementare).

Esempio 1.1. Eventi.

Nel lancio di un dado, i possibili risultati sono i numeri 1, 2, … 6. Ognuno è un punto

campionario ω dello spazio campionario Ω = {1, 2, 3, 4, 5, 6}. Si considerino i seguenti

eventi:

A = “occorrenza di un numero pari” = 2,4, 6;

B = “occorrenza di un numero dispari” = 1, 3, 5;

C = “occorrenza del numero 2” = 2;

D = “occorrenza del numero 7” = ;

E = AB = ;

A e B sono eventi incompatibili;

C è un evento elementare, D è un evento impossibile, E è l’evento certo.

1.2 Probabilità

Esistono diverse definizioni di probabilità. Nel seguito si forniranno 3 definizioni che hanno rilievo

per la loro importanza storica o utilità pratica.

1.2.1 Definizione classica (eventi equiprobabili, Laplace, 1812)

Secondo la prima definizione di probabilità, per questo detta classica, la probabilità P(A) di

occorrenza dell’evento A è definita come:

ANP A

N (1.1)

dove N è il numero di risultati possibili (assumendo che siano equiprobabili) e NA è il numero di

risultati favorevoli all’evento A.

Esempio 1.2. Definizione classica di probabilità

Lancio di una moneta Ω = {T, C}; sia A:=T, allora P(A) = 1/2;

Lancio di un dado Ω = {1, 2,…,6}; sia A = {1, 2}, allora P(A) = 2/6 = 1/3;

Estrazione numero roulette: Ω = {0, 1,…,90}; sia A = “estrazione numero dispari” = {1,

3,…,89}, allora P(A) = 45/91.

La definizione classica consente di calcolare effettivamente la probabilità in molte situazioni.

Inoltre, è una definizione operativa e fornisce quindi un metodo per il calcolo. Presenta tuttavia

diversi aspetti negativi non irrilevanti:

si applica soltanto a fenomeni con risultati equiprobabili;

presuppone un numero finito di risultati possibili;

la definizione è circolare perché utilizza la nozione di probabilità (eventi equiprobabili) per

definire la probabilità stessa.

Page 7: Aqfa   probabilita

7

1.2.2 Definizione empirica (frequentista, Von Mises 1920)

Per superare tali difficoltà, Richard von Mises (1883-1953) propose di definire la probabilità di un

evento come il limite cui tende la frequenza relativa dell'evento al crescere del numero degli

esperimenti. Si consideri un esperimento che possa essere ripetuto un numero infinito di volte e si

assuma che un evento E si sia verificato un numero nE di volte durante l’esecuzione di n

esperimenti. La probabilità di occorrenza dell’evento E si definisce come il limite per n che tende a

infinito della sua frequenza relative nE/n:

lim E

n

nP E

n (1.2)

Esempio 1.3. Definizione frequentista di probabilità: convergenza alla definizione classica

Si simuli il lancio di un dado e si verifichi mediante la definizione (1.2) che l’evento A =

{1, 2} ha probabilità 1/3.

Il codice Matlab riportato in Figura 1.1 genera una successione di numeri casuali, x,

mediante il comando rand. I valori di x così generati sono compresi nell’intervallo chiuso

[2-53

, 1-2-53

]. A partire da x, il codice genera numeri interi, y, casuali equiprobabili compresi

fra 1 e 6.

La Figura 1.2 mostra i primi 10 risultati di una sequenza casuale. La Figura 1.3 mostra la

convergenza della probabilità calcolata mediante la definizione frequentista al valore

ottenuto dalla definizione classica (1/3). Si osserva che per avere una buona corrispondenza

fra i due valori sono necessari circa 104 esperimenti.

% Convergenza definizione frequentista probabilità

% Esempio: lancio di un dado

% n = numero esperimenti

% A = evento

% y = risultati esperimenti

% fA = elenco eventi favorevoli (1) e sfavorevoli (0)

% PA = probabilità di occorrenza evento A

n = 1e6;

x = rand(n,1);

y = round(6 * x + 0.5);

A = [1 2];

fA = zeros(n,1);

for k=1:n

fA(k) = sum(A==y(k));

end

PA = cumsum(fA) ./ (1:n)';

figure(1)

plot(1:10,y(1:10),'xr')

ylim([0 7])

grid on

xlabel('j')

ylabel('y_j')

figure(2)

semilogx(1:n,PA, 1:n, ones(n,1)*length(A)/6,'r--')

xlabel('n')

ylabel('n_E/n')

grid on

set(gca,'xMinorGrid','off')

Figura 1.1. Codice Matlab per verifica convergenza definizione frequentista di probabilità.

Page 8: Aqfa   probabilita

8

Figura 1.2. Lancio di un dado: punti campionari corrispondenti a 10 esperimenti.

Figura 1.3. Convergenza della frequenza relativa al valore della probabilità definita mediante la

(1.1).

La definizione frequentista, come quella classica, è operativa, cioè consente di calcolare

praticamente la probabilità di eventi in molte circostanze; inoltre, è coerente con quanto fornito

dalla definizione classica nel caso di eventi equiprobabili. Tuttavia è necessario osservare:

il "limite" delle frequenze relative non corrisponde all'analogo concetto matematico; ad

esempio, data una successione {an}, si dice che a è il suo limite se per ogni ε > 0 esiste un

numero naturale N tale che |an - a| < ε per ogni n > N, e, comunque dato ε, è sempre

possibile calcolare N; nella definizione frequentista, invece, N non è sempre calcolabile;

non tutti gli esperimenti sono ripetibili; ad esempio, ha sicuramente senso chiedersi quale sia

la probabilità che vi sia vita su Marte o che tra 50 anni il tasso di natalità in Africa diventi la

metà di quello attuale, ma in casi simili non è possibile immaginare esperimenti ripetibili

all'infinito.

1.2.3 Definizione assiomatica (Kolmogorov 1933)

L'impostazione assiomatica della probabilità venne proposta da Andrey Nikolaevich Kolmogorov

nel 1933 in Grundbegriffe der Wahrscheinlichkeitsrechnung (Concetti fondamentali del calcolo

delle probabilità). Va notato che la definizione assiomatica non è una definizione operativa e non

fornisce indicazioni su come calcolare la probabilità. Il nome deriva dal procedimento per

"assiomatizzazione" quindi nell'individuare i concetti primitivi, da questi nell'individuare i postulati

da cui poi si passava a definire i teoremi.

1 2 3 4 5 6 7 8 9 100

1

2

3

4

5

6

7

j

yj

100

101

102

103

104

105

106

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

n

nE/n

Page 9: Aqfa   probabilita

9

L'impostazione assiomatica muove dal concetto di σ-algebra, o classe additiva. Dato un qualsiasi

esperimento casuale, i suoi possibili risultati costituiscono gli elementi di un insieme non vuoto Ω,

detto spazio campionario, e ciascun evento è un sottoinsieme di Ω. La probabilità viene vista, in

prima approssimazione, come una misura, cioè come una funzione che associa a ciascun

sottoinsieme di Ω un numero reale non negativo tale che la somma delle probabilità di tutti gli

eventi sia pari a 1.

Si assuma che ogni evento nello spazio campionari sia associato a un numero reale P(E),

chiamato probabilità di E. Questo numero soddisfa le tre seguenti condizioni:

1. La probabilità è un numero non-negativo: P(E) ≥ 0;

2. La probabilità dell’evento certo è unitaria: P(Ω) = 1;

3. Dati due eventi A e B definiti come mutuamente esclusivi, allora P(AB) = P(A) + P(B).

Si osservi che, come conseguenza degli assiomi precedenti, necessariamente, P(E) 1.

I tre assiomi introdotti da Kolmogorov sono coerenti con la definizione empirica fornita da Von

Mises e con la definizione classica enunciata da Laplace.

1.3 Teoremi classici della probabilità

Dagli assiomi precedenti si ricavano i teoremi di seguito riportati.

1.3.1 Teorema dell’evento complementare

Si definisce evento complementare Ec = \E dell’evento E, l’evento che comprende tutti i punti

campionari di Ω non compresi in E (Figura 1.4).

Figura 1.4. Evento complementare.

Un evento E e il suo complementare Ec sono mutuamente esclusivi, cioè la loro intersezione

fornisce l’evento vuoto, mentre la loro unione genera l’evento certo

0c

c

E E

E E

(1.3)

Applicando alla (1.3) l’Assioma 3 si deduce:

1cP E P E (1.4)

In particolare, essendo Ωc = , l’applicazione della (1.4) dimostra che l’evento vuoto ha probabilità

di occorrenza zero (P(0) = 0). La (1.4) e l’assioma 1 dimostrano che P(E) 1.

Page 10: Aqfa   probabilita

10

Esempio 1.4. Probabilità dell’evento complementare

Sia P = 10-6

la probabilità di collasso di una struttura in un anno. La probabilità che tale

struttura non collassi in un anno è 1 – P = 1 – 10-6

.

1.3.2 Teorema dell’evento totale

Il teorema della probabilità totale consente di calcolare la probabilità dell'unione di due, ovvero la

probabilità che si verifichi almeno uno di essi. Essa è la somma delle probabilità dei singoli eventi

se sono mutuamente esclusivi; in caso contrario, alla somma va sottratta la probabilità

dell’intersezione. Si consideri due eventi E1 e E2 in (Figura 1.5):

Figura 1.5. Evento totale.

L’unione degli eventi E1 e E2 può essere scritta come:

1 2 1 2 2 1 1 2E E E E E E E E (1.5)

dove (E1 – E2) contiene i punti campionari presenti in E1, ma non in E2 (E2 – E1 è definito

analogamente). I tre eventi rappresentati dagli insiemi del termine di destra della (1.5) sono

mutuamente esclusivi, quindi per l’Assioma 3 risulta:

1 2 1 2 2 1 1 2P E E P E E P E E P E E (1.6)

Da Figura 1.5 risulta inoltre che 1 1 2 1 2E E E E E . La probabilità di occorrenza

dell’evento E1 – E2 risulta pertanto:

1 2 1 1 2P E E P E P E E (1.7)

Sostituendo la (1.7) (e un’espressione analoga per E2 – E1) nella (1.6), la probabilità di occorrenza

dell’evento totale E1 E2 risulta:

1 2 1 2 1 2P E E P E P E P E E (1.8)

Dalla (1.8) e dall’assioma di positività discende la condizione:

1 2 1 2P E E P E P E (1.9)

Page 11: Aqfa   probabilita

11

Esempio 1.5. Probabilità dell’evento totale.

Si consideri il lancio di un dado e si considerino i seguenti eventi:

1 21,2,3 ; 3,4 ; 1, ,6E E

Applicando la definizione (1.1) risulta:

1 2 1 21 2 1 3; 1 6P E P E P E E

Applicando il teorema dell’evento totale risulta:

1 2 1 2 1 2 2 3P E E P E P E P E E

1.4 Probabilità condizionata e composta

Si dice probabilità condizionata di A dato B, e si scrive P(A|B), la probabilità che l'evento A ha di

verificarsi quando si sappia che B si è verificato.

| 0

P A BP A B P B

P B

(1.10)

La definizione di probabilità condizionata può essere facilmente spiegata considerando il caso di

uno spazio campionario contenente N punti campionari equiprobabili . Sia NB il numero di

risultati favorevoli per l’evento B e NAB il numero di risultati favorevoli contemporaneamente per

gli eventi A e B (e quindi per l’evento A B). Sostituendo nella (1.10) la definizione classica di

probabilità (Eq. (1.1)):

| AB AB

B B

N NNP A B

N N N (1.11)

La probabilità condizionata P(A|B) può essere dunque interpretata come la probabilità di occorrenza

di A nello spazio campionario ridotto determinato da B (Figura 1.6).

Figura 1.6. Probabilità condizionata.

Esempio 1.6. Probabilità condizionata.

Si consideri il lancio simultaneo di due dadi. Si voglia determinare la probabilità di

occorrenza del numero 7 (evento A), dato che uno dei due dadi ha fornito il numero 1

(evento B). Lo spazio campionario contiene i 36 punti campionari equiprobabili:

(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),

(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),

(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),

(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),

(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),

(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6).

Page 12: Aqfa   probabilita

12

Il numero di risultati favorevoli a A è NA = 6, quindi P(A) = 1/6; il numero di risultati

favorevoli a B è NB=11, quindi P(B) = 11/36; il numero di risultati favorevoli

simultaneamente ad A e B è NAB = 2, quindi P(AB) = 1/18; il numero di risultati

favorevoli a A, dato che si è verificato B sono 2 su 11 possibilità, quindi P(A|B)=2/11.

Attraverso il concetto di probabilità condizionata si perviene al teorema della probabilità composta,

che consente di calcolare la probabilità dell'intersezione di due o più eventi, ovvero la probabilità

che essi si verifichino entrambi. Nel caso di due eventi, si ha

| |P A B P A B P B P B A P A (1.12)

Nel caso che la probabilità di A dato B, P(A|B), sia uguale a P(A), i due eventi vengono definiti

stocasticamente (o probabilisticamente, o statisticamente) indipendenti e dalla stessa definizione

segue una diversa formulazione della probabilità composta, caso particolare del precedente:

P A B P A P B (1.13)

Esempio 1.7. Eventi statisticamente indipendenti.

Si consideri i seguenti eventi legati al lancio di un dado:

1,2,3,4,5,6 ; 1,2 ; 1,3,5 ; 2,4,6A B C

2/6; 3/6; 3/6P A P B P C ;

1 , 1/6A B P A B P A P B A, B indipendenti;

, 0B C P B C P B P C B, C dipendenti.

Si osserva che gli eventi A e B sono indipendenti, ma non mutuamente esclusivi, mentre gli

eventi B e C sono mutuamente esclusivi, ma non indipendenti. Si potrebbe osservare, in

proposito, che due eventi mutuamente esclusivi non possono essere statisticamente

indipendenti, in quanto la realizzazione di uno comporta la non-realizzazione dell’altro.

Il codice Matlab riportato in Figura 1.7 valuta, applicando la definizione frequentista, la

probabilità di occorrenza dell’evento A = {1, 2} e la probabilità di occorrenza di A

condizionata all’occorrenza di B = {2, 4, 5}. La Figura 1.8 mostra che, all’aumentare del

numero di esperimenti n, le probabilità P(A) e P(A|B) tendono al medesimo valore. Ciò

indica che gli eventi A e B sono statisticamente indipendenti.

Page 13: Aqfa   probabilita

13

% Esempio: lancio di un dado

% verifica che gli eventi A = [1 2] e B = [2 4 5] sono statisticamente

% indipendenti.

%

% n = numero di esperimenti

% y = risultati esperimenti (lanci dado)

% fA = elenco eventi favorevoli (1) e sfavorevoli (0) per A

% fB = elenco eventi favorevoli (1) e sfavorevoli (0) per B

% fAB = elenco eventi favorevoli (1) e sfavorevoli (0) per A e B

% contemporaneamente

% PA = probabilità di occorrenza evento A

% PAcB = probabilità di occorrenza di A dato B

n = 1e5;

x = rand(n,1);

y = round(6 * x + 0.5);

A = [1 2];

B = [2 4 5];

fB = zeros(n,1);

fAB = zeros(n,1);

for k=1:n

fA(k) = sum(A==y(k));

fB(k) = sum(B==y(k));

fAB(k) = sum(A==y(k)) & sum(B==y(k));

end

PA = cumsum(fA) ./ (1:n)';

PAcB = cumsum(fAB) ./ cumsum(fB);

Figura 1.7. Codice Matlab per verifica indipendenza statistica mediante definizione frequentista

di probabilità.

Figura 1.8. Probabilità di A (linea blu), e probabilità di A dato B (linea rossa).

100

101

102

103

104

105

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

n

P(A

),

P(A

|B)

Page 14: Aqfa   probabilita

14

1.5 Variabili Aleatorie

In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o

random variable) può essere pensata come il risultato numerico di un esperimento quando questo

non è prevedibile con certezza (ossia non è deterministico). Ad esempio, il risultato del lancio di un

dado può essere matematicamente modellato come una variabile casuale che può assumere uno dei

sei possibili valori 1, 2, 3, 4, 5, 6. Bruno de Finetti definiva numero aleatorio (termine suggerito

dallo stesso per denotare la variabile casuale) un numero ben determinato ma non noto per carenza

di informazioni.

1.5.1 Definizione

Dato uno spazio campionario Ω su cui è definita una misura di probabilità, una variabile aleatoria è

una funzione (misurabile) dallo spazio campionario a uno spazio misurabile (es. l’insieme dei

numeri naturali, l’insieme dei numeri reali, ecc.; Figura 1.9).

In questo capitolo, si considerano variabili aleatorie a valori scalari (dette mono-variate). Variabili

aleatorie a valori vettoriali sono definite nei capitoli successivi.

Una variabile aleatoria è definita continua se ha valori in intervalli continui di . Una variabile è

detta discreta si ha valori in un insieme di numeri finito o numerabile (es. ). Una variabile

aleatoria è detta mista se assume valori in un insieme continuo, ma possiede un numero discreto di

valori aventi probabilità di occorrenza finita.

Nel seguito, le variabili aleatorie verranno indicate con lettere maiuscole (es. X), mentre le

corrispondenti lettere minuscole (es. x) verranno utilizzare per identificare generici valori assunti da

X, detti realizzazioni. La realizzazione x può essere interpretata come l’immagine del punto

campionario attraverso X (Figura 1.9).

Figura 1.9. Variabile aleatoria X.

1.5.2 Distribuzione di probabilità

La distribuzione di probabilità (o distribuzione cumulative, o cumulative distribution function,

CDF) è una funzione che definisce la probabilità che la variabile aleatoria X assuma valori minori o

uguali ad un parametro in .

XF P X (1.14)

La distribuzione di probabilità è definite per qualsiasi valore dell’argomento in e possiede le

seguenti proprietà (facilmente deducibili dalla (1.14) e dagli assiomi della teoria della probabilità):

0XF P X P (1.15)

1XF P X P (1.16)

x

x = X()

Page 15: Aqfa   probabilita

15

1 2 2 1 1 2X XP X F F (1.17)

Dalla (1.17) discende (per l’assioma di positività) che la distribuzione di probabilità è una funzione

non-decrescente i cui valori appartengono all’intervallo chiuso [0, 1]. Sarebbe possibile dimostrare

anche l’implicazione inversa: una funzione non-decrescente che soddisfa le condizioni (1.15) e

(1.16) rappresenta la distribuzione di probabilità di una qualche variabile aleatoria.

Esempio 1.8. Stima distribuzione di probabilità di una variabile aleatoria discrete

La Figura 1.10 mostra il codice Matlab per la stima della distribuzione di probabilità di una

variabile aleatoria discreta X, rappresentativa dei risultati del lancio di un dado. La Figura

1.11 mostra la distribuzione di probabilità stimata. Si osserva la struttura discontinua della

funzione, tipica delle variabili aleatorie discrete. I salti nella funzione rappresentano

probabilità finite di avere risultati in corrispondenza dei valori 1, 2,…,6.

% stima distribuzione di probabilità di v.a. discreta

n = 1e5;

X = round(6*rand(n,1) + 0.5); % lancio di un dado

xi = linspace(-2, 10, 3001);

FX = zeros(size(xi));

for k=1:length(xi)

FX(k) = sum(X<=xi(k))/n;

end

plot(xi,FX,'.')

xlabel('\xi')

ylabel('F_X(\xi)')

grid on

ylim([0 1.1])

Figura 1.10. Codice Matlab per stima distribuzione di probabilità: esempio variabile aleatoria

discreta

Figura 1.11. Distribuzione di probabilità dei risultati del lancio di un dado stimata mediante il

codice di Figura 1.10.

Esempio 1.9. Stima distribuzione di probabilità di una variabile aleatoria continua

Il codice riportato in Figura 1.12 stima la distribuzione di probabilità della variabile

aleatoria continua X, il cui spazio campionario è generato attraverso una trasformazione

non-lineare di numeri casuali Gaussiani u. Per ogni valore (k) dell’ascissa discretizzata, la

distribuzione di probabilità è ottenuta valutando la probabilità dell’evento X (k)

mediante la definizione frequentista. La Figura 1.13 mostra la distribuzione di probabilità

stimata.

-2 0 2 4 6 8 100

0.2

0.4

0.6

0.8

1

FX(

)

Page 16: Aqfa   probabilita

16

% stima CDF della variabile aleatoria X

n = 1e5; % numero esperimenti

u = randn(n,1);

X = u + 0.1*u.^2 + 0.05*u.^3; % generazione spazio campionario per X

xi = linspace(-10, 10, 300); % definizione ascissa discretizzata

FX = zeros(size(xi));

for k=1:length(xi)

FX(k) = sum(X<=xi(k))/n;

end

plot(xi,FX)

xlabel('\xi')

ylabel('F_X(\xi)')

grid on

ylim([0 1.1])

Figura 1.12. Codice Matlab per stima distribuzione di probabilità

Figura 1.13. Distibuzione di probabilità di una variabile aleatoria continua stimata mediante il

codice di Figura 1.12.

1.5.3 Funzione di probabilità (di una variabile aleatoria discreta)

Si consideri una variabile aleatoria discrete X che può assumere gli n valori discreti j (j = 1,…,n).

Si definisce funzione di probabilità di X la funzione:

X j jP P X (1.18)

che definisce, la probabilità di realizzazione di ogni possibile valore j. La funzione di probabilità e

la distribuzione di probabilità sono legate dalla relazione:

X j X j X jP F F (1.19)

j

X X jF P

(1.20)

dove j- indica un numero reale minore, ma arbitrariamente vicino a j. La Figura 1.14 mostra la

funzione di probabilità e la corrispondente distribuzione di probabilità di una variabile aleatoria

discreta.

-10 -8 -6 -4 -2 0 2 4 6 8 100

0.2

0.4

0.6

0.8

1

FX(

)

Page 17: Aqfa   probabilita

17

Figura 1.14. Funzione di probabilità e distribuzione di probabilità di una variabile discrete.

Esempio 1.10. Stima della funzione di probabilità

Si consideri un esperimento realizzando lanciando due dadi. Sia X ottenuto come somma

dei risultati forniti dai due dati. La Figura 1.15 riporta il codice per simulare il lancio di due

dadi; la funzione di probabilità è valutata attraverso la funzione riportata in Figura 1.15

realizzata introducendo la definizione frequentista di probabilità nella (1.18).

La Figura 1.17 mostra la funzione di probabilità (a) e la distribuzione di probabilità (b)

stimata sulla base di 105 lanci di dadi simulati.

% esempio lancio di due dadi

n = 1e5;

X1 = round(6*rand(n,1) + 0.5); % lancio di un dado 1

X2 = round(6*rand(n,1) + 0.5); % lancio di un dado 2

X = X1 + X2;

[PX, xi] = pf1(X);

figure(1)

for k=1:length(xi)

plot(xi(k)*[1 1],PX(k)*[0 1],'b',xi(k),P(k),'.b')

hold on

end

hold off

xlim([0 14])

grid on

xlabel('\xi')

ylabel('P_X(\xi)')

Figura 1.15. Codice Matlab per simulazione del lancio di due dadi.

function [P, xi] = pf1(x)

% stima funzione di probabilità per v.a. discreta X di cui sono disponibili

% n realizzazioni contenute nel vettore x

% P = funxione di probabilità

% xi = ascissa P

xi = min(x):max(x); % ascissa funz di probabilità

P = zeros(length(xi),1);

z = x - min(x) + 1;

for k=1:length(x)

P(z(k)) = P(z(k)) + 1;

end

P = P / length(x);

end

Figura 1.16. Codice Matlab per stima dai dati della funzione di probabilità di una variabile

aleatoria discreta.

1 2 3 40

0.2

0.4

0.6

0.8

1

FX(

)

1 2 3 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

PX(

)

Page 18: Aqfa   probabilita

18

(a) (b)

Figura 1.17. Funzione di probabilità (a) e distribuzione di probabilità (b).

1.5.4 Densità di probabilità (di una variabile aleatoria continua)

La distribuzione di probabilità, FX, di una variabile aleatoria continua, X, è una funzione continua in

, ma non necessariamente derivabile. Si assuma che i punti in cui FX non è derivabile formino un

insieme numerabile. Ove FX è derivabile, si definisce la densità di probabilità pX() (o probability

density function, o pdf) come derivata di FX rispetto all’argomento :

d

d

X

X

Fp

(1.21)

In virtù delle proprietà di FX si deducono le seguenti proprietà della densità di probabilità:

0Xp (1.22)

dX XF p

(1.23)

1Xp d

(1.24)

2

11 2 2 1 1 2dX X XP X F F p

(1.25)

In cui si è supposto che, nei punti dove pX non è definita (FX non derivabile), essa assuma un

qualsiasi valore positivo finito.

La Figura 1.18 descrive la relazione fra pX e FX definita dalla (1.23): l’ordinata FX() equivale

all’area sottesa da pX a sinistra dell’ascissa .

La Figura 1.19 mostra che l’occorrenza di un punto * in cui FX non è derivabile si riflette in una

discontinuità in pX.

0 2 4 6 8 10 12 140

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

PX(

)

0 2 4 6 8 10 12 140

0.2

0.4

0.6

0.8

1

FX(

)

Page 19: Aqfa   probabilita

19

(a) (b)

Figura 1.18. Relazione fra densità (a) e distribuzione (b) di probabilità.

Figura 1.19. Punti singolari nella densità di probabilità.

La (1.25) afferma che l’area sottesa dalla densità di probabilità, compresa fra due valori di ascissa,

1 e 2, rappresenta la probabilità che la variabile aleatoria assuma un valore compreso in tale

intervallo (Figura 1.20). Ponendo 1 = e 2 = + , la (1.25) può essere riscritta nella forma:

dX XP X p p

(1.26)

Nella quale, l’applicazione del teorema della media impone di assumere che pX sia continua in .

Figura 1.20. Significato probabilistico di densità e distribuzione di probabilità.

Page 20: Aqfa   probabilita

20

L’applicazione della definizione empirica di probabilità alla (1.26) fornisce uno strumento per

stimare la densità di probabilità attraverso la relazione:

limXn

np

n

(1.27)

dove n() è il numero di volte in cui il valore di X è compreso nell’intervallo (, + ] in n

esperimenti. La densità così ottenuta è rappresentata da un istogramma (Figura 1.21) che, se è

sufficientemente piccolo può essere interpretato come la discretizzazione di una funzione di

variabile continua.

Figura 1.21. Stima della densità di probabilità.

Esempio 1.11. Stima della densità di probabilità.

Si consideri la variabile aleatoria del precedente Esempio 1.9 e si stimi la densità di

probabilità utilizzando la definizione frequentista.

% stima pdf della variabile aleatoria X

n = 1e6; % numero esperimenti

u = randn(n,1);

X = u + 0.1*u.^2 + 0.05*u.^3; % generazione spazio campionario per X

xi = linspace(-10, 10, 300); % definizione ascissa discretizzata

pX = zeros(size(xi));

Dx = xi(2) - xi(1);

for k=1:length(xi)

pX(k) = sum(X > xi(k)-Dx/2 & X <= xi(k)+Dx/2)/n/Dx;

end

plot(xi,pX)

xlabel('\xi')

ylabel('p_X(\xi)')

grid on

xlim([-6 6])

Figura 1.22. Codice Matlab per stima densità di probabilità.

Page 21: Aqfa   probabilita

21

Figura 1.23. Densità di probabilità stimata mediante il codice riportato in Figura 1.22.

Il codice riportato in Figura 1.22 è molto semplice perché implementa brutalmente

l’estimatore definito dalla (1.27). Sfortunatamente, tale algoritmo è piuttosto inefficiente,

avendo una complessità computazionale pari a n2. In alternativa, la densità di probabilità

può essere stimata mediante la funzione riportata in Figura 1.24, che ha complessità

computazionale pari a n.

function [p, xi] = pdf1(x,Nx)

% stima pdf per v.a. continua X di cui sono disponibili le realizzazioni

% raccolte nel vettore x

% p = pdf

% xi = ascissa pdf

% Nx = numero punti ascissa pdf

xi = linspace(min(x),max(x),Nx)'; % ascissa discretizzata pdf

Dx = (max(x)-min(x)) / Nx; % ampiezza intervalli

p = zeros(Nx,1);

z = (x - min(x)) / (max(x) - min(x)); % x è mappato in [0 1]

z1 = round((Nx-1) * z)+1; % numero d'ordine intervallo ascissa

for k=1:length(x)

p(z1(k)) = p(z1(k)) + 1;

end

p = p / length(x) / Dx; % normalizzazione

end

Figura 1.24. Codice Matlab per stima distribuzione di probabilità.

1.5.5 Valore atteso

Il valore atteso (o media, o expectation) di una variabile aleatoria X, è un numero E[X] che

formalizza l'idea euristica di valore medio di un fenomeno aleatorio.

In generale il valore atteso di una variabile aleatoria discreta è dato dalla somma dei possibili valori

di tale variabile, ciascuno moltiplicato per la probabilità di essere assunto (ossia di verificarsi), cioè

è la media ponderata dei possibili risultati. Se la variabile aleatoria X può assumere i valori j (j =

1,2,…), il valore atteso è definito dalla relazione:

1

E j X j

j

X P

(1.28)

-6 -4 -2 0 2 4 60

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

pX(

)

Page 22: Aqfa   probabilita

22

Per una variabile aleatoria continua il valore atteso è essere definito mediante un integrale.

E d dX XX F p

(1.29)

Si osservi che la definizione di valore atteso ottenuta attraverso l’integrale di Stieltjes nella (1.29)

può essere applicata anche nei casi in cui la funzione densità di probabilità non è definita, come per

le variabili aleatorie discrete e miste.

Il valore atteso è un operatore lineare che dallo spazio delle variabili aleatorie conduce nello spazio

dei numeri reali. Esso gode quindi delle proprietà:

E E EaX bY a X b Y (1.30)

dove X e Y sono variabili aleatorie, mentre a e b sono costanti reali.

Il valore atteso ha la proprietà di monotonia, cioè se una variabile aleatoria X appartiene

all’intervallo [a, b], allora anche il suo valore atteso E[X] appartiene ad [a, b].

Il valore atteso di una variabile aleatoria di cui è disponibile un insieme di realizzazioni può essere

stimato attraverso la media statistica. Ciò può essere dimostrato facilmente nel caso di variabili

aleatorie discrete (il concetto è altrettanto valido per le variabili continue) sostituendo la definizione

frequentista di probabilità nella (1.28)

1

Ej

j

j

nX

n

(1.31)

dove nj rappresenta il numero di volte che si è realizzato il valore j nel corso di n esperimenti, con

n grande a sufficienza. La (1.31) contiene la somma dei risultati possibili j moltiplicati per il

numero di volte che questi si sono realizzati nj. Questa somma corrisponde alla somma dei valori xk

realizzati dalla variabile aleatoria negli n esperimenti (ammesso che n sia grande a sufficienza a fin

che l’insieme dei risultati xk contenga tutti i risultati j aventi una probabilità di occorrenza

significativa). La (1.31) può dunque essere riscritta nella forma:

1

1E

n

k

k

X xn

(1.32)

Il concetto di valore atteso può essere esteso al caso di una variabile aleatoria Y legata, attraverso

una funzione deterministica, ad una variabile aleatoria X di cui è nota la densità di probabilità (cioè,

Y = f(X), con f funzione deterministica). Il valore atteso di Y è fornito dalle espressioni:

1

E E j X j

j

Y f X f P

(1.33)

E E dXY f X f p

(1.34)

per i casi di variabili aleatorie discrete e continue, rispettivamente.

Page 23: Aqfa   probabilita

23

1.5.6 Momenti statistici di una variabile aleatoria

Si definisce momento statistico di ordine k (k ≥ 1) di una variabile aleatoria X il valore atteso della

potenza di ordine k di X:

m E 1,2,k

k X X k (1.35)

Sostituendo la (1.35) nelle (1.33) e (1.34), ponendo f(X) = Xk, si ottengono le espressioni:

1

m 1,2,k

k j X j

j

X P k

(1.36)

m d 1,2,k

k XX p k

(1.37)

Il momento statistico di ordine 1, X = m1[X], è detto valore medio (o media); il momento statistico

di ordine 2, X2 = m2[X], è detto valore quadratico medio (o media quadratica).

Si definisce momento statistico centrale di ordine k (k ≥ 2) di una variabile aleatoria X la quantità:

E 2,3,k

k XX X k

(1.38)

Il momento statistico centrale di ordine 2, X2 = 2[X] è detto varianza, mentre la sua radice

quadrata, X, è detta deviazione standard.

I momenti statistici centrali sono legati ai momenti statistici da relazioni ricorsive. Arrestandosi

all’ordine 4, risultano:

2

2 2 1

3

3 3 2 1 1

2 4

4 4 3 1 2 1 1

m m

m 3m m 2m

m 4m m 6m m 3m

(1.39)

Nel caso in cui X è una variabile aleatoria continua, la media X = m1[X] rappresenta, da un punto di

vista grafico, la posizione (ascissa) del baricentro dell’area sottesa dalla densità di probabilità;

pertanto, la media misura la posizione della funzione di densità di probabilità rispetto all’asse reale.

La media ha la medesima dimensione (unità di misura) delle realizzazioni della variabile aleatoria.

La varianza X2 = 2[X] rappresenta il momento d’inerzia dell’area sottesa dalla densità di

probabilità rispetto all’asse baricentrico; pertanto, la varianza rappresenta una misura di dispersione,

intono al valore medio, delle realizzazioni di una variabile aleatoria. La deviazione standard ha la

medesima dimensione delle realizzazioni della variabile aleatoria.

In accordo con le (1.39), media, varianza e media quadratica sono legate dalla relazione:

2 2 2

X X X (1.40)

Il rapporto fra deviazione standard e media è detto coefficiente di variazione:

XX

X

I

(1.41)

Page 24: Aqfa   probabilita

24

Il momento centrale di ordine 3, adimensionalizzato con la deviazione standard è detto skewness (o

coefficiente di asimmetria). Il momento centrale di ordine 4 adimensionalizzato con la deviazione

standard è detto kurtosis (o coefficiente di piattezza).

3 4

3 4skw ; kurt

X X

X XX X

(1.42)

Lo skewness è generalmente indicato con il simbolo 3. Frequentemente, al valore del kurtosis

definito dalla (1.42) si sottrae 3; in questo caso modo si ottiene un valore detto coefficiente di

eccesso (o eccesso di kurtosis), generalmente indicato con il simbolo 4.

3 4

3 43 4; 3

X X

X XX X

(1.43)

La Figura 1.25 mostra l’effetto della media e della deviazione standard sulla forma della densità di

probabilità. La media determina una traslazione della curva lungo l’asse delle ascisse, mentre la

deviazione standard controlla l’ampiezza della curva (alla quale corrisponde un abbassamento per

conservare l’area unitaria).

La Figura 1.26 mostra l’effetto di skewness e coefficiente di eccesso sulla forma della densità di

probabilità. La condizione 3 = 0 corrisponde ad una funzione simmetrica rispetto alla media; la

condizione 3 > 0 rappresenta la situazione in cui la densità di probabilità ha la coda di destra più

alta della coda di sinistra. Una variabile aleatoria avente 4 > 0 è detta super-kurtica e ha densità di

probabilità alta sulla moda (ascissa corrispondente al picco) e sulle code; una variabile aleatoria

avente 4 < 0 è detta sub-kurtica e ha densità di probabilità bassa sulla moda e sulle code; il caso

4=0 corrisponde alla distribuzione Gaussiana che verrà descritta nel seguito. Per lo studio delle

code della distribuzione è generalmente conveniente diagrammare le funzioni di densità di

probabilità con ordinata in scala logaritmica, come mostrato in Figura 1.27 per i casi già discussi in

Figura 1.26.

Una variabile aleatoria è detta standardizzata se è centrata rispetto alla sua media e scalata in modo

da avere varianza unitaria:

ˆ X

X

XX

(1.44)

da cui ovviamente risulta ˆ 0X

e ˆ 1X

.

Page 25: Aqfa   probabilita

25

(a) (b)

Figura 1.25. Densità di probabilità: influenza della media (a) e deviazione standard (b).

(a) (b)

Figura 1.26. Densità di probabilità: influenza skewness (a) e coefficiente di eccesso (b).

(a) (b)

Figura 1.27. Densità di probabilità (scala logaritmica): influenza skewness (a) e coefficiente di eccesso (b).

I momenti statistici della variabile aleatoria X possono essere stimati a partire da un insieme di sue

realizzazioni xj (j = 1,…,n) attraverso un’espressione analoga alla (1.32)

1

1m E

nk k

k j

j

X X xn

(1.45)

-4 -3 -2 -1 0 1 2 3 410

-3

10-2

10-1

100

, ,

pX(

),

p Y(

),

p Z(

)

-4 -3 -2 -1 0 1 2 3 410

-3

10-2

10-1

100

, ,

pX(

),

p Y(

),

p Z(

)

-4 -3 -2 -1 0 1 2 3 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

, ,

pX(

),

p Y(

),

p Z(

)

3 = 0

4 = -0.5

3 = 0

4 = 5

3 = 0

4 = 0

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

, ,

pX(

),

p Y(

),

p Z(

)

3 = -0.5

4 = 0

3 = 0.5

4 = 0

3 = 0

4 = 0

-6 -4 -2 0 2 4 60

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

,

pX(

),

p Y(

)

X = 0

X = 1

Y = 0

Y = 2

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

,

pX(

),

p Y(

)

X = 0

X = 1

Y = 1

Y = 1

Page 26: Aqfa   probabilita

26

1.5.7 Funzione caratteristica di una variabile aleatoria continua

Si definisce funzione caratteristica (o funzione generatrice dei momenti) della variabile aleatoria X,

la funzione a valori complessi:

iE exp i e dX XX p

(1.46)

dove l’argomento è definito in ℝ. In base alla (1.46), la funzione caratteristica è la trasformata di

Fourier della densità di probabilità, pertanto essa determina completamente la struttura

probabilistica di X.

La funzione caratteristica può essere rappresentata attraverso la serie di McLaurin:

1 0

1 d0

! d

kk

X X kk k

(1.47)

Operando per derivazione sulla (1.46), i termini della (1.47) risultano nella forma:

0

0 1

di E i m 1,2,

d

X

kk k k

kkX X k

(1.48)

che, sostituendo nella (1.47), forniscono un’espressione della funzione caratteristica in termini di

momenti statistici.

1

i1 m

!

kk

X k

k

Xk

(1.49)

La (1.49) dimostra che, conoscendo i momenti statistici fino all’ordine infinito, è possibile

rappresentare la funzione caratteristica e quindi la densità di probabilità. In questo senso, la

conoscenza dei momenti statistici è equivalente alla conoscenza della distribuzione di probabilità,

quindi determina completamente la struttura probabilistica della variabile aleatoria.

1.6 Modelli di variabili aleatorie

Nel presente capitolo si introducono alcuni modelli probabilistici rilevanti per lo studio della

meccanica delle vibrazioni e dell’affidabilità strutturale. Il modello normale (o Gaussiano) è

descritto con maggiore enfasi in virtù delle sue caratteristiche probabilistiche e della sua importanza

applicativa.

1.6.1 Distribuzione normale (o Gaussiana)

Una variabile aleatoria X ha distribuzione normale (o Gaussiana) se la sua densità di probabilità è

nella forma:

2

1 1exp

22

XX

XX

p

(1.50)

Una variabile aleatoria X, con distribuzione normale X e varianza X2 è formalmente definita

attraverso l’espressione X = N(X, X2). La Figura 1.28 mostra la densità di probabilità di una

Page 27: Aqfa   probabilita

27

variabile aleatoria normale standardizzata; nel piano semilogaritmico la curva è costituita da una

parabola.

(a) (b)

Figura 1.28. Densità di probabilità normale: ordinata in scala decimale (a) e logaritmica (b).

La distribuzione di probabilità è data dall’espressione:

2

1 1exp d

22

XX

XX

F

(1.51)

che può essere scritta in forma analitica attraverso la funzione di errore

1

1 erf2

XX

X

F

(1.52)

Per ispezione della (1.50) è immediato verificare che se Y = aX + b, con a e b costanti

deterministiche e X = N(X, X2), allora Y = N(aX + b, a

2X

2).

La funzione caratteristica di una variabile Gaussiana può essere ottenuta calcolando la trasformata

di Fourier della (1.50) e risulta:

2 21exp i

2X X X

(1.53)

Se X è una variabile aleatoria Gaussiana standardizzata, X = N(0,1), allora densità di probabilità e

distribuzione di probabilità risultano:

21 1exp

22Xp

(1.54)

21 1

exp d 1 erf2 22

XF

(1.55)

21exp

2X

(1.56)

Si osserva che la funzione caratteristica di una variabile Gaussiana standardizzata è formalmente

identica alla corrispondente funzione densità di probabilità.

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

pX(

)

-4 -3 -2 -1 0 1 2 3 410

-4

10-3

10-2

10-1

100

pX(

)

Page 28: Aqfa   probabilita

28

1.6.2 Distribuzione uniforme

Una variabile aleatoria continua ha distribuzione uniforme se la sua densità di probabilità è espresso

nella forma:

per1/

altrove0X

a bb ap a b

(1.57)

Il modello uniforme è utilizzato quando una variabile aleatoria può assumere valori equiprobabili in

un intervallo chiuso [a, b]. La funzione di distribuzione può essere ottenuta dalla (1.57) per

integrazione e risulta:

0 per

/ per

1 per

X

a

F a b a a b

b

(1.58)

La media e la varianza di una variabile aleatoria uniforme risultano:

/ 2X a b (1.59)

22 /12

Xb a (1.60)

Figura 1.29. Densità e distribuzione di probabilità di una variabile aleatoria uniforme.

1.6.3 Modello log-normale

Una variabile aleatoria X è della log-normale se Y = log(X) ha distribuzione normale. La densità di

probabilità di una variabile log-normale è espressa nella forma:

2

2

log1exp

22X

mp

ss

(1.61)

dove m e s sono i parametri della distribuzione (e rappresentano, rispettivamente, la media e la

deviazione standard di Y). La media e la varianza di X risultano:

0 a b0

1/(b-a)

pX(

)

0 a b0

1

FX(

)

Page 29: Aqfa   probabilita

29

2

2 2 2

exp2

exp 2 exp 1

X

X

sm

m s s

(1.62)

Figura 1.30. Densità e distribuzione di probabilità di una variabile aleatoria log-normale (m = 1, s = 1).

1.6.4 Modello di Rayleigh

Una variabile aleatoria X è detta di Rayleigh se ha densità di probabilità nella forma:

2

2 2exp

2Xp

b b

(1.63)

dove b è il parametro della distribuzione.

Figura 1.31. Densità e distribuzione di probabilità di una variabile aleatoria di Rayleigh (b = 1).

1.6.5 Modello di binomiale Si consideri una successione di variabili aleatorie discrete, Xk (k = 1,2,…), aventi spazio

campionario Ω = {0, 1}. Si assuma che gli eventi legati a ogni possibile coppia di variabili aleatorie

Xh e Xk (h,k = 1,2,…; hk) siano statisticamente indipendenti; sia inoltre P(Xk = 1) = p.

La successione Xk è detta sequenza di Bernoulli. La funzione di probabilità di una variabile aleatoria

di Bernoulli risulta dunque:

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

0.2

0.25

pX(

)

0 2 4 6 8 10 12 14 16 18 200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F

X(

)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

pX(

)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

FX(

)

Page 30: Aqfa   probabilita

30

0 0 1

1 1

k

k

X k

X k

P P X p

P P X p

(1.64)

Sia Ym una variabile aleatoria discreta definita come la somma dei primi m termini di una sequenza

di Bernoulli (Figura 1.32):

1

m

m k

k

Y X

(1.65)

Figura 1.32. Sequenza di Bernoulli (blu) e corrispondente sequenza binomiale (rosso).

La funzione di probabilità di Ym può essere ottenuta operando in modo ricorsivo. Per m=1, la

funzione di probabilità di Ym = Y1 risulta:

1

1

1 1

1 1

0 0 0 1

1 1 1

Y

Y

P P Y P X p

P P Y P X p

(1.66)

Analogamente, per m=2, la funzione di probabilità di Ym = Y2 risulta (per il teorema dell’evento

totale e per l’ipotesi di indipendenza statistica fra le variabili di Bernoulli):

2

2

2

2

2 1 2

2 1 2 1 2

2

2 1 2

0 0 0 0 1

1 1 1 0 0 1 2 1

2 2 1 1

Y

Y

Y

P P Y P X X p

P P Y P X X X X p p

P P Y P X X p

(1.67)

Le (1.66) e (1.67) possono essere generalizzate, per un m qualsiasi in , attraverso l’espressione:

1m

m

Y m

mP P Y p p

(1.68)

dove il binomio di Newton è espresso nella forma:

0 5 10 15 20 25 300

1

2

3

4

5

6

7

8

9

k

Xk,

Yk

Page 31: Aqfa   probabilita

31

!

! !

m m

m

(1.69)

Sostituendo la (1.68) nell’espressione di media e varianza risulta:

2 1

m

m

Y

Y

mp

mp p

(1.70)

da cui si evince che la media e la varianza di una variabile binomiale sono lineari in m.

Esempio 1.12. Sequenze di Bernoulli e variabili binomiali

Il codice riportato in Figura 1.33 simula una serie di sequenze di Bernoulli di lunghezza n e

la variabile Binomiale Ym ottenuta per m = n. La stima di media (Figura 1.34a), varianza

(Figura 1.34b) e funzione di probabilità (Figura 1.35) è effettuata applicando la definizione

frequentista di probabilità. I risultati della stima sono confrontati con quanto previsto dal

modello binomiale.

Nseq = 10000; % numero realizzazioni

n = 30; % numero esperimenti di Bernoulli

p = 0.2; % prob. di successo esperimenti di Bernoulli

X = rand(n,Nseq) >= (1-p); % sequenza di Bernoulli

Y = cumsum(X); % sequenza binomiale

m = n; % considero m = n esperimenti

% stima funzione di probabilità dai dati

[PY_data, eta_data] = pf1(Y(m,:));

% modello binomiale

eta = 0:m; % ascissa per PY

PY_bi = factorial(m)./factorial(eta)./factorial(m-eta) .* (p.^eta) .* ((1-

p).^(m-eta));

figure(1)

plot(1:n,mean(Y,2),'--.b', 1:n,(1:n)*p,'-r')

xlabel('m')

ylabel('\mu_{Y_m}')

figure(2)

plot(1:n,var(Y,[],2),'--.b', 1:n,(1:n)*(1-p)*p,'-r')

xlabel('m')

ylabel('\sigma^2_{Y_m}')

figure(3)

bar(eta_data,PY_data)

hold on

plot(eta, PY_bi,'-*r')

hold off

xlabel('\eta')

ylabel('p_{Y_m(\eta)}')

xlim([0 20])

Figura 1.33. Codice Matlab per simulazione di sequenze di Bernoulli e binomiali; stima di

media, varianza e funzione di probabilità della variabile binomiale.

Page 32: Aqfa   probabilita

32

(a) (b)

Figura 1.34. Media (a) e varianza (b) della variabile binomiale simulata nel codice di Figura

1.33: stima dai dati (blu), modello (rosso).

Figura 1.35. Funzione di probabilità della variabile binomiale simulata nel codice di Figura

1.33: stima dai dati (blu), modello (rosso).

1.6.6 Modello di Poisson

Una variabile aleatoria discrete Y ha distribuzione di Poisson se la sua funzione di probabilità è

nella forma:

exp 0,1,!

YP

(1.71)

Dalla (1.71) risulta, evidentemente, che PY(0) = e-

; inoltre Y = Y2 = . Al variare del parametro ,

la funzione di probabilità assume le forme mostrate in Figura 1.36.

0 5 10 15 20 25 300

1

2

3

4

5

6

m

Y

m

0 5 10 15 20 25 300

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

m

2 Y

m

0 2 4 6 8 10 12 14 16 18 200

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

pY

m(

)

Page 33: Aqfa   probabilita

33

Figura 1.36. Funzione di probabilità di una variabile di Poisson al variare del parametro .

Una variabile aleatoria di Poisson, Y, può essere interpretata come il limite, per m , di una

sequenza binomiale Ym derivata da una sequenza di Bernoulli Xk avente probabilità di successo

p0. In tal caso la variabile Y è definita dal parametro = mp.

La Figura 1.36 mostra la funzione di probabilità di tre variabili aleatorie binomiali definite,

rispettivamente, dai parametri m = 10, 20 e 100 e p = 0.50, 0.25, 0.05 (blu) e di una variabile

aleatoria di Poisson definita dal parametro = 5.

Figura 1.37. Convergenza di variabili binomiali (blu) a una variabile di Poisson (rosso).

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

PY

()

= 0.7

= 2.5

= 5.0

0 1 2 3 4 5 6 7 8 9 100

0.05

0.1

0.15

0.2

0.25

PY

m(

),

PY

()

m = 20

m = 100

m = 10

Page 34: Aqfa   probabilita

34

1.7 Rappresentazione della relazione probabilistica fra due grandezze

Nei paragrafi precedenti si è discusso su come rappresentare, probabilisticamente, variabili aleatorie

continue e discrete. In molte applicazioni è necessario rappresentare contemporaneamente più

variabili aleatorie e definirne le mutue relazioni statistiche che le governano. Ad esempio, ha senso

chiedersi quale sia la relazione statistica che intercorre il modulo elastico di un provino di acciaio e

la sua tensione si snervamento, oppure fra la velocità del vento (in un determinato luogo, ad un

certo istante) e la sua direzione.

Al fine di sviluppare strumenti per rappresentare la mutua relazione probabilistica fra diverse

grandezze, si considerino due variabili aleatorie, X e Y, con valori in . Per semplicità si assuma

che X e Y siano variabili aleatorie continue.

1.7.1 Distribuzione congiunta di probabilità

La distribuzione congiunta di probabilità, FXY(,), delle variabili aleatorie X e Y è, per definizione,

la probabilità che si verifichi l’evento X Y per la generica coppia di valori e in :

,XYF P X Y (1.72)

In questo contesto, le distribuzioni di probabilità FX() e FY() delle variabili aleatorie X e Y

(considerate separatamente) sono chiamate distribuzioni marginali di probabilità. In generale, la

conoscenza delle distribuzioni marginali non è sufficiente a definire la distribuzione congiunta;

viceversa, nota la distribuzione congiunta, le marginali risultano:

,

,

X XY

Y XY

F P X Y F

F P X Y F

(1.73)

La distribuzione congiunta di probabilità gode delle seguenti proprietà (dimostrabili facilmente

attraverso la definizione (1.72) e gli assiomi della teoria della probabilità):

, 0

, 0

, 0

, 1

XY

XY

XY

XY

F P X Y P

F P X Y P

F P X Y P

F P X Y P

(1.74)

Inoltre, con semplici passaggi è possibile dimostrare che FXY(,) è una funzione non-decrescente

di , :

2 1 2 1

2 1 2 1

, ,

, ,

XY XY

XY XY

F F

F F

(1.75)

cioè la distribuzione congiunta di probabilità è una funzione non-decrescente di e .

1.7.2 Densità congiunta di probabilità

Si consideri le variabili aleatorie X e Y definite dalla distribuzione congiunta di probabilità FXY(,),

supposta derivabile per ogni e in , salvo che, al più, in insiemi di misura nulla (punti o linee).

Si definisce densità di probabilità congiunta:

Page 35: Aqfa   probabilita

35

2 ,

, XY

XY

Fp

(1.76)

Per la (1.75), la densità di probabilità risulta non-negativa. La (1.76) può essere invertita applicando

il teorema fondamentale del calcolo integrale (in forma bi-dimensionale)

, , d dXY XYF p

(1.77)

per la quale il valore della distribuzione congiunta nel punto (, ) corrisponde al volume sotteso

dalla densità congiunta nel dominio definito dai punti (, ) con e .

(a) (b)

Figura 1.38. Distribuzione congiunta (a) e densità congiunta (b) di probabilità di due variabili aleatorie continue.

Applicando il teorema dell’evento totale, è possibile dimostrare le relazioni (Figura 1.39):

2 2

1 1

1 2 1 2 2 2 1 2

2 1 1 1

2 2 1 2 2 1 1 1, , , ,

, d d

XY XY XY XY

XY

P X Y P X Y P X Y

P X Y P X Y

F F F F

p

(1.78)

Figura 1.39. Rappresentazione grafica dell’equazione (1.78).

-10-5

05

10

-10

0

100

0.2

0.4

0.6

0.8

1

FX

Y(

,)

-10-5

05

10

-10

0

100

0.005

0.01

0.015

pX

Y(

,)

1

2

1 2

Page 36: Aqfa   probabilita

36

Da cui discenda, per l’assioma di normalizzazione della probabilità:

, d d 1XYp

(1.79)

Riscrivendo la (1.78) per 1 = - e 2 = +, si ottiene, per definizione, la distribuzione marginale di

probabilità della variabile X

1 2 1 2

, d d

X

XY

P X Y P X F x

p

(1.80)

la quale, derivata rispetto a fornisce la densità marginale di probabilità:

, dX XYp p

(1.81)

Operando analogamente rispetto alla variabile , si ottiene la densità marginale di probabilità della

variabile aleatoria Y:

, dY XYp p

(1.82)

In maniera equivalente, le variabili aleatorie X e Y possono essere rappresentate attraverso la

funzione caratteristica congiunta

i

, E exp i i

e , d d

XY

XY

X Y

p

(1.83)

che corrisponde alla trasformata di Fourier bi-dimensionale della densità di probabilità congiunta.

Nota la funzione caratteristica congiunta, le funzioni caratteristiche marginali possono essere

ottenute annullando uno dei due argomenti della funzione:

,0

0,

X XY

Y XY

(1.84)

1.7.3 Variabili aleatorie statisticamente indipendenti

Due eventi A e B sono definititi statisticamente indipendenti se la probabilità composta della loro

occorrenza è pari al prodotto della probabilità di occorrenza dei due eventi considerati

singolarmente (P(AB) = P(A)P(B)). Due variabile aleatorie X e Y si definiscono statisticamente

indipendenti se gli eventi {X } e {Y } sono statisticamente indipendenti. Da questa

definizione segue immediatamente che, X e Y sono statisticamente indipendenti se e solo se la

distribuzione (densità) congiunta di probabilità è pari al prodotto delle distribuzioni (densità)

marginali. Lo stesso vale per le funzioni caratteristiche.

,

,

,

XY X Y

XY X Y

XY X Y

F F F

p p p

(1.85)

Page 37: Aqfa   probabilita

37

1.7.4 Valore atteso

Nel paragrafo 1.5.5 si introduce il concetto di valore atteso, definito come la media di tutti i

possibili valori realizzabili da una variabile aleatoria X, pesati attraverso la loro probabilità di

occorrenza. Attraverso l’equazione (1.34) il concetto di valore atteso è esteso ad una variabile

aleatoria Y = f(X) definita, a partire dalla variabile aleatoria X, attraverso la funzione deterministica

f.

In questo paragrafo si considera una variabile aleatoria Z definita attraverso una funzione

deterministica f(X,Y) sulla base di due variabili aleatorie X e Y. Il valore atteso della variabile

aleatoria Z è definito come la media dei possibili valori = f(,) assunti da Z, pesati attraverso la

loro probabilità di occorrenza pXY(,)dd:

E E , , , d dXYZ f X Y f p

(1.86)

1.7.5 Correlazione e covarianza

Date due variabili aleatorie X e Y, si definisce correlazione il valore atteso del loro prodotto:

E , d dXY XYR XY p

(1.87)

Dalla definizione si evince che la correlazione di X rispetto a X stessa coincide con la media

quadratica (RXX = X2).

Si definisce covarianza il valore atteso del prodotto delle variabili X e Y centrate rispetto alla loro

media:

E , d dXY X Y X Y XYC X Y p

(1.88)

La covarianza della variabile aleatoria X rispetto a se stessa coincide con la varianza (CXX = X2).

Correlazione e covarianza sono legate dalla relazione:

XY XY X YR C (1.89)

Si definisce covarianza normalizzata (o coefficiente di correlazione) il rapporto:

ˆ ˆEXYXY

X Y

CXY

(1.90)

dove X e Y sono le versioni standardizzate di X e Y.

Le variabili aleatorie X e Y sono dette non-correlate se le loro covarianza CXY è nulla. Se X e Y sono

statisticamente indipendenti, allora sono anche non-correlate. Questa affermazione può essere

facilmente verificata ricordando che se X e Y sono statisticamente indipendenti, allora la loro

densità di probabilità congiunta può essere fattorizzata nella forma: pXY(,) = pX()pY().

Sostituendo nella (1.88) si dimostra immediatamente che CXY=0.

L’implicazione opposta non è, in generale, vera: due variabili aleatorie non-correlate non sono, in

generale, statisticamente indipendenti.

Page 38: Aqfa   probabilita

38

La covarianza e la covarianza normalizzata sono limitate dalle relazioni:

1

XY X Y

XY

C

(1.91)

Nelle quali l’uguaglianza si verifica nel caso X è Y sono legate da una relazione lineare del tipo

Y=aX + b. La (1.91) può essere dimostrata notando che la seguente disuguaglianza è valida per ogni

a in

2

E 0X Ya X Y a

(1.92)

Espandendo l’espressione contenuta nel valore atteso e utilizzando le definizioni di varianza e

covarianza, si ottiene la disequazione di secondo grado:

2 2 22 0X XY Ya C a a (1.93)

La quale è soddisfatta a condizione che il discriminante sia minore o uguale a zero; dunque:

2 2 2 0XY X YC (1.94)

da cui discendono banalmente le (1.91).

Esempio 1.13. Realizzazioni di una coppia di variabili aleatorie

Si considerano le variabili aleatorie X e Y caratterizzate dai seguenti parametri: X = 10, Y

= 20, X2 = 10, Y

2 = 5. La Figura 1.40 mostra 1000 realizzazioni di X e Y per diversi valori

di covarianza: CXY = 0 (a), CXY = 3 (b), CXY = 7 (c), CXY = -5 (d). A questi quattro casi

corrispondono i valori di covarianza normalizzata XY = 0, 0.42, 0.99, -0.71.

(a) (b)

(c) (d)

Figura 1.40. Realizzazioni di una coppia di variabili aleatorie.

0 2 4 6 8 10 12 14 16 18 2012

14

16

18

20

22

24

26

28

x

y

2 4 6 8 10 12 14 16 18 20

14

16

18

20

22

24

26

28

x

y

0 2 4 6 8 10 12 14 16 18

14

16

18

20

22

24

26

x

y

0 2 4 6 8 10 12 14 16 18

14

16

18

20

22

24

26

x

y

Page 39: Aqfa   probabilita

39

Esempio 1.14. Coefficiente di correlazione e dipendenza lineare

Il coefficiente di correlazione può essere interpretato come una misura della dipendenza

lineare che intercorre fra due variabili aleatorie. In particolare, due variabili X e Y sono

legate da una legge deterministica lineare se e solo se il loro coefficiente di correlazione è

1. Infatti, se Y = aX con aℝ deterministico, allora risulta:

2 22 2 2 2

2 2

E E

E E

E E

Y X

Y Y X X

xy X Y X X

Y aX a

Y a X a

C X Y a X a

(1.95)

Dalla seconda delle (1.95) si deduce che Y = |a|X, quindi sostituendo nella (1.90) si

ottiene:

sgnXY

aa

a (1.96)

La Figura 1.41 mostra 1000 realizzazioni di una coppia di variabili aleatorie perfettamente

non-correlate, ma legate da un’evidente relazione statistica (non-lineare).

Figura 1.41. Coppia di variabili aleatorie con legame non-lineare.

1.7.6 Modello normale bi-variato

Due variabili aleatorie X e Y sono dette congiuntamente normali se la loro densità di probabilità

congiunta è fornita dalla relazione:

2

2 2

2 22

1,

2 1

21exp

2 1

XY

X Y XY

X Y XY X Y

X Y X YXY

p

(1.97)

Oppure se la loro funzione caratteristica congiunta ha la forma:

2 2 21, exp exp 2

2XY X Y X XY Yi C

(1.98)

-6 -4 -2 0 2 4 6 8

-4

-2

0

2

4

6

x

y

Page 40: Aqfa   probabilita

40

1.7.7 Distribuzione condizionata di probabilità di una variabile aleatoria

Siano A e B due eventi legati ad un medesimo esperimento. La probabilità di occorrenza dell’evento

A condizionata all’occorrenza dell’evento B è definita dalla relazione (1.10):

| 0

P A BP A B P B

P B

(1.99)

Si assuma ora che gli eventi A e B siano determinati da due variabili aleatorie X e Y come segue:

; ,A X B Y (1.100)

Sfruttando la definizione di distribuzione di probabilità, la (1.99) può essere riscritta nella forma:

,| |

XY

X

Y

FP X Y F Y

F

(1.101)

Dove la funzione FX(|Y) è detta distribuzione di probabilità condizionata della variabile X

rispetto all’evento {Y}. La corrispondente funzione di densità di probabilità è ottenuta derivando

la (1.101) rispetto a e risulta:

,

|

XY

X

Y

F

p YF

(1.102)

Si consideri ora il caso in cui l’evento che genera la condizione sia B = {1 < Y 2}. La

distribuzione di probabilità di X condizionata all’occorrenza di B risulta:

2 1

1 2

2 1

, ,|

XY XY

X

Y Y

F FF Y

F F

(1.103)

La corrispondente densità di probabilità può essere ottenuta derivando la (1.103) rispetto a e

risulta:

2

1

1 2

2 1

, d

|

XY

X

Y Y

p

p YF F

(1.104)

avendo sfruttato la relazione:

,

, dXY

XY

Fp

(1.105)

Sostituendo 1= e 2 = + , la (1.104) può essere riscritta nella forma:

Page 41: Aqfa   probabilita

41

, d

|

XY

X

Y Y

p

p YF F

(1.106)

che, per 0 risulta:

|

,|

XY

X Y

Y

pp

p

(1.107)

dove, la notazione pX|Y(,) indica la densità di probabilità di X condizionata all’occorrenza di Y in

un intono infinitesimo di .

Dalla (1.107) deriva banalmente il teorema della probabilità totale (o di Bayes) che si esprime

attraverso la relazione:

| || |X Y Y Y X Xp p p p (1.108)

Confrontando le equazioni (1.85) e (1.107) si deduce che se le variabili aleatorie X e Y sono

statisticamente indipendenti, allora valgono le relazioni:

|

|

|

|

X Y X

Y X Y

p p

p p

(1.109)

1.8 Proprietà delle variabili aleatorie Gaussiane

Il modello Gaussiano è largamente il più diffuso grazie a una serie di proprietà che lo distinguono.

Fra queste, si menzionano le tre più rilevanti: variabili Gaussiane non-correlate sono statisticamente

indipendenti; la somma di variabili aleatorie Gaussiane è Gaussiana; la somma di un gran numero di

variabili aleatorie statisticamente indipendenti comunque distribuite tende a essere Gaussiana.

1.8.1 Indipendenza statistica di variabili non-correlate

Siano X e Y due variabili Gaussiane non-correlate 0XY . La densità di probabilità congiunta

fornita dalla (1.97) risulta:

2 2

2 2

1 1, exp

2 2

X Y

XY

X Y X Y

p

(1.110)

che può essere chiaramente fattorizzata in due termini corrispondenti con le espressioni della

densità di probabilità di due variabili Gaussiane. Ciò dimostra l’indipendenza statistica.

1.8.2 Linearità dello spazio delle variabili Gaussiane

Uno spazio vettoriale è detto lineare se contiene ogni combinazione lineare dei membri dello spazio

stesso. Per dimostrare che lo spazio delle variabili Gaussiane è lineare è sufficiente dimostrare che

se X e Y sono Gaussiane allora Z = aX + bY è Gaussiana per ogni a e b in ℝ. In realtà, è evidente

che la semplice scalatura di una variabile Gaussiana ha distribuzione Gaussiana (è possibile

verificarlo con un cambio di variabile nella (1.50)), allora senza perdita di generalità è possibile

porre a = b = 1 e quindi Z = X + Y.

Page 42: Aqfa   probabilita

42

Applicando la definizione di distribuzione di probabilità si osserva che la distribuzione di

probabilità di Z risulta:

d , d d

, d d

Z

Z XY

XY

F P Z P X Y

p p

p

(1.111)

in cui l’ultimo passaggio è eseguito operando la sostituzione - . Inoltre, confrontando la

seconda e la terza riga della (1.111) si deduce la relazione:

, dZ XYp p

(1.112)

La (1.112) dimostra che la densità di probabilità della somma di due variabili aleatorie è fornita

dalla convoluzione della loro densità marginale. Applicando la trasformata di Fourier alla (1.112) si

ottiene la funzione caratteristica di Z nella forma:

i

i i

e , d d

e e , d d

,

Z XY

XY

XY

p

p

(1.113)

in cui si è moltiplicato e diviso per la medesima quantità ei

e si è applicata la definizione di

funzione caratteristica congiunta. Sostituendo l’espressione di XY pertinente per il modello

Gaussiano (Eq. (1.98)) si ottiene la relazione:

2 2 21exp i exp 2

2Z X Y X XY YC

(1.114)

che corrisponde alla funzione caratteristica di una variabile Gaussiana con media Z = X + Y e

varianza Z2 = X

2 + 2CXY + Y

2.

1.8.3 Teorema del limite centrale

Si consideri un insieme di variabili aleatorie Xj (j = 1,…, n) statisticamente indipendenti con media

X e varianza X2; Yn sia la variabile aleatoria definita attraverso la somma:

1

n

n j

j

Y X

(1.115)

Applicando la definizione di media e varianza, e tenendo conto dell’indipendenza delle Xj, risulta:

2 2

n

n

Y X

Y X

n

n

(1.116)

Page 43: Aqfa   probabilita

43

La versione standardizzata di Yn è fornita dalla relazione:

1

ˆ

1 ˆ

n Xn

X

n

j

j

Y nY

n

Xn

(1.117)

dove ˆ ( ) /j j X XX X . La funzione caratteristica di ˆnY risulta:

ˆ

1

1

ˆE exp i

i ˆE exp

i ˆE exp

nnY

n

j

j

n

j

j

Y

Xn

Xn

(1.118)

Tenendo conto che le Xj sono statisticamente indipendenti, il valore atteso nella (1.118) può essere

fattorizzato nella forma:

ˆ

1

i ˆE expn

n

jYj

Xn

(1.119)

Se n è grande, gli esponenziali nella (1.119) possono essere espansi in serie di Taylor

32

2 2ˆ

1

22

1

i ˆ ˆE 12

i ˆ ˆ1 E E2

n

n

j jYj

n

j j

j

X X O nnn

X Xnn

(1.120)

che, tenendo conto che le ˆjX sono standardizzate, risulta

3:

2

ˆ 12n

n

Y n

(1.121)

Il limite per n della (1.121) fornisce:

2

ˆ

1exp

2nY

(1.122)

che è la funzione caratteristica di una variabile Gaussiana con media nulla e varianza unitaria.

Equation Chapter (Next) Section 1

3 Si considera il limite notevole lim 1 e

n

x

n

x

n

Page 44: Aqfa   probabilita

44

2 Vettori Aleatori

2.1 Definizione

Definiamo vettore aleatorio un vettore di variabili aleatorie o, con maggior precisione, una variabile

aleatoria le cui realizzazioni sono in uno spazio multi-dimensionale (es. ℝn).

Figura 2.1. Vettore aleatorio X.

Un vettore aleatorio è rappresentato specificando le proprietà statistiche congiunte delle sue

componenti. Si definisce distribuzione di probabilità congiunta la funzione

1 1 n nF P X X X (2.1)

definita per ℝn; Xj e j (j = 1,…,n) sono le componenti di X e , rispettivamente. La distribuzione

di probabilità di un vettore aleatorio ha proprietà analoghe alla distribuzione di probabilità di una

variabile aleatoria scalare; in particolare:

1

1

: [0,1]

0 , ,

1 , ,

n

n

n

F

F se

F se

X

X

X

(2.2)

Se le componenti Xj di X sono variabili aleatorie continue, può essere definita la densità di

probabilità congiunta attraverso la relazione:

1...

n

n

Fp

X

X

(2.3)

La funzione caratteristica di X è fornita dalla trasformata di Fourier n-dimensionale della densità di

probabilità e risulta:

T

T

i

E exp i

e dn

p

X

X

X

(2.4)

2.2 Momenti statistici

Si definisce media del vettore X il vettore contenente la media delle sue componenti.

x

n

x = X ( )

Page 45: Aqfa   probabilita

45

1

2E

n

X

X

X

X X (2.5)

Si definisce matrice di correlazione del vettore X:

1 1 2 1

2 1 2

1

2

2

T

2

E

n

n n

X X X X X

X X X

X X X

R R

R

R

XR XX (2.6)

Gli elementi diagonali della matrice di correlazione sono le medie quadratiche delle componenti di

X; gli elementi fuori diagonale rappresentano le correlazioni di tutte le possibili coppie di

componenti.

Si definisce matrice di covarianza del vettore X:

1 1 2 1

2 1 2

1

2

2T

2

E

n

n n

X X X X X

X X X

X X X

C C

C

C

X X XC X X (2.7)

Gli elementi diagonali della matrice di covarianza sono le varianze delle componenti di X; gli

elementi fuori diagonale rappresentano le covarianze di tutte le possibili coppie di componenti.

Le matrici di correlazione e di covarianza sono legate dalla relazione:

T

X X X XC R (2.8)

La matrice di correlazione rappresenta la generalizzazione del concetto di media quadratica al caso

di vettore aleatorio, mentre la matrice di covarianza generalizza il concetto di varianza. Queste

matrici possono essere quindi interpretate, rispettivamente, come il momento statistico di ordine 2 e

il momento statistico centrale di ordine 2 del vettore X. Da un punto di vista concettuale, non vi

sono preclusioni a considerare momenti statistici di ordine superiore al secondo. In questo caso

nascono però difficoltà formali in quanto tali grandezze non possono essere espresse sinteticamente

attraverso il prodotto “riga per colonna” come nelle (2.7) e (2.8).

2.3 Modello normale (Gaussiano)

Un vettore aleatorio X ha distribuzione normale (o Gaussiana) se la sua densità di probabilità è

nella forma:

T 1

1 22

1 1exp

22X X X Xn

p C

XC (2.9)

Si osserva che la densità di un vettore Gaussiano è definita dalla media e dalla matrice di

covarianza. Inoltre, si osserva che la densità di probabilità congiunta della coppia di variabili

Page 46: Aqfa   probabilita

46

aleatorie X e Y espressa dalla (1.97) può essere rappresentata in forma compatta attraverso la (2.9)

ponendo X = [X Y]T.

La funzione caratteristica di X risulta:

T T1exp i exp

2

X X xxC (2.10)

2.4 Rappresentazione di vettori aleatori

Passando dal caso di una variabile aleatoria X a valori scalari (le cui realizzazioni x sono in ℝ) al

caso di un vettore aleatorio X (le cui realizzazioni x sono in ℝn) si pone il problema di scegliere la

base in ℝn più opportuna da adottare. La scelta non è univoca ed esistono diversi criteri che si

adattano più o meno bene alle diverse circostanze. Fra tutti i sistemi di riferimento è opportuno

menzionare il riferimento utilizzato nell’analisi a componenti principali (Principal Component

Analysis, PCA).

2.4.1 Analisi a componenti principali (PCA)

Si consideri un vettore aleatorio X con realizzazioni in ℝn che per semplicità assumiamo a media

nulla. Ci poniamo l’obiettivo di individuare un vettore ℝn che rappresenti la direzione tipica di

X, quindi che sia più parallelo possibile alle realizzazioni di X. Ciò può essere ottenuto

massimizzando una misura di parallelismo, ad esempio:

2

E TJ

X (2.11)

con il vincolo ||||=1 (altrimenti sarebbe sufficiente allungare per incrementare J). La

massimizzazione vincolata della (2.11) può essere sostituita dalla massimizzazione della funzione

ausiliaria:

2 2

E TJ

X (2.12)

dove è un moltiplicatore di Lagrange. I punti di stazionarietà (fra cui il massimo) di J’ possono

essere ottenuti annullando le derivate di J’ rispetto alle componenti di ottenendo l’equazione:

TE XX 0 (2.13)

che corrisponde al problema agli autovalori:

XC I 0 (2.14)

La matrice di covarianza è simmetrica e definita positiva, quindi gli autovettori k (k=1,…,n) sono n

e sono mutuamente ortonormali; i corrispondenti autovalori k sono reali e positivi. Gli autovalori

sono convenzionalmente ordinati in modo decrescente.

Gli autovettori k formano una base ortonormale in ℝn, quindi possono essere impiegati per

rappresentare il vettore aleatorio X (o più esattamente le sue realizzazioni x).

1

n

k k

k

Y

X (2.15)

Page 47: Aqfa   probabilita

47

dove le variabili aleatorie Yk (k=1,…,n) sono le proiezioni di X sui vettori k

T

k kY X (2.16)

e sono dette componenti principali del vettore aleatorio X. Si dimostra che le componenti principali

hanno media nulla, sono mutuamente non-correlate e hanno varianza pari agli autovalori

T T

T T

E E 0

E E

k k k

T

h k h k h k k hk

Y

Y Y

X

X

X

XX C

(2.17)

La (2.15) rappresenta il vettore X come una somma di vettori deterministici k modulati da variabili

aleatorie non-correlate con media nulla e varianza k. Se gli autovalori sono ordinati in modo

decrescente, la (2.15) fornisce una rappresentazione gerarchica di X, in cui i primi termini della

somma tendono a essere dominanti rispetto a quelli successivi. Quando la (2.15) è utilizzata per

analizzare statisticamente un insieme di dati misurati, queste proprietà gerarchiche possono essere

utilizzate per separare la parte significativa dei dati dal rumore sperimentale.

L’analogia fra la (2.15) e la rappresentazione modale della risposta di strutture lineari è evidente. In

entrambi i casi le coordinate naturali del problema sono sostituite da un sistema di coordinate

opportuno in modo da consentire un troncamento modale (considerare un numero di termini m<n

nella somma dell’Eq. (2.15)). In entrambi i casi, il cambio di coordinate comporta vantaggi

aggiuntivi: nel caso dell’analisi modale, le coordinate principali sono determinate da equazioni del

moto disaccoppiate (per sistemi con smorzamento proporzionale), mentre nel caso di vettori

aleatori, le componenti principali sono statisticamente non-correlate.

La (2.15) può essere riscritta in forma compatta

X Y (2.18)

dove la matrice , ottenuta assemblando per colonne gli autovettori, è una matrice ortogonale e

rappresenta una rotazione in ℝn.

2.5 Simulazione di vettori Gaussiani

Realizzazioni x di un vettore Gaussiano X con media X e matrice di covarianza CX possono essere

generate sfruttando la relazione (2.18) e le proprietà delle componenti principali.

Sia z una realizzazione del vettore aleatorio Z, le cui componenti hanno distribuzione Gaussiana,

media nulla, varianza unitaria e sono mutuamente non-correlate (e quindi statisticamente

indipendenti per la Gaussianità). Realizzazioni di questo vettore possono essere ottenute attraverso

le funzioni disponibili in ogni ambiente computazionale per la generazione di numeri casuali

Gaussiani statisticamente indipendenti. Dato z, una realizzazione di x può essere ottenuta attraverso

la relazione:

0.5

Xx z (2.19)

Equation Chapter (Next) Section 1dove = diag(1…n) è la matrice degli autovalori di CX.

Page 48: Aqfa   probabilita

48

Esempio 2.1. Simulazione di vettori aleatori Gaussiani

Il codice riportato in Figura 2.2 simula una serie di realizzazioni di un vettore aleatorio

Gaussiano con assegnata media e matrice di covarianza.

function x = randn_multi(N, mu, C)

% genera N realizzazioni di un vettore aleatorio Gaussiano con media mu e

% matrice di covarianza C

% x ha dimensione length(mu), N

n = length(mu);

[F,L] = eig(C);

y = sqrt(L)*randn(n,N);

x = F*y;

for k=1:n

x(k,:) = x(k,:) + mu(k);

end

Figura 2.2. Codice Matlab per simulazione di vettori aleatori Gaussiani.

Page 49: Aqfa   probabilita

49

3 Processi aleatori Un processo stocastico (o aleatorio) è una legge che associa, ad ogni punto dello spazio

campionario Ω una funzione x(t) dipendente da un parametro t (nelle applicazioni trattate nel

seguito rappresenterà sempre il tempo). In questo senso, un processo aleatorio può essere

interpretato come la generalizzazione del concetto di variabile aleatoria, ammettendo che questa

assuma valori nello spazio delle funzioni, anziché in .

3.1 Definizioni

Si consideri un esperimento il cui risultato è una funzione del tempo (l’accelerazione sismica del

suolo, la velocità del vento, la risposta di un sistema dinamico). Ogni storia temporale x(t) derivante

da un esperimento è interpretata come una possibile realizzazione di un processo aleatorio X(t). Le

realizzazioni sono dette funzioni campione (Figura 3.1).

Figura 3.1. Funzioni campione.

Un processo aleatorio X(t) può essere interpretato come un contenitore per le funzioni x(j)

(t)

(j=1,2,…) ottenute in corrispondenza del risultato j di un qualche esperimento (o osservazione). In

questo senso, fissando il parametro t = t1, il processo aleatorio si reduce ad una variabile aleatoria

X1=X(t1), mentre fissando l’indice j, il processo aleatorio si riduce ad una funzione deterministica

(Figura 3.2).

Figura 3.2. Variabile aleatoria estratta da un processo aleatorio.

Page 50: Aqfa   probabilita

50

Si considerino un insieme di variabili aleatorie X1,...,Xn estratte dal processo X(t) in corrispondenza

degli istanti t = t1,...,tn (Figura 3.3). La loro completa descrizione probabilistica è fornita dalla

densità di probabilità congiunta:

1 2 1 2

1 2 1 2, , , , , ,n n

X X X n nX t X t X tp p (3.1)

È chiaro che la (3.1) descrive il processo aleatorio X(t) tanto più accuratamente quanto più grande è

l’ordine della distribuzione congiunta considerata. Si deve osservare, tuttavia che anche se si

arrivasse idealmente a considerare una distribuzione congiunta di ordine infinito, estraendo un

numero infinito di variabili aleatorie dal processo X(t), si tratterebbe comunque di una

rappresentazione parziale4 del processo aleatorio, perché esso è formato da un’infinità non-

numerabile di variabili aleatorie. Questo tipo di rappresentazione è comunque sufficiente per gli

scopi della presente trattazione.

Figura 3.3. Insieme di variabili aleatorie estratte da un processo aleatorio.

3.1.1 Medie statistiche del primo ordine

Si consideri la variabile aleatoria X1 estratta dal processo X(t) per t = t1. Essa è completamente

descritta dalla densità di probabilità pX(t1)(). Le medie statistiche del primo ordine includono i

momenti statistici della variabile aleatoria X1 = X(t1). In particolare, la media, la media quadratica e

la varianza del processo aleatorio X(t) sono definite attraverso le relazioni:

1

1 1 1 1 1dX X tt E X t p

(3.2)

1

22 2

1 1 1 1 1dX X tt E X t p

(3.3)

1

222

1 1 1 1 1 1 1dX X X X tt E X t t t p

(3.4)

e sono dunque funzioni (deterministiche) del tempo. La varianza e la media quadratica sono legate

dalla relazione:

2 2 2

1 1 1( )X XXt t t (3.5)

4 Una rappresentazione completa di un processo aleatorio può essere ottenuta attraverso il funzionale caratteristico

(generalizzazione della funzione caratteristica definita per le variabili aleatorie).

Page 51: Aqfa   probabilita

51

3.1.2 Medie statistiche del secondo ordine

Si considerino due variabili aleatorie X1 e X2 estratte dal processo X(t) nei due istanti t = t1 e t = t2.

Le medie statistiche del secondo ordine coinvolgono la rappresentazione congiunta delle variabili

X1 e X2, estratte dal processo per ogni possibile coppia di istanti t1 e t2. Ciò avviene, in generale,

attraverso la funzione di densità di probabilità congiunta pX(t1)X(t2)(1, 2), oppure attraverso momenti

statistici congiunti quali correlazione e covarianza. Si definiscono auto-correlazione e auto-

covarianza le due seguenti grandezze:

1 2

1 2 1 2 1 2 1 2 1 2, E , d dXX X t X tR t t X t X t p

(3.6)

1 2

1 2 1 1 2 2

1 1 2 2 1 2 1 2

, E

, d d

XX X X

X X X t X t

C t t X t t X t t

t t p

(3.7)

da cui si evince che l’auto-correlazione e l’auto-covarianza sono funzioni deterministiche in 2 e

sono legate dalla relazione:

1 2 1 2 1 2, ,XX XX X XC t t R t t t t (3.8)

L’auto-covarianza normalizzata è definita dal rapporto:

1 2

1 2

1 2

,,

XX

XX

X X

C t tt t

t t

(3.9)

Dalle (3.6), (3.7) e (3.9) discendono immediatamente le seguenti proprietà:

1 2 2 1

1 2 2 1

1 2 2 1

2

1 1 1

2

1 1 1

1 1

, ,

, ,

, ,

, ( )

,

, 1

X

XX XX

XX XX

XX XX

XX X

XX

XX

R t t R t t

C t t C t t

t t t t

R t t t

C t t t

t t

(3.10)

3.2 Processi aleatori stazionari

Un processo aleatorio è definito stazionario se la sua densità di probabilità congiunta di ordine n è

indipendente da una traslazione dell’origine dell’asse del tempo.

1 1

1 2 1 2

1 1

1 1

1 2 1 2

1 1

, ,

, , , ,n n

X t X t

X t X t X t X t

n nX t X t X t X t

p p

p p

p p

(3.11)

Ponendo = -t1, si verifica immediatamente che la (3.11) implica le seguenti proprietà:

Page 52: Aqfa   probabilita

52

1. La densità di probabilità del primo ordine (pdf) è indipendente dal tempo t1;

2. La densità di probabilità congiunta di ordine 2 dipende soltanto dalla distanza t2 – t1 dei due

istanti considerati;

3. La densità di probabilità congiunta di ordine n dipende dalle n – 1 distanze t2 – t1, t3 – t2, …,

tn – tn-1 fra gli n istanti considerati per l’estrazione delle variabili aleatorie.

Un processo aleatorio X(t) è detto debolmente stazionario se le condizioni (3.11) sono verificate per

n ≤ 2.

Dalle (3.11) è immediato dimostrare che le medie statistiche del primo ordine di un processo

(debolmente) stazionario sono indipendenti dal tempo:

22 2

2 22

E d

E d

E d

X X t

X X t

X X X X t

X t p

X t p

X t p

(3.12)

Analogamente, le medie statistiche del secondo ordine di un processo (debolmente) stazionario

dipendono dalla distanza = t2 – t1 fra i due istanti considerati per estrarre le variabili aleatorie. Tale

distanza è detta tempo di ritardo (o time lag):

1 2 1 2 1 2

1 2 1 2 1 2

2

E , d d

E

, d d

XX X t X t

XX X X

X X X t X t

XX

XX

X

R X t X t p

C X t X t

p

C

(3.13)

È immediato verificare che le funzioni definite dalle (3.13) soddisfano le seguenti proprietà:

2

2

0

0

0 1

XX XX

XX XX

XX XX

XX X

XX X

XX

R R

C C

R

C

(3.14)

Inoltre, per la (1.91) risulta:

Page 53: Aqfa   probabilita

53

2

1

XX X

XX

C

(3.15)

Un’ulteriore proprietà dell’auto-covarianza può essere dedotta da considerazioni di natura fisica.

Quando le due variabili aleatorie X(t1) e X(t2) utilizzate per valutare la covarianza sono estratte in

istanti molto distanti tra loro (||), queste variabili aleatorie tendono ad essere statisticamente

indipendenti e quindi non-correlate. Da ciò risulta la proprietà:

lim 0XXC

(3.16)

Mentre le proprietà (3.14) e (3.15) hanno origine matematica e sono sempre rigorosamente

soddisfatte, la (3.16) ha un’origine di natura fisica e, in alcuni casi, può cadere in difetto. I processi

aleatori per i quali la (3.16) è valida sono detti a memoria finita.

La Figura 3.4 mostra una tipica funzione di auto-covarianza di un processo stazionario.

Figura 3.4. Funzioni di auto-covarianza di un processo stazionario.

Si osservi che, a rigore, le funzioni campione di un processo stazionario devono necessariamente

avere supporto infinito (devono essere definite su tutto ℝ). In realtà l’ipotesi di stazionarietà è

applicata ogniqualvolta che gli effetti di inizio e fine generati dalla non-stazionarietà sono

trascurabili perché hanno una durata molto limitata rispetto alla lunghezza della parte di processo in

cui le caratteristiche statistiche sono effettivamente invarianti rispetto a traslazioni del riferimento

temporale. Considerando il caso in cui il processo X(t) costituisce la forza applicata ad una struttura,

o la risposta dinamica della struttura stessa (spostamento, tensione, ecc.), allora l’ipotesi di

stazionarietà appare accettabile quando la scala dei tempi caratteristici della struttura è molto più

rapida della scala temporale su cui variano le caratteristiche statistiche del processo. Un tempo

caratteristico di una struttura può essere, ad esempio, il primo periodo proprio ed è generalmente

dell’ordine di un secondo. Il tempo caratteristico delle forze applicate alla struttura dipende dalla

natura fisica del fenomeno eccitatore. Nel caso del vento, le proprietà statistiche della turbolenza

tendono a conservarsi invariate su periodi di lunghezza compresi fra 10 minuti e un’ora. Nel caso

delle onde marine il periodo di stazionarietà tende ad essere anche maggiore (circa 3 ore). Nel caso

del sisma, la fase pseudo-stazionaria in cui le caratteristiche dell’accelerazione sono invarianti dura

pochi secondi. Con questi argomenti è chiaro come l’ipotesi di stazionarietà sia assai più

ragionevole nel caso di strutture eccitate dal vento e dalle onde marine rispetto al caso di forzante

sismica.

Page 54: Aqfa   probabilita

54

3.2.1 Medie temporali di una funzione campione

La stima delle quantità statistiche definite dalle (3.12) e (3.13) può essere effettuata sulla base della

conoscenza di un insieme di realizzazioni xj(t) (j = 1,…,n) del processo X(t), utilizzando la

definizione frequentista di probabilità:

1

2 2

1

22

1

1

1

1

1

1

1

1

n

X j

j

n

X j

j

n

X j X

j

n

XX j j

j

n

XX j X j X

j

x tn

x tn

x tn

R x t x tn

C x t x tn

(3.17)

È chiaro che, se il processo è effettivamente stazionario, le quantità statistiche stimate attraverso le

(3.17) dovranno essere invarianti rispetto a t e potranno quindi essere valutate per un t qualsiasi.

Questo comporta ovviamente un uso poco efficiente delle informazioni statistiche contenute nelle

realizzazioni xj(t) disponibili per l’analisi e può portare a stime poco accurate (se n non è grande a

sufficienza). Con l’obiettivo di migliorare l’efficienza della stima, si definiscono le medie temporali

di una funzione campione x(t) attraverso le relazioni che seguono. Si definisce media temporale

della funzione campione x(t) il valore deterministico:

/2

/2

1lim d

T

TTx x t t

T (3.18)

Si definisce media quadratica temporale della funzione campione x(t) il valore deterministico:

/2

2 2

/2

1lim d

T

TTx x t t

T (3.19)

Si definisce varianza temporale della funzione campione x(t) il valore deterministico:

/2

22 2 2

/2

1lim d

T

TT

s x t x t x xT

(3.20)

Si definisce auto-correlazione temporale della funzione campione x(t) la funzione deterministica:

/2

/2

1lim

T

xxTT

r x t x t dtT

(3.21)

Si definisce auto-covarianza temporale della funzione campione x(t) la funzione deterministica:

/2

2

/2

1lim

T

xx xxTT

c x t x x t x dt r xT

(3.22)

Page 55: Aqfa   probabilita

55

È possibile dimostrare che le funzioni rXX() e cXX() hanno le medesime proprietà di RXX() e di

CXX().

Le medie temporali del primo ordine di una funzione campione possono essere interpretate come

realizzazioni di variabili aleatorie che, in generale, assumono un valore diverso per ogni

realizzazione del processo aleatorio. In altri termini, le medie temporali di una funzione campione

sono realizzazioni di variabili aleatorie generate nel medesimo punto campionario che ha

generato la funzione campione.

Analogamente le medie temporali del secondo ordine di una funzione campione di un processo

stazionario possono essere interpretate come realizzazioni di processi aleatori (funzioni aleatorie del

tempo di ritardo ).

È semplice verificare che se X(t) è un processo stazionario i valori attesi delle sue medie temporali

coincidono con le corrispondenti medie statistiche (per la dimostrazione è sufficiente applicare

l’operatore di valore atteso alle (3.18) - (3.22)). Risulta dunque:

2 2

2 2

E

E

E

E

E

X

X

X

XX XX

XX XX

X

X

S

R

C

R

C

(3.23)

dove le lettere maiuscole sopralineate rappresentano le variabili aleatorie le cui realizzazioni sono

definite dai simboli minuscoli corrispondenti, mentre RXX() e CXX() sono i processi aleatori aventi

rXX e cXX come (generiche) funzioni campione.

3.2.2 Processi aleatori ergodici

Un processo aleatorio stazionario è detto ergodico se le medie temporali di ogni sua realizzazione

sono coincidenti, ovvero se le medie temporali delle sue realizzazioni sono deterministiche. In

questo caso le medie statistiche coincidono con le medie temporali calcolate a partire da una

qualsiasi funzione campione purché sufficientemente lunga (a rigore di lunghezza infinita):

2 2

2 2

X

X

X

XX XX

XX XX

x

x

s

R r

C c

(3.24)

3.2.3 Rappresentazione nel dominio della frequenza di processi stazionari

L’analisi dei sistemi dinamici (deterministici) lineari è svolta in modo conveniente operando nel

dominio della frequenza. In questo modo, la trasformata di Fourier della risposta dinamica a regime

è ottenuta moltiplicando la trasformata di Fourier dell’eccitazione per la funzione di risposta in

frequenza del sistema dinamico. Allo scopo di estendere questi concetti all’analisi di sistemi lineari

con eccitazione aleatoria, è necessario introdurre una rappresentazione nel dominio della frequenza

di processi aleatori.

Page 56: Aqfa   probabilita

56

Nel caso di processi stazionari l’introduzione del concetto di trasformata di Fourier è piuttosto

complicato. Ciò è dovuto al fatto che la trasformata di Fourier di una funzione deterministica esiste

se e solo se questa è assolutamente integrabile (l’integrale del suo valore assoluto è finito). Per

contro, le funzioni campione di un processo stazionario non sono assolutamente integrabili, perché

non si estinguono per |t|. Da un punto di vista matematico, questo problema può essere risolto in

molti modi. Di seguito viene descritto quello matematicamente più semplice, che fa uso del

concetto di limite.

Sia x(t) una realizzazione del processo stazionario X(t) (per semplicità supposto a media nulla) e sia

xT(t) la funzione ottenuta finestrando x(t) in t(-T/2 T/2).

per ,

2 2

0 altrimenti

T

T Tx t t

x t

(3.25)

Si supponga che xT(t) sia assolutamente integrabile per ogni T finito. La trasformata di Fourier di xT

è fornita dalla relazione:

/2

i i

/2e d e d

Tt t

T TT

x x t t x t t

(3.26)

ed esiste per ogni T finito, Mentre la xT(t) può essere espressa nella forma:

i1e d

2

t

T Tx t x

(3.27)

Si definisce energia della funzione xT(t) la grandezza scalare:

/2

2 2

/2Enrg

T

T

TT

x t x t dt x t dt

(3.28)

Essendo xT(t) una realizzazione di un processo aleatorio XT(t), l’energia può essere interpretata

come una variabile aleatoria. Il nome energia associato alla grandezza definita dalla (3.28) è dovuto

al fatto che essa corrisponde (a meno di una costante) all’energia cinetica nel caso in cui x(t)

rappresenta una velocità o all’energia potenziale, nel caso in cui x(t) rappresenti lo spostamento di

un sistema elastico. Il limite per T dell’energia diverge quando x(t) è una realizzazione di un

processo stazionario. Si definisce potenza della funzione xT(t) la grandezza scalare:

/2

2 2

/2

1 1Pwr

T

T

TT

x t x t dt x t dtT T

(3.29)

Confrontando la (3.29) con la (3.19) si osserva che il limite per T della potenza coincide con la

media quadratica temporale di x(t):

2 21lim Pwr lim dT TT T

x x t x t tT

(3.30)

La varianza del processo X(t) corrisponde al valore atteso della media quadratica temporale (X è a

media nulla per ipotesi), quindi risulta:

Page 57: Aqfa   probabilita

57

2 2 21E E lim dX T

TX X t t

T

(3.31)

dove, l’integrale del processo XT(t) può essere interpretato come una variabile aleatoria le cui

realizzazioni sono ottenute integrando le funzioni campione xT(t) di XT(t). L’integrale nella (3.30)

può essere riscritto applicando il teorema di Parseval nella forma:

22 1

d d2

T Tx t t x

(3.32)

La (3.32) è valida per ogni realizzazione xT(t), quindi può essere applicata per riscrivere la (3.31)

nella forma:

2 dX XXS

(3.33)

dove

21 1

lim E2

XX TT

S XT

(3.34)

In qui ( )TX è il processo aleatorio (funzione della frequenza) le cui realizzazioni sono le

trasformate di Fourier ( )Tx ; la funzione SXX() è detta densità di potenza spettrale (Power

Spectral Density, PSD). Dalla (3.34) si deduce che la densità di potenza spettrale è una funzione

reale non-negativa.

L’auto-covarianza del processo X(t) può essere scritta come valore atteso dell’auto-covarianza

temporale:

2

2

1E lim d

1E lim d

T

XXT

T

T TT

C X t X t tT

X t X t tT

(3.35)

dove, ancora, gli integrali sono interpretati come agenti su ogni realizzazione del processo X(t).

Sostituendo la (3.27) nella (3.35) si ottiene:

ii

2

ii *

2

ii *

2

1E lim e d e d d

4

1E lim e d e d d

4

1E lim e e d d d

4

tt

XX T TT

tt

T TT

t

T TT

C X X tT

X X tT

X X tT

(3.36)

L’integrale in dt all’interno della (3.36) risulta:

Page 58: Aqfa   probabilita

58

i

e d 2t

t

(3.37)

che sostituito nella (3.36) fornisce la relazione:

2i

i

1E lim e d

2

e d

XX TT

XX

C XT

S

(3.38)

da cui si dimostra che la densità di potenza spettrale è, a meno di un fattore 2, la trasformata di

Fourier della funzione di auto-covarianza.

La densità di Potenza spettrale può essere espressa invertendo la (3.38) e risulta:

i1e d

2XX XXS C

(3.39)

Le equazioni (3.38) e (3.39) sono chiamate equazioni di Wiener-Khintchine.

Applicando la formula di Eulero alla (3.39) è possibile espandere l’esponenziale nella forma:

1 i

cos d sin d2 2

XX XX XXS C C

(3.40)

Ricordando che la funzione di auto-covarianza è pari rispetto a , il secondo integrale nella (3.40) si

annulla, pertanto la densità di potenza spettrale rimane espressa attraverso la relazione:

1

cos d2

XX XXS C

(3.41)

che è pari rispetto a

XX XXS S (3.42)

La (3.33) indica che l’area sottesa dalla densità di Potenza spettrale rappresenta la varianza del

processo. Inoltre, l’area elementare 2SXX()d rappresenta il contributo alla varianza X2 delle

armoniche del processo di pulsazione comprese nell’intervallo (, +d) (Figura 3.5). Per questa

ragione la densità di Potenza spettrale descrive il contenuto armonico del processo aleatorio così

come lo spettro di Fourier descrive il contributo armonico di un segnale deterministico.

Page 59: Aqfa   probabilita

59

Figura 3.5. Densità di Potenza spettrale.

3.3 Rappresentazione congiunta di una coppia di processi aleatori

Si consideri un esperimento il cui risultato è costituito da una coppia di processi aleatori X(t) e Y(t)

(per esempio il moto sismico lungo due direzioni o in due punti del terreno, la velocità del vento

misurata da due anemometri, la risposta dinamica di una struttura con 2 gradi di libertà).

Si consideri il valore del processo X(t) all’istante t = t1 e il valore del processo Y(t) per t = t2. Essi

possono essere interpretati come una coppia di variabili aleatorie e, come tali, possono essere

rappresentati attraverso la densità di probabilità congiunta pX(t1)Y(t2)(, ); quest'ultima dipende da

due parametri, e , nonché dai tempi t1 e t2 in cui le variabili aleatorie sono state estratte.

Dalla densità di probabilità congiunta si ottengono immediatamente le densità marginali dei

processi X e Y per integrazione parziale:

1 1 2

2 1 2

, d

, d

X t X t Y t

Y t X t Y t

p p

p p

(3.43)

3.3.1 Medie statistiche congiunte del secondo ordine

Si definisce cross-correlazione dei processi X(t) e Y(t) la correlazione delle variabili aleatorie X(t1) e

Y(t2) estratte da X e Y agli istanti t1 e t2, rispettivamente:

1 2

1 2 1 2, E , d dXY X t Y tR t t X t Y t p

(3.44)

Analogamente, si definisce cross-covarianza di X e Y la funzione:

1 2

1 2 1 1 2 2

1 2

, E

, d d

XY X Y

X Y X t Y t

C t t X t t Y t t

t t p

(3.45)

La cross-covarianza normalizzata è definita dalla relazione:

1 2

1 2

1 2

,,

XY

XY

X Y

C t tt t

t t

(3.46)

Page 60: Aqfa   probabilita

60

Il prefisso cross indica che la variabili aleatorie X(t1) e Y(t2) sono estratte dai due processi differenti

X e Y (sebbene associati al medesimo esperimento).

Dalle definizioni (3.44) - (3.46) risultano le proprietà:

1 2 2 1

1 2 2 1

1 2 2 1

, ,

, ,

, ,

XY YX

XY YX

XY YX

R t t R t t

C t t C t t

t t t t

(3.47)

In analogia a quanto definito per le variabili aleatorie, due processi aleatori X(t) e Y(t) sono detti

non-correlati se la loro cross-covarianza CXY(t1,t2) è nulla per ogni t1 e t2 in .

Appare evidente che le medie statistiche del secondo ordine di due processi stazionari X e Y non

dipendono da t1 e t2 separatamente, ma soltanto dal tempo di ritardo = t2 – t1.

E , d d

E

, d d

XY X t Y t

XY X Y

X Y X t Y t

XY

XY

X Y

R X t Y t p

C X t Y t

p

C

(3.48)

Dalle equazioni (3.48) è immediato verificare le seguenti proprietà:

XY YX

XY YX

XY YX

R R

C C

(3.49)

Inoltre per la (1.91) risulta:

1

XY X Y

XY

C

(3.50)

Per le medesime ragioni fisiche esposte per l’auto-covarianza, anche la cross-covarianza

(generalmente) tende a zero per ||. La Figura 3.6 mostra una tipica funzione di cross-

covarianza di due processi stazionari.

Page 61: Aqfa   probabilita

61

Figura 3.6. Cross-covarianza.

3.3.2 Densità di Potenza spettrale incrociata

Siano X(t) e Y(t) una coppia di processi stazionari a media nulla; si definisce densità di potenza

spettrale incrociata la funzione:

*1 1lim E

2XY T T

TS X Y

T

(3.51)

dove TX e TY sono i processi aleatori che contengono le Trasformate di Fourier delle realizzazioni

di X e Y finestrate secondo la (3.25). Operando in maniera analoga a quanto fatto per la densità di

potenza spettrale, è possibile dimostrare le relazioni:

ie dXY XYC S

(3.52)

i1e d

2XY XYS C

(3.53)

La densità di Potenza spettrale incrociata e la cross-covarianza costituiscono una coppia di Fourier.

La cross-covarianza è, in generale, non simmetrica, quindi la densità di Potenza spettrale incrociata

è, in generale, una funzione a valori complessi. La particolare simmetria della cross-covarianza

espressa dalla (3.49) si riflette sulle proprietà:

*

YX XY XYS S S (3.54)

3.3.3 Funzione di coerenza

La funzione di coerenza di due processi stazionari è definite dalla relazione:

XY

XY

XX YY

S

S S

(3.55)

La coerenza è, in generale, una funzione a valori complessi. Frequentemente, la sua parte reale è

chiamata co-coerenza, mentre la sua parte immaginaria è definita quad-coerenza. Alcuni testi

chiamano coerenza il modulo della (3.55), altri il suo modulo quadrato.

Una volta introdotta la funzione di coerenza, la densità di Potenza spettrale incrociata può essere

espresso nella forma:

Page 62: Aqfa   probabilita

62

( ) ( ) ( ) ( )XY XX YY XYS S S (3.56)

La funzione di coerenza può essere interpretata come la controparte nel dominio della frequenza

della cross-covarianza normalizzata. Questa analogia si riflette nella proprietà:

( ) 1XY (3.57)

Due processi aleatori che hanno coerenza unitaria sono detti coerenti. Se due processi aleatori

hanno coerenza nulla, allora sono non-correlati.

3.4 Trasformazioni lineari di processi stazionari

Si considerino due processi stazionari X(t) e Y(t) definiti in modo che le loro funzioni campione x(t)

e y(t) siano legate deterministicamente attraverso la trasformazione lineare:

y t x t H (3.58)

dove ℋ è un operatore lineare, tempo-invariante, causale e asintoticamente stabile. La funzione x(t)

è della ingresso (o input, o eccitazione); la funzione y(t) è detta uscita (o output, o risposta).

L’operatore ℋ è lineare se, per ogni coppia di funzioni x(t) e y(t) e per ogni coppia di costanti a e b in ℝ, vale la relazione:

a x t b y t a x t b y t H H H (3.59)

L’operatore ℋ è tempo-invariante se, per ogni τ in , vale la relazione:

y t x t H (3.60)

L’operatore ℋ è detto causale se la risposta y(t) dipende soltanto dal passato dell’eccitazione x()

con ≤ t.

L’ operatore ℋ è detto (asintoticamente) stabile se, per ogni ingresso limitato x(t) fornisce un’uscita

limitata y(t).

La risposta a regime (lontano dalle condizioni iniziali) dell’operatore (3.58) può essere espressa

attraverso l’integrale di convoluzione:

0

d

t

y t h t x (3.61)

dove h è detta funzione di risposta a impulso e pesa l’eccitazione applicata al tempo in funzione

del tempo trascorso (t - ). L’operatore ℋ è tempo-invariante se h non dipende esplicitamente da t,

ma soltanto dalla differenza t - ; ℋ è causale su h(t - ) = 0 per > t (assegna peso nullo alle eccitazioni future); ℋ è asintoticamente stabile se è assolutamente integrabile in .

Ipotizzando che l’istante iniziale di applicazione dell’eccitazione sia t = -, e sfruttando l’ipotesi di causalità, la (3.61) può essere riscritta nella forma:

Page 63: Aqfa   probabilita

63

d dy t h t x h x t

(3.62)

Applicando la trasformata di Fourier ad entrambi i membri della (3.62), si ottiene l’espressione nel

dominio della frequenza della trasformazione lineare:

y H x (3.63)

dove x e y sono le trasformate di Fourier di x e y (che si suppone esistano) e H è la funzione di

risposta in frequenza (FRF) dell’operatore lineare ℋ. La funzione di risposta in frequenza è la

trasformata di Fourier della funzione di risposta a impulso.

Se x(t) e y(t) sono funzioni campione di due processi aleatori stazionari X(t) e Y(t), allora la (3.58)

può essere formalmente interpretata come una trasformazione lineare di processi stazionari

Y t X t H (3.64)

In questo caso ha senso chiedersi se, conoscendo la rappresentazione probabilistica di X è possibile

valutare la rappresentazione probabilistica di Y. Come passo preliminare, il problema è affrontato

nell’Esempio 3.1 per il caso particolare dell’amplificatore ideale.

Esempio 3.1. Amplificatore ideale.

Sia X(t) un processo aleatorio stazionario a media nulla (X = 0) e sia Y(t) l’uscita

dell’amplificatore ideale ℋ.

Y t aX t (3.65)

dove la costante a rappresenta il guadagno dell’amplificatore. Applicando le definizioni di

auto- e cross-covarianza, è immediato dimostrare le seguenti relazioni:

2

YX XX

YY XX

YY YX XX

C aC

C a C

(3.66)

Inoltre, sfruttando le equazioni di Wiener-Kinchine:

2

1

YX XX

YX XX

XY

S aS

S a S

(3.67)

In generale, quando un processo aleatorio X(t) a media nulla è applicato un operatore lineare ℋ la

situazione può essere idealizzata come mostrato nello schema di Figura 3.7. Dal processo X(t) si

estrae una realizzazione x(t) che viene finestrata sul periodo T, ottenendo xT, quindi trasformata nel

dominio della frequenza ottenendo Tx . Applicando la (3.63) si perviene alla risposta Ty che

antitrasformata produce yT e quindi y, passando al linite per T→; quest’ultima è interpretata come

Page 64: Aqfa   probabilita

64

una realizzazione di Y. Analogamente Tx e Ty sono interpretate come realizzazioni dei processi

aleatori TX e TY che sono dunque legati dalla relazione formale:

T TY H X (3.68)

Sostituendo la (3.68) nelle definizioni di densità di potenza spettrale e densità di potenza spettrale

incrociata si dimostra:

*

2

YX XX

XY XX

YY XX

S H S

S H S

S H S

(3.69)

Dalla definizione di coerenza di dimostra inoltre che:

XY

H

H

(3.70)

da cui emerge che la coerenza fra l’eccitazione e la risposta di un operatore lineare ha

necessariamente modulo unitario.

d

T T T

T

T T T

X t x t x t x X

h t x H x

Y t y t y t y Y

Figura 3.7. Schema per il calcolo della risposta stazionaria di sistemi lineari.

In generale, se l’ingresso X(t) ha media non nulla, allora il valore medio dell’uscita può essere

calcolato applicando l’operatore di media alla (3.62).

E E d

E d

d 0

Y

X X

Y t h t X

h t X

h H

(3.71)

La media dell’uscita è proporzionale alla media dell’ingresso attraverso il favore in zero della FRF.

Ne segue che se l’ingresso ha media nulla, allora anche l’uscita ha media nulla.

3.4.1 Derivazione di processi stazionari

L’introduzione del concetto di derivate di un processo aleatorio (così come per il concetto di

inegrale) richiederebbe la definizione del limite di un processo aleatorio (o del limite di una

successione di variabili aleatorie). In termini matematicamente approssimativi, è possibile

Page 65: Aqfa   probabilita

65

concepire la derivata ( )X t di un processo aleatorio ( )X t come il processo aleatorio le cui funzioni

campione ( )x t sono le derivate delle funzioni campione di X(t).

In altri termini, è possibile concepire la derivata temporale come un particolare operatore lineare

avente FRF H() = i. In quest’ottica, la densità di potenza spettrale del processo derivato può

essere ottenuta particolarizzando le (3.69):

2

i

i

XXXX

XXXX

XXXX

S S

S S

S S

(3.72)

Le (3.72) possono essere facilmente generalizzate per considerare derivate di qualsiasi ordine n. In

questo caso l’auto-spettro della derivata n-ma di X è ottenuto nella forma:

2n n

X X

n

XXS S (3.73)

Dalle (3.72) discende che la coerenza fra un processo stazionario e la sua derivata risulta:

i sgnXX (3.74)

cioè ha modulo unitario e fase /2. Questo è in accordo con il principio per cui la coerenza misura

la presenza di un legame lineare deterministico fra due processi aleatori.

Applicando le equazioni di Wieren-Kintchine alle (3.72) si ottengono relazioni analoghe per il

dominio del tempo:

2

2

XXXX

XXXX

XXXX

dC C

d

dC C

d

dC C

d

(3.75)

3.5 Momenti spettrali

La densità di Potenza spettrale unilaterale ( )XXG è definite dalla funzione (Figura 3.8):

2 per 0

0 per 0

XX XX

XX

G S

G

(3.76)

È una funzione non-negativa definite per 0 e possiede la seguente proprietà:

2

0( )X XXG d

(3.77)

Page 66: Aqfa   probabilita

66

Figura 3.8. Densità di Potenza spettrale bilatera e unilatera.

Si definiscono moment spettrali (o moment di Vanmarcke) le quantità:

,0

( ) 0,1,2,...i

X i XXG d i

(3.78)

In particolare, i primi 3 momenti spettrali risultano:

2

,00

,10

2 2 2

,20

( ) ( )

( ) ( ) 0

( ) ( )

X XX XX X

X XX XX

X XX XX X

G d S d

G d S d

G d S d

(3.79)

La posizione X,1 del baricentro dell’area sottesa da GXX() è data dalla relazione (Figura 3.9):

,10

,1

,00

( )

( )

XX X

X

XXX

G d

G d

(3.80)

Il rapporto X = X,1 / 2 è detto frequenza attesa.

Il raggio di inerzia dell’area sottesa da GXX() è fornito dall’espressione:

1/22

,20,2

,00

d

d

XX X XX

X XXX

G

G

(3.81)

Figura 3.9. Interpretazione geometrica dei moment spettrali.

Page 67: Aqfa   probabilita

67

Il raggio di inerzia dell’area sottesa da GXX() rispetto al suo baricentro, X,2 , fornisce una misura

della dispersione della potenza spettrale (Figura 3.9). Questa quantità è definita dalla relazione:

2

,1

,2 ,2 ,2

,0 ,0

1 X

X X X X

X X

q

(3.82)

Dove il parametro qX è detto ampiezza di banda:

2

,1

,0 ,2

1X

X

X X

q

(3.83)

ed è una quantità adimensionale compresa fra 0 e 1.

3.6 Modelli di processi stazionari

Nel presente paragrafo sono presentati quattro classi di processi aleatori: il processo armonico, il

processo a banda stretta (narrow band), il processo a banda estesa (broad band) e il processo a

banda infinita (rumore bianco, white noise). Questi modelli così ordinati sono caratterizzati da

ampiezze di banda spettrale crescenti.

3.6.1 Processo armonico

Un processo aleatorio stazionario e a media nulla si definisce armonico se ogni sua possibile

realizzazione è esprimibile nella forma

0sinx t A t y (3.84)

dove l'angolo di fase y è una realizzazione della variabile aleatoria Y uniformemente distribuita

nell'intervallo 0, 2:

1

0 22

Yp

(3.85)

Page 68: Aqfa   probabilita

68

Figura 3.10. Processo armonico: realizzazione (a), funzione di autocorrelazione (b), densità di Potenza spettrale (c).

La funzione di auto-covarianza coincide con la funzione di autocorrelazione e risulta

2

0 0

22

0 0

0

2

0

E sin sin d

sin sin d2

cos2

XX YC X t X t A t t p

At t

A

(3.86)

La funzione densità di potenza spettrale di un processo armonico è definita come

2i i

0

2

0 0

1e d e cos d

2 4

4

XX XX

AS C

A

(3.87)

Ne consegue che 2 2

X A / 2 , inoltre i 2

X,i 0A / 2 e la larghezza di banda vale Xq 0 .

3.6.2 Processo a banda stretta

Un processo aleatorio stazionario e a media nulla si definisce a banda stretta se la sua densità di

potenza spettrale è non nulla solo entro un limitato range di frequenze con ampiezza B = 2 1 ,

dove B/ 0 0, 0 essendo il valor medio di banda: 0 1 2 / 2 .

Un processo a banda stretta si definisce ideale se la sua densità di potenza spettrale è definita come

Page 69: Aqfa   probabilita

69

0 1 2per

0 altrimentiXX

SS

(3.88)

La varianza di X(t) è 2

X 0 2 12S ( ) .

Figura 3.11. Processo a banda stretta: realizzazione (a), funzione di autocorrelazione (b), densità di Potenza spettrale (c).

La funzione di auto-covarianza risulta

2

1

i

0

02 1 0 0

e d 2 cos d

sin2 2

sin sin 2 cos

2

XX XXC S S

B

SS B

B

(3.89)

Inoltre:

X,0 02S B ; X,1 0 02S B ; 2

2

X,2 0 0

B2S B

12

; X

2 200

B Bq

1212 B

Ogni singola realizzazione del processo a banda stretta è caratterizzata da un contenuto armonico

concentrato intorno alla frequenza circolare al centro della banda armonica. Le realizzazioni

possono essere definite armoniche distorte, ovvero modulate in fase (fase non costante).

3.6.3 Processo a banda estesa

Un processo aleatorio stazionario si definisce a banda estesa se la sua densità di potenza spettrale è

non nulla solo entro un ampio range di frequenze. Un processo a banda estesa si definisce ideale se

la sua densità di potenza spettrale è definita come

Page 70: Aqfa   probabilita

70

0 per

0 altrimentiXX

S BS

(3.90)

La varianza risulta 2

X 02S B .

Figura 3.12. Processo a banda estesa: realizzazione (a), funzione di autocorrelazione (b), densità di Potenza spettrale (c).

La funzione di auto-covarianza risulta

00

0

2 cos

sin2

Bi

XX XXC S e d S d

BS B

B

(3.91)

Inoltre:

X,0 02S B ; 2

X,1 0S B ; 3

0X,2

2S B

3 ; X

1q

2

Ogni singola realizzazione del processo a banda estesa è caratterizzata da un andamento irregolare

dovuto all'ampiezza del suo contenuto armonico.

3.6.4 Rumore bianco

Un processo aleatorio stazionario si definisce rumore bianco se la sua densità di potenza spettrale è

costante nell'intero range di frequenze; è generalmente indicato con il simbolo W(t):

0( )XXS S (3.92)

Risulta che 2

X

Page 71: Aqfa   probabilita

71

Il processo a banda infinita è fisicamente non realizzabile ma la sua importanza in dinamica

strutturale è fondamentale.

Figura 3.13. Rumore bianco: realizzazione (a), funzione di autocorrelazione (b), densità di Potenza spettrale (c).

Fig. 17

La funzione di auto-covarianza risulta

i i

XX XX 0

0

C S e d S e d

2 S

(3.93)

E' immediato dimostrare che: ,X i i , 1Xq .

Ogni singola realizzazione di un processo definito rumore bianco è caratterizzata da un andamento

infinitamente irregolare dovuto all'infinito contenuto armonico.

4 Analisi statistica di processi aleatori stazionari Nelle applicazioni pratiche le funzioni continue vengono discretizzate mediante sequenze ordinate

di numeri calcolati per un insieme definito di valori (non necessariamente equispaziati) assunti dalla

variabile indipendente. I segnali discreti sono pertanto definiti come funzioni di variabili

indipendenti che possono assumere solo un insieme finito di valori.

Chiamiamo x t una funzione della variabile continua t (generalmente il tempo) e kx la sequenza

degli N valori assunti da x agli istanti 0,1,..., 1kt k N ; indichiamo inoltre con pT la

lunghezza del segnale registrato e con sT il periodo di campionamento, ovvero il tempo che

Page 72: Aqfa   probabilita

72

intercorre tra uno snapshot e il successivo (il pedice s deriva dalla parola inglese sample che

significa campione). Tali grandezze sono legate dalla relazione

p sT NT (3.94)

L'inverso del periodo di campionamento è definito frequenza di campionamento sn e vale

1s sn T (3.95)

mentre il reciproco della lunghezza del segnale campionato è definito risoluzione in frequenza pn e

corrisponde alla minima frequenza osservabile

1p pn T (3.96)

Il campionamento è il primo passo del processo di conversione di un segnale (funzione) da continuo

a discreto e la sua applicazione è vincolata al teorema del campionamento di Nyquist-Shannon, il

quale mette in relazione il contenuto del segnale originale con la frequenza sn . Il teorema afferma

che, sotto le opportune ipotesi, la minima frequenza di campionamento necessaria per evitare

ambiguità nella ricostruzione del segnale con larghezza di banda finita e nota è pari al doppio della

massima frequenza significativa, ovvero

2s cn n (3.97)

dove cn rappresenta la frequenza di cut-off. In altre parole, per campionare un segnale senza perdita

di informazione, bisogna campionarlo con frequenza almeno doppia rispetto alla frequenza della

massima componente spettrale del segnale originale (detta anche frequenza di Nyquist).

Un’armonica di frequenza maggiore di 2sn viene campionata con meno di un punto per ogni

semi-periodo.

Aliasing e immagini….

Il teorema del campionamento viene anche utilizzato in analisi statistica per stabilire il numero di

esperimenti da eseguire per collezionare un numero di dati (campioni) sufficienti per poter

ricostruire correttamente una funzione non nota in alcuni punti, per esempio in punti inaccessibili a

causa di vincoli fisici oppure semplicemente per ottenere dati tra due punti campionati tramite un

esperimento. Congiuntamente a spline e a funzioni di regressione permette di eseguire analisi

elaborate su segnali di origine fisica (temperature, pressioni, conteggio di globuli bianchi e rossi,

conteggio di stelle...).

4.1 Analisi nel dominio del tempo - stima della funzione di autocorrelazione

es matlab

4.2 Analisi nel dominio della frequenza - stima della funzione densità di potenza spettrale

La trasformata di Fourier di una funzione rispetto alla pulsazione è definita come

i tX x t e dt

(3.98)

congiuntamente l'anti-trasformata risulta

Page 73: Aqfa   probabilita

73

i tx t X e d

(3.99)

In questo modo le due funzioni x t e X sono legate dall'operatore trasformata di Fourier. In

ambito discreto ciò che lega i due vettori x e X è la trasformata discreta di Fourier o DFT; affinché

la trasformata sia invertibile le due sequenze devono avere la medesima lunghezza. La funzione

x t è di lunghezza finita e la si estende in maniera periodica per poterla rappresentare mediante

serie di Fourier

ji t

j

j

x t A e

(3.100)

dove 2 2j p p pj j n j T e jA sono i coefficienti di Fourier che valgono

0

1p

j

T

i t

j

p

A t x t e dtT

(3.101)

La (3.100) è valida anche per la sequenza di valori discreti k kx x t dove k st kT

2

2 /j k j s p

i jkTsi t i kT T i jk N

k j j j j

j j j j

x A e A e A e A e

(3.102)

dove

1

2 /

0

1 Nijk N

j k

k

A x eN

(3.103)

La sommatoria (3.102) è estesa comprendendo tutte le armoniche di frequenza j pn jn fino a

frequenza infinita. Se il segnale kx è campionato alla frequenza

sn , per il teorema del

campionamento non possono essere distinte al suo interno armoniche con frequenza maggiore di

2sn .

Supponendo inizialmente che il segnale in questione non contenga armoniche superiori a 2sn , la

(3.102) può essere riscritta nella forma

2

2 /

2

Ni j N

k j

j N

x A e

(3.104)

Definiamo DFT di kx la sequenza dei coefficienti di Fourier jA ordinati in modo da evitare indici

negativi e moltiplicati per il numero dei campioni N

0,1,..., 2 1

2, 2 1,..., 1

j

j

j N

NA j Nx

NA j N N N

(3.105)

Sostituendo nella (3.104) si ottiene

Page 74: Aqfa   probabilita

74

1

2 /

0

1 Nijk N

k j

j

x X eN

(3.106)

Si dimostra che la DFT definita in (3.106) è legata alla trasformata di Fourier continua dalla

relazione

j sX n X nj (3.107)

cioè la DFT approssima la Trasformata di Fourier a meno di un fattore sn .

Nel caso in cui il segnale contenesse armoniche significative oltre la frequenza di cut-off la (3.107)

andrebbe sostituita con la seguente relazione:

j s p s

m

X n X jn mn

(3.108)

% stima PSDF

function [S, n] = psd1(x,Nwin,ns)

% stima PSD (monolatera normalizzata in frequenza) del segnale x campionato

% alla frequenza ns

% Nwin = lunghezza finestre per metodo di Welch (usare potenza di 2 per

% maggiore velocità)

Nfft = Nwin;

Nover = floor(Nwin/2);

Nt = length(x);

Nn = ceil(Nfft/2)+1;

S = zeros(Nn,1);

kk = 0;

i1 = 1;

i2 = Nwin;

while i2 <= Nt

kk = kk + 1;

X = fft(x(i1:i2),Nfft); % fft: algoritmo ottimizzato per il calcolo

% della DFT

S = S + X(1:Nn).*conj(X(1:Nn));

i1 = i1 + Nwin - Nover;

i2 = i2 + Nwin - Nover;

end

S = S / (kk * Nwin * ns/2);

n = (0:Nfft/2)*ns/Nfft;

Figura 4.1. Codice Matlab per stima Power Spectral Density Function mediante algoritmo fft.

Page 75: Aqfa   probabilita

75

5 Simulazione di processi aleatori

5.1 Metodo di Shinozuka

Il metodo di Shinozuka permette di simulare N realizzazioni x t di un processo aleatorio X t a

media nulla e con assegnata densità di potenza spettrale xS . Le x t sono espresse mediante

sovrapposizione di armoniche di ampiezze opportune e fasi casuali nella forma

1

2 cosN

x j j j

j

x t S t

(3.109)

dove j sono valori di frequenza distanti e j sono numeri aleatori uniformemente distribuiti

in 0,2 .

Consideriamo la funzione z t definita in :

1

2 j j

Ni t

x j

j

z t x t iy t S e

(3.110)

dove risultano

1

1

Re

2 sin

2 cos2

N

x j j j

j

N

x j j j

j

x t z t

y t S t

S t

(3.111)

Dalla (3.111) e dall'assunzione che j sono uniformemente distribuite si deduce che x t e y t

sono realizzazioni del medesimo processo aleatorio o, analogamente, che le due funzioni sono

realizzazioni di due processi X e Y con le medesime proprietà statistiche, ovvero

, x y x yS S R R (3.112)

La funzione di autocorrelazione della z t a valori complessi sarà così definita

2

z

x y

x

R E z t z t

E x t x t E y t y t iE x t y t iE y t x t

R R iE x t y t iE y t x t

R iE x t y t iE y t x t

(3.113)

Per la (3.110) la medesima funzione varrà anche

Page 76: Aqfa   probabilita

76

, 1

, 1

4

4

j j k k

k jj k

z

Ni t i t

x j x k

j k

Nii t i t

x j x k

j k

R E z t z t

E S S e e

S S e e E e

(3.114)

L'ipotesi iniziale considerava j e k uniformemente distribuiti e statisticamente indipendenti per

k j , allora anche la loro differenza avrà distribuzione uniforme per k j , ovvero

k ji

kjE e

(3.115)

Di conseguenza la (3.114) diventerà

1

4 k

Ni

z x j

j

R E z t z t S e

(3.116)

Ora è lecito eguagliare le parti reali della (3.113) e della (3.116)

1

1

10

2 4Re

2 4 cos

cos cos

k

Ni

x x j

j

Ni

x x j

j

N

x x j

j

R S e

S e d S

S d S

(3.117)

L'ultima uguaglianza della (3.117) non è altro che la definizione di integrale secondo Riemann; il

secondo membro converge al primo per 0 .

Il processo a media nulla x t simulato attraverso la(3.109) è stazionario ed ergodico; la sua

distribuzione tende ad essere Gaussiana (per N ) in virtù del teorema del limite centrale.

Una rappresentazione alternativa alla (3.109) che possiede migliore convergenza alla distribuzione

Normale è fornita dalla formula

1

2Re j

Ni t

x j j

j

x t S A e

(3.118)

dove j j jA R iI sono numeri complessi, non correlati, con distribuzione di probabilità Gaussiana

standardizzata 0,1N .