Suono Digitale (Campionamento e Quantizzazione

Embed Size (px)

Citation preview

CAPITOLO 2

ANALISI DI SEGNALI SONORI

La natura continua del segnale Sonoro che si manifesta cio con variazioni di pressione che avvengono senza discontinuit, veniva trattato dal complesso di apparecchiature elettroniche che utilizzavano una rappresentazione interna elettro magnetica di per s continua, e perci la formalizzazione della teoria dei segnali e del loro trattamento faceva riferimento alla matematica del calcolo infinitesimale. Ma con la realizzazione degli elaboratori elettronici e pi in generale con lo sviluppo della tecnologia digitale, si dovette sviluppare anche una nuova formalizzazione del fenomeno acustico in s e delle modalit operative di generazione, di trattamento e di riproduzione dei segnali, dovuta al diverso modo di rappresentazione. Con l'uso dell'elaboratore il fenomeno acustico viene trattato come segnale rappresentato in forma di successione numerica e perci le tecniche di analisi, di sintesi, di elabora zione, di registrazione e di riproduzione diventano algoritmi e la teoria matematica di supporto fa riferimento a successioni numeriche e ad operatori come sommatorie ed equazioni alle differenze piuttosto che ad integrali e derivate. Si introduce cos una nuova terminologia che vuole l'aggettivo analogico riferito al segnale reale e l'ag gettivo numerico riferito alla sua rappresentazione interna ai sistemi di elaborazione. Argomento di questo capitolo il complesso delle problematiche e degli apparati utilizzati nella trasformazione dei segnali analogici in rappresentazione numerica, e viceversa. Numerico e digitale verranno usati con lo stesso significato.

18

INFORMATICA E MUSICA

DIGITALIZZAZIONE DEL SEGNALEI processi che stanno alla base della trasformazione in rappresentazione numerica di segnali reali sono il campionamento, la quantizzazione la codifica. [ 25,31,37]

Il campionamento l'operazione attraverso la quale vengono prelevati i valori (detti appunto campioni) che esprimono l'ampiezza di un dato segnale ad istanti discreti, che produce cos una nuova rappresentazione del segnale stesso. La distanza temporale che intercorre tra il prelevamento di un campione e il successivo detta periodo di campionamento e quindi il numero di campioni prelevati nell'unit di tempo (un secondo) rappresenta la frequenza di campionamento. La quantizzazione l'operazione attraverso la quale, ad ogni istante di campiona mento, il valore reale del segnale viene misurato e quindi associato al valore pi vicino di un opportuno insieme di valori discreti: La codifica infine l'operazione attraverso la quale ogni valore quantizzato viene . rappresentato in forma numerica. Tale forma generalmente coincide con una sequenza di numeri interi espressi in forma binaria.

1001011

.

o

-. .....

Campionatore

..... -

Quantizzatore

-. .....

Codificatore ~

Nel complesso, il processo di trasformazione si chiama digitalizzazione del segnale, ed ovviamente da una sequenza di numeri possibile ottenere un segnale analogico con un procedimento corrispondente in pratica all' inverso di quello appena visto. Affinch i dati generati dal processo di conversione AlD rappresentino senza perdita di informazione il segnale originario, necessario che vengano soddisfatti alcuni requisiti. Innanzi tutto, poich nella rappresentazione numerica del segnale vengo no usati valori numerici (di solito) senza decimali, ogni singolo campione digitale viene affetto da un errore di approssimazione che viene detto errore di quantizza zione. Questo errore misurabile in termini di differenza tra il valore istantaneo del segnale reale e del valore numerico utilizzato espresso dalla relazioneE. = I

I P(iT) - P q(iT) I

Capitolo 2: ANALISI DI SEGNALI SONORI

79

in cui P(iT) il valore effettivo del segnale analogico e Pq (iT) il valore quantizzato valutati all'i-esimo istante di campionamento. Come vedremo tra poco, l'entit dell'errore dipende dal numero di bit del numero utilizzato per la codifica binaria. Ora vediamo pi in dettaglio nella figura seguente quanto detto fino ad ora.Livelli di quantizzazione

Codifica dei livelli di quantizzazione

L7 .-------

Campione quantizzato

111 110 101

6' --Campione effettivo

100

l l

011 010 0010002 .---.- --.. ---.- 1.- --.---.. - --.- - -

-01

'

..

I

I

I

Sull'asse delle ascisse sono riportati gli istanti di campionamento, mentre sull'asse delle ordinate sono riportati i livelli di quantizzazione utilizzati rappresentati ulteriormente con la corrispondente codifica binaria nella tabella riportata accanto. Il numero di livelli di quantizzazione (Nlq ) usati per la codifica dipende dal numero n di bit: ad esempio, per 8 livelli di quantizzazione sono necessari 3 bit. Pi formalmente questa dipendenza espressa dalla seguente relazione: n=

Iog, Nlq

L'alterazione dovuta alla quantizzazione dei campioni reali viene considerata come una sorta di rumore sovrapposto al segnale vero e proprio. Il grado di bont di questa approssimazione solitamente espresso dal rapporto tra la potenza S del segnale reale e la potenza media N (Noise) del rumore di quantizzazione, indicato con SNR (Signal to Noise Ratio). Il valore campionato viene rappresentato dal pi vicino

"

20

INFORMATICA E MUSICA

livello di quantizzazione tra quelli disponibili (2 n ) e perci l'errore E(iT) dovuto a questa approssimazione non sar mai superiore alla met dell'intervallo di separazio ne tra due livelli consecutivi. Ad esempio, se n=10, cui corrispondono1024 livelli, e il segnale analogico varia tra -10V e +10V (la variazione complessiva di 20 V), lo scarto tra due livelli adiacenti risulta di 20/1024 ~ 20 mV (rnillivolt) e quindi nel caso peggiore avremmo un errore assoluto di -10mV. Nel caso che il numero di bit utilizzati per la codifica dei campioni sia sufficientemente elevata (almeno 6+7), si dimostra che il rapporto segnale/rumore dato con buona approssimazione da SNR = 22n La rappresentazione dell'SNR fatta secondo una scala lineare porta a risultati che spaziano in un intervallo piuttosto ampio, facendo perdere di vista la misura del rapporto stesso. Per questo motivo preferibile utilizzare una rappresentazione in scala logaritmica, esprimendo il rapporto segnale/rumore in deciBel:

Applicando le regole dei logaritmi alla precedente espressione, si ottiene: SNR = lO log lO 22n = n * 20 logl O 6 02 dB 2=n *' Questa relazione mostra come ogni bit contribuisca di circa 6 dB alla riduzione dell'errore stesso. Nella tabella seguente riportatoil rapporto segnale/rumore espresso sia linearmente che in dB, in funzione del numero di bit utilizzati per la codifica:

SNR (rapporto segnale/rumore)il

Scala lineare 6 7 8 9

(2 2 n) I

Scala logaritrnica (dB) 36 42 48 54 60 66 72 78 84 90 96

lOIl

12 13 14 15 16

4096 16384 65536 262144 1048576 4194304 16777216 67108864 268435456 1073741824 4294967296

Capitolo 2: ANALISI DI SEGNALI SONORI

21

Un altro problema relativo alla digitalizzazione di un segnale analogico quello relativo alla scelta della frequenza di campionamento a cui fa riferimento il corrispon dente teorema (Shannon) e conosciuto nel settore audio anche come teorema di Nyquist. In base a questo teorema la frequenza di campionamento e cio il numero di campioni prelevati nell'unit di tempo, deve essere fissata almeno al doppio della massima frequenza contenuta nel segnale originale. Poich la gamma frequenziale percepita dall'uomo varia tipicamente tra un minimo di 16Hz ed un massimo di 16KHz, la frequenza di campionamento deve essere posta ad almeno 32KHz. In pratica, per non appesantire eccessivamente i circuiti atti alla ricostruzione del segnale a partire dai campioni, di solito si sceglie la frequenza di campionamento 2,5+3 volte superiore a quella massima contenuta nel segnale stesso. Ad esempio, per lo standard dell'hifi commerciale stata scelta la frequenza di campionamento di 44,1KHz per i CD (Compact Disk) e per i DAT (Digital Audio Tape) anche 48 KHz. Quando il teorema di Nyquist non viene rispettato, si va incontro al fenomeno conosciuto come aliasing o foldooer. Prima di esaminarlo in maniera analitica, vogliamo descriverlo attraverso un esempio figurato. noto che il movimento delle immagini di un film il risultato della proiezione di una sequenza di 24 fotogrammi al secondo relativi ad un'immagine reale in movimento. Al momento della ripresa, avviene il campionamento ad intervalli regolari di 1/24 di secondo della infinita sequenza di immagini propria del naturale trascorre del tempo. Con questa velocit di ripresa e di proiezione, qualunque immagine in movimento che avviene con velocit sufficientemente basse come nei normali movimenti delle persone, viene ricostruita in maniera fedele alla realt. Ma fenomeni che accadono con velocit superiori, come tipicamente succede per oggetti rotanti, durante la proiezione non vengono sempre correttamente ricostruiti. Si pensi ad esempio alle ruote dei carri dei film western che a volte girano in senso contrario al quello relativo al senso di marcia del carro stesso. Consideriamo una ruota con quattro raggi del diametro di 30cm circa, tenendo presente che le considerazioni che facciamo valgono poi per una ruota di 8 raggi e 60cm di diametro ed una con 12 raggi e 90cm di diametro, certamente pi vicine a situazioni reali. La nostra' ruota dunque di 30*3.14. = 96 cm circa di circonferenza. Quando inizialmente il carro si muove, diciamo con cavallo alpasso, presumibilmente ad una velocit di ~ 7Km!h pari a 1.92 = 0.96x2 metri al secondo, la ruota compie due giri completi ogni secondo, pari ad un angolo di 2x21t radianti. Poich i fotogrammi di ripresa sono 24 ogni secondo, ciascun raggio della ruota viene ripreso ad incrementi di angolo di 41t/24=1t/6 radianti (=30), ed in proiezione il movimento viene ricostruito correttamente. Quando il cavallo passa al trotto ad una velocit di ~20Km!h = 5.76 = 6xO.96rn/sec., la ruota compie ogni secondo sei giri completi, pari ad un angolo di 6x21tradianti. Questa volta i raggi vengono ripresi ad incrementi di 6x21t/24=1t/2 radianti (=90)

22

INFORMATICA E MUSICA

e siccome i raggi sono quattro, le immagini successive sono uguali tra loro ed il risultato apparente di una ruota ferma di un carro in corsa (in realt si vede che qualcosa non torna proprio perch l'immagine della ruota e confusa e questa confusione data dalla continua sovrapposizione di immagini diverse come senz'altro diversi 50n-o in particolare ogni singolo raggio). Quando il cavallo passa al galoppo ad una velocit di z35Km1h = 9.6 = lOx.96 m/s, la ruota compie ogni secondo dieci giri completi pari ad un angolo di 10x21t radianti. Questa volta i raggi vengono ripresi ad incrementi di 1Ox21t/24=51t/6 radianti ( = 150). Mentre un raggio compie dunque un angolo di 51t/6 radianti, il raggio opposto che si trova sempre a 1t radianti, si trova nella posizione di 1[+51t/6 = l11t/6= -x/6. Questo vuoI dire che la successione dei fotogrammi riprende e ripropone un movimento apparente che risulta essere contrario a quello originale. Succede dunque che la frequenza apparente con cui ogni singolo raggio (e quindi la ruota nel suo insieme) si muove, data dalla differenza tra la frequenza di presenta zione dei foto-grammi e la frequenza istantanea di rotazione della ruota. In pratica, in un qualsiasi sistema fisico in cui sono presenti due oggetti entrambi in movimento periodico di periodi diversi l'uno dall'altro, si genera sempre un nuovo movimento periodico sovrapposto a quelli gi esistenti, di periodo diverso da essi ma pur sempre loro legato. La corrispondente frequenza detta frequenza immagine.

corretto

fermo

contrario

Campionando perci un segnale che ha frequenze superiori alla met della frequenza di campionamento (e cio, sottocampionando) si ha che il numero di campioni ottenuto non sufficiente a ricostruire correttamente il segnale originale.

Capitolo 2.' ANALISI DI SEGNAU SONORl

23

Il fenomeno conusciuto come foldover ( ripiegare intorno) e corrisponde alla trasformazione del segnale di ingresso in un segnale a frequenza Ffo1d = Fc - fs ' dove Fcrappresenta il tasso di campionamento ed fs la frequenza del segnale originale. Pi in generale, nel caso di un segnale periodico con la fondamentale fo' ed un certo numero di armoniche superiori, se Fcflon viene fissato almeno al doppio dell'armo nica a frequenza pi elevata, nel segnale ricostruito compaiono frequenze immagini non presenti nella banda base del segnale originale

0,15

01\\ \ \

~~

Segnale da campionare Segnale ricostruito dopo il campionamento

fo= 12 KHz

Fe = 20KHzffold

~

Te = 0,05msec

= 8KHz

Gli effetti sonori dovuti al foldover sono notevoli. Si pensi ad esempio al campiona

mento di un'onda che aumentaprogressivamente eli frequenza (glissando); fino a che tale valore non supera la met della frequenza di campionamento, il segnale viene ricostruito correttamente, dopodich il segnale risulta a frequenza decrescente e perci distorto rispetto al segnale originale. Una volta fissata la frequenza di campionamento, la rimozione delle frequenze contenute nel segnale che hanno valore superiore alla met della frequenza di campionamento stessa, viene risolto attraverso il filtraggio del segnale da campiona re. Il dispositivo che deve essere inserito a monte della catena di conversione A!D quindi un filtro di tipo passa-basso detto anche filtro anti-aliasing. Per riassumere possiamo dire che considerando il segnale nella sua forma grafica, e volendo ricostruirlo in maniera grafica, il campionamento influisce sull'asse delle ascisse (tempo) e la quantizzazione influisce sull'asse delle ordinate (risoluzione).~.