9
1 EXCURSUS STORICO SULLE TECNICHE DI DISTORSIONE NON LINEARE (Draft 2010) Andrea Arcella 1 La distorsione non lineare (DNL) può essere intesa come una tecnica per operare modifiche su un segnale in ingresso oppure, mettendosi in una prospettiva speculare, per studiare gli effetti che segnali esterni possono avere sul segnale in oggetto nel caso in cui questi ultimi siano rappresentabili come funzioni distorcenti. I modelli che si basano sulla DNL nella teoria dei segnali sono stati proposti già prima della seconda guerra mondiale nell'ambito degli studi sulla teoria dell'informazione e sulle telecomunicazioni. L'oggetto di questo articolo è una riconsiderazione storica del framework concettuale della DNL applicato al campo specifico dei segnali audio. 1. Segnali sottoposti a funzioni distorcenti L'idea base della DNL è quella di applicare una funzione detta distorcente, ovvero un operatore, al dominio di un'altra funzione in ingresso. Un esempio tipico di DNL è quello di un amplificatore la cui funzione di trasferimento non è lineare lungo tutto il range delle ampiezze possibili per un segnale di ingresso. Se la funzione di trasferimento dell'amplificatore fosse lineare in tutto il range di funzionamento avremmo la situazione riportata in Fig.1 Fig.1 Funzione di trasferimento lineare con attenuazione In questo caso la funzione di trasferimento è lineare e la forma del segnale viene preservata attenuandone l'ampiezza. In Fig. 2 osserviamo una funzione di trasferimento che lascia invariata l'ampiezza ma inverte la fase del segnale in ingresso Fig.2 Funzione di trasferimento lineare con inversione di fase 1 Musicista e fisico www.sedicitonnellate.com

Excursus Storico Dnl (Distorsione non lineare)

Embed Size (px)

DESCRIPTION

Un piccolo excursus storico sulla sintesi per distorsione non lineare

Citation preview

Page 1: Excursus Storico Dnl (Distorsione non lineare)

1

EXCURSUS STORICO SULLE TECNICHE DI DISTORSIONE NON LINEARE (Draft 2010)

Andrea Arcella1

La distorsione non lineare (DNL) può essere intesa come una tecnica per operare modifiche su un segnale in ingresso oppure, mettendosi in una prospettiva speculare, per studiare gli effetti che segnali esterni possono avere sul segnale in oggetto nel caso in cui questi ultimi siano rappresentabili come funzioni distorcenti. I modelli che si basano sulla DNL nella teoria dei segnali sono stati proposti già prima della seconda guerra mondiale nell'ambito degli studi sulla teoria dell'informazione e sulle telecomunicazioni. L'oggetto di questo articolo è una riconsiderazione storica del framework concettuale della DNL applicato al campo specifico dei segnali audio.

1. Segnali sottoposti a funzioni distorcentiL'idea base della DNL è quella di applicare una funzione detta distorcente, ovvero un operatore, al dominio di un'altra funzione in ingresso. Un esempio tipico di DNL è quello di un amplificatore la cui funzione di trasferimento non è lineare lungo tutto il range delle ampiezze possibili per un segnale di ingresso.Se la funzione di trasferimento dell'amplificatore fosse lineare in tutto il range di funzionamento avremmo la situazione riportata in Fig.1

Fig.1 Funzione di trasferimento lineare con attenuazione

In questo caso la funzione di trasferimento è lineare e la forma del segnale viene preservata attenuandone l'ampiezza.In Fig. 2 osserviamo una funzione di trasferimento che lascia invariata l'ampiezza ma inverte la fase del segnale in ingresso

Fig.2 Funzione di trasferimento lineare con inversione di fase

1 Musicista e fisico www.sedicitonnellate.com

Page 2: Excursus Storico Dnl (Distorsione non lineare)

2

In generale negli amplificatori la funzione di trasferimento non è lineare in tutto il range di funzionamento. In Fig.3 è mostrato l'effetto di una funzione di trasferimento formata da spezzate.

Fig.3 Funzione di trasferimento lineare non lineare

E' evidente che il segnale risultante da distorsioni non lineari produce segnali con un contenuto armonico diverso (generalmente più ricco) da quello presente nel segnale originario. Possiamo quindi desumere che la modifica operata sull'ampezza del segnale induce una modifica sul contenuto in frequenza.Da un punto di vista analitico possiamo definire questo processo come un operatore distorcente f() applicato ad un segnale in ingresso x(t). Tale operatore può essere applicato al dominio o al codominio della funzione ovvero f()=x(f(t))oppure f()=f(x(t)).Nei casi illustrati in figura abbiamo tutti operatori f applicati al codominio ed in particolare:In Fig.1 l'operatore è dato dalla semplice moltiplicazione di una costante: f(t)=k* h(t) con k<1, in Fig.2 abbiamo k=-1 mentre in Fig.3 k assume 5 diversi valori corrispondenti alle 5 diverse spezzate. In questi casi il fattore moltiplicativo si può interpretare come il coefficiente angolare dei segmenti.In linea di principio possiamo applicare qualunque operatore, ad esempio la derivata f(x(t))=dx(t)/dt, oppure sperimentare con operatori che non hanno una definizione analitica disegnando arbitrariamente la funzione.

2. La DNL nell'informatica musicaleLa DNL è stata applicata ai segnali audio in anni successivi rispetto alla sua formulazione nell'ambito della teoria dei segnali. Riferendoci in particolare all'utilizzo della DNL applicata alla sintesi del suono la prima notizia che abbiamo è riferita all'uso che ne fa Risset nel 1969; nell' esempio 150 (vedi Fig.4) del Catalog of Computer Synthesized Sound c'è la descrizione di uno strumento (clarinetto) in cui l'onda seno è sottoposta ad una "funzione di trasferimento non lineare" ed il controllo di ampiezza del seno "determina l'ammontare di distorsione effettuata sul seno". Risset evidentemente usa il concetto di DNL ma non pubblica al riguardo articoli che diano presupposti teorici per l'uso della DNL come tecnica di sintesi.Bisogna ricordare che l'utlizzo di fatto di tecniche riconducibili al framework concettuale dellla DNL erano già in uso per la sintesi del suono anche se non esisteva (o meglio non era nota) una sistemazione teorica generale. Una tecnica chiaramente riconducibile al concetto di DNL era la famosa sintesi FM introdotta da Chowning nella seconda metà degli anni '60; Oggi infatti possiamo interpretare la funzione modulante come un operatore applicato alla funzione portante secondo lo schema tipico della DNL. Questo modo di interpretare la FM come un caso particolare di DNL è però venuto solo più tardi, quando dopo anni di sperimentazioni si è pervenuti ad un assetto teorico della DNL formalizzato in modo chiaro.

Page 3: Excursus Storico Dnl (Distorsione non lineare)

3

Il problema di qualunque tecnica di sintesi è quello di fornire risultati in qualche misura prevedibili. La formalizzazione della FM ha portato alla definizione di pochi parametri (indici di modulazione, etc) che potevano essere usati direttamente come parametri di controllo del suono nella fase di sintesi. Questo ha determinato il successo della FM come tecnica di generazione sonora.

Fig.4 Strumento 150 del Catalog of Computer Synthesized Sound

Nel caso più generale della DNL il risultato è arrivato più tardi, condizionato non solo da problemi di ordine concettuale e analitico ma anche dalle trasformazioni tecnologiche in atto negli anni '70 con il passaggio dall'analogico al digitale e l'introduzione sempre più massiccia dei computer.Nella prima metà degli anni '70 Suen (1970) e Hutchins (1976) danno una prima sistemazione analitica della DNL con applicazioni nel dominio analogico. Il problema dell'uso a fini musicali della DNL è quello di trovare una classe di funzioni distorcenti il cui risultato nell'applicazione alla sintesi del suono sia in qualche misura prevedibile. Dalla teoria matematica delle approssimazioni lineari abbiamo ereditato la possibilità di costruire grandi classi di funzioni partendo da combinazioni lineari di funzioni trigonometriche o polinomiali. Utilizzando queste tipologie di funzioni abbiamo il vantaggio di poter applicare una serie di strumenti matematici che ci consentono di conoscere analiticamente il risultato dell'applicazione di un'operatore di questo tipo e quindi di poter prevedere l'effetto sonoro della DNL.Il problema che si pone nel dominio analogico è che la progettazione elettronica necessaria per implementare un generico operatore non è per niente semplice, salvo che in alcuni casi notevoli come il clipping, la derivazione o l'integrazione. Questo forse è stato il principale limite allo sviluppo di una teoria generale della DNL negli anni precedenti. Il dominio digitale invece ci da la possibilità di generare operatori distorcenti comunque complessi

Page 4: Excursus Storico Dnl (Distorsione non lineare)

4

in modo relativamente semplice ma impone un problema importante assente nel dominio analogico. I segnali generati applicando un generico operatore infatti sono in generale a banda non limitata. Questo è un problema nel dominio digitale in quanto da luogo al fenomeno dell'aliasing e quindi pone un freno all'uso generale della DNL come tecnica di sintesi.A questo problema hanno posto rimedio Arfib e Lebrun che in due ricerche indipendenti pubblicate nel 1979 hanno indicato il modo di ottenere segnali a banda limitata dalla DNL. La classe di funzioni distorcenti proposte sono quelle ottenibili dai polinomi di Chebishev di primo tipo della forma T k x dove k rappresenta l'ordine del polinomio e x è una sinusoide:

T 1x =x

T 2 x=2x−1..

T n1 x=2xTn x−T n−1x

Tali polinomi si ottengono quindi da una relazione ricorsiva. La proprietà interessante di questi polinomi è che quando una funzione coseno in ingresso x(t) viene sottoposta ad una funzione distorcente T k x il segnale risultante è una sinusoide con frequenza pari alla k-esima armonica del coseno in ingresso. Quindi dato che ciascun polinomio è in grado di generare una armonica ben definita possiamo usare combinazioni lineari pesate di polinomi per creare combinazioni spettrali prevedibili (almeno nel caso di funzioni in ingresso semplici) e a banda limitata (se il segnale in ingresso è a banda limitata).In generale quindi la funzione distorcente con n termini polinomiali sarà del tipo

f x =h0

2∑

K=i

n

hk T k x

Se alla funzione in ingresso viene applicato un inviluppo temporale dinamico otterremo uno spettro dinamico analogamente a ciò che avviene con la variazione dell'indice di modulazione della FM. Ricordiamo infatti che una variazione di ampiezza del segnale di ingresso determina una variazione nello spettro del segnale di uscita. In riferimento alla Fig.5 il coefficiente ά, che rappresenta l'ampiezza del segnale di ingresso può essere una funzione che varia nel tempo, ad esempio l'inviluppo indicato.

Page 5: Excursus Storico Dnl (Distorsione non lineare)

5

Fig.5 Schema a blocchi della DNL

3.Un contributo storico: The Manner in wich and Extent to wich speech can be distorted and remain intellegible – 1950 – MACY Conference

In questo talk Licklider esamina gli effetti del rumore sull'intellegibilità del parlato. Ciò che risulta interessante ai fini storici per coloro che si occupano di suono sono le rappresentazioni dell'interazione tra segnale e rumore che lo scienziato propone. Lo scienziato effettua una disamina delle tipologie di rumore che possono compromettere il parlato. Nella prima parte del testo Licklider offre una panoramica dei rumori che si possono modellizzare come una funzione distorcente applicata al dominio del parlato (che non è contemplata nella discussione sulla DNL), il cui caso più semplice è una dilatazione o una compressisone dell'asse temporale ovvero una riproduzione rallentata o accellerata della registrazione vocale.Nel seguito vengono affrontate le distorsioni applicate al codominio della funzione utilizzando il framework della DNL come lo abbiamo precedentemente illustrato. Le figure incluse nel suo articolo sono particolarmente indicative (vedi Fig.6).Licklider considera vari tipi di funzioni distorcenti tra cui il peak clipping simmetrico, il clipping centrale, la derivazione e l'integrazione (Fig.7). La scelta di questo tipo di funzioni non deve stupire, infatti non solo sono rappresentative di una serie di disturbi delle comunicazioni ma sono anche particolarmente semplici da realizzare mediante l'elettronica analogica che era l'unica disponibile a

Page 6: Excursus Storico Dnl (Distorsione non lineare)

6

quel tempo.

Fig. 6a e 6b La figura 6a Illustra l'effetto del peak clipping simmetrico applicato ad una sinusoide, mentre la 6b illustra l'effetto del peak clipping sul parlato. A parola non distorta. B peak clipping di 6 dB e successiva normalizzazione. C clipping ancora maggiore

Page 7: Excursus Storico Dnl (Distorsione non lineare)

7

Fig. 7 La figura riassume l'effetto di varie funzioni distorcenti e di loro combinazioni sul segnale parlato

L'interesse storico dell'articolo risiede nel fatto che Licklieder utilizza il framework concettuale della DNL applicato ad un segnale audio con venti anni di anticipo rispetto al suo utilizzo nell'informatica musicale e con quasi quarant'anni di anticipo rispetto alla sua formalizzazione definitiva in questo ambito.

Page 8: Excursus Storico Dnl (Distorsione non lineare)

8

Bibliografia

[1]Arfib, D. ”Digital synthesis of complex spectra by means of multiplication of non‐linear distorted sine‐waves”,Journal of the AES, 27(10), 1979.[2] LeBrun, M. ”Digital waveshaping synthesis”, Journal of the AES, 27(4), 1979.[3] Beauchamp, J. ”Brass‐tone synthesis by spectrum evolution matching with nonlinear functions”, ComputerMusic Journal, 3(2), 1979.[4] Risset, J.C. An introductory catalog of computer synthezed sounds. Bell Telephone Laboratories, 1969.[5] Schaefer, R. ”Electronic musical tone production by nonlinear waveshaping”, Journal of the AES, 18(4), 1970.[6] Roads, C. ”A tutorial on nonlinear distortion or waveshaping synthesis”, in Foundations of computer music(C.Roads and J.Strawn eds.). MIT Press, 1985. [Originally appeared in Computer Music Journal, 3(2), 1979.][7] Di Scipio, A. and Prignano, I. ”Synthesis by Functional Iterations. A Revitalization of Nonstandard Synthesis",Journal of New Music Research, 25(1), 1996.[8] Di Scipio, A. ”Iterated nonlinear functions as a sound generating engine”, Leonardo, 34(2), 2001[9] Di Scipio, A. ”Synthesis of environmental sound textures by iterated non linear functions and its ecologicalrelevance to perceptual modeling”, Journal of New Music Research, 32(2), 2002.[10] Filatriau, J.J. Réalisation d’un instrument de synthèse de textures sonores en temps réel, DEA Université Aix‐Marseille II, 2004 [11] Recht, B. and Whitman, B. ”Musically expressive sound textures from generalized audio”, Proc. Int'lConference on Digital Audio Effects (DAFx‐03), 2003.[12] Laminar, Manifold, JdK Productions, 2002 (compact disc).[13] Marcus Satellite, From on high, PerfectBuzzMusic, 1998 (compact disc).[14] Filatriau, J.J. and Arfib, D. ”Instrumental gestures and sonic textures”, Proceedings of the Sound and MusicComputing Conference, 2005.[15] Filatriau, J.J., Arfib, D., Glowinski, D. and Volpe, G. ”Virtual objects as mediation between sonic textures andinteractive gestures”, Proceedings of the Int'l Computer Music Conference, 2007[16] Lazzarini, V. and Timoney, J. ”New Perspectives on Distortion Synthesis for Virtual Analog Oscillators”,Computer Music Journal, 34(1), 2010.[17] Smith, J. O. “Physical Audio Signal Processing for Virtual Musical Instruments and Audio Effects”. Availableonline at ccrma.stanford.edu/~jos/pasp, 2008.[18] Licklider, J.C.R., “Effects of amplitude distortion on the intelligibility of speech“, Journal of the ASA, 18, 1946.[19] Licklider, J.C.R. and Pollack, I., “Effects of differentiation, integration, and infinite peak clippi

Page 9: Excursus Storico Dnl (Distorsione non lineare)

9

ng upon theintelligibility of speech“, Journal of the ASA, 20, 1948.[20] Licklider, J.C.R. “The manner in which and extent to which speech can be distorted abd remain intelligible“,Transactions of the 7th Conference on Cybernetics: Circular Causal and Feedback Mechanisms in Biological andSocial Systems (H.von Foerster ed.), J.Macy Foundation, 1950. [Reprinted in Cybernetics ‐ The Macy Conferences1946‐1953 (C.Pias ed.), Diaphanes, 2003].[21] Licklider, J.C.R. “Man‐computer symbiosis“, IRE Transactions on Human Factors, 1960.[22] Licklider, J.C.R. “The computer as a communication device“, Science and Technology, April 1968.