Upload
bonifacio-loi
View
215
Download
0
Embed Size (px)
Citation preview
Computer e traduzione
10-15-16/3/2010Informatica applicata alla
comunicazione multimedialeCristina Bosco
Overview
• Traduzione: • Traduzione automatica• Traduzione assistita dal computer
Traduzione
• Traduzione e mondo• Traduzione e nuove tecnologie• Traduzione e ipertesto
Traduzione
Il processo di traduzione comporta
la decodifica del significato del testo nel linguaggio sorgente
la ricodifica di tale significato nel testo nel linguaggio destinazione
Traduzione
Il processo di traduzione comporta quindi
una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico
Traduzione
Necessità crescente di traduzione:• Aumento di comunicazioni• Necessità di distruggere le barriere
linguistiche (ad es. in regioni, stati e comunità multilingui)
• Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)
Traduzione
Ma la traduzione è • progressivamente più integrata con
la comunicazione• quindi deve essere più veloce e di
elevata qualità• riguarda grandi moli di documenti e
coinvolge gruppi di traduttori
Traduzione e nuove tecnologie
Le nuove tecnologie • arricchiscono il nostro orizzonte
culturale di nuove modalità espressive• ma incidono anche profondamente sul
modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza
tra le nuove modalità espressive l'ipertesto si pone come la più realistica
simulazione dei processi cognitivi
Traduzione e nuove tecnologie
Sono ipertestuali • la lettura di un testo che contiene
note e rimandi• la consultazione di un dizionario
mentre si legge un testo
E’ IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo
Traduzione e nuove tecnologie
ipertesti che contengano testi e loro traduzioni
consentono rapidi confronti tra versioni
e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo
Traduzione e nuove tecnologie
L’ipertesto è adatto quindi come supporto alla traduzione in quanto
consente di realizzare in modo esplicito legami tra il testo e le sue
traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre
persone
Traduzione e nuove tecnologie
Internet è uno strumento fondamentale perchè contiene un'enorme quantità
di informazioni linguistiche e culturali: archivi di testi letterari,
grandi corpora, dizionari
Traduzione e nuove tecnologie
Overview
• Traduzione• Traduzione automatica• Traduzione assistita dal computer
Traduzione automatica
• Cos’è la traduzione automatica• Breve storia della traduzione
automatica
Traduzione automatica
Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione
completamente eseguito da uno strumento software
Traduzione automatica
Il software di traduzione automatica
• prende in input un testo TA in una lingua A
• restituisce in output il testo TB che nella lingua B ha lo stesso significato di TA
• il modo in cui si passa dall’input all’output è indifferente
Traduzione automatica
La traduzione automatica presenta molti vantaggi:
• omogeneità nello stile ed uso di vocaboli
• coerenza (la stessa frase è tradotta sempre nello stesso modo)
• ma soprattutto risparmio di tempo e denaro
Traduzione automatica
La traduzione automatica è particolarmente adatta per determinati tipi di testo:
• guide di musei• documenti dell’Unione Europea• manualistica tecnica
Traduzione automatica
Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando:
• lo scopo è di comprendere il contenuto di un documento
• si vuole la presenza della componente umana stilistica
Traduzione automatica
MA la traduzione completamente automatica non è attualmente
realizzabile
E non sappiamo se lo sarà mai!
Traduzione automatica
La traduzione completamente automatica ricade infatti nei
problemi, tipici del NLP, legati a:
• ambiguità del linguaggio • incapacità delle macchine di
immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo
Traduzione automatica
La traduzione completamente automatica è dunque impossibile
quando la comunicazione tra esseri umani avviene in “ambienti”
(culturali e cognitivi)aperti,
mutevoli, governati da regole variabili
Traduzione automatica
La traduzione completamente automatica è oggi possibile in casi
particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti.
Ed esistono molti casi che possono essere ricondotti a questa
situazione.
Traduzione automatica
Il forte interesse teorico, ma soprattutto pratico per la traduzione
completamente automaticaè il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di
MT
Traduzione automatica: breve storia
Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni
su nozioni di linguaggio universale (precorrendo l’esperanto) che faciliterebbe il commercio e
linguaggi logici (precorrendo i linguaggi del computer)
Traduzione automatica: breve storia
Nel 1933, Georges Artsouni ideò un “cervello meccanico”, un dispositivo per trattare (archiviare,
consultare e stampare) informazioni, creato per scopi di crittografia, ma
utilizzabile per la traduzione e basato sulla traduzione diretta parola per
parola (senza nessuna analisi linguistica sottostante)
Traduzione automatica: breve storia
Il prototipo del “cervello meccanico” viene presentato e premiato all’esposizione
Universale di Parigi del 1937.Le poste e l’esercito francesi
commissionano due macchine che non verranno mai realizzate a causa della guerra.
Traduzione automatica: breve storia
Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di
macchina per la traduzione che prevede la trasformazione del testo
in forma logica universale (esperanto) prima di passare alla
lingua di destinazione e utilizza forme di analisi morfologica e sintattica
Traduzione automatica: breve storia
L’importanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver
proposto i due modelli che da allora in poi si utilizzeranno per la
traduzione automatica:
• traduzione diretta, parola per parola • traduzione indiretta, basata su
interlingua o transfer
Traduzione automatica: breve storia
Traduzione automatica: breve storia
La MT basata sull’interlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo
destinazione a partire dall’interlingua. Richiede la presenza
di informazioni morfologiche sintattiche e semantiche
Traduzione automatica: breve storia
La MT diretta non prevede rappresentazioni intermedie e si
basa sulla traduzione di ogni parola del linguaggio sorgente nella
corrispondente parola nel linguaggio destinazione
Traduzione automatica: breve storia
Ma ufficialmente la storia della MT nasce nel 1949, quando Warren
Weaver, esperto di decrittazione di codici, produce il promemoria
“Translation”
Traduzione automatica: breve storia
Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su:
• sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi)
• presenza di universali linguistici (metafora delle torri)
• frequenza delle parole (da crittoanalisi)
Traduzione automatica: breve storia
Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche,
già in uso ad esempio presso i romani durante il periodo di Cesare.
(Una avvincente storia della crittografia:Simon Singh, Codici e segreti, Mondadori)
Traduzione automatica: breve storia
Un esempio di crittografia: il codice di Cesare
Traduzione automatica: breve storia
Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la
vittoria degli alleati e la sconfitta dei tedeschi
(grazie al contributo di Alan Turing e del gruppo di Bletchley Park)
Traduzione automatica: breve storia
Dopo l’entusiasmo generato da Weaver e 10 anni ricchi di progetti di MT,
la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai
progetti e per le critiche di vari studiosi, tra cui in particolare quella
del filosofo Bar-Hillel (1959)
Traduzione automatica: breve storia
Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e
soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a
fondamento di qualunque traduzione
Traduzione automatica: breve storia
Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality
translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in
molti casi reali.Teorizza una traduzione di tipo transfer.
Traduzione automatica: breve storia
Negli stessi anni (1954) l’IBM attirava fondi e interesse pubblico
pubblicizzando l’esperimento di Georgetown:
traduzione, dal russo all’inglese, di 49 frasi accuratamente preparate
utilizzando 6 regole grammaticali e 250 item lessicali
Traduzione automatica: breve storia
Nel 1966 l’ALPAC (Automatic Language Processing Advisory Committee,
composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca
di base nella linguistica computazionale
Traduzione automatica: breve storia
Riassumendo:
• precursori (1933-1949), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.
Traduzione automatica: breve storia
Riassumendo:i due modelli:• traduzione diretta• traduzione indiretta, tramite
interlingua o transfer
Traduzione automatica: breve storia
Traduzione automatica: breve storia
Riassumendo:traduzione diretta:basata essenzialmente su una
traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche
Traduzione automatica: breve storia
traduzione indiretta di tipo transfer:LS ->SYS-S -> SYS-D ->LD
dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS)
SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.
Traduzione automatica: breve storia
traduzione indiretta di tipo interlingua: LS-> lingua universale -> LDda un testo in LS è tradotto in una forma
linguistica non caratterizzata (universale)che viene tradotto in LS.
Traduzione automatica: breve storia
Riassumendo:
• prima fase (1946-1954), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che un’approfondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.
Traduzione automatica: breve storia
Riassumendo:
• seconda fase (1954-1966), inizia l’entusiasmo per l’esperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale
Traduzione automatica: breve storiaRiassumendo:
• terza fase (1966-1975), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.
Traduzione automatica: breve storia
Riassumendo:
• quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).
Overview
• Traduzione• Traduzione automatica• Traduzione assistita dal computer
Traduzione assistita dal computer
• Breve storia dei sistemi integrati• Cosa sono i sistemi integrati
Traduzione assistita dal computer
L'invito dell’ALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dell’epoca.
Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a
creare banche dati
Traduzione assistita dal computer
Essendo caricate in supercalcolatori, le banche dati potevano però essere
utilizzate solo all'interno delle organizzazioni che le avevano
sviluppate(Comunità Europee, governo canadese,
Ufficio federale per le questioni linguistiche della Svizzera ...)
Traduzione assistita dal computer
Solo a metà degli anni '80, con la diffusione dei PC e successivamente
con l’avvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica,
sistemi di gestione di glossari, vocabolari digitali …)
Traduzione assistita dal computer
All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle
condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e
garantire una maggiore coerenza formale e contenutistica della traduzione
Traduzione assistita dal computer
I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation)
sono solitamente composti da
• Memoria di traduzione• Database terminologico• Editor di traduzione
Traduzione assistita dal computer
Cosa è la memoria di traduzione (TM, tanslation memory)?
É un database di frasi bilingue allineate, una raccolta di testi precedentemente
tradotti, che viene automaticamente generata e consultata per verificare
se (parte del)la frase è già stata tradotta.
Traduzione assistita dal computer
Come funziona una TM?
Se la frase è già stata tradotta, propone la traduzione (con il grado di
concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.
Traduzione assistita dal computer
Come funziona una TM?
Se la frase NON è ancora stata tradotta, l’utente dovrà digitare l’intera frase
nuova, che verrà a sua volta memorizzata nella TM.
Traduzione assistita dal computer
Come funziona una TM?
Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più
immediata e chiara la verifica e correzione della frase che si sta
traducendo
Traduzione assistita dal computer
Cosa è il database terminologico?
È una raccolta di termini tradotti eventualmente arricchita di
informazioni relative ai termini stessi
Traduzione assistita dal computer
Come funziona un database terminologico?
Viene creato dall’utente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.
Traduzione assistita dal computer
Cosa è l’editor per la traduzione?
È il software che guida l’utente attraverso la traduzione e gestisce il
dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del
database terminologico.
Traduzione assistita dal computer
Come funziona l’editor per la traduzione?Deve riconoscere e proteggere i cosiddetti
markers, perché, a traduzione ultimata, il programma provvede
automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle,
grafici, note a pié pagina, ecc.).
Traduzione assistita dal computer
I sistemi di CAT si possono basare su 2 diversi approcci:
1) il programma fa un confronto automatico dell’intero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.
Traduzione assistita dal computer
I sistemi di CAT si possono basare su 2 diversi approcci:
2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella
successiva. Poi propone la traduzione in base ai dati contenuti
nel database.
Traduzione assistita dal computer
I sistemi di CAT possono:2) Il sistema effettua la ricerca per ogni
singola frase, nel momento in cui si passa dalla frase tradotta a quella
successiva. Poi propone la traduzione in base ai dati contenuti
nel database.