Upload
others
View
11
Download
0
Embed Size (px)
Citation preview
Nuove Tecnologie
per la
Traduzione
Roma, Tor Vergata,LINFO Giuseppe Forte María Lozano Zahonero Sandra Petroni
Contenuti del seminario
1. Dalla traduzione automatica alla traduzione
assistita
2. I corpora, le basi di dati terminologiche e
testuali, le memorie di traduzione e il processo
traduttivo
3. Creazione di corpora, allineamenti e memorie di
traduzione.
TEORIA
PRATICA
4. La traduzione interattiva, il post-editing e il
cleaning dei dati (tmx)
30-03 13:00-15:00
T12A
05-04 09:00-11:00
T12B
12-04 09:00-11:00
T12B
13-04 09:00-11:00
T12A
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1. Dalla traduzione automatica alla traduzione
assistita
1.1 Il mercato della traduzione: sviluppi
1.2 Il mercato della traduzione: domanda
1.3 La traduzione automatica (TA/MT)
1.4 La traduzione assistita (CAT)
- Il workflow
Nuove Tecnologie
per la
Traduzione
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
30-03 13:00-15:00
T12A
• Il progresso tecnologico: Internet
1.1 IL MERCATO DELLA TRADUZIONE: sviluppi
• Globalizzazione
“Processo economico di integrazione
dell'intera economia mondiale in un unico
mercato, con conseguente superamento
delle barriere nazionali” Grande Dizionario Italiano
di GABRIELLI ALDO Dizionario della Lingua Italiana
• Documentazione multilingue:
domanda di traduzione
L'aumento esponenziale di testi da
tradurre richiede l'uso di
tecnologie in grado di ridurre
significativamente tempi e costi
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Stati Uniti: Warren Weaver, 1947
Possibilità di tradurre attraverso l’uso di una
macchina:
…metodo basato sulla sostituzione di parola per
parola, e proponeva di integrarlo con tecniche di
statistica applicata per rilevare la frequenza di
parole e caratteri in testi paralleli… (Wikipedia)
1.3 LA TRADUZIONE AUTOMATICA (TA/MT)
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
TRADUZIONE AUTOMATICA
“La traduzione automatica (TA), definita anche traduzione
automatizzata o MachineTranslation (MT) è un processo
mediante il quale un software viene utilizzato per tradurre
un testo da una lingua naturale (ad esempio, l’inglese) ad
un’altra (ad esempio, lo spagnolo) senza l’intervento
umano”
(Systran)
Source Text
Machine Translation Translations
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1.3 TRADUZIONE AUTOMATICA (TA/MT):
Fallimento: l’ALPAC, Automatic Laguage Processing
Advisory Committee proclama la TA inutile e dispendiosa;
Non sarebbe stato possibile ottenere un sistema di
traduzione completamente automatico di alta qualità e
che potesse sostituire la traduzione umana.
Ripresa: anni ‘80/’90 nuovo interesse
Finanziamenti da parte di grandi organizzazioni
internazionali
Nascita dei primi sistemi di TA:
Systran (russo-inglese)
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1.3 TRADUZIONE AUTOMATICA (TA/MT):
Ambito di indagine della Linguistica Computazionale
(Natural Language Processing – Trattamento Automatico delle
Lingue) Anni ‘90
Discplina che si occupa dell’elaborazione delle lingue, in ogni
possibile aspetto, mediante l’uso di calcolatori.
Modelli principali:
Diretti o per unità
Sintattici o transfer-system
Sistemi a interlingua
Sistema basato su esempi
Sistema basato su statistiche
Sistemi ibridi
1. Rule-Based:
2. Probabilistici:
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sistemi basati su regole (Rule-Based)
CARATTERISTICHE
Un numero quasi infinito di regole linguistiche
rappresentate in diagrammi ad albero
(morfologici/sintattici).
Milioni di dizionari bilingui per ogni combinazione
linguistica
Le traduzioni vengono create in base a processi di:
lemmatizzazione, etichettatura, parser,tokenizzazione, …
<verb>, <n>, <m>, <f>, <sg>, <pl>, …
Diretti o per unità
Sintattici o transfer-system
Sistemi a interlingua
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Input LP
Analisi lessicale
Analisi morfologica
LP
Traducente
DIZIONARIO
Liste omonimi
Forma selezionata
Elaborazione
Traduzione
Elaborazione Analisi
morfologica LA
Traduzione
Diretti o per unità:
Scomposizione al
minimo delle
informazioni
linguistiche da
analizzare tenendo
conto solo delle
caratteristiche della
LP e della LA
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sintattici o transfer-system
Sistemi più
usati per la
comprensione
automatica del
Linguaggio naturale.
Più complessi.
Input LP Segmentazione
Analisi morfologica e sintattica LP
Transfer lessico-sintattico
Sintesi
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sistemi a interlingua:
Rappresentazione morfologica, sintattica e semantica
semplificata.
Sono necessari due passaggi di traduzione:
• Passaggio dalla Source Language all’interlingua,
• Passaggio dall’interlingua al Target Language
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sistema basato
su regole:
PeTra Online
http://petra.interfree.it/
PeTra utilizza un avanzato
sistema di Machine Translation
basato su regole (rule-based)
sviluppato da SyNTHEMA.
1. Dalla traduzione automatica alla traduzione assistita
Sistemi probabilistici
CARATTERISTICHE:
Basati su Corpora paralleli e monolingui
Statistiche per la selezione delle parole
Possono utilizzare o no regole grammaticali
Peso delle parole all’interno dei corpora paralleli:
occorrenza delle parole nei corpora, posizione e
confronto con la lingua target: n-gram
Si necessita di GRANDI quantità di dati per avere
risultati ottimali.
Sistema basato su esempi
Sistema basato su statistiche
Sistemi ibridi
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sistema basato su esempi
Traduzione per analogia: ricava i frammenti
linguistici all’interno di testi allineati
Sistemi statistici
Uso di statistiche sull’occorrenza delle
parole all’interno di grandi corpora
bilingui. Confronto con corpora
monolingui. Flessibilità di creazione.
Possibilità di aggiungere terminologia
“propria”.
Sistemi ibridi
Combinazione di moduli statistici e basati
su regole.
EN ES
EN ES
Term
EN ES
Term
Rules
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Sistemi probabilistici
Risorse:
Corpara paralleli molto grandi (minimo 2mln di
parole) per dominio specifico: risultati migliori
Piattaforme hardware potenti e costose
Software Open-Source: MOSES
Fondi economici
1. Dalla traduzione automatica alla traduzione assistita
Flusso di lavoro e professionisti coinvolti:
Installazione ambiente hardware e software:
Informatico
Preparazione risorse linguistiche (cleaning corpora,
terminologia, regole, etc.) Linguista-Informatico
(formati, macro, CAT-tools, pre-processing,…)
Coordinazionazione del progetto: Linguista-
informatico
Difficoltà:
• Preparazione del materiale linguistico:
selezione dei dati, pulizia dei dati,
automatizzazione dei processi di pre-processiong
• Installazione ambiente hardware e software:
poche informazioni a riguardo, esperti linguistici-
informatici
• Definizione strategie
TEMPO!
Usi:
• Traduzione di pagine web (NO localizzazione)
• Necessità di comunicazione
• Pre-traduzione
• Gist translation?
• Misleading?
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Alcuni nomi:
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1.4 La traduzione assistita - Computer
Assisted Translation (CAT)
Anni ‘70: nasce l’idea di creare una stazione di
lavoro per il traduttore, workstation, workbench
Avvento dei corpora, glossari, dizionari, basi di
dati in formato digitale
Nuova idea: come sfruttare i testi già tradotti
precedentemente in modo da poter risparmiare
tempo e denaro
Ripartizione del lavoro tra più figure professionali:
revisore, traduttore, proofreader, project
manager, terminologo,…)
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
1. Dalla traduzione automatica alla traduzione assistita
TRADUZIONE ASSISTITA
Computer-Assisted Translation (CAT)
“Sistema di traduzione in cui il traduttore
professionista (e non una macchina) utilizza
applicativi software specificamente sviluppati per
facilitare e migliorare il processo di traduzione”
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Traduttore
MT
Memorie di traduzione
Terminologia
Dizionari
testoLP
testoLA
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Strumenti CAT
Memorie di traduzione (Translation Memory,
TM)
Basi di dati terminologiche (TermBase, TB)
Basi di dati testuali (TextBase)
Programmi di allineamento (Aligners)
Project Management
Localizzazione
Garanzia di coerenza stilistica e terminologica
Tempi di traduzione ridotti: produttività
Personalizzazione e condivisione
Interattività: rialimentazione e correzione
Funzioni di pre-traduzione
Ricerca e consultazione
Integrazione con MT!
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
MEMORIE DI TRADUZIONE
TERMINOLOGIA
DIZIONARI Autosuggest
WO
RK
BEN
CH
Pe
r la
Tra
du
zio
ne
MACHINE TRANSLATION
BASI TESTUALI
WO
RK
BEN
CH
Pe
r la
Do
cum
en
tazi
on
e
Altre risorse (esterne)
Testo LP
CA
T Tools
TRANSLATION MANAGEMENT
WORKFLOW MANAGEMENT
Piattaforme di
gestione
• Project Manager
Testo LA
AUTORE/
CLIENTE
Il Workflow
• Revisore • Traduttore • Proofreader • Terminologo • Documentazione • Supporto CAT
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
USI:
Traduzione e Pretraduzione
Qualsiasi formato: .doc/docx, .ppt, .txt, html, xml,
xhtml, etc.
Traduzione di Software
Localizzazione
1. Dalla traduzione automatica alla traduzione assistita
COMPETENZE:
Competenze informatiche medio/alte
Conoscenza medio/alta dei programmi di video
scrittura
Conoscenza dei diversi formati: xml, html, txt, pdf
Conoscenza di Editor
Localizzazione
Conoscenza dei motori di ricerca
Aggiornamenti
Installazione
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
La traduzione assistita (CAT)
Risorse:
Software “pacchetto”: gestione di TM, termbase,
textbase, dizionari, glossari, altre risorse
Personal computer (per freelance)
Connessione Internet
Database o server
1. Dalla traduzione automatica alla traduzione assistita
Svantaggi (?):
Software costosi
“Buone” competenze
Privacy delle informazioni
Esempio file tmx
Alcuni nomi:
1. Dalla traduzione automatica alla traduzione assistita
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
Chi usa questi strumenti?
Organizzazioni Internazionali
Agenzie di traduzione
Traduttori freelance
1. Dalla traduzione automatica alla traduzione assistita
Requisito necessario?
Requisito minimo!
Qualche esempio: Output
FAO Official Documents Online
My Memory
Consigli:
• Monaco, G. (2011): Utopia o realtà? Fin dove è possibile
la traduzione automatica. Tesi di Laurea, Roma, Tor
Vergata (Didattica Web [email protected])
• Forte, G. (2011): La traduzione globalizzata. Tesi di
Laurea, Roma, Tor Vergata (Didattica Web –
• TAUS: Translation Automotion
http://www.translationautomation.com
• Systran: Translation services
http://www.systran.it
• MOSES SMT: Statistical Machine Translation
www.statmt.org/moses/
• SDL Trados: CAT tools
http://www.trados.com/en/
BIBLIOGRAFIA / SITOGRAFIA
Domande?
Giuseppe Forte
Workflow, Meeting Template and Language Support CSCM
Food and Agriculture Organization of the United Nations,
FAO
Roma
Nuove Tecnologie
per la
Traduzione
Nuove Tecnologie per la Traduzione G.Forte, M.Lozano, S.Petroni
2. I corpora, le basi di dati terminologiche e
testuali, le memorie di traduzione e il processo
traduttivo
05-04 09:00-11:00
T12B