Translation-Memory-Technologie: Konzepte, ihre Realisierungen in kommerziellen Produkten und...

Preview:

Citation preview

Translation-Memory-Technologie:Konzepte, ihre Realisierungen in

kommerziellen Produkten und Entscheidungshilfen für den Einsatz

konkreter Systeme

Uta Seewald-Heeg — Hochschule Anhalt (FH)

EQUIVALENCES 01 Neuenburg, 19. Mai 2001

1 Konzepte der Translation-Memory-Technologie

Recycling bestehender Übersetzungen Komponenten von Translation-Memory-

Systemen

2 Kommerzielle Produkte Produktpalette Systemeigenschaften

Terminologieverwaltung Retrieval im Referenzmaterial

3 Entscheidungshilfen für den Einsatz konkreter Systeme

Translation-Memory-Technologie

Konzepte der Translation-Memory-Konzepte der Translation-Memory-TechnologieTechnologie

RecyclingRecycling bestehender bestehender ÜbersetzungenÜbersetzungen

TraditionellerÜbersetzungsprozess

Quelltext-Dokument 1

Zieltext-Dokument 1

• Übersetzen• Nachschlagen/Recherchieren von

Terminologie• In Wörterbüchern• In Terminologiedatenbanken• Auf WWW-Seiten

• Suchen bereits erstellter Übersetzungen

• Im Ablagesystem• Auf Disketten• Im Dateisystem des Computers

Quelltext-Dokument 2

Quelltext-Dokument n

...

Zieltext-Dokument 2

Zieltext-Dokument n

...

Recycling bestehender Übersetzungen Übersetzungsprozess mit Translation Memory

Quelltext-Dokument

Zieltext-Dokument

Pre-processing• Extraktion der Formatinformation• Abgleich der Quelltext-Sätze mit

dem Referenzmaterial (Matches)

Post-processing• Zusammenführen der

übersetzten Sätze mit der Formatinformation

• Speichern der Satzpaare im TM

• Übersetzen• Überprüfen der Matches

Konzepte der Translation-Memory-Konzepte der Translation-Memory-TechnologieTechnologie

Komponenten vonKomponenten vonTranslation-Memory-SystemenTranslation-Memory-Systemen

Translation Memory (TM)Übersetzungsspeicher

• Multilinguales Text-/Satzarchiv

• Synchronisierte quellsprachige und übersetzte Textsegmente (Sätze), die als Referenzmaterial dienen

• Retrieval erfolgt in der Regel mit fuzzy logic

CATCAT

Komponenten vonTranslation-Memory-Systemen

11Datenbank-

Verwaltungs-programm

22Terminologie-

programm

33Text-/

Dokumenten-programm

44Alignment-programm

55Import-/Export-Filter

11Datenbank-

Verwaltungs-programm

• Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren

• Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein

• Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein

• Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen

• Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren

• Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren

• Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein

• Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein

• Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen

• Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren

• Morphologische Analyse

• Linguistisches Tagging

22Terminologie-

programm

• Möglichkeit des Imports elektronisch gespeicherter Glossare

• Translation Manager (IBM) wird mit Terminologie-Wörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an

• einige Programme sind sehr komplex (Fuzzy-Match-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel)

• Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen)

• Möglichkeit des Imports elektronisch gespeicherter Glossare

• Translation Manager (IBM) wird mit Terminologie-Wörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an

• einige Programme sind sehr komplex (Fuzzy-Match-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel)

• Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen)

• Morphologische Analyse

• Eintragsmodelle• TM-Schnittstelle• Workflow

33Text-/

Dokumenten-programm

• Programm, in dem die Übersetzung angefertigt wird

• häufig: 2 parallel angeordnete Fenster (AT - ZT)

• oft: 1 weiteres Fenster, das Einheiten des TM anzeigt

• meistens: Fenster des Terminologieprogramms

• z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten

• Programm, in dem die Übersetzung angefertigt wird

• häufig: 2 parallel angeordnete Fenster (AT - ZT)

• oft: 1 weiteres Fenster, das Einheiten des TM anzeigt

• meistens: Fenster des Terminologieprogramms

• z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten

44Alignment-programm

• Möglichkeit, bestehende Texte und Übersetzungen in die Datenbank einzulesen

• Texte werden in Segmente (meist Sätze) zerlegt• Zuordnung von Textstellen (Sätzen) durch

Verwendung von statistischen und/oder inhaltlichen Kriterien

• Nachbearbeitung in der Regel erforderlich

• große Unterschiede zwischen den angebotenen Programmen

• Star Transit: stark automatisiert (zeitsparend)• Trados WinAlign: halbautomatisch; mit graphischer

Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben

• in der Regel: zusätzliche Kosten bei der Anschaffung

• Möglichkeit, bestehende Texte und Übersetzungen in die Datenbank einzulesen

• Texte werden in Segmente (meist Sätze) zerlegt• Zuordnung von Textstellen (Sätzen) durch

Verwendung von statistischen und/oder inhaltlichen Kriterien

• Nachbearbeitung in der Regel erforderlich

• große Unterschiede zwischen den angebotenen Programmen

• Star Transit: stark automatisiert (zeitsparend)• Trados WinAlign: halbautomatisch; mit graphischer

Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben

• in der Regel: zusätzliche Kosten bei der Anschaffung

55Import-/Export-Filter

• Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM)

• Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB)

• Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet

• Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM)

• Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB)

• Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet

Eignung vonTranslation-Memory-Systemen

• Texte liegen maschinenlesbar vor

• Große Textmengen mit hohem Anteil an Wiederholungen (Sätze, syntaktische Strukturen, Terminologie) innerhalb eines Textes sowie relativ zum vorhandenen Referenzmaterial

• Umfangreiche Terminologie

• Sicherstellen der terminologischen Konsistenz

• Wenige große Kunden (schnellere Amortisierung)

KKommerzielle Produkteommerzielle Produkte

ProduktpaletteProduktpalette

Translation Memory-Systeme

• Déjà Vu von Atril

• EPTAS TM von ALPNET Technologyhttp://www.epp.de/

• SDLX von SDL

• Transit von STAR

• Translation Manager von IBM

• Translator's Workbench von Trados

• ZeresTrans von Zereshttp://hermes.zeres.de/

• TRANS Suite 2000 von Cypresofthttp://www.cypresoft.com/

TM-Technologie in MÜ-Systemen

• Personal Translator Office plus 2001(Linguatec)

• T1 (Langenscheidt)

KKommerzielle Produkteommerzielle Produkte

Systemeigenschaften:Systemeigenschaften:

TerminologieverwaltungTerminologieverwaltung

Trados MultiTerm Trados MultiTerm ‘‘9595

Trados MultiTerm ’95

http://www.trados.com /(Testversion für 30 Tage)

• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden

• Einträge können kreuzreferenziert werden• Suche in beliebigen Sprachrichtungen

möglich• Suche mit Wildcards und Fuzzy Match

• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden

• Einträge können kreuzreferenziert werden• Suche in beliebigen Sprachrichtungen

möglich• Suche mit Wildcards und Fuzzy Match

MultiTerm ’95Fuzzy Searching

MultiTerm ’95Einbinden graphischer Elemente

TermStar von StarTermStar von Star

TermStar von Star

• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden

• Einträge können kreuzreferenziert werden

• Suche in beliebigen Sprachrichtungen möglich

• Unterschiedliche Eintragsmodi verfügbar

• Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden

• Einträge können kreuzreferenziert werden

• Suche in beliebigen Sprachrichtungen möglich

• Unterschiedliche Eintragsmodi verfügbar

TermStar

Kreuzreferenzen

Wahl verschiedener Layouts für die Bildschirmansicht möglich

TermStar

Kreuzreferenzen

Integration grafischer Elemente

KKommerzielle Produkteommerzielle Produkte

Systemeigenschaften:Systemeigenschaften:

Retrieval im ReferenzmaterialRetrieval im Referenzmaterial

Trados Translator's WorkbenchTrados Translator's Workbench

Trados Translator's WorkbenchTrados Translator's Workbench

• Workbench-Editor = Textverarbeitungsprogramm(MS Word oder Word Perfect) oder TagEditor, T-Tagger oder S-Tagger

• Bei Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit

• Einführung einer neuen Version: Trados 5

• Workbench-Editor = Textverarbeitungsprogramm(MS Word oder Word Perfect) oder TagEditor, T-Tagger oder S-Tagger

• Bei Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit

• Einführung einer neuen Version: Trados 5

Trados Translator‘s WorkbenchEdition 3

Trados Translator‘s WorkbenchEdition 3

Trados Translator‘s WorkbenchEdition 3

Trados Translator‘s Workbench

Trados Translator‘s Workbench

TRADOS Translator‘s Workbench

Term einfügen

Trados Translator‘s Workbench

Konkordanzsuche

Trados Translator‘s Workbench

Trados Translator‘s Workbench

TransIt von StarTransIt von Star

• Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk

• Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen

• Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk

• Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen

Transit von Star

Transit von StarAnlegen eines Projektes

Der Benutzer erhält Hilfestellung durch sogenannte Wizards

(Programm-Assistenten).

Transit von StarTransit-Editor (Version 3.0)

Fuzzy-Index

Fenster

Wörter-buch-

Fenster

Notiz- Fenster

Ziel-text-

Fenster

TransIt von StarVersion 3

TransIt von StarVersion 3

Transit von Star

SDLX von SDLSDLX von SDL

• SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien

• SDLX – Weiterentwicklung von Amptran

• SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen

• SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien

• SDLX – Weiterentwicklung von Amptran

• SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen

SDLX — Version 2.0

SDLXVersion 3.5

SDLX

SDLX

SDLX

SDLX

Übernahme der Übersetzung eines

Fuzzy-Matches

Übernahme eines 100%-Matches

Déjà Vu Interactive von AtrilDéjà Vu Interactive von Atril

• Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet(Produktumfang, Anschaffungskosten)

• Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter

• Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet(Produktumfang, Anschaffungskosten)

• Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter

Déjà Vu InteractiveVersion 3.0.18

Déjà Vu Interactive

FuzzinessJe niedriger der Wert ist, desto weniger Entsprechungen werden angezeigt.Mit dem Schieberegler lässt sich ein Wert im Bereich von 0 (nur genau übereinstimmende Entsprechungen) bis 9 wählen.

FuzzinessJe niedriger der Wert ist, desto weniger Entsprechungen werden angezeigt.Mit dem Schieberegler lässt sich ein Wert im Bereich von 0 (nur genau übereinstimmende Entsprechungen) bis 9 wählen.

Minimum number of words in a sentence Sätze mit weniger Wörtern werden in den Datenbanken von Déjà Vu nicht gespeichert. Mit dem Schieberegler kann ein Wert im Bereich von 1 bis 9 gewählt werden.

Minimum number of words in a sentence Sätze mit weniger Wörtern werden in den Datenbanken von Déjà Vu nicht gespeichert. Mit dem Schieberegler kann ein Wert im Bereich von 1 bis 9 gewählt werden.

Déjà Vu Interactive

„Vorübersetzung“

IBM — TranslationManager

• „Mutter“ aller TM-Systeme

• Von IBM zur Unterstützung der eigenen Lokalisierungs-bedürfnisse entwickelt

• Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing)

• Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungs-programme ausgeliefert wird

• In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich)

• „Mutter“ aller TM-Systeme

• Von IBM zur Unterstützung der eigenen Lokalisierungs-bedürfnisse entwickelt

• Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing)

• Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungs-programme ausgeliefert wird

• In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich)

IBM — TranslationManager Filter

• MS Word• WordPerfect• Ami Pro• HTML• RTF• Ventura Publisher• Interleaf• FrameBuilder• BookMaster• IPF (Information Presentation Facility)

• ASCII

AlleFormat-

Informationen bleiben während

der Übersetzung erhalten, so dass Original und

Übersetzung dasgleiche Layout

haben.

IBM — TranslationManagerVersion 2.6.1

Übersetzungsvorschlägeaus dem TM

IBM — TranslationManager

Aktives Segment

copy & paste

IBM — TranslationManager

Übernahme eines Eintrags aus dem Wörterbuch mit

Ctrl + a

IBM Translation Manager

Nachschlagen im TM

IBM Translation ManagerGlobale Änderungen im TM

Vergleich derRetrievalleistung

Referenzsatz

This chapter is an introductionto X11 operations.

Testsatz TWB TransIt SDLX DejaVu TManager

1

1

5

5

7

7

This chapter is a brief introductionto X11 operations.

Chapter 2 of this manual is anintroduction to X11 operations.

See the introductionto X11 operations.

X11 operations are introduced inthis chapter.

Chapter 2 is an introductionto X11 operations.

X11 is introduced inthis chapter.

81 %

86 %

70 %

76 %

86 %

68 %

74 %

81 %

59 %

53 % 44 % 48 %

< 30 % 52 % 23 %

< 30 % 44 % 23 %

Eigene Forschungenzum Retrieval in TMs

• Anreicherung des Referenzmaterials mit linguistischem Wissen durch Shallow Parsing.

• XML-basierter Ansatz zum linguistischen Retrieval im Translation-Memory.

• Berücksichtigung struktureller (Textebene) und syntaktischer Eigenschaften (Satzebene) von Texten.

• Retrievalergebnisse intuitiv plausibler.

EntscheidungshilfenEntscheidungshilfenfür den Einsatz konkreter Systemefür den Einsatz konkreter Systeme

Parameter zur Auswahl einesTM-Systems (I)

„Whenever I want to buy a pair of shoes I try them on and consider whether I feel comfortable wearing them, and whether they fit my needs. I will buy different shoes for different purposes: playing professional football, walking, or staying at home. I draw the possible scenario for using my future shoes and I buy accordingly.“

[Celia Ross in: Language International 12/2000,36]

„Whenever I want to buy a pair of shoes I try them on and consider whether I feel comfortable wearing them, and whether they fit my needs. I will buy different shoes for different purposes: playing professional football, walking, or staying at home. I draw the possible scenario for using my future shoes and I buy accordingly.“

[Celia Ross in: Language International 12/2000,36]

Parameter zur Auswahl einesTM-Systems (II)

EAGLES-Arbeitsgruppe "Assessment and evaluation“

• ISO-Norm 9126

• Adäquatheits-Evaluation– Benutzerprofil– Aufgabenbereich– Leistungsmerkmale des TM-Systems

• Prüf-/Qualitätskriterien:– Funktionalität (functionality)– Zuverlässigkeit (reliability)– Brauchbarkeit (usability)– Leistungsfähigkeit (efficiency)– Wartbarkeit (maintainability)– Portierbarkeit (portability)

EAGLES-Arbeitsgruppe "Assessment and evaluation“

• ISO-Norm 9126

• Adäquatheits-Evaluation– Benutzerprofil– Aufgabenbereich– Leistungsmerkmale des TM-Systems

• Prüf-/Qualitätskriterien:– Funktionalität (functionality)– Zuverlässigkeit (reliability)– Brauchbarkeit (usability)– Leistungsfähigkeit (efficiency)– Wartbarkeit (maintainability)– Portierbarkeit (portability)

Parameter zur Auswahl einesTM-Systems (III)

• Übersetzungsvolumen• Textsorten • Textsorten-Eigenschaften hinsichtlich

– Idiomatizität– Terminologie

• Erfordernis von Konsistenz zwischen den Übersetzungen• Dateiformate• Sprachen bzw. Sprachpaare• Benutzung anderer Übersetzungshilfen und

Notwendigkeit, diese in das TM zu integrieren• Einsatz in einem Team oder als Einzelarbeitsplatz• Wiederverwendbarkeit von TM-Material in anderen

Umgebungen• Umfang der verfügbaren Zeit zum Erlernen eines neuen

Werkzeugs

• Übersetzungsvolumen• Textsorten • Textsorten-Eigenschaften hinsichtlich

– Idiomatizität– Terminologie

• Erfordernis von Konsistenz zwischen den Übersetzungen• Dateiformate• Sprachen bzw. Sprachpaare• Benutzung anderer Übersetzungshilfen und

Notwendigkeit, diese in das TM zu integrieren• Einsatz in einem Team oder als Einzelarbeitsplatz• Wiederverwendbarkeit von TM-Material in anderen

Umgebungen• Umfang der verfügbaren Zeit zum Erlernen eines neuen

Werkzeugs

Parameter zur Auswahl eines TM-Systems Anschaffungskosten

• Trados Translator‘s Workbenchhttp://www.Trados.com/US$/EUR 595 zzgl. Versandkoten und MWSt

• TranIt von Starhttp://www.star-ag.ch/Transit und TermStar Smart 3.0: EUR 695

• DéjàVu von Atrilhttp://www.atril.com/EUR 841,50 zzgl. MwSt

• SDLX von SDLhttp://www.sdlintl.com/products/sdlx/nav/main.htmUS$ 50

• IBM Translation Managerhttp://www-4.ibm.com/software/ad/translat/tm/

• Trados Translator‘s Workbenchhttp://www.Trados.com/US$/EUR 595 zzgl. Versandkoten und MWSt

• TranIt von Starhttp://www.star-ag.ch/Transit und TermStar Smart 3.0: EUR 695

• DéjàVu von Atrilhttp://www.atril.com/EUR 841,50 zzgl. MwSt

• SDLX von SDLhttp://www.sdlintl.com/products/sdlx/nav/main.htmUS$ 50

• IBM Translation Managerhttp://www-4.ibm.com/software/ad/translat/tm/

Resümee

Jedes der vorgestellten Translation-Memory-Systeme erfordert eine Einarbeitung, um sie effizienzsteigernd einzusetzen.

Terminologie-Verwaltungssysteme bieten nennenswerte Erleichterung bei der Erstellung und Pflege von Terminologie.

Sowohl Terminologie-Verwaltungssysteme als auch Transaltion-Memory-Systeme tragen zur Konsistenz der Übersetzungen bei.

Für effiziente Auftragsbearbeitung gibt es bei großen Textmengen mit hohem Anteil an Wiederholungen zu TMs keine Alternative.

Vielen Dank für Ihre Aufmerksamkeit!

Uta Seewald-Heeg seewald@heeg.de

Recommended