Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Tehnologije zaprevajanje: Kaj prinaša prihodnostRED . P R O F . D R . Š P E L A V I N TA R
OD D E L EK Z A P R EV A JA L S TVO , F F U L
S P E L A . V I N TA R@ F F . U N I -‐ L J . S I , H T T P : / /WWW . L O J Z E . S I / S P E L A
ČIGAVA BO PRIHODNOST?
Trendi in izzivi (TAUS17)
podatkovna preobrazba prevajanja◦ TM/MT: bolj jih uporabljamo, boljši so◦ besedilo – segment – reciklažni delček◦ ciljno besedilo: od tvorjenja do selekcije
porokamed strojnim prevajanjem in umetnointeligencomočmnožicprevajanjegovora v govor
Razširjena prepričanja o prevajalskih tehnologijah§ Programi s pomnilniki prevodov niso primerni za vrstebesedil, ki jih prevajam.§ Programi s pomnilniki prevodov so zame predragi / prezapleteni.§ Prevajalskih orodij v oblaku ne uporabljam zaradivarovanja podatkov.§Strojni prevajalniki za slovenščino so preslabi, da bi si z njimi lahko pomagal/a. § Strojnih prevajalnikov ne uporabljam zaradi varovanjapodatkov.
Mejniki zadnjih desetletij1980
dokumenti, tiskanagradivaslovarji, glosarji1>10 jezikov
1990
programska opremaprva CAT orodja, terminološke baze1>25 jezikov
2000
globalizacijaprogramje, spletnevsebineinternet: strežniškipomnilniki1>40
2010
dinamični spletintegracija v poslovne procesestrojno prevajanje6<>60
2020
prevajanje vgrajenov vsako napravopersonalizacijavsebinSP po meripopravljanje SP "prehiti" prevajanje60<>60
Povzeto po: TAUS Technology Report 2017
Kaj pravijo raziskave?§ Language Industry Survey 2017
Raba strojnih prevajalnikov§ naglo naraščajoč trend uporabe strojnihprevajalnikov, predvsempri podjetjih
§ med večjimi podjetji jih že prek 85 % rednouporabljaSP
§ najbolj razširjeni način uporabe je SP + popolna poprava (full post-‐editing)
Raba prevajalskih orodij (CAT)§Med podjetji so se ustalilanamizna prevajalska orodja s podatkovnimistrežniki, narašča raba orodijv oblaku.
§ Pri samostojnihprevajalcih še prevladujejonamizne rešitve, petina jihuporabljabrezplačna spletnaorodja.
Drugi trendi§ Vse strožje zahteve naročnikov v zvezi z varovanjempodatkov.
§ Izziv: pravi kapital ponudnika prevajalskih storitev so podatki. V praksise uporablja večmodelov prenosa avtorskih in uporabniških pravic; pravna podlagaglede lastništvapomnilnikov ni enoznačna.
§ Izziv: “skills gap”; pomanjkanje ustrezno usposobljenihkadrov(jezikoslovne + strokovne + tehnološke veščine).
Prevajalska orodjaNAJPOGOSTEJE UPORABLJANI PROGRAMI
IzrazjeEN SL
CAT (Computer-‐AssistedTranslation)
računalniškopodprto prevajanje
prevajanje z uporabo prevajalskega namizja ali drugeaplikacije, ki vključuje pomnilnik prevodov
CAT tool / TEnT(Translation Environment Tool)
prevajalsko namizje aplikacija, ki vključuje pomnilnik prevodov in druga koristnaorodja (za terminologijo, podporo različnim formatom, strojnoprevajanje, nadzor kakovosti itd.)
localization (L10N) lokalizacija prilagajanje proizvoda lokalnemu tržišču in uporabnikom (v tehničnem, kulturnem, jezikovnem pogledu)
QA (Quality Assurance)
zagotavljanjekakovosti
niz avtomatiziranih postopkov za odpravljanje napak v prevajalskih projektih
MT (Machine Translation)
strojno prevajanje računalniški sistem, ki brez intervencije človeka izvirnobesedilo prevede v ciljno
PEMT (Post-‐Editing MT)
popravljanjestrojnih prevodov
postopek popravljanja strojno prevedenega besedila, da kakovost doseže zahtevano raven
TM (Translation Memory)
pomnilnik prevodov baza dvojezičnih segmentov (stavkov ali stavčnih delov), kinastane med prevajanjem ali s poravnavo obstoječih prevodov
Vrste orodij§ prevajalskanamizja, ki se kombinirajo z MS Wordom (zastarelo)
§ prevajalskanamizja z lastnimokoljem za prevajanje§ prednosti? slabosti?
§ prevajalskanamizja v oblaku§ prednosti? slabosti?
Namizja z lokalno namestitvijo§ SDL Trados Studio, www.sdl.com, €521 (Freelance Edition)
§ memoQ, www.memoq.com, €620 (Translator Pro)
§ Déjà Vu, www.atril.com, €420 (Professional)
§ across, www.my-‐across.net, €0 (za samostojne prevajalce, €19,90 Premium)
§Wordfast Pro, www.wordfast.com, €400 (tudi za iOS)
CAT in MT
pomnilnikprevodov
term.baza
arhiviprevodov
samodejnislovarji fraz
SDL Trados Studio 2017§ podporaza prek 40 datotečnih formatov, z možnostjo podrobnihnastavitev za uvoz datotekXML, JSON itd.
§ SDL Adaptive MT: strojni prevajalnik, ki uporablja umetno inteligenco in se sproti uči iz uporabnikovihprevodov
§ vključuje naprednemožnosti revidiranja prevodov, zagotavljanjakakovosti, upravljanja terminologije, vodenja prevajalskih projektov, uporabedrugih virov prek vtičnikov itd.
memoQ 8§ ponuja nekoliko prijaznejše okolje kot SDL Trados
§ segmentacija na podlagi obstoječega pomnilnika
§ LiveDocs – korpusni način pomnilnikaprevodov
§ privzeto razlikovanjemed glavnim in delovnimpomnilnikom
§ luščenje terminologije vključeno v glavno aplikacijo
§ uvažanje vgrajenih datotek (tudi slik), ki jih je mogoče transkribirati in prevesti znotraj okoljamemoQ
Orodja v oblaku§ Google Translator Toolkit, https://translate.google.com/toolkit/
§Wordfast Anywhere, https://www.freetm.com/
§MateCat, https://www.matecat.com/
§Memsource, https://www.memsource.com/
§ SmartCAT, https://www.smartcat.ai/
MateCat§ brezplačno spletno orodje, ki ponuja dostopdo javnih pomnilnikov in strojnih prevajalnikovMyMemory
§ omogoča uporabo lastnihpomnilnikov in terminološkihbaz
§ podpira71 datotečnih formatov
§ za sodelovalnoprevajanje se lahko posreduje zgolj URL
§ v prevajalski projekt je mogoče dodajati komentarje in uporabljati sitoza iskanje segmentov
Memsource§ zmogljivo okolje za vodenje obsežnih prevajalskih projektov
§ omogoča upravljanje z ekipo prevajalcev in lektorjev (ki si lahko prevod
§ ločeno spletno okolje za prevajanje v formatuMXLIFF
§ okolje za prevajanje (Memsource Editor) si je mogoče tudi naložiti in prevajati brez spletne povezave
§ spletno orodje, ki mu priljubljenost hitronarašča
Smartcat§ podobnookolje kotMemsource
§ polegvseh ostalih običajnih funkcij omogoča tudi spletni klepetmed člani prevajalske ekipe
Strojno prevajanje
Pristopi§ s pravili (1950-‐2000)
§ statistično (2000-‐2014)
§ globokenevronskemreže (2014-‐ )
§ ?
A nove mehke bot posnema hobotnice in inchworms plezati stene
Mehki roboti res dobil okrog.
Nekateri skok, drugi plavati ali plazijo po tleh.
Zdaj, lahko celo lestvice stene.
s priseski hobotnice je navdihnil, so raziskovalcizgradili inchwormlike robot, ki uporablja par priseski scoot okoli vertikalne površine.
Bot lahko Pentranje po grobi in gladek teren, nadzemne in podvodnega, nosi do petkratlastno težo.
Ta vrsta prosto plezanje napravo, opisano 3. april na spomladanskem srečanju Materials Research Society, bi lahko nekega dne pomočravnanje nadzora ali pregleda objektov in mostov.
Nekateri roboti togi kovinski so oblikovane tako, da plezati stene, preveč.
Toda ti stroji so clunkier, dražje in se lahkozlomi, če padejo.
Mehki roboti so relativno poceni narediti in so lahki in prožni, tako da je manj tveganje, povezano z njimi izgubljajo oprijem.
Novi mehki bot posnema hobotnice in pentlje, da se plezajo po stenah
Mehki roboti se resnično približajo.
Nekateri skok, drugi plavajo ali plazijo na tleh.
Zdaj je mogoče celo meriti stene.
Raziskovalci so po navdihu s hobotnicamihobotnice zgradili robot podobnega robota, kiuporablja par sesalnih skodelic, da bi se spustilokrog navpičnih površin.
Bot se lahko razprostira po grobem in gladkemterenu, nad njiju in pod vodo, ki nosi do petkratveč lastne teže.
Ta vrsta prostega plezalnega stroja, opisanega 3. aprila na spomladanskem sestanku družbeMaterial Science Society, bi lahko nekega dnepomagal opraviti nadzor ali pregled zgradb in mostov.
Tudi nekateri togi kovinski robovi so namenjenitudi plezanju sten.
Toda ti stroji so klonični, dražji in se lahkozlomijo, če padejo.
Mehki roboti so sorazmerno poceni in so lahkiin odporni, tako da obstaja manj tveganja, da bi izgubili oprijem.
Pes je šel čez cesto.
•dvojezični slovar•oblikoslovna analiza•skladenjska analiza•semantika,frazeologija,...
Dog acrossiti PRET cesta
went road
crossed
Statistično strojno prevajanje
Nevronsko strojno prevajanje
Sistemi za slovenščinoPresis (http://presis.amebis.si) -‐ klasični transferni sistem, pridvojezičnem leksikonu zametki interlingue (AN/NE-‐SL)
Google Translate (http://translate.google.com) -‐ nevronski strojniprevajalnik
Bing Translator (http://www.bing.com/translator) -‐ Microsoftovnevronski strojni prevajalnik
Yandex (https://translate.yandex.com/)
§ nevronskemodele uporabljajo tudi Facebook, Skype, Amazon itd.
Popravljanjestrojnih prevodov
Ključna vprašanjaKdaj se uporablja popravastrojnegaprevoda?
Kaj pričakujemo od poprave strojnega prevoda?
Ali je rezultat poprave strojnega prevoda lahko enako kakovostenkotčloveški prevod?
Kakšna je razlikamed popravostrojnegaprevoda in popravomeglenihzadetkov?
Kako ravnamo ob prevajalskihprojektih, ki vključujejo popravostrojnegaprevoda?
Glavni razlog za PSP: večjaučinkovitostV večini dosedanjih študij so prevajalci ob uporabi SP prevajaliopazno hitreje (42-‐131 %).
Edina dosedanja raziskava za jezikovni par AN-‐SL (Smolič 2015) je pokazalamanjši dvigproduktivnosti.
Source: MT at Autodesk, http://translate.autodesk.com
Dva bistvena dejavnikakakovost strojnega prevajalnika (“vhodna” kakovost)
pričakovana kakovost popravljenegabesedila (“izhodna” kakovost)
Tipi statističnih sistemov in scenariji uporabeNaročniki običajno ne želijo uporabljati splošnih prevajalnikov.◦ napačna terminologija, avtorske pravice, napačno razdvoumljanje
Ponudniki strojnega prevajanja zato nudijo tri možnosti:◦ osnovni sistem: zgrajen s pomočjo splošnih vzporednih korpusov◦ področno prilagojeni sistem: zgrajen s pomočjo strokovno specifičnihkorpusov
◦ sistem po meri naročnika: zgrajen iz naročnikovih pomnilnikov prevodov
Krožni proces prevajanja s SP
Stopnja poprave
nična – uporabi se grobi SP (zgolj za informacijo)
delna (light post-‐editing) – kadar je potrebna hitra storitev in besediloniza objavo
popolna (full post-‐editing) – kadar želimo s popravo doseči kakovost, kije primerljiva s človeškimprevodom.
Napotki za delno popravoSkušajte zagotoviti pomensko ustreznost prevoda.
Preverite vsebino informacij v besedilu, dodajtemanjkajoče in odstranite odvečne.
Popravite neustrezno, žaljivoali kulturnoneprimernovsebino.
Uporabite kar največji delež strojnega prevoda.
Popravite opazne tipkarske napake.
Ne ukvarjajte se s slogom.
Ne popravljajte stavčne strukture zaradi zagotavljanjaboljše berljivostibesedila.
Napotki za popolno popravoSkušajte zagotoviti pomensko in slovničnoustreznost prevoda.
Preverite, ali so ključni termini pravilnoprevedeni in ali so elementi, kise po navodilih naročnika ne prevajajo, res neprevedeni.
Preverite vsebino informacij v besedilu, dodajtemanjkajoče in odstranite odvečne.
Popravite neustrezno, žaljivoali kulturnoneprimernovsebino.
Uporabite kar največji delež strojnega prevoda.
Popravite tipkarske, pravopisne in slovnične napake, preverite ločila.
Preverite oblikovanje.
Obračunavanje storitevZaenkrat ni enotne tarife.◦ primerjava z meglenimi zadetki (85-‐90 %)◦ primerjava z revizijo človeškega prevoda
Določitev urne postavke po predhodnem testiranju◦ So popravljalci SP usposobljeni za to delo?◦ Priporoča se vzporedni test z vsaj tremi osebami.◦ Oceniti je potrebno čas in končno kakovost!
Več: TAUS Pricing Post-‐Editing Guidelines, https://www.taus.net/academy/best-‐practices/postedit-‐best-‐practices/pricing-‐machine-‐translation-‐post-‐editing-‐guidelines
Vaja MateCat1. V brskalnikuChrome pojdite na stran https://www.matecat.com/.
2. Naložite datoteko za prevod, ki jo najdete v gradivih(erasmus+.docx).
3. Poimenujte projekt in nastavite jezike.
4. V nastavitvah (Settings) lahko dodate lastni pomnilnik (erasmus.tmx) in po želji izključite strojni prevajalnik.
5. Prevedite datoteko.
Vaja Smartcat1. Ustvarite si račun na strani https://www.smartcat.ai/ali se vpišite z
Google računom.
2. Naložite datoteko za prevod (Winzip.ppt).
3. Naložite pomnilnik prevodov (winzip.tmx).
4. V zavihku Pretranslation datoteko predprevedite.
5. Oglejte si analizo v zavihku Statistics.
6. Odprite datoteko za prevod in jo prevedite.
Vaja SDL Trados Studio1. Naložite gradiva s spletne strani in datoteko razširite.
2. Zaženite program SDL Trados Studio 2017.
3. Izberitemožnost Translate Single File, izberite jezike (EN>SL) in datoteko za prevod (CORPORAT_en.pptx).
4. Dodajte pomnilnik prevodov sap.sdltm.
5. Datoteko predprevedite z uporabo ukazaPretranslate in si oglejterezultate analize v jezičku Reports.
6. Prevedite datoteko in jo izvozite spet v formatu .pptx. POZOR: Priloženi pomnilnik vsebuje strojne prevode, ki jih bo potrebnopopraviti.
Vaja memoQ 81. Naložite gradiva s spletne strani in datoteko razširite.
2. Zaženite program memoQ 8.
3. Izberite možnost Create New Project From Template > Add documents, izberite datoteko za prevod (CORPORAT_en.pptx).
4. Poimenujte projekt (npr. SAP). Kliknite Next.
5. Ko je datoteka uvožena, v jezičku Translation Memories ustvarite novpomnilnik (Create/Use New) in vanj uvozite pomnilnik prevodovsap.tmx.
6. Datoteko predprevedite z uporabo ukaza Pretranslate v zavihkuPreparation.
7. Prevedite datoteko in jo izvozite spet v formatu .pptx. POZOR: Priloženipomnilnik vsebuje strojne prevode, ki jih bo potrebno popraviti.