Click here to load reader
View
246
Download
0
Embed Size (px)
White Paper Series
THE ESTONIANLANGUAGE IN
THE DIGITALAGE
Valge raamatu sari
EESTIKEELDIGIAJASTUL
Krista LiinKadri MuischnekKaili MrisepKadri Vider
White Paper Series
THE ESTONIANLANGUAGE IN
THE DIGITALAGE
Valge raamatu sari
EESTIKEELDIGIAJASTUL
Krista Liin Tartu likoolKadri Muischnek Tartu likoolKaili Mrisep Tartu likoolKadri Vider Tartu likool
Georg Rehm, Hans Uszkoreit(toimetajad, editors)
EESSNA PREFACE
Eesti keele raport kuulub META-NETi vljaannete is white paper is part of a series that promotessarja,mille eesmrgiks on tutvustadakeeletehnoloogia- knowledge about language technology and its poten-alaseid teadmisi ja selle ala potentsiaali. Vljaande siht- tial. It addresses journalists, politicians, language com-grupiks on petajad, ajakirjanikud, poliitikud, kogu munities, educators and others. e availability andkeelekogukond ja teised teemast huvitatud. use of language technology in Europe varies betweenKeeletehnoloogia kttesaadavus ja kasutamine on Eu- languages. Consequently, the actions that are requiredroopa keeliti vga erinev. Nii on ka meetmed, mida on to further support research and development of lan-vaja rakendada keeletehnoloogia arendamise ja uuri- guage technologies also differ. e required actionsmise edasiseks toetamiseks, erinevatele keeltele vga depend on many factors, such as the complexity of aerinevad, sltudes niteks keele keerukusest ja selle k- given language and the size of its community.nelejate arvust. META-NET, a Network of Excellence funded by theEuroopa Komisjoni rahastatud tippteadmiste vrgus- European Commission, has conducted an analysis oftik META-NET viis lbi keeleressursside ja -tehno- current language resources and technologies in thisloogiate alase uurimuse, mis keskendus 23 ametlikule white paper series (p. 75). e analysis focused on theEuroopa keelele ja ka teistele olulistele regionaalsetele 23 official European languages as well as other impor-keeltele Euroopas (vt lk 75). Analsi tulemus nitas, tant national and regional languages in Europe. e re-et kigi keelte tehnoloogiates leidub mrkimisvrseid sults of this analysis suggest that there are tremendouspuudujke. Tpne ekspertanals ja olukorra hinda- deficits in technology support and significant researchmine aitavad panustada edasise uurimist mju suu- gaps for each language. e given detailed expert anal-rendamisse ja vhendada riske. ysis and assessment of the current situation will helpMETA-NET koosneb 33 riigi 54 uurimiskeskusest (vt maximise the impact of additional research.lk 71), mis teevad koostd tstuse, valitsusasutuste, As of January 2012, META-NET consists of 54 re-likoolide ja uurimisasutuste esindajatega. Koost search centres from 33 European countries (p. 71).tulemusena valmib hine tehnoloogiline visioon, mis META-NET is working with stakeholders from econ-osana strateegilisest uurimiskavast nitab, kuidas kee- omy (soware companies, technologyproviders, users),letehnoloogilised rakendused saavad katta praegused government agencies, research organisations, non-uurimist puudujgid aastaks 2020. governmental organisations, language communities
and European universities. Together with these com-munities, META-NET is creating a common technol-ogy vision and strategic research agenda for multilin-gual Europe 2020.
III
META-NET [email protected] http://www.meta-net.eu
Selle dokumendi autorid tnavad saksa keele valge raamatu au-toreid loa eest kasutada nende vljaandes sisaldunud keelestsltumatuid materjale [1].
Selle keeleraporti koostamist rahastas 7. raamprogramm
ja Euroopa Komisjoni IKT poliitika toetusprogramm le-
pingute T4ME (toetusleping 249 119), CESAR (toetusle-
ping 271 022), METANET4U (toetusleping 270 893) ja
META-NORD (toetusleping 270 899) kaudu.
e authors of this document are grateful to the authors ofthe White Paper on German for permission to re-use selectedlanguage-independent materials from their document [1].
e development of this White Paper has been funded by the
Seventh Framework Programme and the ICT Policy Support
Programme of the European Commission under the contracts
T4ME (Grant Agreement 249 119), CESAR (Grant Agree-
ment 271 022), METANET4U (Grant Agreement 270 893)
and META-NORD (Grant Agreement 270 899).
IV
SISUKORD CONTENTS
EESTI KEEL DIGIAJASTUL
1 Kokkuvte 1
2 Oht meie keeltele ja vljakutse keeletehnoloogiale 42.1 Keelepiirid tkestavad Euroopa infohiskonda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Meie keeled on ohus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.3 Keeletehnoloogia on vtmetehnoloogia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.4 Keeletehnoloogia vimalused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.5 Keeletehnoloogia vljakutsed . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.6 Kuidas inimesed ja masinad keelt omandavad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3 Eesti keel Euroopa infohiskonnas 93.1 ldinfo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2 Eesti keele eriprad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.3 Viimase aja arengud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.4 Keelehoole Eestis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.5 Keel ja haridus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.6 Rahvusvahelised aspektid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.7 Eesti keel internetis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4 Eesti keele keeletehnoloogiline tugi 144.1 Rakenduste arhitektuur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144.2 Kesksed rakendused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154.3 Muud rakendusalad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.4 Haridusprogrammid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.5 Riiklikud programmid ja algatused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.6 Vahendite ja ressursside kttesaadavus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.7 Keeltevaheline vrdlus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.8 Jreldused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5 META-NETist 31
THE ESTONIAN LANGUAGE IN THE DIGITAL AGE
1 Executive Summary 33
2 Languages at Risk: a Challenge for Language Technology 362.1 Language Borders Hold back the European Information Society . . . . . . . . . . . . . . . . . . 372.2 Our Languages at Risk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.3 Language Technology is a Key Enabling Technology . . . . . . . . . . . . . . . . . . . . . . . . 382.4 Opportunities for Language Technology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.5 Challenges Facing Language Technology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.6 Language Acquisition in Humans and Machines . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 The Estonian Language in the European Information Society 413.1 General Facts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2 Particularities of the Estonian Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.3 Recent Developments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.4 Language Cultivation in Estonia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.5 Language in Education . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.6 International Aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453.7 Estonian on the Internet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4 Language Technology Support for Estonian 474.1 Application Architectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2 Core Application Areas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.3 Other Application Areas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.4 Educational Programmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.5 National Programmes and Initiatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.6 Availability of Tools and Resources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.7 Cross-language comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5 About META-NET 65
A Kirjandus --- References 67
B META-NETi liikmed -- META-NET Members 71
C META-NETi Valge raamatu sari -- The META-NET White Paper Series 75
1
KOKKUVTE
Viimase 60 aasta jooksul on Euroopas vlja kujunenudkll htne poliitiline jamajanduslik struktuur, kuid kul-tuuri ja keelte osas on mitmekesisus silinud. Keeleli-sed takistused prsivad nii Euroopa kodanike omavahe-list kui ka ri- ja poliitikaringkondade suhtlust erine-vates keeltes - portugali k