Click here to load reader

Eesti keel digiajastul

  • View
    246

  • Download
    0

Embed Size (px)

Text of Eesti keel digiajastul

  • White Paper Series

    THE ESTONIANLANGUAGE IN

    THE DIGITALAGE

    Valge raamatu sari

    EESTIKEELDIGIAJASTUL

    Krista LiinKadri MuischnekKaili MrisepKadri Vider

  • White Paper Series

    THE ESTONIANLANGUAGE IN

    THE DIGITALAGE

    Valge raamatu sari

    EESTIKEELDIGIAJASTUL

    Krista Liin Tartu likoolKadri Muischnek Tartu likoolKaili Mrisep Tartu likoolKadri Vider Tartu likool

    Georg Rehm, Hans Uszkoreit(toimetajad, editors)

  • EESSNA PREFACE

    Eesti keele raport kuulub META-NETi vljaannete is white paper is part of a series that promotessarja,mille eesmrgiks on tutvustadakeeletehnoloogia- knowledge about language technology and its poten-alaseid teadmisi ja selle ala potentsiaali. Vljaande siht- tial. It addresses journalists, politicians, language com-grupiks on petajad, ajakirjanikud, poliitikud, kogu munities, educators and others. e availability andkeelekogukond ja teised teemast huvitatud. use of language technology in Europe varies betweenKeeletehnoloogia kttesaadavus ja kasutamine on Eu- languages. Consequently, the actions that are requiredroopa keeliti vga erinev. Nii on ka meetmed, mida on to further support research and development of lan-vaja rakendada keeletehnoloogia arendamise ja uuri- guage technologies also differ. e required actionsmise edasiseks toetamiseks, erinevatele keeltele vga depend on many factors, such as the complexity of aerinevad, sltudes niteks keele keerukusest ja selle k- given language and the size of its community.nelejate arvust. META-NET, a Network of Excellence funded by theEuroopa Komisjoni rahastatud tippteadmiste vrgus- European Commission, has conducted an analysis oftik META-NET viis lbi keeleressursside ja -tehno- current language resources and technologies in thisloogiate alase uurimuse, mis keskendus 23 ametlikule white paper series (p. 75). e analysis focused on theEuroopa keelele ja ka teistele olulistele regionaalsetele 23 official European languages as well as other impor-keeltele Euroopas (vt lk 75). Analsi tulemus nitas, tant national and regional languages in Europe. e re-et kigi keelte tehnoloogiates leidub mrkimisvrseid sults of this analysis suggest that there are tremendouspuudujke. Tpne ekspertanals ja olukorra hinda- deficits in technology support and significant researchmine aitavad panustada edasise uurimist mju suu- gaps for each language. e given detailed expert anal-rendamisse ja vhendada riske. ysis and assessment of the current situation will helpMETA-NET koosneb 33 riigi 54 uurimiskeskusest (vt maximise the impact of additional research.lk 71), mis teevad koostd tstuse, valitsusasutuste, As of January 2012, META-NET consists of 54 re-likoolide ja uurimisasutuste esindajatega. Koost search centres from 33 European countries (p. 71).tulemusena valmib hine tehnoloogiline visioon, mis META-NET is working with stakeholders from econ-osana strateegilisest uurimiskavast nitab, kuidas kee- omy (soware companies, technologyproviders, users),letehnoloogilised rakendused saavad katta praegused government agencies, research organisations, non-uurimist puudujgid aastaks 2020. governmental organisations, language communities

    and European universities. Together with these com-munities, META-NET is creating a common technol-ogy vision and strategic research agenda for multilin-gual Europe 2020.

    III

  • META-NET [email protected] http://www.meta-net.eu

    Selle dokumendi autorid tnavad saksa keele valge raamatu au-toreid loa eest kasutada nende vljaandes sisaldunud keelestsltumatuid materjale [1].

    Selle keeleraporti koostamist rahastas 7. raamprogramm

    ja Euroopa Komisjoni IKT poliitika toetusprogramm le-

    pingute T4ME (toetusleping 249 119), CESAR (toetusle-

    ping 271 022), METANET4U (toetusleping 270 893) ja

    META-NORD (toetusleping 270 899) kaudu.

    e authors of this document are grateful to the authors ofthe White Paper on German for permission to re-use selectedlanguage-independent materials from their document [1].

    e development of this White Paper has been funded by the

    Seventh Framework Programme and the ICT Policy Support

    Programme of the European Commission under the contracts

    T4ME (Grant Agreement 249 119), CESAR (Grant Agree-

    ment 271 022), METANET4U (Grant Agreement 270 893)

    and META-NORD (Grant Agreement 270 899).

    IV

  • SISUKORD CONTENTS

    EESTI KEEL DIGIAJASTUL

    1 Kokkuvte 1

    2 Oht meie keeltele ja vljakutse keeletehnoloogiale 42.1 Keelepiirid tkestavad Euroopa infohiskonda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Meie keeled on ohus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.3 Keeletehnoloogia on vtmetehnoloogia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.4 Keeletehnoloogia vimalused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.5 Keeletehnoloogia vljakutsed . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.6 Kuidas inimesed ja masinad keelt omandavad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    3 Eesti keel Euroopa infohiskonnas 93.1 ldinfo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.2 Eesti keele eriprad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93.3 Viimase aja arengud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.4 Keelehoole Eestis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.5 Keel ja haridus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.6 Rahvusvahelised aspektid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.7 Eesti keel internetis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    4 Eesti keele keeletehnoloogiline tugi 144.1 Rakenduste arhitektuur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144.2 Kesksed rakendused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154.3 Muud rakendusalad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.4 Haridusprogrammid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.5 Riiklikud programmid ja algatused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244.6 Vahendite ja ressursside kttesaadavus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254.7 Keeltevaheline vrdlus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264.8 Jreldused . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    5 META-NETist 31

  • THE ESTONIAN LANGUAGE IN THE DIGITAL AGE

    1 Executive Summary 33

    2 Languages at Risk: a Challenge for Language Technology 362.1 Language Borders Hold back the European Information Society . . . . . . . . . . . . . . . . . . 372.2 Our Languages at Risk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.3 Language Technology is a Key Enabling Technology . . . . . . . . . . . . . . . . . . . . . . . . 382.4 Opportunities for Language Technology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382.5 Challenges Facing Language Technology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.6 Language Acquisition in Humans and Machines . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    3 The Estonian Language in the European Information Society 413.1 General Facts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2 Particularities of the Estonian Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.3 Recent Developments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.4 Language Cultivation in Estonia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.5 Language in Education . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.6 International Aspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453.7 Estonian on the Internet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    4 Language Technology Support for Estonian 474.1 Application Architectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2 Core Application Areas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.3 Other Application Areas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.4 Educational Programmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.5 National Programmes and Initiatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.6 Availability of Tools and Resources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.7 Cross-language comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    5 About META-NET 65

    A Kirjandus --- References 67

    B META-NETi liikmed -- META-NET Members 71

    C META-NETi Valge raamatu sari -- The META-NET White Paper Series 75

  • 1

    KOKKUVTE

    Viimase 60 aasta jooksul on Euroopas vlja kujunenudkll htne poliitiline jamajanduslik struktuur, kuid kul-tuuri ja keelte osas on mitmekesisus silinud. Keeleli-sed takistused prsivad nii Euroopa kodanike omavahe-list kui ka ri- ja poliitikaringkondade suhtlust erine-vates keeltes - portugali k