49
Бранко Тошович Institut für Slawistik der Karl-Franzens Universität Graz http://www-gewi.kfunigraz.ac.at/gralis/index.html [email protected] Грамматическая аннотация для Гралис-Копруса Казанская школа-семинар по компьютерной и когнитивной лингвистике: TEL2014 „Языковая семантика: модели и технологии“ Казань: 6–9 февраля 2014 г. Научно-исследовательский институт «Прикладная семиотика» Академии наук Республики Татарстан

Казанская школа-семинар по компьютерной и когнитивной лингвистике:

  • Upload
    didina

  • View
    85

  • Download
    0

Embed Size (px)

DESCRIPTION

Бранко Тошович Institut für Slawistik der Karl-Franzens Universität Graz http://www-gewi.kfunigraz.ac.at/gralis/index.html [email protected] Грамматическая аннотация для Гралис-Копруса. Казанская школа-семинар по компьютерной и когнитивной лингвистике: - PowerPoint PPT Presentation

Citation preview

Page 1: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Бранко Тошович Institut für Slawistik der Karl-Franzens Universität Graz

http://www-gewi.kfunigraz.ac.at/gralis/[email protected]

Грамматическая аннотация для Гралис-Копруса

Казанская школа-семинар по компьютерной и когнитивной лингвистике:

TEL’2014 „Языковая семантика: модели и технологии“Казань: 6–9 февраля 2014 г.

Научно-исследовательский институт «Прикладная семиотика» Академии наук Республики Татарстан

Page 2: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

222

Содержание

1. Gralis-Korpus

2. Gralis-MorphoGenerator

3. Морфологическая разметка

4. Порождение парадигм

5. Правила порождения

6. Закономерности

7. Перспективы

Page 3: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

3

Гралис-Корпус

Page 4: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Сопоставительное изучение славянских языков

4

Page 5: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Типы разметки • метаязыковая • морфологическая • синтаксическая• семантическая• стилистическая

5

Page 6: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Морфологическая аннотация

6

Page 7: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Научно-исследовательский проект (2006–2010) Австрийского фонда для поддержки научных исследований (FWF: Fonds zur Förderung der wissenschaftlichen Forschung: FWF-Projekt, P19158-G03)

7

Page 8: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

8

Page 9: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Разметка• Multext-East кодировка (Multilingual Texts

and Corpora for Eastern and Central European Languages – multilingual dataset for language engineering research and development)

9

Морфологическая разметка

Page 10: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

10

Page 11: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• CQP

11

Поиск

Page 12: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

12

Page 13: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

13

Page 14: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

14

Page 15: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

15

Page 16: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Позиции (28)• 1. часть речи, 2. подтип части речи, 3.

наклонение, 4. время, 5. лицо, 6. число, 7. род, 8. залог, 9. отрицание, 10. определенность, 11. возвратность, 12. падеж, 13. одушевленность, 14. клитика, 15. вид,

16

Грамматическая кодировка

Page 17: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• 16. вежливость, 17. переходность, 18. ударение, 19. способ глагольного действия, 20. лексико-семантическая группа, 21. сочетание (управление, согласование), 22. экспрессия, 23. функциональный стиль,

17

Page 18: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• 24. аналитическая форма, 25. деструкция, 26. словообразование, 27. номер порождения, 28. грамматический тип порождения

18

Page 19: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

1. Часть речи • n ‒ существительные, v ‒ глаголы, a ‒

прилагательные, p ‒ местоимения, r – наречия, s ‒ предлоги, c ‒ союзы, m ‒ числительные, i ‒ междометия, q ‒ частицы, y ‒ аббревиатуры

19

Page 20: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

2. Подтип части речи • Существительные: c – нариц., p –

собств., m – вещестр., l – собират. • Глаголы: m – полнозначн., a –

вспомогат., o – модальн., c – связочн., b – базовый.

• Прилагательные: f – качеств., r – относит., m – веществ., s – притяж. , o – порядк., m – количеств.

20

Page 21: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Местоимения: p – личн., d – указат., i – неопред., s – притяж., q – вопрос., r – относит., x – возвр., z – отриц., g – общ., y – вопрос.- относ., j – определ., t – указат.-относит.

• Наречия: g – общ., z – отриц., a – адъективн., v – глагольн., q – вопросит.

21

Page 22: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Предлоги: p – препозитивн., t – постпозитивн.

• Союзы: c – сочин., s – подчинит. • Числительные: c – количеств., o –

порядк., m – итеративн., l – видов., s – специальн.

• Частицы: z – отриц., q – вопрос., o – модальн., r – положит.

• Аббревиатуры: n – именн., r – наречн.22

Page 23: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

3. Тип формы • Глаголы: i – изъявит., накл., m –

повелит. накл., c – сосл. накл. 1, h – сосл. накл. 2, n – инфинитив, p – причастие, g – деепричастие 1 (несов. в. / нас. вр.), w – деепричастие 2 (сов. в. / прош. вр.), u – супин, t – переходн., q – циритов., s – гипотетич.

23

Page 24: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Прилагательные: степени сравнения – p: положит. ст., c – сравнит. ст., s – превосх. ст. Наречия: степени сравнения – p: положит. ст., c – сравнит. ст., s – превосх. ст., e – элятив

24

Page 25: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

4. Время •p – презенс, i – имперфект, f – будущ.

1 Ср (серб.), w – будущ. 1 Хр (хорв.) , z – будущ. 1 Ср/Хр (серб./хорв.), q – будущ. 2, s – перфект, l – плюсквамперфект 1, t – плюсквамперфект 2, a – аорист

25

Page 26: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

5. Лицо

1 – первое, 2 – второе, 3 – третье

6. Число

s – ед. ч., p – мн. ч., d – двойств. ч., l – собират. ч.

7. Род

m – м. р., f – ж. р., n – ср. р., l – общий р.

26

Page 27: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

8. Залог

a – действ. залог, p – страд. залог

9. Отрицание

n – да, y ‒ нет

10. Определенность

n – да, y ‒ нет

11. Возвратность

n – да, y ‒ нет27

Page 28: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

12. Падеж

n – им. п., g – род. п., d – дат. п., a – вин. п. v – зват. п., l – предл. п., i – творит. п.

28

Page 29: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

13. Одушевленность

n – да, y ‒ нет

14. Клитика

n – да, y ‒ нет

15. Вид

p – несов. в., e – сов. в., b – двойн. в.

16. Вежливость

n – да, y ‒ нет29

Page 30: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

17. Переходность

n – да, y ‒ нет

18. Деструкция

n – да, y ‒ нет

19. Словообразование

s – непроизв., c – сложн.

20. Тип

01, 02, 03…30

Page 31: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

• Существительные (turist)

• Прилагательные (jasan)

• Глаголы (pisati)

31

Page 32: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Незаполненные позиции • 11. возвратность, 16. вежливость, 18.

деструкция, 19. словообразование

32

Page 33: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Пока отсутствует • 18. ударение, 19. способ глагольного

действия, 20. лексико-семантическая группа, 21. сочетание (управление, согласование), 22. экспрессия, 23. функциональный стиль, 24. аналитическая форма

33

Page 34: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

MorphoGenerator

34

Page 35: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

35

Page 36: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

36

Page 37: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

37

Page 38: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

38

Page 39: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

39

Page 40: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

40

Page 41: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

41

Page 42: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

42

Page 43: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

43

Page 44: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

44

Page 45: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Закономерности

1. Два противоположных правила для порождения форм и парадигм

2. Общие и частичные правила

3. Структурные, категориальные и интеркатегориальные правила

4. Соотношение: число правил ↔ число окончаний

45

Page 46: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

46

5. Соотношение: число и структура правил ↔ часть речи

Page 47: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

6. Усложнение морфологической разметки

• наличие отдельных норм для трех очень близких языков – сербского, хорватского и бошняцкого

47

Page 48: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Перспективы

1. Корректура

2. Снятие грамматической омонимии

3. Морфологическая разметка других славянских языков

4. Синтаксическая, семантическая и стилистическая разметки

48

Page 49: Казанская  школа-семинар по компьютерной  и когнитивной лингвистике:

Литература• Tošović 2008: Tošović, Branko (Hg). Das Gralis-Korpus. In: Branko Tošović (Hg.). Die

Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen. Graz: Lit. 724–749.

• Tošović 2013: Tošović, Branko. Гралис-Корпус. In: Wiener slawischer Almanach. – München: Verlag Otto Sagner, c/o Kubon & Sagner. – Sonderband, 83. – S. 89–111.

49