15
КОРПУСНАЯ ЛИНГВИСТИКА

корпусная лингвистика

Embed Size (px)

Citation preview

Page 1: корпусная лингвистика

КОРПУСНАЯ ЛИНГВИСТИКА

Page 2: корпусная лингвистика

ИСТОРИЯ

Брауновский корпус, 1963 г (БК, англ. Brown Corpus, BC)

По модели близкой к БК был создан Уппсальский корпус русского языка, 1980 г

Page 3: корпусная лингвистика

ОСНОВНЫЕ НАПРАВЛЕНИЯ КОРПУСА

Лексикография

Грамматика

Лингвистика текста (в том числе устного)

Лингводидактика

Многоязычные (переводные) корпусы

Page 4: корпусная лингвистика

ЛЕКСИЧЕСКОЕ УЧЕНИЕСэмьюэл Джонсон

Отказался от расположения слов «по темам», например, отдельно

все растения или все морские животные, и положил в основу

алфавитный принцип.

Проработал обширную литературу всех жанров и направлений,

отобрал огромное количество примеров и включил их в каждую

словарную статью, чтобы проиллюстрировать употребление

слова.

Упорядочил написание и произношение слов

Впервые поставил на титульном листе название Dictionary –

«Словарь»

Page 5: корпусная лингвистика

ОСНОВНЫЕ КОМПЬЮТЕРНЫЕ КОРПУСА

1960-е: Брауновский корпус, (США), 1 млн. слов

1970-е: LOB корпус (Великобритания, Норвегия), 1 млн.

Уппсальский корпус русского языка (Швеция), 1 млн.

1990-е: British National Corpus, 100 млн.

Национальный корпус русского языка, 140 млн.

Oxford English corpus, 2 млрд.

Page 6: корпусная лингвистика

ТИПЫ КОРПУСНОЙ РАЗМЕТКИ

морфологическая

синтаксическая

семантическая

анафорическая

просодическая

Page 7: корпусная лингвистика

КОРПУСНЫЕ МЕНЕДЖЕРЫ Поиск конкретных словоформ

Поиск словоформ по леммам

Поиск группы словоформ в виде разрывной или

неразрывной синтагмы

Поиск словоформ по набору морфологических

признаков

Получение различных лексико-грамматических

статистических данных

Сохранение отобранных строк конкорданса

Page 8: корпусная лингвистика

ПРИМЕРЫ– Национальный корпус русского языка

http://ruscorpora.ru/

– British National Corpus http://www.natcorp.ox.ac.uk/

– International Corpus of English

http://ice-corpora.net/ice/

Page 9: корпусная лингвистика

НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА

Page 10: корпусная лингвистика

БРИТАНСКИЙ НАЦИОНАЛЬНЫЙ КОРПУС

Page 11: корпусная лингвистика

МЕЖДУНАРОДНЫЙ КОРПУС АНГЛИЙСКОГО ЯЗЫКА

Page 12: корпусная лингвистика

АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА

Page 13: корпусная лингвистика

ПОЛЬЗОВАТЕЛИ

Прикладные лингвисты

Лингвисты-теоретики

Преподаватели

Компьютерные лингвисты

Специалисты по общественным наукам (историки,

социологи)

Корпусы, как инструмент для разработки и

настройки различных автоматизированных систем

Page 14: корпусная лингвистика

РЕЗУЛЬТАТЫ

Все употребления выбранного слова в непосредственном

контексте

Слова, которые чаще всего стоят рядом с выбранным

словом

Наиболее важные различия между двумя наборами

текстов

Как тот или иной писатель использует слова и фразы

Page 15: корпусная лингвистика

СПАСИБО ЗА

ВНИМАНИЕ!