23
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА НА ТЕМУ: «ПРОГРАММНАЯ СРЕДА ПОЛУАВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЛОВАРЕЙ ДЛЯ ЛЕКСИКОГРАФОВ» РУКОВОДИТЕЛЬ: К.Ф.-М.Н., ДОЦЕНТ, СОШНИКОВ Д.В. ДИПЛОМНИК ГРУППЫ 08-606: КИРИЛИНА А.А. МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ) Москва, 2015

полуавтоматическая генерации словарей для лексикографов

Embed Size (px)

Citation preview

Page 1: полуавтоматическая генерации словарей для лексикографов

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА НА ТЕМУ: «ПРОГРАММНАЯ СРЕДА ПОЛУАВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЛОВАРЕЙ ДЛЯ ЛЕКСИКОГРАФОВ»

РУКОВОДИТЕЛЬ: К.Ф.-М.Н., ДОЦЕНТ, СОШНИКОВ Д.В.

ДИПЛОМНИК ГРУППЫ 08-606: КИРИЛИНА А.А.

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ(НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)

Москва, 2015

Page 2: полуавтоматическая генерации словарей для лексикографов

1. АКТУАЛЬНОСТЬ

Page 3: полуавтоматическая генерации словарей для лексикографов

2. ТРУДОЁМКОСТЬ ЗАДАЧИ

КАРТИНКА три статьи -> другие статьиПри этом нужно вспомнить все переводы

и ничего не забыть

Page 4: полуавтоматическая генерации словарей для лексикографов

3. ОБОБЩЕНИЕ ЗАДАЧИ

Page 5: полуавтоматическая генерации словарей для лексикографов

4. ЦЕЛЬ РАБОТЫСоздание АРМ лексикографа со считыванием и генерацией словарей в различных форматах.

Page 6: полуавтоматическая генерации словарей для лексикографов

5. КОНКУРЕНТЫ

WeSay Leacslann

Page 7: полуавтоматическая генерации словарей для лексикографов

6. ФУНКЦИОНАЛ АРМ

Page 8: полуавтоматическая генерации словарей для лексикографов

7. ФУНКЦИОНАЛ АРМ

Page 9: полуавтоматическая генерации словарей для лексикографов

8. ЗАДАЧИ

Построить общую модель данныхРеализовать импорт данныхРеализовать генерацию «обратного»

словаряСоздать пользовательский клиент для

редактирования словаря лексикографом

Page 10: полуавтоматическая генерации словарей для лексикографов

9. МЕТАЯЗЫК

Общие идеиСловам соответствуют UIDГипотеза С-ВФрагмент таблицы БД

Page 11: полуавтоматическая генерации словарей для лексикографов

10. МОДЕЛЬ ДАННЫХ EDMX

Page 12: полуавтоматическая генерации словарей для лексикографов

11. ТЕХНОЛОГИИ

Page 13: полуавтоматическая генерации словарей для лексикографов

12. XSLT-ПРЕОБРАЗОВАНИЕ

Page 14: полуавтоматическая генерации словарей для лексикографов

14. РЕДАКТИРОВАНИЕ СЛОВАРЯ

Функции для редактирования и связки слов и примеров. Можно вывести список несвязанных ни с какими словами примерами.

Причины их появления: Такие примеры могут появиться из-за особенностей перевода:

аппарат cihaz, apparat; кассовый ~ kassa cihazı; звуковой ~ лингв. ses cihazı; речевой ~ лингв. söz cihazı; летательный ~ uçquç şekiy

Формы одного слова не распознались из-за неточности правил. Неоднокоренные слова посчитались однокоренными – например с

коротенькими словами.

Page 15: полуавтоматическая генерации словарей для лексикографов

15. ИНТЕРФЕЙС ПРОГРАММЫ

Page 16: полуавтоматическая генерации словарей для лексикографов

16. ИНТЕРВАЛЬНАЯ ОЦЕНКА ОСТАВШЕГОСЯ ВРЕМЕНИ РАБОТЫ

– время редактирования взятой наугад словарной статьи.

С вероятностью оставшееся время работы над словарём будет покрываться промежутком

.

- оценка среднеквадратического отклонения

– квантиль уровня распределения Стьюдента с n степенями свободы

Page 17: полуавтоматическая генерации словарей для лексикографов

17. ПРЕИМУЩЕСТВА ИНТЕРВАЛЬНОЙ ОЦЕНКИ

Page 18: полуавтоматическая генерации словарей для лексикографов

18. ГЕНЕРАЦИЯ «ОБРАТНОГО» СЛОВАРЯ

А ЗДЕСЬ ВЫ ВИДИТЕ КРАСИВЕНЬКИЙ АЛГОРИТМ НА ПСЕВДОКОДИКЕ

Page 19: полуавтоматическая генерации словарей для лексикографов

19. ПОДЫТОЖИМ, ЧТО ПОЛУЧИЛОСЬ

Page 20: полуавтоматическая генерации словарей для лексикографов

20. МОБИЛЬНОЕ ПРИЛОЖЕНИЕ

Page 21: полуавтоматическая генерации словарей для лексикографов

21. РЕЗУЛЬТАТЫ

Разработана модель представления множества словарей на едином лингвистическом поле (несколько словарей вместе в одной модели) (!переписывать)

Разработан алгоритм построения «обратного» словаря

Разработана среда, позволяющая считывать словари в формате .docx для последующей обработки и редактирования

Page 22: полуавтоматическая генерации словарей для лексикографов

22. ПЛАНЫ

Русско-крымскотатарский в крымскотатарско-русский

Совместный словарь трёх авторов на базе русско-украинско-крымскотатарского

Русско-караимский в караимско-русский

Перевод в облачную архитектуру SAAS

Облачный доступ к программе Microsoft Bizspark – подана заявка.

Page 23: полуавтоматическая генерации словарей для лексикографов

СПАСИБО ЗА ВНИМАНИЕ