полуавтоматическая генерации словарей для...

Preview:

Citation preview

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА НА ТЕМУ: «ПРОГРАММНАЯ СРЕДА ПОЛУАВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ СЛОВАРЕЙ ДЛЯ ЛЕКСИКОГРАФОВ»

РУКОВОДИТЕЛЬ: К.Ф.-М.Н., ДОЦЕНТ, СОШНИКОВ Д.В.

ДИПЛОМНИК ГРУППЫ 08-606: КИРИЛИНА А.А.

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ(НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)

Москва, 2015

1. АКТУАЛЬНОСТЬ

2. ТРУДОЁМКОСТЬ ЗАДАЧИ

КАРТИНКА три статьи -> другие статьиПри этом нужно вспомнить все переводы

и ничего не забыть

3. ОБОБЩЕНИЕ ЗАДАЧИ

4. ЦЕЛЬ РАБОТЫСоздание АРМ лексикографа со считыванием и генерацией словарей в различных форматах.

5. КОНКУРЕНТЫ

WeSay Leacslann

6. ФУНКЦИОНАЛ АРМ

7. ФУНКЦИОНАЛ АРМ

8. ЗАДАЧИ

Построить общую модель данныхРеализовать импорт данныхРеализовать генерацию «обратного»

словаряСоздать пользовательский клиент для

редактирования словаря лексикографом

9. МЕТАЯЗЫК

Общие идеиСловам соответствуют UIDГипотеза С-ВФрагмент таблицы БД

10. МОДЕЛЬ ДАННЫХ EDMX

11. ТЕХНОЛОГИИ

12. XSLT-ПРЕОБРАЗОВАНИЕ

14. РЕДАКТИРОВАНИЕ СЛОВАРЯ

Функции для редактирования и связки слов и примеров. Можно вывести список несвязанных ни с какими словами примерами.

Причины их появления: Такие примеры могут появиться из-за особенностей перевода:

аппарат cihaz, apparat; кассовый ~ kassa cihazı; звуковой ~ лингв. ses cihazı; речевой ~ лингв. söz cihazı; летательный ~ uçquç şekiy

Формы одного слова не распознались из-за неточности правил. Неоднокоренные слова посчитались однокоренными – например с

коротенькими словами.

15. ИНТЕРФЕЙС ПРОГРАММЫ

16. ИНТЕРВАЛЬНАЯ ОЦЕНКА ОСТАВШЕГОСЯ ВРЕМЕНИ РАБОТЫ

– время редактирования взятой наугад словарной статьи.

С вероятностью оставшееся время работы над словарём будет покрываться промежутком

.

- оценка среднеквадратического отклонения

– квантиль уровня распределения Стьюдента с n степенями свободы

17. ПРЕИМУЩЕСТВА ИНТЕРВАЛЬНОЙ ОЦЕНКИ

18. ГЕНЕРАЦИЯ «ОБРАТНОГО» СЛОВАРЯ

А ЗДЕСЬ ВЫ ВИДИТЕ КРАСИВЕНЬКИЙ АЛГОРИТМ НА ПСЕВДОКОДИКЕ

19. ПОДЫТОЖИМ, ЧТО ПОЛУЧИЛОСЬ

20. МОБИЛЬНОЕ ПРИЛОЖЕНИЕ

21. РЕЗУЛЬТАТЫ

Разработана модель представления множества словарей на едином лингвистическом поле (несколько словарей вместе в одной модели) (!переписывать)

Разработан алгоритм построения «обратного» словаря

Разработана среда, позволяющая считывать словари в формате .docx для последующей обработки и редактирования

22. ПЛАНЫ

Русско-крымскотатарский в крымскотатарско-русский

Совместный словарь трёх авторов на базе русско-украинско-крымскотатарского

Русско-караимский в караимско-русский

Перевод в облачную архитектуру SAAS

Облачный доступ к программе Microsoft Bizspark – подана заявка.

СПАСИБО ЗА ВНИМАНИЕ

Recommended