Upload
tetyana-struk-trainstation
View
903
Download
11
Embed Size (px)
Citation preview
Постредактирование МП (PEMT):практические вопросы для переводчиков и редакторов
Светлана Светова,
“Плюс Перевод”, Санкт-Петербург
План презентации
• PEMT: цифры, факты, комментарии
• Некоторые практические аспекты PEMT
• Взаимодействие с заказчиком
Тип МП: важно ли знать тип МП и разбираться в МП МП хорошего качества: хорошо ли для переводчика
Настройка и улучшение МП заказчика: должен ли переводчик в этом участвовать
PEMT для понимания vs. Полное PEMT
• PEMT как новый вид деятельности
Обратная связь от переводчиков, страхи и ожидания Удобство работы пост-редактора
Профиль пост-редактора Инструкции по PEMT
Рекомендации по PEMT
The “term used for the correction of machine translation output by human linguists/editors” (Veale and Way 1997)
“checking, proof-reading and revising translations carried out by any kind of translating automaton” (Gouadec 2007)
“In basic terms, the task of the post-editor is to edit, modify and/or correct pre-translated text that has been processed by a machine translation system from a source language (a) in to target language(s).“ (Allen 2003)
“Post-editors … are translators from MT language …”
(H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001)
“According to Hutchins (1986), the term “post-editor” was introduced in 1950 by Erwin Reifler who described the task as follows: “to select the correct translation from the possibilities found by the computer dictionary and to rearrange the word order to suit the target language…”
(H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001)
4
○ Overall volumes continue to grow but prices are down (avg $0.13/word) ○ The market for translation technology is worth $1,287m○ PEMT market is slowly growing – currently at about 3% of the LS
market, worth of $1,238m ($841m last year). ○ Two technology trends: Machine translation and cloud-based software○ Foreign exchange issues affect market sizing.○ 17.45% of LSPs sell Post Edited MT
– (although the number is probably higher but LSPs do not identify this as a different service from Translation)
What’s happening to the market?
PEMT, еще цифры
чтобы стать хорошим пост-редактором, хорошо бы “отпостредактировать” минимум 100 000 слов
ожидания по скорости постредактирования: 600 слов в час ожидания по приросту производительности: в 2 раза (5 000-10 000 слов в день) 3 текста вместо стандартных 2 при PEMT для обработки (исходный + МП +
собственно перевод) 3-5 лет – максимальный опыт PE у пост-редакторов 80% переводчиков не имеют опыта PE прирост производительности – в среднем 10%, хотя цифры встречаются
любые стандартная скидка на PEMT от полной пословной ставки – 30% МП = TM fuzzy match 80-90% правило “2 секунд” (см. Рекомендации по PEMT)
PEMT: взаимодействие с заказчиком
Треугольник PEMT: 3 группы задач
Заказчик
Разработчик Переводчик
1. Внедрить МП для сценариев, когда недостаточно ресурсов для выполнения перевода по традиционной схеме/ требуется увеличить объем перевода в рамках ограниченного бюджета/когда требуется увеличить объем перевода в пределах того же количества переводческих ресурсов
2. Купить и настроить систему (обратная связь)
3. Расширить применение (включая сферы и языки)
4. Обучить МП-специалистов5. Повысить эффективность процессов
1. Получить больше объемов на перевод (включая те, которые не были бы получены без МП)2. Выработать новые навыки (в т.ч. переводить больше и быстрее, не теряя в деньгах)3. Выработать подход к новым условиям
1. Получить опыт внедрения2. Улучшить качество МП на
конкретном опыте (обратная связь и настройка)
3. Расширить применение (включая языковые пары)
4. Расширить клиентскую базу5. Продать услуги по
настройке и разработке6. Продать услуги по
обучению
• Машинный перевод на основе правил (RBMT)– Лингвистические правила– Словарные базы данных– > отсутствие правил > качество перевода
• Статистический машинный перевод (SMT)– Использование вероятностного подхода (на анализе и паттернах)– Изучение предварительно переведенных данных– Способность к статистическому обучению– > ввод данных> качество перевода… способность к обучению
• Гибридные системы машинного перевода (HMT)– Технологии объединены в новом подходе к машинному переводу — "статистическом
синтаксисе"– Автоматическое обучение + "грамматика" на основе правил– Система распознает "грамматику" и способна к автоматическому обучению
Типы МП
Тип МП: важно ли переводчику знать тип МП и разбираться в МП
тип RMBT традиционно считается более устойчивым с точки зрения терминологии (после настройки), SMT – более читабельным
выбор системы МП обычно связан с языковым направлением (в первую очередь)
таблицы типовых ошибок МП обычно приветствуются переводчиками для получения представления о возможных проблемах, связанных с выбором системы МП
уровень настройки системы МП напрямую связан с объемом последующего постредактирования и решения проблем в его процессе, основанных на понимании поведения системы
Переводчику не повредит знание о возможностях или пределах настройки МП для получения представления об объемах постредактирования (в непосредственной связи с трудозатратами и расчетом стоимости)
МП хорошего качества: хорошо ли для переводчика
хорошо настроенная система МП – дополнительные расходы на стороне заказчика – дополнительные ожидания по экономии в процессе перевода и росту производительности
более низкая ставка для переводчика?
но и меньшие трудозатраты для переводчика? в идеале – просто проверить и подтвердить?
угроза полного перехода на МП при переводе данного типа текстов?
существует также мнение, что просто все удалить и переписать – более легкое для переводчика действие, чем выискивать ошибки в МП, особенно хорошего качества (которое может быть намного, намного лучше)
Связанная с предыдущей тема: должен ли переводчик участвовать в повышении качества системы МП и ее настройке
хорошо настроенная система МП – меньшие трудозатраты для переводчика?
быстрее перевел – быстрее получил следующий объем?
не отвлекаешься на повторяющиеся раздражающие ошибки? (МП повторяет ошибку до тех пор, пока ее не исправишь в системе)
одновременно развиваешь новый интересный навык?
1) пост-редактирование до финального качества (полное пост-редактирование, full PEMT)– наиболее часто выполняемый вид работ– в результате “не должен быть виден МП”, высокие (стандартные) ожидания по качеству– для текстов широкого применения
2) пост-редактирование для понимания (light PEMT)– требуется реже (если вообще требуется)– менее высокие ожидания по качеству– фокус на смысле– применяется для текстов, не требующих массового использования
Два основных вида пост-редактирования МП
12
Перед началом работы целесообразно уточнить ожидания заказчика.
PEMT как новый вид деятельности
Постредактирование в сравнении с редактированием
14
• Постредактирование МП заменяет традиционный этап перевода
• Весьма отличается от редактирования ручного перевода (другие, “свои” типы ошибок)
• Приветствуется понимание “поведения” системы
• После постредактирования МП требуется этап стандартного редактирования
Страхи и ожидания
Новая деятельность, мало информации, у заказчиков высокие ожидания
Слишком сильное давление на переводчиков, которые должны принимать решения в условиях пониженной ставки и меньшего времени при высоких ожиданиях
Отмечается корреляция между отношением переводчика к PEMT (положительное-отрицательное) и скоростью работы
Переводчик без опыта постредактирования относится к ошибкам МП так, как будто они сделаны человеком (эмоции - лишнее время)
Хороший МП – “все пропало, у переводческой профессии нет будущего”
Плохой МП – “я сейчас все удалю и гениально перепишу, но при этом получу на 30% меньше”
Опасения привыкнуть к “стилю МП” и перестать замечать ошибки.
Переводчики склонны более доверять нечетким совпадениям в ТМ (“сделано человеком”), чем МП-сегментам
Но некачественный результат МП вызывает меньше раздражения, чем “человеческий” сегмент из ТМ
При PEMT приходится иметь дело с 3 текстами вместо 2, отсюда рост когнитивной нагрузки
Пост-редактирование – по-прежнему “непрестижная” деятельность (?), мало креатива
Переводчики очень устают от постредактирования, гораздо сильнее, чем от перевода (связано и с типом текстов, подлежащих МП, например, длинные списки наименований продукции …)
Опыт, навык, здравый смысл, расчет и обсуждение условий – лучшие друзья пост-редактора.
Удобство работы пост-редактора
Текущий стандарт работы – в CAT, где результат МП = еще одно нечеткое совпадение (fuzzy match)
Вопрос: должен ли результат МП быть нечетким совпадением или подсказкой?
Современные требования к разработчикам по части PEMT:
• формирование отчета, фиксирование времени, запись действий…
Основное известное требование к разработчикам средств PEMT – внедрить кнопку DELETE ALL
• предварительная оценка качества МП – связанная с объемом постредактирования ставка
• предварительная оценка пригодности текста к МП (MT-friendly content)
• самообучение системы в процессе работы и обновление последующих сегментов
Обучение
Профиль пост-редактора
большинство пост-редакторов МП в настоящее время – штатные сотрудники
пост-редакторами могут становиться только опытные переводчики со склонностью к редактированию, поскольку неопытные и без склонности легко увлекутся возможной гладкостью МП (хотя встречается и точка зрения, что начинающих переводчиков легче обучить постредактированию и убедить в его целесообразности)
постредактирование МП требует непредвзятого отношения, гибкого подхода - и умения видеть в МП еще один профессиональный инструмент для повышения собственной эффективности и конкурентоспособности
пост-редактору МП явно не повредят:
отличные языковые навыки
знание предметной области
опыт работы с системами CAT и средствами автоматической проверки и интерес к технологиям
навык редактирования и умение быстро принимать решения
положительное отношение к МП
склонность к экспериментированию
практика, практика, практика (100 тыс. слов )
Инструкции по PEMT
Инструкции по PEMT создаются под требования конкретных заказчиков и конкретных проектов, а не “вообще”, это связано с ожиданиями по качеству и уровнем настройки/типом МП (обычно инструкция по PEMT содержит 3 пункта как минимум: ожидания/требования по качеству, разбор типовых ошибок МП, рекомендации)
Таблицы типовых ошибок МП включаются в инструкции для напоминания о возможных проблемах (=доп. проверках)
Поскольку МП-ошибки повторяются, PEMT – это не всего лишь “исправить одно слово и одну запятую”, речь может идти о структурных изменениях на всем пространстве текста (текстов), о чем инструкции напоминают
При PEMT обычно рекомендуется пренебрегать стилем, а не терминологией или правильной передачей смысла, большинство инструкций советует “стараться использовать как можно больше из результата МП”
Пост-редакторы должны следовать и стандартным процедурам (QA и т.д.)
Инструкции по PEMT – традиционная часть
• Результат перевода должен быть корректным и истинным отображением исходного текста
• Перевод должен соответствовать всем правилам выходного языка• Обязательным условием является последовательное использование
правильной терминологии• Необходимо применение соответствующего документу стиля• Должны использоваться справочные материалы (проектные указания, базы
TM, глоссарии, терминологические базы и т.д.)• Форматы дат и времени, единиц измерения, числовых выражений, валют и пр.
должны быть адаптированы к правилам выходного языка• Должно воспроизводиться форматирование исходного документа• Перевод должен быть читабельным и пригодным для целей его
использования
Дополнительные или
отсутствующие слова
Отрицание
Составные конструкции или
конструкции с дефисом
Имена собственные
Вопросительные
предложения
Инструкции по PEMT: примеры дополнительных проверок в случае SMT
20
21
Инструкции по PEMT - рекомендации
Убедитесь, что вся информация передана корректно
Проверьте все числовые выражения
Проверьте корректность терминологии
Вносите необходимые изменения только в том случае, если значение
передано неправильно или искажено
Не меняйте структуру текста, если значение передано верно
Всегда помните, что превалируют конкретные требования заказчика
Для максимального удовольствия от эксплуатации данной палатки следуйте, пожалуйста, нашим рекомендациям.
Постановка палаткиВыберите максимально ровную поверхность. Очистите её от острых камней и веток.
Правила противопожарной безопасности.• не держите плитки, горелки и лампы близко к материалу палатки• следуйте противопожарной инструкции пришитой внутри палатки
• держите выход свободным от вещей
Пример, просто пример
Типовые рекомендации пост-редактору
Минимум усилий для максимума результата (как можно меньше коррекции)
И как можно меньше времени
Вносить изменения только тогда, когда это совершенно необходимо
Ничего не добавлять по сравнению с исходником
Ничего не удалять по сравнению с исходником
И вот еще рекомендации…
24
Пытайтесь использовать результат
МП по максимуму
Не стоит стараться “гениально переписать” все заново – равно как и оставить все как есть
Всегда перечитывайте результат перевода после постредактирования
Находите те фрагменты в результате МП, использование которых может значительно ускорить работу
Правило “2 секунд”
Раз
• Прочитать исходный текст, затем МП
• Определить пригодные для использования фрагменты
Два
• Откорректировать МП
• Стараться не пытаться все переписать или оставить как есть
• Фокус – на корректности
Три
• Провести дополнительные проверки
• Исправить опечатки
• Проверить терминологию
Этапы постредактирования
25
Обучение по PEMT: что предлагается в настоящее время
SDL PEMT Certification (бесплатно для пользователей SDL Trados Studio)
TAUS Post-Editing Course с различными языковыми модулями
Рис. 3 Спасибо за внимание[email protected]