27
Постредактирование МП (PEMT): практические вопросы для переводчиков и редакторов Светлана Светова, “Плюс Перевод”, Санкт-Петербург

PEMT: практические вопросы для переводчиков и редакторов

Embed Size (px)

Citation preview

Page 1: PEMT: практические вопросы для переводчиков и редакторов

Постредактирование МП (PEMT):практические вопросы для переводчиков и редакторов

Светлана Светова,

“Плюс Перевод”, Санкт-Петербург

Page 2: PEMT: практические вопросы для переводчиков и редакторов

План презентации

• PEMT: цифры, факты, комментарии

• Некоторые практические аспекты PEMT

• Взаимодействие с заказчиком

Тип МП: важно ли знать тип МП и разбираться в МП МП хорошего качества: хорошо ли для переводчика

Настройка и улучшение МП заказчика: должен ли переводчик в этом участвовать

PEMT для понимания vs. Полное PEMT

• PEMT как новый вид деятельности

Обратная связь от переводчиков, страхи и ожидания Удобство работы пост-редактора

Профиль пост-редактора Инструкции по PEMT

Рекомендации по PEMT

Page 3: PEMT: практические вопросы для переводчиков и редакторов

The “term used for the correction of machine translation output by human linguists/editors” (Veale and Way 1997)

“checking, proof-reading and revising translations carried out by any kind of translating automaton” (Gouadec 2007)

“In basic terms, the task of the post-editor is to edit, modify and/or correct pre-translated text that has been processed by a machine translation system from a source language (a) in to target language(s).“ (Allen 2003)

“Post-editors … are translators from MT language …”

(H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001)

“According to Hutchins (1986), the term “post-editor” was introduced in 1950 by Erwin Reifler who described the task as follows: “to select the correct translation from the possibilities found by the computer dictionary and to rearrange the word order to suit the target language…”

(H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001)

Page 4: PEMT: практические вопросы для переводчиков и редакторов

4

○ Overall volumes continue to grow but prices are down (avg $0.13/word) ○ The market for translation technology is worth $1,287m○ PEMT market is slowly growing – currently at about 3% of the LS

market, worth of  $1,238m ($841m last year). ○ Two technology trends: Machine translation and cloud-based software○ Foreign exchange issues affect market sizing.○ 17.45% of LSPs sell Post Edited MT

– (although the number is probably higher but LSPs do not identify this as a different service from Translation)

What’s happening to the market?

Page 5: PEMT: практические вопросы для переводчиков и редакторов

PEMT, еще цифры

чтобы стать хорошим пост-редактором, хорошо бы “отпостредактировать” минимум 100 000 слов

ожидания по скорости постредактирования: 600 слов в час ожидания по приросту производительности: в 2 раза (5 000-10 000 слов в день) 3 текста вместо стандартных 2 при PEMT для обработки (исходный + МП +

собственно перевод) 3-5 лет – максимальный опыт PE у пост-редакторов 80% переводчиков не имеют опыта PE прирост производительности – в среднем 10%, хотя цифры встречаются

любые стандартная скидка на PEMT от полной пословной ставки – 30% МП = TM fuzzy match 80-90% правило “2 секунд” (см. Рекомендации по PEMT)

Page 6: PEMT: практические вопросы для переводчиков и редакторов

PEMT: взаимодействие с заказчиком

Page 7: PEMT: практические вопросы для переводчиков и редакторов

Треугольник PEMT: 3 группы задач

Заказчик

Разработчик Переводчик

1. Внедрить МП для сценариев, когда недостаточно ресурсов для выполнения перевода по традиционной схеме/ требуется увеличить объем перевода в рамках ограниченного бюджета/когда требуется увеличить объем перевода в пределах того же количества переводческих ресурсов

2. Купить и настроить систему (обратная связь)

3. Расширить применение (включая сферы и языки)

4. Обучить МП-специалистов5. Повысить эффективность процессов

1. Получить больше объемов на перевод (включая те, которые не были бы получены без МП)2. Выработать новые навыки (в т.ч. переводить больше и быстрее, не теряя в деньгах)3. Выработать подход к новым условиям

1. Получить опыт внедрения2. Улучшить качество МП на

конкретном опыте (обратная связь и настройка)

3. Расширить применение (включая языковые пары)

4. Расширить клиентскую базу5. Продать услуги по

настройке и разработке6. Продать услуги по

обучению

Page 8: PEMT: практические вопросы для переводчиков и редакторов

• Машинный перевод на основе правил (RBMT)– Лингвистические правила– Словарные базы данных– > отсутствие правил > качество перевода

• Статистический машинный перевод (SMT)– Использование вероятностного подхода (на анализе и паттернах)– Изучение предварительно переведенных данных– Способность к статистическому обучению– > ввод данных> качество перевода… способность к обучению

• Гибридные системы машинного перевода (HMT)– Технологии объединены в новом подходе к машинному переводу — "статистическом

синтаксисе"– Автоматическое обучение + "грамматика" на основе правил– Система распознает "грамматику" и способна к автоматическому обучению

Типы МП

Page 9: PEMT: практические вопросы для переводчиков и редакторов

Тип МП: важно ли переводчику знать тип МП и разбираться в МП

тип RMBT традиционно считается более устойчивым с точки зрения терминологии (после настройки), SMT – более читабельным

выбор системы МП обычно связан с языковым направлением (в первую очередь)

таблицы типовых ошибок МП обычно приветствуются переводчиками для получения представления о возможных проблемах, связанных с выбором системы МП

уровень настройки системы МП напрямую связан с объемом последующего постредактирования и решения проблем в его процессе, основанных на понимании поведения системы

Переводчику не повредит знание о возможностях или пределах настройки МП для получения представления об объемах постредактирования (в непосредственной связи с трудозатратами и расчетом стоимости)

Page 10: PEMT: практические вопросы для переводчиков и редакторов

МП хорошего качества: хорошо ли для переводчика

хорошо настроенная система МП – дополнительные расходы на стороне заказчика – дополнительные ожидания по экономии в процессе перевода и росту производительности

более низкая ставка для переводчика?

но и меньшие трудозатраты для переводчика? в идеале – просто проверить и подтвердить?

угроза полного перехода на МП при переводе данного типа текстов?

существует также мнение, что просто все удалить и переписать – более легкое для переводчика действие, чем выискивать ошибки в МП, особенно хорошего качества (которое может быть намного, намного лучше)

Page 11: PEMT: практические вопросы для переводчиков и редакторов

Связанная с предыдущей тема: должен ли переводчик участвовать в повышении качества системы МП и ее настройке

хорошо настроенная система МП – меньшие трудозатраты для переводчика?

быстрее перевел – быстрее получил следующий объем?

не отвлекаешься на повторяющиеся раздражающие ошибки? (МП повторяет ошибку до тех пор, пока ее не исправишь в системе)

одновременно развиваешь новый интересный навык?

Page 12: PEMT: практические вопросы для переводчиков и редакторов

1) пост-редактирование до финального качества (полное пост-редактирование, full PEMT)– наиболее часто выполняемый вид работ– в результате “не должен быть виден МП”, высокие (стандартные) ожидания по качеству– для текстов широкого применения

2) пост-редактирование для понимания (light PEMT)– требуется реже (если вообще требуется)– менее высокие ожидания по качеству– фокус на смысле– применяется для текстов, не требующих массового использования

Два основных вида пост-редактирования МП

12

Перед началом работы целесообразно уточнить ожидания заказчика.

Page 13: PEMT: практические вопросы для переводчиков и редакторов

PEMT как новый вид деятельности

Page 14: PEMT: практические вопросы для переводчиков и редакторов

Постредактирование в сравнении с редактированием

14

• Постредактирование МП заменяет традиционный этап перевода

• Весьма отличается от редактирования ручного перевода (другие, “свои” типы ошибок)

• Приветствуется понимание “поведения” системы

• После постредактирования МП требуется этап стандартного редактирования

Page 15: PEMT: практические вопросы для переводчиков и редакторов

Страхи и ожидания

Новая деятельность, мало информации, у заказчиков высокие ожидания

Слишком сильное давление на переводчиков, которые должны принимать решения в условиях пониженной ставки и меньшего времени при высоких ожиданиях

Отмечается корреляция между отношением переводчика к PEMT (положительное-отрицательное) и скоростью работы

Переводчик без опыта постредактирования относится к ошибкам МП так, как будто они сделаны человеком (эмоции - лишнее время)

Хороший МП – “все пропало, у переводческой профессии нет будущего”

Плохой МП – “я сейчас все удалю и гениально перепишу, но при этом получу на 30% меньше”

Опасения привыкнуть к “стилю МП” и перестать замечать ошибки.

Переводчики склонны более доверять нечетким совпадениям в ТМ (“сделано человеком”), чем МП-сегментам

Но некачественный результат МП вызывает меньше раздражения, чем “человеческий” сегмент из ТМ

При PEMT приходится иметь дело с 3 текстами вместо 2, отсюда рост когнитивной нагрузки

Пост-редактирование – по-прежнему “непрестижная” деятельность (?), мало креатива

Переводчики очень устают от постредактирования, гораздо сильнее, чем от перевода (связано и с типом текстов, подлежащих МП, например, длинные списки наименований продукции …)

Опыт, навык, здравый смысл, расчет и обсуждение условий – лучшие друзья пост-редактора.

Page 16: PEMT: практические вопросы для переводчиков и редакторов

Удобство работы пост-редактора

Текущий стандарт работы – в CAT, где результат МП = еще одно нечеткое совпадение (fuzzy match)

Вопрос: должен ли результат МП быть нечетким совпадением или подсказкой?

Современные требования к разработчикам по части PEMT:

• формирование отчета, фиксирование времени, запись действий…

Основное известное требование к разработчикам средств PEMT – внедрить кнопку DELETE ALL

• предварительная оценка качества МП – связанная с объемом постредактирования ставка

• предварительная оценка пригодности текста к МП (MT-friendly content)

• самообучение системы в процессе работы и обновление последующих сегментов

Обучение

Page 17: PEMT: практические вопросы для переводчиков и редакторов

Профиль пост-редактора

большинство пост-редакторов МП в настоящее время – штатные сотрудники

пост-редакторами могут становиться только опытные переводчики со склонностью к редактированию, поскольку неопытные и без склонности легко увлекутся возможной гладкостью МП (хотя встречается и точка зрения, что начинающих переводчиков легче обучить постредактированию и убедить в его целесообразности)

постредактирование МП требует непредвзятого отношения, гибкого подхода - и умения видеть в МП еще один профессиональный инструмент для повышения собственной эффективности и конкурентоспособности

пост-редактору МП явно не повредят:

отличные языковые навыки

знание предметной области

опыт работы с системами CAT и средствами автоматической проверки и интерес к технологиям

навык редактирования и умение быстро принимать решения

положительное отношение к МП

склонность к экспериментированию

практика, практика, практика (100 тыс. слов )

Page 18: PEMT: практические вопросы для переводчиков и редакторов

Инструкции по PEMT

Инструкции по PEMT создаются под требования конкретных заказчиков и конкретных проектов, а не “вообще”, это связано с ожиданиями по качеству и уровнем настройки/типом МП (обычно инструкция по PEMT содержит 3 пункта как минимум: ожидания/требования по качеству, разбор типовых ошибок МП, рекомендации)

Таблицы типовых ошибок МП включаются в инструкции для напоминания о возможных проблемах (=доп. проверках)

Поскольку МП-ошибки повторяются, PEMT – это не всего лишь “исправить одно слово и одну запятую”, речь может идти о структурных изменениях на всем пространстве текста (текстов), о чем инструкции напоминают

При PEMT обычно рекомендуется пренебрегать стилем, а не терминологией или правильной передачей смысла, большинство инструкций советует “стараться использовать как можно больше из результата МП”

Пост-редакторы должны следовать и стандартным процедурам (QA и т.д.)

Page 19: PEMT: практические вопросы для переводчиков и редакторов

Инструкции по PEMT – традиционная часть

• Результат перевода должен быть корректным и истинным отображением исходного текста

• Перевод должен соответствовать всем правилам выходного языка• Обязательным условием является последовательное использование

правильной терминологии• Необходимо применение соответствующего документу стиля• Должны использоваться справочные материалы (проектные указания, базы

TM, глоссарии, терминологические базы и т.д.)• Форматы дат и времени, единиц измерения, числовых выражений, валют и пр.

должны быть адаптированы к правилам выходного языка• Должно воспроизводиться форматирование исходного документа• Перевод должен быть читабельным и пригодным для целей его

использования

Page 20: PEMT: практические вопросы для переводчиков и редакторов

Дополнительные или

отсутствующие слова

Отрицание

Составные конструкции или

конструкции с дефисом

Имена собственные

Вопросительные

предложения

Инструкции по PEMT: примеры дополнительных проверок в случае SMT

20

Page 21: PEMT: практические вопросы для переводчиков и редакторов

21

Инструкции по PEMT - рекомендации

Убедитесь, что вся информация передана корректно

Проверьте все числовые выражения

Проверьте корректность терминологии

Вносите необходимые изменения только в том случае, если значение

передано неправильно или искажено

Не меняйте структуру текста, если значение передано верно

Всегда помните, что превалируют конкретные требования заказчика

Page 22: PEMT: практические вопросы для переводчиков и редакторов

Для максимального удовольствия от эксплуатации данной палатки следуйте, пожалуйста, нашим рекомендациям.

Постановка палаткиВыберите максимально ровную поверхность. Очистите её от острых камней и веток.

Правила противопожарной безопасности.• не держите плитки, горелки и лампы близко к материалу палатки• следуйте противопожарной инструкции пришитой внутри палатки

• держите выход свободным от вещей

Пример, просто пример

Page 23: PEMT: практические вопросы для переводчиков и редакторов

Типовые рекомендации пост-редактору

Минимум усилий для максимума результата (как можно меньше коррекции)

И как можно меньше времени

Вносить изменения только тогда, когда это совершенно необходимо

Ничего не добавлять по сравнению с исходником

Ничего не удалять по сравнению с исходником

Page 24: PEMT: практические вопросы для переводчиков и редакторов

И вот еще рекомендации…

24

Пытайтесь использовать результат

МП по максимуму

Не стоит стараться “гениально переписать” все заново – равно как и оставить все как есть

Всегда перечитывайте результат перевода после постредактирования

Находите те фрагменты в результате МП, использование которых может значительно ускорить работу

Правило “2 секунд”

Page 25: PEMT: практические вопросы для переводчиков и редакторов

Раз

• Прочитать исходный текст, затем МП

• Определить пригодные для использования фрагменты

Два

• Откорректировать МП

• Стараться не пытаться все переписать или оставить как есть

• Фокус – на корректности

Три

• Провести дополнительные проверки

• Исправить опечатки

• Проверить терминологию

Этапы постредактирования

25

Page 26: PEMT: практические вопросы для переводчиков и редакторов

Обучение по PEMT: что предлагается в настоящее время

SDL PEMT Certification (бесплатно для пользователей SDL Trados Studio)

TAUS Post-Editing Course с различными языковыми модулями

Page 27: PEMT: практические вопросы для переводчиков и редакторов

Рис. 3 Спасибо за внимание[email protected]