К эффективному взаимодействию между человеком и машиной в практике перевода - Мои статьи - Мои статьи

Меню сайта

Форма входа

Категории раздела

Мои статьи [35]

Друзья сайта

Статистика

Онлайн всего: 1

Гостей: 1

Пользователей: 0

Главная » Статьи » Мои статьи

К эффективному взаимодействию между человеком и машиной в практике перевода

Опубликовано в журнале "Филология и литературоведение". 2015. № 2

Как бы ни развивались лингвистические технологии, пока они не выходят на уровень идеального перевода. К этому, собственно, и перестали стремиться. Поэтому будущее (и прогрессивное настоящее) за совместной работой людей и машин.

Иван Смольников, генеральный директор ABBYY Language Services

Машинный перевод является частью переводческого ландшафта уже в течение достаточно долгого периода времени, и его роль на рынке переводов неуклонно возрастает. Тем не менее, отношение к нему в переводческой среде до сих пор неоднозначно. В этой статье, приняв в качестве отправной точки положение, что в обозримом будущем «человеческий» перевод и машинный перевод «обречены» на сосуществование, мы обсудим практические аспекты эффективного взаимодействия между человеком и машиной.

Несколько лет назад вышла статья с красноречивым названием «Стоп, машина!» [1]. Ее автор М.А. Орел ставит под сомнение эффективность машинного перевода (МП), которая, по его словам, определяется формулой «максимум объёма за минимум времени и при минимуме усилий человека»:

Но какого качества этот объём? Позволяют ли эти быстрые переводы принимать реальные управленческие решения? Действительно ли они эффективны, то есть позволяют ли при этой сверхвысокой скорости достичь желаемого результата? Ведь если дела обстоят, как в анекдоте про секретаршу, которая печатает 1500 знаков в минуту, «правда, потом такая ерунда получается, что ничего понять невозможно», то это уже не эффективность. [1]

Для иллюстрации своего скептического отношения к возможностям МП автор приводит переводы текстовых фрагментов, выполненных различными программами МП, которые, по его мнению, «затуманивают смысл настолько, что понять, «кто кому чего сделал», невозможно» и «их нельзя считать достаточными … для принятия сколько-нибудь важных решений». (Мы еще вернемся к обсуждению этих примеров.)

Следует отметить, что, отказывая в перспективности МП («автоматическому», по его терминологии), автор статьи «Стоп, машина!», тем не менее, признает полезность «автоматизированного» перевода, под которым понимает системы переводческой памяти, электронные словари, информационно-справочные средства и т.п. Свое предпочтение он обосновывает следующим «основополагающим принципом», согласно которому «мозговым центром» и «системным интегратором» процесса перевода является человек:

Машина лишь оптимизирует процесс перевода, а все переводческие решения принимает только человек. [2]

Этот принцип не вызывает никаких возражений. Однако, по нашему мнению, этот принцип в равной степени распространяется и на машинный («автоматический») перевод, поскольку и в процессе МП человек остается «мозговым центром» и «системным интегратором». Таким образом, по сравнению с традиционной практикой перевода взаимодействие человека и машины не отменяется, а только изменяется.

Одной из форм такого взаимодействия человека и машины является использование МП в сочетании с постредактированием. Один из ведущих мировых экспертов в области МП и постредактирования Джеффри Аллен определяет постредактирование как «исправление текста, ранее переведенный [машиной], а не перевод «с нуля» [3], а задачу постредактора как «редактирование, изменение и/или исправление ранее переведенного текста, который был обработан системой машинного перевода с исходного языка на целевой язык» [4]. Теоретические и практические аспекты постредактирования рассмотрены в работах и других зарубежных авторов (см., напр., [5], [6], [7]).

Методологическое осмысление накопленного опыта в применении этой относительно новой переводческой практики нашло отражение в «Практическом руководстве по постредактированию МП», разработанном Обществом пользователей автоматизации перевода (TAUS, Translation Automaton User Society) [8].

Для повышения качества конечного продукта МП, выражающегося в «снижении объема постредактирования» составители руководства рекомендуют, в частности:

Проверить качество «сырого» МП до обсуждения производительности и цены и установить разумные ожидания.

Согласовать определение конечного качества информации, которая должна постредактироваться, в зависимости от типа пользователя и уровней приемлемости. [8, c. 3]

В руководстве различаются два уровня качества: «для публикации» (“publishable quality”) и «достаточно хороший» (“good enough”). Текст уровня качества «для публикации» должен быть понятен («конечный пользователь отлично понимает содержание сообщения»), точен («[сообщение] передает то же самое значение, что и исходный текст»), «стилистически приемлемым, хотя стиль может оказаться не такого высокого уровня, какого может достичь переводчик, переводящий на родной язык», «синтаксис – в норме, грамматика и пунктуация – правильные». Текст «достаточно хорошего» качества должен быть понятен («вы можете понять основное содержание сообщения»), точен («[сообщение] передает то же самое значение, что и исходный текст»), но может не быть «стилистически выразительным». Иными словами, «текст может звучать как созданный компьютером, синтаксис может быть несколько необычным, грамматика – несовершенной, однако сообщение передается точно». [8, с. 6, 8]

В [8] для получения качества «для публикации» рекомендуется полное постредактирование, а для «достаточно хорошего» качества – легкое постредактирование. При этом отмечается, что, «если «сырой» MП хорошего качества, то для получения качества «для публикации», возможно, потребуется всего лишь легкое, а не полное, постредактирование». [8, c. 5]

Другим часто встречающимся в литературе термином для обозначения переводов «достаточно хорошего» качества является перевод «для информации» (“for-information”) (см., напр., [9], [10, c. 8, 9, 26]). Джеффри Аллен вместо терминологической пары «для информации»/«для публикации» предпочитает пользоваться терминами «внутренний»/«внешний» перевод (inbound/outbound translation) (см., напр., [11, c. 5-11], [12, c. 18]).

На русском языке некоторые теоретические аспекты этой практики рассмотрены в работах Ю.И. Чакыровой [13], [14]. В отличие от [8] Чакырова в [14] кладет в основу своей классификации не качество конечного продукта, а виды постредактирования: легкое/быстрое и полное/конвенциальное. Цель легкого/быстрого постредактирования – «точное и законченное сообщение»; «текст редактируется только когда это нужно для понимания»; при этом качество окончательного текста таково, что «его можно понять без обращения к оригиналу». Цель полного/конвенциального постредактирования – «точное и законченное сообщение, не отличающееся от сделанного человеком», а его качество является «подходящим для публикации, соответствующим качеству традиционного перевода». [14, с. 138-139]

Несмотря на формально-методологические различия между [8] и [14], сходство в характеристике целей и качества постредактирования МП между ними очевидно.

Эффективность применения МП в сочетании с постредактированием становилась предметом анализа в эмпирических исследованиях, выполненных как разработчиками и заказчиками программ МП, так и независимыми исследователями.

В компании SDL, одним из продуктов которой является программы МП TRADOS, опираясь на собственные исследования, считают, что применение МП в сочетании с постредактированием ускоряет процесс перевода в среднем на 30% [15, с. 17].

Об увеличении производительности переводчиков говорят и результаты исследования, выполненного Мирко Плиттом и Франсуа Массело из компании Autodesk [16]. По данным этих авторов:

МП ускорил работу всех переводчиков, хотя и в различных пропорциях: от 20 до 131%. MП улучшил производительность переводчиков в среднем на 74%; другими словами, МП сэкономил 43% времени перевода. [16, c. 10]

Качество переводов, выполненных с помощью МП и без его помощи, оказалось «средним или хорошим», а количество ошибок (к удивлению авторов исследования) оказалось выше в переводах, выполненных человеком, чем в текстах, полученных после МП и постредактирования. [16, с. 14]

Качество конечного продукта фирменной программы МП Переводческого центра Европейской Комиссии оценивается в недавнем отчете о деятельности центра [17]:

Качество оказалось неудовлетворительным, за несколькими исключениями (напр., для одного из исходных текстов в тесте результат МП оказался «относительно приемлемым», хотя и потребовал значительного постредактирования, для [перевода на] греческий, португальский, словенский, датский и болгарский). Для остальных текстов МП был признан не столь полезным переводчиками, которые потратили намного больше времени на постредактирование переводов, выполненных машиной, чем если бы они редактировали переводы тех же самых документов, выполненные внештатными переводчиками [17, с. 18].

Важно отметить, что в данном случае МП с постредактированием сравнивался не непосредственно с переводом, выполненным человеком, а с переводом, выполненным человеком, после редактирования.

Развернутый анализ эффективности МП в сочетании с постредактированием предложен руководителем проекта компании PROMT Ириной Малышевой в [18]. Ключевым фактором «для качественного и эффективного редактирования» она считает «степень доверия автору редактируемого текста». На основании этого фактора, Малышева выделяет 5 стратегий МП, характеризующиеся объемом постредактирования, рассчитанным в процентах исходному тексту [18, с. 5-22]:

Полное редактирование с проверкой каждого компонента текста по исходному фрагменту;
Использование МП исключительно в качестве подсказки по терминологии;
Использование МП в качестве грамматического подстрочника с подбором синонимичных выражений;
Чтение МП и исправление вызывающих сомнения мест с обращением к исходному тексту;
Чтение МП и исправление очевидных погрешностей без обращения к исходному тексту.

Легко заметить, что «крайние» стратегии (5 и 1) точно соответствуют типам постредактирования, описанным Ю.И. Чакыровой в [14], а «промежуточные» стратегии (2 – 4) представляют собой степени переработки МП, выполняемой постредактором в пределах всего потенциального диапазона постредактирования. Описания стратегий подкреплены наглядными примерами переводов, выполненных PROMT и профессиональным переводчиком.

Рекомендации по применимости МП с постредактированием в зависимости от выбранной стратегии сведены Малышевой в таблицу [18, с. 23], воспроизводимую ниже (Таблица 1):

Таблица 1. Стратегии постредактирования по [18]

Итак, когда «доверие» к автору минимально, и его текст требует полного постредактирования (100%), применение МП не рекомендуется вообще. Во всех остальных случаях применение МП предусматривает ту или иную степень постредактирования. Оптимальной стратегией работы с МП «с точки зрения как качества перевода, так и скорости работы», по мнению Малышевой, является стратегия 4 (чтение МП и исправление вызывающих сомнения мест с обращением к исходному тексту), а самой быстрой – стратегия 5 (чтение МП и исправление очевидных погрешностей без обращения к исходному тексту). [18, с. 21-23]

Поскольку результаты исследований, выполненных разработчиками или владельцами фирменных продуктов МП, могут вызывать вопросы к их объективности, есть смысл дополнить наш анализ результатами исследований, выполненных независимыми экспертами из академической среды или переводческого сообщества.

Ребекка Федерер и Шэрон О’Брайен из Дублинского городского университета в своем исследовании [19] задаются вопросом: «каково качество постредактированного продукта по сравнению с качеством перевода, выполненного человеком». Результаты их исследования показали следующее:

…если качество определяется по таким характеристикам, как ясность и точность, то … качество постредактирования равно, если не выше качества перевода, выполненного человеком. Однако если характеристикой качества считать стиль, тогда перевод, выполненный человеком предпочтительнее постредактированного продукта. [19, с. 68-69]

Качество постредактирования переводов, выполненных человеком и машиной, сравниваются и в работе Элейн О’Кюрран из локализационной компании Welocalize Inc. [20]. Сравнивая ошибки МП в сочетании с постредактированием и переводов, выполненных профессиональными переводчиками, она обнаружила, что «во всех [рассмотренных ею] языковых парах в переводе, выполненном человеком, оказалось больше ошибок, чем в МП [в сочетании с постредактированием]» [20, с. 117].

Думается, что вывод, сделанный в одной из выше процитированных исследовательских работ об эффективности МП в сочетании с постредактированием, можно принять в качестве обобщенной консервативной оценки современного состояния этой переводческой практики:

[М]ашинный перевод плюс постредактирование не обязательно производят продукт неудовлетворительного качества. [19, с. 69]

Теперь, имея «на руках» теоретические и эмпирические данные о МП и постредактировании, мы можем вернуться к критике эффективности МП в статье М.А. Орла «Стоп, машина!» [1]. В подтверждение своих доводов против машинного («автоматического») перевода, он приводит переводы четырех текстовых фрагментов, выполненных программами МП: PROMT, Google Translate, Systran). Все переводы, приводимые Орлом, – это «сырой» МП. Как мы видели выше, согласно руководству по постредактированию [8], даже минимально приемлемый уровень качества целевого текста после МП предполагает, что этот текст будет понятен и точен. Это означает, что если «сырой» МП не отвечает этим критериям, то требуется выполнить стандартный этап процесса МП – постредактирование. Поскольку о постредактировании в статье «Стоп, машина!» не сказано ни единого слова (любопытно, почему?), предлагаем проанализировать приводимые им примеры с учетом этого этапа и посмотреть, придем ли мы к тем же выводам об эффективности МП, что и автор статьи. Из-за ограничений места мы рассмотрим МП, выполненный только одной программой, Google Translate, и применим только один вид постредактирования, легкое/быстрое постредактирование. Результаты нашего эксперимента приведены в Таблице 2.

Таблица 2. Постредактирование МП примеров из [1].

Из четырех фрагментов наименее качественным оказался «сырой» МП фрагмента 1. Тем не менее, усилия по доведению его до уровня, обеспечивающего понимание и точность, можно считать оправданными, поскольку в окончательном переводе использовано немало блоков «сырого» МП. С другой стороны, очевидно, что доведение «сырого» МП этого фрагмента до уровня «для публикации» потребует слишком большого объема постредактирования. Поэтому для получения качества «для публикации», опираясь на рекомендацию PROMT для случаев, требующих «полного редактирования», следует признать, что для данного фрагмента перевод «вручную» будет предпочтительнее.

Для обеспечения понятности и точности фрагмента 2 объем постредактирования его МП оказался минимальным, как и для фрагмента 4. Больше того, уровень качества МП и постредактирования последнего соответствует уровню «для публикации».

МП фрагмента 3 имеет уровень «для публикации» вообще без постредактирования: очевидно, с 2010 по 2015 год Google Translate усовершенствовал свою технологию достаточно для решения этой частной переводческой задачи.

В свете вышеизложенного, можно утверждать, что уже сегодня машинный перевод в сочетании с постредактированием является достаточно эффективной переводческой практикой с учетом рекомендаций и стратегий, разработанных специалистами в этой области. Не вызывает сомнения и то, что благодаря постоянному прогрессу в области компьютерных технологий и растущему осознанию и освоению практикующими переводчиками своей новой роли в быстро меняющемся мире перевода эффективность такого взаимодействия человека и машины будет только увеличиваться.

Орел М.А. Стоп, машина! // Мосты. 2009. № 4. С. 50-59 [электронный ресурс]. URL: http://yermolovich.ru/index/0-71 (дата обращения: 01.02.2015).
Орел М.А. Стоп, машина! // Мосты. 2009. № 4. С. 50-59 [электронный ресурс]. URL: http://ermolovich-di.ucoz.ru/index/0-72 (дата обращения: 01.02.2015).
Allen J. What is MT Postediting? // Oocities.org []. URLhttp://www.oocities.org/mtpostediting/
Allen J. Post-editing // Computers and Translation: A Translators Guide. Amsterdam, John Benjamins, 2003. Цит. по: Allen J. What is MT Postediting? // Oocities.org [электронный ресурс]. URL: http://www.oocities.org/mtpostediting/ (дата обращения: 01.02.2015).
Martínez L.G. Human Translation versus Machine Translation and Full Post-Editing of Raw Machine Translation Output (Dissertation). Dublin, Dublin City University, 2003. 135 p.
O’Brien S. Introduction to Post-Editing: Who, What, How and Where To Next? // The Ninth Conference of the Association for Machine Translation in the Americas AMTA 2010, Denver, CO, USA (31.10-04.11.2010) [электронный ресурс]. URL: http://amta2010.amtaweb.org/AMTA/papers/6-01-ObrienPostEdit.pdf (дата обращения: 01.02.2015).
Temizöz Ö. Postediting Machine Translation Output and Its Revision: Subject-Matter Expert Experts Versus Professional Translators (Doctoral Thesis) // Tarragona, Universitat Rovira I Virgili. 2013. xii, 275 p.
TAUS Best Practices MT Post-Editing Guidelines, 2010. 10 p. // Slideshare [электронный ресурс]. URL: http://www.slideshare.net/TAUS/taus-mt-postediting-guidelines (дата обращения: 01.02.2015).
European Commission (EC) Post-edition repide (PER). Цит. по: Allen J. Inbound versus Outbound Translation // Panel “Localization in customer support”. The Localization World Conference, Bonn, Germany, (29.06-01.07.2004) [электронный ресурс]. URL: http://www.geocities.com/mtpostediting/LWBonn2004-A05JeffAllen.pdf (дата обращения: 01.02.2015).
Durban C. Translation: Getting It Right. A Guide to Buying Translations. Alexandria, VA, American Translators Association, 2011. 28 p.
Allen J. Inbound versus Outbound Translation // Panel “Localization in customer support”. The Localization World Conference, Bonn, Germany, (29.06-01.07.2004) []. URL: http://www.geocities.com/mtpostediting/LWBonn2004-A05JeffAllen.pdf (дата обращения: 01.02.2015).
Allen J. How are we responding to industrial and business needs for Controlled Language and Machine Translation // Journées Linguistiques. Langues contrôlées; traduction automatique et langues spécialisées, Besançon, France (5-6.05.2004). 24 p. [электронный ресурс]. URL: http://www.geocities.com/jeffallenpubs/besanconmay2004.htm (дата обращения: 01.02.2015).
Чакырова Ю.И. Постредактирование – благодать или проклятие? // Индустрия перевода: материалы V Международной научной конференции. Пермь, 2013. С. 134-142.
Чакырова Ю.И. Постредактирование в транслатологической парадигме // Вестник ПНИПУ (Пермский национальный исследовательский политехнический университет). Проблемы языкознания и педагогики. 2013 № 8. С. 137-144.
Светова С. Профессиональные переводчики и МП: выбор стратегии. Постредактирование МП. 20 с. // Международная переводческая конференция Translation Forum Russia 2014 (Екатеринбург, 26-28.09.2014) [электронный ресурс]. URL: http://tconference.ru/ (дата обращения: 01.02.2015).
11.Plitt M. and Masselot F. A Productivity Test of Statistical Machine Translation Post-Editing in a Typical Localisation Context // The Prague Bulletin of Mathematical Linguistics. 2010. № 93. P. 7-16.
CT/CA-002/2014EN. Activity Report of the Translation Centre 2013. Luxembourg, Translation Center for the Bodies of the European Union, 2014. 65 p. [электронный ресурс]. URL: http://www.europarl.europa.eu/document/activities/cont/201407/20140710ATT86771/20140710ATT86771EN.pdf (дата обращения: 01.02.2015).
Малышева И. PROMT: Постредактирование машинного перевода. 31 с. // Международная переводческая конференция Translation Forum Russia 2011 (Санкт-Петербург, 23-25.09.2011) [электронный ресурс]. URL: www.promt.ru/images/postediting.ppt (дата обращения: 01.02.2015).
Fiederer R. and O’Brien S. Quality and Machine Translation: A realistic objective? // The Journal of Specialised Translation. 2009. P. 52-74.
O’Curran E. Translation Quality in Post-Edited versus Human-Translated Segments: A Case Study // Proceedings of the Third Workshop on Post-Editing Technology and Practice. The 11th Conference of the Association for Machine Translation in the Americas. Vancouver, BC, Canada, 2014. P. 113-118.

Категория: Мои статьи | Добавил: Anstan (06.04.2015)

Просмотров: 643 | Теги: постредактирование, machine translation, Translation, машинный перевод, post-editing, перевод | Рейтинг: 0.0/0

Всего комментариев: 0


Имя *:
Email *:

Код *: