Главная » Статьи » Мои статьи |
Опубликовано в журнале "Филология и литературоведение". 2015. № 2 Как бы ни развивались лингвистические технологии, пока они не выходят на уровень идеального перевода. К этому, собственно, и перестали стремиться. Поэтому будущее (и прогрессивное настоящее) за совместной работой людей и машин. Иван Смольников, генеральный директор ABBYY Language Services Машинный перевод является частью переводческого ландшафта уже в течение достаточно долгого периода времени, и его роль на рынке переводов неуклонно возрастает. Тем не менее, отношение к нему в переводческой среде до сих пор неоднозначно. В этой статье, приняв в качестве отправной точки положение, что в обозримом будущем «человеческий» перевод и машинный перевод «обречены» на сосуществование, мы обсудим практические аспекты эффективного взаимодействия между человеком и машиной. Несколько лет назад вышла статья с красноречивым названием «Стоп, машина!» [1]. Ее автор М.А. Орел ставит под сомнение эффективность машинного перевода (МП), которая, по его словам, определяется формулой «максимум объёма за минимум времени и при минимуме усилий человека»:
Для иллюстрации своего скептического отношения к возможностям МП автор приводит переводы текстовых фрагментов, выполненных различными программами МП, которые, по его мнению, «затуманивают смысл настолько, что понять, «кто кому чего сделал», невозможно» и «их нельзя считать достаточными … для принятия сколько-нибудь важных решений». (Мы еще вернемся к обсуждению этих примеров.) Следует отметить, что, отказывая в перспективности МП («автоматическому», по его терминологии), автор статьи «Стоп, машина!», тем не менее, признает полезность «автоматизированного» перевода, под которым понимает системы переводческой памяти, электронные словари, информационно-справочные средства и т.п. Свое предпочтение он обосновывает следующим «основополагающим принципом», согласно которому «мозговым центром» и «системным интегратором» процесса перевода является человек:
Этот принцип не вызывает никаких возражений. Однако, по нашему мнению, этот принцип в равной степени распространяется и на машинный («автоматический») перевод, поскольку и в процессе МП человек остается «мозговым центром» и «системным интегратором». Таким образом, по сравнению с традиционной практикой перевода взаимодействие человека и машины не отменяется, а только изменяется. Одной из форм такого взаимодействия человека и машины является использование МП в сочетании с постредактированием. Один из ведущих мировых экспертов в области МП и постредактирования Джеффри Аллен определяет постредактирование как «исправление текста, ранее переведенный [машиной], а не перевод «с нуля» [3], а задачу постредактора как «редактирование, изменение и/или исправление ранее переведенного текста, который был обработан системой машинного перевода с исходного языка на целевой язык» [4]. Теоретические и практические аспекты постредактирования рассмотрены в работах и других зарубежных авторов (см., напр., [5], [6], [7]). Методологическое осмысление накопленного опыта в применении этой относительно новой переводческой практики нашло отражение в «Практическом руководстве по постредактированию МП», разработанном Обществом пользователей автоматизации перевода (TAUS, Translation Automaton User Society) [8]. Для повышения качества конечного продукта МП, выражающегося в «снижении объема постредактирования» составители руководства рекомендуют, в частности:
В руководстве различаются два уровня качества: «для публикации» (“publishable quality”) и «достаточно хороший» (“good enough”). Текст уровня качества «для публикации» должен быть понятен («конечный пользователь отлично понимает содержание сообщения»), точен («[сообщение] передает то же самое значение, что и исходный текст»), «стилистически приемлемым, хотя стиль может оказаться не такого высокого уровня, какого может достичь переводчик, переводящий на родной язык», «синтаксис – в норме, грамматика и пунктуация – правильные». Текст «достаточно хорошего» качества должен быть понятен («вы можете понять основное содержание сообщения»), точен («[сообщение] передает то же самое значение, что и исходный текст»), но может не быть «стилистически выразительным». Иными словами, «текст может звучать как созданный компьютером, синтаксис может быть несколько необычным, грамматика – несовершенной, однако сообщение передается точно». [8, с. 6, 8] В [8] для получения качества «для публикации» рекомендуется полное постредактирование, а для «достаточно хорошего» качества – легкое постредактирование. При этом отмечается, что, «если «сырой» MП хорошего качества, то для получения качества «для публикации», возможно, потребуется всего лишь легкое, а не полное, постредактирование». [8, c. 5] Другим часто встречающимся в литературе термином для обозначения переводов «достаточно хорошего» качества является перевод «для информации» (“for-information”) (см., напр., [9], [10, c. 8, 9, 26]). Джеффри Аллен вместо терминологической пары «для информации»/«для публикации» предпочитает пользоваться терминами «внутренний»/«внешний» перевод (inbound/outbound translation) (см., напр., [11, c. 5-11], [12, c. 18]). На русском языке некоторые теоретические аспекты этой практики рассмотрены в работах Ю.И. Чакыровой [13], [14]. В отличие от [8] Чакырова в [14] кладет в основу своей классификации не качество конечного продукта, а виды постредактирования: легкое/быстрое и полное/конвенциальное. Цель легкого/быстрого постредактирования – «точное и законченное сообщение»; «текст редактируется только когда это нужно для понимания»; при этом качество окончательного текста таково, что «его можно понять без обращения к оригиналу». Цель полного/конвенциального постредактирования – «точное и законченное сообщение, не отличающееся от сделанного человеком», а его качество является «подходящим для публикации, соответствующим качеству традиционного перевода». [14, с. 138-139] Несмотря на формально-методологические различия между [8] и [14], сходство в характеристике целей и качества постредактирования МП между ними очевидно. Эффективность применения МП в сочетании с постредактированием становилась предметом анализа в эмпирических исследованиях, выполненных как разработчиками и заказчиками программ МП, так и независимыми исследователями. В компании SDL, одним из продуктов которой является программы МП TRADOS, опираясь на собственные исследования, считают, что применение МП в сочетании с постредактированием ускоряет процесс перевода в среднем на 30% [15, с. 17]. Об увеличении производительности переводчиков говорят и результаты исследования, выполненного Мирко Плиттом и Франсуа Массело из компании Autodesk [16]. По данным этих авторов:
Качество переводов, выполненных с помощью МП и без его помощи, оказалось «средним или хорошим», а количество ошибок (к удивлению авторов исследования) оказалось выше в переводах, выполненных человеком, чем в текстах, полученных после МП и постредактирования. [16, с. 14] Качество конечного продукта фирменной программы МП Переводческого центра Европейской Комиссии оценивается в недавнем отчете о деятельности центра [17]:
Важно отметить, что в данном случае МП с постредактированием сравнивался не непосредственно с переводом, выполненным человеком, а с переводом, выполненным человеком, после редактирования. Развернутый анализ эффективности МП в сочетании с постредактированием предложен руководителем проекта компании PROMT Ириной Малышевой в [18]. Ключевым фактором «для качественного и эффективного редактирования» она считает «степень доверия автору редактируемого текста». На основании этого фактора, Малышева выделяет 5 стратегий МП, характеризующиеся объемом постредактирования, рассчитанным в процентах исходному тексту [18, с. 5-22]:
Легко заметить, что «крайние» стратегии (5 и 1) точно соответствуют типам постредактирования, описанным Ю.И. Чакыровой в [14], а «промежуточные» стратегии (2 – 4) представляют собой степени переработки МП, выполняемой постредактором в пределах всего потенциального диапазона постредактирования. Описания стратегий подкреплены наглядными примерами переводов, выполненных PROMT и профессиональным переводчиком. Рекомендации по применимости МП с постредактированием в зависимости от выбранной стратегии сведены Малышевой в таблицу [18, с. 23], воспроизводимую ниже (Таблица 1): Таблица 1. Стратегии постредактирования по [18] Итак, когда «доверие» к автору минимально, и его текст требует полного постредактирования (100%), применение МП не рекомендуется вообще. Во всех остальных случаях применение МП предусматривает ту или иную степень постредактирования. Оптимальной стратегией работы с МП «с точки зрения как качества перевода, так и скорости работы», по мнению Малышевой, является стратегия 4 (чтение МП и исправление вызывающих сомнения мест с обращением к исходному тексту), а самой быстрой – стратегия 5 (чтение МП и исправление очевидных погрешностей без обращения к исходному тексту). [18, с. 21-23] Поскольку результаты исследований, выполненных разработчиками или владельцами фирменных продуктов МП, могут вызывать вопросы к их объективности, есть смысл дополнить наш анализ результатами исследований, выполненных независимыми экспертами из академической среды или переводческого сообщества. Ребекка Федерер и Шэрон О’Брайен из Дублинского городского университета в своем исследовании [19] задаются вопросом: «каково качество постредактированного продукта по сравнению с качеством перевода, выполненного человеком». Результаты их исследования показали следующее:
Качество постредактирования переводов, выполненных человеком и машиной, сравниваются и в работе Элейн О’Кюрран из локализационной компании Welocalize Inc. [20]. Сравнивая ошибки МП в сочетании с постредактированием и переводов, выполненных профессиональными переводчиками, она обнаружила, что «во всех [рассмотренных ею] языковых парах в переводе, выполненном человеком, оказалось больше ошибок, чем в МП [в сочетании с постредактированием]» [20, с. 117]. Думается, что вывод, сделанный в одной из выше процитированных исследовательских работ об эффективности МП в сочетании с постредактированием, можно принять в качестве обобщенной консервативной оценки современного состояния этой переводческой практики:
Теперь, имея «на руках» теоретические и эмпирические данные о МП и постредактировании, мы можем вернуться к критике эффективности МП в статье М.А. Орла «Стоп, машина!» [1]. В подтверждение своих доводов против машинного («автоматического») перевода, он приводит переводы четырех текстовых фрагментов, выполненных программами МП: PROMT, Google Translate, Systran). Все переводы, приводимые Орлом, – это «сырой» МП. Как мы видели выше, согласно руководству по постредактированию [8], даже минимально приемлемый уровень качества целевого текста после МП предполагает, что этот текст будет понятен и точен. Это означает, что если «сырой» МП не отвечает этим критериям, то требуется выполнить стандартный этап процесса МП – постредактирование. Поскольку о постредактировании в статье «Стоп, машина!» не сказано ни единого слова (любопытно, почему?), предлагаем проанализировать приводимые им примеры с учетом этого этапа и посмотреть, придем ли мы к тем же выводам об эффективности МП, что и автор статьи. Из-за ограничений места мы рассмотрим МП, выполненный только одной программой, Google Translate, и применим только один вид постредактирования, легкое/быстрое постредактирование. Результаты нашего эксперимента приведены в Таблице 2. Таблица 2. Постредактирование МП примеров из [1]. Из четырех фрагментов наименее качественным оказался «сырой» МП фрагмента 1. Тем не менее, усилия по доведению его до уровня, обеспечивающего понимание и точность, можно считать оправданными, поскольку в окончательном переводе использовано немало блоков «сырого» МП. С другой стороны, очевидно, что доведение «сырого» МП этого фрагмента до уровня «для публикации» потребует слишком большого объема постредактирования. Поэтому для получения качества «для публикации», опираясь на рекомендацию PROMT для случаев, требующих «полного редактирования», следует признать, что для данного фрагмента перевод «вручную» будет предпочтительнее. Для обеспечения понятности и точности фрагмента 2 объем постредактирования его МП оказался минимальным, как и для фрагмента 4. Больше того, уровень качества МП и постредактирования последнего соответствует уровню «для публикации». МП фрагмента 3 имеет уровень «для публикации» вообще без постредактирования: очевидно, с 2010 по 2015 год Google Translate усовершенствовал свою технологию достаточно для решения этой частной переводческой задачи. В свете вышеизложенного, можно утверждать, что уже сегодня машинный перевод в сочетании с постредактированием является достаточно эффективной переводческой практикой с учетом рекомендаций и стратегий, разработанных специалистами в этой области. Не вызывает сомнения и то, что благодаря постоянному прогрессу в области компьютерных технологий и растущему осознанию и освоению практикующими переводчиками своей новой роли в быстро меняющемся мире перевода эффективность такого взаимодействия человека и машины будет только увеличиваться.
| |
Просмотров: 643 | | |
Всего комментариев: 0 | |