Подъем машинного перевода. Бюро переводов в Челябинске
+7 (351) 750-10-38
Заказать обратный звонок

Заказ обратного звонка

x





Подъем машинного перевода

Те, кто приблизительно знаком с машинным переводом (далее — «МП»), скорее всего, отреагировали следующим образом. «Отлично!», — подумали те,  кто периодически пользуется широко известной бесплатной Google Translate, получая перевод через доли секунды. «Погодите…», – появилось в голове остальных, которые еще и знают при этом оба языка. Google Translate, как и остальные системы МП, делает ошибки — от едва заметных до уморительных.

Подъем машинного перевода

Интернет наводнен всевозможными примерами плохого перевода с китайского на английский. Носители английского, не владеющие китайским, даже не подозревают порой, насколько смешные ошибки выдает программа при обратном переводе. В 2011 году протестующие в рамках акции «Захвати Уолл-стрит» прогнали через компьютерный переводчик призыв No more corruption (Скажем коррупции «нет») и в результате получили китайскую фразу, означавшую There is no corruption(Коррупции нет)

Машинный перевод — штука сложная. Он на десятилетия захватил умы многих ученых. Более старые модели разбивали грамматические структуры и раскладывали на части смысл исходного текста, а затем восстанавливали их на языке перевода. Однако это был настолько запутанный механизм, что сейчас не приходится удивляться неразрешимым проблемам, вызванным данным подходом. Теперь применяется система «больших данных», то есть программы МП в основном статистические. Если внести в переводческую модель таких программ большое количество высококачественных переводов, сделанных человеком, поместив материал на языках оригинала и перевода, то программа проведет аналогию, что Х в языке А нужно переводить как Y в языке В, а также как часто и в каких контекстах Х лучше переводить как Z. Чем больше данных вводится в программу, тем больше расширяется ее статистическое «понимание». Поэтому Google стал точнее остальных программ МП.

Машина отлично справляется с переводом отдельных слов, то есть когда работает как онлайн-словарь. Также хорошо переводит устойчивые выражения, поскольку эти сочетания слов переводились уже огромное количество раз, поэтому их эквиваленты найти не так сложно. Кроме того, неплохой результат выдается на простые предложения с незамысловатой структурой. Тем не менее, зачастую при вводе полных предложений можно заметить некую неуклюжесть перевода. А целые тексты вообще выглядят бессвязно. 

Программы МП «не переваривают» материал, который не преподала им обучающая модель. То есть они просто не знают, что делать с такими текстами. Один байкер сделал татуировку на торсе. Фраза Ride Hard Die Free («Езди жестко, умри легко») была нанесена большими китайскими символами. Единственная загвоздка была в том, что слово die было переведено в значении «чекан»… Почему? Очевидно, фразы die free не было в обучающих программу текстах. Кстати, free было оформлено в значении «бесплатный». Возможно, в базе ориентировочных текстов системы-переводчика были материалы по промышленности и коммерции. Во всяком случае, это объясняет, почему был выбран гораздо менее распространенный вариант «чеканка» вместо глагола в значении «отбросить коньки».

Дело в том, что качество программ МП быстро улучшается посредством специального обучения для использования в конкретной области. Например, для промышленной компании нужен технический перевод, поэтому здесь подойдет вариант «чекан», а для фирмы по изготовлению игр die — это «игральный кубик». Ограничение сферы применения резко увеличивает точность перевода. Зато в случае перевода текстов, например, публицистических, «натренированные» таким образом программы почти бесполезны. Однако возможность успешного применения системы в рамках ограниченной сферы позволяет посмотреть на проблему более оптимистично, ведь в таком случае программу можно довольно быстро нацелить на множество отдельных областей с учетом определенной языковой пары. Конечно, если удастся подобрать достаточное количество нужных текстов.


К списку статей

Смотреть другие услуги