Сравнение он-лайн переводчиков на примере перевода англоязычных юмористических текстов (на примере пяти популярных переводчиков)

Рассмотрение и анализ популярных в Интернете он-лайн переводчиков, сравнение их возможностей и функций. Технологии, на которых работают он-лайн транслейторы. Сравнительная характеристика перевода английских шуточных текстов с помощью он-лайн словарей.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 06.06.2012
Размер файла 452,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное агентство по образованию

Государственное образовательное учреждение

Ульяновский государственный университет

Институт международных отношений

Факультет иностранных языков и профессиональной коммуникации

Кафедра лингвострановедения и коммуникации

Курсовая работа

Сравнение он-лайн переводчиков на примере перевода англоязычных юмористических текстов

(на примере пяти популярных переводчиков)

Выполнила:

студентка 4 курса

группы 45 атпл

Старчук Анастасия Валерьевна

Проверила:

Доцент кафедры АЯГС

Крашенинникова Наталья Александровна

Ульяновск 2011 г.

Оглавление:

интернет переводчик шуточный текст

Введение

Глава I. Информация об исследуемых он-лайн переводчиках

1.1 Технологии, на которых работают он-лайн транслейторы

1.2 Чем различаются веб-сервисы перевода

1.3 PROMT

1.4 Google Translate

1.5 Microsoft Translator

1.6 Babel Fish Translation

1.7 Worldlingo Multilingual Translator

Глава II. Сравнение перевода, полученного в исследуемых он-лайн переводчиках

2.1 Примеры

2.2 Результаты исследования

Вывод

Источники

Список источников примеров

Приложение

Введение

Тема сравнения он-лайн переводчиков на примере перевода англоязычных юмористических текстов актуальна, так как в настоящее время является малоизученной и требует дальнейшего специального рассмотрения. В основном материал, изложенный в общедоступной литературе, носит общий характер.

Актуальность выбора предмета настоящего исследования определяется также важной ролью, отводимой он-лайн переводчикам, так как это незаменимый инструмент обучения, бизнеса и исследований в современном мире. Объектом исследования являются он-лайн переводчики.

Предметом курсовой работы является анализ результатов перевода с помощью он-лайн переводчиков.

Практическая ценность работы состоит в том, что полученные в ходе теоретического и экспериментального исследования результаты могут быть рекомендованы людям, которые ценят время, затраченное на работу с переводами и продуктивность работы. Результаты исследования могут быть использованы всеми, как школьниками и студентами, так и разработчиками сайтов и бизнесменами, а так же профессиональными переводчиками.

Цель курсовой работы - рассмотреть и проанализировать популярные в интернете он-лайн переводчики.

В соответствии с поставленной целью были определены следующие исследовательские задачи:

· провести теоретический анализ специальной литературы по проблемам, составляющим концептуальную базу исследования;

· проанализировать результаты перевода с помощью исследуемых он-лайн переводчиков.

В исследовании были использованы следующие методы: общий теоретический метод анализа специальной литературы по рассматриваемой теме, метод смыслового анализа экспериментального и теоретического материала.

Работа состоит из Введения, Основной части (Главы 1, Главы 2), Примеров, Результатов исследования, Вывода, Источников, Списка источников примеров и Приложения.

Во Введении сформулированы основные положения курсовой, определены её объект, предмет, основная цель и задачи, обоснована актуальность, отмечена практическая ценность работы, а также обозначены используемые в ходе работы методы.

В первой главе анализируется информация об исследуемых интернет транслейторах, сравниваются их возможности и функции.

Вторая глава, посвящена экспериментальному исследованию полученных переводов.

В Выводе представлены основные заключения по проведенному исследованию.Глава I

Информация об исследуемых он-лайн переводчиках

Пользователь довольно часто сталкивается с тем, что ему нужно оперативно перевести на родной язык (или с родного на иностранный) ту или иную фразу или небольшой фрагмент текста. Чаще всего это нужно при составлении писем, заявлений, при чтении инструкций, руководств, новостей и другой информации. Несомненно, иностранный язык многие из нас изучали в школе или в институте, поэтому при достаточном объеме времени справиться с задачей будет несложно. Однако при работе в Интернете несколько минут практически всегда имеют значение.

Очевидно, что такой перевод должен происходить быстрее, чем с бумажным словарем. Для этого существуют специальные приложения и сервисы -- программы-переводчики для настольных компьютеров и мобильных устройств, а также веб-сервисы перевода. Давайте попробуем разобраться, какое из решений лучше подходит в конкретной ситуации.

Важно понимать отличие программ для перевода текстов от обычных электронных словарей. Последние представляют собой оболочку, которая предоставляет пользователю интерфейс для доступа к словарной базе данных. Обычно в таких продуктах можно получить в той или иной степени подробное значение слова или словосочетания, а также увидеть примеры словоупотребления. Конечно, для «тонкого» перевода человеку, знающему принципы грамматики иностранного языка, имеющего приличный лексикон, такой программы будет более чем достаточно, поэтому они и прибегают к ним лишь в случаях крайней необходимости или при работе со специфическими текстами. Обычному же пользователю электронный словарь сэкономит разве что 10-15% времени, которое бы уходило на пролистывание обычного бумажного издания. Программы-переводчики же рассчитаны на работу не просто со словами и словосочетаниями, а с тем, как они употребляются в контексте, и позволяют получать сразу полный вариант текста на родном или иностранном языке. Для этого используются специальные алгоритмы, связывающие переведенные фрагменты в структуре предложений в соответствии с правилами грамматики и т. д. Понятно, что результат работы такого приложения может отличаться от привычного текста (например, если в нем используются аббревиатуры, литературные приемы, жаргон и другие сложные для перевода конструкции).

Однако это нормально: для обычного пользователя электронный переводчик обычно играет роль приложения для «схватывания» общей информации -- о чем говорится в тексте или для базового перевода на иностранный язык. Грамотный и образованный человек, прочитавший такой перевод, все домыслит самостоятельно и исправит стилистические ошибки. Кроме того, программа переводчик подойдет для перевода текста, написанного на незнакомом языке, -- ради однократной процедуры никто не будет с «нуля» учить иностранный язык или прибегать к помощи специалистов.

«Переводчик может быть реализован как в виде приложения, так и в виде веб-сервиса. В первом случае он напоминает текстовый редактор, к которому подключены специальные инструменты, отвечающие за настройку перевода (направление, фиксированный перевод известных слов и оставление непереведенными определенных выражений и т. д.) с базами данных по каждому языку. Такая программа может интегрироваться с другими приложениями на компьютере, например, с редакторами из Microsoft Office, онлайн-мессенджерами, веббраузерами, что позволяет получать перевод непосредственно в этих приложениях без необходимости копирования фрагмента текста в переводчик, причем с сохранением форматирования и структуры текста. Переводчик в виде веб сервиса задействует ресурсы приложения, установленного на удаленном сервере. Здесь от пользователя требуется только веб-браузер или клиент для работы с сервисом (второе чаще нужно на мобильном устройстве), а также доступ в Сеть. Вы можете скопировать или ввести текст для перевода в переводчик или же перевести нужный контент через расширения браузера -- например, панели перевода (Mozilla Firefox), плагины (Google Chrome) или «ускорители» (Internet Explorer 8). Преимущество программ-переводчиков в том, что сама процедура перевода осуществляется локально на компьютере, без интернет-подключения. Кроме того, пользователю предоставляются значительно более подробные настройки автоматического перевода, чем в веб-сервисе (в последнем обычно можно только переключить направление и тематику), и их сохранение для различных проектов. Веб сервис выигрывает за счет готовности итогового перевода, интеграции с основным источникоминформации (браузером), а также бесплатной моделью использования (в то время как все настольные системы перевода платные)»

(источник: http://howeng.ru/kakoj-anglo-russkij-perevodchik-luchshe)

1.1 Технологии, на которых работают он-лайн транслейторы

Каким же образом программе удается связно переводить текст с одного языка на другой? Какие технологии машинного перевода (МП, machine translation) разрабатываются сегодня? Что ждет машинный перевод в ближайшем будущем?

Есть две конкурирующих технологии машинного перевода: традиционная (rule-based machine translation) -- основанная на правилах и статистическая (statistical-based machine translation). Обе технологии имеют свои плюсы и минусы, приверженцев и противников, и сегодня в Интернете часто обсуждается вопрос, какая из них позволяет получить наиболее качественный результат. Особенно активно противопоставляются друг другу технологии rule-based и statistical-based после запуска бесплатного сервиса онлайн-перевода Google (основанного на статистическом методе) [В сервисе Google на базе статистической технологии работают только те направления перевода, которые помечены как BETA-версии]. Попытаемся выяснить, какая же из этих технологий лучше.

Перевод по правилам Rule-based machine translation -- это метод, используемый большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.), его еще называют традиционным методом машинного перевода. Технология основана на применении правил (алгоритмов), когда программа анализирует текст и на основе проведенного анализа синтезирует вариант перевода. Работа такой системы сходна с процессом мышления человека: система анализирует текст, используя множество алгоритмов.

Представителем систем, которые основаны на традиционной технологии перевода, являются программы-переводчики PROMT, разрабатываемые специалистами одноименной российской компании. Процесс перевода, выполняемый системами PROMT, можно условно разделить на несколько этапов.

Морфологический анализ слов.

Приступив к переводу текста, программа в первую очередь анализирует слова в каждом предложении с точки зрения морфологии, то есть указывает род, число, лицо и другие морфологические характеристики. На данном этапе программа не решает вопрос грамматической многозначности, а только фиксирует эту информацию. Например, если слово может принадлежать к разным частям речи: английское слово blow может употребляться как глагол (дуть, веять) или как существительное (порыв ветра, дуновение), то система определит, что blow -- это форма настоящего времени, 1 или 2 лица единственного или множественного числа, либо 3 лица множественного числа, а также форма инфинитива.

Анализ и синтез групп.

После морфологического анализа система выполняет следующие действия:

решает вопрос грамматической многозначности (определяет значения слов, которые могут относиться к разным частям речи) -- там, где это можно определить на контекстном уровне; объединяет отдельные слова в группы (именные, глагольные и др.).

Примеры именных групп:

a woman (женщина): неопределенный артикль единственного числа и существительное в единственном числе;

many nice letters (много хороших писем) -- количественное слово many для определения множественного числа, прилагательное nice и существительное

множественного числа letters.

Глагольные группы:

have taken (взял, взяли) -- вспомогательный глагол have + причастие прошедшего времени taken.

Синтаксический анализ предложений.

Следующий этап работы системы -- определение членов предложения и их места в предложении, границ простых предложений и их связей друг с другом в сложных предложениях. Сначала программа ищет сказуемое, затем перед сказуемым -- подлежащее (предполагается, что в предложении прямой порядок слов). Если же перед сказуемым подлежащего нет, то система ищет его за сказуемым, или считается, что подлежащее отсутствует (например в безличных предложениях («Принесли торт») или императиве («Отдай мне книгу»)).

Синтез предложений.

Это заключительный этап работы системы, когда происходит согласование элементов внутри групп, сказуемого и зависимых от него слов (подлежащего, прямого и/или косвенного дополнения), уточняется порядок слов в предложении. В процессе работы программа использует множество алгоритмов, которые помогают составить вариант перевода с учетом грамматических и других особенностей того или иного языка.

В результате, даже обнаружив шероховатости и недочеты в тексте перевода (что, к сожалению, случается), в абсолютном большинстве случаев пользователь поймет смысл текста, переведенного с помощью технологии rule-based (табл. 1). В зависимости от качества исходного текста «на выходе» получится «черновой» вариант перевода, который позволяет быстро понять, о чем идет речь в исходном тексте. Ведь, как известно, сегодня пользователю зачастую не требуется идеальный перевод иноязычного документа, веб-страницы или электронного письма, а достаточно «чернового» варианта, чтобы принять решение или просто получить полезные сведения.

Статистика -- наука точная?

Другая широко обсуждаемая сегодня технология перевода -- статистическая (statistical-based machine translation). В отличие от традиционной, она не использует лингвистические алгоритмы перевода, а основана на статистическом вычислении вероятности совпадений. Для работы этой системы необходимы огромные базы параллельных текстов, где попарно хранятся словосочетания (фразы из 2-3 слов) и их переводы, так называемые N-граммы. В процессе перевода также используется механизм анализа, но не лингвистический, а статистический. Система подбирает вариант перевода, основываясь на частоте совпадений, то есть в конечном итоге будет подставлен вариант, имеющий наиболее высокий процент совпадений.

Слабым местом статистических систем является отсутствие механизма анализа грамматических правил входного и выходного языков. Трудно представить, что система, которая не анализирует текст с точки зрения грамматики, способна выдать связный перевод.

Еще одна проблема состоит в том, что для корректной работы такой системы необходимо иметь в базе не просто очень большое, а невероятно большое количество параллельных N-грамм. Ведь чем больше базы параллельных текстов, тем выше качество перевода. Для обработки такого объема информации необходимо значительное количество компьютерных ресурсов, что по силам только мощному корпоративному или интернет-серверу. К слову сказать, сегодня не существует коммерческих версий статистических переводчиков [Единственный известный коммерческий продукт на базе статистического перевода предлагает американская компания Language Weaver. Система SMTS 4.3 предназначена только для корпоративных клиентов и не работает с русским языком] для настольных компьютеров, а большинство разработок в этой области по-прежнему пребывает в состоянии перманентной разработки. Практически единственным доступным статистическим переводчиком является бесплатный сервис онлайн-перевода компании Google.

Однако не будем ограничиваться теоретическими выводами, пора проверить качество перевода обеих технологий, попробовав их «в деле». Сравним две наиболее известные на сегодня системы перевода -- уже упоминавшийся переводчик PROMT и интернет-сервис Google.

PROMT и Google: битва титанов

Мы решили протестировать англо-русское направление перевода как наиболее популярное среди русскоязычных пользователей. Сразу отметим, что сервис перевода Google сегодня предлагает воспользоваться BETA-версией этой языковой пары (данное языковое направление находится в стадии разработки). Онлайн-сервис Google также предлагает BETA-версии для восточноазиатских направлений перевода (китайского, японского, корейского и арабского языков), также работающих на основе статистического метода перевода. Остальные языковые пары переводят тексты на базе системы SYSTRAN (rule-based machine translation).

К сожалению, наши сомнения относительно качества перевода с помощью статистического метода оказались небезосновательны. Например, простое именное словосочетание «a Chinese orphanage» (китайский приют) Google перевел как «Китая приюте». Во-первых, слово «Chinese» само по себе переводится как «китайский» и не может иметь варианта перевода «Китай» (China). Непонятно, почему сервис не только неправильно перевел прилагательное, но и не согласовал падеж слова «orphanage» (если опустить прилагательное, получается бессмысленное «из приюте»). Однако, в отличие от перевода PROMT, предлог сервис Google выбрал правильно: «bring FROM» -- «привести ИЗ».

Во-вторых, перевод слова «bringing» в варианте Google вообще отсутствует. Исчезновение слов или фраз при переводе недопустимо и является очень грубой ошибкой. Даже при отсутствии в словарных базах системы варианта перевода (а такое возможно) программа должна подставить в переведенный текст слово «как есть» -- в нашем случае английское «bringing». Если же программа действует по принципу: «нет перевода -- нет слова», то смысл переведенного текста вряд ли будет понятен пользователю. Единственный вариант в данном случае -- кропотливо сравнивать исходный и переведенный тексты, чтобы обнаружить «пропавшее» слово и самостоятельно перевести его, если позволяет квалификация. Тогда возникает вопрос: зачем нужна система перевода, если приходится переводить самому?

Связно перевести вторую часть предложения сервису Google не удалось. В получившемся варианте («это только показать, что она идентична близнецы, а также за рубежом») члены предложения не согласованы с точки зрения синтаксиса, и в результате теряется смысл текста. Система PROMT успешно справилась с этим фрагментом: «только для этого, чтобы показать, что у нее есть идентичная сестра-близнец, также принятая за границей».

Мы также предложили сервису Google перевести фрагмент новости о футболисте Дэвиде Бекхэме, однако результат перевода предложения «Beckham may find LA a refreshing change once the hype and novelty wears off» также оказался неудачным: «Бэкхем может найти LA освежающий измениться после того, ажиотаж и новизна носит удалиться». К сожалению, иначе как бессмысленным набором слов такой перевод назвать нельзя. Напрашивается вывод, что мы имеем дело с примитивным подстрочником, и система, не найдя связного перевода предложения в базе, тупо подставила перевод каждого слова по отдельности.

Очевидно, что причина нелепостей при переводе статистическим методом заключается в недостаточном объеме параллельных баз текстов из различных областей знаний. В традиционных системах перевода, работающих на основе правил, есть возможность настройки программы для перевода текстов со специализированной терминологией. В частности, можно подключить тематические словари, создавать и редактировать собственные словари, резервировать слова, не требующие перевода, и т. д. Результат перевода после настройки системы приведен в табл. 3.

Использование возможностей настройки не отразится на объеме занимаемой программой памяти. В статистических системах необходимым условием является наличие достаточного количества параллельных текстов по любой тематике, что требует значительного объема памяти ПК и огромных трудозатрат по занесению N-грамм в базы. По всей видимости, сегодня эта задача еще не нашла достойного решения.

Стоит также отметить, что технология перевода статистической системой построена на анализе параллельных текстов, и программа может менять результат перевода в зависимости от контекста анализируемых баз. В результате перевод одного и того же термина может быть разным, так как система вычисляет вероятность (наибольшее количество) совпадений перевода данного слова в определенном контексте. В отличие от статистического метода, технология rule-based гарантирует одинаковый перевод одного и того же термина, что особенно актуально для корпоративных пользователей, которые переводят тематическую информацию со специализированными терминами.

К сожалению, снова первыми бросаются в глаза недостатки перевода Google. Начало стандартного предложения «The employee is being hired» сервис перевел выдуманным словосочетанием «Работника на работу», опустив сказуемое «нанимается» (is being hired). Кроме того, переводчик Google убрал из текста перевода название компании -- MTSS. О смысле получившейся фразы «обеспечения безопасности признаются компании должности и органа» (оригинал звучит как «providing security of MTSS Company office») остается только догадываться. Вместе с тем, PROMT идеально перевел этот фрагмент: «обеспечение безопасности офиса компании MTSS».

Однако с некоторыми нюансами сервис Google справился лучше соперника. Во-первых, термин «the employee» был корректно переведен как «работник», а не «служащий» (вариант перевода PROMT). Во-вторых, выражение «as a security» было правильно переведено Google как «в качестве охранника», в отличие от угловатого «как охранник», предложенного PROMT'ом. Более гладко переведено и последнее предложение в примере: «The employee also agrees to perform additional duties incidental to the general job description» -- «Также работник обязуется выполнять дополнительные обязанности...». Но непонятно, почему союз «также» стоит в начале предложения: нарушается строгий стиль текста -- важное условие, которое необходимо соблюдать при переводе юридических документов.

В целом, создается впечатление, что перевод Google состоит из отдельных кусочков (фраз), что, по сути, верно. В процессе перевода система «ищет» в базах параллельные словосочетания, не анализируя при этом грамматику языков. Если пользователю повезет и в базе системы есть аналогичный текст, тогда на выходе система выдаст вполне приличный перевод. Если перевод в базе отсутствует, тогда Google смело выдает примитивный подстрочник, не потрудившись «связать» слова в осмысленное предложение.

Исходя из анализа двух технологий можно сделать вывод, что системы, реализованные на основе традиционной технологии перевода (rule-based machine translation), предлагают более качественный перевод по сравнению с методом статистического анализа. Очевидно, что 100-процентное качество перевода не способен обеспечить ни один машинный переводчик. Перевод системы PROMT позволяет понять смысл текста, хотя программа и допускает некоторые огрехи и стилистические неточности. Безусловным достоинством PROMT является возможность настройки, благодаря чему систему можно «обучить» вполне корректному переводу текстов.

Глобальным недостатком статистической системы Google является фатальная зависимость качества перевода от объема и разносторонности базы параллельных текстов. Минусом является и то, что этот переводчик доступен только в качестве онлайнового сервиса. Всем известно, что бесплатные интернет-порталы переводят лишь небольшие фрагменты текстов. Таким образом, для корпоративных клиентов (самый большой сегмент пользователей программ-переводчиков), которым часто приходится переводить большие объемы документации, сервис перевода Google может служить разве что демонстрацией достижений на ниве статистического перевода [Рекомендуем также обратить внимание на бесплатный сервис перевода на сайте Translate.ru, который предоставляет компания ПРОМТ. Сервис реализован на основе технологии PROMT и предлагает девять направлений перевода для русского языка, что особенно важно для русскоязычных пользователей]. Поэтому основные пользователи данного сервиса -- частные пользователи, у которых необходимость в переводе фрагментов текста или электронных писем возникает время от времени.

Однако с переводом устойчивых словосочетаний Google в некоторых случаях справился лучше PROMT'а, что позволяет задуматься о возможной интеграции обеих технологий для получения оптимального качества перевода. В частности, некоторое время назад стало известно, что компания ПРОМТ приобрела у Google корпус (базы параллельных текстов), размер текстов корпуса составляет более 24 Гб в сжатом виде.

Возможно, в будущем специалистам ПРОМТ удастся объединить преимущества обеих технологий и представить систему перевода качественно нового уровня. Скорее всего, такой переводчик будет не самой «легкой» программой с точки зрения объема занимаемой памяти ПК, но будем надеяться, что и эта сложность будет преодолена. В любом случае, машинный перевод -- область высокотехнологичных решений, которая постоянно развивается, и разработчикам систем машинного перевода есть над чем поработать сегодня, чтобы предложить интересное решение пользователям завтра.

1.2 Чем различаются веб-сервисы перевода

Основные отличия веб-сервисов перевода состоят в качестве перевода и реализации интерфейса -- переведен ли он на все те языки, которые поддерживаются для перевода, насколько им удобно пользоваться в силу ограничения объема введенного текста, можно ли сохранять персональные настройки перевода, сколько расходуется трафика при открытии страницы, а также каково количество самих направлений и тематик. В этом отношении подавляющее большинство таких ресурсов лицензируют переводческую технологию от крупных игроков рынка и предоставляют сервис в качестве дополнения. В российском сегменте Интернета лидирует сервис translate.ru («ПРОМТ»). Он подключен на очень многих вебсайтах и порталах (например, Mail.ru) и работает на движке фирменного настольного переводчика PROMT. Сервис предоставляет перевод с английского, немецкого, французского, испанского языков на русский язык и обратно, а также с итальянского языка на русский. Доступны и переводы с английского на немецкий, французский, португальский, испанский языки и обратно, перевод с французского на немецкий и испанский и с испанского на французский.

Есть автоматическое определение языка. Работает несколько тематик -- общение, учеба, бизнес, компьютеры, автомобили, медицина, путешествия, спорт. Перевод можно распечатать, отослать по электронной почте и просто скопировать из формы. Translate.ru переводит только короткие (до 500 знаков) фрагменты текста и веб-страницы (нужно ввести URL). За один раз в Translate.ru разрешается переводить тексты объемом не более 3000 символов, включая пробелы и знаки конца параграфа (для зарегистрированных пользователей -- 10 000 символов, включая пробелы и знаки конца параграфа). Есть версия для мобильных устройств в браузере. В мире лидирует сервис переводов Google -- Google

Translate. В нем значительно больше направлений переводов, но отсутствуют тематики. Поле для ввода текста поддерживает очень большие фрагменты текста, к тому же сервис умеет переводить сайты -- для этого можно просто скопировать в строку ввода URL-ресурса или установить расширение/панель для браузера. Из-за открытой технологии разработчики создали достаточно большое количество бесплатных клиентов для перевода через Google как для десктопов, так и для смартфонов и коммуникаторов, помимо фирменного мобильного приложения от Google. Интересно, что в Google Translate можно предложить свой вариант перевода.

Переводчик компании Microsoft -- Translator -- реализован в виде веб-сервиса, дополнения для офисного пакета MS Office, а также ускорителя для браузера Internet Explorer 8. Количество языков перевода и локализаций интерфейса сопоставимо с Google Translate. Переводить веб-страницы, в том числе имеющие фреймы, позволяет веб-сервис Babel Fish Translation (в то время как, например, с помощью Google Translate невозможно полностью перевести страницу с лотом на аукционе eBay). Babel Fish Translation может переводить до 150 слов в 20 направлениях, включая русско-английское (также есть немецкий, французский, китайский, японский и другие языки).

Один из немногих вебсервисов, имеющих удобную виртуальную клавиатуру для ввода нестандартных символов (диакритика и пр.), -- Worldlingo Multilingual Translator. Однако он требует платной регистрации для доступа к дополнительным словарям и тематикам перевода.

1.3 PROMT (www.translate.ru)

Удобство доступа и работы: Для незарегистрированных пользователей предлагается только общелексическая тематика перевода, зато набор языковых пар не урезается. После регистрации становятся доступны все тематические базы. Может переводить также web, e-mail и даже wap-странички. Интерфейс русский. Имеет КПК и WAP версию.

Количество языков: ПРОМТ переводит с английского, немецкого, французского, испанского языков на русский язык и обратно, а также с итальянского языка на русский. Доступны также переводы с английского на немецкий, французский, португальский, испанский языки и обратно, перевод с французского на немецкий и испанский и с испанского на французский.

Тематические базы: В режиме зарегистрированного пользователя их 10 - общая лексика, автомобили, банковское дело, деловая корреспонденция, компьютерные игры, интернет, логистика, программное обеспечение, спорт, путешествия.

Корректность перевода: Для перевода больших объемов или «на понимание» переводчика вполне достаточно. Чтобы получить «чистовой» текст, придется потратить время и усилия. Наличие тематических баз существенно повышает качество перевода.

Частота обновления базы слов и словосочетаний: Фиксированная частота обновления не установлена, но все же базы время от времени обновляются. В марте этого года вышла новая версия.

1.4 Google Translate (http://translate.google.ru/)

Переводчик Google - это бесплатная служба переводов, предоставляющая мгновенные переводы с использованием 57 различных языков. Она может переводить слова, предложения и веб-страницы с любого и на любой из поддерживаемых языков.

Когда Переводчик Google создает перевод, он ищет шаблоны в сотнях миллионов документов, чтобы предоставить самый лучший перевод. При обнаружении шаблонов в документах, уже переведенных людьми, Переводчик Google может делать интеллектуальные предположения для выбора соответствующего перевода. Процесс поиска шаблонов в больших объемах текста называется "статистическим машинным переводом". Поскольку переводы выполняются компьютерами, не все их результаты будут идеальными. Чем больше используется переведенных людьми документов, которые Переводчик Google может анализировать на определенном языке, тем лучше будет качество перевода. Именно поэтому точность перевода на разных языках иногда различается.

Удобство доступа и работы: Простой дизайн. Регистрация не требуется. Система может переводить текст и web-страницы. Есть возможность загрузки страницы. Интерфейс русский.

Количество языков: Google переводит с/на Арабский, Английский, Болгарский, Китайский (упрощенный), Китайский (традиционный), Хорватский, Чешский, Датский, Голландский, Финский, Французский, Немецкий, Греческий, Хинди, Итальянский, Корейский, Японский, Норвежский, Польский, Румынский, Русский, Испанский, Шведский, Португальский.

Тематические базы: Подразделений не существует.

Корректность перевода: Разработан определенный подход к качеству перевода. В систему загружаются тексты очень большого объема (миллиарды слов). Затем для построения модели перевода применяются методы самообучения на основе статистического анализа. При экспериментальной оценке система показала очень хорошие результаты.

Частота обновления базы слов и словосочетаний: Так как сервис относительно новый, сейчас ведутся его постоянные доработки, в том числе и в области качества перевода.

(источник: http://translate.google.ru/about/intl/ru_ALL/)

1.5 Microsoft Translator (http://www.microsofttranslator.com)

Софт-гигант Microsoft также имеет свою систему онлайн-перевода. Прежде всего, Bing Translator привлекает удобным интерфейсом, что характерно для продуктов Microsoft. Окно браузера делится на две части: в одной отображается исходный текст, в другой перевод. С помощью панели управления можно настраивать внешний вид переводчика по своему вкусу.

Bing Translator “знает” все основные европейские языки, а также китайский, японский, корейский и арабский. Любопытная особенность данного сервиса в том, что Вам не обязательно знать название языка, с которого Вы хотите перевести страницу. Система сама определит язык оригинала и отобразит перевод. Такое автоматическое определение языка переводимой веб-страницы исключительно полезно при работе с экзотическими языками, когда, например, Вы не знаете - на корейском или японском языке написан нужный документ.

1.6 Babel Fish Translation (http://babelfish.yahoo.com/)

Сервис, предоставляемый Yahoo! для перевода части текста или веб-страницы целиком с английского (или несколькоих других языков) на другой язык. Основан на приложении, разработанном корпорацией AltaVista Technology. Назван в честь вымышленного существа из цикла научно-фантастических романов «Автостопом по галактике» английского писателя Дугласа Адамса вавилонская рыбка, название которого, в свою очередь, отсылает к древнему городу Вавилону и связанному с ним библейскому преданию о Вавилонской башне.

Перевод осуществляется по технологии, разработанной компанией SYSTRAN (англ.), одной из старейших фирм, ведущих разработки в области машинного перевода.

1.7 Worldlingo Multilingual Translator

(http://worldlingo.com/ru/products_services/worldlingo_translator.html)

Удобство доступа и работы: Простой дизайн. Регистрация не требуется. Система может переводить текст и web-страницы. Есть возможность загрузки страницы. Интерфейс русский.

Количество языков: WorldLingvo переводит с/на Голландский, Английский, Французский, Немецкий, Итальянский, Португальский, Испанский, Русский, Шведский.

Тематические базы: Их 21 - общая лексика, автомобили и технологии, авиация и космос, химия, бытовые темы, компьютеры и обработка данных, наука о земле, экономика и бизнес, электроника, пищевая промышленность, юриспруденция, естественные науки, математика, машиностроение, медицина, металлургия, военное дело, морское дело и судоходство, фотография и оптика, физика и атомная энергия, политология. Наличие баз существенно повышает качество перевода.

Глава II. Сравнение перевода, полученного в исследуемых он-лайн переводчиках

Мы рассмотрели пятнадцать примеров английских шуточных текстов, переведенных с помощью он-лайн словарей (PROMT, Google Translate, Microsoft Translator, Babel Fish Translation, Worldlingo Multilingual Translator).

Критерием оценки успешности перевода было сохранение шуточного смысла или сохранение смысла в целом, сможет ли виртуальный транслейтор заменить переводчика.

Как мы можем убедиться, просмотрев еще раз Приложение, где представлены все примеры и результаты их перевода, лучше всего с заданием, хотя результат и далеко от идеала, справились лишь несколько он-лайн транслейторов, конкретнее это: PROMT, Google Translate, Microsoft Translator. Причем, лучшие результаты из них показал именно Google Translate.

Пример (в Приложении под6)

He was almost sure

A college professor returned home from a meeting. As he entered his room, he heard a noise that seemed to come from under the bed.

- Is there someone there? - he asked absently.

- No, professor, - answered the thief.

- That is strange, - muttered the professor. - I was almost sure I heard someone under the bed.

Проработанный перевод:

Он был почти уверен

После заседания в институте профессор вернулся домой. Входя в свою комнату, он услышал шум, казалось, доносился из-под его кровати.

- Тут есть кто-нибудь? - спросил он рассеянно.

- Нет, профессор, - ответил вор.

- Как странно, - пробормотал профессор. - Я был почти уверен, что кто-то есть под кроватью.

Перевод с помощью Google Translate:

Он был почти уверен,

профессор колледжа вернулся домой с заседания. Когда он вошел в свою комнату, он услышал шум, что, казалось, пришел из-под кровати.

- Есть ли кто там? - спросил он рассеянно.

- Нет, профессор, - ответил вор.

- Это странно, - пробормотал профессор. - Я был почти уверен, что я услышал, как кто под кроватью.

Но даже и здесь, как мы видим, есть небольшие недочеты, понятные человеку, но не машине: шум, что, казалось, пришел из-под кровати; что я услышал, как кто под кроватью.

Пока что, по-видимому транслейтор плохо различает заголовки и первые предложения: Он был почти уверен,

профессор колледжа вернулся домой с заседания.

Но в целом, смысл понятен, исходное форматирование по большей части соблюдено.

Но вот для сравнения, то, какой перевод нам выдал Babel Fish Translation:

Он был почти уверен Профессор коллежа возвратил домой от встречи. По мере того как он вошел его комнату, он услышал шум который показалось, что пришел из-под кровати. - Кто-то там? - он спросил отсутствующе. - Нет, профессор, - ответил похитителю. - Которое странно, - пробормотал профессора. - Я был почти уверен я услышал кто-то под кроватью. - Какстранно, - пробормоталпрофессор. - Ябылпочтиуверен, чтокто-тоестьподкроватью.

В этом случае, зачем-то, транслейтор дублировал последние несколько предложений. Как очевидно можно заметить, разработчики Babel Fish Translation не проработали сочетаемость слов, например: возвратил домой от встречи; Которое странно; Кто-то там?. Вполне возможно, что транслейтор берет просто одни из первых, записанных в словарной статье к каждому из слов значений, и ставит их вместе, не принимая во внимание их сочетаемость и частотность встречаемости в одном предложении.

Так же минус приписываем за несохранение или просто неучёт форматирования исходного текста. Сохранения смысла почти нет, особенно он теряется в этом месте: Нет, профессор, - ответил похитителю.

Далее, рассмотрев все проанализированные примеры, мы можем заметить типичные ошибки, допускаемые он-лайн транслейторами:

1) Буквальность

(из примера №1)

Approaching the friend - Приближение к другу (PROMT)

Two parents gone - Две родители пошли (Google Translate) - родителя пойденного (Babel Fish Translation)

and left me $25,000 - и оставила мне $25,000 - и оставил меня $ 25 тысяч (PROMT) - и оставил меня 25 000 долларов США (Microsoft Translator ) - и налево я $25.000 (Worldlingo Multilingual Translator)

(из примера №4)

books for Christmas gifts - книги за рождественские подарки (PROMT) - книги для рождественских подарков (Google Translate) - книги для рождественских подарков (Microsoft Translator) - книги для подарков Кристмас (Babel Fish Translation) - книги для подарков рождества (Worldlingo Multilingual Translator)

(из примера №5)

take your paws away from my beard - Вы любезно уберете лапы из моей бороды (PROMT) - возьмите свои лапы от моей бороды (Google Translate) - примет ваши лапы от моей бороды (Microsoft Translator) - примете ваши лапки далеко от моей бороды (Babel Fish Translation) - примете ваши лапки далеко от моей бороды (Worldlingo Multilingual Translator)

(из примера №9)

Not taking off your cap - Не взятие Вашей кепки (PROMT) - Не принимая в шапку (Google Translate)

Most certainly, Sir, your Honour, be so kind as to hold my calf for a moment, then I'll pay my respect to you, depend on me, Sir!- Само некоторо, господин, ваша почетность, поэтому вид о владении моя икра на момент, после этого я оплащу мое уважение к вам, завишу на мне, господине! (Google Translate)

I'm still master here, am I not? - Я являюсь все еще основным здесь, я нет? (PROMT) - Я неподвижный оригинал здесь, не будет мной? (Worldlingo Multilingual Translator)

(из примера №10)

When the doorkeeper made his appearance - Когда привратник сделал свою внешность (PROMT)

(из примера №11)

hearts, spades, diamonds, clubs and England - сердца, лопаты, алмазы, клубы и Англия (PROMT ) - черви, пики, бубны, трефы (Google Translate) - сердца, лопаты, диаманты, клубы и Англия (Babel Fish Translation)

I always hit my thumb with it - я всегда хит моего пальца с ним (Microsoft Translator)

2) Использование вариантов перевода другой тематики/редкой встречаемости

(из примера №1)

sees a friend at a table - видит друга в таблицу (Microsoft Translator) - видит друга на таблице (Babel Fish Translation)

A man in a bar - Человек в адвокатском сословии (Babel Fish Translation)

(из примера №3)

eat more fruit - ест больше плодоовощ (Babel Fish Translation)

(из примера №8)

cut a piece off each leg of the new trousers - каждой ветви новые брюки (Google Translate)

(из примера №9)

A disrespectful calf - Непочтительная икра (Babel Fish Translation)

is pulling a big calf on a string - вытягивает большую икру на шнуре (Babel Fish Translation)

(из примера №10)

and the table that costs 10.000 dollars - И таблицы, стоит 10.000 долларов (Microsoft Translator) - И таблица то стоит 10.000 доллара (Babel Fish Translation)

(из примера №14)

Take it easy - Примите его легкое (Worldlingo Multilingual Translator)

(из примера №15)

I always hit my thumb with it - я всегда хит моего пальца с ним (Microsoft Translator)

3) Незнание транслейтором известных имен

(из примера №4)

Mark Twain - Марк Тшаин (Babel Fish Translation) - Марк Twain (Worldlingo Multilingual Translator)

(из примера №9)

County Westmorshire - Округ Westmorshire (Microsoft Translator) - Каунти Westmorshire (Google Translate)

(из примера №10)

Charles I by Vandyck - Чарльза I Vandyck (PROMT) - Карла I по Vandyck (Google Translate) - Charles i Vandyck (Babel Fish Translation)

4) Неправильное формирование множественного числа

(из примера №10)

on visiting other castles and museums - посетить другие замоки и музеи (Babel Fish Translation)

5) Несоответствие окончаний

(из примера №1)

Three close family members lost - 3 члена близких родственников потерянного

(из примера №6)

muttered the professor - пробормотало профессора (Worldlingo Multilingual Translator)

The tree is to blame - Дерево в этом виноват (Google Translate)

(из примера №9)

A disrespectful calf - неуважительное теленка (Microsoft Translator)

The elderly landlord - Пожилые арендодателем (Microsoft Translator)

6) Незнание стандартных конструкций или базовых слов

(из примера №3)

Medicine won't help you at all - Медицина не поможет вам на всех (Google Translate)

(из примера №4)

such as the French write - как франчуз пишет (Babel Fish Translation)

(из примера №10)

its photo in the guide-book - свое фото в guide-book (Babel Fish Translation)

7) Несоблюдение падежей

(из примера №3)

Get away to some quiet country - Уйти в тихой страны (Microsoft Translator)

(из примера №5)

exclaimed indignantly - сказал агрессивныйому (Babel Fish Translation)

(из примера №8)

The too long trousers - Слишком длинние брюки (Babel Fish Translation)

8) Несочетание предлогов в контексте

(из примера №4)

it is useful to put under the short leg - поставить под короткой ноге (Google Translate)

(из примера №7)

returned home from a meeting - возвратил домой от встречи (Babel Fish Translation)

9) Формы глагола не подходящие по контексту

(из примера №12)

If I am a gentleman and you are a gentleman, who will milk the cow? - Если я джентельмен и ты джентльмен, который будет доить корову? (Google Translate) - Если я джентльмен и, то вы джентльмен, который надоет корову? (Babel Fish Translation)

(из примера №13)

Did you have a good holiday? Did you go away? - У Вас был хороший праздник? Вы уходили? (PROMT) - У вас есть хороший праздник? Ли вы идете от? (Microsoft Translator) - Было ли у вас хорошего отдыха? Вы уходите? (Google Translate)

(из примера №14)

She left me to become my auntie - Она вышла я для того чтобы стать моей тетенькой (Babel Fish Translation) - Она оставила меня стать моей тети (Microsoft Translator)

Таким образом, становится очевидно, что он-лайн транслейторы допускают большое количество ошибок, которые в большинстве случаев сильно искажают смысл заданного текста, и особенно это касается смысла шуток и анекдотов, где наличие правильной передачи смысла каждой из частей является гарантией передачи шуточности.

Такие минусы он-лайн переводчиков как выбор неправильного синонима или смысла слова из его нескольких в словарной статье ведут к возникновению полной чепухи, а иногда даже вызовет смех у носителя языка (прим: is pulling a big calf on a string - вытягивает большую икру на шнуре).

Если для перевода шуток или анекдотов с английского на русский воспользуется он-лайн транслейтором человек с низким уровнем знания английского, то ему будет очень тяжело понять что к чему. Например, если он возьмет для этой цели Google Translate, то там предлагается самому выбрать вариант перевода отдельного слова или словосочетания. Но, человек, не знающий английский язык, вряд ли сам сможет понять сходу и без углубленного перевода каждого слова в других словарях, какой из вариантов он должен выбрать.

Собственно, гигантский сбор текстов на разных языках и их последующее сопоставление между собой и является методом перевода, который заложен в "гугловский" машинный перевод (вместо привычного способа заполнения базы компьютеров-переводчиков словарными запасами, правилами грамматики, её примерами и исключениями, что и является проблемным местом для неживых переводчиков).

По ходу ознакомления с переводчиком, нашлись в нём и минусы (как понимается временные): на примере перевода с русского на немецкий и английский в Google.Translate отмечается не всегда верное спряжение глаголов, а также неуместное по контексту употребление прилагательных.

А вот "5+" в Google.Translate бесспорно можно отдать такой функции: при наведении на любое слово или цельную фразу в уже переведённом тексте, переводчик подсвечивает его соответствие в тексте языка, с которого был осуществлён перевод. Также эта функция получает дополнительные баллы за то, что кликнув на любое переведённое слово, можно узнать альтернативный вариант перевода в виде выпадающего списка.

Тем не менее, как мы можем в этом сами убедиться, Google Translate предлагает самый связный и адекватный перевод в большинстве случаев.

PROMT немного уступает в этом Google, а на третьем месте мы расположим Microsoft Translator, чья основная проблема в неправильном зачастую подборе слов, но несмотря на это, он может использоваться как вспомогательное средство при переводе.

У оставшихся двух Babel Fish Translation и Worldlingo Multilingual Translator слишком много недоработок на данный момент, что мешает им произвести более или менее адекватный перевод даже в довольно не осложненных запутанными конструкциями или многосмысленными словами текстах.

Вывод

Система машинного перевода, какой бы совершенной она ни была, все равно не является 100%-ным носителем языка, поэтому для нее “домыслить” опущенные слова во фразе, например, союзы, практически невыполнимая задача, равно как и понять сленг и жаргонизмы.

А, например, пропущенный или лишний знак препинания делает невозможной оценку синтаксической структуры предложения. Что также отражается на качестве перевода.

Поэтому, даже самые современные он-лайн переводчики пока не справляются с поставленной задачей на отличном уровне. Хотя разработчики таких он-лайн транслейторов стремятся к идеальному результату перевода, чтобы заменить работу человека над выискиванием отдельных слов в словарях, вряд ли это будет возможным в ближайшие годы.

Машинные переводы почти напрямую связаны с искусственным интеллектом. А эта область, как известно, тоже еще разрабатывается и далека от идеала, ведь человеческий мозг уникален, и вполне вероятно, что машине никогда не удастся достичь уровней его организации.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.