Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Основные понятия и функциональные стили лингвостилистики. Принципы работы и типы систем машинного перевода. Сопоставительный анализ отрывков научно-технического текста и их переводов на русский язык с помощью различных СМП - трансфертной и статистической.

Рубрика Иностранные языки и языкознание
Вид дипломная работа
Язык русский
Дата добавления 23.06.2011
Размер файла 4,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ

(ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ МАИ

ДИПЛОМНАЯ РАБОТА

на тему

Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Оглавление

  • Введение
  • 1. К определению основных понятий лингвостилистики.
    • 1.1 Основные понятия
    • 1.2 Функциональные стили
    • 1.3 Стилистическая характеристика научно-технического стиля
      • 1.3.1 Общие особенности
      • 1.3.2 Лексические особенности научно-технического стиля
      • 1.3.3 Синтаксические особенности научно-технического стиля
      • 1.3.4 Морфологические особенности научно-технического стиля
      • 1.3.5 Подстили
  • 2. К проблеме машинного перевода в современном языкознании
    • 2.1 Основные понятия машинного перевода
      • 2.1.1 Развитие машинного перевода
      • 2.1.2 Степень реализации СМП
      • 2.1.3 Принципы оценки СМП
      • 2.1.4 Принцип действия СМП
    • 2.2 Подходы к машинному переводу
      • 2.2.1 СМП основанные на правилах
      • 2.2.2 Системы машинного перевода основанные на примерах
      • 2.2.3 Статистический машинный перевод
    • 2.3 ТМ-системы
    • 2.4 Сравнение различных типов СМП
  • 3. Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе
    • 3.1 Основные особенности
    • 3.2 Лексические особенности
    • 3.3 Синтаксические особенности
    • 3.4 Морфологические особенности
  • Заключение
  • Библиография
  • Приложения
    • Схема 1: основные понятия стилистики
    • Схема 2: тропы и фигуры
    • Схема 3: функциональные стили языка
    • Схема 4: особенности научно-технического стиля
    • Образцы проанализированных текстов
      • Отрывок 1
        • Оригинал
        • Перевод, выполненный статистической СМП
        • Перевод, выполненный трансфертной СМП
        • Перевод, выполненный человеком
      • Отрывок 2
        • Оригинал
        • Перевод, выполненный статистической СМП
        • Перевод, выполненный трансфертной СМП
        • Перевод, выполненный человеком
      • Отрывок 3
        • Оригинал
        • Перевод, выполненный статистической СМП
        • Перевод, выполненный трансфертной СМП
        • Перевод, выполненный человеком
    • Таблицы анализа
  • Список сокращений
  • Условные обозначения

Введение

Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.

С каждым днем увеличивается число пользователей Интернета. Все больше сетевые технологии оказывают влияние на развитие самой науки и техники. За последние годы сильно начал меняться характер образования, переходя на уровень дистанционного. Этот переход осуществляется даже в классических вузах. Развитие науки и образования, да и вообще формирование мирового информационного пространства значительно тормозится из-за так называемого языкового барьера. Эта проблема пока не нашла своего кардинального решения.

Последние годы объем предназначенной для перевода информации увеличился. Создание универсального языка типа Эсперанто, «эльфийских языков» или какого-либо другого языка не привели к изменению ситуации. Использование традиционных средств межкультурной коммуникации может быть достойным выходом. Нынешний век диктует свои условия: информация меняется двадцать четыре часа в сутки, широко применяются электронные средства связи. В такой ситуации классический подход к осуществлению перевода не всегда оправдывает себя. Он требует значительных капиталовложений и временных затрат. В некоторых случаях более целесообразным представляется использование машинного или автоматического перевода и систем машинного перевода (СМП).

Работа посвящена изучению стилистики текста, и исследованию особенностей стиля научно-технической литературы, в аспекте применения автоматизированных средств перевода.

Актуальность темы оправдана появлением большого количества научно-технических документов и необходимостью оперативного их перевода на другие языки.

Цель работы: изучение особенностей научно-технического стиля в аспекте машинного перевода.

Задачи работы:

· описать в общих чертах стилистику научно-технического текста;

· описать принципы работы, основные типы систем машинного перевода;

· изучить особенности языковых средств научного стиля;

· выяснить какие из языковых средств остаются в тексте после его перевода;

· сравнить текст, переведенный машиной и профессиональным переводчиком.

Объектом исследования являются преобразования, возникающие при машинном переводе текста научно-технической литературы.

Предметом исследования являются особенности структурно-семантических трансформаций при машинном переводе определенной научной работы с английского языка на русский.

В ходе исследования были использованы следующие методы:

· аналитический;

· сравнительный;

· изучение монографических публикаций и статей;

· метод сплошной выборки;

· методы лингвистического анализа;

· метод обобщения.

Теоретическая значимость работы заключается в попытке собрать и систематизировать информацию о малоизученном аспекте взаимодействия двух областей знаний:

· об особенностях стиля научно-технической литературы;

· об особенностях систем машинного перевода.

Практическая ценность работы определяется:

· описанием особенностей научного стиля в виде диаграмм и схем, что, по нашему мнению, является наиболее доходчивым и методически оправданным.

· комплексом собранных сведений относительно систем машинного перевода, которые также представлены в виде диаграмм и схем;

· приведенным стилистическим анализом отрывков из классического труда Д. Кнута «Искусство программирования»;

· сопоставлением машинного и «человеческого» перевода приведенного отрывка.

В качестве теоретической основы исследования были использованы как классические работы А.И. Гальперина И.В. Арнольд, посвященные стилистике английского языка, Я.И. Рецкера, А.Д. Швейцера, посвященные общей теории перевода, так и современные труды Ю.Н. Марчука, П.Н. Хроменкова, Б. Н. Рахимбердиева, посвященные машинному переводу. Особенно хотелось бы отметить работу С. Рассела, в которой дается объяснение принципов работы многих приложений искусственного интеллекта, в том числе машинного перевода.

В качестве фактического материала использован первый том классического труда Д. Кнута «Искусство программирования», а также переводы этой работы, выполненные как человеком, так и с помощью программных средств. Очень подробно были проанализированы три отрывка из этой работы, взятые из начала, середины и конца книги. Оригинальные отрывки на английском языке содержат примерно полторы тысячи языковых единиц (1685). Общий объем проанализированных единиц составляет 6259 слов.

1. К определению основных понятий лингвостилистики.

Стилистикой называется отрасль лингвистики, исследующая принципы и эффект выбора и использования лексических, грамматических, фонетических и вообще языковых средств для передачи мысли и эмоции в разных условиях общения (Арнольд, 1990: 10).

Лингвистическая стилистика -- раздел языкознания, занимается исследованием:

· стилей речи;

· стилистических приемов;

· выразительных средств языка в их отношении к выражаемому содержанию.

Связь стилистики с другими дисциплинами можно представить в виде диаграммы.

Стилистика языка исследует:

· специфику языковых подсистем -- функциональных стилей и подъязыков, которые характеризуются своеобразием:

o словаря,

o фразеологии,

o синтаксиса;

· экспрессивные, эмоциональные и оценочные свойства различных языковых средств.

Следует выделять стилистику текста. Понятие стилистики текста часто путают с понятием стилистики языка. Стилистика текста необходима, так же как грамматика, семантика и другие аспекты и области изучения текста. Важны оба компонента названия -- стилистика и текст.

Первый компонент обозначает стилистический подход ко всем явлениям текста. Второй -- предмет изучения и специфику стилистического изучения (изучаются не традиционные языковые единицы, а тексты).

В определении И.Р. Гальперина, под текстом понимается произведение, имеющее определенную направленность и прагматическую установку, и характеризующееся завершенностью и многомерностью.

Стилистика изучает отдельные реальные тексты. Она рассматривает, каким образом тексты передают содержание:

· следуя нормам, известным грамматике и стилистике языка;

· на основе значащих отклонений от этих норм.

Задачи стилистики:

1. Анализ выбора определенных языковых средств при наличии синонимичных форм выражения мысли для полноценной и эффективной передачи информации.

2. Анализ экспрессивных средств языка на всех уровнях.

3. Определение функции задания -- определение стилистической функции, которую выполняет языковое средство.

Стилистика подразделяется по уровням на лексическую, грамматическую и фонетическую стилистику.

Лексическая стилистика изучает функции лексики и рассматривает взаимодействие прямых и переносных значений. Лексическая стилистика изучает:

· разные составляющие контекстуальных значений слов, их потенциал

o экспрессивный,

o эмоциональный

o оценочный;

· их отнесенность к разным функционально-стилистическим пластам.

Диалектные слова, термины, слова сленга, разговорные слова и выражения, неологизмы, архаизмы, иностранные слова и т.д. изучаются с точки зрения их взаимодействия с разными условиями контекста. Важную роль в стилистическом анализе играет разбор фразеологических единиц и пословиц.

Грамматическая стилистика подразделяется на:

· морфологическую;

· синтаксическую.

Морфологическая стилистика рассматривает стилистические возможности различных грамматических категорий, присущих тем или иным частям речи. Здесь рассматриваются:

· стилистические возможности категории числа;

· противопоставлении в системе местоимений;

· именной и глагольный стили речи;

· связи художественного и грамматического времени и т.д.

Синтаксическая стилистика исследует экспрессивные возможности:

· порядка слов;

· типов предложений;

· типов синтаксической связи.

Важное место здесь занимают фигуры речи:

· синтаксические;

· стилистические;

· риторические фигуры.

Это особые синтаксические построения, придающие речи добавочную выразительность. Как в лингвостилистике, так и в литературной стилистике много внимания уделяется разным формам передачи речи повествователя и персонажей: диалог, несобственно-прямая речь, поток сознания и др. Фонетическая стилистика, включает все явления звуковой организации стихов и прозы:

· ритм;

· аллитерацию;

· звукоподражание;

· рифму;

· ассонансы и т.п.

Сюда же относится рассмотрение нестандартного произношения с комическим или сатирическим эффектом для показа социального неравенства или для создания местного колорита.

Практическая стилистика учит умению правильно выражаться, советует использовать слова, значениями которых мы умеем оперировать, не злоупотреблять фразеологическими оборотами, учит правильно обращаться с языком. Все должно употребляться согласно случаю. Функциональная стилистика изучает стиль как функциональную разновидность языка, особенно в художественном тексте.

1.1 Основные понятия

В лингвистике очень часто используются такие термины как: выразительные средства языка, экспрессивные средства языка, стилистические средства, стилистические приемы. Эти термины иногда употребляются синонимически, иногда же в них вкладывается различное содержание (Гальперин, 1958: 43).

Все выразительные средства языка (лексические, морфологические, синтаксические, фонетические) являются объектом изучения как лексикологии, грамматики и фонетики, так и стилистики. Первые три раздела науки о языке рассматривают выразительные средства как факты языка, выясняя их лингвистическую природу. Стилистика изучает выразительные средства с точки зрения их использования в разных стилях речи, полифункциональности, потенциальных возможностей употребления в качестве стилистического приема (Гальперин, 1958: 46).

Изобразительными средствами языка при этом называют все виды образного употребления слов, словосочетаний и фонем, объединяя все виды переносных наименований общим термином «тропы». Изобразительные средства служат описанию и являются по преимуществу лексическими.

Тропы -- семантические преобразования языковых единиц. Тропы в определенном контексте трансформируют значение единиц путем установления отношения адекватности с понятиями другой предметной области. Образуется своеобразная семантическая сеть.

При образовании тропов активную роль играет ассоциативное мышление. Тропы реорганизуют семантическое пространство языка и, снимая в нем границы между реальным и возможным, создают основу для постижения глубинной структуры реальности особым, «новым» способом, порождая «парадоксальную семантическую ситуацию» (Фатеева, 2006).

Выразительные средства, или фигуры речи, не создают образы, а повышают выразительность речи и усиливают ее эмоциональность при помощи особых синтаксических построений: инверсии, риторического вопроса, параллельных конструкций, контраста и т. д. (Арнольд, 1990:39).

Так же выделяют понятие стилистического приема. И.Р. Гальперин описывает его как намеренное и сознательное усиление какой-либо типической структурной и/или семантической черты языковой единицы (нейтральной или экспрессивной), достигшее обобщения и типизации и ставшее таким образом порождающей моделью. Основным признаком является намеренность или целенаправленность употребления того или иного элемента, противопоставляемая его существованию в системе языка. С понятием стилистического приема связано понятие стилистической функции.

Стилистическая функция - та роль, которую языковое средство играет при передаче экспрессивной информации:

· создание художественной выразительности;

· создание художественного пафоса;

· создание комического эффекта;

· создание речевой характеристики героя.

Прямого соответствия между стилистическими средствами, стилистическими приемами и стилистической функцией нет. Стилистические средства неоднозначны. Инверсия, например, в зависимости от контекста и ситуации может создать пафос и приподнятость или, напротив, придать ироническое, пародийное звучание. Многосоюзие, в зависимости от контекстуальных условий, может служить для логического выделения элементов высказывания, для создания впечатления неторопливого, размеренного повествования или, наоборот, для передачи серии взволнованных вопросов, предположений и т.д. Гипербола может быть трагической и комической, патетической и гротескной. Функционально-стилистическую окраску не следует смешивать со стилистической функцией. Первая принадлежит языку, вторая -- тексту. В словарях функционально-стилистическая коннотация -- историческая отнесенность слов и принадлежность к специальной терминологии, -- так же как коннотация эмоциональная, указывается специальными пометами: colloquial, poetical, slang, ironical, anatomy и т.д. В отличие от стилистической коннотации стилистическая функция помогает читателю правильно расставить акценты и выделить главное. Стилистическую функцию важно также отличать от стилистического приема. К стилистическим приемам относят стилистические фигуры и тропы. Стилистическими приемами являются также синтаксические или стилистические фигуры, увеличивающие эмоциональность и экспрессивность высказывания за счет необычного синтаксического построения: разные типы повторов, инверсия, параллелизм, градация, многочленные сочинительные единства, эллипсис, сопоставление противоположностей и т.д. Особую группу образуют фонетические стилистические приемы: аллитерация, ассонанс, ономатопея и другие приемы звуковой организации речи.

1.2 Функциональные стили

Отличительные черты каждого стиля зависят от его назначения и той комбинации языковых функций, которая преобладает в акте коммуникации:

· от сферы общения;

· от того, имеет ли общение своей главной целью:

o сообщение сведений,

o выражение эмоций (общение),

o побуждение к каким-либо действиям.

Функциональный стиль (ФС) (Functional Style, также Register) -- это общественно осознанная и функционально обусловленная совокупность приемов употребления, отбора, и сочетания языковых средств, направленная на достижение определенной цели сообщения. Понятие ФС связано с понятием языковой вариативности. Разные авторы выделяют разное количество функциональных стилей.

По И.Р. Гальперину ФС всего пять.

По И.В. Арнольд их четыре.

Существует много других классификаций функциональных стилей.

Не существует единственно правильного варианта. Рассмотрим трудности выделения ФС.

1. ФС переплетаются.

2. ФС исторически изменчивы.

3. Понятие ФС очень тесно соприкасается с жанрами. Стиль может составлять совокупность жанров, например, стиль художественной прозы _ это роман, рассказ, поэма, и т.д.

4. Стили не изолированы, но, что важно, они имеют собственное ядро, собственные параметры. Меньше всего под влиянием других стилей находится деловой стиль.

Мы вслед за Гальпериным будем выделять пять стилей языка:

· научный;

· художественный;

· публицистический;

· официально-деловой;

· разговорный.

Причем, в данном случае, стили можно связать с функциями языка следующим образом:

Стили разделены на две категории. Это книжные стили и разговорный стиль. При этом книжные стили это:

· научный;

· художественный;

· публицистический;

· официально-деловой.

Основные черты стилей и их жанры приведены на схеме в приложении.

1.3 Стилистическая характеристика научно-технического стиля

Научно-технический стиль -- стиль научной прозы, который используется в изложении, имеющем определенное содержание. Наиболее характерными чертами стиля научной прозы является синтаксическая организация предложений и выбор лексики. Отбор лексики в стиле научной прозы подчиняется одной основной задаче: адекватно донести до читателя описываемое явление в многообразии признаков, характеризующих это явление. Поэтому слова, используемые для выражения мысли в научной прозе имеют одно, обычно ведущее, предметно-логическое значение. Вообще, наиболее характерным для стиля научной прозы является использование слов в основных предметно-логических значениях. В этом стиле слова редко используются в переносных и других контекстуальных значениях (Гальперин, 1958: 424).

Принято считать, что единственной функцией научного стиля является функция интеллектуально-коммуникативная, другие функции факультативны. Научный стиль характерен для текстов, предназначенных для сообщения точных сведений из какой-либо специальной области и для закрепления процесса познания.

1.3.1 Общие особенности

Общие особенности стиля можно представить в виде диаграммы:

Определенной стилистической обособленностью обладают в подобных текстах:

· леммы;

· аксиомы;

· теоремы;

· доказательства;

· алгоритмы.

Для таких структур характерна формальность изложения и перегруженность штампами. Без специальной подготовки они сложны для понимания.

1.3.2 Лексические особенности научно-технического стиля

Образность

Образность, как правило, не свойственна стилю научной прозы.

Очень редко встречаются:

· метафоры;

· метонимии;

· гиперболы;

· сравнения;

· другие средства создания образности.

Но неверно предполагать полное отсутствие образности в научных текстах. Здесь она может быть использована как вспомогательное средство. Образность в научной прозе -- это средство проявления индивидуальной манеры изложения, которое само по себе не является обязательным для стиля научной прозы. Образность обычно усиливает, оттеняет уже аргументированную логически мысль.

Неологизмы

В научном тексте чаще, чем в иных появляются неологизмы. Это связано, с острой необходимостью новых слов:

· при изучении ранее неизвестных явлений;

· при изобретении новых устройств;

· при применении новых методов;

· при переосмыслении старого научного опыта.

В отличие от неологизмов, появляющихся в живой разговорной речи и в газетно-публицистическом стиле, неологизмы, появляющиеся в стиле научной прозы, оказываются значительно более устойчивыми. В зависимости от того, насколько широко те или иные научные открытия становятся известными широким массам, слова-неологизмы, их обозначающие, входят в фонд общеупотребительной лексики или остаются в обращении лишь в узкой области, где возник такой неологизм. В стиле научной прозы вырабатывается особая, общая для многих разновидностей этого стиля, научная фразеология (Гальперин, 1958: 425). Последнее тесно связано с возникновением терминов.

Термины

Термин -- слово или словосочетание, точно и однозначно именующее понятие и его соотношение с другими понятиями в пределах специальной сферы. Терминами обозначают вновь появляющиеся понятия, связанные с развитием науки, техники и искусства. Важно понимать, что нет однозначного соответствия между терминами и неологизмами. Не всякий научный термин является неологизмом, не всякий неологизм становится термином. Термины чаще всего лишены эмоционального значения. В отдельных случаях могут его приобретать. Кроме того, термины чаще всего характеризуются однозначностью. Однако такая однозначность может существовать только в пределах одной научной темы. А даже в рамках конкретной науки моносемантичность может быть нарушена.

Например, термин «бинарный» (binary), в математике.

Бинарный код

двоичная система счисления.

Бинарный поиск

классический алгоритм поиска элемента в отсортированном массиве.

Например, термин «архитектура» (architecture), в информатике.

Системная архитектура

фундаментальная организация системы, реализованная в ее компонентах, связях этих компонентов друг с другом и внешней средой и принципах, определяющих структуру и развитие системы.

Архитектура оборудования

используемые технические средства/решения.

Архитектура компьютера

концептуальная структура вычислительной машины, определяющая проведение обработки информации и включающая методы преобразования информации в данные и принципы взаимодействия технических средств и программного обеспечения.

Архитектура персонального компьютера

компоновка его основных частей, таких как процессор, ОЗУ, видеоподсистема,

дисковая система, периферийные устройства и устройства ввода-вывода.

Архитектура набора команд

часть архитектуры компьютера, определяющая программируемую часть ядра микропроцессора.

Микроархитектура

это способ, которым данная архитектура набора команд реализована в процессоре.

Архитектура приложений

функциональный и компонентный состав информационной системы.

Последний пример является хрестоматийным. Многие теоретики компьютерной техники признают, что термин является «одним из самых невезучих».

Но вообще, по своей природе термины оказывают большее сопротивление процессу обрастания дополнительными значениями. И казусы, описанные выше, возникают из-за рассогласования терминологии. Подобное может возникать и если термин недостаточно устоялся в какой-то определенной области. Также, важно заметить, что наличие терминов и неологизмов в научно-техническом тексте не обязательно, а является лишь средством обеспечения логичности и понятности. Научный текст или устно произнесенный научный доклад или лекция отражают работу разума и адресованы разуму, следовательно, они должны удовлетворять требованиям логического построения и максимальной объективности изложения (Арнольд, 1990: 130).

Наиболее часто встречаются в научных текстах, конечно же, не термины, а общеупотребительные слова. Интересно заметить, что строгость в употреблении терминов и привычных формулировок, в целом, более свойственна русскому научно-техническому стилю, чем английскому. Поэтому переводчик нередко чувствует себя обязанным осуществлять «стилистическую правку» оригинала, вводить вместо парафразы точный термин, разъяснять, что конкретно имеется в виду, заменять авторский оборот более привычным штампом. Одно из распространенных проявлений стилистической адаптации в научно-техническом переводе _ это стремление «закавычить» стилистические инородные элементы.

Таким образом, всю совокупность лексических особенностей можно изобразить в виде схемы:

1.3.3 Синтаксические особенности научно-технического стиля

Союзы

С точки зрения синтаксической организации предложения стиль научной прозы характеризуется точно определенной системой союзной связи, вытекающей из строгой логически последовательной системы изложения. Эта развернутая система связи вызвала к жизни многие и многие обороты предложного и наречного характера, которые стали употребляться в синтаксических функциях связующих элементов речи. Именно в этом стиле речи произошла постепенная десемантизация таких слов, как consequence result, connection и др.

В таких сочетаниях как in consequence of, as a result, in connection with и др. В стиле научной прозы находит свое наиболее яркое выражение логический синтаксис, в отличие от эмоционального синтаксиса художественной речи (Гальперин, 1958: 425).

Подобное можно увидеть не только в английском языке, но и в русском.

В научном стиле активны союзы, предлоги и предложные сочетания. В роли них могут выступать слова, обладающие самостоятельным значением в иных условиях. Прежде всего, это существительные.

Для научной речи характерно преобладание сложноподчиненных предложений, в которых союзы четко отражают причинно-следственные отношения (если... то, так что, в то время как); той же цели служит употребление местоименно-наречных и союзных слов (и потому, поэтому, следовательно, благодаря этому, в результате этого и др.). Сложноподчиненные и тем более бессоюзные предложения здесь менее употребительны (Голуб, 2003: 31).

Предлоги и союзы позволяют более определенно и точно выражать мысль.

Не только союзная связь выражает четкие логические взаимосвязи отдельных частей высказывания. Значительную роль в этом отношении в английской научной прозе играют причастные и инфинитивные обороты. Однако, в отличие от стиля газетных сообщений и газетных статей, в которых краткость изложения вызывается условиями коммуникации, в стиле научной прозы краткость не является характерной чертой стиля. Наоборот, всесторонность и убедительность доказательств выдвигаемых положений нередко требует развернутости изложения.

Структура

В стиле научной прозы весьма важную роль играют сверхфразовые единства -- абзацы. Как таковое, разбиение на абзацы скорее относится к общим особенностям научного текста. Но структура абзацев полностью повторяет с одной стороны структуру предложений, а с другой стороны логику развертывания текста в целом.

В стиле научной прозыкаждый последующий абзац раскрывает мысль, которую нес предыдущий абзац. Иногда это следование может быть очевидным, иногда происходит при помощи синтаксических структур. В каждом абзаце легко можно выделить основную мысль.

Принцип сочинения и подчинения предложений отвечают требованиям логики. Главная мысль содержится в главном предложении, подчиненная мысль -- в придаточном.

Для научно-технических материалов английского языка характерно преобладание простых предложений, которые, составляют в среднем свыше половины общего числа предложений в тексте. В то же время число сложных предложений сравнительно невелико. Это явление несвойственно соответствующему стилю в русском языке, где сложные предложения используются очень широко. В связи с этим в англо-русских технических переводах часто используется прием объединения предложений, в результате чего двум или более простым предложениям английского оригинала соответствует одно сложное предложение в русском переводе.

В английских текстах особенно часто встречаются пассивные обороты. Форма изложения в стиле научной прозы не несет дополнительных функций воздействия на читателя. Она лишь средство придать ясность изложению. Вот почему редактирование научной «прозы, в основном, сводится к уточнению значений слов и словосочетаний и характера связи между отдельными частями высказывания (Гальперин, 1958: 435).

К синтаксическим особенностям можно отнести и наличие неалфавитных

знаков в тексте. Это могут быть:

· формулы;

· символы;

· графики;

· диаграммы.

Таким образом, всю совокупность синтаксических особенностей можно изобразить в виде схемы:

1.3.4 Морфологические особенности научно-технического стиля

Авторская речь построена в первом лице множественного числа «мы»:

· наука создана содружеством большого количества учёных;

· вовлечение читателей в процесс рассуждения и доказательства:

– we are coming to realise,

– the tube has shown us,

– we are beginning to see,

– we deal with.

· множественное скромности;

Например:

As an illustration let us take the language of Euclidean geometry and algebra.(A.Einstein)

Широко употребляются безличные формы c it и конструкции с one:

· it should be borne in mind;

· it may be seen;

· one may write;

· one may show;

· one may assume;

· one can readily see;

Модальные глаголы в научных и технических текстах употребляются без отчетливой дифференциации их значений. С этим утверждением можно поспорить (например, в спецификации CSS level 2 это не так), но, в некоторых случаях, такое явление может встречаться.

Заметное предпочтение отдается пассивным и неличным формам глагола.

Не научно:

I use the same notation as previously

Научно:

The notation is the same as previously used

Преобладание именных, а не глагольных конструкций даёт возможность большего обобщения, устраняя необходимость указывать время действия.

Не научно

when we arrived

Научно

at the time of our arrival

Термины, обозначающие вещество или отвлеченное понятие, употребляются в обеих числовых формах без сдвига лексического значения и могут определяться числительными;

Например:

Normally two horizontal permeabilities are measured.

В научно-техническом тексте встречается сравнительно частое употребление настоящего продолженного и будущего вместо простого настоящего:

· today we are coming to realize that ...;

· we are beginning to see that ...;

· finally, as long as the automaton is running.

Таким образом, всю совокупность морфологических особенностей можно изобразить в виде схемы:

1.3.5 Подстили

Обычно говорят от трех подстилях научного стиля: собственно-научный; научно-учебный; научно-популярный.

Жанры собственно-научного подстиля выделяются:

· монография;

· диссертация;

· доклад и др.

Подстиль отличается строгой, академической манерой изложения. Тексты этого подстиля пишут «специалисты для специалистов». Этому подстилю противопоставлен научно-популярный подстиль. Он реализуют функцию популяризации научных знаний. Тексты этого подстиля пишут «специалисты для обывателей». Информация преподносится в доступной и занимательной форме. Отличительная черта стиля -- это соединение противоположных характеристик текста:

· логичности и эмоциональности;

· объективности и субъективности;

· абстрактности и конкретности.

В отличие от научной прозы в научно-популярной литературе значительно меньше специальных терминов и других научных средств.

Научно-учебный подстиль соединяет в себе черты собственно-научного подстиля и научно-популярного изложения.

Основные черты:

· терминологичность;

· системность в описании научных сведений;

· логичность;

· насыщенность иллюстративным материалом;

· доказательность;

· доступность.

Задача этого стиля -- быстро и понятно донести информацию в всей своей полноте.

Жанры научно-учебного подстиля:

· учебное пособие;

· лекция;

· семинарский доклад;

· ответ на экзамене.

2. К проблеме машинного перевода в современном языкознании

В настоящее время имеется достаточно широкий выбор пакетов программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы:

· электронные словари (electronic dictionary)

· системы машинного перевода (machine translation system).

Системы машинного перевода (СМП) текстов с одних естественных языков на другие моделируют работу человека-переводчика.

Их полезность зависит от того, в какой степени в них учитываются объективные законы языка и мышления. Законы эти пока еще изучены плохо. Поэтому, решая задачу машинного перевода, необходимо учитывать опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. В процессе перевода в качестве основных единиц смысла выступают не отдельные слова, а фразеологические словосочетания, выражающие понятия. Именно понятия являются элементарными мыслительными образами. Только используя их можно строить более сложные образы, соответствующие переводимому тексту. Обычно сравнивая работу машины и человека приводят следующую характеристику.

На наш взгляд, она не очень верна, и отчасти предвзята. Для проведения такого сравнения нужно знать тип СМП и принцип ее работы. Причем, когда говорят о переводе «с помощью вычислительной техники», то часто путают понятия. Вообще, в современной лингвистике можно выделить ряд направлений использования компьютера.

В этой работе мы будем подробно рассматривать системы машинного перевода. Ниже расскажем кратко о других направлениях.

2.1 Основные понятия машинного перевода

На данный момент выделяют три типа систем машинного перевода.

Полностью автоматические системы машинного перевода являются скорее несбыточной мечтой, чем реальной идей. В этой работе мы их рассматривать не будем. Все системы машинного перевода (MT-системы) работают при участии человека в той или иной мере. TM-системы иногда называют еще «памятью переводчика». Они являются скорее просто удобным инструментом, нежели элементом автоматизации.

2.1.1 Развитие машинного перевода

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет.

Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.

Задача аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П.С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914) Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетия, проблема машинного перевода все еще не решена на должном уровне. Она оказалась значительно сложнее, чем это представляли себе пионеры и энтузиасты МП конца пятидесятых _ начала шестидесятых годов прошлого века. Поэтому, оценивая сегодняшнюю реальность, уместно говорить и о разочарованиях, и о надеждах в этой области.

В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г.Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В.М. Зелко в 80-х годах. Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов.

Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.

2.1.2 Степень реализации СМП

По степени разработанности отличают следующие классы СМП:

2.1.3 Принципы оценки СМП

Сейчас достаточно очевидно, что невозможно заменить человека-переводчика машиной. Однако, можно сильно облегчить труд переводчика и повысить его производительность. Для того, чтобы судить на сколько труд переводчика стал эффективнее и проще использует следующие методы оценки СМП.

Методы отчасти являются относительными и формального критерия в принципе быть не может. На наш взгляд, наиболее адекватными являются субъективные и статистические методы. Но они применимы только для конкретной команды переводчиков и редакторов. И для каждого человека будут давать сильно разнящиеся показатели. Инженерные и программные методы позволят оценить СМП только на уровне конечного продукта.

На уровне разработки пользы от них не много.

2.1.4 Принцип действия СМП

Любая СМП в своей работе (на этапе эксплуатации) использует формальные шаги представленные на схеме.

2.2 Подходы к машинному переводу

Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.

Часто утверждается, что для успешного решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.

Как правило, метод перевода основанный на правилах использует символическое представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.

Если у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода, основанного на грамматике, оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.

Для перевода родственных языков (русский, украинский) может оказаться достаточной простая замена слов.

Современные системы машинного перевода делят на три большие группы:

· основанные на правилах;

· основанные на примерах;

· статистические.

Далее мы рассмотрим эту классификацию подробнее.

2.2.1 СМП, основанные на правилах

Системы машинного перевода основанные на правилах - общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках.

Они состоят из двуязычных словарей и грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.

На основе этих данных исходный текст последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода, которые основаны на примерах.

Принцип работы таких систем - связь структуры входного и выходного предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.

Перевод с английского на немецкий будет выглядеть как:

A girl eats an apple. Ein Madchen isst einen Apfel.

Эти системы делятся на три группы:

· системы пословного перевода;

· трансфертные системы;

· интерлингвистические;

Пословный перевод

Такие системы используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются (как есть) в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов). Так же он может быть использован для составления подстрочечника для TM-систем.

Трансфертные системы

Как трансфертные системы, так и интерлингвистические, имеют одну и ту же общую идею. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных - зависит.

Трансфертные системы работают по очень простому принципу: к входному тексту применяются правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический (а иногда и семантический) анализ текста для создания внутреннего представление. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было получено из исходного текста, строят более «абстрактное» внутренне представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.

При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:

· морфологический анализ;

· лексическая категоризация;

· лексический трансфер;

· структурный трансфер;

· морфологическая генерация.

Морфологический анализ. Слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов.

Лексические категоризации. В любом тексте некоторые слова могут иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.

Лексический трансфер. На основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.

Структурный трансфер. Слова согласуются в предложении.

Морфологическая генерация. На основе выходных данных структурного трансфера создаются словоформы переводного текста.

Одной из основных особенностей трансфеных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке. Это может работать на одном из двух уровней лингвистического анализа, или сразу на обоих.

Уровни:

1. Поверхностный (синтаксический) трансфер. Этот уровень характеризуется передачей «синтаксических структур» между исходным и переводным языком. Подходит для языков в той же семье или того же типа, например, в романских языков, между итальянским испанским, каталонским, французским, и т.д.

2. Глубинный (семантический) трансфер. Уровень характеризуется семантическим представлением. Оно зависит от языка оригинала. Это представление может состоять из ряда структур, которые представляют значение. Перевод также обычно требует структурного трансфера. Этот уровень используется для перевода между более отдаленными языками.

Интерлингвистический машинный перевод

Интерлингвистический машинный перевод - один из классических подходов к машинному переводу. Исходный текст трансформируется в абстрактное представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления. Основным преимуществом такого подхода является то, что для добавления нового языка в систему. Можно доказать математически, что в рамках этого подхода, создания каждого нового интерпретатора языка для такой системы будет удешевлять ее, по сравнению, например, с системой трансфертного перевода. Кроме того, в рамках такого подхода можно

· реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка;

· относительно простая реализация перевода сильно отличающихся языков, таких как, например русский и арабский.

Однако, до сих пор не существует реализаций такого подхода, которые бы корректно работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Сама большая сложность для создания подобных систем заключается в проектировании межъязыкового представления. Оно должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время оно должно отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.

Впервые интерлингвистический подход был предложен в 17 веке Декартом и Лейбницем, которые предложили универсальные словари, использующие числовые коды. Другие, такие как Кейв Бек, Афанасий Кирхер и Иоганн Иоахим Бехер работали над разработкой однозначного универсального языка, основанного на принципах логики и иконографики.

В 1668 году Джон Уилкинс в трактате «Опыт о Подлинной символике и философском языке» рассказал о своем интерлингва .

В 18 и 19 веков было разработано много универсальных языков, в том числе и Эсперанто. Известно, что идея универсального языка для машинного перевода, никак не проявилась на начальных этапах развития этой технологии. Вместо нее рассматривались только пары языков. Однако, в течение 1950-х и 60-х годов, исследователи в Кембридже возглавляемые Маргарет Мастерман, в Ленинграде во главе с Николаем Андреевым и в Милане Сильвио Ceccato начали работу в этой области.

В 1970-х и 1980-x годах были сделаны определенные успехи в этой области и был построен ряд систем машинного перевода.

В этом методе перевода, межъязыковое представление можно рассматривать как способ описания анализа текста, на языке оригинала. При этом, в представлении сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста.

При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. Другое - языка перевода. Перевод в данном случае производится в два этапа.

В некоторых случаях используются два и более представления одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.

Такой подход не нов для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык.

Для использования системы интерлингвистического машинного перевода необходимы:

· словари для анализа и генерации текстов;

· описание грамматик языков;

· база знаний понятий (для создания межъязыкового представления);

· правила проекции понятий для языков и представления.

Самым сложным моментом при создании такого типа является невозможность построить базу для широких областей знаний. А те базы, которые создаются для очень специфичной тематики, обладают высокой вычислительной сложностью.

2.2.2 Системы машинного перевода основанные на примерах

Перевод основанный на примерах - один из подходов к машинному переводу, при котором используется двуязычный корпус текста. Этот корпус текста во время перевода используется как база знаний. Грубо говоря, это перевод по аналогии.

Если задуматься о том, как человек переводит, то мы вряд ли придем к выводу, что переводчик осуществляет глубокий лингвистический анализ. Предполагается, что люди разлагают исходный текст на фразы, потом переводят эти фразы, а далее составляют переводной текст из фраз. Причем, перевод фраз обычно происходит по аналогии с предыдущими переводами.

Для построения системы машинного перевода, основанной на примерах потребуется языковой корпус, составленный из пар предложений.

Языковые пары -- тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком -- носителем двух языков, так и набором предложений и их переводов, выполненных человеком.

Перевод, основанный на примерах, лучше всего подходит для таких явлений как фразовые глаголы. Значения фразовых глаголов сильно зависит от контекста. Фразовые глаголы очень часто встречаются в разговорном английском языке. Они состоят из глагола с предлогом или наречием. Смысл такого выражения невозможно получить из смыслов составляющих частей. Классические методы перевода в данном случае неприменимы.

Этот метод перевода можно использовать для определения контекста предложений.

Двуязычные корпуса текста

Возникает ожидаемый вопрос, где брать такие пары. Примерами двуязычных корпусов текстов можно назвать парламентские отчеты в Канаде, Гонконге и других странах. Тексты представляют собой протоколы дебатов в парламенте. Кроме того, хорошим примером являются официальные документы Европейского экономического сообщества. Они издаются на 11 языках. Организация объединенных наций публикует документы на нескольких языках. Эти материалы оказались очень полезными для машинного перевода.

2.2.3 Статистический машинный перевод

Статистический машинный перевод -- это метод машинного перевода. Он использует сравнение больших объёмов языковых пар, так же как и машинный перевод основанный на примерах.

Статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода.

Статистический машинный перевод основан на поиске наиболее вероятного перевода предложения с использованием данных из двуязычных корпусов текстов. В результате при выполнении перевода компьютер не оперирует лингвистическими алгоритмами, а вычисляет вероятность применения того или иного слова или выражения. Слово или последовательность слов, имеющие оптимальную вероятность, считаются наиболее соответствующими переводу исходного текста и подставляются компьютером в получаемый в результате текст.

В статистическом машинном переводе ставится задача не перевода текста, а задача его расшифровки. Мы предполагаем, что статья, написанная на английском языке, на самом деле является статьей написанной на английском, но текст зашифрован (или искажен шумом). При таком подходе становится понятно почему, чем дальше языки, тем лучше работает статистический метод, по сравнению с классическими подходами.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.