Лингвистическое обеспечение искусственного интеллекта

Искусственный интеллект. История разработки систем искусственного интеллекта. Связь искусственного интеллекта с другими дисциплинами. Информатика в обществе. Психолингвистика. История развития психолингвистики. Лингвопсихология. Теория интерпретации.

Рубрика Иностранные языки и языкознание
Вид реферат
Язык русский
Дата добавления 14.12.2008
Размер файла 46,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Система ОЕЯ, разумеется, - не самоцель. Ее задачи упорядочены и определяют «уровни ОЕЯ». Так, неязыковым целям подчинены процедуры, направляющие любой вид ОЕЯ; этим процедурам, в свою очередь, подчинен уровень речевых актов (при интерпретации или порождении отдельных высказываний). Самый низкий уровень составляют процедуры собственно языковой обработки (языковой анализ).

Общими для предложенных систем ОЕЯ являются следующие компоненты: ЕЯ -> ФР -> ИНТ -> СОД -> БД. А именно, естественно-языковой вход (ЕЯ) переводится в форму репрезентации (ФР) знаний; интерпретатор (ИНТ) устанавливает связь между репрезентацией для положений дел в (ФР) и, посредством языка системы обработки данных (СОД), банком данных (БД). В рамках этих систем операции, связанные с обработкой текста («лингвистические вычисления» обладают различными свойствами; анализ проведенных на сегодняшний день разработок показывает скорее не то, в чем они состоят, а то, чем эти операции не являются: они работают не исключительно аддитивно, не исключительно одна за другой (последовательно), не исключительно на микроуровне и не статистическим образом.

История ОЕЯ

Предыстория ОЕЯ определена многими факторами, из которых можно выделить в особенности два: 1) попытки моделирования нейронов в виде логического устройства, связанные с именами МакКаллоу и Питтса; 2) зарождение «информационной» парадигмы - взгляда на числа и на текст как на то, что представляет общее понятие «информации» (Шеннон), обладающее количественными характеристиками, со всеми вытекающими последствиями для математической теории информации. Понятие «информативность» принадлежит указанной парадигме.

Собственно же историю ОЕЯ иногда представляют как состоящую из трех этапов:

1. Начало 1950-х - начало 1960-х годов. Идея «информации» привела к концепции «машинного перевода» как установления той информации, которая скрыта за предложением на естественном языке, и выражения ее на другом - целевом языке. Язык информационного содержания был назван «языком-посредником». На этом этапе была введена и идея эвристического поиска, а также языка программирования для решения задач ОЕЯ (наиболее популярным языком, начиная с этого времени, был ЛИСП, введенный и описанный впервые в работе.

2. «Эпоха обработки семантической информации» (примерно 1962-1973 гг.). Ее основные идеи: а) необходимо использовать ограниченные содержательные области для моделирования ОЕЯ; б) следует построить как можно больше систем для обработки ограниченных подъязыков, присвоив этим системам статус «экспертов» в таких областях, а затем объединить все эти системы в одну, в рамках «крупного эксперта», определяющего, какой из подчиненных должен начать работать на конкретном этапе обработки, при решении конкретной задачи - концепция «крупного переключения»; в) использование «ключевых слов», управляющих выбором конкретных действий по ходу обработки текста; г) перевод естественного языка на формальные языки (некоторые из формальных языков при этом обладают собственными исчислениями, типа исчисления предикатов формальной логики; имеются языки поиска в базе данных. Эту эпоху иногда называют эрой «инженерного подхода»: основной упор делался на решение конкретных (как правило, прикладных) задач, без попытки моделировать психологическую реальность.

Начало 1970-х годов ознаменовалось интересом к обработке семантической информации; появились даже первые ростки интереса ж «когнитивной науке» (названной в те же годы «когитологией»).

В результате исследований этой «эпохи» выяснилось: а) даже в очень простых ситуациях (использование языка гораздо более разнопланово, чем можно было бы ожидать; б) специализация той или иной системы ОЕЯ и перспектива расширения этой системы находятся в серьезном конфликте между собой; в) репрезентации для языковых выражений, используемые в рамках таких систем (скажем, формальные языки), весьма неточны и неадекватны выразительным способностям естественного языка; г) приходится поступиться очень многими типами выражений, реально используемых на естественном языке (в частности, выражениями для физических событий и действий, описаниями сцен, карт, путей, предписаниями; реальными разговорами, спорами, дебатами, обсуждениями, эмоционально окрашенными высказываниями и высказываниями об эмоциональных состояниях; метаописаниями теорий; поэтическим языком, юмором, иронией, ложью и т.п. - т.е. всем, что требует гораздо более богатого метаязыка, чем тот, который могут на сегодняшний день предоставить в наше распоряжение существующие нотации логики).

3. Современная эпоха (1970-1995 гг.). В это время в центре внимания находятся следующие проблемы: а) соотнесенность речевых актов, фокусов внимания и общих (для ЭВМ и человека) презумпций; б) использование «новаторского» потенциала языка (в частности, интерпретация метафор); в) постройте прикладных систем, понимающих естественный язык (а не просто его обрабатывающих), г) обработка высказываний о пространственных событиях; д) введение факторов «здравого смысла» в состав логического вывода систем ОЕЯ, в частности, учет степени правдоподобности при интерпретировании высказываний.

Система, «понимающая» естественный язык

Смоделировать понимание и обработку естественного языка - это не одно и то же. Так, мы можем (не понимая полностью или частично) манипулировать символами, повторить сказанное на чужом (и непонятном нам) языке и т.п. Все это, пусть огрубление, соответствует ситуации ОЕЯ без понимания. С другой стороны, сам факт того, что мы нечто понимаем, равносилен тому, что мы над выражением производим определенные лингвистические операции. Таким образом, понимание естественного языка - специальный случай ОЕЯ. Многие из построенных систем ОЕЯ не понимают естественного языка в том смысле, который разумно вкладывать в термин «понимание».

Прежде всего, не все такие системы обладают целенаправленностью: выработка собственных целей, планирование, воплощение стратегий в виде тех или иных тактических приемов, «прослеживание» результатов этих приемов и предсказание (предвидение) дальнейших результатов - все это пока еще не более чем проект хорошей системы ОЕЯ. Так, система SHRDLU обладает системой планирования, но цели в ней достигаются не посредством высказываний; и кроме того, эта система не в состоянии распознавать цели человека: в диалоге с ЭВМ именно человек обладает инициативой. Несколько более замаскировано отсутствие целенаправленности в системах ЭЛИЗА и ДОКТОР. Только сравнительно недавно целенаправленность и моделирование намерений вошли в круг интересов разработчиков ОЕЯ.

Другое временное упущение: понять новое высказывание в диалоге или в тексте - значит, кроме прочего, связать его с тем, что было сказано раньше. В системах «искусственного интеллекта» эта задача решается, в основном, опосредованно, в два шага:

1) сначала, на основании протокола анализа предшествующего диалога или текста, активируются «фреймы», или «скрипты» (т.е., неформально говоря, те схемы из базы знаний, в которые можно уложить поступившую новую информацию), а затем

2) новое, текущее сообщение сопоставляется с этими схемами (но не с предшествующими предложениями непосредственно).

В результате, в частности, упускается такая возможность, реально используемая на самом деле в общении между людьми, как «ловля на слове», непоследовательность в употреблении терминов и т.п.

Третье отличие состоит в слабой реализованности влияния контекста непосредственно на направление работы анализатора. Так, в большинство систем ОЕЯ имеется две отдельные подсистемы: а) анализатор («парзер») перерабатывает входной текст в некоторую промежуточную форму (на язык синтаксических деревьев - как в системах типа, на упрощенный естественный язык - как в работе или на язык понятийных примитивов - как у Шенка), а затем б) подсистема логического вывода строит репрезентацию для значения входного текста (посредством заполнения недостающих деталей в репрезентации, полученной на выходе из анализатора); тогда включаются те неупомянутые события, которые связывают в единое целое факты, упоминаемые в тексте. Часто представленные другие компоненты (система ответа на вопросы и система построения аннотации к статье) скорее демонстрируют достигнутость понимания, чем являются частью процесса понимания. Назначение промежуточного представления для значения текста всегда одно и то же: защитить систему логического вывода от «капризов» естественного языка. Однако эта направленность не выдержана последовательно: логический вывод всегда бывает при этом связан с дополнительным анализом - на основе теперь уже промежуточной репрезентации. Но на работе анализатора никак не сказывается (в названных системах) то, к каким выводам придет система логического вывода. Попытка восполнить это упущение сделана разработчиками системы FRUMP, где знания о мире отделены от чисто языковых сведений, не где, тем не менее, контекстная информация влияет на процесс анализа, В этой системе содержатся, среди прочего, два модуля: Предсказыватель (предсказывает ограничения на то, что может дальше появиться в тексте) и Выяснитель (верифицирует эти гипотезы Предсказывателя). Однако эта система находится в стадии проектирования.

Другой вид проблем: отношение между синтаксисом и семантикой в рамках анализа предложения. Имеем здесь, как минимум, три возможности:

1) при переходе от предложения к представлению его значения сначала полностью восстанавливается синтаксическая структура предложения; на втором же этапе эта структура переводится в семантическое представление;

2) между синтаксисом и семантикой нет никаких барьеров, семантическая структура получается прямо, исходя из текстового вида предложения;

3) построение частичных синтаксических репрезентаций перемежается установлением частичных же семантических репрезентаций (т.е. синтаксис и семантика различаются, не в анализа взаимодействуют не прямолинейным образом). Третье решение является компромиссным между первыми двумя; в особенности оно удовлетворяет противников последовательного анализа, которые считают, что при ОЕЯ необходимо допускать возможность той ситуации, когда различные типы информации и процедур вызываются более одного раза на различных этапах обработки входного выражения.

В обобщенном виде компромиссный подход может быть охарактеризован как «модульная концепция ОЕЯ». Одно из достоинств этого подхода - организационное упрощение: можно разделить всю задачу на несколько подзадач, которые поручаются разным исследователям или группам исследователей; получаемые же в результате «модули» работают во взаимодействии друг с другом, но не «вмешиваясь» во внутреннюю технику операций друг друга.

Несомненно, переработка естественного языка в целях создания лингвистического обеспечения искусственного интеллекта представляет собой процесс, сложность которого трудно переоценить. Попытки создать «естественный язык для искусственного интеллекта» предпринимаются снова и снова, так что представляется вполне возможным, что в ближайшем будущем появится система языка для искусственного разума, идентичная естественной.

Заключение

Последние 20 лет в центре внимания разработчиков искусственного интеллекта находится вопрос о моделировании той деятельности человека, результатом которой является речь.

Описание процессов получения, переработки, хранения и передачи информации затрудняется тем, что данные процессы происходят в мозге человека и недоступны для непосредственного исследования.

Высказывается мнение, что, изучая процесс обработки языка в мозге человека, исследователь мысленно прослеживает тот путь, который проходит этот человек, воспринимая и интерпретируя какой-либо текст.

Исследования процессов обработки языка непосредственно связаны с прикладными задачами. На их основе разрабатываются модели лингвистического обеспечения искусственного интеллекта.

В данной работе я не стала останавливаться на всех методиках анализа и обработки естественного языка, так как вопрос лингвистического обеспечения искусственного интеллекта весьма обширен. По той же причине в предложенном подходе были рассмотрены исключительно общие положения и некоторые примеры к ним. Был затронут только синтаксический подход, кроме которого существует также, например, морфологический и лексический.

Использованная литература:

1. Демьянков В.З. Основы теории интерпретации и ее приложения в вычислительной лингвистике, М.: Изд-во Моск. ун-та, 1985

2. Краткий словарь когнитивных терминов, М.: Филологический факультет МГУ им. М.В. Ломоносова, 1996

3. Мышление, когнитивные науки, искусственнный интеллек,т М.: Центральный совет философских (методологических) семинаров при Президиуме АН СССР, 1988.


Подобные документы

  • Понятие и характеристики знаковой системы. Репрезентативная и коммуникативная функции естественного языка. Роль его формализации в научном познании и логике. Основные семантические категории искусственного языка, уровни его организации, сфера применения.

    реферат [26,3 K], добавлен 28.11.2014

  • Сконструированные языки, их различие по специализации и назначению и определение степени сходства с естественными языками. Основные виды искусственных языков. Невозможность применения искусственного языка в жизни как главный недостаток его изучения.

    контрольная работа [12,4 K], добавлен 19.04.2011

  • Исследование роли изучения иностранных языков в развитии международного туризма и межкультурных коммуникациях. История создания варшавским врачом-окулистом Людвигом Заменгофом первого в мире искусственного языка эсперанто; его популярность в ХХ веке.

    курсовая работа [10,3 K], добавлен 18.05.2011

  • Исследование структуры речевого акта, являющегося в свою очередь объектом исследования новой риторики и психолингвистики. Предыстория появления неориторических наук. Анализ неориторических концепций XX века. Анализ дебатирования и речевой педагогики.

    курсовая работа [49,0 K], добавлен 15.11.2009

  • Понятие перевода как вида языковой коммуникативной творческой деятельности человека. Предмет и методы исследования теории перевода, история ее становления и развития, современные тенденции и перспективы, взаимосвязь с другими науками на сегодняшний день.

    презентация [767,5 K], добавлен 22.12.2013

  • Стилистика как наука, ее объект, предмет, цели и задачи. Направления современной стилистики, лингвистические и экстралингвистические факторы. Связь стилистики с другими лингвистическими дисциплинами. Экспрессивность, эмоциональность и оценочность.

    шпаргалка [84,5 K], добавлен 21.06.2011

  • Понятие языкознания как учебной дисциплины, его сущность и особенности, методы и этапы изучения, история зарождения и становления. История и особенности лингвистических учений как составной части языкознания, ее периодизация и структурный состав.

    реферат [19,8 K], добавлен 26.02.2009

  • Язык как выражение народного духа, состояния интеллекта и образованности, общественного и личного настроения, воли, движений души, стиля жизни современного общества. Изменение языковой культуры и отношения к русскому языку. Понижение грамотности письма.

    эссе [11,5 K], добавлен 02.12.2012

  • Когнитивная лингвистика ставит перед собой задачу выявить возможности разной (в зависимости от языка) категоризации определённых перцептуально или концептуально заданных ситуаций.

    реферат [12,0 K], добавлен 23.05.2004

  • Анализ восприятия интеллекта носителями русского языка (по данным русского ассоциативного словаря). Специфика пословиц, отражающих отношение русского человека к интеллекту. Особенности восприятия мужского и женского ума в русских и английских пословицах.

    курсовая работа [29,3 K], добавлен 13.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.