Разработка алгоритма работы синтаксического анализатора текста, а также базы данных синтаксических правил русского языка

Фундамент синтаксического анализа. Словоизменительные морфологические средства. Структура системы синтаксического анализатора текста и используемая методика анализа текста. Графематический и фрагментационный анализ. Структура морфологического словаря.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 24.06.2012
Размер файла 194,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Ниже перечислены все используемые граммемы:

мр, жр, ср - мужской, женский, средний род;

од, но - одушевленность, неодушевленность;

ед, мн - единственное, множественное число;

им, рд, дт, вн, тв, пр - падежи: именительный, родительный, дательный, винительный, творительный, предложный;

св, нс - совершенный, несовершенный вид;

пе, нп - переходный, непереходный глагол;

дст, стр. - действительный, страдательный залог;

нст, прш, буд - настоящее, прошедшее, будущее время;

пвл - повелительная форма глагола;

1 л, 2 л, 3 л - первое, второе, третье лицо;

0 - неизменяемое.

кр - краткость (для прилагательных и причастий).

сравн - сравнительная форма (для прилагательных).

имя, фам - имя, фамилия.

лок, орг - локативность, организация.

кач - качественное прилагательное.

вопр, относ - вопросительность и относительность (для наречий).

дфст - слово обычно не имеет множественного числа.

опч - частая опечатка или ошибка.

жарг - жаргонизм.

Как уже было сказано, одной словоформе может соответствовать много морфологических интерпретаций. Например, у словоформы стали две интерпретации:

· {СТАЛЬ, C, «но», («жр, ед, рд», «жр, ед, дт», «жр, мн, им», «жр, мн, вн»)};

· {СТАТЬ, Г, «нп, св», («мн, дст, прш»)}.

3. Разработка базы данных синтаксических правил

База синтаксических правил состоит из двух сущностей:

· Правила

· Элементы

Структура таблицы «Правила» представлена на рисунке 3.1.

Рис. 3.1

Структура таблицы «Элементы» представлена на рисунке 3.2.

Рис. 3.2

3.1 Построение логической модели базы данных в рамках методологии IDEF

Логический уровень - это абстрактный взгляд на данные, на нем данные представляются так, как выглядят в реальном мире, и могут называться так, как они называются в реальном мире. Объекты модели, представляемые на логическом уровне, называются сущностями и атрибутами. Логическая модель данных является универсальной и никак не связана с конкретной реализацией СУБД.

IDEF1X (IDEF1 Extended) - методология описания данных, использующаяся для моделирования реляционных баз данных, имеющих отношение к рассматриваемой системе. Методология IDEF1X определяет стандарты терминологии, используемой при информационном моделировании, и графического изображения типовых элементов на диаграммах. Логическая модель базы данных синтаксических правил представлена на рисунке 3.1.1

Рис. 3.1.1

Заключение

В ходе практической работы была разработан алгоритм синтаксического анализа русскоязычных текстов база данных синтаксических правил русского языка, а так же база данных синтаксических правил. В данной программе предусмотрена печатная форма отчетности. В дальнейшем этот алгоритм и база данных могут пригодиться для разработки синтаксического анализатора текста.

Список литературы

1. Синтаксис современного русского языка. - http://www.hi-edu.ru/e-books/xbook089/01/part-002.htm

2. Автоматическая обработка текста. - http://aot.ru/docs/synan.html

3. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения. М., 1985 г.

4. Панкратов Д.В., Гершензон Л.М. Описание синтаксического анализа в системе Диалинг. -, 1999.

Размещено на Allbest.ru


Подобные документы

  • Использование переводческих трансформаций при переводе английского исторического текста. Лингвистические проблемы перевода. Стилистический разбор текста. Особенности лексического, семантического и синтаксического устройства художественного текста.

    курсовая работа [57,4 K], добавлен 18.05.2016

  • Составляющие единицы текста, сложное синтаксическое целое как текстовая единица, его структурная и внутренняя организация. Соотношение абзаца и сложного синтаксического целого. Средства связи единиц. Анализ текста по схеме профессора Солганика Г.Я.

    реферат [23,0 K], добавлен 10.11.2011

  • Структура текста, морфологический уровень. Исследование текста с лингвистической точки зрения. Прямонаправленная и непрямонаправленная связность текста. Важность морфологического уровня текста в понимании структуры текста и для понимания интенции автора.

    реферат [30,4 K], добавлен 05.01.2013

  • Ознакомление с содержанием текста, выделение в нем орфограмм и пунктограмм. Группирование слов, принадлежащих разным частям речи. Нахождение слова в тексте, употребляемого в переносном значении. Проведение синтаксического разбора сложного предложения.

    контрольная работа [15,5 K], добавлен 04.02.2012

  • Современные подходы интерпретации анализа художественно-прозаического текста с учетом его специфики, базовых категорий и понятий. Рассмотрение художественного текста как единства содержания и формы. Практический анализ текста "A Wicked Woman" Дж. Лондона.

    курсовая работа [48,5 K], добавлен 16.02.2011

  • Изучение вопросов об определении поэтической функции языка, понятие лингвистической поэтики. Сцены как вариативное начало в составе рамки содержательной конструкции текста. Понятие содержания текста. Цельный versus комплексный анализ интенции текста.

    реферат [38,4 K], добавлен 14.08.2010

  • Понятие текста в концепциях лингвистов и психолингвистов, его основные характеристики, свойства и функции. Подходы к его описанию. Природа и процесс порождения текста. Механизмы и особенности его восприятия на примере анализа художественного произведения.

    курсовая работа [47,8 K], добавлен 15.01.2014

  • Лингвостилистические особенности эпистолярного текста. Приемы реорганизации субъектной структуры текста письма при переводе с английского языка на русский. Анализ писем с точки зрения лингвистических и коммуникативно-прагматических особенностей.

    дипломная работа [97,5 K], добавлен 29.07.2017

  • Экспрессивность и ее синтаксические средства выражения. Экспрессивные возможности синтаксического построения текста. Рассмотрение особенностей парантетических внесений. Построение публичных выступлений: примеры на английском языке с переводом на русский.

    курсовая работа [129,1 K], добавлен 10.05.2015

  • Принадлежность текста к определенному стилю. Правильная расстановка знаков препинания. Основные лексические, морфологические и синтаксические черты текста. Ошибки в употреблении существительных, прилагательных, числительных. Расстановка ударения в словах.

    контрольная работа [17,9 K], добавлен 24.05.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.