Разработка алгоритма работы синтаксического анализатора текста, а также базы данных синтаксических правил русского языка
Фундамент синтаксического анализа. Словоизменительные морфологические средства. Структура системы синтаксического анализатора текста и используемая методика анализа текста. Графематический и фрагментационный анализ. Структура морфологического словаря.
Рубрика | Иностранные языки и языкознание |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 24.06.2012 |
Размер файла | 194,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Ниже перечислены все используемые граммемы:
мр, жр, ср - мужской, женский, средний род;
од, но - одушевленность, неодушевленность;
ед, мн - единственное, множественное число;
им, рд, дт, вн, тв, пр - падежи: именительный, родительный, дательный, винительный, творительный, предложный;
св, нс - совершенный, несовершенный вид;
пе, нп - переходный, непереходный глагол;
дст, стр. - действительный, страдательный залог;
нст, прш, буд - настоящее, прошедшее, будущее время;
пвл - повелительная форма глагола;
1 л, 2 л, 3 л - первое, второе, третье лицо;
0 - неизменяемое.
кр - краткость (для прилагательных и причастий).
сравн - сравнительная форма (для прилагательных).
имя, фам - имя, фамилия.
лок, орг - локативность, организация.
кач - качественное прилагательное.
вопр, относ - вопросительность и относительность (для наречий).
дфст - слово обычно не имеет множественного числа.
опч - частая опечатка или ошибка.
жарг - жаргонизм.
Как уже было сказано, одной словоформе может соответствовать много морфологических интерпретаций. Например, у словоформы стали две интерпретации:
· {СТАЛЬ, C, «но», («жр, ед, рд», «жр, ед, дт», «жр, мн, им», «жр, мн, вн»)};
· {СТАТЬ, Г, «нп, св», («мн, дст, прш»)}.
3. Разработка базы данных синтаксических правил
База синтаксических правил состоит из двух сущностей:
· Правила
· Элементы
Структура таблицы «Правила» представлена на рисунке 3.1.
Рис. 3.1
Структура таблицы «Элементы» представлена на рисунке 3.2.
Рис. 3.2
3.1 Построение логической модели базы данных в рамках методологии IDEF1Х
Логический уровень - это абстрактный взгляд на данные, на нем данные представляются так, как выглядят в реальном мире, и могут называться так, как они называются в реальном мире. Объекты модели, представляемые на логическом уровне, называются сущностями и атрибутами. Логическая модель данных является универсальной и никак не связана с конкретной реализацией СУБД.
IDEF1X (IDEF1 Extended) - методология описания данных, использующаяся для моделирования реляционных баз данных, имеющих отношение к рассматриваемой системе. Методология IDEF1X определяет стандарты терминологии, используемой при информационном моделировании, и графического изображения типовых элементов на диаграммах. Логическая модель базы данных синтаксических правил представлена на рисунке 3.1.1
Рис. 3.1.1
Заключение
В ходе практической работы была разработан алгоритм синтаксического анализа русскоязычных текстов база данных синтаксических правил русского языка, а так же база данных синтаксических правил. В данной программе предусмотрена печатная форма отчетности. В дальнейшем этот алгоритм и база данных могут пригодиться для разработки синтаксического анализатора текста.
Список литературы
1. Синтаксис современного русского языка. - http://www.hi-edu.ru/e-books/xbook089/01/part-002.htm
2. Автоматическая обработка текста. - http://aot.ru/docs/synan.html
3. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения. М., 1985 г.
4. Панкратов Д.В., Гершензон Л.М. Описание синтаксического анализа в системе Диалинг. -, 1999.
Размещено на Allbest.ru
Подобные документы
Использование переводческих трансформаций при переводе английского исторического текста. Лингвистические проблемы перевода. Стилистический разбор текста. Особенности лексического, семантического и синтаксического устройства художественного текста.
курсовая работа [57,4 K], добавлен 18.05.2016Составляющие единицы текста, сложное синтаксическое целое как текстовая единица, его структурная и внутренняя организация. Соотношение абзаца и сложного синтаксического целого. Средства связи единиц. Анализ текста по схеме профессора Солганика Г.Я.
реферат [23,0 K], добавлен 10.11.2011Структура текста, морфологический уровень. Исследование текста с лингвистической точки зрения. Прямонаправленная и непрямонаправленная связность текста. Важность морфологического уровня текста в понимании структуры текста и для понимания интенции автора.
реферат [30,4 K], добавлен 05.01.2013Ознакомление с содержанием текста, выделение в нем орфограмм и пунктограмм. Группирование слов, принадлежащих разным частям речи. Нахождение слова в тексте, употребляемого в переносном значении. Проведение синтаксического разбора сложного предложения.
контрольная работа [15,5 K], добавлен 04.02.2012Современные подходы интерпретации анализа художественно-прозаического текста с учетом его специфики, базовых категорий и понятий. Рассмотрение художественного текста как единства содержания и формы. Практический анализ текста "A Wicked Woman" Дж. Лондона.
курсовая работа [48,5 K], добавлен 16.02.2011Изучение вопросов об определении поэтической функции языка, понятие лингвистической поэтики. Сцены как вариативное начало в составе рамки содержательной конструкции текста. Понятие содержания текста. Цельный versus комплексный анализ интенции текста.
реферат [38,4 K], добавлен 14.08.2010Понятие текста в концепциях лингвистов и психолингвистов, его основные характеристики, свойства и функции. Подходы к его описанию. Природа и процесс порождения текста. Механизмы и особенности его восприятия на примере анализа художественного произведения.
курсовая работа [47,8 K], добавлен 15.01.2014Лингвостилистические особенности эпистолярного текста. Приемы реорганизации субъектной структуры текста письма при переводе с английского языка на русский. Анализ писем с точки зрения лингвистических и коммуникативно-прагматических особенностей.
дипломная работа [97,5 K], добавлен 29.07.2017Экспрессивность и ее синтаксические средства выражения. Экспрессивные возможности синтаксического построения текста. Рассмотрение особенностей парантетических внесений. Построение публичных выступлений: примеры на английском языке с переводом на русский.
курсовая работа [129,1 K], добавлен 10.05.2015Принадлежность текста к определенному стилю. Правильная расстановка знаков препинания. Основные лексические, морфологические и синтаксические черты текста. Ошибки в употреблении существительных, прилагательных, числительных. Расстановка ударения в словах.
контрольная работа [17,9 K], добавлен 24.05.2012