Разработка модуля контроля знаний именного склонения для интеллектуальной системы обучения русскому языку как иностранному

Анализ существующих программных решений для обучения студентов и контроля их знаний. Обзор лингвопроцессорных средств и обоснование их выбора. Алгоритмы решения и проверки упражнений на именную часть русского языка. Применение правил преобразования.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 29.01.2015
Размер файла 97,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

4. После склонения главных слов требуется склонять зависимые слова. Однако по правилам русского языка склоняются лишь те слова, которые находятся с главным в связи типа согласование. В согласование вступают прилагательные (и местоимённые прилагательные), притяжательные местоимения, числительные, а также существительные, выполняющие роль приложения. То есть, среди слов, зависимых от данного, нужно найти все прилагательные, притяжательные местоимения, числительные и существительные с синтаксической функцией приложение и поставить в требуемую форму.

5. После того как зависимые слова поставлены в нужную форму, остаётся лишь удалить скобки (если они были).

6. Правильный ответ готов.

После генерации правильного ответа нужно провести синтаксический анализ ответа студента. После этого происходит сравнение синтаксических деревьев по алгоритму, описанному в пункте 4.1.

Также, студенту нужно вернуть текстовое представление правильного ответа. Оно получается по следующему алгоритму:

1. В результат записываются последовательно все слова, не являющиеся подставленными автоматически при анализе. Знаки препинания также считаются словами.

2. Если слово оказалось в начале предложения, то оно пишется с прописной буквы.

3. Если слово является именем собственным, оно также пишется с прописной буквы.

4. Если слово в оригинале было написано с большой буквы и, при этом, не находилось в начале предложения, оно должно быть написано с прописной буквы.

5. После этого удаляются лишние пробелы перед (или после) знаками препинания, дублирующие пробелы заменяются одинарными.

6. Результат возвращается студенту.

4.3 Алгоритм проверки упражнений типа «Склонение с числами»

При реализации данного алгоритма проверки пришлось немного изменить алгоритм склонения из предыдущего типа. Причина этого кроется в том, что при постановке слова во множественное число не всегда соблюдается согласование слов. Об этом подробнее говорилось при описании данного типа. Чтобы обойти данную проблему, было введено такое понятие как форма для зависимых слов. Теперь при склонении словосочетаний зависимым словам может присваиваться форма, отличная от той, которая присваивается главному слову.

Алгоритм генерации правильного ответа выглядит следующим образом:

1. Выделение из текста слова, содержащего одни цифры.

2. Если число кончается на единицу, и при этом предпоследняя цифра -- не 1, форма для главного слова и для зависимых слов -- именительный падеж, единственное число.

3. Если число кончается на 2, 3 или 4 и предпоследняя цифра -- не единица, форма для главного слова -- родительный падеж, единственное число, а для зависимых слов -- родительный падеж, множественное число.

4. В ином случае форма и для главного слова, и для зависимых -- родительный падеж, множественное число.

5. Далее происходит склонение слов в указанные формы.

6. После этого получается текстовое представление ответа машины.

7. Это текстовое представление сравнивается с текстовым представлением ответа студента.

4.4 Алгоритм проверки упражнений типа «Ответить по модели»

В упражнениях этого типа преподаватель вводит модель, которая анализируется системой. Модель, фактически, показывает, как преобразовать вопрос в ответ. Мы выделяем следующие виды преобразований:

1. Склонение слов в скобках.

2. Удаление слов.

3. Вставка новых слов.

4. Замена слов.

5. Перестроение дерева.

Смысл этих преобразований был рассказан в пункте 2.2. Здесь мы подробнее остановимся на алгоритмах данных преобразований. Данные алгоритмы должны последовательно применяться к исходному предложению. В результате их работы должен получаться верный ответ.

4.4.1 Выявление преобразований

Для выявления необходимых преобразований используются два синтаксических дерева: дерево модели вопроса (ДМВ) и дерево модели ответа (ДМО). В результате работы каждого из приведённых ниже алгоритмов получается список преобразований данного типа. После создания списка преобразований очередного типа, происходит преобразование ДМВ в соответствии с выявленным списком.

Склонение слов в скобках

Для того чтобы просклонять слова в скобках, требуется сначала определить форму, в которую их нужно ставить. Так как мы работаем над именной частью русского языка, формой этой будет число и падеж. Для определения нужной формы сначала выделяется главное слово в скобках (это слово, которое не имеет родителя). Если таких слов несколько, то берётся первое из них. Далее в ДМО ищется слово с такой же нормальной формой, как у главного слова из скобок. При нахождении такого слова создать правило склонения слов в скобках, в котором будет содержаться падеж и число этого слова. Также, после этого нужно просклонять слова в скобках в запомненную форму. Пример:

Вы смотрите фильм? (программа «Новости»)

Нет, я смотрю программу «Новости».

Главным словом в скобках является слово «программа». В ДМО оно стоит в винительном падеже единственного числа. Следовательно, слова из скобок нужно ставить в эту форму. После работы алгоритма исходное предложение будет выглядеть так:

Вы смотрите фильм? (программу «Новости»)

А в списке правил преобразования будет одно правило, предписывающее склонять слова из скобок в форму единственного числа винительного падежа.

Удаление

Для того чтобы определить, слова с какими синтаксическими функциями требуется удалить из предложения, нужно сравнить каждую ветку ДМВ с каждой веткой ДМО. При отсутствии какой-либо ветки формируется правило удаления этой ветки. В правиле содержится лишь синтаксическая функция удаляемого слова. При этом следует учитывать, что при ответе на вопросы меняется форма местоимений. Также удаляются все знаки препинания, отсутствующие в ДМО.

Проиллюстрируем это на примере:

Вы смотрите фильм? (программу «Новости»)

Нет, я смотрю программу «Новости».

Модель вопроса состоит из двух предложений, соответственно в ней два корня. Проверяем наличие первого корня («смотреть») в ДМО. Затем проверяем наличие слова «вы» в ДМО. Его там нет, но есть замена для него -- слово «я». Значит слово «вы» не должно удаляться. Теперь проверяем наличие слова «фильм». Оказывается, что его нет в ДМО, поэтому формируется правило, что из вопроса требуется удалять прямое дополнение (коим и является слово «фильм»). Вся ветка, начинающаяся со слова «программа» присутствует в ДМО. Кроме прямого дополнения нужно удалять ещё знак вопроса и скобки, которые также отсутствуют в ДМО.

В результате получается следующее:

Вы смотрите программу «Новости»

Вставка новых слов

Эта операция аналогична удалению, только здесь алгоритму предстоит добавлять в ДМВ слова из ДМО, которые пока отсутствуют в ДМВ. Покажем это на примере. Сейчас в ДМВ отсутствуют слово «Нет» и знаки препинания: запятая и точка. Слово «Нет» присоединяется к слову «смотрите». Ему назначается синтаксическая роль частица. Запятая вставляется после слова с синтаксической ролью частица. Точка вставляется в конец предложения. В результате исходное предложение будет выглядеть так:

Нет, Вы смотрите программу «Новости».

Замена слов

Этот этап выполняется, если в данном упражнении происходит смена вопроса на ответ, либо утвердительного предложения на вопросительное. В этом случае происходит замена местоимений первого лица на второе и наоборот. Следует отметить, что в результате работы этого правила может получиться несколько вариантов ответа. Рассмотрим наш пример.

В данном случае нужно заменять слово «Вы» на местоимение первого лица: местоимение «мы» или местоимение «я». При этом также требуется склонять главный для местоимения глагол в нужную форму. В результате проведённой замены мы получим два ответа:

Нет, я смотрю программу «Новости».

Нет, мы смотрим программу «Новости».

Эти ответы выглядят как правильные, однако если взглянуть на получившееся дерево, мы заметим, что оно некорректно:

смотрю

+ нет

L я

программу

L Новости

смотрим

+ нет

L мы

программу

L Новости

Перестроение дерева

Под перестроением дерева понимается восстановление правильного вида дерева. Здесь происходит сравнение текущего дерева с ДМО. В случае каких-либо несоответствий формируется правило, устраняющее их.

Для данного примера таким несоответствием является то, что прямое дополнение сейчас не присоединено к сказуемому. Создаётся правило, исправляющее данную ситуацию:

смотрим

+ нет

+ мы

L программу

L Новости

В результате мы получаем полностью идентичное ответу дерево. После всех преобразований у нас формируется список правил, применяя которые мы можем преобразовывать и другие вопросы из упражнения.

4.4.2 Применение правил преобразования

Рассмотрим, как будет преобразован следующий вопрос:

Они строят магазин? (больница)

Первое правило заставляет алгоритм склонять слово «больница» в винительный падеж:

Они строят магазин? (больницу)

Следующее правило говорит о том, что должны быть удалены прямое дополнение («магазин»), а также вопросительный знак и скобки:

Они строят больницу

Далее вставляются слово «Нет» и знаки препинания: точка и запятая:

Нет, они строят больницу.

Далее должна происходить замена слов, однако в данном случае она не требуется, так как в нашем примере нет местоимений первого или второго лица. Поэтому следующим шагом формируется окончательное дерево решения:

строят

+ Нет

+ они

L больницу

4.5 Недостатки алгоритмов

Большим недостатком разработанных алгоритмов является возникновение ошибок при отклонении от модели задачи. Например, если с той же моделью попробовать преобразовать предложение «Они играют в футбол? (баскетбол)», то получится ответ: «Нет, они играют баскетбол», так как предлог «в» не предусматривается моделью. Он будет удалён вместе с дополнением «футбол».

Также, в заданиях «Ответить по модели» не могут употребляться разные предлоги. То есть, к примеру, в Упражнение 1 мы не можем вставить выделенный вопрос:

Упражнение 1.

Раскройте скобки по модели.

Модель: Я люблю гулять (город) -- Я люблю гулять по городу.

1) Максим едет (дорога).

2) Елена после учёбы ходила (магазины).

3) Девушка идёт (улица).

4) Луиза зашла (друг).

Четвёртый вопрос будет обработан неверно. Система вернёт ответ: «Луиза зашла по другу», что, конечно, неверно.

По тем же причинам нельзя в одном задании типа «Ответить по модели» использовать разные вопросительные слова.

Чтобы устранить проблемы, вызванные отклонениями от модели, нужно накапливать в системе модели предложений и их возможных изменений. Также требуется разработать механизм, который будет определять принадлежность того или иного предложения определённой модели. Это позволит постепенно уйти от необходимости задавать модель в некоторых упражнениях (например, в упражнениях, в которых требуется ответить на вопрос, используя слова из скобок). Также это позволит сделать общение с системой более естественным.

Что касается проблем связанных с разными предлогами, то здесь пока сложно что-то исправить. Ведь выбор правильного предлога требует понимания контекста, а как было показано в главе 3, современные лингвистические процессоры пока не могут этого позволить. Данная проблема будет одним из направлений моего исследования в аспирантуре.

Заключение

Итак, исходя из целей работы, сделаем выводы. Имеющиеся на рынке системы автоматизированного обучения не упрощают преподавателям задачу обучения студента, а скорее усложняют её за счёт несовершенства применяемых в них средств контроля знаний. С целью снять имеющиеся в таких системах ограничения была начата разработка системы КЛИОС, составной частью которой является интеллектуальный модуль проверки упражнений, который является предметом данной работы.

В ходе проведённой работы были проанализированы имеющееся на рынке лингвистическое программное обеспечение. Исходя из результатов тестирования лингвистических процессоров, были выбраны два наиболее подходящих для решения поставленной задачи.

На их основе были разработаны алгоритмы проверки упражнений на именную часть русского языка. Кроме проверки, система может сама генерировать правильный ответ на упражнения большинства рассмотренных типов. Это позволяет повысить эффективность труда преподавателя и даёт возможность использовать систему в качестве тренажёра для самостоятельного обучения. Также, как было показано в четвёртой главе, результаты проверки упражнений могут быть использованы для корректировки личного плана обучения студента.

Результаты работы применены в системе КЛИОС и используются преподавателями русского языка кафедры РКИ на подготовительных курсах. В дальнейшем работа будет развиваться, добавятся упражнения по системе глагола.

Список литературы

1. Лелюхина О.А. Обучение иностранных студентов // Национальный исследовательский Томский политехнический университет: [сайт]. [2013].

2. Колтунов И.И., Николаенко А.В., Фатеев И.В. Методологическое обоснование дистанционного обучения на основе современных информационных технологий // Материалы международной научно-технической конференции ААИ «Автомобиле- и тракторостроение в России: приоритеты развития и подготовка кадров». Москва. 2010. Книга 12.

3. Епифанова М.А., Железовский А.Б., Шнейдер М.Е. Влияние мультимедийных средств на реализацию основных принципов обучения // Высшее профессиональное образование: современные тенденции, проблемы, перспективы: Сб. научных трудов Седьмой Международной заочной научно-методической конференции. Саратов. 2010. сс. 146-151.

4. Савинов А.П., "Интеллектуальные лингвопроцессорные тренажеры для интенсивного усвоения русского языка как иностранного. Концепции их построения и проблемы," Известия ТПУ, [в печати].

5. Features tour // MoodleDocs: [сайт]. [2013].

6. Blackboard, Inc // Wikipedia, the free encyclopedia: [сайт]. [2013].

7. Система дистанционного обучения «СТ Курс». Челябинск: 2004. Презентация.

8. Смирнова Н.В. Следящие интеллектуальные обучающие системы: состояние и перспективы // In: Интеллектуальные системы управления. Коллективная монография под редакцией акад. РАН Васильева С. Н. Москва: Машиностроение, 2010.

9. Седунов А.А. Модель графематического анализа в системе обработки естественного языка // Вестник Воронежского государственного университета. 2007. No. 2.

10. Технологии // АОТ: [сайт]. [2003].

11. Азбучные истины | 7. Буква ё // ГРАМОТА.РУ -- справочно-информационный интернет-портал «Русский язык»: [сайт].

12. Описание программного пакета синтаксического разбора и машинного перевода Cognitive Dwarf. Москва: 2006. Документ.

13. Синтаксический анализатор // ООО Диктум: [сайт]. [2013].

14. Коробов М. Морфологический анализатор pymorphy2 // Морфологический анализатор pymorphy2: [сайт]. [2013].

15. Андреев С. Синтаксический и семантический анализ текстов // ABBYY: [сайт]. [2011].

16. Именные части речи, их общие и отличительные признаки // Naexamen.ru: [сайт]. [2011].

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.