Теория языков программирования и методы трансляции

Детерминированная автоматная модель синтаксического анализатора. Исследование структуры разработанной программы, требования к функциональности, Основные элементы и принципы реализации. Листинг спроектированной программы и анализ полученных результатов.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 11.12.2015
Размер файла 69,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Введение

программа анализатор автоматный

Для интерпретации языков программирования необходимы компиляторы, в основе которых лежат синтаксические и семантические анализаторы. Для построения простейшего компилятора целесообразно использовать современные утилиты для лексического разбора такие как flex и bison, позволяющие на основе набора лексем, описании грамматики языка, сгенерировать программный код, выполняющий разбор введенного текста.

Лисп - семейство языков программирования, основанных на представлении программы системой линейных списков символов, которые притом являются основной структурой данных языка. Лисп считается вторым после Fortran старейшим высокоуровневым языком программирования.

Большим достоинством Лиспа является его функциональная направленность, т. е. программирование ведется с помощью функций. Причем функция понимается как правило, сопоставляющее элементам некоторого класса соответствующие элементы другого класса. Сам процесс сопоставления не оказывает никакого влияния на работу программы, важен только его результат - значение функции. Это позволяет относительно легко писать и отлаживать большие программные комплексы. Ясность программ, четкое разграничение их функций, отсутствие каверзных побочных эффектов при их выполнении является обязательными требованиями к программированию таких логически сложных задач, каковыми являются задачи искусственного интеллекта. Дисциплина в программировании становится особенно важной, когда над программой работает не один человек, а целая группа программистов.

Сферы применения языка Лисп многообразны: наука и промышленность, образование и медицина, от декодирования генома человека до системы проектирования авиалайнеров. [2]

1. Постановка задачи

Разработать программу синтаксического и семантического анализа для подмножества Lisp. Синтаксический разбор реализовать с использованием детерминированного автомата с магазинной памятью. Семантические аспекты описать грамматикой свойств.

Выбранное мной подмножество языка извлекает голову от головы исходного списка: (car (car '((12 12) (7 8) 3)))

2. Описание исходного языка

Описание регулярной грамматики, описывающей лексемы языка:

"setq" {return stq;}

"list" {return lst;}

"cons" {return cns;}

[0-9]+ {return Number;}

[A-Za-z][A-Za-z0-9]* {return id;}

\' {return APOST;}

\ {return SPACE;}

\( {return LSC;}

\) {return RSC;}

Описание КС-грамматики, описывающей синтаксис языка:

Если (V,T,P,S) - КС- грамматика (V - множество нетерминальных символов, T - множество терминальных символов, P - множество порождающих правил, Form - аксиома), то

V::={<stq, lst,cns >};

T::={ LSC RSC id Number SPACE APOST};

Form::= program|program SPACE form

;

program: stroka1

stroka2

;

stroka1: LSC fun SPACE id SPACE arg RSC

;

stroka2: LSC fun SPACE arg SPACE arg RSC

;

fun: cns|stq|lst|

;

arg: Number|id|fun1

;

fun1: cns1|stq1|lst1|

;

cns1: LSC cns SPACE arg SPACE arg RSC

;

stq1: LSC stq SPACE arg SPACE Number RSC

;

lst1: LSC lst SPACE arg SPACE arg RSC

;

3. Детерминированная автоматная модель синтаксического анализатора

В ходе работы над курсовым проектом была использованная модель детерминированного автомата с магазинной памятью

Детерминированный автомат с магазинной памятью может использоваться в качестве распознавателя некоторых частных видов КС-языков. (КС-язык это язык, который может быть описан КС-грамматикой, а КС-грамматика, по классификации Хомского, - это грамматика, правила которой в левой части содержат по одному нетерминалу, а в правой - произвольные строки терминалов, нетерминалов или пустые строки).

Управляющая таблица содержит в своих клетках команды, которые должен выполнить автомат. Координаты клетки, из которой следует выбрать очередную команду, определяются содержанием вершины стека (координата строки) и обозреваемым на входной ленте символом анализируемой строки (координата столбца). Управляющая таблица автомата, реализующего алгоритм типа «сдвиг-приведение», естественно, содержит команды типа «сдвиг» и типа «приведение», а также две команды завершения работы алгоритма: успешное завершение синтаксического разбора входной строки и обнаружение синтаксической ошибки во входной строке. LR(1)-грамматика и грамматика предшествования являются частными видами КС-грамматик, для которых может быть построен детерминированный автомат, реализующий алгоритм типа «сдвиг-приведение».

В ходе работы над курсовым проектом была использована LR(1)-реализация алгоритма «сдвиг-приведение»

В заголовки строк управляющей таблицы LR(1)-автомата выносятся индексы его внутренних состояний, а в заголовки строк - все терминальные и нетерминальные символы грамматики, а также маркер конца входной строки. Записи стека содержат два поля: поле символа и поле внутреннего состояния. Содержание поля состояния верхней записи стека определяет текущее внутреннее состояние автомата и, следовательно, координату строки управляющей таблицы, из которой должна быть выбрана очередная команда. Перед началом работы распознавателя в стек следует поместить запись, содержащую индекс начального состояния в поле состояния. Команда типа «сдвиг» должна указывать, в какое внутреннее состояние переходит автомат одновременно с чтением символа из входной ленты. В результате выполнения этой команды курсор входной ленты перемещается на один символ влево, а стек пополняется записью с прочитанным из ленты символом в поле символа и индексом внутреннего состояния, указанного в команде, в поле состояния. Команда типа «приведение» должна указывать правило грамматики, например, в виде его номера, по которому следует выполнить приведение. В результате выполнения этой команды из стека удаляются записи, соответствующие правой части правила, по которому делается приведение, и подготавливается имитация установки курсора входной ленты на нетерминальный символ левой части этого правила. По команде «допуск» разбор считается успешно завершенным. По команде «ошибка» разбор также прекращается, но входная строка объявляется синтаксически неверной.

Для вышеприведенного фрагмента грамматики с правилами i) - iii) управляющая таблица LR(1)-автомата может быть такой.

<описания>

<список имен>

вещественное

,

идентификатор

маркер конца

1

допуск

сдвиг2

2

сдвиг3

сдвиг6

3

сдвиг4

приведение i

4

сдвиг5

5

приведение ii

приведение ii

6

приведение iii

приведение iii

Таблица построена в предположении, что нетерминал <описания> является начальным символом фрагмента грамматики (его аксиомой). Числами 1 - 6 в таблице обозначены внутренние состояния автомата, при этом состояние 1 является начальным. Соответственно, в командах типа «сдвиг» этими числами указываются внутренние состояния, в которые должен переходить автомат, выполняя такие команды. Команды типа «приведение» снабжены номерами правил, по которым следует выполнять приведение. Пустые клетки таблицы считаются содержащими команду «ошибка».

Содержание полей символа и внутреннего состояния указаны через запятую. Символом обозначена пустая строка. Так запись ,1 означает, что поле символа пусто, а в поле внутреннего состояния находится индекс 1.

Для того, чтобы построить управляющую таблицу для LR(1)-автомата, нужно определить множество его внутренних состояний. Внутренние состояния автомата ставятся в соответствие позициям правых частей правил LR(1)-грамматики в результате так называемой разметки этих правил.

В простейшем случае разметка выполняется следующим образом.

1. Индексы внутренних состояний следует поместить между соседними символами, перед первым символом (в начальную позицию) и после последнего символа (в конечную позицию) правой части каждого правила.

2. В начальные позиции всех правых частей правил для аксиомы следует поместить индекс начального состояния автомата.

3. Если в процессе разметки индекс какого-либо состояния оказался перед нетерминальным символом, его следует распространить на начальные позиции всех правых частей правил для этого нетерминального символа.

4. Если в процессе разметки в двух или более правилах слева от одного и того же символа оказался один и тот же индекс внутреннего состояния, то в этих правилах и справа от этого символа следует поместить одинаковые индексы.

Рассмотренная в этом разделе LR(1)-таблица была построена на основе такой разметки правил грамматики:

i) <описания>::= 1 вещественное 2 <список имен> 3

ii) <список имен>::= 2 <список имен> 3, 4 идентификатор 5

iii) <список имен>::= 2 идентификатор 6

Для разметки понадобилось шесть различных индексов. Следовательно, у автомата должно быть шесть внутренних состояний.

Заполнение таблицы с использованием разметки выполняется по следующим правилам.

1. Команда «сдвиг k» помещается в клетку таблицы с координатами (j,символ), если позиция слева от символа отмечена индексом k, а позиция справа от символа - индексом j.

2. Команда «приведение m» помещается в клетку таблицы с координатами (n,символ), если конечная позиция правой части m-го правила грамматики отмечена индексом n, а символ является символом-следователем для нетерминала левой части m-го правила грамматики, т.е. может следовать за этим нетерминалом в какой-либо сентенциальной форме. (Сентенциальной формой называются аксиома и все строки нетерминальных и терминальных символов, которые из нее выводятся).

3. Команда «допуск» помещается в клетку таблицы с координатами (l,аксиома), где l - индекс начального внутреннего состояния автомата.

4. После заполнения таблицы по правилам 1 - 3 в клетки, оставшиеся пустыми, помещается команда «ошибка».

В результате применения этих правил к размеченному фрагменту грамматики и получается вышеприведенная управляющая таблица LR(1)-автомата.[1]

4. Структура разработанной программы

Программа состоит из:

· Сгенерированного файла утилитой FLEX(flex.cpp);

· Файлов, сгенерированных утилитой BISON (bisonout.cpp, bisonout.hpp);

· Файла исходного текста (parcerin.txt).

5. Результаты тестирования

В качестве входных данных программе были предложены данные:

(car '((1 2) 3)) и (car ((1 2) 3)).

Ответная реакция программы на строку (car '((1 2) 3))

Ответная реакция программы на строку (car ((1 2) 3))

6. Руководство пользователя

Написанная мною программа распознаёт команды car и cdr (возможны вариации Car, CAR, Cdr, CDR) и список их аргументов (цифры, числа, буквы латинского алфавита). Список может содержать также вложенные списки и функции (только указанные выше).

Запуск программы осуществляется через проект(Project.sln) с несением входных данных в файл parserin.txt (включён в проект).

Реакция программы на входные данные:

· сообщение «Синтаксическая ошибка!», означает наличие синтаксических ошибок в исходном тексте;

· сообщение «Текст синтаксически верен!», означает отсутствие синтаксических ошибок в исходном тексте.

Заключение

В ходе работы над курсовым проектом была разработана программа, позволяющая анализировать синтаксис и лексику исходного кода на языке Lisp.

Достоинствами такой программы является анализ текста с вложенными функциями и списками различной глубины, а также простой интерфейс. В качестве недостатков стоит указать наличие только синтаксического и лексического анализа, небольшой набор определяемых функций, а также отсутствие возможности указывать в качестве аргументов функций переменные.

Библиографический список

1. Т.М. Максимова. Теория языков программирования и методы трансляции. Методические указания к выполнению курсовых работ. - СПб.: СПбГУАП, 2011.

2. http://progopedia.ru

3. http://ru.wikipedia.org

Приложение

Содержание файла описания для flex:

%option noyywrap

%option yylineno

%option never-interactive

%{

#include <string>

#include <iostream>

#include "bisonout.hpp"

using namespace std;

extern FILE *yyin, *yyout; // referenced from flex-generated scanner

extern int yylineno;

int yylex();

YYSTYPE yyval;

string tmpstr = "";

%}

DIGIT [0-9]

NUMBER [1-9]({DIGIT})*

NAME [a-zA-Z]

%%

{DIGIT} {return DIGIT;}

{NAME} {return NAME;}

{NUMBER} {return NUMBER;}

"car" {return CAR;}

"Car" {return CAR;}

"CAR" {return CAR;}

"cdr" {return CDR;}

"Cdr" {return CDR;}

"CDR" {return CDR;}

\' {return APOST;}

\ {return SPACE;}

\( {return LSC;}

\) {return RSC;}

Содержание файла описания для bison:

%{

#include <iostream>

#include <stdio.h>

#include <string>

#include <stdlib.h>

#include <Windows.h>

using namespace std;

int yyerror(char const* msg);

int yylex();

int lineno();

int yyparse();

%}

%token DIGIT NAME NUMBER CAR CDR APOST SPACE LSC RSC

%%

prog: LSC func RSC;

func: CAR SPACE prog | CDR SPACE prog | CAR SPACE arg | CDR SPACE arg;

arg: APOST val;

val: LSC lists RSC;

lists: atomes | LSC lists RSC | lists SPACE atomes | lists SPACE LSC lists RSC;

atomes: atom | atomes SPACE atom;

atom: NUMBER | DIGIT | NAME;

%%

extern FILE *yyin;

int yyerror(char const* msg)

{

return 0;

}

int main()

{

setlocale(LC_ALL,"RUS");

yyin=fopen("c:\\kurs3\\parserin.txt","r");

if(yyparse()!=0) printf("Синтаксическая ошибка!\n");

else printf("Текст синтакcически верен!\n");

system("pause");

return 0;

}

Размещено на Allbest.ru


Подобные документы

  • Основные концепции языков программирования, механизмы типизации данных. Описание языков программирования и методов трансляции. Конечные автоматы и преобразователи. Общие методы синтаксического анализа. Формальные методы описания языкового перевода.

    курс лекций [5,5 M], добавлен 04.12.2013

  • Особенности и суть языков программирования, способы их задания, цепочки символов и операции над ними. Классификация языков и грамматик, форма Бэкуса-Наура. Определение и свойства регулярных выражений, конечные автоматы и грамматики, описание программы.

    курсовая работа [231,5 K], добавлен 23.06.2011

  • Постановка задачи и алгоритм решения. Листинг программы, иллюстрирующей работу с символами, строками и блоками. Описание возможностей языка С, используемых для реализации алгоритма. Тестирование итоговой программы, анализ полученных результатов расчета.

    курсовая работа [63,0 K], добавлен 27.12.2012

  • Разработка программы, позволяющей приобрести навыки быстрой печати на клавиатуре. Обзор существующих аналогов. Обоснование технических приемов программирования. Тестирование, анализ полученных результатов. Руководство пользователя, листинг программы.

    курсовая работа [1,3 M], добавлен 03.04.2015

  • Проектирование программы-анализатора, состоящей из двух частей: лексического анализатора, разбивающего исходный текст программы на лексемы и заполняющего таблицу имен; синтаксического анализатора, проверяющего соответствие текста заданной грамматике.

    курсовая работа [2,0 M], добавлен 14.06.2010

  • C++ как универсальный язык программирования, его сущность, назначение, классы и возможности. Блок-схема и листинг программы KURS.EXE, ее принцип работы, системные требования, возможные неполадки и способы их устранения. Листинг заставки VOVA777.EXE.

    курсовая работа [422,3 K], добавлен 31.05.2010

  • Разработка программы, решающей базовую задачу линейного программирования симплекс-методом с помощью симплекс-таблиц. Выбор языка программирования и среды разработки, программные модули и их взаимодействие между собой. Листинг разработанной программы.

    курсовая работа [415,8 K], добавлен 08.09.2013

  • Основные параметры устройства отображения информации. Обоснование выбора используемых ресурсов микроконтроллера и схемы включения. Разработка схемы алгоритма. Описание и отладка программы. Схема электрическая принципиальная и листинг трансляции программы.

    курсовая работа [121,3 K], добавлен 12.12.2014

  • Описание программного обеспечения и языка программирования. Структуризация записей файлов, таблица компонентов. Организация производства: комплекс технических средств, инструкция пользователя. Листинг разработанной программы и оценка ее эффективности.

    дипломная работа [868,3 K], добавлен 29.04.2013

  • Синтаксически ориентированная трансляция: общие понятия; транслятор, интерпретатор, препроцессор. Программная реализация трансляции, основанной на структуре текста; идея Н. Хомского; языковые процессоры. Заголовочные файлы, алгоритмы и функции программы.

    курсовая работа [734,3 K], добавлен 04.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.