Комплекс розпізнавання письмового тексту

Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу оптичного розпізнавання символів. Шрифтові та безшрифтові алгоритми розпізнавання друкованого тексту.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык украинский
Дата добавления 19.05.2014
Размер файла 1,7 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Процедура InvertButtonClick, що визивається натисненням кнопки «Інвертувати», відповідає за інвертацію кольорів зображення.

І нарешті сама основна процедура, яка і виконує власне розпізнавання тексту - PerceiveButtonClick. Процедура містить в собі ряд інших процедурі функцій, зокрема процедури TopPP, BottomPP, LeftP, RightP, TopP, BottomP. Ці процедури відповідають за виділення рядка символів з тексту та одного символу з вже виділеного рядка. Далі отримане нормалізоване зображення символу порівнюється з набором еталонних символів. Процедура аналізую відсоток співпадань нормалізованого символа з еталонним і виводить відповідний символ в поле Memo. Цикл продовжується доки не буде розпізнаний останній символ останнього рядка.

Процедури SaveButtonClick і SaveEditChange відповідають за зберігання результату розпізнавання в текстовий або табличний файл.

В програмі також реалізована можливість перенесення розпізнаного тексту в різноманітні редактори. Ця можливість реалізована в процедурах MicrosoftWord1Click, NotepadClick, MicrosoftExcel1Click.

2.3 Засоби і середовище створення комплексу

Для реалізації комплексу розпізнавання тексту було обрано інтегроване середовище програмування Delphi 7. Дана система програмування була обрана із-за її можливості роботи з графічною інформацією, отриманої на вході, можливостей мови Pascal в реалізації циклів розрахунків і великих можливостей в побудові графічного інтерфейсу.

В якості апаратної бази при розробці додатку використовувався персональний комп'ютер на основі процесору Pentium 4 3.0 ГГц, 1 ГБ.

2.4 Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту

Програма запускається викликом файлу «Perceive.exe», після чого перед користувачем з'являється головна форма (Рис 2.1). На головній формі користувачу надається можливість визначати свої дії за допомогою кнопок.

Наступним кроком є імпортування зображення в програму. Це можна зробити двома способами: відкрити готове зображення з диску (кнопка «Відкрити») (рис 2.2), або внести зображення з сканера (кнопка «Сканувати») (рис 2.3.).

Рис 2.1. Головна форма

Рис 2.2. Відкриття зображення з диска

Рис. 2.3. Внесення зображення з сканера

Відкриту картинку можна масштабувати, вибираючи потрібний масштаб з випадаючого списку в лівому нижньому кутку області «Зображення» (рис 2.4).

Рис 2.4. Масштабування зображення

Наступні кроки є підготовчими до розпізнавання. В отриманому зображені можна інвертувати кольори, а також очистити зображення від шумів відповідно натиснувши кнопки «Інвертувати» і «Очистити». Результати даних перетворень будуть відображатися в області «Зображення».

Щоб розпізнати внесене в програму і підготовлене зображення користувачу необхідно натиснути кнопку «Розпізнати». Після закінчення процесу розпізнавання результат (текст) буде відображатися в правій частині вікна програми, в області «Текст» (рис 2.5).

Рис 2.5. Розпізнаний текст

На наступному етапі отриманій текст можна зберегти в файл, причому є можливість зберігання в декількох текстових форматах (txt, doc, rtf) і табличному (xls). (рис 2.6) Також отриманий текст можна одразу перенести в необхідний редактор: Microsoft Word, Microsoft Excel чи Блокнот. (Рис 2.7)

Рис 2.6. Зберігання тексту в файл

Рис 2.7. Перенесення тексту в редактор

2.5 Організація тестування та налагодження комплексу розпізнавання письмового тексту

На етапі тестування програмного продукту мною використовувалися різноманітні контрольні приклади, різні кольорові схеми символів. Також під час тестування використовувались зашумлені зображення, тексти з різноманітною величиною шрифтів (рис 2.8 - 2.)

Рис 2.8. Звичайний текст

Рис 2.9. Зашумлений текст

Рис 2.9. Різнокольоровий текст

Провівши тестування я отримав такі результати: середня точність розпізнавання тексту - 85%, швидкість розпізнавання - 10 символів в секунду.

2.6 Рекомендації по впровадженню і використанню комплексу розпізнавання письмового тексту

Даний програмний продукт дозволяє розпізнавати цифри та літери українського алфавіту. Програма не потребує інсталяції. Для початку роботи з програмою достатньо запустити файл «Perceive.exe». Для того щоб завантажити потрібний файл в програму потрібно натиснути кнопку «Відкрити» або «Сканувати». Після відкриття файлу зображення з'являється на панелі «Зображення». Далі користувачу потрібно проаналізувати яскравості фону і символу: якщо символ є яскравішим ніж фон, то потрібно інвертувати кольори зображення натиснувши кнопку «Інвертувати».

При наявності шуму на зображенні, останнє можна очистити натисканням на кнопку «Очистити».

Коли передрозпізнавальна обробка здійснена можна переходити до розпізнавання символу, для цього потрібно натиснути «Розпізнати».

Після виконання процедури розпізнання, на панелі «Текст» з'явиться розпізнаний текст, який, в подальшому, можна зберегти(кнопка «Зберегти») або перенести в один з декількох можливих текстових редакторів для подальшого редагування.

Для завершення роботи з програмою потрібно натиснути кнопку «Вихід».

Висновки

Процес розпізнавання зображень є складною багатоетапною процедурою. Багатоетапність обумовлена тим, що різні завдання обробки насправді тісно зв'язані і якість вирішення однієї з них впливає на вибір методу вирішення інших. Так вибір методу розпізнавання залежить від конкретних умов представлення вхідних зображень, зокрема характеру фону, шумової обстановки і пов'язаний з вибором методів попередньої обробки, сегментації, фільтрації.

У даній дипломній роботі була розглянута тематика розбору тексту. В результаті виконання дипломної роботи мною був створений комплекс розпізнавання тексту. Крім того набув навичок роботи з професійним програмним забезпеченням даного виду, закріпив і поглибив теоретичні і практичні знання в галузі програмування.

розпізнавання письмовий текст символ

Список використаних джерел

1. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М: Машиностроение, 1990. 320 с.

2. Гиренко А.В., Ляшенко В.В., Машталир В.П., Путятин Е.П. Методы корреляционного обнаружения объектов. Харьков: АО “БизнесИнформ”, 1996. 112 с.

3. А.В. Мисюрёв. Использование искусственных нейронных сетей для распознавания рукопечатных символов. В сб. "Интеллектуальные технологии ввода и обработки информации", М.: Эдиториал УРСС, 1998, 142 c.

4. Арлазаров В.Л., Славин О.А. Алгоритмы распознавания и технологии ввода текстов в ЭВМ. Информационные технологии и вычислительные системы 1996, No 1., 146 c.

5. ABBYY FineReader -- Википедия [Цит. 2010, 12 квітня]. - Доступний з <http://ru.wikipedia.org/wiki/ABBYY_FineReader>.

6. Online OCR - Онлайн сервис распознавания текста - Что такое Online OCR? [Цит. 2010, 12 квітня]. - Доступний з <http://www.onlineocr.ru/support/SupportMain.aspx>.

7. Штучні нейронні мережі [Цит. 2010, 12 квітня]. - Доступний з <http://www.victoria.lviv.ua/html/neural_nets/zmist.htm>.

8. CuneiForm -- Вікіпедія [Цит. 2010, 12 квітня]]. - Доступний з <http://uk.wikipedia.org/wiki/CuneiForm >.

9. Readiris Pro 11 Retail Multi - Readiris Pro, Офис, распознавание текста - CWER.ru [Цит. 2010, 12 квітня]. - Доступний з <http://www.cwer.ru/readiris_pro_corporate_edition_v_11_0_retail_multi>.

10. Славин О.А., Корольков Г.В., Болотин П.В. Методы распознавания грубых объектов. В сб. "Развитие безбумажных технологий в организациях", 1999 р 311 с.

11. Е.В. Щепин, Г.М. Непомнящий. К топологическому подходу в анализе изображений. Геометрия, топология и приложения (Межвузовский сборник научных трудов). Москва, Мин. высшего и средн. спец. образ. РСФСР, Московский институт приборостроения, 1990 г., 315 c.

Размещено на Allbest.ru


Подобные документы

  • Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.

    дипломная работа [1,6 M], добавлен 02.07.2014

  • Огляд методів розпізнавання образів. Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. Критерій оптимізації параметрів функціонування даної системи. Інформаційне та програмне забезпечення обробки рукописних символів.

    дипломная работа [291,0 K], добавлен 14.10.2010

  • Огляд інтелектуальних принципів організації процесу розпізнавання символів. Розробка системи безклавіатурного введення документів у комп’ютер. Опис і обґрунтування проектних рішень; розрахунки і експериментальні дані; впровадження системи в експлуатацію.

    дипломная работа [182,5 K], добавлен 07.05.2012

  • Алгоритм оптичного розпізнавання образів. Універсальність таких алгоритмів. Технологічність, зручність у процесі використання програми. Два класи алгоритмів розпізнавання друкованих символів: шрифтовий та безшрифтовий. технологія підготовки бази даних.

    реферат [24,5 K], добавлен 19.11.2008

  • Історія досліджень, пов’язаних з розпізнаванням образів, його практичне використання. Методи розпізнавання образів: метод перебору, глибокий аналіз характеристик образу, використання штучних нейронних мереж. Характерні риси й типи завдань розпізнавання.

    реферат [61,7 K], добавлен 23.12.2013

  • Розробка, дослідження та реалізація методів вирішення завдань аналізу, розпізнавання і оцінювання зображень як один із провідних напрямків інформатики. Класифікація та аналіз існуючих методів розпізнавання образів, переваги та недоліки їх застосування.

    статья [525,8 K], добавлен 19.09.2017

  • Актуальність сучасної системи оптичного розпізнавання символів. Призначення даних систем для автоматичного введення друкованих документів в комп'ютер. Послідовність стадій процесу введення документу в комп'ютер. Нові можливості програми FineReader 5.0.

    курсовая работа [4,5 M], добавлен 29.09.2010

  • Специфіка застосування нейронних мереж. Огляд програмних засобів, що використовують нейронні мережі. Побудова загальної моделі згорткової нейронної мережі. Реалізація нейромережного модулю розпізнавання символів на прикладі номерних знаків автомобілів.

    дипломная работа [3,4 M], добавлен 15.03.2022

  • Розробка методів вирішення завдань аналізу, розпізнавання, оцінювання зображень як одних з провідних напрямків інформатики. Описання методу пошуку співпадіння об’єкту-цілі з міткою-прицілом на заданому відеоряді. Виявлення об’єкта на цифровому зображенні.

    статья [138,7 K], добавлен 21.09.2017

  • Системи розпізнавання обличчя. Призначення та область застосування програми "Пошук обличчя люди у відеопотоках стандарту MPEG-4". Штучна нейронна мережа, локалізація та розпізнавання обличчя. Методи, засновані на геометричних характеристиках обличчя.

    курсовая работа [1,8 M], добавлен 27.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.