Модели и алгоритмы распознавания железнодорожной технической документации icon

Модели и алгоритмы распознавания железнодорожной технической документации


Смотрите также:
Модели и алгоритмы распознавания железнодорожной технической документации...
Методические рекомендации по отбору, экспертизе ценности...
Из истории Центрального государственного архива научно-технической документации Санкт-Петербурга...
Математические модели и алгоритмы на графах с нестандартной достижимостью...
Математические модели и алгоритмы на графах с нестандартной достижимостью...
Программа по курсу: методы анализа данных и распознавания (базовый) по направлению...
Программа по курсу: методы анализа данных и распознавания по направлению: 511600 факультеты...
«Нечетко-логические модели и алгоритмы»...
Нечетко-логические модели и алгоритмы...
Порядок проведения рассмотрения и согласования проектной и технической документации...
Метод нечеткого распознавания динамических образов...
Методические указания к выполнению курсовой работы по дисциплине «Технические средства...



Загрузка...
скачать


На правах рукописи


Бурсиан Елена Юрьевна


МОДЕЛИ И АЛГОРИТМЫ РАСПОЗНАВАНИЯ ЖЕЛЕЗНОДОРОЖНОЙ ТЕХНИЧЕСКОЙ ДОКУМЕНТАЦИИ


Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ


АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук


Санкт-Петербург

2010

Работа выполнена в Федеральном государственном образовательном учреждении высшего профессионального образования «Петербургский государственный университет путей сообщения»

на кафедре «Математика и моделирование»


Научный руководитель: доктор технических наук, профессор

Ходаковский Валентин Аветикович


Официальные оппоненты: доктор физико-математических наук, профессор Береславский Эдуард Наумович


кандидат физико-математических наук, доцент Карпушев Сергей Иванович


Ведущая организация: Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», им. В.И. Ульянова (Ленина).


Защита диссертации состоится 28 декабря 2010 г. в 13 часов на заседании диссертационного совета Д 218.008.06 при Петербургском государственном университете путей сообщения по адресу: 190031, г. Санкт-Петербург, пр. Московский, 9, в ауд. 1-217.


С диссертацией можно ознакомиться в библиотеке Петербургского государственного университета путей сообщения.


Автореферат разослан 26 ноября 2010 г.


Ученый секретарь

диссертационного совета

к.т.н., профессор Кудряшов В. А.


^ ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время наиболее перспективным является электронный способ хранения, обработки и передачи информации. Во многих отраслях решается проблема создания средств эффективного ведения электронной документации. В железнодорожной отрасли также ведутся работы по переводу технической документации на электронные носители информации с целью повышения эффективности мониторинга, диагностики и технического обслуживания, повышения оперативности поиска и устранения неисправностей.

Серьёзным препятствием переходу на электронную форму документации является наличие значительного массива бумажных документов, связанных с существующими техническими системами, построенными до появления адекватных средств ведения и хранения электронной документации. В связи с вышеизложенным необходимо снабдить автоматизированное рабочее место (АРМ) средствами автоматического распознавания для специализированной технической документации систем железнодорожной автоматики.

Задача распознавания технических документов представлена в научной литературе значительным количеством работ, касающихся как основ теории распознавания, так и имеющих прикладной характер. Разработкой основ теории распознавания занимается научная школа под руководством академика РАН Ю. И. Журавлёва. Среди современных отечественных авторов следует отметить теоретические работы К. В. Рудакова, В. Л. Матросова, Ю. П. Пытьева, Е.В. Дюковой и работы прикладного характера Л. М. Местецкого, Я. А. Фурмана и И. А. Рейера.

В развитие задач анализа и обработки изображений, прикладных задач технического чтения значительный вклад внесли зарубежные исследователи R. O. Duda, P. E. Hart, R. C. Gonzalez, H. Blum, T. Y. Zhang, C. Y. Suen.

Во многих работах исследуются проблемы организации информационной поддержки систем железнодорожной автоматики, анализируются способы представления информации, технологии внесения изменений в техническую документацию, форматы хранения и структуры данных, рассматриваются алгоритмы предварительной обработки изображения текста, особенности структурных методов распознавания символов и графических объектов.

При этом задача автоматического распознавания технической документации для систем железнодорожной автоматики остаётся нерешённой вследствие наличия значительного объёма документов невысокого качества, рукописных текстов и отсутствия эффективных методов их обработки. Тем самым является актуальной задача совершенствования методов и средств распознавания специализированной технической документации для систем железнодорожной автоматики как инструментов построения и модернизации специализированной электронной базы данных, основанной на этой документации.

^ Объектом исследования является процесс распознавания специализированной технической документации для систем железнодорожной автоматики.

Предмет исследования – методы, модели и алгоритмы распознавания текстовой и табличной информации.

^ Целью диссертационной работы является повышение вероятности распознавания символов специализированной технической документации для систем железнодорожной автоматики. Для достижения поставленной цели в работе решалась научная задача: совершенствование методов и алгоритмов распознавания специализированной технической документации для систем железнодорожной автоматики как инструментов построения и модернизации специализированной электронной базы данных, основанной на этой документации.

Для достижения поставленной цели и решения научной задачи в работе осуществляется решение подзадач исследования:

  1. Разработка методов предварительной обработки изображения листа монтажной документации (ЛМД) с целью устранения шумов и помех. Проверка эффективности предлагаемых методов.

  2. Разработка алгоритма сегментации изображения ЛМД и определения главной таблицы на изображении и методов автоматического распознавания специальных знаков и структуры таблиц.

  3. Разработка модели процесса автоматического распознавания чертёжных рукописных символов, представленных в таблицах монтажной документации систем железнодорожной автоматики.

  4. Создание модели процесса автоматического распознавания для ЛМД как целостной структуры.

На защиту выносятся:

  1. Методы и алгоритмы предварительной обработки изображений специализированной технической документации для систем железнодорожной автоматики.

  2. Алгоритм распознавания структуры монтажных карточек и схем комплектации.

  3. Модель процесса автоматического распознавания символов технической документации.

  4. Модель распознавания монтажных карточек и схем комплектации для систем железнодорожной автоматики как целостных структур.

^ Методы исследования. Для решения задач, поставленных в диссертационной работе, применялись методы распознавания образов, теории вероятностей и математической статистики, элементы теории графов, аппарат дифференциальной геометрии и алгебраические методы.

Для устранения дефектов изображения использовались способы фильтрации изображения, основанные на теории дискретного преобразования Фурье. В частности, разработка средств полосовой и низкочастотной фильтрации была основана на теоремах быстрого дискретного преобразования Фурье. При разработке алгоритмов распознавания символов была использована теория контурного анализа, элементы теории вычислительной геометрии, теоретические основы алгоритмов скелетизации изображения и корреляционный анализ.

При создании прототипа программы распознавания изображений специализированной технической документации для систем железнодорожной автоматики использовалась интегрированная среда разработки программного обеспечения Visual C++.

Достоверность научных результатов, полученных в диссертационной работе, основана на строгости применяемых методов, аналитических преобразований и подтверждена численными экспериментами и практическими результатами опытной эксплуатации. Адекватность предлагаемых методов и средств установлена с помощью экспериментальных исследований.

^ Научная новизна:

  1. Разработан метод и инструмент эффективного удаления шумов из изображения технической железнодорожной документации, вызванных многократным копированием, сконструированный с учётом особенности данной документации.

  2. Предложен комплекс методов распознавания таблицы для специализированной технической документации, отличающийся от применявшихся ранее малой трудоёмкостью и возможностью построения таблицы по её фрагментам.

  3. Разработанная модель процесса автоматического распознавания символа технической документации отличается новым алгоритмом выбора параметров построения скелета символа, основанным на концепции распространения волновых фронтов от границ области.

  4. Предложенный алгоритм распознавания изображения ЛМД отличается от применяемых ранее подходом, при котором ЛМД рассматривается как целостная структура.

^ Практическая значимость. Результаты, полученные в ходе исследования, реализованы в виде программного модуля для автоматизированного рабочего места ведения технической документации (АРМ-ВТД), и позволят увеличить эффективность построения и модернизации электронной базы данных систем железнодорожной автоматики.

Предложены средства восстановления утерянных электронных специализированных технических документов на основе данных, сохранившихся на бумажном носителе информации. Созданы средства электронного документооборота технической железнодорожной документации. Методы и средства распознавания монтажных карточек и схем комплектации для систем железнодорожной автоматики внедрены в АРМ-ВТД, оформлен акт внедрения.

^ Апробация и реализация. Алгоритм распознавания специализированной технической документации систем железнодорожной автоматики применён для создания и модернизации электронной базы данных монтажной документации систем железнодорожной автоматики.

Результаты работы докладывались на научных семинарах и заседаниях кафедры «Математика и моделирование» ПГУПС (2006–2009 гг.) и на конференции «50-летие КФ ИрГУПС» (2005г.).

Публикации. По результатам диссертационного исследования опубликовано 6 статей, в том числе две статьи в журналах, рекомендованных ВАК.

^ Структура и объём работы. Диссертационная работа представлена введением, четырьмя главами, списком литературы и приложениями, при этом составляет 150 стр. основного текста, содержит 114 рисунков, 4 приложения и 2 таблицы. Библиографический список составляют 83 наименования.

^ ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении аргументирована актуальность исследования, обоснована практическая значимость работы. Определён объект исследования.

В первой главе работы отмечены особенности и описана структура изображения специализированной технической документации для систем железнодорожной автоматики, как объекта распознавания.

Анализ структуры и особенностей изображения специализированной технической документации являлся необходимым условием создания эффективной методики её распознавания. Исследования показали, что структура изображения ЛМД представляет собой систему двух объектов: главной части, представляющей собой таблицу, содержащую основную информацию, и дополнительной части, оформленной в виде текста, второстепенных таблиц или графических объектов. Для построения электронной базы данных необходимо выделить на изображении таблицу, содержащую основную информацию.

В ячейках таблицы с помощью чертёжных рукописных символов или электронными шрифтами отражены технические характеристики приборов. Линии таблицы либо проведены вручную, либо напечатаны на принтере или ротапринтной машине. При этом изображение имеет дефекты, вызванные либо многократным копированием, либо особенностями состояния оригинала, с которого осуществлялось сканирование, либо применением копировальных машин старого образца.

Ведущими разработками в области распознавания печатного и рукописного текстов, таблиц и схем являются пакеты программ оптического чтения текстов FineReader и FormReader, CuneiForm, OmniPage, TextBridge, ReadirisPro. Применение данных пакетов для распознавания специализированной технической документации не является эффективным из-за невысокого качества изображения железнодорожной документации и отсутствия учёта её особенностей. При этом под особенностями понимается использование специальных структурных типов таблиц и наличие специальных знаков.

Выполненный в главе анализ современного состояния проблемы распознавания, включая задачу предварительной обработки изображения, определения информативных характеристик элементов изображения и создания алгоритмов идентификации, позволил поставить цель и задачи научной работы, сформулировать необходимые условия их решения.

^ Вторая глава исследования посвящена разработке методов предварительной обработки сканированных изображений ЛМД с целью устранения шумов и удаления помех.

Задача предварительной обработки изображения решалась с помощью низкочастотной и полосовой фильтрации двумерного сигнала, представленного матрицей , элементами которой являются значения яркостей пикселей изображения. Матрица раскладывалась по системе ортогональных функций, представленной матрицами , где – любая ортогональная или унитарная матрица.

При проведении численных экспериментов в качестве преобразования применялось разложение по функциям Уолша, дискретное комплексное преобразование Фурье и дискретное косинус-преобразование, , – условия ортогональности для вещественных и комплексного преобразований соответственно. , где . Далее осуществлялась низкочастотная или полосовая фильтрация , и производилось обратное преобразование.

В экспериментальных исследованиях для всех преобразований применялись алгоритмы быстрых преобразований (использовался метод Кули-Тьюки) со временем работы , так как фактические размеры обрабатываемой матрицы градаций яркости изображения монтажных карточек и схем комплектации для систем железнодорожной автоматики – , .

Для ослабления влияния выделенных гармоник на характеристики изображения (контрастность, гистограммы яркости пикселей фона и объекта, неоднородность фона, плавность границ объектов) использовался фильтр.

Согласно теории пространственной фильтрации матрица коэффициентов ослабления вычислялась по формуле , где , – двумер­ная частота, – коэффициент ослабления при двумер­ной частоте . Период задавался в пикселях, – функция, определяющая изменение коэффициента понижения амплитуд.

Для комплексного преобразования Фурье , , для вещественного косинус-преобразования и преобразования Уолша , , ( – ширина и высота изображения). Форма фильтра задавалась с помощью функции: , где – параметр, определяющий крутизну среза. Для фильтра низких час­тот , высоких – . На рис. 2.1 изображены графики функций для , на рис. 2.2 – для .




Рис. 2.1. Графики функции



Рис. 2.2. Графики функции


Полосовой фильтр строился как произведение фильтров низких и высоких частот с разными периодами , задающими «срезы» по низким и высо­ким частотам. При этом модуль параметра принимал равные значения для каждого из сомножителей: , где .

В процессе исследования был сделан вывод, что применение функций Уол­ша следует осуществлять только при распознавании горизонтальных и вертикальных линий таблиц. Применение вещественного косинус-преобразования и комплексного преобразования Фурье позволило получить практически одинаковые результаты, соответствующие поставленной цели.

В работе предложено применение низкочастотной фильтрации как метода устранения неинформативных частей скелетного представления символа при обработке изображения специализированной технической документации. Полосовая фильтрация позволила добиться устранения неоднородности фона и распознавать символы, расположенные в исходном изображении на границе изменения яркости фона.

В работе предложен метод целевой параметрической фильтрации, направленный на устранение дефектов изображения горизонтальных и вертикальных линий. Областью применения метода является распознавание изображений специализированной технической документации, полученных многократным копированием или с помощью ротапринтной машины. При этом главной задачей фильтрации является задача улучшения изображения линий таблицы, так как без правильного построения таблицы повышение эффективности распознавания символов бесперспективно.

Разработан прототип программы с выбором системы базисных функций и полуавтоматическим подбором параметров фильтрации, основанный на теоретических положениях низкочастотной фильтрации, использующий фильтрующую функцию . Численные эксперименты, проведённые с помощью модуля предварительной обработки, показали эффективность предложенных средств и методов.

В третьей главе диссертации обосновывался алгоритм распознавания структуры таблицы ЛМД. При этом предполагалось, что таблица представлена системой горизонтальных и вертикальных линий, либо проведённых от руки, либо построенных на матричном принтере или на принтере с невысоким качеством печати. Изображения линий могли иметь разрывы и полости, вызванные помехами и многократным копированием. Далее подразумевается, что всё сказанное для горизонтальных линий относится также и к вертикальным линиям.

При создании алгоритма автоматического распознавания структуры ЛМД были разработаны.

  1. Процедуры определения горизонтальных линий и устранения разрывов линий с оценкой времени их работы.

  2. Алгоритм распознавания структуры таблицы с учётом особенностей специализированной технической документации для систем железнодорожной автоматики.

  3. Прототип программы для проведения численных экспериментов с целью проверки эффективности работы процедуры и алгоритма.

  4. Метод распознавания линий таблицы, основан на следующих положениях.

4.1. Линии таблицы представлены на изображении в виде горизонтальных объектов, вследствие этого области их расположения эффективно устанавливались с помощью алгоритма определения длинных горизонтальных последовательностей пикселей объекта.

4.2. Вследствие дефектов изображения алгоритм, указанный в первом пункте, позволяет получить только отдельные фрагменты линий. Изображение таблиц монтажных карточек и схем комплектации содержит несколько десятков линий, являющихся почти горизонтальными, то есть отклонения линий таблицы от горизонтали не превышают нескольких градусов. При этом на каждой линии может иметься более десяти разрывов. Таким образом, необходимо применять процедуру поиска всех разрывов на линиях таблицы.

Случаи взаимного расположения фрагментов изображений горизонтальных линий представлены на рис. 3.1 тремя ситуациями: a, b, c. Ситуация a соответствует разрыву без наложения, случай b – разрыву с наложением, в ситуации c второстепенный фрагмент линии повторяет рисунок линии выше или ниже основного фрагмента. При этом ситуацию d, соответствующую «разветвлению» линии без нарушения связности, целесообразно обрабатывать с помощью процедуры закраски области на растре как один фрагмент линии.




Рис. 3.1. Варианты разрывов изображений горизонтальных линий


Подавляющее большинство разрывов горизонтальных линий на изображениях монтажных карточек и схем комплектации – разрывы без наложений. Поиск и удаление разрывов без наложения можно эффективно осуществлять с помощью построения диаграммы Вороного для точек, расположенных на концах фрагментов всех горизонтальных линий.

При этом решается следующая задача. На плоскости имеется точек. Для каждой точки требуется найти все соседние точки, удалённые от данной точки на расстояние не более чем . Количество ближайших соседей ограничено параметром . точек – концы фрагментов горизонтальных линий (, – количество фрагментов). Задача устранения разрывов без наложения решается за время .

Поиск разрывов с наложением эффективно производится с помощью традиционной процедуры, основанной на упорядочивании фрагментов по значениям ординат начальных точек фрагментов.

На основе рассматриваемого метода был создан прототип программы распознавания горизонтальных линий. На рис. 3.2 представлен фрагмент таблицы монтажной карточки без устранения разрывов. На рис. 3.3 показан тот же фрагмент после применения процедуры устранения разрывов. При этом с помощью предлагаемого метода были устранены разрывы горизонтальных линий, соответствующие ситуации, в которой второстепенный фрагмент линии повторяет рисунок линии, расположенной выше, разрыв без наложения в конце первой горизонтальной линии и разрывы без наложения вертикальных линий.




Рис. 3.2. Фрагмент с разрывами



Рис. 3.3. Фрагмент без разрывов


Экспериментальные исследования, выполненные с помощью прототипа программы распознавания горизонтальных линий, подтвердили эффективность предложенного метода.

С целью распознавания структуры таблицы монтажных карточек и схем комплектации был разработан метод вычисления координат колонок и ячеек, определения конфигурации таблицы и представления её в виде графа, вершинами которого являются ячейки таблицы и вся таблица. При этом вершины соединялись рёбрами в том случае, когда соответствующие им ячейки находились одна над другой, вершина соответствующая всей таблице соединялась ребрами с верхними ячейками. Структура таблицы монтажных карточек представлять в виде дерева.

В четвёртой главе диссертации представлена модель процесса автоматического распознания символов технической документации и модель распознавания монтажных карточек и схем комплектации как целостных структур. Предполагается, что изображения символов выполнены чертёжными шрифтами вручную, машинописью или получены от принтера без применения художественных гарнитур. При этом считается, что все знаки записаны раздельно, лишь в редких случаях имеет место случайное «приклеивание» соседних знаков. То есть, не ставится задача расшифровки слитного рукописного текста, которая значительно сложнее.

Предлагаемая модель процесса автоматического распознавания символов технической документации основывалась на применении методов теории графов и принципов статистического подхода в задачах распознавания образов. Для каждого изображения символов таблицы строился вектор информативных характеристик размерности . Множество распознаваемых изображений символов разбивалось на подмножества с равными количествами ветвей скелетных графов. В каждом подмножестве разбиения , где – размерность вектора информативных характеристик элементов разбиения, – количество ветвей скелетных графов элементов разбиения, – размерность вектора информативных характеристик для каждой ветви скелетного графа.

Возможные результаты распознавания кодировались точками дискретного пространства , выбиралось пространство распознающих функций . При этом предполагалось, что на задано пространство вероятностных мер . В работе рассматривались методы распознавания символов, основанные на топологических свойствах скелетных графов (связность, количество циклов, степени вершин) и сравнении информативных характеристик распознаваемых и эталонных символов.

Для каждого символа, встречающегося в таблицах железнодорожной документации, строился набор обучающих данных (набор эталонов) , где – выборка из элементов векторной случайной величины с неизвестным распределением , вектор информативных характеристик эталона. При этом предполагалось, что возможно принципиально различное написание символов, поэтому – число элементов в наборе , как правило, было отлично от единицы. С целью построения наборов обучающих данных были разработаны средства создания и модификации электронной базы данных эталонных символов.

Известно, что основная проблема при формализации и решении задач распознавания образов применительно к заданной предметной области – формирование набора информативных признаков . Одним из основных способов формирования набора информативных признаков символа является построение скелета плоской замкнутой области, соответствующей символу на изображении.

Скелетом замкнутой ограниченной области назовём геометрическое место точек центров замкнутых кругов , удовлетворяющих следующим условиям.

  1. Замкнутые круги принадлежат области ().

  2. Замкнутые круги не содержатся в других замкнутых кругах, принадлежащих области ().

При этом при применении алгоритма построения скелета возникает проблема «стрижки скелета», состоящая в определении и удалении неинформативных частей скелетного представления, так как любая точка максимума кривизны границы области является началом линии скелета.

Скелетный граф области строился с помощью кусочно-линейной аппроксимации кривых, составляющих скелет. В каждой точке скелета определялась толщина символа, которая равна удвоенному расстоянию от точки скелета до границы области, соответствующей символу на изображении. Распознавание символа осуществлялось при помощи сравнения наборов информативных характеристик и , созданных на основе скелетных графов распознаваемого и эталонного объектов.

В работе предлагается алгоритм построения скелета области, основанный на моделировании распространения по изображению области плоских волн, начинающихся в точках границы области (рис. 4.1).




Рис. 4.1. Распространение волн




Рис. 4.2. Скелеты символов



Рис. 4.3. Скелетные графы


На первом этапе предлагаемого алгоритма применялась процедура обхода границы, в результате работы которой все точки границы получали последовательные номера в соответствии с порядком обхода границы (на рис. 4.1 граница области закрашена чёрным цветом). Далее в каждой точке границы осуществлялась генерация волны, при этом цвет волны вычислялся в формате RGB, яркости цветов считались равными номеру точки, полученному при обходе границы.

На следующих этапах производилось последовательное построение волновых фронтов, распространяющихся от границ области, и осуществлялась закраска пикселей, принадлежащих волновым фронтам. Работа алгоритма заканчивалась, когда вся область была закрашена.

В качестве точек скелета выбирались точки, которые имели соседние по 4-связному растру точки, яркости которых отличались от яркостей данных точек на величину большую некоторого порога, являющегося параметром алгоритма скелетизации. На рис. 4.1 линия резкого перепада яркости соответствовала линии скелета. Скелет (рис. 4.2) формировался из точек, расположенных на границе скачкообразного изменения яркости пикселей. На рис. 4.3 представлены скелетные графы символов, построенные с помощью предлагаемого алгоритма и линейной аппроксимации скелета .

В ходе исследования были разработаны алгоритм и прототип программы с целью сравнительного изучения скелетизации с помощью алгоритмов последовательного удаления граничных точек, алгоритма утончения (T. Y. Zhang, C. Y. Suen) и с помощью моделирования распространения плоских волн от границ изображения символа.

На основе численных экспериментов сделан вывод, что при обработке изображения символов высокого качества с толщиной линии не более четырёх пикселей нельзя отдать предпочтение какому-либо из алгоритмов. В случае изображения среднего качества при использовании первых двух алгоритмов появляются неинформативные элементы скелета, и возникает необходимость в разработке дополнительных процедур для удаления лишних элементов скелетного представления символов.

Предложенная модель процесса автоматического распознания символов, расположенных в ячейках таблицы монтажных карточек и схем комплектации, основана на следующих положениях.

  1. Распознавание символов целесообразно осуществлять во время или после определения параметров таблицы монтажных карточек и схем комплектации, при этом границы изменения линейных характеристик символа (толщины написания линии и размеры прямоугольника, ограничивающего область расположения) являются установленными.

  2. При условии, что толщина линии на изображении не превышает нескольких пикселей, применение алгоритма последовательного удаления граничных пикселей объекта с целью построения скелета символа не приводит к существенным искажениям скелетного графа.

  3. Если толщина написания линии символа ограничена несколькими десятками пикселей, то скелет символа, построенный с помощью волнового алгоритма, при условии распространения волн от границ области, обладает всеми информативными характеристиками объекта, необходимыми для отнесения его к одному из символов.

  4. При построении базы данных эталонных символов, встречающихся в таблицах монтажных карточек и схем комплектации для систем железнодорожной автоматики, следует ограничиться типичными и ординарными случаями изображения символов, так как нестандартные и нехарактерные особенности образуют необозримое множество написаний. База данных эталонных символов может быть представлена только соответствующими им скелетными графами, так как для типичных изображений символов вся существенная информация содержится в скелетных графах. При этом нетипичные особенности могут образовывать специальную базу данных.

  5. При создании базы данных скелетных графов эталонных символов рассматриваемые скелетные графы следует разбить на классы гомеоморфных графов и составлять наборы информативных признаков отдельно для каждого из классов. При этом количество признаков в наборе элементов одного класса является постоянным.

  6. Сравнение распознаваемых символов следует осуществлять только с эталонными символами из базы данных, скелетные графы которых являются гомеоморфными скелетным графам распознаваемых символов. При этом ветви скелетных графов необходимо упорядочить таким образом, чтобы соответствующие ветви гомеоморфных графов имели одинаковые номера.

  7. Над координатами вершин всех полученных графов необходимо произвести аффинные преобразования, с целью стандартизации прямоугольников, ограничивающих графы. С целью создания наборов информативных характеристик на каждой ветви скелетного графа следует выбрать определённое количество точек, являющееся параметром алгоритма, и вычислить в них характеристики ломаных, представляющих ветви графов, (углы наклона ребер, значения кривизны).

  8. Сравнение наборов информативных характеристик, составленных из комплексных угловых коэффициентов звеньев ломаных соответствующих ветвям скелетных графов, с помощью выборочной корреляционной функции применимо для любых скелетных графов. При этом гипотеза о принадлежности распознаваемого изображения к классу данного эталонного символа не отвергается, если



где

– алгебраическое дополнение элемента , – компонента вектора с номером , – вектор угловых коэффициентов скелетных графов с номером .

  1. Сравнение наборов информативных характеристик, составленных из координат точек, в которых рёбра скелетных графов пересекаются с массивами горизонтальных и вертикальных линий, и вычисление расстояния Хаусдорфа между полученными множествами пересечений и с целью определения наиболее близкого эталонного символа применимо для скелетных графов, представленных простыми цепями. При этом расстояние Хаусдорфа определялось следующим образом: , где

, .

На основе изложенных положений была создана модель процесса распознавания рукописных чертёжных символов, разработан алгоритм и прототип программы распознавания рукописных чертёжных символов, расположенных в ячейках таблицы монтажных карточек и схем комплектации для систем железнодорожной автоматики. Численные эксперименты показали, что с помощью предлагаемого алгоритма можно добиться эффективности распознавания 75% для рукописных изображений невысокого качества.

Монтажные карточки оформлены в виде таблиц, алгоритм распознавания является средством автоматизации построения и пополнение электронной базы данных, рассматриваемой документации, поэтому вся текстовая информация должна быть представлена в виде элементов, включаемых в структуры, соответствующие таблицам. При распознавании всего документа, представленного в виде таблицы, в настоящем исследовании был предложен следующий метод.

  1. Применение средств автоматического распознавания структуры таблицы и символов монтажных карточек и схем комплектации. Определение координатных характеристик прямоугольников расположения символов и ячеек таблицы.

  2. Формирование для каждой ячейки таблицы набора строчек, состоящих из последовательностей кодов.

  3. Установление основных внутренних и внешних структурных связей монтажных карточек и схем комплектации для систем железнодорожной автоматики, формирование системы внутренних ссылок на ячейки таблицы и системы внешних ссылок на другие таблицы.

  4. Воспроизведение распознанной таблицы в символьном виде, отражающем структуру таблицы и текст ячеек.

С целью распознавания ячейки таблицы как структуры, состоящей из последовательности строчек, составленной из отдельных кодов, был предложен следующий метод.

  1. Построение гистограмм высоты и ширины символов, за исключением высоких, узких и широких символов, с использованием результатов их распознавания. Вычисление средних значений высоты и ширины символа таблицы и доверительных интервалов для данных значений.

  2. Определение границ возможных значений межстрочных расстояний с помощью средних значений ширины и высоты символов.

  3. Разбиение множества символов ячейки на подмножества символов, относящихся к одной строке ячейки.

  4. Упорядочивание символов в каждой строке ячейки и разбиение строк на отдельные коды.

С целью установления внутренних и внешних связей между ячейками таблицы и другими таблицами применялись следующие процедуры.

  1. Формирование последовательностей кодов, встречающихся в таблице (словарь таблицы) со ссылкой на ячейку, строчку ячейки и номер слова.

  2. Определение колонок численных кодов.

  3. Установление совпадающих колонок и частично совпадающих колонок.

  4. Дополнительное распознавание текста в заголовках колонок с использованием информации об обратной нумерации колонок.

С целью проверки эффективности метода распознавания для монтажных карточек и схем комплектации как целостных структур был разработан прототип программы её распознавания, численные эксперименты показали эффективность предлагаемого метода для изображений рукописных монтажных карточек, полученных многократным копированием оригинала.

В заключении изложены выводы и основные результаты исследования.

^ ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

  1. Разработаны специализированные методы, модели и алгоритмы предварительной обработки изображений ЛМД для систем железнодорожной автоматики. Создан прототип программы, осуществляющий данные методы.

  2. Обоснованы и конструированы специализированные способы сегментации изображения в целях отделения его структурных элементов: таблиц, символов и специальных знаков применительно к монтажным карточкам и схемам комплектации систем железнодорожной автоматики.

  3. Предложены модель, алгоритм и программа процесса автоматического распознавания символов специализированной технической документации для систем железнодорожной автоматики. Разработан новый алгоритм построения скелета символа, основанный на распространении волн, начинающихся в точках границы символа. Создан прототип программы, осуществляющий построение скелета, с помощью рассматриваемого алгоритма.

  4. Разработаны методы распознавания монтажных карточек и схем комплектации как целостных структур, что позволило добиться повышения эффективности обработки изображения специализированной технической документации.

  5. Предложены способы представления распознанной информации. Создан прототип соответствующей программы.

^ СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Основные работы, опубликованные в журналах перечня ВАК:

  1. Бурсиан Е. Ю. Алгоритм распознавания чертёжных рукописных символов. Приборостроение. Известие ВУЗов. № 7. 2008.

  2. Бурсиан Е. Ю. Распознавание таблиц монтажных карточек технической железнодорожной документации. Известия Санкт-Петербургского университета путей сообщения. Выпуск 2. 2010.

Список работ соискателя, опубликованных по теме диссертации:

  1. Бурсиан Е. Ю. Кластеризация распознаваемых объектов на основе корреляционных функций скелетных графов. Математика в ВУЗе. Труды международной научно-практической конференции. Санкт-Петербург. 2004.

  2. Бурсиан Е. Ю. Предварительная обработка изображения технологической карты. Математика в ВУЗе. Труды международной научно-практической конференции. Новгород. 2005.

  3. Бурсиан Е. Ю. Распознавание железнодорожной документации. Известия Санкт-Петербургского университета путей сообщения. Выпуск 3. 2007.

  4. Бурсиан Е. Ю. Моделирование распознавания рукописных символов в таблицах технологических карт систем железнодорожной автоматики. Известия Санкт-Петербургского университета путей сообщения. Выпуск 1. 2009.

Выступления на конференциях:

  1. Бурсиан Е. Ю. Фильтрация изображения распознаваемых объектов на электротехнической схеме. Конференции 50-летие КФ ИрГУПС. 2005.


Подписано к печати 24.11.2010 г. Печ.л. – 1,0

Печать – ризография. Бумага для множит. апп. Формат 60х841/16

Тираж100 экз. Заказ №

Тип. ПГУПС. 190031, С-Петербург, Московский пр.д.9







Скачать 247,88 Kb.
оставить комментарий
Бурсиан Елена Юрьевна
Дата23.09.2011
Размер247,88 Kb.
ТипАвтореферат, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

наверх