Разработка методов звукового распознавания слов на основе их морфологического анализа и синтеза 05. 13. 11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей icon

Разработка методов звукового распознавания слов на основе их морфологического анализа и синтеза 05. 13. 11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей


Смотрите также:
Математическое и программное обеспечение пофонемного распознавания казахской речи на основе...
Математическое и программное обеспечение распознавания многоэлементных зрительных сцен с...
Принципы и решения по совершенствованию эффективности функционирования операционных систем и...
Разработка моделей...
01. 02. 06 – Динамика, прочность машин, приборов и аппаратуры...
Алгоритмы и программные средства помехоустойчивого кодирования мультимедиа потоков в...
Алгоритмы и программные средства помехоустойчивого кодирования мультимедиа потоков в...
Автореферат диссертации на соискание ученой степени...
3. Языки и системы программирования. Технологий разработки программного обеспечения...
Правила приема в аспирантуру на 2009 год в белорусском государственном университете...
Поиск сценариев событий на гриде источников данных об окружающей среде...
Поиск сценариев событий на гриде источников данных об окружающей среде...



Загрузка...
скачать
УДК 004.432.4 На правах рукописи


Бекманова Гульмира Тылеубердиевна


РАЗРАБОТКА МЕТОДОВ ЗВУКОВОГО РАСПОЗНАВАНИЯ СЛОВ НА ОСНОВЕ ИХ МОРФОЛОГИЧЕСКОГО АНАЛИЗА И СИНТЕЗА


05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей


Автореферат

диссертации на соискание ученой степени

кандидата технических наук


Астана 2010


Работа выполнена в Евразийском национальном университете им. Л.Н. Гумилева


Научный руководители: доктор технических наук, профессор

^ Шарипбаев А.А.


доктор физико-математических наук, профессор

Шелепов В. Ю.


Официальные оппоненты: доктор технических наук, профессор

Джурунтаев Д. З.


кандидат технических наук

Жуат М.


Ведущая организация: ДГП «Институт математики» РГП «Институт математки, информатики и механики» МОН РК


Защита состоится 31 марта 2010 г. в 17.00 часов на заседании диссертационного совета Д 14.61.01 при Евразийском национальном университете им. Л. Н. Гумилева, по адресу: 010008, г. Астана, ул. Мунайтпасова 5, главный корпус, аудитория 302


С диссертацией можно ознакомиться в библиотеке Евразийского национального университета им. Л.Н. Гумилева.


Автореферат разослан «27» февраля 2010 г.


Ученый секретарь

диссертационного совета Д14.61.01, д.т.н. Ниязбекова Р. К.


^ ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ


ВВЕДЕНИЕ

Актуальность темы исследования. Разработка средств эффективного взаимодействия человека с компьютером, в том числе автоматического распознавания речи, является одним из актуальных направлений развития искусственного интеллекта и информатики в целом. Исследованием этой проблемы уже более 50 лет занимаются специалисты нескольких научных областей.. С развитием современных речевых технологий появилась принципиальная возможность перехода от формальных языков-посредников между человеком и машиной к естественному языку (ЕЯ) в устной форме как универсальному средству выражения целей и желаний человека. Речевой ввод обладает рядом преимуществ, таких, как естественность, оперативность, смысловая точность ввода, освобождение рук и зрения пользователя, возможность управления и обработки в экстремальных условиях.

Выявление формальных структур естественного языка, формализация языка в целом, построение конструктивной теории и компьютерной модели языка являются приоритетными направлениями информатики на протяжении последних десятилетий. Системы информационного поиска, диалоговые системы, инструментальные средства для машинного перевода и автореферирования, рубрикаторы и модули проверки правописания, так или иначе, проводят анализ естественно-языковых текстов. Достижения последних лет в области современной логики, искусственного интеллекта и компьютерной лингвистики создали новые предпосылки для исследований природы морфологических, синтаксических, семантических и словообразовательных связей в естественном (казахском) языке.

^ Степень разработанности проблемы. Значительный вклад в изучение и исследование проблемы распознавания речи и обработки естественно-языковых текстов внесли ученые дальнего и ближнего зарубежья. Достаточно эффективные системы распознавания речи существуют для английского, китайского, испанского, японского и русского языков. Проблемы распознавания речи отражены в трудах следующих ученых: S. Furui, R.O. Duda, Jelinek, F. Jurafsky D., J.H. Martin, E. Keller (ed.), C.D. Manning, H. Schuetze, L.R. Rabiner , B. Juang, S. L. Oviat, Н. Хомского, У. Ли, Дж. Фланагана, Дж. Е. Шуна, Ф. Хейс-Роза, Г. Гудмена, Р. Редди, Т. К. Винцюка, В. Ю. Шелепова, А. В. Ниценко, Г. В. Дорохиной, В. Н. Трунина-Донского, Е. Н. Соколовой, А. Б. Холоденко, М. А. Сапожкова, В.Я. Чучупала, К. А. Маковкина, А. В. Чичагова, В. А. Баранникова, В. А. Кибкало, Д. Е. Шуклина и др.

Вместе с тем в настоящее время не существует эффективной системы распознавания казахской речи. Проведенный анализ лингвистической литературы показал, что в настоящее время нет описания фонетического строя казахского языка, содержащего физические (акустические) характеристики звуков, необходимые для создания автоматического транскриптора, который является неотъемлемой частью системы распознавания казахской речи. Кроме того проблема распознавания речи всегда тесно связана с обработкой текста на ЕЯ, в данном случае разработкой формальных моделей и алгоритмов словоизменения, словообразования и морфологического анализа казахского языка, что делается впервые.

Актуализация проблем исследования и степень их разработанности детерменируют цель, основные задачи исследования и логику ее построения.


Целью диссертационной работы является разработка методов звукового распознавания слов на основе их морфологического анализа и синтеза на основе исследования морфологических, фонологических, семантических закономерностей и фонетического строя казахского языка, направленных на разработку формальных моделей и построения алгоритмов словоизменения, словообразования и морфологического анализа.

Задачи. Для достижения указанной цели диссертационной работы ставятся и решаются следующие задачи:

  • создание базы данных начальных форм казахских слов с разметкой частей речи и других признаков, необходимых для генерации словаря словоформ;

  • разработка формальной модели словоизменения и словообразования казахского языка с учетом семантики на основе семантической нейронной сети;

  • автоматическая генерация базы данных казахских словоформ с полной морфологической информацией;

  • разработка алгоритма и программы морфологического анализа естественно-языковых текстов с учетом семантики на основе семантической нейронной сети и клеточных автоматов;

  • формализация фонологических правил звукосочетаний в казахском языке;

  • разработка транскриптора, позволяющего автоматически генерировать транскрипцию заданного слова;

  • разработка алгоритмов и программ распознавания казахских слов на основе транскрипции.

^ Объектами исследовани являются морфологические, фонологические и семантические закономерности казахского языка, фонетический состав и классификация звуков казахского языка, методы распознавания речи естественных языков и обработки цифровых звуковых сигналов.

^ Методы исследований диссертационной работы основывается на теории нейронных сетей, теории формальных языков и автоматов, теории функций комплексных переменных, теории и методов программирования.

^ Научная новизна полученных результатов диссертационной работы заключается в том, что впервые были:

  • создана база данных начальных форм слов объёмом 45 000 слов с разметкой частей речи и других признаков, необходимых для генерации словаря словоформ;




  • получена формальная модель словоизменения и словообразования казахского языка с учетом семантики на основе семантической нейронной сети;

  • автоматически сгенерирована база данных казахских словоформ объёмом более 1 800 000 словарных статей с полной морфологической информацией;

  • разработаны алгоритмы и программы морфологического анализа естественно-языковых текстов с учетом семантики на основе семантической нейронной сети и клеточных автоматов;

  • получены формализации фонологических правил звукосочетаний в казахском языке;

  • разработан транскриптор, позволяющий автоматически генерировать транскрипцию заданного слова;

  • разработаны алгоритмы и программы распознавания казахских слов на основе транскрипции.

^ Основные научные положения диссертационного исследования, выносимые на защиту:

  • формальная модель словоизменения и словообразования казахского языка с учетом семантики на основе семантической нейронной сети;

  • алгоритм морфологического анализа естественно-языковых текстов с учетом семантики на основе семантической нейронной сети и клеточных автоматов;

  • формальные фонологические правила звукосочетаний казахского языка;

  • транскриптор, позволяющий автоматически генерировать транскрипцию заданного слова;

  • алгоритмы и программы распознавания казахских слов на основе транскрипции.

^ Практическая значимость работы состоит в том, что полученные словари могут быть изданы в качестве орфографических словарей. Полученные формализации, методы и алгоритмы могут использоваться в системах обработки естественно-языковых текстов (орфографических корректорах, переводчиках, обучающих системах), системах распознавания и синтеза казахской речи, а также в семантических поисковых системах.

^ Апробация работы. Результаты работы докладывались на следующих конференциях:

  • Международной научно-практической конференции студентов, аспирантов, молодых ученых «Современные техника и технологии (г. Томск 2008),

  • Международной научно-практической конференции «Информационно-инновационные технологии: интеграция науки, образования и бизнеса» КазНТУ им. Сатпаева (Алматы 2008)

  • Международной конференции «Актуальные проблемы математики и информационных технологий – Аль Хорезми 2009» (Ташкент 2009),

  • Всероссийской конференции с межународным участием Знания-Онтологии-Теории (Новосибирск, 2009 г).

Результаты диссертационного исследования внедрены в учебный процесс по дисциплинам «Теория языков и автоматов» и «Системы искусственного интеллекта» специальности «050602-Информатика» на кафедре «Программное обеспечение систем и сетей» КазНТУ им. К. Сатпаева и кафедры «Вычислительная техника» ЕНУ им. Л. Н. Гумилева (Акты внедрения).

Публикации. Основные научные результаты диссертации опубликованы в 11 научных трудах, из них 4 опубликованы в изданиях, перечень которых утвержден Комитетом по контролю в сфере образования и науки. Из совместных публикаций в диссертации приведены результаты, полученные автором.

^ Структура работы. Диссертация состоит из введения, трех глав, заключения, списка использованных источников из 101 наименований и приложений. Основное содержание диссертационной работе изложено на 117 страницах машинописного текста, иллюстрированного таблицами и рисунками.

^ В первой главе приведены теоретические основы распознавания слов, в которых рассматриваются состав и классификация звуков казахского языка, математические основы распознавания слов казахского языка, в том числе элементы теории нейронных сетей, элементы теории формальных языков и автоматов, а также современные методы и технологии распознавания речи.

Во второй главе автоматизируются морфологический анализ и синтез казахских слов, которые включают в себя построение семантической базы начальных форм слов, формализацию морфологических правил казахского языка, построение и реализацию морфологического синтеза казахских слов, а также построение и реализацию алгоритмов морфологического анализа казахских слов.

^ В третьей главе реализуются методы распознавания казахских слов. Осуществляется первоначальная запись и обработка речевого сигнала. На основе формализованных фонологических правил звукосочетаний разрабатывается автоматический транскриптор и осуществляется распознавание казахских слов.

В приложении приводятся исходные тексты программмы, формальные правила, и акты внедрения.

^ КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении содержится общая характеристика работы, где обоснована актуальность исследуемой проблемы; определены объекты исследования; сформулированы цель и задачи исследования; представлены идея работы и методы исследования; показана связь диссертационной работы с программами; установлены научная новизна, практическая ценность и достоверность результатов; указаны апробация, публикации, использование и внедрение полученных результатов; приведены выносимые на защиту положения; дана структура диссертации.

^ В первой главе приведены теоретические основы распознавания слов, в которых рассматриваются состав и классификация звуков казахского языка, математические основы распознавания слов казахского языка, в том числе элементы теории нейронных сетей, элементы теории формальных языков и автоматов, а также современные методы и технологии распознавания речи.

Для изучения звуков языка будут использоваться фонетические и фонологические методы анализа.

Фонетическими методами являются:

  • артикуляционный анализ;

  • акустический анализ;

  • перцептивный анализ.

Под распознаванием слитной речи будем понимать представление речевого сигнала последовательностью слов, которая ему соответствует.

Параметры автоматической системы распознавания речи в первую очередь зависят от условий прикладной задачи:

  • уровня окружающего шума;

  • свойств канала передачи речи;

  • размера словаря;

  • типа ввода речи (изолированный или слитный ввод).

Для распознавания изолированных слов необходимо, чтобы диктор делал короткие паузы между словами, что замедляет ввод и ухудшает естественность, в то время как при вводе слитной речи этого не требуется.

Продукты, основанные на технологии распознавания речи, можно разделить на три большие группы:

  • средства речевого управления;

  • средства диктовки;

  • средства идентификации по образцу речи [1].

Методы распознавания речи. Ключевым вопросом в распознавании речи является идентификация элементов речи, которая ведется или путем сравнения с эталонами (фонем, слов, словосочетаний) методами динамического программирования (ДП), или посредством оценки правдоподобия принадлежности данного сигнала к тому или иному классу при статистическом моделировании на основе скрытых Марковских моделей.

^ Семантические нейронные сети

В 1957 году, Джон фон Нейман создал архитектуру нейронной сети, принципиально отличную от персептронной. Её свойствами, существенными для данной работы, являются следующие[8]:

  • Нейрон представляет некоторое достаточно простое устройство по переработке входных сигналов. В оригинале были использованы логические функции конъюнкции, дизъюнкции и инверсии.

  • Нейрон может динамически изменять выполняемую функцию. Один и тот же нейрон в разное время может выполнять разные функции. В один момент времени — только одну из возможных функций.

  • Нейрон может динамически менять соединения с другими нейронами.

  • Одна часть нейронной сети может анализировать состояние другой части сети.

  • Одна часть сети может изменять топологию другой части нейронной сети.

При математически полном наборе функций их сложность отразится только на вычислительной эффективности. Как показал фон Нейман в своей работе, такая нейронная сеть эквивалентна машине Тьюринга.

При этом необходим только одноуровневый метапереход, в результате которого такая нейронная сеть напрямую реализует конечный автомат, эквивалентный машине Тьюринга, и ленту с программой.

В сети фон Неймана главное — не функция, выполняемая нейроном. Главным является способность к саморефлексии и самомодификации.

Допустим, в сети уже сформирована некоторая структура. В описываемой сети один участок нейронной сети может проанализировать структуру другого участка. Затем принять некоторые решения на основе этого анализа и провести изменение связей или типов нейронов.

Одна часть нейронной сети может использовать другую часть нейронной сети в качестве банка памяти, динамически подсоединяясь к отдельным нейронам-ячейкам, считывая их состояние или изменяя это состояние.

Интересна аналогия, которую можно провести между молекулой ДНК и лентой в таком автомате. Более того, одна часть нейронной сети может выпустить "конструирующий рукав" и собрать из отдельных нейронов устройство, выполняющее некоторые функции.

При этом память, расположенная в "ленте" используется как ДНК, на основе которой конструируется некоторый участок нейронной сети.

Рассмотрим семантические нейронные сети и те следствия, которые возникают в процессе применения идей фон Неймана к этим сетям.

В сети фон Неймана существуют ограничения на топологию связей и  обрабатываются только логические значения. В семантической нейронной сети, построенной на основе сети фон Немана, ограничения на топологию связей отсутствуют и выполняется обработка нечётких значений. Все нейроны в сети фон Неймана синхронизируются тактами В семантической нейронной сети существуют синхронизированные и не синхронизированные нейроны. В отличие от сети фон Неймана, в семантической нейронной сети отсутствуют ограничения на топологию нейронов. Это приводит к невозможности относительной адресации нейронов, как это делал фон Нейман. В этом случае, необходимо ввести абсолютную адресацию[5].

Выводы:

  • Семантическая нейронная сеть может быть эффективно реализована средствами существующей вычислительной техники.

  • Семантическая нейронная сеть эквивалентна машине Тьюринга благодаря постулированной свободе разработчика. Это означает, что на её основе можно реализовать систему, вычисляющую любую функцию вычислимую на машинах Тьюринга. Например, такая сеть, в качестве частного случая, может моделировать многослойный персептрон с обратным распространением ошибки.

  • Так нейроны персептрона можно сконструировать из отдельных нейронов такой сети, выполняющих по отдельности функции суммирования, умножения и функцию активации.

  • Алгоритм обучения персептрона можно реализовать в виде отдельного фрагмента такой сети, анализирующего и модифицирующего фрагмент, соответствующий, собственно, персептрону.

  • Семантическая нейронная сеть эквивалентна клеточному автомату. [6].

Принцип клеточных автоматов основан на локальных взаимодействиях. Все элементы в любой рассматриваемой системе действуют по одинаковым принципам. В совокупности результаты работы простых правил, на которых основаны взаимодействия, позволяют получать сложное поведение. Джон фон Нейман дает следующее определение клеточным автоматам: «Клеточные автоматы являются дискретными динамическими системами, поведение которых полностью определяется в терминах локальных зависимостей. В значительной степени также обстоит дело для большого класса непрерывных динамических систем, определенных уравнениями в частных производных. В этом смысле клеточные автоматы в информатике являются аналогом физического понятия «поля»… клеточный автомат может мыслиться как стилизованный мир. Пространство представлено равномерной сеткой, каждая ячейка или клетка которой содержит несколько битов данных; время идет вперед дискретными шагами, а законы мира выражаются единственным набором правил, скажем, небольшой справочной таблицей, по которой любая клетка на каждом шаге вычисляет своё новое состояние по состояниям её близких соседей. Таким образом, законы системы являются локальными и повсюду одинаковыми. «Локальный» означает, что для того, чтобы узнать, что произойдет здесь мгновение спустя, достаточно посмотреть на состояние ближайшего окружения: никакое дальнодействие не допускается. «Одинаковость» означает, что законы везде одни и те же: я могу отличить одно место от другого только по форме ландшафта, а не по какой-то разнице в законах».

Формально клеточный автомат можно определить как набор {G, Z, N, f},

  • где G – метрика поля, на котором действует клеточный автомат;

  • Z – множество состояний каждой клетки;

  • N – окрестность клетки, которая влияет на состояние данной клетки;

  • f – правила клеточного автомата, которые в математическом виде могут быть записано.

Свойствами клеточного автомата являются: локальность правил, однородность системы, конечность множества состояний клетки, одновременность изменений для всех клеток.

Во второй главе автоматизируются морфологический анализ и синтез казахских слов, которые включают в себя построение семантической базы начальных форм слов, формализацию морфологических правил казахского языка, построение и реализацию морфологического синтеза казахских слов, а также построение и реализацию алгоритмов морфологического анализа казахских слов.

Построение семантической базы начальных форм слов. В состав любой языковой модели системы распознавания речи входит словарь. В нашей системе существует словарь начальных форм, на основании которого строится словарь словоформ казахского языка. Построение словаря словоформ основывается на использовании семантической языковой модели казахского языка.

Процесс словоизменения основывается на детальном анализе начальной формы слова с целью выделения его морфологических признаков и считывания его семантических признаков из базы знаний. Далее определяется траектория словоизменения, происходит сам процесс словоизменения на основе семантической нейронной сети и запись словоформы и его морфологической информации в словарь словоформ.





Рисунок 1 – Процесс словоизменения


Морфологические признаки выделяются по следующему принципу. Определяется последняя буква начальной формы слова и относится к одной из следующих категорий (рисунок 2). В соответствии с этими признаками осуществляется добавление того или иного окончания.




Рисунок 2 – Дерево морфологических признаков


Очевидная сложность обработки естественно-языковых процессов вызвана трудностью их формализации. Сложность заключается в невозможности словоизменения слов для какой либо части речи по заданной траектории без предварительной обработки словаря начальных форм, поскольку существует зависимость словоизменения слова от его смысла, то есть от его семантического содержания[7].

В качестве семантических признаков начальных форм слов выступают такие категории как часть речи, одушевленность и неодушевленность для имен существительных, образование сравнительных и превосходных степеней прилагательных, образование собирательных и порядковых числительных, для глагола сочетание в сложных формах с вспомогательными глаголами как «отыр», «тұр», «жатыр», «жүр» и др. Всего в базе знаний, по которой осуществляется словоизменение, более 30 семантических признаков.

Формализация морфологических правил казахского языка. Казахский язык относится к тюркской группе языков и характеризуется большим числом словоформ для каждого слова, образованных путем добавления к его концу суффиксов и окончаний. Суффиксы относятся к семантической категории и при образовании новых слов часто изменяют части речи, к которой относится корневое слово или основа. Например, неделимый корень в форме глагола «жаз – пиши» при добавлении суффикса «у» превращается в существительное «жаз+уписьмо» или в другой глагол «жаз+уписать», а добавление к последнему другого суффикса «шы» превращает его в существительное «жазу+шы – писатель». В то же время, добавление окончания не меняет части речи, к которой принадлежит основа (неделимый корень плюс суффиксы). Например, с помощью окончания «лар» можно получить множественное число существительного «жазу+лар – письма, жазушы+лар – писатели»[8].

В этой работе будут рассматриваться только правила добавления окончаний, которые порождают из одного и того же слова много словоформ, отличающихся друг от друга только окончаниями, которые добавляются в определенном порядке. Это позволяет строить словарь автоматически, генерируя словоформы при помощи правила добавления окончаний. При этом действует закон сингармонизма звуков и слогов, который обуславливает добавления мягких или твердых окончаний в зависимости от мягкости или твердости основы (неделимого корня или корня с суффиксом) соответственно. Например, для имен существительных к основе слова вначале добавляется окончание множественного числа затем притяжательное окончание (означает принадлежность предмета тому или иному лицу) далее следует падежное окончание и последним окончание формы спряжения (добавляется только к одушевленным существительным, которые изменяются по лицам с помощью личных окончаний.

Для формализации правил добавления окончаний предлагается использовать семантическую нейронную сеть, осуществляющую синтез словоформ казахского языка, что позволяет порождать структуру словаря начальных форм в виде синхронизированного линейного дерева.

Для представления словоформы и ее признаков будут использоваться следующие метасимволы:

# - разделитель между словами,

(- начало слова,

) - конец слова,

! - начало признака словоформы (падеж и т. д.),

* -конец признака словоформы.

Рассмотрим пример для слова «бала - ребенок» (основа слова) и двух его словоформ «балам - мой ребенок», «балаң - твой ребенок» (в казахском языке одушевленные существительные изменяются по лицам с помощью личных окончаний). Рецептор возбуждается на символ начала слова «(». Далее переходит в состояние «б», при подаче символа «б», далее последовательно «(ба», «(бал», «(бала» , и затем одновременно два субсостояния «(балам)» и «(балаң)» (рисунок 3).




Рисунок 3 – Синхронизированное линейное дерево для словоформ


На рисунке 4 приведен пример структуры связей леммы, определяющей следующие признаки: имя существительное (зат есім) –«!зе*» , одушевленное – «!жа*», притяжательное окончание (тәуелдік жалғау) первого лица – «!11*» (бірінші жақ), притяжательное окончание (тәуелдік жалғау) второго лица – «!22*» (екінші жақ). При подаче на лемму слова «(балам)» она переходит в возбужденные субсостояния: «(балам)», «!зе*», «!жа*», «!11*» а при подаче слова «балаң» в возбужденные субсостояния: «(балаң)», «!зе*», «!жа*», «!22*».




Рисунок 4 – Синхронизированное линейное дерево для словоформ и их морфологической информации

Нейроны рецепторы распознают отдельные символы входной символьной последовательности. На выходе рецептор генерирует сигнал, означающий наличие или отсутствие соответствующего символа в анализируемом тексте. Нейроны-эффекторы выдают результат распознавания отдельных фрагментов входной символьной последовательности. Заменив в синхронизированном линейном дереве сигнал от рецептора сигналом от эффектора того же дерева, получим возможность использовать в качестве входных символов фрагменты символьных последовательностей.

Для обозначения таких фрагментов во входной символьной последовательности будем применять метасимволы скобок: "(" и ")". Тогда приведенный пример перепишется в виде: ((бала)м), ((бала)ң), (((бала)м)ның), (((бала)ң)да) [8].





Рисунок 5 – Использование в качестве входных символов фрагментов символьных последовательностей


Таким образом формализованы все части речи казахского языка, общее количество формальных правил составило около 20000 записей, например только для глагола это исло 13000 формальных правил.

Ниже приводятся фрагмент формальных правил словоизменения на примере существительного с учетом закона сингармонизма, который обуславливает добавления мягких или твердых окончаний в зависимости от мягкости или твердости основы. Приведенный пример показывает фрагмент правил, где «зе» – зат есім (имя существительное), «жа» - жанды (одушевленность), «01» заканчивается на твердые гласные а, о, ұ, «))» между закрывающими скобками помещены окончания существительных, после «!» морфологическая информация.

((зежа01)мын)!жі11

((зежа01)мыз)!жі11

((зежа01)сың)!жі22

((зежа01)сыңдар)!жі22

((зежа01))!жі33

((зежа01)м)!тә11

((зежа01)мыз)!тә110

((зежа01)ң)!тә22

((зежа01)ңыз)!тә22

((зежа01)сы)!тә33

((зежа01)лар)!кт

(((зежа01)лар)мыз)!ктжі11

(((зежа01)лар)сыңдар)!ктжі22

(((зежа01)лар))!ктжі33

(((зежа01)лар)ым)!кттә11

(((зежа01)лар)ымыз)!кттә110

(((зежа01)лар)ың)!кттә22

(((зежа01)лар)ыңыз)!кттә22

(((зежа01)лар)ы)!кттә33

((зежа01))!ат0

((зежа01)ның)!іл

((зежа01)ға)!ба

((зежа01)ны)!та

((зежа01)да)!жс

((зежа01)дан)!шы

((зежа01)мен)!кө

((зежа01)менен)!кө

(((зежа01)м)ның)!тә11іл

(((зежа01)м)а)!тә11ба

(((зежа01)м)ды)!тә11та

(((зежа01)м)да)!тә11жс

(((зежа01)м)нан)!тә11шы

(((зежа01)м)мен)!тә11кө

(((зежа01)м)менен)!тә11кө

(((зежа01)мыз)дың)!тә110іл

(((зежа01)мыз)ға)!тә110ба

(((зежа01)мыз)ды)!тә110та

(((зежа01)мыз)да)!тә110жс

(((зежа01)мыз)дан)!тә110шы

(((зежа01)мыз)бен)!тә110кө

(((зежа01)мыз)бенен)!тә110кө

(((зежа01)ң)ның)!тә22іл

(((зежа01)ң)а)!тә22ба

(((зежа01)ң)ды)!тә22та

(((зежа01)ң)да)!тә22жс

(((зежа01)ң)нан)!тә22шы

(((зежа01)ң)мен)!тә22кө

(((зежа01)ң)менен)!тә22кө

(((зежа01)ңыз)дың)!тә22іл

(((зежа01)ңыз)ға)!тә22ба

(((зежа01)ңыз)ды)!тә22та

(((зежа01)ңыз)да)!тә22жс

(((зежа01)ңыз)дан)!тә22шы

(((зежа01)ңыз)бен)!тә22кө

(((зежа01)ңыз)бенен)!тә22кө

(((зежа01)лар)дың)!ктіл

(((зежа01)лар)ға)!ктба

(((зежа01)лар)ды)!ктта

(((зежа01)лар)да)!ктжс

(((зежа01)лар)дан)!ктшы

(((зежа01)лар)мен)!кткө

(((зежа01)лар)менен)!кткө

((((зежа01)лар)ым)ның)!кттә11іл

((((зежа01)лар)ым)а)!кттә11ба

((((зежа01)лар)ым)ды)!кттә11та

((((зежа01)лар)ым)да)!кттә11жс

((((зежа01)лар)ым)нан)!кттә11шы

((((зежа01)лар)ым)мен)!кттә11кө

((((зежа01)лар)ым)менен)!кттә11кө

((((зежа01)лар)ымыз)дың)!кттә11іл

((((зежа01)лар)ымыз)ға)!кттә11ба

((((зежа01)лар)ымыз)ды)!кттә11та

((((зежа01)лар)ымыз)да)!кттә11жс

((((зежа01)лар)ымыз)дан)!кттә11шы

((((зежа01)лар)ымыз)бен)!кттә11кө

((((зежа01)лар)ымыз)бенен)!кттә11кө

((((зежа01)лар)ың)ның)!кттә22іл

((((зежа01)лар)ың)а)!кттә22ба

((((зежа01)лар)ың)ды)!кттә22та

((((зежа01)лар)ың)да)!кттә22жс

((((зежа01)лар)ың)нан)!кттә22шы

((((зежа01)лар)ың)мен)!кттә22кө

((((зежа01)лар)ың)менен)!кттә22кө

((((зежа01)лар)ыңыз)дың)!кттә22іл

((((зежа01)лар)ыңыз)ға)!кттә22ба

((((зежа01)лар)ыңыз)ды)!кттә22та

((((зежа01)лар)ыңыз)да)!кттә22жс

((((зежа01)лар)ыңыз)дан)!кттә22шы

((((зежа01)лар)ыңыз)бен)!кттә22кө

((((зежа01)лар)ыңыз)бенен)!кттә22кө

((((зежа01)лар)ым)сыңдар)!кттә11жі22

((((зежа01)лар)ың)быз)!кттә22жі11

((((зежа01)лар)ы)сыңдар)!кттә33жі2



Программная реализация эмулятора семантической нейронной позволила сделать эту систему открытой, добавляя в нее все новые и новые правила, не меняя программного кода, мы можем синтезировать новые словоформы и новые слова.

Известно, что семантическая нейронная сеть эквивалентна клеточному конечному автомату. Поэтому задача морфологического анализа сводится к изменению состояний субавтомата, соответствующего словарной статье и ее признакам.

Программная реализация эмулятора семантической нейронной сети и соответствующего конечного автомата позволила автоматизировать синтез и анализ словоформ казахского языка.

Алгоритм морфологического анализа

1. Слово считывается;

2. Открывается словарь начальных форм и в нем выполняется поиск считанного слова;

3. Если слово найдено, то перейти к шагу 12, иначе шаг 4 ;

4. Слово в цикле посимвольно считывается, начиная с последнего символа, то, что получается, ищем в словаре окончаний;

5. Если окончание найдено, то остаток ищем в словаре начальных форм;

6. Запоминаем морфологическую информацию окончания;

7. Если остаток слова найден в словаре начальных форм, то

8. Если это глагол, то считываем слово слева перед ним и определяем время глагола

9. Если это деепричастие, то считываем слово справа после него и определяем время глагола

10. Если это прилагательное, то считываем слово слева перед ним и проверяем его входит ли оно в список вспомогательных слов, использующихся для образования превосходных степеней, если входит, то это превосходная степень прилагательного.

11. Если такое слово не найдено, то переходим к шагу 4, иначе к шагу 12;

12. Конец.[4].


^ В третьей главе реализуются методы распознавания казахских слов. Осуществляется первоначальная запись и обработка речевого сигнала. На основе формализованных фонологических правил звукосочетаний разрабатывается автоматический транскриптор и осуществляется распознавание казахских слов.
^

Обработка речевого сигнала:


  • оцифровка речевых сигналов;

  • сглаживание звукового сигнала;

  • вычисление численного аналога полной вариации и количества точек постоянства;

  • определение начала и конца речи.

Для описания обработки записываемого речевого сигнала введем некоторые понятия, связанные с числовыми массивами.

Пусть имеется одномерный числовой массив и задан некоторый порог . Построим символьную последовательность , поставив в соответствие членам массива, которые больше , символ «В» (выше порога), остальным символ «Н» (ниже порога).

Для того чтобы устранить случайные единичные включения, для каждого промежуточного i-го элемента полученной символьной последовательности выполняются две дополнительные обработки:


  • обработка «тройками»:

если и , то полагается

, (1)

  • обработка «четверками»:


если и , , то полагается


и . (2)


Далее мы для краткости будем называть описанную процедуру «В-Н»-обработкой исходного числового массива.

Мы будем использовать также процедуру сглаживания речевого сигнала. Сглаживанием сигнала называется обработка его 3-точечным скользящим фильтром вида:


. (3)





Рисунок 6 Сигнал, отвечающий слову «Астана»





Рисунок 7 Сигнал, отвечающий слову «Астана» после 10-кратного сглаживания

^ Первоначальная запись и обработка речевого сигнала. Для записи речевого сигнала в память компьютера сначала нужно произвести его оцифровку. Мы будем использовать 8-битную оцифровку звукового сигнала с частотой дискретизации 22050 Гц, так что его значения имеют градаций: от 0 до 255.

Предполагается использование системы в лабораторных условиях, при отсутствии существенного внешнего шума. При вводе речевого сигнала записывается 30000 отсчетов «тишины» и в записанном сигнале анализируются последовательные отрезки по 300 отсчетов в каждом. Для каждого из них вычисляется следующее отношение:


, (4)

(5)


где V- численный аналог полной вариации, - число точек постоянства, то есть моментов времени, для которых в следующий момент величина сигнала остается неизменной. Автоматически определяется значение величины (4), характерное для используемой звуковой карты, как наиболее часто встречающееся в массиве значений. Оно увеличивается на 0,1 и запоминается под именем , а результат, увеличенный в 2 раза, – под именем .

^ Вычисление последовательности квазипериодов. Гласные и звонкие согласные звуки образуются с использованием голосовых связок, которые под действием потока воздуха из легких совершают колебания, близкие к периодическим. Поэтому и соответствующие сигналы (амплитудно-временные представления) являются квазипериодическими (точное определение понятия квазипериода приведено ниже). Вот как выглядит, например, амплитудно-временное представление звука А в слове «ата»:





Рисунок 8 Результат автоматического разбиения голосового участка сигнала на квазипериоды


На этом рисунке вертикальные метки расставлены программой, вычисляющей последовательные квазипериоды по следующему алгоритму.

Вычисляется величина


(6)


где - номер отсчета, с которого в буфере начался текущий квазипериод,

.


Определяется , при котором величина принимает минимальное значение. По определению представляет собой длину квазипериода. Числа и MAX определяются высотой голоса диктора. Для тенора можно взять


, .


Принимая конец найденного квазипериода за начало следующего, находим второй квазипериод и так далее.


^ Автоматический транскриптор – программа перевода любого орфографического текста в транскрипционную запись и наоборот на основе лингвистических правил [11].

Транскриптор слов в транскрипционную запись присутствует во всех системах обработки естественного языка, таких как переводчики, системы распознавания или синтеза речи.

Введем следующие обозначения для гласных звуков: G – множество гласных звуков казахского языка, G1 – множество твердых гласных звуков, G2 – множество мягких гласных звуков, G3 – множество негубных гласных звуков, G4 – множество губных гласных звуков, G5 – множество заднеязычных гласных звуков, G6 – множество переднеязычных гласных звуков, G7 – множество открытых гласных звуков, G8 – множество закрытых гласных звуков, G9 – срединный гласный звуков в попарно различимых признаках звуков в каждой группе, т.е.

G = {А, Ә, О, Ө, Ұ, Ү, Ы, І, Е};

G1 = {А, О, Ұ, Ы}  G;

G2 = {Ә, Ө, Ү, І}  G;

G3 = {А, Ә , Ы, І}  G;

G4 = {О, Ө, Ұ, Ү}  G ;

G5 = {А, О, Ұ, Ы}  G;

G6 = {Ә, Ө, Ү, І}  G ;

G7 = {А, Ә, О, Ө}  G;

G8 = {Ұ, Ү, Ы, І }  G;

G9 = {E}  G.

Также введем обозначения для согласных звуков: S – множество согласных звуков казахского языка, S1 – множество глухих согласных звуков, S2 – множество звонких согласных звуков, S3 – множество сонорных согласных звуков, S4 – множество губных согласных звуков, S5 – множество переднеязычных согласных звуков, S6 – множество среднеязычных согласных звуков, S7 – множество заднеязычных согласных звуков, S8 – множество смычных согласных звуков, S9 – множество круглощелевых согласных звуков, S10 – множество плоскощелевых согласных звуков, S11 – множество дрожащих согласных звуков, S12 – множество боковых согласных звуков, т.е.


S 1 = {К, Қ, П, Ф, С, Т, Х, Ш}  S;

S 2 = {Б, В, Г, Ғ, Д, Ж, З}  S;

S3 = {Й, Л, М, Н, Ң, Р, У}  S;

S 4 = {Б, М, П, У} S;

S 5 = {Д, Ж, З, Л, Н, Р, С, Т, Ш}  S;

S6 = {В, Г, К, Ф}  S;

S 7 = {Ғ, Й, Қ, Х}  S;

S 8 = {Б, Г, Ғ, Д, К, Қ, М, Н, Ң, П, Т}  S;

S 9 = {З, С, У}  S;

S 10 = {Ж, Й, Ш}  S;

S 11 = {Р}  S;

S 12 = {Л}  S;


Пусть A – алфавит казахского языка, т.е. A = G S, тогда множество всех цепочек (слов) конечной длины в алфавите A обозначается как:

A* = A0­ A1 A2 A3 …, (7)

где A0­ = {} – множество слов длины 0, A1 = A – множество слов длины 1, A2 = AA – множество слов длины 2, A3 = AAA – множество слов длины 3,  – знак операции прямого (декартового) произведения множества.

Элементы множества A* будут обозначаться строчными (малыми) греческими буквами: , , , ... . При этом слово длины 0 (пустое слово) всегда будет обозначаться через .

Множество всех слов не нулевой длины в алфавите A обозначим через A+­, которое образуется исключением из A* множество пустых слов, т.е.

A+­ = A* \ {} (8)

Ясно, что любая фонологическая единица казахского языка является элементом множества A+­[4,5].

Теперь приступим к формализации фонологических правил казахского языка:

  1. ^ Стык двух глухих согласных. На стыке двух глухих согласных в одном слове или в случае, когда одно слово заканчивается на глухой согласный звук, а другое слово начинается c глухого согласного звука, оба эти согласные звуки остаются глухими:

(9)


Пример: Стык двух глухих согласных возможен в корне слова “ақпан”, “ақпар”, на стыке корня и афикса (суффикса или окончания) “атақпен”, “бақпен”, на стыке двух слов “ақ сандық”, “ақ саусақ”. Во всех этих случаях превращения глухих согласных не происходит[6].

  1. ^ Стык двух согласных глухого и сонорного.

  1. На стыке двух согласных глухого и сонорного в одном слове или в случае, когда одно слово заканчивается на глухой переднеязычный согласный (с, т, ш), а другое начинается c сонорного согласного звука, тогда глухой согласный остается глухим, а сонорный согласный остается сонорным:

, (10)


где ={С, Т, Ш}.


Пример: Стык двух согласных глухого и сонорного возможен в корне слова “асмар”, на стыке корня и постфикса (суффикса или окончания) “бетмоншақ”, на стыке двух слов “жас мал”. Во всех этих случаях превращения согласных не происходит[6].

  1. На стыке двух согласных глухого и сонорного в одном слове или в случае, когда одно слово заканчивается на глухой непереднеязычный согласный (к, қ, п, ф, х), а другое начинается c сонорного согласного звука, тогда глухой согласный, заменяется на парный ему звонкий согласный:


, (11)

где .


Пример: Стык двух согласных глухого и сонорного возможен на стыке двух корней Бекмагамбет (произносится Бегмагамбет), Ақнұр (произносится Ағнұр) в сложных словах и на стыке двух слов ақ мандай (произносится ағмандай), көк найза (произносится көгнайза). Во всех этих случаях происходит превращения согласных[6] .

  1. На стыке двух согласных звонкого и глухого в слове или на стыке двух слов, звонкий согласный остается звонким, а глухой согласный заменяется на парный ему звонкий

или

звонкий согласный заменяется на парный ему глухой согласный а глухой согласный остается глухим согласным


(12)


(13)


Пример: Стык двух согласных звонкого и глухого возможен на стыке корня и постфикса и на стыке двух корней сөзсіз (произносится сөссіз), қымызқор (произносится қымысқор) и на стыке двух слов тез пісті (произносится тес пісті), жүз пышақ (произносится жүс пышақ). Однако можно произнести и следующим образом қымыз қор - қымыз ғор, тез пісті тез бісті, жүз пышақ - жүз бышақ [6].

  1. На стыке двух согласных глухого и звонкого в слове или на стыке двух слов, глухой согласный заменяется на парный ему звонкий согласный, а звонкий согласный остается звонким согласным

или

глухой согласный остается глухим согласным, а звонкий согласный заменяется на парный ему глухой согласный .

(14)

(15)

Пример: Стык двух согласных глухого и звонкого возможен в корне слова акбар (произносится акпар), на стыке корня и постфикса не встречается, на стыке двух слов ақ гүл (произносится ақкүл). Во всех этих случаях происходит превращение звонкого согласного в глухой согласный. Однако можно произнести эти слова по-другому акбар (произносится ағбар), ақ гүл (произносится ағгүл)[6].

Полученные таким образом формальные фонологические правила казахского языка позволят построить транскриптор, который автоматически строит транскрипционную запись слова, что является важным элементом при разработке системы распознавания казахской речи[2,3,11].

^ Распознавание слов по эталонам. Алгоритм DTW. Пусть некоторая реализация слова принимается за эталон. Мы представляем ее в виде набора 27-ми 29-мерных векторов:

(16)

Такой эталон записывается для каждого из слов распознаваемого словаря.

Пусть теперь

(17)

- представление слова, которое подлежит распознаванию. Естественно было бы разумным образом определить расстояние между двумя наборами вида (16), (17), так, чтобы, вычислив расстояние набора (8) до всех эталонов, объявить результатом распознавания то слово из словаря, эталон которого является ближайшим.

Выберем для определенности за расстояние между векторами сумму модулей разностей соответствующих координат (-метрика). Тогда казалось бы естественным определить расстояние между наборами (16), (17) как сумму расстояний векторов с одинаковыми номерами. Однако, это нецелесообразно по следующей причине. На самом деле при вычислении расстояния между двумя реализациями одного и того же слова нужно было бы сравнивать между собой вектора, относящиеся к одинаковым звукам. Но темп произнесения слова может быть различным. Кроме того, он может меняться на протяжении слова. Можно сказать "Алма", а можно сказать "Алма-а".

Разрешить эту трудность помогает следующий алгоритм, восходящий к Т.К. Винцюку и получивший название алгоритма Dynamic Time Warping или DTW-алгоритма (Динамическое деформирование времени). Обозначим расстояние между векторами и наборов (16), (17) через и для всех определим величину :

, , , , (18) .

Это определение расстояния между частью сигнала, соответствующего (16), от начала до -го отрезка включительно и частью сигнала, соответствующего (17), от начала до -го отрезка включительно. Тогда расстояние между полными сигналами определяется как . Для того, чтобы понять смысл этого определения, обозначим через ~ отношение соответствия между векторами из набора (16) и векторами из набора (17), которое определяется следующим образом:



Далее, если , то в случае, когда минимум есть , полагаем

;

если минимум есть , полагаем

;

если минимум есть , полагаем



Таким образом, алгоритм DTW обеспечивает выравнивание акустически наиболее близких кусков сигнала и их сравнение. Распознавание с помощью этого алгоритма сводится к вычислению DTW-расстояния исследуемого слова до всех эталонов и объявления результатом распознавания того слова словаря, эталон которого оказывается ближайшим [9].

ЗАКЛЮЧЕНИЕ



Представленная диссертационная работа является законченным научным исследованием, в которой получены следующие научные результаты:

  • создана база данных начальных форм слов объёмом 45 000 слов с разметкой частей речи и других признаков, необходимых для генерации словаря словоформ;

  • получена формальная модель словоизменения и словообразования казахского языка с учетом семантики на основе семантической нейронной сети;

  • автоматически сгенерирована база данных казахских словоформ объёмом более 1 800 000 словарных статей с полной морфологической информацией;

  • разработаны алгоритмы и программы морфологического анализа естественно-языковых текстов с учетом семантики на основе семантической нейронной сети и клеточных автоматов;

  • получены формализации фонологических правил звукосочетаний в казахском языке;

  • разработан транскриптор, позволяющий автоматически генерировать транскрипцию заданного слова;

  • разработаны алгоритмы и программы распознавания казахских слов на основе транскрипции.

Перечисленные научные результаты являются обоснованными и достоверными.

Научные результаты, полученные в диссертационной работе, могут использоваться в дальнейшем в различных областях, так полученные электронные словари не имеют аналогов в казахской лингвистике и могут быть изданы независимо от других результатов исследования. Кроме того, они и полученные формализмы и алгоритмы могут использоваться в других предметных областях искусственного интеллекта, например, при разработке интеллектуальных поисковых систем, систем машинного перевода и т.д. Методы звукового распознавания, а также транскриптор имеют направленность на решение проблемы распознавания казахской речи.

Диссертационная работа написана единолично, содержит совокупность новых научных результатов, выдвигаемых для публичной защиты, имеет внутреннее единство и свидетельствует о личном вкладе соискателя в науку.
^

СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

  1. Шарипбаев А. А., Бекманова Г. Т. К вопросу распознавания казахской речи. // Издательство Томского политехнического университета, Труды 14 Международной научно-практической конференции студентов, аспирантов, молодых ученых «Современные техника и технологии» – Томск: 2008.– Том 2. – с. 240-241.
  2. Шарипбаев А. А., Бекманова Г. Т. Математические методы распознавания сочетания звуков казахского языка. //Труды Международной научно-практической конференции «Информационно-инновационные технологии: интеграция науки, образования и бизнеса» –КазНТУ им. К. Сатпаева. – Алматы: 2008. – с. 216-220.
  3. Шарипбаев А. А., Бекманова Г. Т. Формализация фонологических закономерностей казахского языка для систем автоматического распознавания речи // Вестник НАН РК. – Алматы: 2008. – №6. – с. 42-46.
  4. Шарипбаев А. А., Бекманова Г. Т. Формализация морфологических правил казахского языка с помощью семантической нейронной сети // Доклады НАН РК. – Алматы: 2009. – №4. – с. 11-16.
  5. Sharipbaev A., Bekmanova G. The synthesis of word forms of Turkic language using semantic neural networks // Abstracts «Modern problems of applied mathematics and information technologies – Al Khorezmy 2009». Tashkent: 2009. – p. 145.
  6. Шарипбаев А. А., Бекманова Г. Т. Синтез словоформ тюркских языков с помощью семантической нейронной сети // Труды конференции «Актуальные проблемы математики и информационных технологий – Аль Хорезми 2009». – Ташкент: 2009. – Том 2. – с. 148-152.
  7. Шарипбаев А. А., Бекманова Г. Т. Построение логической семантики слов казахского языка // Материалы Всероссийской конференции с межународным участием «Знания-Онтологии-Теории (ЗОНТ-09)». – Новосибирск: 2009. – Том 2. – с. 246-249.

  8. Бекманова Г. Т. Некоторые подходы к проблемам автоматического словоизменения и морфологического анализа в казахском языке // Вестник Восточно-Казахстанского государственного технического университета им. Д. Серикбаева. – Усть-Каменогорск: 2009г. – № 4. – с. 192-197.

  9. Бекманова Г., Ниценко А. , Шарипбаев А. А., Шелепов В. Ю. О некоторых вопросах, связанных с распознаванием казахской речи // Вестник ЕНУ им. Л. Н. Гумилева. – Астана: 2009. – № 6. – с. 172-177.

  10. Бекманова Г. Т. Транскриптор казахских слов для распознавания речи // Вестник НАН РК. Алматы: 2009. – № 6. с. 12-17.

  11. Бекманова Г., Ниценко А. , Шарипбаев А. А., Шелепов В. Ю. Алгоритмы распознавания казахского слова как целого. Структурная классификация слов казахского языка // Вестник ЕНУ им. Л. Н. Гумилева. – Астана: 2010. – в печати.
^

ТҮЙІН СӨЗ



Бекманова Гульмира


Сөздердерді морфологиялық анализ бен синтезге негізделген дыбыстық тану әдістерін жасау


05.13.11 - «Есептеуіш машиналар мен кешендердің және компьютерлік жүйелердің математикалық және программалық қамтамасы»


Ұсынылып отырған диссертациялық жұмыс аяқталған ғылыми зерттеу болады және онда мынадай ғылыми нәтижелер алынған:

  • сөз пішімдерінің сөздігін тудыру үшін сөз таптары және басқа белгілері анықталған көлемі 45000 қазақ сөздерінің алғашқы пішімдерінен тұратын деректер базасы жасалды;

  • семантикалық нейрондық желі негізінде қазақ тілінің сөз өзгерістері мен сөз құраушыларының семантикасы ескеріліп формалды моделі құрылды;

  • қазақ сөз пішімдерінің морфологиялық толық ақпаратты көлемі 1800000 сөздік баптарынан тұратын деректер базасы тудырылды;

  • семантикасы ескеріле отырып, семантикалық нейрондық желі мен клеткалық автомат негізінде табиғи-тілді мәтінді морфологиялық талдаудың алгоритмі мен программасы жасалынды;

  • қазақ тіліндегі дыбыс үйлестерінің фонологиялық ережелерінің формалды моделі алынды;

  • берілген сөздің транскрипциясын автоматты тудыратын транскриптор жасалынды;

  • қазақ сөздерін транскрипция негізінде танитын алгоритмдер мен программалар жасалынды.

Диссертациялық жұмыстың ғылыми нәтижелері негізделінген және расталған. Олар кейінірек әртүрлі салаларда қолданыс табады. Құрылған электрондық сөздіктердің қазақ лингвистикасында баламалары жоқ және оларды зерттеудің басқа нәтижелеріне байланыссыз жеке басып шығаруға болады. Сонымен қатар, олар және құрылған формализмдер мен алгоритмдер жасанды зерденің басқа пәндік салаларында, мысалы, зерделі іздеу жүйелері мен машиналық аудару және басқа жүйелерін жасау кезінде қолданылады. Дыбысты тану әдістері мен траскриптор қазақ тілінде сөйлеулерді тануға бағытталған.

Диссертациялық жұмысты ізденушінің өзі жазған және ол оның ғылымға қосқан үлесіне куә болады. Диссертация өзінің ішкі бірлігі бар ашық қорғалатын ғылыми нәтижелердің жиынтығын қамтиды.

SUMMARY


Bekmanova Gulmira


^ Designing of methods for speech recognition of words with using of their morphological analysis and synthesis


05.13.11 - Mathematical and the software of computers, complexes and computer networks

The purpose of research is designing of methods for speech recognition of words with using of their morphological analysis and synthesis. The basis of research of morphological, phonologic, semantic laws and phonetic building the Kazakh language, the formal models directed on development and construction of algorithms of word change, word-formation and the morphological analysis.

The following results are received:

  • The database of initial form of words is created. It is consist of 45 000 words with their semantic information. The database is using for generation of word flections.

  • The formal model of word flections and word generations is created. The formal model basic on semantic neural net.

  • The database of word flections is automatically generated. It is consist of more than 1 800 000 words with full their morphological information;

  • The algorithms and programs (basics on semantic neural net and cellular’s automates) of morphological analyses of natural languages texts are designing.

  • Formalizations of phonological rules of sounds combinations are received.

  • The program for automatic transcriptions of words is designing. Transcriptor

  • Algorithms and programs of recognition Kazakh words are designing.

All their scientific results are proved and authentic.

The received Databases can be issued as spelling dictionaries, and formalizations, methods and algorithms can be used in systems of processing of natural language texts (spelling proof-readers, the translators, training systems), systems of recognition and synthesis of the Kazakh speech, and also in semantic search systems.

Подписано в печать 26.02.10 г. Формат 60×84/16

Усл. печ. л. 1,5. Тираж 100 экз. Заказ № 025


Отпечатано в типографии ЕНУ им. Л. Н. Гумилева

г. Астана, ул. Кажымукана, 13






Скачать 405,53 Kb.
оставить комментарий
Бекманова Гульмира Тылеубердиевна
Дата21.09.2011
Размер405,53 Kb.
ТипАвтореферат, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

Рейтинг@Mail.ru
наверх