АДАПТИВНОЕ РАСПОЗНАВАНИЕ СИМВОЛОВ. (В. Л. Арлазаров, В.В. Троянкер, Н.В. Котович). ПРОДОЛЖЕНИЕ
Рассмотрение обоих подходов в сравнении друг с другом приводит к целесообразности их объединения. Цель объединения очевидна - получить метод, совмещающий одновременно универсальность и технологичность безшрифтового подхода и высокую точность распознавания шрифтового. Предпосылками для исследования в этом направлении послужил следующий круг идей и фактов. Любой алгоритм распознавания символов становится применим на практике при качестве распознавания 94-99%. "Дожимание" последних процентов, т.е. окончательная доводка алгоритма всегда является трудоемкой и дорогостоящей работой. Внутри сферы распознавания символов любой алгоритм имеет свою специфичную область действия, для которой он разработан и в которой проявляет себя наилучшим образом. В целом, путь увеличения качества распознавания лежит не в изобретении сверхинтеллектуального алгоритма, который заменит собой все остальные, а в комбинировании нескольких алгоритмов, каждый из которых сам по себе прост и обладает эффективной вычислительной процедурой. При комбинировании различных алгоритмов важно, чтобы они опирались на независимые источники информации о символах. В случае, если два алгоритма работают над сильно коррелированными между собой данными, то вместо увеличения качества распознавания будет увеличиваться суммарная ошибка. С другой стороны, знания о распознанных символах должны накапливаться и использоваться в последующих шагах процесса распознавания. Более того, как окончательный критерий можно использовать точный шрифтозависимый алгоритм, база характеристик которого построена прямо в процессе работы ("на лету") по результатам предыдущих шагов распознавания. Метод, обладающий указанным выше свойством, будем называть адаптивным распознаванием, т.к. он использует динамическую настройку (адаптацию) на конкретные входные символы.
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ АДАПТИВНОГО РАСПОЗНАВАНИЯ. В модели приняты следующие допущения:
- Символы обучающей выборки и материала распознавания принадлежат единственному шрифту. Обобщение этой модели на случай произвольного количества шрифтов требует отдельного исследования.
- Все символы внутри одного цикла адаптивного распознавания имеют одинаковую степень искажений, вносимых процессами печати и сканирования. Это предположение отвечает ситуации, когда единицей цикла является одна страница текста.
- Имеется некий готовый шрифтонезависимый алгоритм с определенным качеством распознавания. В данном случае не важно, откуда взялся этот алгоритм, каким образом он анализирует символы, его особенности и детали реализации.
- В данной модели не учитывается зависимость надежности распознавания от корреляции между кластерами разных букв. Очевидно что эмпирически такая зависимость существует, однако это не снижает применимость модели в целом, а только ограничивает ее применение в ряде конкретных случаев. В перспективе, фактор взаимозависимости между различными кластерами безусловно должен быть учтен при моделировании адаптивного распознавания.
Модель охватывает два ключевых этапа адаптивного распознавания: кластеризация символов обучающей выборки и дораспознавание. Модель создается с целью получения аппарата, позволяющего оценить теоретический предел качества распознавания и надежности при заданных параметрах первичного распознавания и меры искаженности символов. Ниже следует перечисление параметров модели.
P- качество распознавания, полученное на этапе первичного распознавания
- мера искаженности символов, дает числовое выражение количеству случайных изменений в конфигурации пикселов среди экземпляров символов, обозначающих одну и ту же букву алфавита
F- финальное качество распознавания достижимое с помощью шрифтозависимого алгоритма адаптированного к данной выборке символов
V- надежность распознавания символа; V=f(x,P), где x -расстояние от данного символа до центра кластера(идеального символа). Функция f является частью конкретного алгоритма вычисления расстояния между символом и кластером. Зависимость надежности от расстояния до идеала указывает на интуитивно очевидную связь между надежностью и отличием символа от идеала. Зависимость надежности от качества первичного распознавания отражает тот факт, что при зафиксированном х надежность может быть различной в зависимости от качества материала из которого составлен кластер
Предположим выбрана метрика, т.е. функция отображающая отличия между символом и кластером в действительное положительное число (расстояние). Основное положение модели заключается в том, что расстояние от символа пришедшего на распознавание до кластера есть нормально распределенная случайная величина с плотностью вероятности
Тогда по заданной минимальной допустимой надежности Vmin вычислим максимальное расстояние Xm на которое символ может отклониться от кластера и при котором V>= Vmin
Далее по определению функции распределения [2] получаем
Это равенство дает ответ на вопрос каким будет качество распознавания при заданных надежности и мере искаженности символов. Наоборот, измерив на представительной выборке качество распознавания, можно по таблице [5] выяснить с какой надежностью получен этот результат.
|