"ПЕРСПЕКТИВЫ РАЗВИТИЯ OCR-ТЕХНОЛОГИЙ В НАЧАЛЕ XXI ВЕКА"
Тезисы доклада генерального директора компании Cognitive Technologies, д.т.н., профессора В.Л. Арлазарова
Выделим несколько основных тенденций, которые, по нашему мнению, будут иметь место на рынке систем распознавания в начале XXI-века:
- ОСНОВНАЯ ТЕНДЕНЦИЯ. Ввиду того, что на гладких текстах OCR-системы уже имеют точность распознавания вполне достаточную для их успешного промышленного использования, то основные усилия разработчики будут тратить (и это подтверждает деятельность Cognitive Technologies за последние три года) на интеграцию OCR-систем с различными программами обработки информации (электронные архивы, системы автоматизации делопроизводства и др.) и, возможно, операционными системами.
- Если все же говорить об OCR-системе, как о самостоятельной программе, то здесь развитие пойдет в следующих направлениях:
- повышение точности распознавания текстов низкого качества. В первую очередь, к этой категории относятся документы находящиеся в архивном хранении. Эта категория документов сегодня еще плохо поддается обработке существующими системами. К концу следующей пятилетки, по нашим оценкам, точность распознавания текстов плохого качества возрастет в 5 раз. Наряду с проблемой повышения точности низкокачественных текстов актуальной является проблема выделения текстовой информации на фоне шумов (например, задачи распознавания номерных знаков автомобилей и т.д.);
- создание систем распознавания математических символов. Аппарат для реализации подобной системы уже разработан в Cognitive Technologies;
- реализация технологий рукописного распознавания. Технология обработки этого класса документов сегодня находится на достаточно высоком уровне. С ее помощью Cognitive Technologies уже реализован ряд крупных и достаточно сложных проектов. Однако, область применения могла бы быть значительно больше. Дело в том, что многих видов документов, которые существуют на западе, в России на сей день не существует (например чеков). Поэтому, вопрос развития этого направления зависит не столько зависит от разработчиков, сколько остается вопросом востребованности технологий.
|