ПОЛЬЗОВАТЕЛИ ИНТЕРНЕТА ДЕЛАЮТ СВОЙ ВЫБОР В ПОЛЬЗУ OCR CUNEIFORM
Как показал анализ статистки одного из самых популярных американских сайтов с коллекцией программного обеспечения - Download.com, пользователи интернета в мире проявляют большой интерес к системе оптического распознавания CuneiForm компании Cognitive Technologies.
По данным журнала "Инфобизнес" (№13-14 от 20 апреля 1999 г.) число ежедневных скачиваний программы OCR CuneiForm практически в 2 и более раз (десятки раз) превышает показатели таких программ как Presto! OCR (по лиц. ABBYY), Sokrat ("Арсеналъ"), поисковая система "Следопыт 2.0" и другие. Несомненно, эти факты говорят о том, что пользователи всемирной сети сделали свой выбор в пользу программы CuneiForm, именно благодаря ее качеству распознавания и другим функциональным возможностям.
По словам Н.Никольского, директора по маркетингу компании Cognitive Technologies: "Сегодня мы наблюдаем повышенный интерес пользователей к OCR CuneiForm. Его можно объяснить, в частности, объявленным на начало июня выходом системы распознавания нового тысячелетия CuneiForm 2000."
ИНФОРМАЦИЯ О СИСТЕМЕ CUNEIFORM 2000
Систему CuneiForm 2000 отличает высочайшее качество распознавания, возросшее на 60% по сравнению с предыдущими версиями. Разработчиками было полностью переписано ядро распознавания.
Одной из важнейших особенностей новой версии является высокая точность воссоздания формы исходного документа. Эта возможность получила название "What you scan is what you get". Дело в том, что до настоящего времени пользователи систем распознавания тратили достаточное количество времени (которое часто превышало время самого сканирования и распознавания) для придания документу его исходной формы, добиваясь того, чтобы каждый фрагмент находился на нужном месте. Особенно это касается документов со сложной топологией: многоколончатые тексты с заголовками, аннотациями, графическими иллюстрациями, таблицами, и т.д. В новой версии эта проблема успешно решена.
CuneiForm 2000 - система, в которой реализованы алгоритмы самообучения. С их реализацией система способна самостоятельно обучаться и распознавать плохо пропечатанные символы с помощью шрифта, созданного на основе символов, которые пропечатаны достаточно хорошо. Таким образом, если при распознавании низкокачественных документов традиционными методами OCR-система дает процент ошибок больше порогового, то CuneiForm может произвести дораспознавание текста с использованием адаптивных алгоритмов. Отметим, что самообучение занимает лишь 10% от суммарного времени распознавания. Применение самообучающихся алгоритмов в процессе распознавания выделяют CuneiForm в новый, перспективный класс систем.
НОВЫЕ ВОЗМОЖНОСТИ CUNEIFORM 2000
|