OCR CuneiForm теперь free-ware. Загрузить систему OCR CuneiForm V.12.
Скачать исходный код программы OCR Cuneiform
Скачать документацию на библиотеки ядра распознавания
Описание архива Cuneiform_src.zip
Директория Kern содержит исходные коды ядра распознавания Puma, необходимые для сборки версии.
Директория Addfiles содержит дополнительные файлы, необходимые для корректного функционирования программы, а именно:
- поддиректория API_PUMA содержит контрольные примеры и описание этих примеров;
- поддиректория Bin содержит словари, необходимые для функционирования программы;
- поддиректория System содержит утилиту, необходимую для регистрации com-серверов;
- файл lns32.ini содержит необходимые параметры конфигурации;
- файлы dbghelp.dll и zlib.dll необходимы для корректного функционирования программы;
- файл reg.bat необходим для запуска регистрации com-сервера распознавания;
- файл license.txt содержит лицензию на данный продукт.
Заявки на участие в Open Source проекте можно отправлять на [email protected].
На сайте запущен форум для координации работы над проектом Open Source .
Информация об OCR CuneiForm:
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
OCR CuneiForm это:
- высокое качество распознавания;
- высокая скорость работы;
- распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
- работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
- распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
- полное сохранение топологии страницы;
- поддержка пакетного режима сканирования и распознавания;
- простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
- встроенный текстовый редактор для работы с распознанным текстом;
- совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.
|