monday2000
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору terminat0r U235 Я имел в виду, что те дистрибутивы CuneiForm под Windows, которые доступны на оф. сайте, не поддерживают вывод hOCR. Вообще их 2 штуки, вот они: 1. http://www.cuneiform.ru/downloads/cuneiform.zip (версия на момент открытия кода программы - т.е. "старая"). http://www.cuneiform.ru/downloads/setup_openocr_cuneiform_rus.exe (более новая версия - т.е. "новая"). Правда, "новая" версия поддерживает вывод в свой фирменный формат FED - который является аналогом hOCR. Вот документация к FED: http://www.djvu-soft.narod.ru/openocr.htm (я даже перевёл её на английский). По идее, можно сделать конвертер FED -> hOCR (или что-то в этом роде). Вывод hOCR прикрутили уже линуксоиды - к своему Linux-клону CuneiForm. Но Windows-то версиям CuneiForm от этого ни холодно, ни жарко - они как не умели выводить hOCR - так и не умеют по-прежнему. "Старая" версия не умеет распознавать более 1-страницы текста за один присест. И ещё она даже и FED не умеет выводить. "Новая" версия фактически содержит 2 программы в одном дистрибутиве - "старую" версию плюс новую программу, умеющую делать пакетное распознавание. Именно вот эта пакетная распознавалка (фактически, это просто нечто вроде GUI к ядру распознавания) и умеет выводить FED. Но есть одна важная проблема: по неизвестным причинам, "новая" версия почему-то распознаёт гораздо хуже "старой" (эту мысль мне сообщил модератор ZYV с форума OpenOCR). В смысле качества распознавания. (кстати, ZYV - не сотрудник Cognitive, так что он ничего толком не знает). Видно, пакетная распознавалка получилась у них кривая. Так что по идее, плясать нужно всё-таки от "старой" версии - начисто игнорируя "новую". U235 Цитата: CuneiForm нормально под Win32 (проверял под VC++) собирается, с выводом в hocr. | Так это здорово и замечательно! Я лично об этом мог только мечтать - поскольку совершенно не имел и не имею времени пытаться перекомпилировать CuneiForm. Расскажите, пожалуйста, подробнее - как Вы это компилировали, по шагам (например, на форуме openocr.org), ну или хотя бы - выложите готовую к применению CuneiForm под Windows, умеющую выводить hOCR (надеюсь, она с визуальным интерфейсом и поддержкой пакетного распознавания?). Это будет просто здорово. | Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:20 09-10-2010 | Исправлено: monday2000, 09:26 12-10-2010 |
|