gencho
Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору bolega Привет! У меня в DjvuOCR 2.3 уже работает режим, сохраняющий координаты картинок. Информация сохраняется в файл, формат следующий, вот пример: Picture Frame v.15: items = 1, file = "G:\jram13\0001.frf" 898 1945 1097 2208 Picture Frame v.15: items = 1, file = "G:\jram13\0030.frf" 241 1326 1847 2331 Picture Frame v.15: items = 3, file = "G:\jram13\0129.frf" 144 1264 1072 1412 144 1412 974 1502 144 1502 1072 1554 v.15 указывает версия FineReadera (10 - FR7, 15 - FR8) items - количество строк с координат прямоугольников file - Path к FRF файл в проект FineReader Зона у FineReader может не быть прямоугольник, а состоятся из пересечение несколько прямоугольников, поетому появляется например items = 3 - имеются три прямоугольника формирующие зону. Координаты прямоугольников: top, left, bottom, right. Если в файле появится строка не начинающая с "Picture Frame", ее надо пропускать - она сообщает о картинки в табличних клетках, которые пока пропускаю: они обычно получаются при плохой скан, часть текста маркируется как картинка. Вообще, иногда FineReader не маркирует картинки как надо - или маркирует часть, или больше. Хорошая стратегия: получить тот файл с координаты, пройтись по тексте и исправить маркировка картинок, и потом снова получить файл с координаты. | Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 02:32 22-02-2008 | Исправлено: gencho, 02:35 22-02-2008 |
|