Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Открыть новую тему     Написать ответ в эту тему

vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DjvuOCR
by gencho

Программа для добавление OCR информации в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9. Есть также другие полезные функции для работы с djvu.
 
Текущая версия: 2.4 beta
 
Офсайт  
Софт на ЯДиске

Авторская документация к DjvuOCR (в формате HTM)  
 
 
FR9frfPatch для автоматического исправления перепутанных страниц после распознавания в FineReader 9 на многоядерном процессоре
 
Статья Создание в djvu-файле текстового слоя и интерактивного содержания
 
Статья OCR в djvu файлах - новый подход к старым возможностям (немного устаревшая).
 
Статья OCR && DJVU || DJVU && OCR или есть ли текст в дежавю? (немного устаревшая).

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 22:28 28-02-2007 | Исправлено: TelecomUral, 13:44 22-07-2020
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Допустим текстовый слой есть. Как его оттуда вытащить без помощи ФайнРидера?
 
Добавлено:
Наверно, много вопросов не бывает. Есть еще один вопрос. Допустим, изначально сканы для последующей Djvu-книги имели разрешение 300 дпи. Во время декодирования я указал 600 дпи. Качество от этого изменится?

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 22:20 12-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock

Цитата:
Допустим текстовый слой есть. Как его оттуда вытащить без помощи ФайнРидера?  

В программе WinDjvu есть команда вывода текста.

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 09:07 14-12-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
если скан был в 300, то и закодируется в 300, а не в 600, можно проверить экспериментально.

Всего записей: 2294 | Зарегистр. 22-03-2005 | Отправлено: 09:19 14-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Обновлённая версия ФайнРидера 9 (9.0.0.724) открывает для распознавания Djvu файлы. Может стоит заняться поддержкой обновлённого формата frf в DjvuOCR?

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 16:26 15-12-2007
zhenyamerezhko

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот перевод интерфейса на русский http://rapidshare.com/files/76981228/russian.ini класть в папку Language

Всего записей: 45 | Зарегистр. 17-12-2002 | Отправлено: 18:22 16-12-2007
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS

Цитата:
gencho  
Обновлённая версия ФайнРидера 9 (9.0.0.724) открывает для распознавания Djvu файлы. Может стоит заняться поддержкой обновлённого формата frf в DjvuOCR?  

Поддерживаю тебя - 6 книг стоит на месте - не могу ничего сделать

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3304 | Зарегистр. 22-12-2003 | Отправлено: 18:50 20-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем!
 
У меня сейчась нет время для FR9, пробую довести до разума окончательная версия для FR8. С FR9 займусь где то минимум через месяц, к сожалению.
 
А та версия FR9, которая открывает DJVU, не подходит? Она не сохраняет в DJVU? Простите за вопросы, я ее не смотрел еще.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 19:32 22-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
Она не сохраняет в DJVU?

Нет, не сохраняет. Только открывает для распознавания.

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 19:34 22-12-2007 | Исправлено: ILHS, 19:36 22-12-2007
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
А та версия FR9, которая открывает DJVU, не подходит?

Она позволяет сохранить только в эти форматы:
 

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3304 | Зарегистр. 22-12-2003 | Отправлено: 14:24 24-12-2007
krylov07

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
А та версия FR9, которая открывает DJVU, не подходит? Она не сохраняет в DJVU? Простите за вопросы, я ее не смотрел еще.

Нет, разработчики FR пишут, что проблема сохранения в DJVU - абсолютно не техническпая, но пока не разрешима из-за лицензионных ограничений Lizardtech. God knows this is true or not, but thats what they write and looks the agreement FR-Lizardtech could be the matter of some far-away future.

Всего записей: 112 | Зарегистр. 07-05-2007 | Отправлено: 23:13 25-12-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Я попробовал запустить команду Dump pictures info for SK, программа что-то делала, но дамп-файл не создала. FR ver.8. Dumpfile задаю c:\dump.txt. Эта функция еще не работает?

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 14:31 26-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
Taк, значит вот что я нашел:
 
http://gencho.gencho.googlepages.com/Djvu_support_for_FineReader_9.rar
 
Цитирую:
Год выпуска: 2007
Совместимость с Vista: неизвестно
Язык интерфейса: английский + русский
Таблэтка: Не требуется
Описание: В релиз входят две dll-библиотеки. Их нужно добавить в папку, в которую установлен FineReader, и тогда он сможет распознавать DjVu-файлы.
 
Сам пока не пробовал, еще не ставил девятку. Пробуйте и сообщите впечатления.
 
krylov07
Понял. Разработчики FR пойдуть по пути PDF - после распознавания скомпресируют DJVU файл снова, уничтожая все усилия того кто сделал тот файл, и евентуально вводя проблемы типа и-н, меняя размер, теряя букмарки и т.д....
 
bolega
 
То что выложил это не полная версия, только для ознакомление при перевод интерфейса. Там Dump pictures не работает. Подождите еще немного.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 17:10 27-12-2007 | Исправлено: gencho, 17:18 27-12-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Спасибо.  
Интересно, FR сохраняет где-нибудь угол deskew, который он применяет к исходным сканам? Я спрашиваю, потому что координаты of pictures будут относиться уже к повернутому (rotated image) изображению.

Всего записей: 3936 | Зарегистр. 09-09-2002 | Отправлено: 11:03 28-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Я тоже задавал себе этот вопрос. Есть несколько зон в файловом формате, о которых нет информация что они сохраняют, но пока никакое разумное число в известных мне форматах там не нашел. Но и не искал целенаправлено.
 
Добавлено:
Сделал експерименты. Нет, не сохраняется такая информация в рабочих файлах,. Ротация делается еще на вход, и рабочий файл создается для новое изображение.
 
Есть одна возможность: делать сравнение между исходное изображение и страница после ввода в FR. Но незнаю насколько это выполнимо реально.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 00:47 29-12-2007 | Исправлено: gencho, 05:50 29-12-2007
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
Taк, значит вот что я нашел:  
 
http://gencho.gencho.googlepages.com/Djvu_support_for_FineReader_9.rar  

Это просто плагины для распознавания DjVu файла в ABBYY FineReader и ничего другого.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3304 | Зарегистр. 22-12-2003 | Отправлено: 22:35 29-12-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Помогите, пожалуйста, разобраться с ошибкой чтения пакета.
Для большинства страниц пишет:

Цитата:
Invalid FRF Format
(2) offset=00000005

В ФР этот же пакет открывается нормально. Вот фрагмент пакета:
http://rapidshare.com/files/79967138/OCR2.rar.html
Заранее премного благодарен!

----------
пропадет-растает

Всего записей: 6791 | Зарегистр. 21-09-2002 | Отправлено: 03:14 30-12-2007 | Исправлено: ghosty, 03:15 30-12-2007
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
 Есть одна возможность: делать сравнение между исходное изображение и страница после ввода в FR. Но незнаю насколько это выполнимо реально.
 

я думаю, это выполнимо. Можно делать deskew исходного изображения, определить угол (deskew angle), потом сделать deskew изображения после FR, определить для него угол, и разница этих двух углов есть тот угол, на который поворачивал FR.

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 14:47 30-12-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Видимо, проблема в том, что я редактировал этот пакет до и после переустановки системы. Если перераспознать отдельную страницу, то ошибки не будет. Но перераспознавать таким образом более 600 страниц сил нет - на редактирование ушло около 2-х дней. Помогите, пожалуйста.

----------
пропадет-растает

Всего записей: 6791 | Зарегистр. 21-09-2002 | Отправлено: 21:26 30-12-2007 | Исправлено: ghosty, 21:32 30-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
 
Спасибо за информация. Но как получились у вас такие вещи? Может, после переустановки системы вы поменяли имя пользователя Windows?
Вот, подправил DjvuOCR чтобы обрабатывал:
http://gencho.gencho.googlepages.com/DjvuOCR.rar
 
Успехи всем!

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 18:08 31-12-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Благодарю за ответ.

Цитата:
Может, после переустановки системы вы поменяли имя пользователя Windows?
Да в том-то и дело, что сменил
Недавно добился желаемого путем написания специального скрипта, которы выделял на каждой странице маленький блок текста и распознавал его (спасибо octopus'у за идею).
 
С Новым годом, gencho, спасибо за Вашу замечательную программу!
Всех с Новым годом!

----------
пропадет-растает

Всего записей: 6791 | Зарегистр. 21-09-2002 | Отправлено: 18:19 31-12-2007
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru