Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Открыть новую тему     Написать ответ в эту тему

vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DjvuOCR
by gencho

Программа для добавление OCR информации в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9. Есть также другие полезные функции для работы с djvu.
 
Текущая версия: 2.4 beta
 
Офсайт  
Софт на ЯДиске

Авторская документация к DjvuOCR (в формате HTM)  
 
 
FR9frfPatch для автоматического исправления перепутанных страниц после распознавания в FineReader 9 на многоядерном процессоре
 
Статья Создание в djvu-файле текстового слоя и интерактивного содержания
 
Статья OCR в djvu файлах - новый подход к старым возможностям (немного устаревшая).
 
Статья OCR && DJVU || DJVU && OCR или есть ли текст в дежавю? (немного устаревшая).

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 22:28 28-02-2007 | Исправлено: TelecomUral, 13:44 22-07-2020
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Спасибо. Действительно в Batch mode работает.
В силе остаётся второй вопрос:

Цитата:
при экспортировании текста из такого типа Djvu с OCR, снова текст одного языка подменён вопросами.  
Использована программа WinDjvu (функция экспортирования текста).
Как решить проблему?

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 11:02 03-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не знаю как експортирует текст WinDjvu.
 
Предлагаю следующее (я так пользуюсь):
1) експортируйте OCR-слой из DJVU с пмощью djvused (командная строка:
djvused -e output-txt file.djvu >output.txt
 
или из DjvuOCR, меню Extract OCR layers
 
2) используйте утилита cvthtml2.exe из пакета DjvuOCR. Командная строка
cvthtml2 -j output.txt output.html
 
Открываете output.html в IE или Firefox и копируете то что надо - там все в UTF8 сохраняется.
 
В последная версия DjvuOCR есть встоенная опция про такого експорта текста.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 17:01 03-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
В последная версия DjvuOCR есть встоенная опция про такого експорта текста.

Это DjvuOCR 2.2 beta или есть ещё новее?

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 08:37 04-12-2007
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho

Цитата:
Да, чуть не забыл: добавлена возможность перевода сообщении на другие языки, пока только английский и болгарский, так как я руский не сильно владею в деталях и особено падежах . Там надо один маленкий текстовый файл перевести, но вы справитесь. Если есть желающие, английский оригинал здесь:  
 
http://gencho.gencho.googlepages.com/english.ini  
 
Надо переводить только текст справа от знак '=' .

1.Насколько я понимаю, программа уникод не будет использовать?
Это жалко, так как на не родных виндовсах, будут все равно видны только крякозябры.
 
2. Немного трудно переводить, так как нет программы, под которую это делается.
Не все с английского переводится так же кратко и с длинной строк могут быть проблемы.
 
Я смог бы перевести на украинский и возможно немецкий (для русского перевода есть достаточно русских на этом форуме), но надо действительно иметь программу для согласования длины строк и их видимости
 
Можете где-то выложить, можно и не рабочую, но чтобы могла читать файл с переводами?

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 15:32 04-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот, поставил здесь:
 
http://gencho.gencho.googlepages.com/DjvuOCR_temp.rar
 
Только новое EXE и языки, для полной версии надо добавить предидущий пакет.
 
Да, Unicode пока не будеть - я работал по пути наименьшего сопротивления, а для Unicode надо менять много, пока остановился на компромис.  
 
Предупреждаю, этот вариант не из последних, но интерфейс вроде тот же - может что-то не работаеть как надо. Скоро будеть публичный вариант.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 22:42 04-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Заранее прошу прощение за максималистический вопрос:
Можно ли в принципе создать (визуальный) редактор файлов Djvu с OCR? Где можно было бы редактировать и картину (стереть, очистить итд, например на основе привью кромсатора) и текст.

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 10:26 08-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
В принципе возможно много. На практика для этого нужно потратит ресурсы.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 19:59 08-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Ещё вопрос:
Как работает Dump Pictures Info (for ScanKromsator)?

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 21:51 08-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
Пока только создает список с координаты картинок. Этого меню в массовая версия не будеть.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 23:41 09-12-2007
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если gencho не успеет быстрее ответить, расскажите мне, пожалуйста, что означают сле-дующие функции в DJV-Decoder из DJV-OCR
Horizontal flip и Vertical flip
To gray и To tonal
Level 1-255
Resize width x height
Layer. Можно подробнее рассказать о его разновидностях?
Если я правильно понял, то программа может и output dpi поменять на выбранный? А что такое тональный цвет применительно к скану?

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 15:14 10-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Horizontal flip и Vertical flip
Огледальное отображение, по горизонтали и по вертикали
 
To gray и To bitonal
Выходное графическое изображение будеть в отенках серого (to gray) или чернобелое (to bitonal). Если не выбраны, изображение выводится в оригинал, какое оно в файле.
 
Level 1-255
При выход в чернобелое изображение, это уровень отрезания, ниже - черный цвет, выше - белый.
 
Resize width x height  
Масщабирование изображения. Если ничего не указано, не пользуется.
 
Layer
Конструкция DJVU такая, что изображение состоится из несколько частей, маска и основа. Полное изображение получается через "all". Иногда если есть большой серий фон, а мы хотим получить чернобелое изображение, хорошие результаты получаются с "mask" или "foreground", чисто экспериментально.
 
Page range
Интервал страниц, можно задавать в форме 1-15,46,89-213
Это выводит толко страниц с 1 по 15, 46, и с 99 по 213. Если конец интервала выше количество страниц, он автоматически коректируется во время работы.  
 
dpi
Разрешение выходого графического изображения. Если пусто, сохраняется dpi изображения в файле.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 20:02 10-12-2007
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо, gencho! Никто еще не перевел интерфейс на русский язык?

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 20:57 10-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
Никто

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 22:14 10-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gencho
Греческий интерфейс:
http://rapidshare.com/files/75816173/greek.ini
Замечание: нужно расширить размеры кнопок.
Хорошо было бы вместе с русским интерфейсом создать и хелп файл.

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 15:39 11-12-2007 | Исправлено: ILHS, 15:41 11-12-2007
gencho



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
Спасибо!
Можете ли вы сохранить тот же файл как Unicode? Например загужаете в Wordpad и сохраняете как Unicode text? Это нужно если вдруг я от безделья сделаю Unicode поддержку интерфейса.  
 
Кнопки я уже изрядно расширял, посмотрю что можено еще сделать.  
Руский хелп готовится.
 
Еще раз спасибо.

Всего записей: 321 | Зарегистр. 20-06-2003 | Отправлено: 19:21 11-12-2007
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нужно скопировать текст из книжки в формате Дежваю, но в просмотрщике нет такой опции. Может нужна дополнительная программа? Я нашел один метод, но он долгий, а книжек много. Сначала декодировал книжку в тифы, потом распознал в ФайнРидере, а уж потом отправил в пдф. Есть путь покороче? Спасибо.

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 20:53 12-12-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
Если текстового слоя у DJVU изначально не было, то только так.

----------
пропадет-растает

Всего записей: 6791 | Зарегистр. 21-09-2002 | Отправлено: 20:59 12-12-2007
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
Если небольшой фрагмент книжки, то можно использовать ABBY Screenshot Reader.

Всего записей: 597 | Зарегистр. 06-12-2004 | Отправлено: 21:02 12-12-2007
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А как определить, был он или нет? Если был, то как?

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 21:34 12-12-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
посмотрите свойства страницы, по правой кнопке мыши, там вся статистика написана, в том числе размер текста, если текстовой слой есть.

Всего записей: 2303 | Зарегистр. 22-03-2005 | Отправлено: 21:55 12-12-2007
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru