Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Сканирование и оцифровка текста *.txt, *doc, *.pdf, *.djvu

Модерирует : gyra, Maz

articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

   

ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотелось бы составить нечто вроде алгоритма действий для тех, кто оцифровывает в разные форматы (а таковых здесь много).
Например, что делать, если у человека есть книга без картинок и формул, если с картинками и формулами, если оригинал плохого качества, если он хочет, чтобы было удобно читать, чтобы файл был наименьшего объема и т.д. и т.п.
Давайте разберемся, какие форматы для каких целей подходят. Проблема отнюдь не надуманная.  


Софт:
1. LizardTech DocumentExpress и DjVu Solo  
2. ScanKromsator: Знаменитый кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
3. DjVuReader: Альтернативный шустрый ридер для *.djvu. Автор: Dickobraz. http://www.opendjvu.nm.ru/
Обсуждение здесь.
4. AutoScan: Плагин для беспрерывного сканирования под IrfanView. Обновляется при выходе новой версии IrfanView. Автор: EL. autoscan.zip (4 KB)


Полезные ссылки по *.djvu:
http://www.cqham.ru/m2_scan.htm  
http://www.cqham.ru/djvu_print.htm    
http://www.cqham.ru/likbez_djvu.htm    
http://www.cqham.ru/djvu_ocr.htm    
 
Наш маленький FAQ по *.djvu:
1. Q: Что делать, если при конвертации происходит замена одних букв на другие, напр. "и" на "н" (проблема "инь" (с) Astra55)
    A: Возможные варианты рассмотрены здесь.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 18:51 02-03-2004 | Исправлено: ghosty, 03:53 18-12-2004
evheniys



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
EL
Точно такаяже ошибка (
Windows XP(Pro)+SP1 (Rus)
Irfan 3.91
Cканер AgfaSnapScan (FotoLook 3.6)
 
Если чуть подправить процедуру проверки - работает,
но сканит весь лист в лайнарт 100 дпи

Всего записей: 63 | Зарегистр. 07-02-2003 | Отправлено: 18:47 22-09-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evheniys и другие (если еще есть такие), у кого возникает ошибка при работе с AutoScan:
 
Дописал небольшую проверку на нестандартные ситуации
AutoScan 1.6.1
Попробуйте. Если получите сообщение об ошибке - скопируйте его в буфер (ткнуть курсором в текст, Ctrl-A, Ctrl-C) и запостите сюда.
 
Добавлено
Похоже, что проблема все равно пока не решается:(  
Мне нужна дополнительная информация:
 
1. Попробуйте перед строкой 209 ("IrfanViewVersionInt = CInt(IrfanViewVersionStr)")вставить такую строку в скрипт:
MsgBox IrfanViewVersionInt & vbCRLF & IrfanViewVersionStr
 
Что показывает при запуске?
 
2.
что за версию IrfanView вы используете? Может, какую-нибудь русифицированную? Тогда ссылку на нее, пожалуйста.
 
С этим http://irfanview.tuwien.ac.at/iview392.zip скрипт у вас работает или нет?

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 14:08 26-09-2004
evheniys



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
EL
 
Ситуация без изменений
 
Сообщение об ошибке
=========
Script:      D:\iv\autoscan.vbs
Line:        209
Char:       5
Error:       Type mismatch: 'CInt'
Code:      800A000D
Source:    Microsoft VBScript runtime error
=========
При добавлении строчки получаем
0
3.9.2.0
 
Остальные мелочи
Windows XP pro (Rus) Buil 2600 + SP1
Windows Based Script Host 5.6.0.8515
Agfa SnapScan 1212U + Agfa FotoLook 3.6
IrfanView 3.92 лежит в  D:\iv\
 
 
P.S. То ли лыжи не едут, то ли я не отсюда

Всего записей: 63 | Зарегистр. 07-02-2003 | Отправлено: 15:21 28-09-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evheniys: спасибо за информацию. Баг, кажется, пофиксил.  
Исправленную версию можно забрать по тому же адресу: AutoScan 1.6.2
(Более подробное обсуждение можно посмотреть здесь.)

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 18:44 28-09-2004
evheniys



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
EL
 
Работает, но......
как я и говорил, возможно особенности дров, но
сканит весь лист в 100 дпи ч/б

Всего записей: 63 | Зарегистр. 07-02-2003 | Отправлено: 16:04 30-09-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evheniys: а если просто сканируешь из Photoshop'а или того же IrfanView, потом закрыл окно драйвера сканера, а потом опять открыл - сохраняются ли при этом установки предыдущего сканирования или все сбрасывается?

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 16:21 30-09-2004
evheniys



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
EL
Настройки сканирования сохраняются
Вот потому такой глюк и непонятен

Всего записей: 63 | Зарегистр. 07-02-2003 | Отправлено: 16:27 01-10-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evheniys: хм, если сохраняются, то и скрипте должны использоваться сохраненные.
Тогда еще вопрос: а если не только окно драйвера закрыть, но и саму вызвавшую программу (IrfanView, в частности). А потом вновь запустить программу (IrfanView) и открыть из нее окно сканера (File->Acquire). Так тоже сохраняются установки предыдущего сканирования?

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 17:23 01-10-2004
evheniys



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
EL
 
Да, сохраняются в любом случае

Всего записей: 63 | Зарегистр. 07-02-2003 | Отправлено: 14:57 04-10-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
evheniys: странно  
Скрипт просто вызывает IrfanView (в скрытом окне), который и выполняет сканирование (т.е. IrfanView в свою очередь вызывает GUI драйвера, тоже в скрытом окне).  
Почему таким образом не используются предыдущие установки сканирования, а при ручном запуске используются - пока не знаю. Тем более, что у меня все работает (и работало раньше) без ошибок. Если пойму, в чем дело - исправлю. Если у кого-то появится идея, из-за чего может быть этот глюк - напишите.

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 16:35 04-10-2004 | Исправлено: EL, 16:37 04-10-2004
AlexS



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Хочу внести свои 5 копеек
 
Разобрался с защитой CPC Tool:
Значение о кол-ве оставшихся файлов хранит в реестре, вообщем делайте такой .reg файл:
======================================
Windows Registry Editor Version 5.00
 
[-HKEY_CLASSES_ROOT\CLSID\{06C693C0-3402-11D0-9EDC-2586AA340211}]
[-HKEY_CLASSES_ROOT\CLSID\{84D78BC0-3402-11D0-9EDC-9BAF7E873402}]
======================================
 
запускаете, и все сначала
 
ЗЫ. Для 9x систем, первая строчка должна быть "REGEDIT4", и формат файла не Unicode, а ANSI.

Всего записей: 174 | Зарегистр. 07-10-2001 | Отправлено: 22:00 17-10-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обновил AutoScan для поддержки IrfanView 3.95. Ссылка та же  (в шапке).

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 22:25 28-10-2004
KAs99

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не знаю к кому обратиться.... может здесь спецы есть.
Фотографирую журнальные страницы цифровиком в jpeg. Потом обрабатываю в Фотошопе, распознаю в ФайнРидере... потом перевожу в .pdf. Однако при открытии этого pdf оказывается, что журнальная страница не занимает всю страницу вьювера Адобе Акробата, т.е. чтобы рассмотреть страницу нужно сильно увеличивать....
Вопрос: как бы сделать так, чтобы отсканированная страница полностью занимала окно вьювера?

Всего записей: 37 | Зарегистр. 16-07-2003 | Отправлено: 11:26 04-11-2004
ZZmiy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KAs99
Из FineReaderа сохраняешь PDF ? В нем нет такой настройки...
Нужно такой PDF загрузить в Acrobat (не Reader) и в меню Файл, Свойства документа, Начальный вид, Параметры документа, Увеличение поставить что-нибудь типа Подогнать по видимому или Подогнать по ширине. И сохранить документ.
Ну и надеюсь, что в PDF не большие пустые поля со всех сторон изображения? Иначе в том же Acrobate придется делать кропинг(обрезание) страниц...

Всего записей: 430 | Зарегистр. 05-04-2003 | Отправлено: 12:59 04-11-2004
KAs99

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ZZmiy
Спасибо за совет. Пошел искать Acrobat (который не Reader)

Всего записей: 37 | Зарегистр. 16-07-2003 | Отправлено: 13:29 04-11-2004
quaxter



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ZZmiy

Цитата:
Из FineReaderа сохраняешь PDF ? В нем нет такой настройки...

Понимаешь, жизнь - штука суровая.
Обыкновенно при устаеновке Акробата (который не совсем Ридер) у тебя устанавливается на компьютере виртуальный принтер и программа Distiller.
Имея это все в совокупности на своей машине, отправляешь весь пакет на печать на этот виртуальный принтер - и о чудо! У тебя непостижимым образом создается PDF...
Но что еще ужаснее, для создания PDF существует масса других способов - часть работает аналогично через виртуальный принтер, часть просто содержится в разных программах и помогает жить. К примеру, последние версии OpenOffice содержат функцию генерации PDF. В итоге сохраняешь документ в вордовом формате, открываешь в OpenOffice - и оттуда генеришь PDF...

Всего записей: 712 | Зарегистр. 08-02-2003 | Отправлено: 01:40 05-11-2004
KAs99

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
quaxter
И Вам СПАСИБО!
(Бросает искать Акробата (того, который не РИДЕР) и бежит на поиски ОупенОффиса, который может генерировать ПДФ)
 
Добавлено
Извините, а может еще варианты есть? С прогами, которые поменьше весят?
(Однако, не перестает искать и ОупенОффис и Акробат (на всякий пожарный))

Всего записей: 37 | Зарегистр. 16-07-2003 | Отправлено: 08:42 05-11-2004
asd777



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Народ подскажите плиз
как *.djvu конвертнуть в *.doc очень надо

Всего записей: 147 | Зарегистр. 28-09-2004 | Отправлено: 09:06 05-11-2004
max67

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asd777
1. Конвертируешь djvu в tiff. Удобнее всего при помощи консольной утилиты Djvudecode
загрузка: http://chemister.da.ru/Download/djvudecode.zip
описание (eng): http://www.planetdjvu.com/store/products/document_express_cle/help/djvudecode.htm
Многостраничный djvu переводится в многостраничный же несжатый tiff. Файл получается не маленький.
 
2. Грузишь полученный tiff в FineReader. Дальше как обычно.
N.B. В MS Office 2003 тоже появился OCR. Можно и в нем распознать. Но я его не пользовал, про удобство и качество распознавания ни чего сказать не могу.

Всего записей: 835 | Зарегистр. 10-06-2002 | Отправлено: 09:29 05-11-2004
ging



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KAs99

Цитата:
Извините, а может еще варианты есть? С прогами, которые поменьше весят?

Ghostscript: h__p://www.ghostscript.com
Versiya 8.14 vmeste s view'erom vesit primerno 9 MB.

Всего записей: 565 | Зарегистр. 18-09-2003 | Отправлено: 14:15 05-11-2004
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Компьютерный форум Ru.Board » Компьютеры » Программы » Сканирование и оцифровка текста *.txt, *doc, *.pdf, *.djvu
articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru