Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Сканирование и оцифровка текста *.txt, *doc, *.pdf, *.djvu

Модерирует : gyra, Maz

articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

   

ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотелось бы составить нечто вроде алгоритма действий для тех, кто оцифровывает в разные форматы (а таковых здесь много).
Например, что делать, если у человека есть книга без картинок и формул, если с картинками и формулами, если оригинал плохого качества, если он хочет, чтобы было удобно читать, чтобы файл был наименьшего объема и т.д. и т.п.
Давайте разберемся, какие форматы для каких целей подходят. Проблема отнюдь не надуманная.  


Софт:
1. LizardTech DocumentExpress и DjVu Solo  
2. ScanKromsator: Знаменитый кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
3. DjVuReader: Альтернативный шустрый ридер для *.djvu. Автор: Dickobraz. http://www.opendjvu.nm.ru/
Обсуждение здесь.
4. AutoScan: Плагин для беспрерывного сканирования под IrfanView. Обновляется при выходе новой версии IrfanView. Автор: EL. autoscan.zip (4 KB)


Полезные ссылки по *.djvu:
http://www.cqham.ru/m2_scan.htm  
http://www.cqham.ru/djvu_print.htm    
http://www.cqham.ru/likbez_djvu.htm    
http://www.cqham.ru/djvu_ocr.htm    
 
Наш маленький FAQ по *.djvu:
1. Q: Что делать, если при конвертации происходит замена одних букв на другие, напр. "и" на "н" (проблема "инь" (с) Astra55)
    A: Возможные варианты рассмотрены здесь.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 18:51 02-03-2004 | Исправлено: ghosty, 03:53 18-12-2004
asd777



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
max67
спасибо помогло

Всего записей: 147 | Зарегистр. 28-09-2004 | Отправлено: 14:34 05-11-2004
ZZmiy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
quaxter

Цитата:
Но что еще ужаснее, для создания PDF существует масса других способов  

При чем тут "создание PDF" ??? С созданием и FineReader справляется...
Речь шла о том, как в готовом PDF исправить указанную выше ситуацию.
Что, OpenOffice позволяет это сделать на готовом PDF ?
И уж незачем, ради встроенной возможности делать PDF, ставить другой текстовый редактор, если Word почти у всех и так установлен.
А тем более по размеру изготавливаемого PDF с Acrobatом пока никто не может поспорить (если конечно правильно им пользоваться).
 
KAs99

Цитата:
которые поменьше весят

Скачай программу pdfFactory. Размер ~2М. Ссылки тут -
http://forum.ru-board.com/topic.cgi?forum=5&topic=3466
Она станет доп.принтером и позволит делать PDF из любой программы, имеющей печать,
а не только из OpenOffice (quaxter - ).
Сохранишь документ из FineReadera в Word. Там меню - Файл, Печать, Принтер, Имя - pdfFactory, потом жми Свойства, Doc Info, Acrobat Viewer Options, Magnification - fit width или fit page, Ok, Ok.  
Когда будет готово, выскочит окно с документом, там жми Save и укажи куда сохранять PDF...

Всего записей: 430 | Зарегистр. 05-04-2003 | Отправлено: 15:13 05-11-2004
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

 
   дам ссылку на профи-софт для реставрации отсканированных книг.
   чрезвычайно экономит время.  
   продвинутый скриптинг.
 
 
   Те, кто работает со сканкромсатором, оценят по достоинству великолепные  
возможности пакета.  
 
 
   Урл для скачки пакета вышлю  мылом, писать
 
   mailto:roman@farlep.net?Subject=restorerofbooks
   
   (Сабжект не менять, иначе ответа не будет!)

Всего записей: 669 | Зарегистр. 14-11-2003 | Отправлено: 13:32 14-11-2004
dmitin



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ГОСПОДА!!!
По ссылке _http://labun.com/autoscan.zip скачал архив и ДокторВэб ругается, что autoscan.vbs , возможно, заражен SCRIPT.Virus . А онлайновая служба Касперского говорит, что нет. Может еще кто-то чем-то проверить?

Всего записей: 449 | Зарегистр. 22-08-2004 | Отправлено: 01:28 15-11-2004
ZZmiy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dmitin
Выкинь DrWeb - он ко всему подозрительный, поставь AVP или NOD.

Всего записей: 430 | Зарегистр. 05-04-2003 | Отправлено: 13:00 15-11-2004
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romanef
Уважаемый, всё это похоже на рекламу, особенно по площади поста!
Ваши слова

Цитата:
профи-софт для реставрации отсканированных книг

(я конечно же профи - купился) при сопоставлении с аннотацией к софту

Цитата:
Under Windows XP it can be unstable (tested at two computers under WinXP SP2).

не убедительны (плюс 15 мег ).
Плиз, представьте более убедительные аргументы: что такое софт умеет, что другие нет или умеет лучше. Тогда я возможно стану бета-тестером, так и быть!

Всего записей: 2494 | Зарегистр. 28-05-2004 | Отправлено: 17:41 16-11-2004
max67

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Уважаемый, всё это похоже на рекламу

Дык это не его разработка, а его как я понимаю взлом. За что большое спасибо (заочно).
Год назад я весь инет облазил в поисках пилюль, но софтина так и не обьявилась на варезной сцене.
А за описанием фич пожалте на офсайт Bookrestorer.

Всего записей: 835 | Зарегистр. 10-06-2002 | Отправлено: 19:18 16-11-2004
EL

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dmitin  
(ПМ тоже получил, но отвечу здесь на тот случай, если еще у кого-нибудь возникнут вопросы)
 
В моем архиве вирусов нет. А если бы был, то кто-нибудь уже написал бы здесь об этом. Тем более что скрипт VBS, в отличие от обычных программ, - это простой текстовый файл, открыв который (в любом редакторе) можно увидеть, какие команды собственно выполняются.
 
Антивирусы, перестраховываясь после разных I love You letter.vbs, преполагают наличие вируса по косвенным признакам, например по обращению к объекту WScript.Shell или к Scripting.FileSystemObject, т.к. эти объекты обычно используются скрипт-вирусами для работы с файловой системой. Автоматически отличить вредоносный код от полезного практически невозможно. Поэтому антивирусы и предупреждают: возможно вирус.

Всего записей: 48 | Зарегистр. 02-04-2004 | Отправлено: 21:59 16-11-2004
Snake_60



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
max67
 
Дык я не понял, софтина поломана или нет? При запуске у меня выдаёт
Цитата:
Unable to locate dongle. Running evaluation mode.
Но потом, через пару сек, запускается и, в принципе, работает. Правда полностью разобраться ещё не успел, может потом глюки вылезут...

Всего записей: 807 | Зарегистр. 20-01-2003 | Отправлено: 02:52 19-11-2004
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Дык я не понял, софтина поломана или нет? При запуске у меня выдаёт ..

 
 
   там же в ридми описано - не обращайте внимания на сообщение, все ок.
   если у вас XP, то обязательно запускайте программы в режиме совместимости  
   с w2k.  иначе будут глюки.
 
   кстати, написан маленький фак по ней.
   перепошлите еще раз запрос по ссылке, которую тут была.
 
  там есть ссылки на сайт производителя с описанием модулей  
  обработки, FAQ от произвродителя
   
 
 
Добавлено

Цитата:
romanef  
Уважаемый, всё это похоже на рекламу, особенно по площади поста!  
Ваши слова  
 
Цитата:профи-софт для реставрации отсканированных книг  
 
(я конечно же профи  - купился) при сопоставлении с аннотацией к софту  
 
Цитата:Under Windows XP it can be unstable (tested at two computers under WinXP SP2).  
 
не убедительны (плюс 15 мег ).  
Плиз, представьте более убедительные аргументы: что такое софт умеет, что другие нет или умеет лучше. Тогда я возможно стану бета-тестером, так и быть!

 
   1. по поводу ОС - производитель в системных требованиях указывает на NT.
   2. работает софт нормально, много фишек, которых нет в других софтах (коррекция кривых строк, коррекция освещенности, и т.д.)
   3.  использовать или нет - это Ваше личное дело. Те, кто поставил, вроде все довольны

Всего записей: 669 | Зарегистр. 14-11-2003 | Отправлено: 08:21 19-11-2004
kvk



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
romanef

Цитата:
коррекция кривых строк

Эксперты вроде как утверждают, что больше ни где не реализовано.
Спасибо!
Удачи  

Всего записей: 9240 | Зарегистр. 23-12-2001 | Отправлено: 09:44 19-11-2004
n0xyl



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
нужна помощь.
 
имеется отсканированная книжка. фалы в формате jpg , название 00001 до 00534. в дежавю пытаюс всех их запихнуть в один файл, да вот появляется проблема с нномерами страниц. они почемуто все в перемежку расроложены. Существують ли какие нибудь способы исправления этих проблем, а то ручками тоскат повеситься можно.

Всего записей: 317 | Зарегистр. 07-01-2003 | Отправлено: 16:57 19-11-2004
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romanef
Ну что ж, аргументы весомые, будем осваивать. Спасибо!

Всего записей: 2494 | Зарегистр. 28-05-2004 | Отправлено: 17:03 19-11-2004
estimated



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
n0xyl
Если используешь Solo, то делай так:

Цитата:
Сначала открываешь первое, потом находишь в меню Append и добавляешь все остальные, следя за тем, чтобы они добавились в правильном порядке. Для этого в окне открытия/добавления файлов сначала ставишь курсор на последний файл, потом с нажатым Shift тыкаешь на первый.

Всего записей: 1088 | Зарегистр. 15-02-2002 | Отправлено: 17:37 19-11-2004
WWWovan



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Вопрос немножко, возможно не по теме...
Какими програмами можно конвертировать дежавю в другие форматы и в какие форматы есть возможность конвертировать? (Дальше текст требует обработки и перевода)

Всего записей: 578 | Зарегистр. 15-11-2003 | Отправлено: 20:34 19-11-2004
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ИрфанВью от версии 3.92 и далее, практически без вариантов

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 21:19 19-11-2004
Snake_60



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
romanef
 
Всё понял, спасибо.

Всего записей: 807 | Зарегистр. 20-01-2003 | Отправлено: 01:36 20-11-2004
WWWovan



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Astra55
Спасибо. Супер!

Всего записей: 578 | Зарегистр. 15-11-2003 | Отправлено: 23:39 20-11-2004
ZZmiy



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как правильно делать djvu из tiff (300 dpi), чтобы не было искажений "и"<->"н" ???
Кто-нибудь разобрался с этим?

Всего записей: 430 | Зарегистр. 05-04-2003 | Отправлено: 01:08 22-11-2004
estimated



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ZZmiy: периодически вижу такие сообщения, но сам у себя такого не замечал. Каким образом конвертируешь?
Сразу скажу, радикальное решение - это lossless режим (в DjVu Solo это достигается путем выбора "clean").
 
 
Добавлено
Конечно, проблема может возникнуть только в тех случаях, где графические образы букв "н" и "и" очень похожи... Т.е. влияют тип шрифта, его размер, качество печати и качество скана. Ну, да это в общем и так понятно.

Всего записей: 1088 | Зарегистр. 15-02-2002 | Отправлено: 02:12 22-11-2004 | Исправлено: estimated, 19:00 22-11-2004
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Компьютерный форум Ru.Board » Компьютеры » Программы » Сканирование и оцифровка текста *.txt, *doc, *.pdf, *.djvu
articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru