Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Сканирование книг. Как? Чем?

Модерирует : gyra, Maz

articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2

   

MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет! В сканировании ничего не соображаю (опыта - 0)! Помогите плиз, такая ситуация:  
Возьму книжку в библиотеке, надо будет ее отсканировать за быстро (за 1 день) и вернуть.  
Нужно:  
1. Текст книжки на харде.  
2. Текст книжки со всеми значками, картинками и т.п. на харде (в любом формате, хоть jpg или tiff (gif?) - там много будет нот и всяких таких знаков.  
3. Содержание книжки как в пункте 2 (т.е. со всеми значками, картинками и т.п.) - распечатать.  
 
Я, ничего не зная о сканировании, пока думал сделать так: Отсканировать чем-нить (офис XP не подойдет? что лучше вссего для такого сканирования? Или без разницы?) в картинки с максимальным качеством (скажем, tiff - 300 dpi), этот вариант пойдет для пунктов 2 и 3. А для пункта 1, нет ли проги для перегонки из графики в текст? Если нет, значит после того, как отсканировал чем-нить в картинки сканировать еще раз Finereader в текст?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 11:25 24-06-2003
FireBrizz



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MusicLover
Сканируй в FineReader, он сохраняет пакет в виде картинок тоже (тока при сканировании установи нужное тебе разрешение)

Всего записей: 223 | Зарегистр. 19-02-2003 | Отправлено: 11:36 24-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хорошо, а если там ноты перемежаются с большим колическтвом текста, значит там будут как текст, так и картинки? А в каком формате все это сохранять? Насколько я знаю, в документах ворд нельзя сохранить высококачественные картинки?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 20:30 24-06-2003
Sws



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MusicLover

Цитата:
Хорошо, а если там ноты перемежаются с большим колическтвом текста, значит там будут как текст, так и картинки

Когда в FineReader распознавать будешь - пометь соотвтественно блоки (текст или картинка). А потом можно будет перегнать в word. При этом качество картинки не имеет значения - все нормально сохранится (только вот какой объем файла получится - это вопрос )
А вообще исходный скан у FR - это файл формата tiff со всеми вытекающими последствиями по обработке его потом в графическом редакторе.
 
ЗЫ. А вообще, если потом с этим текстом работать не надо, то распознавание и правка очень муторная работа. Можно все страницы (и текст и картинки) распознать постранично как картинки и потом это читать и печатать - такое а-ля ксерокс . Только опять приходиться расплачиваться объемом на винте.

Всего записей: 570 | Зарегистр. 27-02-2002 | Отправлено: 20:44 24-06-2003
Jenyay



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
И еще загляни сюда: http://forum.ru-board.com/topic.cgi?forum=35&topic=1478&start=300#4
 
Меня впечатлил формат djvu.

----------
http://jenyay.net - софт, исходники и фото

Всего записей: 1773 | Зарегистр. 13-10-2001 | Отправлено: 21:42 24-06-2003
max67

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MusicLover
Распознавать текст с большим колличеством спецсимволов это еще та морока. Имхо, достаточно будет отсканировать в tiff с 300 dpi (обязательно чернобелый а не полутоновый), сконвертировать в pdf и склеить в единый файл. Размер получиться примерно 3-5 Mb на каждые 100 страниц.

Всего записей: 835 | Зарегистр. 10-06-2002 | Отправлено: 21:43 24-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вообще, по здравом размышлении, я решил все-таки не распозновать текст, а отсканить в картинки. Я так предполагаю, для этого хватит office XP или ACDSee?

Цитата:
сконвертировать в pdf и склеить в единый файл

А что мне даст вообще конвертирование в pdf? Выигрышь места на винте? Я вот тоже увлеклася всяческими видами сжатия мультимедиа (звука, картинок, даже текста), но недавно решил, что игра не стоит свеч... Объемы хардов постоянно увеличиваются... Если это не собираешься передавать по и-нету, можно остановится в моем случае и на tiff? А там глядишь и появтся эти многослойные оптические диски, в сотни раз вмсестительнее DVD ... Вот когда пожалеешь об этой мороке со сжатием...  

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 12:36 25-06-2003
Alekha



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может вопрос не по теме, но какой программой можно склеивать несколько *.pdf файлов в один?

Всего записей: 96 | Зарегистр. 21-03-2003 | Отправлено: 13:59 25-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, кстати, такой еще вопрос: как лучше сканировать, чтобы потом распечатывать на A4? Нужно, чтобы картинки были какого-то определенного размера, или при печати там они автоматически для А4 форматируются? И какой формат все же выбрать? (Чтоб покачественнее, но для черно-белого, (а для цветного?)) Tiff? BMP? Я предпочту формат без сжатия, пожалуй...  
 
Добавлено
И еще один глупый вопрос: каким софтом все-таки удобнее(быстрее, лучше) сканировать в картинки? У меня есть ACDSee v4.01, ну и office XP (MS Office Document scanning).  
А п.п. распознования текста (русского), насколько я знаю, лучшим вариантом является Finereader (6.0 последняя?)?  
Да, и все-таки, можно ли конвертировать графические файлы в текстовые? Ведь FR получает tiff, а потом его конвертирует... Наверняка можно взять уже готовый графический файл и сконвертировать его в текстовый? Нет?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 15:22 25-06-2003
max67

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alekha
Из того что сам пробовал, самым безглючным оказался Arts Split and Merge Wizard. Рекомендую.
Можно посмотреть в топике по плагинам к акробату:
http://forum.ru-board.com/topic.cgi?forum=35&topic=5810&start=260#lt
 
MusicLover

Цитата:
при печати там они автоматически для А4 форматируются ?

Да, такя опция есть в настройках драйвера любого принтера.  
 
На счет сохранения без сжатия это конечно хозяин барин, однако при печати картинки с текстом разницы в качестве между сжатым и несжатым изибражением не заметишь.
Сканировать все равно лучше в tiff, можно и без сжатия.  
 

Цитата:
взять уже готовый графический файл и сконвертировать его в текстовый

Это и есть OCR, т.е. то, что делает FineReader.

Всего записей: 835 | Зарегистр. 10-06-2002 | Отправлено: 22:10 25-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, и еще: как избавиться от черной полосы посередине?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 09:11 26-06-2003
Dimius



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
MusicLover

Цитата:
Да, и еще: как избавиться от черной полосы посередине?

Из-за чего она у тебя? Очень толстая книга?
В вин98 был такой простой продукт: kodakimage
с помощью него легко убирались черные полосы не только посредине, но и по краям (ручками, не автоматом).
А так - любым графическим редактором.

Всего записей: 495 | Зарегистр. 02-11-2002 | Отправлено: 09:50 26-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И в конце-концов, все-таки, какой софт удобнее для сканирования? Я, помнится, когда-то использовал Corel PhotoImage, было очень удобно! Не знаю, позволяет ли скажем, ACDSee  (FotoCanvas Lite) задать область сканирования, обрезать края? Да, и сканировать это (спец. сиимволы, буквы) нужно как черно-белое? Глубина в 1 бит?
Dimius
Да, толстая, мягкий переплет.
 
 
Добавлено
Dimius
Я еще имею в виду, как лучше? (Если не автоматом), замазать белым, теркой, как?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 11:45 26-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Отсканировал тут одну книжку (600 dpi), сохранил как tif без сжатия... А теперь хочу подправить косметические дефекты, а именно:
1. Убрать черные полосы посередине.
2. Всякие там пятна.
3. Подвести кое-где буквы.
4. Выровнять перекошенные страницы. (Что не очень удобно, там все отсканировано разворотами, и обычно одна страница ровная, а другая куда-нить отклоняется... Их надо разрывать?
5. Желательно немного развести страницы в стороны ( может пожрезать наружные поля). (Т.е. там в книжке были очень маленькие внутренние поля, а наружные большие (а после сканирования ессно стали еще намного больше, получается при печати много будет бумаги зря портиться) желательно с этим что-то сделать...  
Вот такие вещи надо сделать... Как лучше всего делать каждую операцию? Как автоматизировать процессы? Да, и еще... Книжка эта получилась - 520Mb... Как ее поджать для интернета?

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 12:24 28-06-2003
BlackFox



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
у Взора лежит книги...как можно их сделать в том же формате и таком же качастве?

Всего записей: 2644 | Зарегистр. 16-12-2001 | Отправлено: 12:26 28-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня тут возникла идея, как дефект размытых букв (цифр) исправлять... Взять в графическом редакторе (у меня Corel Photo-Paint)  просто инструмент "текст" и напечатать то, что там не видно, потом растягиванием сделать этот текст такого же размера как в оригинале, поместить сверху "мутного" и сохранить тифчик... Хотя, чтобы из-за нового текста не выпирал старый, надобы или 1) замалевать старый кисточкой (белой краской)? (правда после этого плохо видно куда новый лепить) или 2) делать новый чуть крупнее.

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 15:37 28-06-2003
Abolin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MusicLover
 

Цитата:
если там ноты  

 
http://rockmaster.narod.ru/soft/sound_tools/notes/smart_score.htm
http://forum.ru-board.com/topic.cgi?forum=35&topic=5046#1
 

Цитата:
правда после этого плохо видно куда новый лепить

 

Цитата:
Corel Photo-Paint
работает со слоями ?
 
 
BlackFox
 
http://forum.ru-board.com/topic.cgi?forum=35&topic=0238#1
 
 
Добавлено
MusicLover

Цитата:
Как ее поджать для интернета?  

 
Так перевести в тот же .pdf .... или как...  книжка в виде файла должна быть или её on-line читать должны?

Всего записей: 88 | Зарегистр. 08-04-2002 | Отправлено: 17:12 28-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Abolin

Цитата:
http://rockmaster.narod.ru/soft/sound_tools/notes/smart_score.htm  
http://forum.ru-board.com/topic.cgi?forum=35&topic=5046#1  

Эт конечно очень интересно, только
1. Надо с этими прогами разбираться, качать, и т.п. А из файла они кстати делают OCR?
2. У меня ведь там текста еще больше чем нот, причем текст русский. Они ведь текст не рапознают? Как они текст оставят? Как картинки?
3. Они небось работают со своими какими-нить типами файлов, а у меня принтера нет, печатать буду у кого-то.    
При всем при этом, там в самих нотах куча буквенных обозначений на русском языке... Это нужна специальная прога: для сканирования ЭТМ на русском языке
 
Кстати, у меня есть шрифты "Musical", там как раз нотки и т.п. Но как это может помочь?
 

Цитата:
Corel Photo-Paint  
работает со слоями ?  

Не знаю... Я делаю так: кисточкой (обычно квадратной) белой краской удаляю все пятна. Потом tiff сохраняю. Получается довольно-таки красивенько. Правда долго и муторно... Других способов, к сожалению, не знаю. Я еще кстати и не прбовал, не знаю, нормально ли он сохраняет текст, вставленный сверху... Может там можно только кисточкой и т.п. работать...
 

Цитата:
Так перевести в тот же .pdf .... или как...  книжка в виде файла должна быть или её on-line читать должны?

В виде файла. Наверное, действительно или pdf или djvu... Их дополнительно архивировать  (rar) нет смысла?    
 
P.S. Попробовал OmniPage SE - ужасно распознает, несмотря на достаточно четкий оргинал...

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 22:11 28-06-2003
Abolin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Эт конечно очень интересно

 
Ну, вот и хорошо.  
 

Цитата:
Я еще кстати и не прбовал, не знаю, нормально ли он сохраняет текст

 
Надеюсь, на копии файла упражняетесь?
 

Цитата:
дополнительно архивировать  (rar) нет смысла

 
выигрыша в объеме практически не будет. надежность скачивания вроде несколько повышается
 

Цитата:
Попробовал OmniPage SE - ужасно распознает, несмотря на достаточно четкий оргинал

 
В смысле - OmniPage LE? Ну, это, по мнению специалстов, не лучший выбор. Fine Reader ... пятый или шестой... т.е. шестой лучше, а пятый проще достать-установить...

Всего записей: 88 | Зарегистр. 08-04-2002 | Отправлено: 23:03 28-06-2003 | Исправлено: Abolin, 23:04 28-06-2003
MusicLover



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Надеюсь, на копии файла упражняетесь?  

Недавно догадался на всякий случай сделать архив оригиналов Причем, что интересно,. Rar оценивает сжатие 520Mb в ~25Mb, а реально сжимает в ~45 (на макс. сжатии, непрерывный архив) :-\
 

Цитата:
В смысле - OmniPage LE? Ну, это, по мнению специалстов, не лучший выбор. Fine Reader ... пятый или шестой... т.е. шестой лучше, а пятый проще достать-установить...  

Нет SE=Special Edition... (~50Mb).  
Интересно, а если я установлю шрифт Muical, он (FR 6) мне распознает корректно ноты, или нет?  

Всего записей: 1877 | Зарегистр. 23-10-2002 | Отправлено: 18:25 29-06-2003
   

Страницы: 1 2

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Сканирование книг. Как? Чем?
articlebot (18-01-2005 10:47): Перемещено в форум "eBookz"


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru