Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тут мы имеем нетипичную неравномерность освещения.

 
Ну хорошо, корешок брать не будем: там сложности действительно не только с despeckle, но и с выравниванием освещения. Но вот проблемные многоточия и тире (да и некоторые буковки, которые тоже подвержены исчезновению, если не поднять порог бинаризации) расположены вполне себе по центру страницы. Т. е. приведенные образцы сохраняют силу в качестве иллюстрации к моим словам о том, что сейчас despeckle лучше не использовать, поскольку заранее неизвестно, что именно и на каких страницах может попасть под нож.
 

Цитата:
Когда сканер по какой-то причине недоступен - можно конечно и фотиком пользоваться, но на хорошие результаты в таком случае расчитывать не приходится.  

 
Мой опыт убеждает меня в обратном. При съемке на фотик, конечно, приходится учитывать больше факторов, но сам процесс идет гораздо веселее, а качество получается не сказать, чтобы сильно хуже. Тем более, как выяснилось, именно СТ обрабатывает фотки очень прилично. Более того, меня не покидает ощущение, что с данной конкретной книжкой было бы меньше проблем, если бы я снимал ее на фотик, а не на сканер.
 
Но это так, мысли вслух: спорить на эту тему, наверное, нет смысла.
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 09:49 11-05-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Error 404!
/downloads/despeckle2.zip.
File Not Found!

Всего записей: 2868 | Зарегистр. 22-03-2005 | Отправлено: 10:51 11-05-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Точку в конце уберите
 
Добавлено:
anagnost96
http://abab.front.ru/job1.djvu  
Обработал в Корел, включая деспекл. Дескью и кроп делал в СК. Торопился, поэтому может что-то пропустил

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 11:16 11-05-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
сделал Ваш пример в кромсаторе, по стандартной методике, только немного задрал порог бинаризации до 220: _http://ifile.it/a09xlkr
З.Ы. ghosty сказал бы, что такие книги, с греческим текстом и пр., надо сканировать в 600

Всего записей: 2868 | Зарегистр. 22-03-2005 | Отправлено: 13:34 11-05-2009 | Исправлено: VadimirTT, 13:37 11-05-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Бинаризация и в СК, и в Кореле получилась хорошо, но это потому, что порог задавался вручную.  Может и в СТ со временем появится полностью ручное задание порога бинаризации, для сложных случаев.  По поводу Despeckle - я уже говорил, что, перед тем, как делать регулировку аггрессивности, сначала нужно исчерпать другие методы.  Ручная регулировка - это для меня капитуляция перед проблемой.  К тому же она будет привязана к конкретному алгоритму, что не есть хорошо.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:39 12-05-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Cuneiform-Qt http://www.altlinux.org/Cuneiform-Qt в планах хотят интегрировать со ScanTailor. Любопытно, что имеется в виду.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:27 12-05-2009 | Исправлено: monday2000, 09:30 12-05-2009
ITTY

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня версия 0.9.5, 4-е процессорная машина, 4Гб память, WinXP + SP3.  
При Deskew программа пару раз падала.

Всего записей: 5 | Зарегистр. 30-04-2009 | Отправлено: 10:29 12-05-2009 | Исправлено: ITTY, 10:33 12-05-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://jenyay.net/blog/2009/04/30/scan-tailor-programma-dlya-obrabotki-otskanirovannykh-knig/

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:41 12-05-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
А почему вы в инструкции по сборке не указали  , что нужно установить пакет libboost1.35-dev?

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 21:01 12-05-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Cuneiform-Qt http://www.altlinux.org/Cuneiform-Qt в планах хотят интегрировать со ScanTailor. Любопытно, что имеется в виду.

Не знаю, со мной они не связывались.  Самый реальный вариант - взять исходники СТ, выкинуть оттуда две последних стадии, и заменить их стадией OCR.
 

Цитата:
У меня версия 0.9.5, 4-е процессорная машина, 4Гб память, WinXP + SP3.  
 При Deskew программа пару раз падала.

Я так понимаю падения не воспроизводятся?  Придется видимо все-таки прикручивать обработчик падений с трассировщиком стека.
 

Цитата:
http://jenyay.net/blog/2009/04/30/scan-tailor-programma-dlya-obrabotki-otskanirovannykh-knig/

Видел.
 

Цитата:
А почему вы в инструкции по сборке не указали  , что нужно установить пакет libboost1.35-dev?

Инструкция несколько устарела.  Раньше нужные компоненты boost'а поставлялись вместе с СТ, а теперь уже нет - обновлять их слишком гемморойно, да и дистрибутивы не приветствуют такой подход.  А инструкция между прочим на Wiki и доступна для редактирования без всякой регистрации, так что заметили неточность - поправьте.  Кстати 1.35 - это минимальная версия.  Можно брать и новее.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:27 13-05-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Раньше нужные компоненты boost'а поставлялись вместе с СТ, а теперь уже нет

Кстати, если есть такая возможность - минимализируйте насколько возможно вес дистрибутива СТ.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:34 13-05-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кстати, если есть такая возможность - минимализируйте насколько возможно вес дистрибутива СТ

Разве еще остались люди на модемах?  СТ весит примерно столько, сколько весит средняя книга в djvu формате.  Кто качает книги, скачает и СТ.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:03 13-05-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
Бинаризация и в СК, и в Кореле получилась хорошо, но это потому, что порог задавался вручную.
По крайней мере в случае Корела это не совсем так, точнее совсем не так . Порог я обычно задаю в диапазоне 170-190, в данном случае он был равен 175. Кстати, Вы могли обратить внимание, что текст у меня не жирный - т.е. порог не задран.
Дело в контурной резкости (Unsharp mask). Применение этой обработки считаю для себя обязательной. Ее назначение:
1. При сканировании в 300 дпи книг со шрифтом, имеющим тонкие перемычки ("и", "н" и пр.) последние на сканах получаются бледными (как бы слегка размытыми). Если не принять специальных мер, то на выходе от них останутся фрагменты или они потеряются. Чтобы их спасти, применяю контурную резкость, которая дополнительно усиливает контраст букв. Поэтому, порог бинаризации особо на жирность не влияет. Кстати, перед бинаризацией я выполняю Сглаживание, чтобы не только сгладить буквы, но и чтобы порогом можно было регулировать жирность по вкусу.
2. Случай, о котором шла речь - пересвет текста у одной стороны сгиба. Не всегда удается хорошо прижать корешок к стеклу и, чтобы вытащить бледный текст, применяется контурная резкость.
 
ИМХО, контурная резкость СТ очень бы не помешала . Не у всех же ОптиуБук. Да и в случае  ОптикБука можно в два раза ускорить сканирование, если сканировать разворотами.
 

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 06:12 15-05-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Разве еще остались люди на модемах?  

Если я не ошибаюсь, тут кто-то делал билды СТ, которые получались меньше размером, чем Ваши.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:30 15-05-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Добавьте, пожалуйста бип (отключаемый) , который срабатывает после окончания пакетной обработки на какой-то стадии. Например, я сейчас включил стадию нарезки и паралельно читаю блог, но что бы узнать закончилась ли нарзека мне надо переключится обратно и посмотреть не закончилась ли она, а так я мог бы болеее эффективно использовать время.
 
Добавлено:
Я наверное не точно выразился. идею в виду , что сопровождать исчезновение копки послле успешного окончания процесса обработки.

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 23:16 16-05-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
ИМХО, контурная резкость СТ очень бы не помешала . Не у всех же ОптиуБук. Да и в случае  ОптикБука можно в два раза ускорить сканирование, если сканировать разворотами.  

Буду иметь в виду.
 
monday2000

Цитата:
Если я не ошибаюсь, тут кто-то делал билды СТ, которые получались меньше размером, чем Ваши.  

Нет, то было только предложение разделить СТ на две части, одну из которых - dll'ки - качать нужно было бы только один раз или по крайней мере редко.
Процитирую свой ответ:

Цитата:
То есть разделить пакет на две части - сама программа и библиотеки.  Экономия будет только при обновлениях, а гемороя значительно прибавится - и пользователям, и мне.  Например когда я захочу обновить какую-либо из этих библиотек, то придется писать на странице закачки: "если вы скачивали пакет с dll'ками до такого-то числа", значит вам нужно их обновить".  Кстати в первый раз качать придется больше, чем сейчас - поскольку исполнительный файл + dll'ки будут всяко больше, чем статически скомпилированный исполнительный файл.  В общем овчинка выделки не стоит.  Что такое два-три лишних мега по сравнению с потерей удобства?

 
CrackMe

Цитата:
Добавьте, пожалуйста бип (отключаемый) , который срабатывает после окончания пакетной обработки на какой-то стадии. Например, я сейчас включил стадию нарезки и паралельно читаю блог, но что бы узнать закончилась ли нарзека мне надо переключится обратно и посмотреть не закончилась ли она, а так я мог бы болеее эффективно использовать время.  

А не устроит ли вас вместо бипа мигание таскбара?  Тут и опции никакой не пришлось бы добавлять.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:52 17-05-2009 | Исправлено: Tulon, 15:53 17-05-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Устроит, но так я могу и от компа в пределах комнаты отойти.
не мог ли бы ещё 1 фичу добавить:
переназначьте клавиши q и w не на то, чтобы они меняли главное изображение посередине, а двигали иконки вниз/вверх только маленькие иконки. Дело в том, что я предпочитаю вначале прогнать данный этап в автоматическом режиме для всех изображений, а потом гляжу на маленькие изображения и там где надо нажимаю на иконку и вручную правлю параметры.

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 22:23 17-05-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
В общем овчинка выделки не стоит.  Что такое два-три лишних мега по сравнению с потерей удобства?

А, вон оно что. Я тоже так думаю.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:16 18-05-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нашёл баг: при добавлении файла в существующий проект, нажимаю в диалоге по совей домашней директории и и СТ вылетает. ОС убунту 8.10.
 
Добавлено:
Предлагаю голосовать за номинирование СТ на sourceforge.net

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 19:07 20-05-2009 | Исправлено: CrackMe, 21:10 20-05-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Нашёл баг: при добавлении файла в существующий проект, нажимаю в диалоге по совей домашней директории и и СТ вылетает. ОС убунту 8.10.  

Тоже Ubuntu 8.10, но воспроизвести не смог.
Раз уж вы под Linux, вам будет не сложно сделать backtrace.

Код:
 
gdb scantailor
run
 

Делаете так, чтобы тот упал.

Код:
 
bt
 

Ну и про-copy-paste'ить вывод bt.
 
Добавлено:
Хотя нет, у меня Ubuntu 9.04 - может поэтому и не падает.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:38 20-05-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru