Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
estimated



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Сложно все это вслепую делать - не имея доступа к винде.  

Может, в виртуальную машину поставить? (Хотя, наверное, этот способ рассматривался и по каким-то причинам не подошел)

Всего записей: 1088 | Зарегистр. 15-02-2002 | Отправлено: 16:37 18-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Добавил 3 скриншота в предыдущий пост
Глюк таков: появляется scrollbar. Совершенно вредный.
 

Цитата:
Я кстати разобрался, почему иконка в исполнительный файл не встраивается. ...
Сложно все это вслепую делать - не имея доступа к винде

Не уверен что все так, как кажется.
 
windres.exe scantailor.exe
 
windres.exe: scantailor.exe: no resource section
Или windres к объектнику нужно применять ?
 
Добавлено:
Bug #2
   
Непереведено
 
Добавлено:
StageListView.cpp
 
btn->setStatusTip(tr("Launch batch processing"));

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 18:14 18-03-2009 | Исправлено: ndch, 18:44 18-03-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Да мало ли - когда резак точно устанавливаешь по месту, или какую-то соринку вычищаешь, или ластиком стираешь - найдётся достаточно операций, которые потребно выполнять, метаясь по скану в увеличенном зуме.
 

Резак точно установить - согласен, скроллбар был бы кстати.  Ластика пока нет, ручного выделения объектов - тоже.  Когда появятся, может и скроллбары добвлю.  В любом случае есть гораздо более приоритетные задачи.
 
Добавлено:
estimated

Цитата:
Может, в виртуальную машину поставить? (Хотя, наверное, этот способ рассматривался и по каким-то причинам не подошел)

Тут у меня архитекрура другая - старый iBook, еще до перехода на Intel.  В принципе для PowerPC Маков когда-то существовал эмулятор Интела - старые версии VirtualPC.  Но эмулировать другую архитектуру при 933 мегагерцах - занятие для мазохистов.
 
Добавлено:
ndch

Цитата:
windres.exe: scantailor.exe: no resource section
Или windres к объектнику нужно применять ?  

windres компилирует файл ресурсов в объектный файл.  В Visual C++ этим занимается утилита rc.  Так вот rc CMake поддерживает, а windres - нет.  Так что приходится писать ручные правила для сборки файлов ресурсов.
 

Цитата:
Launch batch processing.
Непереведено  

Ага, забыл.
 
 
 
 
Добавлено:

Цитата:
Глюк таков: появляется scrollbar. Совершенно вредный.  

Мда.  А ведь там есть код, специально предотвращающий появление этого скроллбара.  Он там с самого начала, или появляется потом?  Если потом, то когда именно?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:28 18-03-2009 | Исправлено: Tulon, 23:39 18-03-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Берите ноутбук, будете на нём читать электронные книги.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:18 19-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Scrollbar появляется при первом "запуске batch"

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 17:50 19-03-2009 | Исправлено: ndch, 19:20 20-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Насколько могу судить- возникает потому что "графа" стадии 1 "Исправление ориентации" высотой 22 пикселя, а нововведённые изображения высотой 24 пикселя. На что весьма скользко намекал.
Imho, вариантов два:
1.Увеличить высоту минимальной графы до высоты картинки.
2. Уменьшить высоту картинок до высоты минимальной графы.
Честно говоря, замето это еще на первом скриншоте.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 20:07 20-03-2009 | Исправлено: ndch, 20:12 20-03-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Насколько могу судить- возникает потому что "графа" стадии 1 "Исправление ориентации" высотой 22 пикселя, а нововведённые изображения высотой 24 пикселя.

В таком случае непонятно. почему скроллбары появляются только при запуске пакетной обработки, а не при появлении кнопки.  Попробуйте послуднюю версию - может поможет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:57 21-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
-

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 08:52 21-03-2009 | Исправлено: ndch, 08:59 21-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Разрешите внести свои две копейки.
Недавно опробовал ST, очень понравилось. Огромное спасибо за программу! Есть, наконец, средство, которое не надо объяснять неделями. И встроенные алгоритмы отличные. Но есть несколько вещей, которые бы хотелось улучшить или добавить.
Во-первых, здОрово было бы на этапе распознавания цветного/черно-белого (Смешанный режим) добавить возможность вывода в два файла (один -- черно-белый, другой -- соответствующий ему цветной, как "sep-файлы" в СК), чтобы потом мочь кодировать в DjVu по отдельности, скажем, "методом разделенных сканов". А еще, сам процесс распознавания цветного нельзя никак регулировать -- может быть, можно здесь можно добавить какой-нибудь движок?
То, что файлы нельзя из проекта убрать, не очень удобно. У меня три страницы были (случайно, такие файлы прислали) вдвое больше остальных, и остальные страницы хотели по ним выравниваться. Правда, я нашел выход -- поменял размер в IrfanView, но убрать их и потом запустить отдельно было бы удобнее.
Жалко, что нельзя добавить уже разрезанные-повернутые-макетированные с полями страницы, обязательно надо либо менять поля, либо даже определять полезную область. А если требуется _только_ вывод (увеличение разрешения-сглаживание)? Я попытался определить полезную область автоматически, но автомат не берет номера страниц, а проходить 500 страниц руками -- понятная морока (и обязательно что-то пропустишь). И макету нельзя сказать, чтобы брал страницы "как есть"... Так в результате и бросил этот гигантский PDF, а жаль.
Не будет ли отдельного despeckle? У меня много черно-белых сканов, которые я по лени вообще не пропускаю через кромсатор, а только обрезаю в ирфане, и сразу в DjVu. Было бы здорово удалять из них мусор. Может быть, ST сможет? СК может.
Планируется ли исправление перспективы? Выпрямление строчек?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 02:13 26-03-2009 | Исправлено: iit512, 02:16 26-03-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
The OpenJPEG library is an open-source JPEG 2000 library developed in order to promote the use of JPEG 2000.

http://code.google.com/p/openjpeg/

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:51 26-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512
>>возможность вывода в два файла.
>>чтобы потом мочь кодировать в DjVu по отдельности
Это обсуждалось в ebookz. По наблюдениям пришли к выводу- учиться пользоваться сегментером софта(DEE)

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 21:55 26-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По наблюдениям пришли к выводу- учиться пользоваться сегментером софта(DEE)  

А какой-нибудь внятный текст есть на эту тему (на русском или английском)?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 05:51 27-03-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А какой-нибудь внятный текст есть на эту тему (на русском или английском)?

Хелп к DEE 5.1:
 
http://djvu-soft0001.nxt.ru/dee51le_help.rar (5,89 МБ)
 
Он на английском языке. Но лучше этого не найдёте.
 
Кроме того, быть может, кое-что можно почерпнуть из DjVu-спецификаций: http://www.djvu.org/resources/ - но там гораздо сложнее, по-научному. Тоже на английском языке.
 
По-русски есть только это: http://natahaus.info/forums/showthread.php?t=5520

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:21 27-03-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Но что толку изучать возможности сегментёра DEE - если ни СТ, ни СК пока что не умеют обрабатывать сырые сканы в нужной степени совершенства - для сегментёра DEE. Хорошая обработанность сырых сканов нужна хотя бы как подсказка для сегментёра DEE.
 
Примером нужной сканобработки являются:
 
1. CorelScan - http://www.djvu-soft.narod.ru/scan/corel_scan.htm
 
2. Как почистить сканы книг?  (© Иван Сторожев ) http://www.djvu-soft.narod.ru/scan/clear_scan_trilogy.rar
 
3. Методика сканирования и обработки цветных книг http://natahaus.info/forums/showthread.php?t=6055
 
Нужно и в СТ реализовать нечто подобное - иначе все заумные возможности сегментёра DEE не имеют смысла (что мы имеем сейчас). Не сможет сегментёр DEE проявить всю свою мощь на "абы как обработанных" (как сейчас) сканах.
 
Причём тут явно не обойтись без некоего аналога СК-шных Picture-зон. Только желательно, чтобы эти зоны авто-определялись - а потом вручную их границы лишь подправить (как в файнридере).
 
Причина в том, что очень часто на одном и том же скане есть участки, которые нужно как-либо различно обрабатывать (т.е. при сканобработке).
 
Только если в СК на всё про всё есть лишь один тип зон - Picture-зоны - то на самом деле нужно сделать чуть ли не десяток разных видов Picture-зон - на все случаи жизни.
 
Добавлено:

Цитата:
Планируется ли исправление перспективы? Выпрямление строчек?

На это ИМХО вообще пока преждевременно замахиваться - слишком уж сложно - и взять такой алгоритм негде - значит, его нужно создавать - а он явно весьма непрост.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:08 27-03-2009 | Исправлено: monday2000, 13:11 27-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
2 monday2000: Спасибо за ссылки!

Цитата:
Причём тут явно не обойтись без некоего аналога СК-шных Picture-зон. Только желательно, чтобы эти зоны авто-определялись - а потом вручную их границы лишь подправить (как в файнридере).  

Так я что имею в виду -- "смешанный" алгоритм ST распознает цветные и черно-белые зоны. Так? Почему бы не сохранять их в разные файлы?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 20:58 27-03-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
Так я что имею в виду -- "смешанный" алгоритм ST распознает цветные и черно-белые зоны.

Я, наверное, что-то пропустил... В СТ уже тоже есть Picture-зоны?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:45 28-03-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Во-первых, здОрово было бы на этапе распознавания цветного/черно-белого (Смешанный режим) добавить возможность вывода в два файла (один -- черно-белый, другой -- соответствующий ему цветной, как "sep-файлы" в СК), чтобы потом мочь кодировать в DjVu по отдельности, скажем, "методом разделенных сканов". А еще, сам процесс распознавания цветного нельзя никак регулировать -- может быть, можно здесь можно добавить какой-нибудь движок?  

ST не делает цветовой сегментации.  Алгоритм автовыделения картинок работает в сером режиме и про цвета знать не знает.  Даже если бы знал, то все равно вывод раздельных сканов - весьма низкоприоритетная задача, потому что простые смертные ей пользоваться не будут.
 

Цитата:
То, что файлы нельзя из проекта убрать, не очень удобно.

А вот это как раз высокоприоритетная задача.
 

Цитата:
Жалко, что нельзя добавить уже разрезанные-повернутые-макетированные с полями страницы, обязательно надо либо менять поля, либо даже определять полезную область. А если требуется _только_ вывод (увеличение разрешения-сглаживание)?

Слишком спецефичная задача - не укладывается в пользовательский интерфейс СТ.
 

Цитата:
Я попытался определить полезную область автоматически, но автомат не берет номера страниц, а проходить 500 страниц руками -- понятная морока (и обязательно что-то пропустишь).

Дайте угадаю - сканы без полей?  Если нет, то пример в студию.
 

Цитата:
Не будет ли отдельного despeckle? У меня много черно-белых сканов, которые я по лени вообще не пропускаю через кромсатор, а только обрезаю в ирфане, и сразу в DjVu. Было бы здорово удалять из них мусор. Может быть, ST сможет? СК может.  

Опять же задача не укладывается в существующий интерфейс пользователя.  Для такой задачи был бы идеален плагин к IrfanView или чему-то подобному.  У СТ исходники открыты - есть желающие сделать такой плагин на основе кода из СТ?
 

Цитата:
Планируется ли исправление перспективы? Выпрямление строчек?

Задача непростая, а свободного времени катастрофически мало.
 
 

Цитата:
Я, наверное, что-то пропустил... В СТ уже тоже есть Picture-зоны?  

Есть авто-определение картинок.  Вручную править авто-определенную область пока нельзя.  Автоматический алгоритм работает хорошо, кроме как в случаях, когда картинка хотя бы на одном участке плавно переходит в фон.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:45 28-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо большое за ответ.

Цитата:
ST не делает цветовой сегментации.  Алгоритм автовыделения картинок работает в сером режиме и про цвета знать не знает.  Даже если бы знал, то все равно вывод раздельных сканов - весьма низкоприоритетная задача, потому что простые смертные ей пользоваться не будут.  

Понятно. ndch мне уже прислал ссылку, где Вы отвечали на похожий вопрос -- http://forum.ru-board.com/topic.cgi?forum=5&topic=27424&start=820#18
Все же, было бы здорово не менять исходники, а где-нибудь далеко-далеко в интерфейсе устроить такую опцию...

Цитата:
Дайте угадаю - сканы без полей?  Если нет, то пример в студию.  

Нет, не угадали. Книга, скачанная Google Book Downloader. Хотел уменьшить ее ужасающий размер путем создания "кошерного" черно-белого DjVu. Такие книги, кстати, уже на торрентах раздают, так что проблема будет возникать снова.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 08:44 29-03-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цитата:
Дайте угадаю - сканы без полей?  Если нет, то пример в студию.  
 
Нет, не угадали. Книга, скачанная Google Book Downloader. Хотел уменьшить ее ужасающий размер путем создания "кошерного" черно-белого DjVu. Такие книги, кстати, уже на торрентах раздают, так что проблема будет возникать снова.  

Тогда залейте куда-нибудь одну-две страницы, где отрезаются номера страниц, и ссылку сюда.  А почему бы такие файлы не скармливать сразу DjVu?  Любой resampling только ухудшит качество.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:44 29-03-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Люди! Кто-нибудь по вертикали страницы выравнивает ?
Иногда не хватает горизонтальной направляющей и предпросмотра на макете сразу двух страниц для взаимного выравнивания сканов.
Tulon считает что это малоактуальная фича! Если кто использует напишите, может быть повлияем на его взгляд !  Очень интересно мнение тех кто занимается обработкой в CT и не только.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 20:14 29-03-2009 | Исправлено: ndch, 20:16 29-03-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru