Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
А вы не думали переключать режимы не через выпадающий список, а кнопками, как на других стадиях? Или экономите место под будущие фичи?
Например, так:
http://www.onlinedisk.ru/image/268503/Outputmodes.png
Ну и плюс подсказка в статусе.
Честно говоря, неудобная штука - выпадающий список. Особенно для трех параметров.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 23:13 15-11-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вы не думали переключать режимы не через выпадающий список, а кнопками, как на других стадиях? Или экономите место под будущие фичи?
Например, так:
http://www.onlinedisk.ru/image/268503/Outputmodes.png

Мне больше нравится выпадающий список.  Эти иконки не слишком очевидны.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:41 15-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
А если что-нибудь в вашем же стиле?
http://www.onlinedisk.ru/image/268537/Outputmodes2.png
Заостряю вопрос, т.к. я довольно часто переключаюсь между типами вывода. И от необходимости выбирать в выпадающем списке вместо простого щелчка по кнопке испытываю явное неудобство.
Один клик как-то проще, чем клик + выбор + клик...

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 00:06 16-11-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Все равно не очевидно и все равно заставляет думать.  Так или иначе, до окончания работ над деспеклом я не собираюсь улучшать интерфейс.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:19 16-11-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Лично для меня выпадающие списки в большинстве случаев удобнее, чем переключатели.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 00:21 16-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пришла в голову мысль:
А что если расширить понятие типа вывода.
Т.е. пусть черно-белый означает удаление всех автозон, но не запрещает добавлять свои зоны вручную. Ведь бывает, что автозоны находятся так криво, что их проще создать вручную, чем исключать все неправильно обнаруженное.
Цветной/серый означает заливку рабочей области автозоной, но опять же не запрещает добавлять свои зоны. Например, когда потребуется часть картинки с текстом перенести в слой foreground.
А при переключении в смешанный ищутся автозоны, как в текущей реализации.
Потенциальную проблему пока что вижу лишь одну - тип ручной зоны "вычесть из автозоны" в черно-белом режиме неактуален.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 00:37 16-11-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Не хочу пока этим заниматься, и даже обдумывать / планировать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:57 16-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
поясните про патч:
почему вы не сделали его в окне задания dpi и для всех типов вывода?
Если книжка содержит хотя бы два разных типа, то получается, что нужно отдельно проходить все смешанные картинки и на каждой вручную переключать куда сохранять - в изображения, или в текст. И опять же, возможно проблемы с последующим сбором - как djvu поймет, что смешанные страницы с номером 15, 54 и 72 нужно вставить именно в нужные страницы чб дежавюшки? Вручную создаете 1-14, 16-53 и 55-71 нужного размера, залитые белым, или есть другой способ?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:54 16-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
В Гимпе мне гаусс показался более качественным.

Так а я именно же из Гимпа его и перенёс - причём один-в-один, т.е. у меня он полностью эквивалентен гимповскому. Мне, кстати, тоже гимповский гаусс-блёр показался наиболее качественным - там ведь какая-то сложная формула с экспонентой.
Tulon

Цитата:
Другое дело какой-нибудь инструмент пост-обработки, например тот же DjVu кодер.

Намёк понятен. В принципе, это реально. Я пока ещё не смотрел зоны в СТ, но если  будет время, можно будет добавить в поддержку зон из СТ в какую-то из сделанных мною программ для DjVu-кодирования.

Цитата:
Я уже не раз писал, что думаю по этому поводу.  Не надо заставлять меня повторять это еще раз.

Вот это пока что главное у нас с Вами принципиальное разногласие. Жаль.
 
P.S. Вот, кстати, насчёт сегментирования: есть тут один проектик молодой - вот: http://www.ohloh.net/p/didjvu . Автор - тот же, что и у pdf2djvu. Может, там у него что ценное найдётся в этом его didjvu. По крайней мере, я из этой Gamera немало алгоритмов "перебил" тогда под FreeImage успешно.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:05 16-11-2009 | Исправлено: monday2000, 17:07 16-11-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
почему вы не сделали его в окне задания dpi и для всех типов вывода?  

 
Ну как-то нелогично было бы делать глобальной такую настройку, которая фактически влияет только на смешанный режим.
 

Цитата:
Если книжка содержит хотя бы два разных типа, то получается, что нужно отдельно проходить все смешанные картинки и на каждой вручную переключать куда сохранять - в изображения, или в текст.

 
Я как-то об этом не думал, поскольку для книжек с иллюстрациями (если их не считанные единицы) обычно применяю смешанный режим ко всем страницам и потом переключаюсь на ч/б лишь там, где это позволит избежать обнаружения нежелательных зон.
 
Однако соглашусь, что некоторое неудобство тут имеется. Мне кажется, наиболее удачное решение проблемы заключалось бы в том, чтобы добавить к диалогу "Применить режим вывода" еще один пункт: "Ко всем страницам с данным режимом".
 

Цитата:
И опять же, возможно проблемы с последующим сбором - как djvu поймет, что смешанные страницы с номером 15, 54 и 72 нужно вставить именно в нужные страницы чб дежавюшки? Вручную создаете 1-14, 16-53 и 55-71 нужного размера, залитые белым, или есть другой способ?

 
Склейщик в данном случае руководствуется именами файлов: предполагается, что субскан заднего плана должен отличаться специфическим суффиксом (например, "sep.tiff") от соответствующей ему черно-белой страницы. Если для каких-то страниц такого файла не обнаружится, то, значит, и склеивать ничего не нужно: достаточно просто взять маску как есть. Конечно, для того, чтобы это работало, файлы с картинками нужно как-то переименовывать после вывода, поскольку сам СТ никаких особых суффиксов им не назначает.
 
На самом деле, для меня как раз некоторую проблему представляют паразитные белые файлы, которые, естественно, генерируются для страниц, содержащих только текст, при обработке их в смешанном режиме с указанием выводить только картинки. Приходится их удалять вручную после вывода.
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 22:06 16-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
влияет только на смешанный режим

на самом деле (если говорить о выводе картинок в родном разрешении сканов), то должно влиять еще и на страницы в режиме "Цветной/серый".  

Цитата:
некоторую проблему представляют паразитные белые файлы


Цитата:
субскан заднего плана должен отличаться специфическим суффиксом

да, в этом есть некоторый костылизм решения. Хотя и переименовывать, и удалять тем же Free (Total) Commander'ом - не проблема. А если не генерировать белые файлы, то придется в СТ посреди экрана писать что-то типа "Текстовый файл не создан из-за отсутствия на данной странице текстовой информации, для отображения страницы прогоните проект в режиме изображение" и наоборот для отсутствующих изображений при генерации текстового вывода. Что скорее всего не прокатит из-за просадки юзабилити.
А что, белый фон сильно портит итоговый djvu?

Цитата:
Склейщик в данном случае руководствуется именами файлов

Я не совсем понял, на входе склейщика (DjVu Imager) на последнем этапе - картинки sep + текстовая djvu. Получается, что информация об именах чб файлов в djvu остается?

Цитата:
"Применить режим вывода" еще один пункт: "Ко всем страницам с данным режимом".

по-моему, так получится масляное масло..

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 02:41 17-11-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
на самом деле (если говорить о выводе картинок в родном разрешении сканов), то должно влиять еще и на страницы в режиме "Цветной/серый".  

 
Одно дело -- смена разрешения, а другое -- вывод той или иной составляющей изображения. Это всё-таки разные настройки, хоть их и целесообразно использовать вместе.
 

Цитата:
А если не генерировать белые файлы, то придется в СТ посреди экрана писать что-то типа "Текстовый файл не создан из-за отсутствия на данной странице текстовой информации, для отображения страницы прогоните проект в режиме изображение" и наоборот для отсутствующих изображений при генерации текстового вывода.

 
Это еще и потому нежелательно, что иногда вывод пустых страниц целесообразен (я сохраняю пустые страницы книги, чтобы не сбивались нумерация и распределение по разворотам).
 

Цитата:
А что, белый фон сильно портит итоговый djvu?  

 
Ну а зачем он нужен? Полезной функции не исполняет, а место будет занимать.
 

Цитата:
Я не совсем понял, на входе склейщика (DjVu Imager) на последнем этапе - картинки sep + текстовая djvu. Получается, что информация об именах чб файлов в djvu остается?  

 
Ну вообще-то да, обычно остается.
 

Цитата:
по-моему, так получится масляное масло..

 
А диалог переименовать в "Применить параметры режима вывода", что, кстати, точнее соответствует его назначению. Вот и не будет масла.
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 14:04 17-11-2009
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
А вот их убил как раз Deskpeckle.  


Цитата:
я настроился на доведение до ума Deskpeckle

В настоящее время, н-р, номера в сносках режутся безбожно.
Если нужны примеры, дайте знать.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 11:16 18-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Скрипт для автоматической фильтрации всех tif-ок в папке средствами Gimp. Мне пригодился. http://www.onlinedisk.ru/file/270732/ Использую для борьбы с растром на картинках.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 12:23 18-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Получается, что информация об именах чб файлов в djvu остается?

Да (т.е. в многостраничном DjVu). В WinDjView см. Файл - Информация о документе...

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:19 18-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Русские буквы с пробелами в именах файлов тоже на уровне формата не принимаются? Пока не догадался избавился от них DjVu Imager не хотел подклеивать картинки.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:17 20-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Русские буквы с пробелами в именах файлов тоже на уровне формата не принимаются?

Точно, это просто djvudump не понимает кириллицу, вот что выдаёт:
 
   
 
Это просто нужно мне подправить.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:45 20-11-2009 | Исправлено: monday2000, 09:49 20-11-2009
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
с помощью СТ сделан большой скан  (950 страниц, 300дпи серый -> 600дпи чб с выпрямлением)
hччp://rapidshare.com/files/309594879/t08293.rar
пароль twilightzone
 
определение "полезной области"  без ошибок прошло везде, кроме одной страницы, где были сложные иллюстрации и рамка была выбрана неверно. Результат, я считаю, отличный.

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 13:12 20-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ST 0.9.7.1: Косячок со скроллбарами: увеличиваю масштаб, протаскиваю картинку, уменьшаю масштаб до минимума - скроллбары не исчезают.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:33 20-11-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пожелание. При переносе проекта в другой каталог (на другой ПК) он не открывается (не находится на старом месте). Нельзя-ли для этого открыть окно выбора файлов?

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 15:31 20-11-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru