Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
Картинки сильно отличаются от фона (10-15 единиц). Тогда можно запускать автосегментатор.

Можно еще схитрить - сильно выкрутить уровень черного у подаваемых на вход сканов, чтобы картинки четко выделялись на фоне. Определить зоны и подать на вход уже нормальные страницы.

Всего записей: 328 | Зарегистр. 10-08-2018 | Отправлено: 13:35 03-10-2021 | Исправлено: Archivist, 13:36 03-10-2021
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В Тейлоре нет разделений: зона текста и зона картинки, отдельно их вывести нельзя.
Как нельзя? В STF, STU точно есть, причём можно выводить текст без обработки(серым).

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 13:43 03-10-2021 | Исправлено: qwaxym, 13:48 03-10-2021
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
qwaxym
Забавно, что для нормальной работы с универсальным ST нужно иметь под рукой связку его форков
А автосегментатор там такой-же, как в STA?

Всего записей: 328 | Зарегистр. 10-08-2018 | Отправлено: 13:51 03-10-2021
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно еще схитрить - сильно выкрутить уровень черного у подаваемых на вход сканов, чтобы картинки четко выделялись на фоне. Определить зоны и подать на вход уже нормальные страницы.

Да, и это тоже. Просто это "нюансы", про которые нужно точно знать, для чего ты это делаешь.

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 14:28 03-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пользуюсь Скан Тейлор Эдвансед, пробовал всяческие другие версии (футуред, экспериментал  и т.п., не понравились.) Эдвансед полностью устраивает. Зачем доить программу, которая особо для этого не приспособлена? Если книга со сложными страницами, то в Тейлоре подготовляется геометрическая составляющая книги (обрезаются развороты, устанавливаются поля), делается вывод в цвете и забрасывается в Кромсатор, там удаляется фон, мусор и всё остальное. В Тейлор больше не возвращаемся, всю вторую половины работы в Кромсаторе до победного конца, хотя любители Фотошопа делают это всё своими путями (это мне неведомо)

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 14:56 03-10-2021 | Исправлено: kamenkapenza, 14:58 03-10-2021
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
qwaxym Забавно, что для нормальной работы с универсальным ST нужно иметь под рукой связку его форков
А автосегментатор там такой-же, как в STA?

Всё нужное встроено в STU! Автосегментатор скорее всего такой же, но лучше узнать у создателя STU.  

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 15:00 03-10-2021 | Исправлено: qwaxym, 15:02 03-10-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
для нормальной работы с универсальным ST нужно иметь под рукой связку его форков

 
Мне в 97% случаев хватает именно STU, так как там клевая эргономика. Кроме того есть важные штуки, которых нет в STA
- можно отключить сглаживание   (в STA я так и не понял, при какой комбинации методов оно минимально)
- можно вернуться со стадии страниц на стадию разрезки и сохранить выделение
- можно расширить диапазон бинаризации
- слой "foreground"   - в цвете остается то, что выше порога бинаризации, остальное заливается белым.  - это хорошо сегментирует картинки и текст, наложенные поверх светлых фонов
 
также касательно деварпинга  
- я не готов говорить за последнюю версию STA, но не все полезности из форка STF были взяты, кажется убирание лишних красных точек и какие-то хоткеи ранее не работали
- в STU была исправлена заблокированная в ST опция "глубина скана"
 
 
Однако бываю нужны и другие форки, так как там есть уникальные инструменты:
 
STA
- заливка полей цветом фона страницы  (на них может быть грязь и после бинаризациии потребуется повторная чистка,  а если залить белым, то будет лажать авто-определение порогов бинаризации или полоски на паразитные на крае контента будут)
- направляющие, к которым можно прижимать контент  - стихи какие-нибудь на разных отступах от краев листа, задолбаешься поля выставалять, а так просто направляющую двигаешь
- кликаешь по краю котента, он уползает - удобно, когда массово колонтитулы не захватились
 
 
ST-experimental
- кнопка keystoning - если есть только такое искажение, то именно оно правится и будет, а в других форках может добавиться кривизна и куча возни по ее отмене
- исправление кривизны до определения  зон котента. полезно при обработке фоток
- масштабирование зон контента - исправляет скачки расстояния книга-фотик
 
ST  (классический 9.11.1)
Я его держу для получения задней и передней обложки одинаковых размеров.
Увы, но в STU бывают расхождение на пиксель размеров страниц при обработке фоток в край листа.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 11:27 14-10-2021 | Исправлено: daa2013, 12:02 14-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Такой вопросец: если я выполняю в Тейлоре лишь обрезку разворотов, установку полезной области и добавление полей (чтобы сравнять все страницы по ширине и длине), а потом на выходе устанавливаю режим "Цветной", то теряется ли качество текста и картинок на выходе? Имеется в виду "съедает" ли Тейлор какое то качество, если сравнивать  на входе и на выходе? Я к тому, что в последнее время использую Тейлор для геометрических преобразований, а потом выходные файлы запихиваю в Кромсатор для отладки и финализации.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 16:18 15-10-2021
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
теряется ли качество текста и картинок на выходе

Только при deskew, из-за быстрого мыльного алгоритма поворота.

Всего записей: 328 | Зарегистр. 10-08-2018 | Отправлено: 16:44 15-10-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist но ведь поворот на угол, не кратный 90 градусов, с любым алгоритмом вносит искажения (необратим).

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 17:35 15-10-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
при сканах в 600 дпи я ухудшений не вижу.
за 300 не скажу

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 17:44 15-10-2021
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
но ведь поворот на угол, не кратный 90 градусов, с любым алгоритмом вносит искажения

Это так, но бикубический алгоритм, или lanczos делают повороты практически без мыла. ST, в отличие от SK, не дает возможности выбрать алгоритм. Для изготовления книг, правда, это большой роли не играет — текст бинаризуется, а картинки специально размываются для подавления растра. С журналами дело обстоит иначе.
 
Добавлено:
Тут еще интересный момент — какой файл бинаризуется в обоих программах. Виртуально повернутый, или физически. Если первое, то при переносе из СТ в СК результат может быть хуже.

Всего записей: 328 | Зарегистр. 10-08-2018 | Отправлено: 17:44 15-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Господа! Столкнулся с таким размышлением насчет правильной установке полей в Тейлоре. Раньше об этом не задумывался, книги джву просматриваю в программе winDjvu в режиме "по ширине страницы" и такой проблемы не замечал, но сегодня товарищ, который присылает сканы для обработки, спрашивает: "А чего это у тебя поля в развороте какие то маленькие, Обычная страница = 4030 пксл, а эта должна быть по идее 8060, а у неё только 4620" То есть визуально разворот  выглядит практически как одна страница.
А технология у меня следующая: разрезаю развороты (даже те, которые содержат одну информацию), например, картинка на разворот или название книги не на одной странице, а на двух, то есть на разворот). Устанавливаю полезную область, а затем визуально поля (там видно оригинал страницы, поэтому поля выставить не проблема), поля устанавливаю с функцией выравнивания для всех страниц, то есть одиночные страницы все одинаковой длины и ширины. Потом я делаю вывод (готовые тифы). После этого в том развороте, который должен быть в одну страницу я ВЫБИРАЮ ТИП РАЗРЕЗА "Одиночная страница", устанавливаю полезную область. Если есть ещё какие то страницы широкие,например, обложка с корешком отсканирована,я так же устанавливаю полезную область, у этих страниц я снимаю галочку "Выровнять размер с остальными страницами. И получается,что размер разворота произвольный.  Как сделать, чтобы соблюсти геометрические пропорции разворота, чтобы он был в пикселях (товарищу так надо) в два раза больше одиночной страницы? Хотя, пока писал - понял решение проблемы: когда делаешь разворот одиночной страницей (тип разреза-одиночный), потом ставишь полезную область и нажимаешь "Сбросить", чтобы полезная область захватила весь разворот без остатка. Наверное, так? По идее должны получится удвоенные пиксели.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 13:17 16-10-2021 | Исправлено: kamenkapenza, 13:21 16-10-2021
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
8060, а у неё только 4620

Хорошо вам, можете позволить себе 8к мониторчики.
Да не, я вполне помню переход от полноцветного 640*480 к 4k. Просто как было 300dpi приличным, так и осталось (точнее 16 пикселей для x-height на чём-то незакорючистом, типа кирилицы).

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 13:21 16-10-2021 | Исправлено: ndch, 13:25 16-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хорошо вам, можете позволить себе 8к мониторчики.
Да не, я вполне помню переход от полноцветного 640*480 к 4k.
 

Мы ни в чём себе не отказываем! А по сути то что? Чтобы разворот по пикселям (или по муллиметрам, не знаю, как правильно) был в 2 раза поболе одиночной страницы?

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 13:24 16-10-2021
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А по сути  - делим все развороты на страницы и получаем предсказуемый результат.
Обложку с корешком обрабатываем отдельно.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 13:27 16-10-2021 | Исправлено: ndch, 13:31 16-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А по сути  - делим все развороты на страницы и получаем предсказуемый результат.

 
У меня всё наоборот. надо из размера одиночной страницы получить разворот, то есть соблюсти геометрические пропорции, воспользоваться миллиметрами, пикселями или писюльками,лишь бы был результат налицо.
 
 
Добавлено:

Цитата:
Обложку с корешком обрабатываем отдельно.

Я так и делаю. Только в данном случае не обложка, а разворот, который становится одиночной страницей, но по геометрическим параметрам должен остаться разворотом

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 13:32 16-10-2021
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Наверное я не самый сообразительный и видимо поэтому уже совсем не понимаю о чём вы пишете.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 13:36 16-10-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Наверное я не самый сообразительный

Вполне возможно )))

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 13:38 16-10-2021
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А вы попробуйте написать так, чтобы было понятно всем.

Всего записей: 6516 | Зарегистр. 31-08-2008 | Отправлено: 13:47 16-10-2021 | Исправлено: ndch, 13:47 16-10-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru