Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1,  Часть 2
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 38836 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 13:07 10-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo
Спасибо за небольшое объяснение алгоритмов бинаризации.
Хотя за кадром остались еще полдюжины алгоритмов, всё равно такое краткое и понятное объяснение лучше, чем перебирание десятков страниц из выдачи гугла. По крайней мере, есть от чего отталкиваться.
Но если бы я писал такой пост, то фамилии авторов, и, соответственно, названия алгоритмов, привёл бы латиницей - по 2 причинам: во-первых в интерфейсах ScanTailor (и ScanKromsator) они приведены на английском, во-вторых преобразование английских имён в русские допускает некоторую вольность, типа Вольф, Волф, Вульф, Брэдли, Бредли, Оцу, Отсу.
Если исходить из данного объяснения, что Sauvola - это развитие Niblack, а Wolf - это развитие Sauvola, то становится понятным, почему автор ScanKromsator с примерно 15-ти летним опытом развития своей программы и таким же опытом оцифровки книг, выбрал Wolf. Просто из этой тройки - Niblack, Sauvola, Wolf - выбрал самый продвинутый. Остаётся непонятным, а чем руководствовались энтузиасты, добавлявшие в форки ScanTailor алгоритмы Niblack и Sauvola наряду с Wolf.
esys

Цитата:
Возможно, но смысл каждого из регулируемого параметра ищется.

Ну да. Я это и имел в виду. Я пытался добиться хоть какого-то внятного объяснения "смысла каждого из регулируемого параметра" от одного из ответственных за безудержную вакханалию с добавлением параметров в ScanTailor, но в ответ тишина, и мёртвые с косами стоят.

Цитата:
Сам вольф с регулировкой толщины точно нужен

Ну да. Последняя версия ScanKromsator тому подтверждение.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:38 10-01-2024
Hunter23071985

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем привет!
Просьба добавить объяснение алгоритмов бинаризации в шапку, чтобы не искать, когда понадобится.
Спасибо AlVaKo!

Всего записей: 2559 | Зарегистр. 19-09-2009 | Отправлено: 12:52 10-01-2024
esys

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну да. Я это и имел в виду.

Я имел в виду что в инете смысл параметров можно найти, но это не отменяет необходимость рекомендаций по их использованию. И уж точно не надо убирать эти параметры из СТ, т. к. пока не всем понятно как их использовать на практике.

Всего записей: 340 | Зарегистр. 22-06-2016 | Отправлено: 13:07 10-01-2024 | Исправлено: esys, 13:07 10-01-2024
yozhic



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo,
спасибо. Только, пожалуйста, исправьте названия алгоритмов на английские, а то потом их не найдёшь при поиске.

Всего записей: 2773 | Зарегистр. 20-03-2008 | Отправлено: 13:24 10-01-2024
MZN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Остаётся непонятным, а чем руководствовались энтузиасты, добавлявшие в форки ScanTailor алгоритмы Niblack и Sauvola наряду с Wolf

Просто он иногда дает лучшие результаты.

Цитата:
Я пытался добиться хоть какого-то внятного объяснения "смысла каждого из регулируемого параметра" от одного из ответственных за безудержную вакханалию с добавлением параметров в ScanTailor, но в ответ тишина, и мёртвые с косами стоят.

А у сектантов SK с их-то опытом не пробовали выяснить? Расскажете, что получилось.
 
Вообще, ответы на Ваши вопросы лично я получаю практикой. Не очень удобно, но работает.

Всего записей: 1718 | Зарегистр. 23-10-2004 | Отправлено: 13:31 10-01-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
yozhic say:

Цитата:
не найдёшь при поиске.

У меня всё находит. Что за поисковик у вас такой?
 
MZN say:

Цитата:
ответы на Ваши вопросы лично я получаю практикой.

На самом деле всё "слегка" по другому. "Уважаемый" с пеной у рта доказывал, что я наезжаю на SK, хотя ежу понятно, что наезжаю я именно на "старожилов" SK, а не саму SK. Мне совершенно непонятно о чем и про что эти люди, ибо толку с них, как с козла молока. А разумные ответы я получаю только от обычных пользователей SK. Гнать в шею их всех надобно поганой метлой.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 13:31 10-01-2024 | Исправлено: zvezdochiot, 13:42 10-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Постараюсь сильно не оффтопить и оставаться в пределах.
1)
Цитата:
Надеюсь, ясна принципиальная разница обогащения информацией от одной страницы с картинкой против двух связанных смыслом картинок.

Ну да. Именно по этой причине, я имею в виду вообще важность композиции в книге, я предпочитаю pdf и недолюбливаю epub и fb2.
Для сохранения печатной композиции в электронной книге важна взаимосвязанное редактирование параметров обоих сканов разворота.
Не знаю, есть ли такое в ScanKromsator, но в ScanTailor одновременное редактирование двух страниц на развороте практически невозможно. Или я ошибаюсь? Буду рад, если это так.
2)
Цитата:
В хороших книгах для воздействия дополнительно применяют габариты и материал обложки, даже толщину и отделку бумаги. Например, недавно брал сканил Акунина "Историю Российского государства", там страницы светлобежевые.

Ну да. "Еще Александр Бенуа говорил о том, что бумага должна быть не кипенно-белой, а светлых кремовых оттенков, чтобы не утомлять при чтении глаза."
Недаром нормальные читалки электронных книг предлагают настройки цвета страниц для форматов fb2 и epub.
Недаром ЕМНИП в каком-то СанПин-е для детских книг указывалась необходимость задания цвета страниц не полностью белого, а специальных оттенков.
Я сам при изготовлении для себя лично чего-то в pdf борюсь с желанием подсунуть в качестве фона для текста нечто "кремовых оттенков", но останавливает трудность оптимального подбора цвета.
Не знаю, можно ли сделать такое в ScanKromsator, но в ScanTailor задать ровный монотонный оттенок для цвета страниц, типа светло-бежевого у Акунина, практически невозможно. Или я ошибаюсь? Буду рад, если это так.
3)
Цитата:
зачем выдавать в паблик вариант чтения без засечек, т.е. только с экрана - ? (upd я имею ввиду обработку с порчей контуров шрифта

Ну да. Именно поэтому я горячий сторонник pdf с векторными шрифтами и противник djvu, где порча контуров шрифтов неизбежна принципиально.
Не знаю, можно ли сделать такое в ScanKromsator, но в ScanTailor создать на выходе готовый true pdf с векторными шрифтами практически невозможно. Или я ошибаюсь? Буду рад, если это так.
4)
Цитата:
Если dpi экрана 72/96, то конечно засечки только глаза портят. Как рубцы на контуре. А станет экран подобен распечатке, 300дпи - то что?

- я недавно пробежался по нескольким книгам по типогрфике - печатное качество для качественных шрифтов они указывают не менее 600 dpi, а лучше около 1000 dpi.
Лазерными принтерами я занимался очень давно, но уже тогда качество 300 dpi было в режиме эконом, а для качественоой печати предусматривались 600 dpi или 1200 dpi. Познания по струйных принтерах у меня заканчиваются на 2440 dpi.
- у меня уже сейчас смартфон с экраном 300 dpi
- вот когда мониторы 40 дюймов получат 300 dpi, тогда и будем думать "то что"
Увеличение dpi для качественного отображения шрифтов как картинки, без использования векторных шрифтов, упирается в чрезмерное увеличение размера выходного файла, особенно при наличии иллюстраций.
Помочь в этом был призван метод разделённых сканов.
Не знаю, как это сделано в ScanKromsator, но в ScanTailor раздельный вывод текстового слоя и фонового слоя возможен только в Scantailor Advanced. Или я ошибаюсь? Буду рад, если это так.
P.S. по остальной метафизике, по вашему желанию, прошу в личку
 
Добавлено:
esys

Цитата:
это не отменяет необходимость рекомендаций по их использованию.

Ну конечно же. Теория без практики мертва.  

Цитата:
И уж точно не надо убирать эти параметры из СТ, т. к. пока не всем понятно как их использовать на практике.

Ну да. Особо интерфейс дополнительные пороги вроде бы не перегружают. Так что пусть пока будут, до выяснения их практической целесообразности. Тем более, что оригинальные версии STEX, STA, STU без лишних наворотов пока что в свободном доступе.
Я против траты такого ценного ресурса, как время и мозговая энергия разработчика впустую, но если время и мозги уже потрачены, то так тому и быть. Но в будущем пустой траты желательно избегать.
MZN

Цитата:
А у приверженцев SK с их-то опытом не пробовали выяснить? Расскажете, что получилось.

Да. Собираюсь. Расскажу.

Цитата:
ответы на Ваши вопросы лично я получаю практикой

Как я уже писал, чтобы получить правильный ответ, надо задать правильный вопрос, который уже содержит часть ответа. Поэтому, скажу вам по секрету, я сам стараюсь задавать вопросы только после поиска ответов в гугле, в теме на ру-борде в версии для печати, и попробовав лично на практике максимум вариантов. но это не отменяет того, что кто-то лучше меня подобрал ключевые слова для гугла, что кто-то в теме написал ключевые слова не так, как я себе представлял (Wolf vs Вульф), что кто-то имеет более продолжительный опыт работы в интересующей меня области.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 13:36 10-01-2024 | Исправлено: jourmager, 13:39 10-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
упирается в чрезмерное увеличение размера выходного файла, особенно при наличии иллюстраций.
Помочь в этом был призван метод разделённых сканов

поглядите файлы от bolega. Мне последнее время кажется что он как-то умудрился встроить в djvu векторные шрифты Хотя это всего лишь 1200дпи. Не скажу что там большой размер у файлов.
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1110646937/1952#1952

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 14:12 10-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Не скажу что там большой размер у файлов.

Небольшой размер! Да вы прикалываетесь?!
Brem2.(1937).djvu 335.70 MB
А есть с этой техникой что-то более интересное, чем членистоногие? Хотя бы млекопитающие или птицы?

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 14:39 10-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 
http://publ.lib.ru/ARCHIVES/B/BREM_Al'fred_Edmund_(uchenyy-zoolog)/_Brem_A.E..html
 

Цитата:
jourmager
Небольшой размер! Да вы прикалываетесь?!

простите, вы чего хотели от 650-страничного богато иллюстрированного тома? 5 Мбайт?

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 14:48 10-01-2024
yozhic



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot (пост)
Цитата:
Что за поисковик у вас такой?

Хороший поисковик, ищет хорошо. Только как искать то? По запросу «Otsu» и «Sauvola» не найду. А транскрибировать я бы, честно говоря, не догадался — ну, это почти как в словаре, если слово английское, то ищем «translation», а не «транслэйшн» или «транслатион». Тем более транскрибировать по-разному же можно. Вот, кстати, пример:

Цитата:
Кристиан Вульф реализует алгоритмы Кристиана Вульфа, Ниблэка и Саволы

— это отсюда.

Всего записей: 2773 | Зарегистр. 20-03-2008 | Отправлено: 15:25 10-01-2024 | Исправлено: yozhic, 15:25 10-01-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
исправьте названия алгоритмов на английские

Тема закрыта, редактирование сообщения для меня заблокировано.

Всего записей: 42 | Зарегистр. 06-07-2011 | Отправлено: 16:16 10-01-2024
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Неплохая подборка фильтров бинаризации есть тут (искать по слову thresholding): https://scikit-image.org/docs/stable/api/skimage.filters.html#
После каждого алгоритма есть ссылки на статьи с полным описанием метода от автора.
Можно сразу посмотреть результат  нескольких вариантов бинаризации: https://scikit-image.org/docs/stable/api/skimage.filters.html#skimage.filters.try_all_threshold
 
Но, думаю, не сильно важно, каким именно алгоритмом делается бинаризация. Предварительный шумодав (особенно для плохой печати) и выравнивание освещения были бы  гораздо полезнее.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 16:50 10-01-2024
yozhic



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo
Добро, тогда вот так попробуем.
 
Сообщение от AlVaKo с кратким объяснением алгоритмов бинаризации: читаем здесь.
 
Ключевые слова (для удобства поиска): Otsu (Оцу, Отсу), Niblack (Ниблэк, Ниблек), Sauvola (Савола, Саувола), Wolf (Вульф, Вольф, Волф, Уольф, Уолф), Bradley (Брэдли, Брэдлей, Бредли, Бредлей, Брадли, Брадлей), Wellner (Вельнер, Вельнэр, Веллнер, Веллнэр, Уеллнер, Уэллнер).

Всего записей: 2773 | Зарегистр. 20-03-2008 | Отправлено: 17:19 10-01-2024 | Исправлено: yozhic, 17:23 10-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MZN

Цитата:
А у сектантов приверженцев SK с их-то опытом не пробовали выяснить? Расскажете, что получилось.

Рассказываю. Вот, что получилось. Ответ от bolega - автора программы ScanKromsator
дополнение от bolega
Подозреваю, что больше никто не ответит, к сожалению.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:43 11-01-2024 | Исправлено: jourmager, 17:04 11-01-2024
MZN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Вот видите, а тем не менее, Wolf очень часто вытягивает. Поэтому что-либо узнать можно лишь практикой. Своей.

Всего записей: 1718 | Зарегистр. 23-10-2004 | Отправлено: 12:48 11-01-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MZN say:

Цитата:
Wolf очень часто вытягивает.

Вы будете смеяться с моей истории, но мой ответ примерно такой же, о чём не раз уже говорил в теме:
Пороги EdgePlus, BlurDiv и EdgeDiv - не пороги в прямом смысле, а комбо из соответствующего префильтра и порога Otsu,  подробности здесь.... Именно ими в 100% случаев и пользуюсь. Разница с ответом bolega только в том, что он не использует шаблонные префильтры, а предоставляет пользователю самому комбить их из элементарных фильтров.
 
PS: Забыл упомянуть. Я то - это я, но Нубий-IV всегда расхваливал и расхваливает порог Gatos, а это уже классика, правда тоже комбо из порога Niblack и чистильщика Gatos.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 13:45 11-01-2024 | Исправлено: zvezdochiot, 14:19 11-01-2024
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Есть возможность прикрутить к STEX автосейв через некий промежуток времени?

Всего записей: 176 | Зарегистр. 02-06-2018 | Отправлено: 00:10 26-01-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:

Цитата:
прикрутить к STEX автосейв

Вряд ли. Все работают над багом #17. Учитывая это "обстоятельство" никому не до жиру, а автосохранение - это именно жир.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 01:09 26-01-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru