Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 Предыдущие части: Часть 1,  Часть 2

Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор, PhotoShop, или GIMP.
ST изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ST) (ncraun) >>>  последняя версия
Scan Tailor Experimental (STex) (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (STEX) (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия (статистика)
Scan Tailor Deviant (STD) (Нубия-IV) >>>  последняя версия ("фотосканы")
Scan Tailor Plus (STP) (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (STE) (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (STF) (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (STU) (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (STA) (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (STA) (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).

Всего записей: 39605 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 16:30 31-08-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VSHY say:
Цитата:
Текст по краям потерял чёткость и вообще стал более блёклым.

У вас что то с монитором. Текст не трогается вообще, потому что всё, что попадает в маску, остаётся оригинальным.

Код:
gm compare -highlight-style assign -highlight-color purple 001-I.png 007-MI.png -file 007-MI.c.png

   

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 14:07 23-05-2025 | Исправлено: zvezdochiot, 14:22 23-05-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По поводу картинок на страницах с текстом. Все эти блюры, шарпы и т.д. в stex применяются ко всей странице а не только к текстовому блоку или я что то путаю?

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 17:28 23-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:
Цитата:
или я что то путаю?

Нет, не путаете.
И нету никакого текстового блока в ST. Идейка была, да сплыла.

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 17:36 23-05-2025 | Исправлено: zvezdochiot, 17:39 23-05-2025
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У вас что то с монитором. Текст не трогается вообще, потому что всё, что попадает в маску, остаётся оригинальным.
Я Ваши картинки сравниваю. Трогается или нет, я этого не знаю. Но вижу, что текст пострадал.

Всего записей: 1208 | Зарегистр. 19-05-2008 | Отправлено: 17:44 23-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VSHY say:
Цитата:
Я Ваши картинки сравниваю.

Не только вы, но и я. И даже целый пруф тремя сообщениями ранее выкатил. На тексте ни одной пурпурной точки. Пурпурный (различия) строго вне текста.

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 17:49 23-05-2025 | Исправлено: zvezdochiot, 17:50 23-05-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Нет, не путаете.

Тогда уж простите за прямоту но все эти фильтросвистетелки и нафиг не надо если на странице есть фото. Ну или брать в руки графический редактор и в ручном режим менять изуродованные фотографии на оригинальные, во второй папке после ST Split. Или прогонять сканы по два раза, сначала без фильтров, а потом – во втором проекте с ними, с заменой папки с фотографиями. Думать какой из вариантов выбрать, где фотографий больше/меньше.

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 17:57 23-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:
Цитата:
нафиг не надо

"Небольшое" уточнение: вам нафиг не надо. А мне оно очень даже нужно. И делаю я всё за одно прохождение.
Но идея делать обработку совместно с другим софтом очень даже верна. Об этом и в шапке написано.

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 18:05 23-05-2025 | Исправлено: zvezdochiot, 18:10 23-05-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Gimp (комментарий)
git: STEX: issue #66: Denoiser EM
 

Вы описываете метод шумоподавления для зашумленного изображения - когда огромное количество паразитных точек создают фон на скане. У меня несколько иная ситуация, поэтому не знаю, стоит ли мне так ухищряться. Я сейчас обрабатываю изображения без шума - просто на каждом скане в результате бинаризации образовалось один-два десятка паразитных объектов (не всегда они выглядят как точки - бывают разнообразные по форме и размеру).  
Причем есть особенность - есть довольно много чуть обособленных непаразитных точек и многоточий, которые не должны удаляться.
 
Если использовать функцию автоматического удаления пятен в STA на стадии вывода, то, во-первых, пятна зачастую удаляются не все (даже если порог удаления на максимуме), и всё равно каждый раз приходится просматривать весь скан в поисках оставшихся пятен, чтобы потом замазать их вручную с помощью функции "Зоны заливки". Это занимает много времени.
 
Во-вторых, как я уже сказал, я сейчас обрабатываю страницы на которых присутствуют как бы отдельно стоящие точки и многоточия. Это НЕ паразитные объекты, однако они удаляются вместе с паразитными при достаточно высоком пороге удаления пятен. Приходится снижать порог до тех пор, пока непаразитные объекты не вернутся на место, но вместе с тем и ранее удаленные паразитные точки тоже вновь появляются.  
Думаю, что вот какая фича пригодилась бы мне сейчас: точно также, как и при использовании функции "Зоны заливки" на скане выделяются некоторые зоны-многоугольники - это зоны неудаления. Внутренность каждого многоугольника должна остаться без изменений в результате применения функции автоматического удаления пятен. Я бы заключил в такие многоугольники упомянутые выше непаразитные объекты, которые не должны исчезать на обрабатываемой странице при высоком пороге удаления.
Может быть что-то подобное уже существует в какой-либо сторонней программе, либо будет реализовано в следующей версии STA.  
 
И, кстати, давно хотел поинтересоваться - как вы относитесь к графическому редактору Spotlight Pro v22.0 - он как раз и предназначен в том числе для исправления результатов сканирования. Я им пока не пользовался и на форуме он почему-то не обсуждается...

Всего записей: 46 | Зарегистр. 26-02-2025 | Отправлено: 21:14 23-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
на скане выделяются некоторые зоны-многоугольники - это зоны неудаления.

Это есть в ToDo STEX-а (пункт 7). Только ни один пункт этого ToDo выполнен не будет, ибо прогер нужен. А без прогера ловить нечего.
 
psikov say:
Цитата:
либо будет реализовано в следующей версии STA.  

STA вообще никто не занимается. Кодовые изменения в нём - это список порогов и зон я расширил в 2023-2024. Все остальные изменения - сборка онли. Опять таки, прогеров в проекте нет.
 
psikov say:
Цитата:
как вы относитесь к графическому редактору Spotlight Pro v22.0  

Никак. Вообще понятия не имею, что это.

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 21:35 23-05-2025 | Исправлено: zvezdochiot, 21:36 23-05-2025
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как вы относитесь к графическому редактору Spotlight
Это реально профессиональное ПО. В 99-м, когда я работал в проектном институте, мы активно его использовали для векторизации.
Сейчас это мощный векторно-растровый редактор, в основе которого лежит AutoCAD. Для векторизации текстов можно подключить модуль Fine Reader. Можно создавать свои текстовые и графические шаблоны для автоматической и полуавтоматической векторизации.
 
Для ST из него можно было бы взять способы замеров мусора и объектов, а также их выделения для последующей очистки от мусора.
 
Добавлено:

Цитата:
и на форуме он почему-то не обсуждается...
Вот его тема.
А не обсуждается потому, что очень нишевый продукт. Спецов по нему единицы.

Всего записей: 1208 | Зарегистр. 19-05-2008 | Отправлено: 03:57 24-05-2025 | Исправлено: VSHY, 04:25 24-05-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
А мне оно очень даже нужно.

Да мы тут давно это понял, не я один.  

Цитата:
И делаю я всё за одно прохождение.

Там где фото нет.  

Цитата:
psikov
У меня несколько иная ситуация

Покажите пример.

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 14:47 24-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:
Цитата:
Да мы тут давно это понял

Эк вас.
Ну с "царями" и прочей "знатью" я общаться не привыкший, так что обойдусь. Найдите собеседника под стать себе.

Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 16:03 24-05-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Ну ладно, с журналами там понятно, все сканы можно запихивать в pdf с ocr и горя не знать. А с книгами? У тебя все книжки исключительно в текстовом виде, без рисунков и фотографий внутри? Неужели ты не подумал что СНАЧАЛА разделение на текст/фото и только ПОТОМ все эти свистоперделки с фильтрами? А если разделения нет то зачем тогда уродовать фильтрами фотографии на страницах? Если уж позарез хочется фильтров то может надо было бы хоть пару строк для неофитов черкнуть что так мол и так. Никак нет! Это выше нас. Так что "цари" не у меня, нечего стрелки переводить.

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 18:21 24-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:
Цитата:
СНАЧАЛА разделение на текст/фото и только ПОТОМ все эти свистоперделки с фильтрами?

Вы обманываетесь. Нет такого ни в одном ST. В нём всё в точности до наоборот: есть одно (и только одно!) изображение, а на него уже набрасываются маски иллюстраций, порога, заливки и т.д. Ну вот так уж он устроен. Почему? А я почём знаю? Я не прогер, чтобы в таких делах разбираться.
 
PS: У вас, у вас "цари". Не скромничайте. Вам же каждый встречный чем то обязан. А мне нужен был инструмент. Я его искал, я его нашёл - STEX. Вы ищите свой инструмент. Не царское дело, конечно, но попробуйте.
 

  • ПубЛиб: Александр Борисович Макаров.
  • Макаров Александр Борисович, "Практическая геомеханика. Пособие для горных инженеров.", 2006


  • Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 19:56 24-05-2025 | Исправлено: zvezdochiot, 20:33 24-05-2025
    indifirent

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    zvezdochiot
    а на него уже набрасываются маски иллюстраций

    Ага, сначала фильтры, потом маска. И поменять местами блоки выполнения никак нельзя потому что не программист. Ясно-понятно.

    Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 02:24 25-05-2025
    zvezdochiot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    indifirent say:
    Цитата:
    потому что не программист.

    Совершенно верно. Сто раз об этом сказано. А сарказм ваш - насмешка над собой, ибо всё именно так.
     
    И куда же делись все "песнопения" об отсутствии иллюстраций? Я с вас улыбаюсь.

    Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 09:20 25-05-2025 | Исправлено: zvezdochiot, 09:37 25-05-2025
    indifirent

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    zvezdochiot
    И куда же делись все "песнопения" об отсутствии иллюстраций?

    От меня были "песнопения" почему ставите телегу впереди лошади. Смысл маску накидывать если уже например блюр на всю страницу.

    Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 15:54 25-05-2025 | Исправлено: indifirent, 15:57 25-05-2025
    zvezdochiot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    indifirent say:
    Цитата:
    От меня были "песнопения"...  

    Процитировать?

    Цитата:
    У тебя все книжки исключительно в текстовом виде, без рисунков и фотографий внутри?

     
    indifirent say:
    Цитата:
    Смысл маску накидывать если...

    GIMP (comment): GIMP: префильтрация перед порогом.
    Не, ну вам то виднее.... "Царь", как-никак.

    Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 16:11 25-05-2025 | Исправлено: zvezdochiot, 16:16 25-05-2025
    indifirent

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    zvezdochiot
    Процитировать?

    То с каким упорством ты запихиваешь в stex фильтры, должно как бы намекать на отсутствие в твоих книгах фото/рисунков. Отсюда и заданный выше вопрос. Что опять не так?

    Цитата:
    GIMP (comment): GIMP: префильтрация перед порогом.

    Нет, это невыносимо. Ему про уродование фильтрами фото на странице а он про префильтрацию перед порогом. В общем я понял, группа фильтров служит исключительно для текстового блока и рисунков типа ксилографии или гильош, на сканированной странице.

    Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 22:41 25-05-2025 | Исправлено: indifirent, 22:43 25-05-2025
    zvezdochiot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    indifirent say:
    Цитата:
    отсутствие в твоих книгах фото/рисунков.

    И я привёл пример, на котором очень "отсутствуют" фото и рисунки. Ну очень.
     
    indifirent say:
    Цитата:
    служит исключительно для текстового блока

    То есть ты их (фильтры) все попробовал? На основании чего сделал такой дурацкий вывод? Ну-ну.
     
    STD: issue #17: Balance: comment
     
    PS: Кстати, у фильтров (внезапно!) есть отрицательные коэффициенты. К чему бы это?

    Всего записей: 974 | Зарегистр. 18-05-2023 | Отправлено: 22:55 25-05-2025 | Исправлено: zvezdochiot, 23:02 25-05-2025
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

    Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2025

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru