Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 Предыдущие части: Часть 1,  Часть 2

Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор, PhotoShop, или GIMP.
ST изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ST) (ncraun) >>>  последняя версия
Scan Tailor Experimental (STex) (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (STEX) (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия (статистика)
Scan Tailor Deviant (STD) (Нубия-IV) >>>  последняя версия ("фотосканы")
Scan Tailor Plus (STP) (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (STE) (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (STF) (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (STU) (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (STA) (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (STA) (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).

Всего записей: 39598 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 16:30 31-08-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
Там их много:

Сам я не очень в теме про виндусяцкие дела. Так что бери "scantailor-experimental-1.2025.05.05-X86-64-install.exe". Он на Qt5, так что словить "бзики" на нём меньше шансов. Ну а ежели не понравится, то возьмёшь на Qt6.
 
AlVaKo say:
Цитата:
в результате бинаризации "внутренности" такого штриха будут становиться белыми.

Как ни странно, именно эта особенность: устойчивый результат только на больших радиусах, - стала причиной начала разработки мной сначала порога EdgePlus, который после слияния с BlurDiv перерос в EdgeDiv. Одно из "требований" или "назначений" этого семейства порогов было именно использование малых радиусов и прямая шкала коэффициентов (увеличение от глобального порога в сторону "локального").

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 18:35 07-05-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
На этапе "Вывод":
"Увеличение разрешения" - 1.5

Разрешение исходной tif-картинки 400х400, а в результате должно получаться 600х600, правильно?
Я всё сделал как вы сказали, но у меня в результате работы STEX обработанная картинка почему-то имеет разрешение 96х96. Что не так?

Всего записей: 46 | Зарегистр. 26-02-2025 | Отправлено: 22:36 07-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
у меня в результате работы STEX обработанная картинка почему-то имеет разрешение 96х96.

Всё так. Просто STEX игнорирует само понятие "разрешения" (если не заметил). Значение 96x96 - это дефолтное для изображений. Пакетные графические процессоры типа GraphicsMagick в том числе нужны для исправления таких особенностей. В вашем же случае можно по-быстрому прогнать результат через STA с принудительным назначением 600dpi. Ну коли нету у вас пакетного графического процессора, хотя я не понимаю, как можно без него работать, рано или поздно всё-равно упрёшься в тупик.

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 22:46 07-05-2025 | Исправлено: zvezdochiot, 22:47 07-05-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
в результате работы STEX обработанная картинка почему-то имеет разрешение 96х96


Цитата:
Просто STEX игнорирует само понятие "разрешения" (если не заметил). Значение 96x96 - это дефолтное для изображений.

Чего только не узнаешь с помощью новых пользователей.
Оригинальный ST experimental действительно игнорировал понятие "dpi". Т.е. в выходных tiff-ах не было значения dpi вообще.
Но STEX от энтузиастов какого-то лешего прописывает в выходные tiff-ы значение 96 dpi. Т.е. аж никак не игнорирует, а принудительно прописывает своё. Ну вот зачем? И почему именно 96?
 
Использование термина "разрешение" применительно к dpi в некоторых случаях может приводить к путанице. Т.к. "разрешение" также может быть размером (шириной и высотой) экрана (матрицы) в пикселях.
 

Цитата:
Сам я не очень в теме про виндусяцкие дела. Так что бери "scantailor-experimental-1.2025.05.05-X86-64-install.exe". Он на Qt5, так что словить "бзики" на нём меньше шансов. Ну а ежели не понравится, то возьмёшь на Qt6.

Я скачивал STEX кучу раз, и каждый раз незлым тихим словом поминал того, кто делает 8 вариантов программы для Windows. Ну зачем столько? Причем с неоднозначными названиями файлов.
У вас есть статистика скачиваний?  
Сколько там ARM-ов?  
А 32-битный зачем? Вы в курсе, что на некоторых файлах 32-битный СканТейлор вываливается из-за нехватки памяти, о чём знали все его авторы ещё лет 10-15 назад. Потому что 32 бита - это ограничение памяти в 2ГБ. И в некоторых режимах на некоторых файлах этого не хватает.
Проблемы с Qt5/6 были чёрт знает когда и ЕМНИП касались только Linux-а, а для Windows зачем тогда 2 версии с разными Qt?
Про преимущества инсталятор vs portable - отдельная тема, но ИМХО тоже понятная.

Всего записей: 1006 | Зарегистр. 04-11-2019 | Отправлено: 02:06 08-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Сколько там ARM-ов?

Как минимум 1 - plzombie. А это (внезапно!) сборщик этих самых вин-сборок.
 
jourmager say:
Цитата:
А 32-битный зачем?

Запросы на 32 как были, так и остались. Без статистики.

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 09:12 08-05-2025 | Исправлено: zvezdochiot, 14:23 08-05-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Последний релиз STEX (1.2025.05.05).
На этапе "Вывод":
"Увеличение разрешения" - 1.5
"Фильтры":
- кривые - по нулям
- доп. фильтры: "Размытие/Резкость": размер - 2, коэффициент - 1.0
- "Выровнять освещение" - 1.0
"Режим":
- "Черно-белый"
- "Порог": EdgeDiv: радиус - 5, коэффициент - 0.75

Можно вопрос. Как вычислить эти параметры? Данные параметры подойдут для любого скана с вышеупомянутым эффектом белых пятен? Вот, например, кусок другой отсканированной книги с другим шрифтом, но тем же эффектом:
https://dropmefiles.com/WB4aP
 
На этот раз параметры можно оставить такими же как в приведенной цитате? Или же размер, коэффициент, радиус и всё остальное надо каждый раз для каждой книги как-то подбирать, менять в зависимости от размеров шрифта, от разрешения, ещё от чего-то?
 

Цитата:
Либо использовать пакетный графический процессор перед обработкой в STA: Применить пакетно "Гауссово размывание" радиусом 2.

"Радиусом 2" - насколько это важно? Почему не радиусом 3 или 1?  

Цитата:
gaussian-blur 2x2

Программа XnView, например, не позволяет сделать 2х2. Минимум 3х3. Или больше.

Всего записей: 46 | Зарегистр. 26-02-2025 | Отправлено: 01:20 12-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
Как вычислить эти параметры?

Зачем что то вычислять, когда всё можно увидеть на сканах? 2 - это размер "дырок", 5 - размер (ориентировочный) тонких штрихов. Остальные радиусы уже стоят в STEX.
Скриншот
 
psikov say:
Цитата:
"Радиусом 2" - насколько это важно? Почему не радиусом 3 или 1?

Это повлияет на сохранность контуров и жирность букв.
 
psikov say:
Цитата:
XnView, например, не позволяет сделать 2х2. Минимум 3х3. Или больше.

"На нет и суда нет". Пробуйте. Ну коли нет у вас другого пакетного графического процессора. (А это точно радиус? Или это размер окна? Для радиуса 2 размер окна будет 2+1+2=5.).

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 10:20 12-05-2025 | Исправлено: zvezdochiot, 10:38 12-05-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Скриншот

На скриншоте результат обработки в STEX с указанными ниже значениями параметров, правильно?

Цитата:
На этапе "Вывод":
"Увеличение разрешения" - 1.5
"Фильтры":
- кривые - по нулям
- доп. фильтры: "Размытие/Резкость": размер - 2, коэффициент - 1.0
- "Выровнять освещение" - 1.0
"Режим":
- "Черно-белый"
- "Порог": EdgeDiv: радиус - 5, коэффициент - 0.75

 

Цитата:
2 - это размер "дырок", 5 - размер (ориентировочный) тонких штрихов

Я привел сканы страниц из двух разных книг, однако в обоих случаях размер дырок равен 2, а размер штрихов равен 5 - это случайное совпадение?

Всего записей: 46 | Зарегистр. 26-02-2025 | Отправлено: 23:55 12-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
правильно?

Правильно. Но проще самому проверить.
 
psikov say:
Цитата:
это случайное совпадение?

Неверно. Случайностей и совпадений в природе не бывает. Это мат. абстракция подмены множества слабокоррелируемых процессов на некую "случайность". Но значения ориентировочные. И точнее не надо. Чему ж тут удивляться?

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 00:30 13-05-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Для виндовс последний STEX где можно найти?

Всего записей: 616 | Зарегистр. 22-06-2016 | Отправлено: 21:33 19-05-2025 | Исправлено: esys, 21:33 19-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
Для виндовс последний STEX где можно найти?

Там же, где и обычно. Ссылка в шапке.

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 21:42 19-05-2025 | Исправлено: zvezdochiot, 21:42 19-05-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нашел. Спасибо!
 
Добавлено:
Как сделать чтобы при выводе в режиме цветной/серый не было никакого преобразования картинки (цветов и тонов) кроме обрезки и исправления искажений? В фильтрах что-то надо настроить?

Всего записей: 616 | Зарегистр. 22-06-2016 | Отправлено: 21:55 19-05-2025 | Исправлено: esys, 22:05 19-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
в режиме цветной/серый не было никакого преобразования картинки

В кривых (S и C) - нули. Выравнивание освещения - 0. Все доп. фильтры - коэффициенты 0.0 (по дефолту).
Ежели нужна "обрезка" - отметить "Белые поля".

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 22:48 19-05-2025 | Исправлено: zvezdochiot, 22:55 19-05-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так?

Всего записей: 616 | Зарегистр. 22-06-2016 | Отправлено: 23:20 19-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
Так?

Так. Я так понял, что "Белые поля" тебе вовсе и не нужны, а под "обрезкой" подразумевалось выравнивание страниц.
 
PS: А вот то, что ты от доп. фильтров "Шумодав KNN" и "Удалять пятна" отказываешься - это зря, я бы по 0.25 в них накрутил.

Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 23:29 19-05-2025 | Исправлено: zvezdochiot, 23:33 19-05-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обрезка при выделении полезной области.
 
Добавлено:
Какие лучше параметры для такого?

Всего записей: 616 | Зарегистр. 22-06-2016 | Отправлено: 23:58 19-05-2025 | Исправлено: esys, 00:59 20-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
Какие лучше параметры для такого?

Тяжёлый случай. Собственно вот.
 
Стадия "Вывод":

Код:
 
"Увеличение разрешения":
- Масштаб: 1.5
 
"Фильтры":
- Цвет по S/C-кривой: 0.0 0.0
- доп. фильтры (все размеры дефолтные, только коэффициенты):
-*- Auto Level: 0.5
-*- SubtractBG: 1.0
-*- Шумодав KNN: 0.5
-*- Удалять пятна: 0.5
- Выровнять освещение: 0.0
(остальное - дефолт)
 
"Режим": Черно-белый
- Порог: EdgeDiv
- радиус, коеф: 5 0.75
(остальное - дефолт)
 
"К-средних":
К(цветов): 2
фон: 0.5
(остальное - дефолт)
 


Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 02:20 20-05-2025 | Исправлено: zvezdochiot, 02:30 20-05-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата:
"ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами."
Зачем тут нужна запятая?
 
Как быстро и эффективно удалять паразитные точки в черно-белом режиме? Может быть для этого стоит воспользоваться какой-либо сторонней программой после обработки в STA?  

Всего записей: 46 | Зарегистр. 26-02-2025 | Отправлено: 00:42 23-05-2025 | Исправлено: psikov, 00:47 23-05-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov say:
Цитата:
Как быстро и эффективно удалять паразитные точки

  • Gimp (комментарий)
  • git: STEX: issue #66: Denoiser EM

    Код:
     
    #!/bin/sh
     
    mkdir -p b d m r
    gm convert -gaussian 5x5 $1 b/$1.png
    gm composite -compose Difference $1 b/$1.png d/$1.png
    gm convert -gaussian 5x5 d/$1.png d/$1.png
    gm convert -negate -normalize +dither -colors 2 -normalize -colors 256 d/$1.png m/$1.png
    gm composite -compose Plus $1 m/$1.png r/$1.png
    gm composite -compose Multiply b/$1.png m/$1.png b/$1.png
    gm composite -compose Subtract m/$1.png b/$1.png b/$1.png
    gm composite -compose Subtract r/$1.png b/$1.png r/$1.png
     


  • Всего записей: 973 | Зарегистр. 18-05-2023 | Отправлено: 01:34 23-05-2025 | Исправлено: zvezdochiot, 02:38 23-05-2025
    VSHY

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    git: STEX: issue #66: Denoiser EM
    Текст по краям потерял чёткость и вообще стал более блёклым.
    Лично я бы таким не пользовался.

    Всего записей: 1207 | Зарегистр. 19-05-2008 | Отправлено: 14:03 23-05-2025 | Исправлено: VSHY, 14:04 23-05-2025
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

    Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2025

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru