Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)
Программа для автоматизированной обработки сканов тип.книг

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 Предыдущие части: Часть 1,  Часть 2

Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор, PhotoShop, или GIMP.
ST изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ST) (ncraun) >>>  последняя версия
Scan Tailor Experimental (STex) (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (STEX) (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия (статистика)
Scan Tailor Deviant (STD) (Нубия-IV) >>>  последняя версия ("фотосканы")
Scan Tailor Plus (STP) (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (STE) (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (STF) (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (STU) (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (STA) (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (STA) (актуальный форк) >>>  история версий
ScanTailor Spectre (STS) (для macOS 12 и дальше) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
Хронология разработки Scan Tailor и её форков (livejournal, 20 февраля 2025).

Всего записей: 39757 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 00:46 08-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell say:
Цитата:
открываю сегодня и что же вижу?

А ты на каком этапе после открытия проекта оказался? На первом? Может стоит переключится (в списке) на последний?

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 15:20 09-01-2026 | Исправлено: zvezdochiot, 15:20 09-01-2026
vell



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мдя. Я помню в 1997 году мой одноклассник делал графический редактор, на паскале, он за 1,5 года дошел до возможности сохранения, кроме bmp в gif.
 
Прочему же так все со ScanTailor сложно, неинтуитивно понятно и своенравно?!
 
Я когда открываю проект в photoshop\premiere\aftereffects оказываюсь на том этапе, на котором закончил.  
Почему это не так в ScanTailor?

Всего записей: 640 | Зарегистр. 06-10-2004 | Отправлено: 19:17 09-01-2026 | Исправлено: vell, 19:20 09-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell say:
Цитата:
Прочему же так все со ScanTailor сложно, неинтуитивно понятно и своенравно?!

Это мягко сказано. Я до сих пор дивлюсь, откуда Tulon брал свои "идеи" для того, чтобы реализовать всё именно таким образом. Меня лично вымораживают дурацкие диалоги "Применить к...". Это просто вынос мозга. Специально в STEX: ToDo прописал изничтожение этой пахабщины и перенос функционала в "Эскизы", где ему и место. Но!.... Прогеров, чтоб это сделать, нема. А на нет и суда нет.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 19:40 09-01-2026 | Исправлено: zvezdochiot, 19:44 09-01-2026
vell



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
применил STEX: vell-0002-stex-all.zip
Меня всё устроило

слишком криво, лучше я пересниму.
 
У меня другая напасть теперь. FineReader распознал текст, сохраняю чтобы был поиск по тексту (за картинкой страницы) а в результате получается полная лажа. https://disk.yandex.ru/i/ZJScuC-w5t39rg
И никакие настройки экспорта не меняют ситуацию(

Всего записей: 640 | Зарегистр. 06-10-2004 | Отправлено: 21:24 09-01-2026 | Исправлено: vell, 21:26 09-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell say:
Цитата:
FineReader распознал текст, сохраняю чтобы был поиск по тексту

И где этот текст? Нету ни шиша.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 21:34 09-01-2026
vell



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот с текстом. https://disk.yandex.ru/d/Oj4r8E_LptwA2A
Но какая разница, если растровая картинка никуда не годится.

Всего записей: 640 | Зарегистр. 06-10-2004 | Отправлено: 21:52 09-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell say:
Цитата:
Вот с текстом.

Извлёк OCR с помощью cpdf:

Код:
 
cpdf -draft киприан+текст.pdf -o киприан-ocr.pdf
 

Собственно, вот.
Можешь наложить его поверх исходного PDF (ежели таковой был) в виде штампа любым удобным тебе инструментом, хоть PDF24.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 22:07 09-01-2026
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Так?:
1. Распознать в ФР файл.
2. Вытащить из него osr с помощью cpdf.
3. Вставить osr.
 
П. 3 как сделать без онфайн сервисов?

Всего записей: 721 | Зарегистр. 22-06-2016 | Отправлено: 23:29 09-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
как сделать без онфайн сервисов?

1. можно и tesseract.
2. cpdf уже указал.
3. ежели ГУИ, то PDFTK Builder. Я же делаю через qpdf:

Код:
 
qpdf киприан-src.pdf --overlay киприан-ocr.pdf -- киприан-book.pdf
 

 
Где в 1,2,3 онфайн сервисы?

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 23:42 09-01-2026
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Понял, спасибо!

Цитата:
Где в 1,2,3 онфайн сервисы?
 

PDF24 - гугл показал.

Всего записей: 721 | Зарегистр. 22-06-2016 | Отправлено: 00:11 10-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:
Цитата:
PDF24 - гугл показал.

Ох уж этот гугол. Есть же PDF24 Creator,, а это уже совсем не сервис, а конкретная программа. Просто это комбайн "онклюзив", вот я его и указал. Но и без него полно средств с нужным функционалом.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 00:35 10-01-2026 | Исправлено: zvezdochiot, 00:36 10-01-2026
vell



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то, господа, слишком много лишних этапов.  
Сначала я снимаю, затем закидываю в vFlat scan чтобы страницы обрезать и выпрямить, затем закидываю в scan tailor чтобы очистить от фона и улучшить читаемость, затем в FineReader чтобы распознать текст и сохранить в PDF, затем вытащить из PDF osr с помощью cpdf, затем снова создать PDF со вставленным за картинками текстом.
 
Не кажется вам, что это неправильный процесс и что-то надо сократить и оптимизировать?

Всего записей: 640 | Зарегистр. 06-10-2004 | Отправлено: 09:29 10-01-2026
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не кажется вам, что это неправильный процесс и что-то надо сократить и оптимизировать?
 

Попробуйте SK, там все в одном.

Всего записей: 721 | Зарегистр. 22-06-2016 | Отправлено: 10:25 10-01-2026 | Исправлено: esys, 10:28 10-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell say:
Цитата:
Не кажется вам, что это неправильный процесс и что-то надо сократить и оптимизировать?  

В большинстве случаев такие "сокращения" и "оптимизации" - это откровенное неприкрытое вредительство. Но вам виднее...

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 11:34 10-01-2026
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в принципе, оффтоп
 

Цитата:
vell
Что-то, господа, слишком много лишних этапов.

никто вам не мешает обойтись одним этапом: закажите сканирование и обработку профессионалу. Оплатил - получил. Ноль проблем.
А самостоятельно - оно вона как долго и трудно.

Всего записей: 3695 | Зарегистр. 15-07-2010 | Отправлено: 12:18 10-01-2026
vell



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
самостоятельно - оно вона как
если бы я был офис-менеджером, то да, может как вы говорите и сделал бы, но всю жизь делаю все сам, да и куда более сложные вещи. Не все сам человек может допетрить КАК НАДО, по этому к форуму и обращается.
 
Да и к тому же вопрос не стоит просканить и избавиться-забыть. С моей библиотекой-то это не работа "на отвали".
 

Цитата:
Попробуйте SK, там все в одном.

Скачал, загрузил сканы свои, припух... Скачал туториалы снова припух.  
 
Так как я сегодня впервые открыл для себя ScanKromsator мне очень не хватает того, что у буржуев называется "quick start guide"... Может есть такой а не список вопросов-ответов или документация а-ля "Инструкция по эксплуатации"? Задам этот вопрос в тематической ветке.
 
И да, судя по всему,
Цитата:
там все в одном
это не так, ибо OCR в PDF вставляется отдельно...
 
Знаете, работая инженером мне встречаются сложные системы, и чаще человеческий фактор играет более решающую роль в понимании...

Всего записей: 640 | Зарегистр. 06-10-2004 | Отправлено: 13:01 10-01-2026 | Исправлено: vell, 13:02 10-01-2026
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Всего записей: 3695 | Зарегистр. 15-07-2010 | Отправлено: 13:10 10-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, AAW, в той ли теме ты ответил?
 
vell say:
Цитата:
у буржуев называется "quick start guide"

Так как "это" всё вам в новинку, то, к сведению, есть кое-что, что "свидетели SK" не афишируют. А именно то, что SK - "программа одного человека". То есть пишется одним человеком и только для себя любимого. Официально bolega прикрывается каким то "эксклюзивом", но в SK нет никаких эксклюзивных компонент, эксклюзивна только их компоновка.
 
Мне такой подход понятен, ибо все "доводки" STEX я проводил таким же образом, с той лишь разницей, что эти доводки проводились для конкретных книг и в релизах либо даны ссылки на эти книги, либо ссылки на статьи, описывающие "проблему" при изготовлении книги.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 13:26 10-01-2026
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
ну вот чего врать-то так откровенно. Это же всё проверяется. Сам bolega про некоторые фичи СК пишет в ветке "я это сделал по чьей-то просьбе, сам никогда не пользуюсь". Типа порога Вольфа.
Нравится вам тейлор - прекрасно. Другую прогу пытаться топить зачем? Потому что она всё равно лучше, как вы ни вылезаете из кожи? Ну так вы заложник Тулона и прочих программистов. Расслабьтесь.
 
upd
! вспомнил: вы ж сами там предлагаете то одно то другое включить в Кромсатор
 
К слову о рецептах.
Вопрос: вы чем пдф с индексным пространством 2 бита сделали? Я башку свернул, пытаясь повторить ваши 477кбайт, потом увидел что есть тщательно скрываемое таинство

Всего записей: 3695 | Зарегистр. 15-07-2010 | Отправлено: 13:58 10-01-2026 | Исправлено: TelecomUral, 14:08 10-01-2026
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot say:
Цитата:
Другую прогу пытаться топить зачем?

Кто? Где? Как?
AAW, ну всё же ровно так, как я и написал.  И в том, что я написал нету никакого "топить". У всего есть достоинства и недостатки. Вы горбом выпячиваете достоинства, но фанатично (!) замалчиваете недостатки. Зачем?
 
TelecomUral say:
Цитата:
вы чем пдф с индексным пространством 2 бита сделали? Я башку свернул

В свойствах документа всё указано. Это либо jbig2enc, либо img2pdf.

Всего записей: 1093 | Зарегистр. 18-05-2023 | Отправлено: 14:06 10-01-2026 | Исправлено: zvezdochiot, 14:07 10-01-2026
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.B0ard 2000-2026

LiteCoin: LgY72v35StJhV2xbt8CpxbQ9gFY6jwZ67r

Рейтинг.ru

Рейтинг.ru