Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 Предыдущие части: Часть 1,  Часть 2

Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор, PhotoShop, или GIMP.
ST изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ST) (ncraun) >>>  последняя версия
Scan Tailor Experimental (STex) (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (STEX) (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия (статистика)
Scan Tailor Deviant (STD) (Нубия-IV) >>>  последняя версия ("фотосканы")
Scan Tailor Plus (STP) (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (STE) (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (STF) (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (STU) (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (STA) (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (STA) (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).

Всего записей: 39685 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 16:30 31-08-2025
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent
Цитата:
Subtitle Edit?
В ней я фразы по временной шкале двигал вправо-влево, это точно, а в какой делал OCR, - не помню...

Всего записей: 1209 | Зарегистр. 19-05-2008 | Отправлено: 21:38 10-06-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Например по слову "rpanuua"?

Даже если он никчемный, от него вред только в росте веса файла, в отличие от всяких сомнительных обработок изображения. К тому же при необходимости ocr легко удаляется без причинения вреда остальным частям файла.

Всего записей: 620 | Зарегистр. 22-06-2016 | Отправлено: 21:39 10-06-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
А все ваши остальные "правды" - это пускание пыли в глаза?

Какие ... "правды"?! Что за демагогию ты разводишь? STEX игнорирует dpi но с упорством самурая назначает 96. Фильтры обрабатывают весь скан до маски а не наоборот. Где об этом можно прочитать, в каком руководстве к stex? Программа не вчера же вышла.  
А вот господин Арцимович видеоуроки делал к ST и корона не упала, так как её не было. В наши дни, СТ попал в руки неких чуваков которые навешивать фич всяких, как на новогоднюю ёлку, превращая программу в графический редактор.
 

Цитата:
esys
К тому же при необходимости ocr легко удаляется без причинения вреда остальным частям файла.

Зачем же внедрять такой текстовый слой вся цена которого – лёгкое удаление оного из документа?

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 01:10 11-06-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Зачем же внедрять такой текстовый слой вся цена которого – лёгкое удаление оного из документа?
 

Чтобы ocr не годился для поиска по словам - такого не бывает, даже в рассматриваемом случае будет для этого толк. Копировать текст и высматривать что там верно-неверно распозналось - зачем?

Всего записей: 620 | Зарегистр. 22-06-2016 | Отправлено: 01:21 11-06-2025 | Исправлено: esys, 01:24 11-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
esys
Чтобы ocr не годился для поиска по словам - такого не бывает

дитё наивное
достаточно ошибиться в языке распознавания.

Всего записей: 3611 | Зарегистр. 15-07-2010 | Отправлено: 05:30 11-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:
Цитата:
Какие ... "правды"?!

Вот именно, вот именно... Нет таких.
Не надо корчить из себя "озабоченного пользователя". Вы не входите в те самые "пересчитать по пальцам одной руки".
 
TelecomUral say:
Цитата:
достаточно ошибиться в языке распознавания.

Что будет обнаружено сразу же. Не вопрос и не проблема.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 06:19 11-06-2025 | Исправлено: zvezdochiot, 06:22 11-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Что будет обнаружено сразу же

ага, в многоязычной-то книге? Мимо меня прошло поболее тысячи подобных книжек (филология, словари всевозможные, медицина с латынью и т.п.), но с отлаженными языками видел - по памяти - две. Ну, может забыл ещё пяток, за 20 лет.
 
+
что ж вы "границу" в Трикоми тогда не обнаружили.

Всего записей: 3611 | Зарегистр. 15-07-2010 | Отправлено: 06:49 11-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:
Цитата:
в многоязычной-то книге?

Сложите ваши сообщения вместе и получите бред и фигу. Хоть сами то читайте, что пишите.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 14:42 11-06-2025 | Исправлено: zvezdochiot, 14:42 11-06-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тема вроде про СканТейлор, значит поговорим про СканТейлор. Для разнообразия. Если кому-то СканТейлор интересен.
 
Провёл эксперимент.
Взял 1-й скан и ScanTailor 2019.8.16.
Сделал бинаризацию в 17 вариантах с разными значениями и комбинациями Window size (50-100-200-300-400-500) и Coeff (0.1-0.2-0.3), но включенный Despecl на максимум.
Сделал распознавание только одного проблемного бледного абзаца в FR16 (режим Text and pictures only, только один язык, применил выравнивание строк, т.к. именно этот абзац наклонен относительно остального текста).
Лучшие результаты показаны под тегами море при (жирным выделены ошибки):
300, 0.3 (4 ошибки)
Подробнее...
400, 0.3 (4 ошибки)
Подробнее...
200, 0.2 (5 ошибок)
Подробнее...
400, 0.2 (6 ошибок)
Подробнее...
200, 0.3 (по умолчанию) (9 ошибок)
Подробнее...
Вне конкурса STEX + zvezdochiot (7 ошибок)
Подробнее...
 
Резюме:
0) сам тест занял около 10 минут. Обработка результатов теста (вычитывание и сравнение по словам 17 отрывков текста) около 30 минут.
1) На данном бледном тексте лучший результат дало увеличение окна до 300-400 при дефолтном коэффициенте 0.3 (помним, что деспекл включен на максимум). Чуток хуже работает уменьшение коэффициента, но как-то странно.
2) Дополнительная настройка параметров бинаризации в СканТейлоре даёт уменьшение ошибок распознавания на проблемных текстах
3) То, что STEX с дополнительными настройками показал результат хуже, чем STA с дополнительными настройками, лично я объясняю тем, что слишком много крутилок слишком увеличивает время подбора параметров, что вкупе с эргономическими просчётами СканТейлора увеличивает вероятность выбора неоптимальных параметров.
3) Вычитывать надо. Но для комфортного вычитывания и исправления ошибок нужна специализированная программа.
4) Теоретически можно автоматизировать процесс подбора оптимальных параметров бинаризации с учетом OCR.
5) Выпрямление строк в ФайнРидере 16 дало улучшение качества распознавания на 10-15% (до 20). К сожалению, подобная функция отсутствует в СканТейлоре. Это совсем не исправление наклона.
6) FineReader 8-й версии в этом тесте показал отвратительные результаты.
7) Алгоритмы формирования текста (не распознавания, а назначение распознанному тексту атрибутов размера, курсива, жирности, большой-маленький) у ФайнРидера оставляют желать много лучшего.
8) При тестирование выявлены такие градации ошибок: 1-без ошибок, 2-незначительная ошибка (ошибочные переходы точка-запятая, размер шрифта, большие-маленькие буквы, курсив, жирный шрифт), 3-незначительная ошибка в слове, при этом слово остаётся понятным, 4-катастрофическая ошибка, когда слово полностью понятно, но меняет первоначальное значение, 5-катастрофическая ошибка, когда слово полностью непонятно.

Всего записей: 1023 | Зарегистр. 04-11-2019 | Отправлено: 19:02 11-06-2025 | Исправлено: jourmager, 19:18 11-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Провёл эксперимент.

Интересный тест. Намекает на адаптивный размер окна для Wolf. С учётом использования интегральных изображений такое вообще не проблема, но пока не слышал о метрике, на основе которой можно сделать такую адаптацию.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 19:28 11-06-2025
psikov

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Если кому-то СканТейлор интересен.

Интересно почему он ВАМ до сих пор интересен.  ЕМНИП, вы же в этой теме много раз писали, что Тейлор делает свою работу косо, криво, медленно, неудобно и т.п. Ну так почему же ВЫ его не забросили и на Кромсатор до сих пор не перешли? Ну или на какую-либо другую альтернативную программу - тот же FineReader, например, может делать ту же работу, что и Тейлор. Стало быть СканТейлор не такой уж и убогий, как можно подумать читая то, что вы здесь про него пишете?

Всего записей: 48 | Зарегистр. 26-02-2025 | Отправлено: 13:02 12-06-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
psikov

Цитата:
Интересно почему он ВАМ до сих пор интересен.   ЕМНИП, вы же в этой теме много раз писали, что Тейлор делает свою работу косо, криво, медленно, неудобно и т.п. Ну так почему же ВЫ его не забросили и на Кромсатор до сих пор не перешли? Ну или на какую-либо другую альтернативную программу - тот же FineReader, например, может делать ту же работу, что и Тейлор. Стало быть СканТейлор не такой уж и убогий, как можно подумать читая то, что вы здесь про него пишете?

 
-2) Если коротко - Кромсатор избыточно сложен, ФайнРидер недостаточно функционален. Но для получения результата иногда приходится использовать все подходящие программы.
При отсутствии времени дальше можно не читать.
 
-1) Я не знаю. каков ваш стаж на ру-борде (дата регистрации и количество постов ни о чём не говорит) и насколько вы информированы по теме, поэтому постараюсь объяснить обстоятельно, уж извините за многословие.
 
0) Всё ниже написанное является моим ИМХО, которое я могу при необходимости подкрепить фактами. Но замечания об ошибках, уточнения, дополнения приветствуются.
 
1) Почему мне интересен ScanTailor для обработки книжных сканов.
Специализированных программ обработки книжных сканов я знаю 4:
Book Restorer, ScanKromsator, ScanTailor, LIMB Processing.
Функции обработки книжных сканов имеют некоторые OCR-программы и PDF-редакторы:
FineReader, PDF-XChange Editor, Orpalis PaperScan Pro. Есть ещё мощные OCR-программы, такие, как Kofax Omni Page, Readiris PDF, Aquaforest Autobahn DX, но я не помню, что там есть по обработке сканов, а проверить сейчас нет возможности. Но в своё время я пробовал все (и не только вышеперечисленные), кроме LIMB Processing и Aquaforest Autobahn DX.
 
Совершенно отдельно стоят программно-аппаратные комплексы Archive.org (программа LuraDocument) и Google Books.
 
2) Моё мнение таково, что серьёзные производители серьёзных программ физически не могут сделать качественные алгоритмы обработки сканов (и фотографий) книг по той причине, что при разработке и тестировании программных алгоритмов надо использовать эти самые сканы страниц книг. Которые сканы практически все находятся под охраной авторского права. И их нельзя использовать для разработки соответствующих программ. Т.е. легальный разработчик легальной программы обработки сканов книг вынужден работать вслепую. В таком случае даже хорошие программисты поневоле превращаются в некомпетентных идиотов.
 
3) Tulon, автор ScanTailor, получил в своё время кучу седых волос и кучу мертвых нервных клеток, из-за того, что его доставал некий персонаж из US, которого Tulon подозревал в работе на органы охраны авторских прав, и Tulon мог огрести по полной в случае соответствующих обвинений, типа использования сканов книг, полученных нелегальным путём. Всё это есть в этой теме.
 
4) Единственная известная мне профессиональная программа обработки книжных сканов, сделанная профессиональными программистами, которая доступна широкой общественности ЕВПОЧЯ  - это Book Restorer, который прекратил своё существование в 2008 году. В том же году Google Books заключил (начал заключать) мировое соглашение с владельцами авторских прав на книги по иску в нарушении авторских прав. Совпадение?
 
ИМХО, по концепции интерфейса и по скорости работы определённых функций Book Restorer не смогли превзойти ни ScanTailor, ни ScanKromsator, хотя развивались ещё 20 лет после оного.
К сожалению, Book Restorer имеет существенные огрехи в реализации интерфейса и работе некоторых функций, что делает невозможным его использование в качестве основной программы для обработки сканов, но им приходится пользоваться в некоторых трудных случаях, типа исправления геометрических искажений.
 
Программа LIMB Processing, которая является далёким наследником Book Restorer-а, вообще-то предназначена для продажи в составе программно-аппаратных комплексов компании i2s, т.е. в комплекте с их планетарными сканерами. Хотя на сайте пишут по 30-дневный триал и на ру-борде даже есть тема в соответствующем разделе. Но.
 
5) Итого остаются фриварные ScanTailor и ScanKromsator.
ScanKromsator начал разрабатываться раньше ScanTailor-а. К сожалению, автор ScanKromsator-а не силён в разработке интерфейса пользователя (по его же собственным словам), а также ограничен программной платформой разработки. Поэтому ScanKromsator имеет неинтуитивный, нелогичный, неудобный интерфейс.  
 
Положение осложняется тем, что автор ScanKromsator-а наотрез отказался делать инструкцию к программе. Так называемая "Хрестоматия", своеродная библия приверженцев ScanKromsator-а, состоит из 4 (совпадение ?) не связанных между собой разделов, которые повторяют одно и то же на разный лад. Причём в Хрестоматии, которая была выпущена в 2018 году, описываются устаревшие на сегодняшний день версии программы (основа - 6-я версия 2016 года, хотя есть тексты и по версии 2008 года), т.е. одни функции работают не так, другие не рекомендуются, третьи вообще уже удалены, а описания новых функций естественно нет. Опять же - это хрестоматия, т.е. набор текстов от разных авторов с их собственным подходом по интересным им самим темам. Системность отсутствует как класс.
 
Видеоуроки существуют, но имеют те же недостатки - устарелость, отсутствие системности, разный подход, помноженные на длительность просмотра. Элементарные операции могут быть растянуты как резинка-венгерка. Но есть один плюс - страдающим бессонницей классно смотреть на ночь. В какой-то момент начинает неудержимо клонить в сон.
 
В некоторой степени помогают файлы Whats New в инсталяшках ScanKromsator-a, но это про информирование, а не про обучение.
 
Чтение специализированной темы на руборде помогает мало, т.к. там в основном обсуждаются специфические проблемы, обычно находящиеся вне сиюминутных интересов рядовых пользователей.
 
Есть возможность получить ответ на свой вопрос или совет от автора ScanKromsator-a (или от искушенных пользователей), но не будешь же спрашивать его о казалось бы элементарных вещах, типа как открыть файл для работы в ScanKromsator-e. Ой, а такое уже было. И не у меня одного.
 
Всё это приводит к тому, что на освоение программы требуется много времени. С затратами времени на освоение ScanKromsator-а можно смирится, но интерфейс программы настолько своеобразен, что порядок нужных действий для обработки материала забывается моментально, если не пользоваться ScanKromsator-ом каждый день. Т.е. при периодическом использовании ScanKromsator-a каждый раз приходится проходить всё обучение и освоение заново. Это задалбывает.
 
Также автор ScanKromsator-a принципиально против автоматизации определённых рутинных действий, что в определённых случаях приводит к увеличению времени обработки материала и к повышенной утомляемости обработчика от тупого однообразия бессмысленных действий.
 
Дополнительные функции есть и их много. Но сложность их освоения и некоторые сомнения в их принципиальной нужности могут нивелировать их существование.
 
Некоторым недостатком программы является её основная направленность на формат djvu.
 
Очень большой плюс ScanKromsator-a - это то, что программа постоянно развивается, улучшается, а сам автор является очень активным пользователем своей программы, т.е. о процессе обработки сканов знает "из первых рук". Что, ИМХО, приводит к обратном результату - на каждый чих сразу же добавляется своя кнопка, что приводит к дальнейшему усложнению и без того переусложненного интерфейса.
 
6) ScanTailor изначально делался как программа массовой потоковой автоматической обработки сканов для неискушенных пользователей. Это привело к тому, что ScanTailor имеет интерфейс, который является простым, интуитивным, логичным, и в основном удобным. Таким образом отсутствует необходимость в многословных инструкциях, видеоуроках, советах автора, каком-либо обучении. В форках программы, типа ScanTailor Advanced или ScanTailor Universal есть дополнительные функции, которые не совсем очевидны, но это не настолько большой грех.
 
Направленность ScanTailor-a на автоматизацию процесса убыстряет его, упрощает, и делает менее утомительным.
 
К сожалению, Tulon, автор ScanTailor-a, имея на начало разработки программы опыт обработки сканов аж 2 книжки, взял мастера Nero Burning Rom как основу идеи интерфейса и принципа работы ScanTailor-a, что привело к жесткой заданности последовательности действий и к жесткой внутренней архитектуре программы. Эту ошибку расхлёбывали и расхлёбывают по сей день все пользователи ScanTailor-a, все авторы его форков, ну и сам Tulon.
 
Ещё одна ошибка - это использование лицензии GPL v.3, которая резко ограничивает возможности программиста по использованию программных библиотек, по возможности зарабатывать деньги и по куче других нюансов.
 
Существующие проблемы в ScanTailor-e частично связаны с позицией автора - Tulon-a, который иногда рогом упирался в своё собственное видение работы программы и напрочь отказывался прислушаться к мнению пользователей, намного более искушенных в обработке сканов.
 
Надо понимать, что концепция автоматизации процесса обработки и максимального упрощения интерфейса имеет оборотную сторону. Т.е. функциональность программы всегда приносилась в жертву, чтобы программа оставалась максимально удобной и автоматизированной. Тем не менее, количество и качество его функционала вполне достаточны для обработки очень большого количества материала.
 
К сожалению, разработка ScanTailor-a профессиональными высококлассными программистами на C++, коими были Tulon (ST и ST Experimental), 4lex4 (ST Advanced), trufanov-nok (ST Universal), прекратилась как минимум 5 лет назад и надежды на её возобновление нет.
 
7) FineReader, который является наиболее продвинутым OCR- и PDF-редактором в области обработки сканов, всё-таки не дотягивает до функциональности ScanTailor-a, и уж тем долее до ScanKromsator-a, по причинам, озвученным в п. 2. Практически все его функции в разделе Image Editor (который по концепции до боли напоминает Book Restorer), аналогичные функциям ScanTailor, реализованы на "полшишечки", т.е. теоретически они есть, а практического удовольствия - никакого.
 
Ну серьёзно. Вот как в Файнридере разделить разворот на страницы, если разворот сфоткан под углом, и граница раздела страниц наклонена? Я пробовал. Ни фига. Как повернуть страницу на полградуса, который вижу я, а не на 20 градусов, которые видит алгоритм? Как кропнуть автоматом  по содержимому 300 страниц книги? Где сделать поля? Как бинаризировать страницы с подбором алгоритма бинаризации и его параметров? Всё это без проблем делается в ScanTailor.
Т.е. в некоторых случаях функции FineReader Image Editor работают, и работают хорошо, типа того же Straighten Text Lines, а в некоторых хоть плачь и колись кактусом.
 
8) Бонус. Приходилось сравнивать результаты бинаризации Orpalis PaperScan Pro, которая использует полностью автоматическую реализацию "Bradley adaptive thresholding", и ScanTailor. Увы и ах. Коммерческое решение от команды профессионалов проигрывало бесплатному решению от одиночки-самоучки (в области обработки изображений). Надо будет их наследника Aquaforest Autobahn DX попробовать, может довели до ума.

Всего записей: 1023 | Зарегистр. 04-11-2019 | Отправлено: 02:52 13-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем.
 
От некоторых запросов пользователей приходишь в глухой ступор. Вот последний из них: STA: [feature request] output image pipe #103. Вопрос к запрашивающему только один: Зачем? Зачем он делает такой запрос? Для какой цели?

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 16:43 14-06-2025
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я ничего не понял (может гугл не так перевел).

Всего записей: 620 | Зарегистр. 22-06-2016 | Отправлено: 20:57 14-06-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot , esys

Цитата:
Зачем он делает такой запрос?

Насколько я понял, этот юзер просит добавить в СканТейлор возможность отправлять уже полностью обработанные изображения сразу на вход какой-либо программы для сборки изображений в pdf/djvu. Т.е. нажал в СканТейлоре кнопку Плей на этапе Оутпут, и получил в соответствующей папочке уже готовый pdf/djvu.
А может и не так.

Всего записей: 1023 | Зарегистр. 04-11-2019 | Отправлено: 02:09 15-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
нажал в СканТейлоре кнопку Плей на этапе Оутпут, и получил в соответствующей папочке уже готовый pdf/djvu.

Не сложно догадаться, что "получится", ежели отдельно взятые страницы нуждаются в чистке, или режим не тот и т.д и т.п. Шляпа какая то. Вот и спрашивается: Зачем?!

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 09:36 15-06-2025 | Исправлено: zvezdochiot, 09:36 15-06-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Не сложно догадаться, что "получится", ежели отдельно взятые страницы нуждаются в чистке, или режим не тот и т.д и т.п. Шляпа какая то

Да. ИМХО вы правы.
 
Также добавлю, что ваша точка зрения так или иначе совпадает с мнением авторов СканТейлора:
 
are, Отправлено: 00:08 28-06-2008

Цитата:
было бы идеально ещё приделать сюда вызов minidjvu или другие свободные djvu-кодировщики как внешние программы. Впрочем это конечно необязательно - можно потом скрипт запускать с вызовом внешних программ

Автор: Tulon, Отправлено: 09:37 28-06-2008

Цитата:
Не вижу смысла делать неинтерактивный режим. Во первых, хотя бы одна страница из книги наверняка будет обработана неправильно. Во вторых, мне сложно представить, кто и зачем такой режим будет использовать.
Что касается встроенного экспорта в djvu, то пока я такого не планирую. Разве с экспортом есть какие-то проблемы? От программы экспорта и удобств-то особых не нужно. Указание набора файлов, выставление параметров, и сам экспорт.

 
Автор: U235, Отправлено: 06:08 04-04-2010

Цитата:
как насчет того, чтобы встроить экспорт в djvu (pdf) в сам ST как еще один этап?

Автор: Tulon, Отправлено: 11:48 04-04-2010

Цитата:
Сборка страниц плохо вписывается в модель ST. Например в ST предполагается возможность повторной обработки одной страницы на любой стадии. При сборке в DjVu такое не прокатит - придется переделывать всю сборку. Также возможно придется отойти от модели, где любые операции над изображением отражаются в файле проекта и могут потом быть пройдены на автомате.

 
Автор: balik1982, Отправлено: 19:30 28-02-2013

Цитата:
видится появление после этапа финальной обработки кнопки СОЗДАТЬ djvu

Автор: monday2000, Отправлено: 21:27 28-02-2013

Цитата:
В принципе, это технически возможно - но я не хочу. Это вредный универсализм. И вообще - мнимое упрощение. Не так уж и трудно открыть экспорт в другой программе и сделать там DjVu (или PDF). К тому же, просто созданием DjVu по нынешним временам уже не обойдёшься - всё равно ведь надо и OCR делать, и оглавление-букмарки да и обложку тоже.

 
Автор: allo04, Отправлено: 17:32 28-01-2016

Цитата:
еще бы ... экспорт добавить

Автор: 4lex4, Отправлено: 18:38 28-01-2016

Цитата:
экспорт в скантейлоре - выход за пределы проекта. ScanTailor не должен содержать элементы, которые не соответсвуют целям проекта, а создание djvu и подгонка под их утилиты - это далеко от ST. Лично я djvu не пользуюсь сейчас вообще, только pdf. Есть куча программ для экспорта в djvu из результатов ST, используйте их.

 
Автор: tlotr, Отправлено: 19:28 28-01-2016

Цитата:
напрасно отвергаете экспорт

Автор: 4lex4, Отправлено: 19:48 28-01-2016

Цитата:
Никто не отвергавет экпорт, есть куча утилит, используйте их, а эта фича выходит за пределы проекта ScanTailor, я не хочу тратить время на то, что уже реализовано сотни раз

 
Но тут надо понимать, что под термином "экспорт" также (в случае 4lex4) понимается экспорт разделённых сканов для djvu, который был реализован в ST Featured и ST Advanced.

Всего записей: 1023 | Зарегистр. 04-11-2019 | Отправлено: 11:48 15-06-2025 | Исправлено: jourmager, 11:56 15-06-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 
STA 1.0.20 "fly".
   
Заменено в Sauvola и Wolf контекстно независимое регулирование порога Delta (т.е. тупое поднятие/опускание пороговой карты на указанную величину) на контекстно зависимое регулирование Delta (т.е. регулирование производится в ходе построения пороговой карты в зависимости от контекста).
Так как вы постоянно эксплуатируете именно порог Wolf, желательно ваше замечание о применимости/недоприменимости данного регулирования.
 
PS: И я знаю, что регулировать ползунком гораздо удобнее, но пока восстановить его для Sauvola и Wolf не получается.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 19:20 15-06-2025 | Исправлено: zvezdochiot, 19:35 15-06-2025
xeccentricx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите какие параметры нужно выбрать, чтобы избавиться от водяных знаков на фоне фотографий? Места, где фон слишком светлый, не видно текста.
Пример

Всего записей: 2 | Зарегистр. 24-11-2011 | Отправлено: 15:02 04-07-2025 | Исправлено: xeccentricx, 15:03 04-07-2025
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xeccentricx
Есть такой же логотип на других сканах – чёрных, белых или одноцветных? Если да то лого можно убрать в режиме Divide, в фотошопе например.

Всего записей: 221 | Зарегистр. 02-06-2018 | Отправлено: 17:29 04-07-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru