Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1,  Часть 2
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 19 августа 2024).

Всего записей: 39187 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 16:51 18-09-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
Какие страницы для примера?

Не "спорь" ты с очередным свидетелем Кромсатора. У него, видишь ли, искажения возле корешка сделаны автоматическим исправлением искажений, которым в STA никто не пользуется совсем по указанной мной причине. Ну и о чём после такого можно "спорить"?
 

Всего записей: 755 | Зарегистр. 18-05-2023 | Отправлено: 21:27 04-06-2024 | Исправлено: zvezdochiot, 21:27 04-06-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
искажения возле корешка сделаны автоматическим исправлением искажений

Да ну это всем понятно, что не так.

Всего записей: 521 | Зарегистр. 22-06-2016 | Отправлено: 21:49 04-06-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
У него, видишь ли, искажения возле корешка сделаны автоматическим исправлением искажений

Это не у меня, а у автора pdf-файла. Там не только искажения возле корешка, там сплошь и рядом перекос строк текста в одну сторону, а графиков в другую. Потому что алгоритм дуреет, когда ему на полстраницы есть за что уцепиться, а на полстраницы непонятно какая фигня в виде графика. И когда сдуру это применять автоматом оно и вылазит.
 
Кстати, одна из типичных проблем режима коррекции геометрических искажений в СканТейлоре - это ошибочное отсутствие захвата первой (первых) или последней (последних) строк текста на странице. В этом случае чётко видно, что синенькая решётка захватывает очень классно весь текст, кроме первых или последних строк. И при последующей коррекции всё классно исправляется, кроме этих висячих строк. И тут проблемы две - во-первых лень прощелкать все страницы на предмет правильного положения решётки исправления - мы же крутые автоматчики, в во-вторых это возможно в СканТейлоре только через одно место.
 
 
Сорри за оффтоп
esys

Цитата:
В оригинале их было аж две одинаковые

Ага. Ещё один довод к тому, что файл после изготовления не проверялся.

Цитата:
на каждой было только "90 коп."

Нет. Там также был логотип Издательства Просвещение.

Цитата:
Убрал обе, т. к. это мусор

Эээ... Я промолчу, т.к. это вообще грозит перерасти в злостный философский оффтоп

Цитата:
В оригинале они левые, т. к. не повторяют оригинального оглавления книги, поэтому их копировать я не стал

Конечно они левые, потому что панель букмарков слева. И повторять точь в точь они не обязаны, потому что в печатной книге в оглавлении никогда не бывает указания обложки или титула, а в букмарках они быть должны. То, что автор файла поленился и сделал оглавление только на главы и не делал на параграфы, ну так лень - мать всех пороков. Он и файл проверить поленился.
А может вы имеете в виду "несовпадение" страниц? Потому что обложка в pdf-файле имеет номер "i" для совпадения нумерации логической и физической? И при преобразовании pdf в djvu надо все цифирки увеличивать на один?

Цитата:
Какие страницы для примера?

Стр. 247. 250, 255 книги. Куски оригинального скана. И эти страницы вместо 4-bit index имеют кодирование в jpg. Прощелкать 318 страниц на поиск артефактов у меня заняло меньше минуты на тормозной Суматре. вас не смутило пустые места на страницах вашего djvu? Или вы тоже свою работу не проверяли?

Цитата:
Нашел только специально высматривая.

Кстати, если уж вы специально высматривали, то должны были обратить внимание на стр. 75 книги, где на левом графике левая часть оси иксов V неестественно задрана вверх. Остальные десяток -другой страниц уже не так интересен.

Всего записей: 891 | Зарегистр. 04-11-2019 | Отправлено: 23:52 04-06-2024 | Исправлено: jourmager, 00:27 05-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
стр 75
https://disk.yandex.ru/i/P3xMWaghxEsf5w
не надо делать выводы на неустановленных фактах.
 

Всего записей: 3391 | Зарегистр. 15-07-2010 | Отправлено: 00:18 05-06-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Просто 3 скриншота.
1) Оригинал разворота из книги
2) Правая часть разворота после STEX 2024.05.18 Geometric Distortions Curved Lines
3) Правая часть разворота после BookRestorer 4.2.1 (2007 год) Geometrical Correction
Кстати, можно обратить внимание на колонки миниатюр в СканТейлоре и БукРесторере.  
Как уже все догадались, я не подбирал специально страницы, а просто прогнал все сканы на полном автомате через СТ и БР в режиме исправления геометрических искажений.  
И ещё, во время исправления геометрических искажений на 66 страницах - STEX натужно гудел всеми моими 8 потоками с загрузкой 100% в течение 1 минуты. БукРесторер обошелся 15-30% загрузки в течение 10 секунд.
Напоминаю, БукРесторер 2007 года, STEX - 2024 года.  
P.S. Походу, я теперь свидетель БукРесторера
P.P.S. Надеюсь, все понимают, что я охотно предоставлю оригиналы желающим в чисто исследовательских целях исправления геометрии
 
Сорри за оффтоп
TelecomUral

Цитата:
не надо делать выводы

Риторический вопрос - а где вы увидели "выводы" в моих словах, цитирую сам себя:
"На мой непросвещённый взгляд ... Могу и ошибаться, могу и аргументировать."
"утверждать не берусь, но вполне вероятно"
"должны были обратить внимание"
Я только высказывал вероятностные предположения, основываясь на своём опыте работы с СканТейлором и другими программами.
Кстати, ИМХО "неустановленный факт" - это оксиморон, но применённый не как стилистический приём, а как ...

Всего записей: 891 | Зарегистр. 04-11-2019 | Отправлено: 18:04 05-06-2024 | Исправлено: jourmager, 18:49 05-06-2024
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
О Господи, опять в бане меряются. Да доеб@ться можно до каждой из работ! ... и до каждого. То что деварп в том же stex работает круче всех, и ресторера тоже, это факт. Только надо руки прямые иметь и глаза получше а не тупо засовывать в программу, жать пару клавиш и ожидать великолепного результата. И при этом при всём не смотреть что получилось в итоге, не проверять! ("хотел капслоком написать но удержался") Читаешь и последние волосы на голове дыбом встают. То страницу с ценой удаляют, потому как лишняя, то страницы в середине потому как не текста не изображения на них нет. Эй, улучшайзеры, может вы уберёте руки от сканера, не вы макет книги готовили, не вам его "улучшать"?!

Цитата:
Походу, я теперь свидетель БукРесторера

Быть свидетелем ресторера в 24-м году – моветон.

Всего записей: 202 | Зарегистр. 02-06-2018 | Отправлено: 21:23 05-06-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не вы макет книги готовили

Бумажной книги. Электронную книгу читают на эл. устройстве, то что нужно было бумажной, электронной не нужно. Листы пустые "Для заметок" 10 шт. тоже надо оставлять? Хотя уже видел, что делают эл. книгу так, что ее в трехмерке можно крутить зачем-то. Можно еще звук бумаги добавить при перелистывании. На листы делить тоже нельзя, наверное, т. к. бумажную книгу мы читаем раскрытой на двух страницах?

Всего записей: 521 | Зарегистр. 22-06-2016 | Отправлено: 22:27 05-06-2024 | Исправлено: esys, 22:31 05-06-2024
indifirent

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Электронную книгу читают на эл. устройстве, то что нужно было бумажной, электронной не нужно.

Электронная книга книге рознь. Для автентики подходит pdf и djvu а для кучи текста можно и epub какой то. Надеюсь вы книги по сопромату в fb2 не сохраняете.
Уточняю. Простите за офф-топ.

Всего записей: 202 | Зарегистр. 02-06-2018 | Отправлено: 22:47 05-06-2024 | Исправлено: indifirent, 22:51 05-06-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Надеюсь вы книги по сопромату в fb2 не сохраняете.

Не уловил связь.

Всего записей: 521 | Зарегистр. 22-06-2016 | Отправлено: 22:57 05-06-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
Не уловил связь.

Он про цитирование и соответствие номеров страниц (опять же для цитирования). Так же зачастую для "идентификации" указывается кол-во страниц в книге. Но всё сводится к одному - цитирование конкретной страницы конкретной книги.
 

Всего записей: 755 | Зарегистр. 18-05-2023 | Отправлено: 23:44 05-06-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent

Цитата:
То что деварп в том же stex работает круче всех, и ресторера тоже, это факт. Только надо руки прямые иметь и глаза получше а не тупо засовывать в программу, жать пару клавиш и ожидать великолепного результата.

Угу. Повторюсь:

Цитата:
я охотно предоставлю оригиналы желающим в чисто исследовательских целях исправления геометрии

Жду запроса.
 

Цитата:
Быть свидетелем ресторера в 24-м году – моветон.

Вы, вероятно, невнимательно читали тред. Если не поняли, то мой каминг-аут как "свидетеля БукРесторера" - это был сарказм в ответ на замечание zvezdochiot, что я "очередной свидетель Кромсатора". Ему в его патологической, мягко говоря, нелюбви к СканКромсатору, его автору, и всему СканКромсаторскому комьюнити, всюду мерещатся "враги".
А я взвешенно отношусь к любой программе, и способен признавать как достоинства, так и недостатки программ, которыми пользовался. СканТейлор имеет ряд достоинств, но это не отменяет его недостатков. Точно так же, как можно признавать большой вклад его автора Tulon-а в книгоделательное дело, но при этом нельзя забывать про грабли, которые он раскидал вокруг и на которые наступали все и он в числе первых.

Всего записей: 891 | Зарегистр. 04-11-2019 | Отправлено: 23:53 05-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вынудили таки пофилософствовать. Сорри!
оффтоп

Всего записей: 3391 | Зарегистр. 15-07-2010 | Отправлено: 06:42 06-06-2024 | Исправлено: TelecomUral, 06:49 06-06-2024
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Можно ли в Experimental  указать фиксированное значение размера вібираемого контента? И перенести полученную область на все страницы. (по аналогии с функционалом Advanced).
Хочется просто обрезать края сканов на несколько миллиметров и на выходе получить страницы фиксированного размера.

Всего записей: 889 | Зарегистр. 27-06-2006 | Отправлено: 15:31 06-06-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD say:

Цитата:
в Experimental  указать фиксированное значение размера вібираемого контента?

Нет. Только установка рамки ручками.
 
LonerD say:

Цитата:
И перенести полученную область на все страницы.

Да. "Применить к...".

Всего записей: 755 | Зарегистр. 18-05-2023 | Отправлено: 16:40 06-06-2024
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
Нет. Только установка рамки ручками.

Понял, спасибо за ответ.
 
Очень жаль, что каждый автор стремится к "индивидуальности". Мало того, что все предыдущие полезняшки в новых форках выбрасываются, так ещё и придумывается собственный формат сэйвов.
Нашёл свои старые недоделанные проекты за 2012-13 годы, хотел было доработать их в новых форках. Ан нет, сэйвы уже ни с чем из современного несовместимы. Невозможно импортировать даже банальную обрезку, повороты страниц, зоны картинок.

Всего записей: 889 | Зарегистр. 27-06-2006 | Отправлено: 02:12 07-06-2024 | Исправлено: LonerD, 02:17 07-06-2024
MZN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
Насчет преемственности полностью поддерживаю.

Всего записей: 1803 | Зарегистр. 23-10-2004 | Отправлено: 06:46 07-06-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD, MZN, у меня старые проекты STEX в новых версиях открывает. Так что с преемственностью у  STEX проблем нет.
 

Всего записей: 755 | Зарегистр. 18-05-2023 | Отправлено: 06:53 07-06-2024
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
ну так выложите новые и старые сейвы, чтобы можно было сравнить их и поправить.  
Tulon, в свое время, очень правильно взял за основу открытый стандарт xml для сейвов.

Всего записей: 989 | Зарегистр. 14-12-2005 | Отправлено: 09:00 07-06-2024
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
Цитата:
Нашёл свои старые недоделанные проекты за 2012-13 годы, хотел было доработать их в новых форках. Ан нет, сэйвы уже ни с чем из современного несовместимы.
Извечный спор - новшества или совместимость. Совместимость можно поддерживать до определённого момента, а потом, рано или поздно, всё равно будет отказ от совместимости и переход на другой формат.
4lex4 действительно много хороших улучшений сделал в плане внутренностей проекта, это признают почти все, кто реально разбирался в коде. Ну и полезных настроек много добавил...
 
U235
Цитата:
Tulon, в свое время, очень правильно взял за основу открытый стандарт xml для сейвов.
Тут не в xml дело. Хотя он к настоящему времени уже давно устарел - обладает излишней избыточностью. Json лучше. Но опять же, не в этом дело, а в том, что добавляя настройки и новые возможности, формат, который был заложен внутри xml, сильно изменился.
Нормальный подход - писать код, который конвертит данные /настройки к новому формату. Но такое возможно для коммерческих продуктов. Никто своё время тратить здесь на это вряд ли будет.
 
Тут другая проблема - нет чтобы всем вместе договориться и пилить, усовершенствуя один проект, каждый для себя наклепал форков... И это тоже извечная проблема, - договариваться всегда сложнее, чем наколбасить для себя что хочешь, ни кого не спрашивая. И это тоже извечное, как вселенная, - сначала взрывается и разлетается в разные стороны, потом люди на своём горбу пытаются собрать воедино)) Сейчас людей таких не наблюдается, потому все эти ахи и вздохи бесполезны - пользуемся тем, что имеем.

Всего записей: 1148 | Зарегистр. 19-05-2008 | Отправлено: 16:48 07-06-2024 | Исправлено: VSHY, 16:52 07-06-2024
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VSHY Ничего против JSON не имею, т.к. тоже открытый стандарт. В xml  сохраняют свои данные куча программ, от офисных, до программ верстки. Xml легко читается человеком и парсится машиной. Это гораздо лучше какого-то бинарного формата как, например, у ABBYY  FineReader'а или ранних версий MS Office.  
Есть  замечательный xmlstarlet для преобразования xml2xml.
Ну или простенький скрипт на Python, думаю, легко выполнит такое преобразование. Главное написать схему преобразования.
В форках есть и плюсы: удачные решения появившиеся в одном форке   могут  переноситься в другие. Опять же,  для ST отсутствует  такая вещь как bus factor.
https://ru.m.wikipedia.org/wiki/%D0%A4%D0%B0%D0%BA%D1%82%D0%BE%D1%80_%D0%B0%D0%B2%D1%82%D0%BE%D0%B1%D1%83%D1%81%D0%B0  
 
Монополизм это плохо, конкуренция  разнообразие решений  - хорошо.  

Всего записей: 989 | Зарегистр. 14-12-2005 | Отправлено: 18:33 07-06-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru