Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии); ветка develop
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: ndch, 16:47 18-07-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
 
я вроде бы все фиксы прочитываю, видимо либо не понял либо пропустил...
 
нашел, за 12 июня, значит точно пропустил я...
 
приношу извинения

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 15:41 19-06-2018
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кому протестировать цветовую сегментацию, вот 2 отличных страницы с красным текстом и красными картинками разных оттенков: https://yadi.sk/d/BHs5eU_m3Y7RT7 Взято из Гупэеў П.П. - Асновы савецкай дзяржавы і права, 1987

Без дополнительных приблуд красный текст все еще выделить тяжеловато.

Всего записей: 168 | Зарегистр. 15-10-2009 | Отправлено: 18:34 20-06-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
allo04, имелось ввиду что все в переднике, такую картинку тоже можно сегментировать, а не совать в задний фон. (Если на картинках отсутсвует градиент, то есть плавные переходы тона, то их лучше сегментировать вместе с текстом.)
 
neitan18, если нужно все затолкать в передник - вот результат. Но паспорт на первой странице я бы сделал картинкой в фоне, ибо детальность на исходнике недостаточна, чтобы бинаризовать такие мелкие детали, а значит и сегментировать.
 
Кстати да, красный текст справа на последней странице слишком бледен, пришлось вручную править в шопе уровнями.
Но тут проблема не в сегментации, а в недостатке инструментов в СТ.
Тут два варианта: использовать адаптивную бинаризацию, но в этом случае картинку придется вытаскивать в отдельный слой, сегментировать и объединять обратно, иначе она испортится. Или наоборот вытаскивать красный текст и бинаризовывать его отдельно. Но это геморой и не практично, подробнее ниже.
 
По сути последняя страница показывает недостаток такой фичи в СТ, как зоны бинаризации, которая есть в СК.
Необходимо сделать на стадии выхода новую вкладку с зонами, чтобы определять отдельные настройки бинаризации и цветовой сегментации для разных участков страницы.
Напримаер, в данном случае мы могли бы для всей страницы выставить адапативный метод бинаризации Wolf, а картинку выделить зоной и выставить ей бинаризацию методом Otsu. Или вообще просто выделить блок с бледным красным текстом, таким образом задав ему свой отдельный порог бинаризации.
По сути такая фича просто жизненно необходима для работы со сложными случаями и открывает кучу возможностей.
Также огромный плюс для сегментации + постеризации, ибо отдельные картинки на странице смогут иметь свои настройки, не влияя друг на друга, и даже можно будет сразу извлекать контуры из градиентных картинок без работы со слоями.
 
Жаль щас со временем туго (а фича достаточно затратная по времени), с удовольствием бы запилил.

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 332 | Зарегистр. 27-01-2016 | Отправлено: 04:21 21-06-2018 | Исправлено: 4lex4, 05:11 21-06-2018
neitan18

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Функция архиважная, я часто с такой информацией сталкиваюсь.

Всего записей: 5 | Зарегистр. 29-03-2017 | Отправлено: 12:32 21-06-2018
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Именно отсутствие зон бинаризации не позволяет сделать СТ универсальным средством обработки сканов.
Такую книжечку только СК осилит, надеюсь, пока...

Всего записей: 168 | Зарегистр. 15-10-2009 | Отправлено: 14:18 21-06-2018
Shurix83

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4, если не секрет - когда планируете зарелизить 1.0.15 и что нового в нем будет?

Всего записей: 69 | Зарегистр. 12-04-2007 | Отправлено: 15:06 21-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shurix83
 
лично мое мнение - лучше следить за обновлениями на ветке develop что творится с проектом https://github.com/4lex4/scantailor-advanced/tree/develop
 
с моента выхода 1.0.14 было 47 фиксов разных
 
из нового и яркого - это безграничное количество направляющих, отключение жестских полей, улучшение обнаружение контента, например, белого на темном (новые опции в настройках), фиксы на разных стадиях...
 
из последнего - теперь можно будет с помощью горячих клавиш переходить между выбранными страницами...
--------------------------------------------------
4lex4
 
практически, не хватает следующей фичи, которая бы экономила бы время - в проекте на ряде страниц в разброс картинки, после вывода проверяю корректность определения картинок, правлю зоны картинок и поле нужно выводить опять страницу, приходится вывод после правки зон картинок делать по штучно, а было бы, по моему, здорово, если бы на стадии вывода была бы возможность выводить/прогнать только выбранные страницы (вместо прогонки всего проекта, хотя это конечно не час/два займет) либо чтобы на стадии вывода была сортировка, которая бы все страницы после правки сбились бы в одном месте и можно было прогнать только их...
 
повторюсь, чисто мое мнение... кто как думает еще по этому поводу?

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 21:14 23-06-2018 | Исправлено: derrikF, 21:17 23-06-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
derrikF, можно было бы сделать так: если выбрано 2 и более страниц, обрабатывать в пакетном режиме только их. Главное, чтобы было без постоянно выскакивающих богомерзких диалогов.
 
Хотя я сомневаюсь в нужности такой фичи.
Дело в том, что даже если прогонять все страницы - обработанные страницы (без знака вопроса) в СТ только проходят проверки и не обрабатываются повторно, поэтому проскакиваются очень быстро. Разумно просто поправить все зоны картинок, не переключаясь во вкладку выхода (оставляя страницу со знаком вопроса), и затем запустить пакетную обработку на все страницы в самом конце.

Всего записей: 332 | Зарегистр. 27-01-2016 | Отправлено: 23:12 23-06-2018 | Исправлено: 4lex4, 23:32 23-06-2018
Dmb_2007

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
derrikF

Цитата:
лично мое мнение - лучше следить за обновлениями на ветке develop что творится с проектом https://github.com/4lex4/scantailor-advanced/tree/develop  
с моента выхода 1.0.14 было 47 фиксов разных  

 
А что делать нам, форточникам-то?
У нас нет встроенных "make install" и прочих радостей...

Всего записей: 318 | Зарегистр. 07-05-2004 | Отправлено: 00:37 25-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dmb_2007
 
а вы что, думаете, что у меня просто по щучему велению всё стало происходить? я достаточно промучился чтобы завести сборку в Linux Mint...
но наладив раз, я уже не имею с этим проблем...
 
я имел ввиду, что на той ветке можно читать обновления которые происходят в разработке...

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 06:57 25-06-2018
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я имел ввиду, что на той ветке можно читать обновления которые происходят в разработке...
 

Лучше один раз "пощупать", чем десять раз прочитать.
А сделать мы можем это только в новых релизах.

Всего записей: 168 | Зарегистр. 15-10-2009 | Отправлено: 11:48 25-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
я не однократно принимал решение завязать с потытками наладить сборку из исходников, потому что постоянно какие-то проблемы возникали, но через время опять предпринимал попытки, и в один из моментов я это добился...
 
и теперь наслаждаюсь )))
 
4lex4
что, действительно так сложно наладить сборку проги в винде? сколько для этого нужно места юзерам?
вы сами собираете под винду в реальной винде или в виртуалке?

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 12:47 25-06-2018 | Исправлено: derrikF, 13:12 25-06-2018
Shurix83

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Коллеги, предлагаю вашему вниманию самописную утилитку для чистки мусора (дефектов печати) в уже обработанных ST страницах. Утилита писалась под свои нужды, поэтому сами понимаете... В общем, хотелки-пожелания-критика принимаются.
 
По ссылке https://yadi.sk/d/1uK9SxXl3YKXmf - архив с утилитой и инструкцией, а также примеры её применения.
 

Всего записей: 69 | Зарегистр. 12-04-2007 | Отправлено: 17:07 25-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
если у кого Linux Mint, то можете попробовать пакет, я собрал сейчас, может заработает, из ветки develop, включает все 354 commits
 
scantailor-advanced-dev-1.0.14-354-LinuxMint.deb https://cloud.mail.ru/public/JULK/ex3hNGdDM

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 19:34 25-06-2018 | Исправлено: derrikF, 17:37 26-06-2018
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shurix83
Задумка интересная и она даже работает. Но нужен какой-никакой графический интерфейс, т.к. ручками в конфиге каждый раз ковыряться не вариант.

Всего записей: 168 | Зарегистр. 15-10-2009 | Отправлено: 08:15 26-06-2018
Shurix83

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но нужен какой-никакой графический интерфейс, т.к. ручками в конфиге каждый раз ковыряться не вариант.  

Не вы один говорите про необходимость графического интерфейса, но его нет и, скорее всего, не будет по нескольким причинам.
 
Главная причина - я совершенно не представляю как вон должен выглядеть: графически делать 4 поля для габаритов дефекта + 4 поля для отступов + птичку на закрашивание чёрным - всё это будет фактически тоже самое, что и в конфиге руками прописать. Прироста удобства не даст, а затраты на работу в человек-часах увеличат.
Если у вас есть идеи как этот самый графический интерфейс должен выглядет, то озвучьте их. А еще лучше нарисуйте
 
Графически было бы куда важнее и удобнее сделать какой-нибудь визуальный замерщик габаритов искомого дефекта и отступов от него - типа ткнул в него мышкой и - вуаля! - показались значения или (что еще лучше) автоматически добавился фильтр в конфиг. Но это тоже не час и не два дня работы, поэтому пока для таких замеров без внешнего графического редактора не обойтись.
 
Как-то так.

Всего записей: 69 | Зарегистр. 12-04-2007 | Отправлено: 10:19 26-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
 
ГЛЮК - develop 354 commits
 
в проекте страницы порезаны пополам
 
на первом скрине выдно, что у меня выбрана страница 0024 [П], но когда я переключаюсь на 4 стадию, то видно на следующем скрине, что подсвечивается страница 0024 [П], но выбрана и отображается почему-то 0024 [Л]
 
ладн, попробовал наоборот - на третьем скрине видно, что у меня выбрана страница 0024 [П], затем я пеерключаюст на 5 стадию, и на четвертом скрине видно, что у меня выбрана страница 0024 [Л]
 
я только вчера собрал с 354 commits, при 353 commits с таким я вроде не сталкивался
 
скрины
 
это просто кошмар, невозможно работать!!! точно, такого при 353 commits не было

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 11:25 26-06-2018 | Исправлено: derrikF, 12:07 26-06-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
derrikF, поправил.

Всего записей: 332 | Зарегистр. 27-01-2016 | Отправлено: 14:32 26-06-2018 | Исправлено: 4lex4, 14:32 26-06-2018
derrikF



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
 
да, подтверждаю, теперь не перескакивает с П на Л
 
Добавлено:
4lex4
 
так что все таки насчет круглых зон? сейчас пробовал с помощью лассо обводить семь круглых зон, такой напряг с этим...
 
типа, возможность создавать круглые зоны либо превращать созданные прямоугольные в круглые

Всего записей: 192 | Зарегистр. 25-02-2007 | Отправлено: 17:35 26-06-2018
Fafy

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Отсканировал книгу в 560 страниц. При автоматическом определении полезной области только на 50_ти страницах произошел захват номеров страниц книги а на 510_ти страницах захватило только текстовый блок. Качество сканирования хорошее. В книге только текст с одинаковым форматированием и почти без глав. Единственное, номера страниц расположены от текстового блока на несколько большем рассстоянии чем обычно. В переди обработки таких томов еще много.
 
4lex4
Сделайте, пожалуйста ползунок настройки чувствительности распознавания полезной области.  
На корректировку полезной области вручную почти на всех страницах, это не передать словами... Надеюсь на понимание.

Всего записей: 436 | Зарегистр. 25-10-2010 | Отправлено: 10:24 27-06-2018
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru