Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии); ветка develop
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: ndch, 16:47 18-07-2018
Kvjazhich

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Эта программа умеет применять только одну функцию обработки? Например, мне нужно исправить только угол наклона текста в сканах и всё, далее сохранить.

Всего записей: 2 | Зарегистр. 21-01-2019 | Отправлено: 14:45 21-01-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kvjazhich

Цитата:
мне нужно исправить только угол наклона текста в сканах и всё

Scan Tailor для этого не годится, тк использует быстрый алгоритм поворота изображений и сменить его на bicubic/lanczos невозможно.

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 16:01 21-01-2019
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kvjazhich
Если не ошибаюсь, то это можно сделать в консольной версии.
Archivist
Насколько я понимаю, геометрические трансформации делаются в Qt xform.
А там со сглаживанием вроде все в порядке...

Всего записей: 642 | Зарегистр. 14-12-2005 | Отправлено: 17:35 21-01-2019 | Исправлено: U235, 18:07 21-01-2019
Shurix83

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Эх, интегрировать бы в ScanTailor эту штуку — https://galfar.vevb.net/wp/projects/deskew/ ...
 
И как я понимаю, новостей от 4lex4 никаких?

Всего записей: 76 | Зарегистр. 12-04-2007 | Отправлено: 11:29 22-03-2019
beremour



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Shurix83
а оно лучше, чем уже имеющийся ?

Всего записей: 394 | Зарегистр. 08-04-2002 | Отправлено: 17:11 25-03-2019
Shurix83

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
beremour вроде как да, но лучше, конечно, сразу всё ровно сканировать.
Вообще, это только повод узнать как дела с СТА — всё, амба, или шансы на дальнейшее развитие еще есть.

Всего записей: 76 | Зарегистр. 12-04-2007 | Отправлено: 22:44 25-03-2019
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shurix83
Вы, пожалуйста, конкретные примеры страниц приведите, где СТ выравнивает некорректно, а данный софт без ошибок.

Всего записей: 642 | Зарегистр. 14-12-2005 | Отправлено: 09:42 26-03-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Shurix83 очевидно принес штуку из темы СканКромсатора, где я ранее прикладывал  архив со сравнением поворота журнальных сканов. На СТ я их не проверял, но если интересно можете попробовать.

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 09:59 26-03-2019
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не знаю, на выравнивание текста никогда нареканий не было.
Я и удивился этому объявлению.
 

Цитата:
Вообще, это только повод узнать как дела с СТА — всё, амба, или шансы на дальнейшее развитие еще есть.  

На ГитХабе автор вроде бы отвечает.
 
...Работать на энтузиазме выматывает как минимум, а "мана" на следующий энтузиазм копится долго.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4136 | Зарегистр. 18-09-2003 | Отправлено: 13:59 26-03-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не знаю, на выравнивание текста никогда нареканий не было.

В журнальной многоколоночной верстке с неоднородными фонами и большим количеством иллюстраций ситуация несколько отличается от книжной.

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 14:20 26-03-2019
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
И что???

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4136 | Зарегистр. 18-09-2003 | Отправлено: 20:35 26-03-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Появляются нарекания.

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 20:44 26-03-2019
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist

Цитата:
На СТ я их не проверял, но если интересно можете попробовать.

Проверил на СТ, присутствует пара выбросов с.94(1 градус) и с.36(0.5 градусов)
остальное более-менее коррелирует с Deskew1.25. Еще заметил дискретность угла СТ(0.0625 градуса), где-то в исходниках была константа шага преобразования Хафа, ее можно сделать поменьше.
В СК дискретность угла тоже присутствует, около 0.084 градуса. Есть два явных выброса с.109(14 градусов) и с.64 (13 градусов). Остальные значения хоть и лежат в пределах 1-2 градусов, со значениями Deskew1.25 коррелируют слабо.
Хочу на днях еще потестить deskew от Imagemagick в двух вариантах и в FR8, как сделаю, выложу сводную таблицу.
 

Всего записей: 642 | Зарегистр. 14-12-2005 | Отправлено: 22:31 26-03-2019
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Понимаете, я нареканий могу выставить массу любой программе.
То что вы написали - это исключение, таких исключений тоже масса.
Если они решаются точно и бесповоротно - то можно включать, а если это просто решение одной из разновидностей - то и зачем???.
 
Я стараюсь понять ограничения алгоритмов, а за каждую десятую долю процента сношать мозг программисту не хочу, хотя многие тут это делают...
Потому когда алгоритм начнёт нормально работать на исключениях, тогда его и вставлять.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4136 | Зарегистр. 18-09-2003 | Отправлено: 07:05 27-03-2019 | Исправлено: slava_kry, 07:20 27-03-2019
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вообще, это только повод узнать как дела с СТА — всё, амба, или шансы на дальнейшее развитие еще есть.

Есть. В апреле планирую выпусть следующий релиз(ы) с фиксами, в мае релиз с фичей зон бинаризации. Потом опять пропаду, где-то до зимы.

Всего записей: 332 | Зарегистр. 27-01-2016 | Отправлено: 07:21 27-03-2019
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235, включите ещё в таблицу ST-экспериментальный и ФР-12
https://yadi.sk/d/grMZtb0g0hiRrg
добавил ещё от себя одну страницу с картинкой, оба СТ на ней косячат, ФР в норме, непонятно за что цепляются СТ, ничего горизонтального на таком градусе нет, интересно как поведут другие программы на ней, такой вариант в книгах встречается чаще, чем разноцветные журналы.
 
slava_kry, так-то сходу видно невооружённым глазом, что Deskew1.25 меньше косячит, наверное и её можно чем-то в тупик загнать, может с большими углами не справится?, насканировать ей под 45 градусов, чтоб наверняка добить ей мозг ))  
 
Archivist, ну Вы педант просто капец, запрещать пользоваться СТ, потому что нет бикубика, да мы без него 10 лет живём и ещё протянем сколько нужно. По большому счёту сканы так и так надо чистить от шума размытием, а резкостью восстановим полезные контуры, вот и весь расклад, тем и дышим. Так-то идею к правильной обработке на поворотах верно продвигаете и хорошее решение наковыряли, сейчас ещё U235 затестить на разных сканах, с разным DPI, светлые и тёмные, съёдобные и ядовитые и будем хотя бы знать, что вон там есть и получше, кому для журналов нужно, то туда, а лечение от быстрого алгоритма slava_kry даст или уже выдал в видеоблоге.
 
Сейчас представил читателя, попалась страница с отклонением в 0,5 влево, левое ухо пошло вниз, следующая вправо, голова опять качнулась ))
 
4lex4, мне аж знакомый написал - зайди на ру-борд, 4lex4 появился.  
Во как! Событие!  
Пользуясь случаем ещё раз поблагодарю, программа работает отлично!  
Мозг не жалейте, под нагрузкой дольше проработает ))
 

Всего записей: 141 | Зарегистр. 22-04-2012 | Отправлено: 10:53 27-03-2019
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad
https://yadi.sk/d/qo6ttUwR3fhSwQ
Табличка в csv и график угла поворота (абсолютное значение) для разных программ, для данных сканов. Угол поворота рассчитывался, где это возможно, исходя из размеров исходного скана и размера повернутой версии.
Результаты: FR8 и FR12 выравнивают сканы примерно одинаково.  Разницы между ST и ST-e вообще нет, за исключением двух сканов, да и там она не велика.  
FR (8 и 12)  ближе к deskew 1.25,  далее идет ST, затем идут Imagemagick и SK.  
 
 
 
 
Добавлено:

Цитата:
добавил ещё от себя одну страницу с картинкой

Дело в том, что  СТ перед поиском угла делает чистку картинки, чтобы избавиться от теней. И принимает практически всю иллюстрацию за тень, соответственно угол находит неправильно, т.к страница почти пустая. См. режим отладки, вкладка after_cleanup. (Файл \filters\deskew\Task.cpp)

Всего записей: 642 | Зарегистр. 14-12-2005 | Отправлено: 17:33 27-03-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad

Цитата:
Сейчас представил читателя, попалась страница с отклонением в 0,5 влево, левое ухо пошло вниз, следующая вправо, голова опять качнулась ))

Оцифрованные журналы принято читать разворотами (по 2 страницы на экране) и в таком режиме даже незначительные перекосы часто бросаются в глаза, например когда два полноразмерных "вертикальных" элемента на соседних страницах начинают образовывать угол. И у читателя брови поползли вверх
 
U235
Очень наглядно получилось в плане исследования схожести алгоритмов. По графику можно подумать, что СК справился хуже всех, но напомню, что в архиве были исключительно страницы, отбракованные после работы СК. С остальными 2/3 страниц журнала он справился на отлично, выровняв угол до 0-0.02
 
А вы можете посоветовать, как с помощью IM и значений угла из лога Deskew 1.25 пакетно поворачивать страницы? Плохо знаком с этим приложением. Данные приводятся к набору пар значений (008.tif -0.405, 094.tif 0.155,..). Все же Deskew 1.25 размывает картинку еще сильнее, чем СТ. Я написал автору, он обещал решить проблему.

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 19:55 27-03-2019
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235, для меня расклад ожидаемый, визуально сравнил с разных программ, но почему-то душой чуть больше болел за ST-e, как-то ранее тестировал его с STA на предмет выпрямления искажений на автомате, и тогда ST-e был явно на шаг впереди, результаты выкладывал, может и тут, не помню, а здесь Вы так уровняли их способности, что прям загрустил.
А что за IM90? В результатах теста настоящий герой. Есть к чему стремиться всем участникам ))
 
Archivist
>>Оцифрованные журналы принято читать разворотами (по 2 страницы на экране)<<
Когда-то и я так считал, пока меня не забросали помидорами настоящие читатели за то, что принудительно включал вид при открытии пдф разворотами.
Если у Вас монитор метр на два или два на три, то проблем с чтением не возникнет, для остальных самый удобный режим "по ширине страницы".
А так согласен, когда всё идеально ровно, то очень приятно, но плата временем на правку..., народ понятливый и не встречал злобных выплесков на мизерные отклонения в готовых файлах, главное информация есть, читатель её получил, писать об мелких косяках будет просто некорректно.
 

Всего записей: 141 | Зарегистр. 22-04-2012 | Отправлено: 20:39 27-03-2019
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В результатах теста настоящий герой.

Так он по графику почти ничего не повернул.
 

Цитата:
Когда-то и я так считал, пока меня не забросали помидорами настоящие читатели за то, что принудительно включал вид при открытии пдф разворотами.

PDF не лучший выбор для *отсканированных* журнальных страниц из-за проблем с масштабированием. Но в любом случае странно, что программа для чтения предпочитает настройки PDF пользовательским. А этот принудительный вид учитывал, что титульная страница должна идти отдельно, а последующие парами?

Всего записей: 86 | Зарегистр. 10-08-2018 | Отправлено: 20:51 27-03-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru