Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сборка 2013.03.09
 
http://rghost.ru/44385289
 
Добавлено:
Новая опция:
 
Picture_Shape
 
взята из Enhanced в неизменном виде.
 
Не обошлось без проблем: после перенесения выяснилось, что опция привнесла баг, который в своё время устранил DikBSD:

Цитата:
30.11.2011 Исправил bug - при открытии ранее сохраненного и отработанного проекта на Стадии Вывод. весь проект требовал прогонки заново. Т.е. все миниатюры на ленте имели знак вопроса. Исправлено.

Этот баг порождён именно этой опцией - в том виде, в котором её реализовал автор Enhanced. В самом Enhanced этог баг до сих пор присутствует.
 
Но я сегодня уже просто не успеваю этот баг исправить "по следам" DikBSD - посмотрю это уже завтра.
 
Опцию пока просто перенёс и всё. Потом буду, скорее всего, как-то улучшать её. Дело это будет не быстрое, сразу предупреждаю.
 
Добавлено:
Кстати, опция оказалось довольно здоровенной - по исходным кодам. Я её запарился переносить по кускам. Она даже в консольной версии есть.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:52 09-03-2013
3y6acTuK

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заметил, что ScanTailor портит тонкие элементы на страницах - например, исчезают засечки у шрифта Times.
Исходник - серый TIFF, с черно-белым идеальным шрифтом, отрендеренным из векторного Times в 600 dpi
На выходе:  
1) Режим "Черно-белый", с любыми степенями (по-умолчанию, тоньше, жирнее) - невозможно добиться тех же тонких засечек, которые были - они либо исчезают, либо становятся очень жирными - проще говоря, буквы просто сильно огрубляются программой.
2) Режим "Цветной/Серый" - оригинальные засечки у букв таки сохраняются, но становятся серыми! То есть при печати они будут растрироваться.  
 
Никакие фильтры типа поворота, выравнивания, очистки от мусора не применялись - только автообрезка полей (кстати, здесь тоже есть глюки из-за Разрезки страниц, может попозже о них).
 
Ну и зачем делать из черно белых линий серые?  
 
(А если даже так надо для внутренней обработки - тогда надо и разрешение для нее повышать, чтобы не терялись мелкие детали в обрабатывемых страницах).

Всего записей: 385 | Зарегистр. 23-07-2007 | Отправлено: 00:08 10-03-2013
tlotr

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
А можно пояснить в двух словах, в чём конкретно заключается суть данной опции?

Всего записей: 85 | Зарегистр. 16-09-2009 | Отправлено: 02:13 10-03-2013
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Спасибо большое.
Повторюсь про автоматическую установку границ зон выделения (красную рамочку). Тут она будет более чем кстати.
Сейчас автоматом выделилась прямоугольная зона. Она большая и захватывает ту часть страницы, которая должна быть белым фоном. Нужно вручную рисовать красную рамочку, потом ещё одну рамочку дабы исключить излишки из слоя картинок. Если бы рамка была уже установлена автоматом - достаточно было с зажатым Ctrl лишь потянуть за уголок дабы подправить зону.
 
Кстати при печати иногда (в старых изданиях) имеется вертикальная чёрточка между буквами - как при печати на печатной машинке. Нет ли у вас планов попытаться автоматизировать удаление этих дефектов печати?
 
tlotr
Это автоматическое выставление прямоугольной области для прямоугольных зон картинок.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 05:58 10-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerDergunov

Цитата:
Нет ли у вас планов попытаться автоматизировать удаление этих дефектов печати?  

Это к bolega. Scan Tailor ориентирован на более-менее типовые случаи сканобработки, а ScanKromsator - наоборот.

Цитата:
Тут она будет более чем кстати.  

Оконтуривать автоматическую прямоугольную Picture_Shape-зону ручной прямоугольной зоной автоматически? Точнее, оформлять автоматическую прямоугольную Picture_Shape-зону не в виде растрового объекта, а в виде прямоугольной пользовательской (векторной) зоны?
 
Добавлено:
А если на странице несколько зон, и все слишком разные? Как быть?
 
Добавлено:
Кстати, я ещё не пробовал - если сейчас на странице несколько зон, они все "оквадратятся" или нет. И что делать, если нужно лишь избранные зоны сделать квадратными, а другие оставить в покое.
 
Добавлено:
Может, Picture_Shape вообще надо было вынести в контекстное меню зоны?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 08:33 10-03-2013
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это автоматическое выставление прямоугольной области для прямоугольных зон картинок.

отлично! пора хватать

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 08:44 10-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сборка Scan Tailor Featured 2013.03.11
 
http://rghost.ru/44433165
 
Исправлен баг опции Picture_Shape, который в своё время исправил автор Scan Tailor Plus.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:58 11-03-2013
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Оконтуривать автоматическую прямоугольную Picture_Shape-зону ручной прямоугольной зоной автоматически?

Да.
Автоматическую прямоугольную Picture_Shape-зону, а также автоматическую не-прямоугольную зону.
Сейчас чтобы исключить лишний фрагмент из Picture_Shape-зоны приходится рисовать ещё две зоны, и вся польза сходит на нет. Была бы зона автоматически оконтурена - достаточно было бы потянуть за уголок.
 

Цитата:
А если на странице несколько зон, и все слишком разные? Как быть?

Имхо оконтуривать.
Будет много проще их редактировать/удалять/изменять размеры.
 

Цитата:
Может, Picture_Shape вообще надо было вынести в контекстное меню зоны?

Только не вынести, а добавить. Оставить как сейчас + возможность вызова из контекстного меню.
 
А вообще я уже писал - контекстное меню на зонах очень недружелюбно сделано. Зачем сделано лишнее диалоговое окно, до которого каждый раз приходится добираться, если все эти же опции можно вынести в контекстное меню?

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 06:00 12-03-2013
balik1982



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
ОГРОМНОЕ спасибо за то что откликнулись на мою просьбу и так быстро сделали свою версию программы полностью удовлетворяющей при обработке "повседневных" сканов книг!

Всего записей: 118 | Зарегистр. 23-02-2005 | Отправлено: 20:04 12-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
balik1982
Пожалуйста.
 
Я залил последнюю версию на Sourceforge:
 
https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/
 
Тут возникла одна терминологическая проблема: теперь у нас оказалось 2 различные сущности, именуемые понятием "прямоугольные зоны": те, что сделал я (векторные), и те, что пришли из Enhanced (растровые).
 
Поэтому я решил для определённости переименовать зоны из Enhanced из "прямоугольная" в (долго думал, как) "обведённая". Имеется в виду "обведённая прямоугольником" - но писать прямо так - "обведённая прямоугольником" - слишком длинно, а в русском языке нет подходящего простого термина. Можно было бы назвать их "ортогонированная", или "ортогонизированная" - но это слишком заумно. Я думал ещё насчёт "оквадраченная" - но это и слишком коряво, и не совсем точно - ведь "квадрат" - это не то же самое, что и "прямоугольник".
 
По-английски "обведённая" я написал как "surrounded".
 
Если бы в русском языке было слово "опрямоуголенная" - я бы лучше так назвал.
 
Добавлено:
По поводу последнего бага: я его исправил не так именно, как это сделал DikBSD в Plus. Хотя мне его исправление сильно помогло. Но почему-то его исправление мне ничего не дало - когда я его воспроизвёл у себя, пришлось его значительно дорабатывать.
 
Причина этого бага довольно интересна: я думаю, что автор Enhanced просто выбрал неоптимальное место в XML-файле задания, где хранить информацию о типе зоны. Так что мне пришлось для исправления бага находясь в одном XML-узле, лезть в другой, и оттуда считывать тип зоны - а это чёрт знает что.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:06 12-03-2013 | Исправлено: monday2000, 18:59 13-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В последней версии обнаружился баг: под Windows 7 на этапе вывода обработка зависает перед выводом текущего скана в главное окно - бесконечно крутится круговая анимация, а изображение так и не выводится. Под Windows XP - всё нормально.
 
Хотя, не исключено, что тут какие-то иные причины, нежели чем разные операционки, но больше всего похоже на эту причину.
 
Сборка 2013.03.09 не имеет этого бага. Видимо, я не совсем удачно придумал способ устранения бага, устраненного DikBSD: получается, один баг я убрал, но этим породил новый баг - и гораздо хуже.
 
Буду разбираться, в общем.
 
Если кому-то интересно - то посмотрите функцию "опрямоуголивания" зон:
 
http://scantailor.git.sourceforge.net/git/gitweb.cgi?p=scantailor/scantailor;a=blob;f=imageproc/BinaryImage.cpp;hb=refs/heads/pictureshape
 
строка 565:
 
void
BinaryImage::rectangularizeAreas(BWColor content_color)
 
Это - "ядро" опции Picture_Shape. Каждый желающий может по этой функции придумать аналогичную свою - тут особых знаний по программированию ИМХО не требуется, это чистая школьная геометрия. Предлагайте свои варианты. Если кто-то что-нибудь удачное придумает - могу вставить в Featured.
 
У Tulon'а отдельный самодельный класс для черно-белых изображений, и он пока что выглядит не слишком-то удобным. Я пока даже не понимаю, как он работает. К примеру, во FreeImage работа с ЧБ выглядела столь же просто, как и с другими глубинами цветов. А тут какие-то непонятные навороты, затуманивающие суть.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:36 15-03-2013 | Исправлено: monday2000, 19:56 18-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Разобрался я с этим rectangularizeAreas. Алгоритм оказался довольно изощрённым.
 
Он работает с чёрно-белой маской автозон. Суть примерно такая:
 
Алгоритм работает не с отдельными пикселями, а с "пятнами" - размером в 32-битное слово. Так и быстрей, и проще.
 
Обходит в бесконечном цикле всю маску - дойдя до конца переходит на начало и так бесконечно.
 
Внутри цикла: находит все пятна, внутри каждого из которых есть хотя бы один пиксель зоны. Строит глобальный список пятен.
 
Одновременно пробует увеличить каждое пятно в 1,5 раза - во все стороны - и смотрит, не пересекается ли увеличенное пятно с каким-нибудь соседним. Если пересекается - то 2 этих пятна сливаются в одно, и результат кладётся в глобальный список пятен, если нет - то идёт дальше.
 
При этом при каждом акте слияния устанавливается глобальный флаг "слияние произошло". Этот флаг служит условием выхода из бесконечного цикла: когда рано или поздно слияния перестанут происходить - то бесконечный цикл прервётся, и это будет окончанием работы алгоритма.  
 
Только защиты от зацикливания я не увидел - впрочем, вариант полного отсутствия слияний выглядит невероятным.
 
Ясно, что такой алгоритм правильно сохранит количество зон на скане: допустим, если было 2 авто-зоны - то он их не сольёт в одну.
 
Что мне в нём не очень нравится - так это то, что полученный контур всегда заметно больше, чем исходная зона. Это определяется как микронеровностями контура исходной зоны, так и самим характером алгоритма, где минимальная оперируемая единица - это не один пиксель, а 16 (приращение пятна).
 
Потом бывают ещё такие картинки, которые хотя и прямоугольные, но количество углов у них больше 4-х.
 
   
 
Такие картинки алгоритм выделяет простым прямоугольником - а в некоторых книгах их немало.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:25 18-03-2013 | Исправлено: monday2000, 20:34 18-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor Featured 2013.03.19  
 
http://rghost.ru/44614697
 
Добавлено:
Исправлен баг с зависанием программы. Оказалось, что разница в операционных системах ни при чём, а баг возникал просто из-за переноса программы на другой компьютер! Причина бага оказалась банальной: в конструкторе класса я забыл проинициализировать добавленные мною булевские переменные нулём - из-за этого они содержали мусор, который ошибочно принимался за true. А на моём компе, видно, там был не мусор - а нулевое значение, то ли сохранившееся в реестре после прежних экспериментов, то ли ещё почему-то. Поэтому у меня всё работало - а на другом компе - нет.
 
Также я добавил ещё один вид "формы картинок" - Test. Пока что он просто равен "Обведённая", но в дальнейшем я планирую как-то её модифицировать. "Обведённая" так и останется, а Test ещё долго, наверное, будет объектом моих экспериментов.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:10 19-03-2013 | Исправлено: monday2000, 22:46 19-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я залил последнюю исправленную версию на офсайт
 
https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:52 20-03-2013
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Спасибо за обновление. Нюансы и плюсы ещё не успел оценить.
Первое что бросается в глаза - на последнем шестом этапе колонка слева сделана резиновой по вертикали на всю высоту экрана. Наблюдается в нескольких последних версиях (например, в версии за 15.02 такого ещё не было). Это специально так сделано или баг? Большущие поля смотрятся не очень органично, но если это сделано специально для облегчения добавления информации в колонку - то вполне можно терпеть.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 00:41 21-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это специально так сделано или баг?

Чистая случайность. Но я не понял, о чём речь? Поясните.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:20 21-03-2013
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
я не понял, о чём речь? Поясните.

Вот так было (по крайней мере в версии от 15.02):
http://rghost.ru/44659940.view
Вот так стало в нескольких последних версиях:
http://rghost.ru/44659875.view

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 19:56 21-03-2013
tlotr

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот так было (по крайней мере в версии от 15.02):
Вот так стало в нескольких последних версиях:  

 
Кстати, а зачем это было сделано?

Всего записей: 85 | Зарегистр. 16-09-2009 | Отправлено: 20:24 21-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerDergunov
Понял. Постараюсь исправить.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:26 21-03-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor Featured 2013.03.22
 
http://rghost.ru/44688408
 
LonerDergunov
Вот так?
 
Добавлено:
tlotr

Цитата:
Кстати, а зачем это было сделано?

Я же добавил выпадающий список "Форма картинок" - вот у меня панель и сбилась тогда.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:06 22-03-2013
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru