Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно определить - настоящий ли это скан

на мой (неискушённый фотиками) взгляд с вероятностью 90% это хороший фотоснимок. Почему я так думаю? Потому что если бы это был прижим к планшетному стеклу, не было бы волн на строках, лист бы разгладился.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 16:37 16-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2 say:

Цитата:
 
Можно определить
 

Ну какбэ того-этого:

Код:
 
exiftool 20230510204635-020.jpg  
 
ExifTool Version Number         : 12.16
File Name                       : 20230510204635-020.jpg
Directory                       : .
File Size                       : 3.3 MiB
File Modification Date/Time     : 2023:08:16 17:02:46+03:00
File Access Date/Time           : 2023:08:16 17:03:08+03:00
File Inode Change Date/Time     : 2023:08:16 17:02:46+03:00
File Permissions                : rw-r--r--
File Type                       : JPEG
File Type Extension             : jpg
MIME Type                       : image/jpeg
JFIF Version                    : 1.02
Resolution Unit                 : inches
X Resolution                    : 600
Y Resolution                    : 600
Comment                         : Canon Inc
Image Width                     : 9921
Image Height                    : 7015
Encoding Process                : Baseline DCT, Huffman coding
Bits Per Sample                 : 8
Color Components                : 1
Image Size                      : 9921x7015
Megapixels                      : 69.6
 

Canon и по сканерам и по фотикам. Хз.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 17:09 16-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
на мой (неискушённый фотиками) взгляд с вероятностью 90% это хороший фотоснимок. Почему я так думаю? Потому что если бы это был прижим к планшетному стеклу, не было бы волн на строках, лист бы разгладился.

Благодарю, подтвердили мои мысли, хотя и хотелось бы ошибиться. Я как раз про эти волны в строках тоже подумал. Смущает пока только черные края по листу, как будто все же сканировали его с открытой крышкой.  
Исходник 600х600. В метаданных ничего не нашел кроме упоминания Canon Inc. Так то это тоже вероятность, что это фотик, но в тоже время может быть и сканер.  
 
zvezdochiot,
спасибо. Просто автора как-то спрашивать об этом неудобно. Так то я бы и не заморачивался. Скан то в принципе хорошего качества полагаю, если бы не эти волны.

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 17:10 16-08-2023 | Исправлено: Highlander_2, 17:12 16-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2

Цитата:
Подскажите еще, пожалуйста. Можно определить - настоящий ли это скан (т.е. исходник после оцифровки на обычном сканере), или все же фотоскан с хорошим качеством.

Если основываться на exifмета-данных исходного файла, который был загружен на фотохостинг - то это скан со сканера Canon формата A3.
Объясняю:
Image Size 9921x7015, dpi 600, т.е. физические размеры 42 х 29,7 см, что полностью соответствует формату А3.
Фотокамера на 70 (семьдесят) мегапикселей это конечно уже не редкость, но я сильно сомневаюсь, что этот jpg точного формата А3 размером 3 мегабайта сделан именно камерой.
Плюс черные поля по краям - типично как при сканерной обработке.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 18:33 16-08-2023 | Исправлено: jourmager, 09:02 17-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
тогда как образовались волны?

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 18:40 16-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
тогда как образовались волны?

Ну, например, книга прижималась к стеклу сканера с помощью крышки сканера.
Книга сравнительно толстая и имеет твердый переплет хороший корешок.
Поэтому прижатие было неравномерным - снизу страниц давило сильнее и строки более ровные, а также левая чётная страница, т.к. это начало книги (стр. №38) и тонкая половина, почти не придавливалась, потому что крышка сначала давила на корешок, потом на более толстую часть книги.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 19:02 16-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
всё равно есть вопросы к особенностям. Полоска, горизонтальная, посредине черной области снизу, она откуда? И почему не вдоль всего скана? А особочёрный блок слева-сверху? Скан при прижиме даже черной крышкой будет засвечен по более высокой ее части хотя бы с краю. Ведь не в затемненном же помещении сканируют. Тем более подсветка лампы всё равно зальет детали корпуса и крышку неравномерно. А тут прям ровненько по всей черной площади, но не строго черное (не RGB=000). Да и такой вот нюанс: когда на планшетнике толстую жесткую книгу кладут, все равно ее прижимают (двигают) к точке (0,0), а она как правило (я исключений не встречал) находится вблизи крышки. То есть более хороший прижим предполагается в данном случае вверху страниц, там, куда книгу приткнули. Опять всё не стыкуется. И поэтому тоже я склонился к фотоагрегату. Там и корпус более специализированный, и полоски объяснимы конструкцией (допустим, прижимы такие). Ну а что размер строго А3 при 600дпи, так рассчитать и обрезать софтом не составляет проблемы.
 
upd
В минус фото-версии я скажу только что уж больно хороший фотоснимок На засечки и мелкие буквы посмотрел - ну что за оптика такая прекрасная.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 03:45 17-08-2023 | Исправлено: TelecomUral, 04:23 17-08-2023
karl_karlsson



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Так, изображение обработано. У больших сканеров идет обработка на уровне железа, либо драйверов. Не все уровни этой обработки везде отключаются. Тем более если на выходе JPEG, еще монохромный.
 

Цитата:
Полоска, горизонтальная, посредине черной области снизу, она откуда? И почему не вдоль всего скана?

Она есть, но похоже там какой-то авто контраст применяется.
 
jourmager

Цитата:
Фотокамера на 70 (семьдесят) мегапикселей это конечно уже не редкость, но я сильно сомневаюсь, что этот jpg точного формата А3 размером 3 мегабайта сделан именно камерой.

Пропорции среднеформатных сенсоров бывают несколько другие, поэтому на самом деле будет нужно что-то свыше 80 МП. Ну и даже если 100 МП, даже у них сенсор небольшой - высота всего вокруг 40 мм. А вот у сканеров сенсор будет вокруг 70 мм.
 
Это в смысле, что люди не понимают, почему у них имеется 100500 МП камера, а вот фото книги все же как-то не так получается... Ну хороший A3 сканер это по сути очень большая среднеформатная камера 7 на 10. Хоть тут всего же одна линейка и моторчик ее двигает. У среднеформатных камер, даже за $100500, все идет вокруг 6 на 4,5, а то и ниже. Хотя понятно, у них не одна линейка и моторчик, но их там этих линеек вокруг 10 тысяч. Вот и почему все так дорого...
 
 
 

Всего записей: 2027 | Зарегистр. 14-03-2007 | Отправлено: 05:44 17-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, звучит все логично и многое объясняет. Благодарю за высказанное мнение. Мне тут еще просто подумалось, может скан делался каким-нибудь док-сканером, типа подобной штукой.
https://www.ixbt.com/img/r30/00/00/00/00/doko-bs16-big.jpg
 
TelecomUral,  

Цитата:
всё равно есть вопросы к особенностям. Полоска, горизонтальная, посредине черной области снизу, она откуда? И почему не вдоль всего скана? А особочёрный блок слева-сверху?  

Книга объемная, где-то около 700 стр. У меня просто есть сомнения, что ее можно так аккуратно разложить, чтобы  при этом страницы не закрывались. Ну и полагаю, сгибы у переплета были бы при фотосканировании не такими ровными, как на образце.
 

Цитата:
В минус фото-версии я скажу только что уж больно хороший фотоснимок На засечки и мелкие буквы посмотрел - ну что за оптика такая прекрасная.

Автор скана живет в поднебесной. Так что по поводу наличия столь прекрасной оптики может там все имеется
 
karl_karlsson,

Цитата:
Пропорции среднеформатных сенсоров бывают несколько другие, поэтому на самом деле будет нужно что-то свыше 80 МП. Ну и даже если 100 МП, даже у них сенсор небольшой - высота всего вокруг 40 мм. А вот у сканеров сенсор будет вокруг 70 мм.  

Спасибо за еще один довод в пользу оцифровки сканером. Все хорошо, если бы не эти плавающие строки, портят все впечатления от качества скана. Не знаю получится ли сабжем исправить их, включив в настройках распрямление строк, ни разу не пользовался этой опцией. Или лучше оставить как есть.
 
 

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 07:57 17-08-2023 | Исправлено: Highlander_2, 08:02 17-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2 say:

Цитата:
 
можно так аккуратно разложить, чтобы  при этом страницы не закрывались. Ну и полагаю, сгибы у переплета
 

Когда сканировал сам, не ленился и делал сканирование Г-образно. Потери времени не очень напрягли, при этом Г-образное сканирование гораздо удобнее и добротнее, чем разворотом.
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 08:33 17-08-2023 | Исправлено: zvezdochiot, 08:38 17-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И ещё скан версус фото.
1) Изображение разворота книги, выложенное на фотохостинг, имеет размер 9921х7015.
Ищем в гугле изображения именно этого конкретного размера и видим, что они все по сюжету скорее сканы, а не фото. Далее скачиваем оригиналы этих изображений на предмет метаданных. Всё почти одинаково. Кстати, EXIF отсутствует.
2) Скачиваем оригиналы фото с фотокамер Canon и смотрим у них метаданные.  
Кроме простых метаданных, также присутствует EXIF с характерными фотоданными: ISO, shutter speed, aperture, exposure.
3) Конечно можно допустить, что это изображение прогонялось через специальную программу, где размеры были изменены и подогнаны точно под А3 и размер в пикселях для сканера Кэнон, а также был удалён EXIF, но как-то слишком сложно. Я бы в такое поверил, если бы чёрные поля были обрезаны.
4) Крышка у сканеров А3 открывается иначе, чем у А4
5) Чтобы так сфотографировать книгу с такими плоскими страницами их надо или сверху прижать стеклом, которого не видно, или использовать скрепки, зажимы, пальцы рук, которых не видно.
6) Один из вариантов появления волн - в программе сканирования Кэнон где-то по умолчанию включена опция автоматического исправления кривизны или наклона строк.
7) "фотоагрегат"? Это что? Автоматический сканер типа Google Books? Совсем не похоже. Там изображения проходят полную автоматическую обработку и никаких чёрных полей, наклона строк и волн не будет.

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 09:00 17-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
"фотоагрегат"? Это что?

ну, некая конструкция из стола для книги, прижима стеклом спереди и штатива с фотиком. Плюс спецпрограмма.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 14:02 17-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
некая конструкция
 

"Подсыплю" тогда в "топку": Поделки народных умельцев из набора "палок".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 14:15 17-08-2023
karl_karlsson



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2

Цитата:
Мне тут еще просто подумалось, может скан делался каким-нибудь док-сканером, типа подобной штукой.
https://www.ixbt.com/img/r30/00/00/00/00/doko-bs16-big.jpg

Да нет, это в принципе невозможно. Такое качество дает только среднеформатная камера и выше. Там имеются еще большие форматы, но это уже совсем.
 
Типа вот такое, например:
book2net Ultra A2+ Book Scanner
Посмотрите на размер сенсора, там где линзы снимают.
Ну там еще видна и сама линза - Apo-Componon 4.0/45
 


Дальше, насчет того, что из себя представляет сканер был бы он камерой.
Ну такое выпускается для среднеформатных камер и называется оно Digital scan back.
Но они очень дорого стоят, хоть и дешевле обычных цифровых среднеформатных камер.
 
Поэтому, насчет самоделок были как минимум двух направлении:
(Ну все это где-то начало либгена 2008-2010 год.)
- фотографическая камера из сканера для фотографии неподвижных объектов
- камера из сканера специально для книг
 
Примеры то не мало, но самые выдающиеся, это:
 
Ryoji Tsukada / YAKU2010
https://www.flickr.com/photos/46505679@N04/
https://www.youtube.com/@ryojitsukada467/videos
https://yaku-yakuscam.hatenadiary.org
 
Dario Morelli / Project ESE
https://www.flickr.com/photos/projectese/
Также был youtube, но похоже он его удалил
https://frankenphotography.wordpress.com/tag/dario-morelli/
 
 
 
Вот например как оно работает:
https://www.youtube.com/watch?v=rZvMJ6ZkeRI
Что на выходе получается:
https://live.staticflickr.com/5704/21528488656_ccc9828138_o_d.jpg
 
Это 11700 х 8480, что дает где-то 100 МП.
Но тут нету никаких фильтров Байера.
Поэтому оно эквивалентно где-то 150 МП обычной камерой среднего формата.
 

Всего записей: 2027 | Зарегистр. 14-03-2007 | Отправлено: 19:33 17-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
"Подсыплю" тогда в "топку": Поделки народных умельцев из набора "палок".  

По моему это уж сильно заморочились с конструкцией
 
jourmager

Цитата:
6) Один из вариантов появления волн - в программе сканирования Кэнон где-то по умолчанию включена опция автоматического исправления кривизны или наклона строк.  

Вот, кстати, волны не везде встречаются:
https://i.postimg.cc/yVfv6nNS/20230427214622-016-1-L.png
Скан уже после обработки в FastStone Viewer, пришлось контраст на 80% вывернуть, чтобы убрать бледность.
 
karl_karlsson,

Цитата:
Да нет, это в принципе невозможно. Такое качество дает только среднеформатная камера и выше. Там имеются еще большие форматы, но это уже совсем.  

Я что-то уже сам заинтересовался этим вопросом, и пожалуй, все-таки попробую корректно узнать у автора об используемом средстве для сканирования. Мне он как-то называл давно аппарат, но вообще не на слуху, точно не Canon. Просто тогда сканы ровненькие выходили, а тут... Вроде качество отличное, только вот эти волны как-то портят немного общее впечатление.  
 
 

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 09:10 18-08-2023 | Исправлено: Highlander_2, 09:12 18-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробывал обработать сканы с включенной опцией "Выпрямление строк" (авто) в STU, результат до https://i.postimg.cc/g2YT6srZ/2023051024635-016-2-R.jpg и после https://i.postimg.cc/RSXV3pFc/20230510204635-016-2-R.jpg

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 17:28 18-08-2023 | Исправлено: Highlander_2, 17:29 18-08-2023
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Попробывал обработать сканы с включенной опцией "Выпрямление строк" (авто) в STU, результат до

Справа поправить и будет нормально! А метод по краям не пробовали, он тоже авто?

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 09:42 19-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем.
 
Александр по "просьбам нуждающихся" сделал релиз STU 0.2.14 с уже оглашенным здесь набором порогов (тем же, что в STA). "Владельцев" XP или 32битных осей милости просим "на огонёк".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 20:25 19-08-2023 | Исправлено: zvezdochiot, 20:25 19-08-2023
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
"Владельцев" XP или 32битных осей милости просим "на огонёк".

Интересное "кино". У меня хоть и не XP а WIN10 но поставил 32-битку, запихнул пример скана с кривыми строчками от Highlander_2 (первая ссылка выше) в итоге получилось на выходе следующее:
Otsu - чёрная полоса с правой стороны
Sauvola - чёрная полоса сверху
Wolf - чёрная полоса слева
Bradley - чёрная полоса справа и внизу
EdgePlus - чёрная полоса с права
BlurDiv - чёрная полоса внизу
EdgeDiv - чёрная полоса справа и вверху
В scantailor-advanced_1.0.18-qt5_win64_epdbta такой фигни нет во всех перечисленных.
Хотите, могу скрин прислать но там тупо тонкая полоса на самом краю страницы.

Всего записей: 176 | Зарегистр. 02-06-2018 | Отправлено: 22:22 19-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:

Цитата:
 
В STA такой фигни нет во всех перечисленных.  
 

Так в STA и деварп сломан к чортовой матери. Не обращал внимание на средние строки?
 
indifirent say:

Цитата:
 
Хотите, могу скрин прислать
 

Хочу. Только просто выложи где-нибудь и ссылку дай.
 
PS: Сравни деварп в STA и в STEX. Хотя в STU деварп такой же как в STA.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 22:28 19-08-2023 | Исправлено: zvezdochiot, 22:42 19-08-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru