Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 

Цитата:
вспомнил, что в ветке про ST хвалили самописную программку удаления этой грязи.
http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=2820#14
сам не юзал, ничего сказать не могу.

 
Пробую с этой программой проводить эксперименты. Вообще неплохо, даже на первый взгляд. Буду дальше варьировать параметры. Одна беда, урезает многие запятые и точки. Спрошу разработчика в той ветке можно ли тут что-то сделать.
 
Большое спасибо за «наводку»!

Всего записей: 31 | Зарегистр. 26-02-2014 | Отправлено: 20:28 06-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А ничего, что в результате этого выходные сканы будут иметь разные размеры?

Я же написал "на вкус".
 
 
оффтоп
 
Самый тяжёлый вариант это когда сквозь переплёт просочился клей, или просто переплёт не разгибается в 180 град (клееный, или жёсткий картон, или пробитый скрепками...). Тогда в пакете сканов возникает несколько страниц типа таких вот изогнутых у корешка:
 

 

 
Они а) неодинаковы по габаритам и б) по-разному косые.
 
Я не вижу проблемы выделить среди них максимальные габариты, сделать для обычных страниц с полями эти габариты стандартными, а те, что вышли чуть-чуть поменьше, оставить как есть (можно подкрасить клин, залить в окне VR). Если нормально сосканено, то я не припомню случая чтоб срез был более 50пкс. Обычно 6-20, а то и меньше. Ну будет гулять размер в меньшую сторону, ну и что?
А вот если растягивать, то будет необратимое ухудшение читаемости (резкости) и может быть несостыковка смежных картинок.  
Пример: когда slava_kry делал ДЭ1 том про советские республики, то там есть развороты с вклейками. Поля были выбраны неправильно, завышены, но при попытке растянуть вклейку под обрез книги начинала бить в глаза несуразность, несочетаемость сходных элементов слева и справа. И они уходили с линии параллельности. То есть художник делал именно разворот, он был гармоничен. Масштабирование правой половинки всё убивало. А если левой, то там шрифт становился крупнее, тоже не фонтан.
 
Мораль: если в книге есть листы под обрез, выставляйте габариты книги точно

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 07:02 07-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
allo04
положил ролик на ютуб.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:45 08-08-2019
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Спасибо, все очень информативно.
Всегда лучше один раз увидеть...

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 11:41 09-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Команда "Change threshold..." на закладке Binarization не вызывается для правой страницы разворота. Нет в меню по ПКМ.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 07:57 15-08-2019
igogo22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вылезла проблема с импортом картинок в pdf в Кромсатор.
https://we.tl/t-UVGlobM6Pb
Выдает ошибку "Возможно, файл открыт другим приложением или запаролен."
Проперти файла говорят что он не запаролен. Все другие программы его открывают без проблем.

Всего записей: 45 | Зарегистр. 05-12-2011 | Отправлено: 16:16 15-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вылезла проблема с импортом картинок

интересно, что эта страничка и тиффом lzw в СК не залазит. пока её немного не подрихтуешь, убрав часть черного (я удалял автомобили).

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 05:21 16-08-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Нет в меню по ПКМ.

Так и задумано.
Это для того, чтобы не подумали, что команду можно применять только к левым или только к правым половинкам разворота. Она применяется только целиком.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 07:56 16-08-2019
igogo22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вылезла проблема с импортом картинок в pdf в Кромсатор.
https://we.tl/t-UVGlobM6Pb


Цитата:
пока её немного не подрихтуешь, убрав часть черного

Ну для меня это не вариант. Надо книгу "как есть" сделать.
Первый раз не знаю что делать, или как обойти.

Всего записей: 45 | Зарегистр. 05-12-2011 | Отправлено: 13:09 19-08-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
igogo22
TelecomUral

Цитата:
пока её немного не подрихтуешь, убрав часть черного

Я загрузил пдф в Nitro_PDF_Professional_7.3.1.10, сохранил с другим именем, после чего СК импортировал скан из пдф.
Думаю, это же сработает в любом другом ПДФ-эдиторе.
 
P.S. Хватило даже просмотрщика Foxit Reader.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 14:15 19-08-2019 | Исправлено: shch_vg, 23:14 19-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
сохранил с другим именем

?!
я вообще в тифф страничку экспортнул... и нифига.
мне ещё показалось странным, что число цветов в тиффе - 257, а с виду страничка чб. Не люблю таких совпадений

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:38 20-08-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
 
?!  

Чтобы не затирать исходный пдф!
Можно сохранять и с тем же именем.

Цитата:
я вообще в тифф страничку экспортнул... и нифига.

Вот и ответ на вопрос: кривые свойства скана в пдф, только СК чувствителен к этому.
 
Вопрос: как Вам удалось извлечь кривой скан?
У меня после AcrobatPro и Nitro_PDF_Professional получаются тифы, которые СК нормально читает.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:14 20-08-2019 | Исправлено: shch_vg, 14:21 20-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вопрос: как Вам удалось извлечь кривой скан?  

PDFXсhange Viewer 2.0 build 42.6
Он у меня давно-давно установлен как базовый просмотрщик pdf дома. Но в этом году стал обнаруживать, что он частенько глючит. Я вообще-то pdf-файлами не пользуюсь, так что может программа просто древняя. Когда-то её хвалили.
Настройки экспорта страницы, насколько помню - tiff lzw 24bit 600 точек.
UPD
Вот
https://yadi.sk/d/QxhoI12kY_14Rg

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 15:13 20-08-2019 | Исправлено: TelecomUral, 16:54 20-08-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
PDFXсhange Viewer 2.0 build 42.6  
.......................................................
Настройки экспорта страницы, насколько помню - tiff lzw 24bit 600 точек.

Нашел у себя именно эту версию, но экспортируемый ею скан с Вашими параметрами СК принимает нормально.

 
Добавлено:

Цитата:
Вот  
https://yadi.sk/d/QxhoI12kY_14Rg

Выложенный Вами скан содержит 512 цветов и нормально загружается в СК.
Кстати, у меня получился абсолютно похожий импортированный файл.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 16:59 20-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Выложенный Вами скан содержит 512 цветов и нормально загружается в СК.

 

 
upd
 
Более того, тифф пришлось упаковать в rar, потому что его и яндекс-диск отказался загружать.
 

 
Не знаю что и думать... md5=5CE789C740B9AE50E9E7C705B44DFF41

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 17:48 20-08-2019 | Исправлено: TelecomUral, 03:49 21-08-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
А вот что показывает ирфанвью на Вашем файле к1.tif:
 
Разучился загружать на ради-кал
Сейчас выложу в другое место.
 
Вот

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 19:00 20-08-2019 | Исправлено: shch_vg, 19:10 20-08-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Вы не глядели этот проблемный pdf?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 07:48 01-09-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А чего там глядеть. Открывам его в блокноте как текстовый файл и в самом конце что мы видим? Тэг "startref". Такого тэга нет и никогда не было в стандарте pdf. Должен быть "startxref"! Буква "x" пропущена.  
Похоже, этот pdf создала какая-то глючная кустарная программа или скрипт. Отсутствие или повреждение Trailer-блока pdf-файла для большинства просмотрщиков не является фатальным. Дело в том, что pdf формат довольно избыточный, часть его блоков можно иногда восстановить проведя полный анализ всего файла. Но СК этим не занимается, у него другие задачи.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 10:58 01-09-2019 | Исправлено: bolega, 11:27 01-09-2019
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Тэг "startref".  

Отсутствие х одна из причин неимпортирования из пдф.
Добавление х в исходный кривой пдф оставляет его кривым.
А вот
Цитата:
Отсутствие или повреждение Trailer-блока pdf-файла для большинства просмотрщиков не является фатальным.
, по-видимому, является причиной кривизны, т.к. файлы пдф, полученные сохранением кривого пдф в любом пдф-эдиторе, увеличиваются  более, чем на 100 байт.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 14:50 01-09-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
по-видимому, является причиной кривизны, т.к. файлы пдф, полученные сохранением кривого пдф в любом пдф-эдиторе, увеличиваются  более, чем на 100 байт.

После обнаружения бага в startref я дальше не стал уже копать, возможно, там еще чего-нибудь не хватает. При сохранении редакторы заново генерируют trailer-блок, уже корректный.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 16:23 01-09-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru