Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Без подсветки. Но вопрос в точку.
 
Выделение, выделение было сделано в режиме подсветки !
 
Запускаю СК с нуля, выключаю подсветку, выделяю-поворачиваю: улётов нет.
 
Запускаю СК с нуля (подсветка в сохраненном задании горит), выделяю, только потом выключаю подсветку, поворачиваю  -  начинаются улёты.
 
 
Важно , что хотя бы ситуация воспроизводится, а то сколько-то там бет назад, они совершенно неожиданно для меня начинались. Но, может, тут как раз проверки мышки, о которых, писал болега, сказались и часть причин в 6.6. уже заблокирована.
 
Добавлено:
Пользуясь случаем, хочу напомнить о фиче, которую уже неоднократно просил.
Делать разборку джву по слоям  задний/передний с генерацией пустышек на месте тех слоёв, которые отсутствуют  (для фото-страниц - пустой слой маски; для ч/б или раскрашенных масок  - пустой задник).  
Дело в том, что утилиты джву при разборке  нарушают нумерацию страниц (пустышку не генерируют, а следующую страницу нумеруют предыдущим номером), и сгенерировать пустышки руками и вставить их с правильной нумерацией (и в комплект задников, и в комплект передников, в каждом из которых свои собственные смещения) для какой-нибудь толстой энциклопедии в тыщу с лишним страниц становится очень хлопотным занятием.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 09:19 09-11-2020 | Исправлено: daa2013, 09:36 09-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Все равно у меня не воспроизводится
Давайте уточним, как поворачиваете: по команде КМ, хоткею (Ctrl-R?) или по кнопке в панели. Как завершается поворот: paste или paste and merge.
Включены ли опции RV Options > Editor > Auto merge pasted image и Auto merge non-merged image. Там же опция Paste point location чему равна?
Windows 7/10 ?
 

Цитата:
Пользуясь случаем, хочу напомнить о фиче, которую уже неоднократно просил.  

Я знаю. Но эта фича пожалуй одна из самых сложных. Поэтому я иногда я ее обдумываю, но решения пока нет. Просто импортировать задний слой одной зоной на всю страницу мало толку. Чего потом с этим делать?? Там и картинки будут, и текст раскрашенный. В идеале из слоя надо вычленить цветной текст (тут еще тоже надо подумать, делать ли одной зоной или разбивать на отдельные зоны по какому-нибудь признаку), картинки тоже желательно разбить на отдельные зоны, если это возможно; по какому критерию я пока не знаю.
Малоцветка - это тоже самое что цветной текст, но области цветов более хаотично распределены, надо как-то определить, что с ними делать: как раскрашенные b/w зоны, либо как малоцветку.
Т.е. это намного сложнее, чем импорт pdf, в котором уже все как правило разбито.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 09:47 09-11-2020 | Исправлено: bolega, 09:51 09-11-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне было бы достаточно двух папок, где в одной сложены задники, в другой - передники без какого-либо создания искусственных зон. Лишь бы была правильная нумерация и сгенерированы пустышки. Потому что я отдельно обрабатываю задники, отдельно передники.  
 
А вообще мне для реставрации нужны три комплекта (еще и совмещенный).
Я открываю два кромсатора (допустим маски и совмещенные), и занимаюсь чисткой масок + вклеиванием в маску того, что неуместно ушло в фон.
Потом точно также при помощи двух СК делаю комплект правильных задников.  Потом склеиваю все в FSD.
То есть вместо зон, тут в режиме компаре имеет смысл показывать совмещенный джву слева, а справа какой-то слой: маски/задники. Ну и дать возможность копипасты слева направо.  Можно справа переключать демонстрируемый слой: задник/передник.  
При генерации же джву задники можно считать зонами на всю страницу.
Upd: я назвал это реставрацией, но я так часто и свои собственные сканы обрабатываю, где для разделения текст/картинки использую джву-сегментацию (делаю джву без какого-либо субсэмплинга задника  1 к одному), а потом ошибки сегментера правлю руками. Использую эту технику, когда текст поверх картинок лежит.  
 
 
При импорте же чужих книг еще может быть проблема, что часть страниц может иметь нестандартный дпи, или что разрешение задника у части страниц не такое (часть субсемплили на 2, часть на 3, часть на 4). Но я бы при импорте всё апсемплил до максимального разрешения.  
 
 

Цитата:
Давайте уточним,  

Win 7
Ctrl+R   (кстати, при повороте через КМ, вроде, улетов нет)
завершаю paste
включен   Auto merge pasted image
выключен  Auto merge non-merged image
Paste point location = top left

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 10:43 09-11-2020 | Исправлено: daa2013, 22:41 09-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
утилиты джву при разборке  нарушают нумерацию страниц (пустышку не генерируют, а следующую страницу нумеруют предыдущим номером),  

А какими командами и утилитами вы получаете слои для случая картинок, и для случая раскрасок.
А то я не пойму насчет пустышек.  
 
Добавлено:

Цитата:
завершаю paste  

А merge как делаете, щелчком или командой КМ?
И еще: режим one-page Или two-page

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 10:57 09-11-2020 | Исправлено: bolega, 11:00 09-11-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А какими командами и утилитами вы получаете слои для случая картинок,  

Разборку делаю при помощи djvudecode . У меня для слоёв два батника:
 
для задников:
djvudecode.exe --output-format=tif --layer=background input.djvu _output  
 
для передников:
djvudecode.exe --output-format=tif --layer=foreground  input.djvu _output  
 
(ну и ещё третий для совмещенных страниц).
 
А других способов разборки я просто не знаю.
 
(Я любой файл для разборки именую input.djvu , а складывается стандартно в папку _output )
 

Цитата:
А merge как делаете, щелчком или командой КМ?
И еще: режим one-page Или two-page

щелчком
режим - one page
 
Добавлено:

Цитата:
А то я не пойму насчет пустышек.  

Я не могу сейчас это перепроверить, но мне, кажется, что при попытке разборки  
этого файла крестика, как раз, весь набор проблем и вылез:
 
http://publ.lib.ru/ARCHIVES/S/Sovetskaya_Enciklopediya/Bol'shaya_sovetskaya_enciklopediya._Izd.2._T.12.(1952).[djv-1200].zip
 
"Проблема пустышек" заключается в том, что если джву такой
1 - трехслойная страница
2 - однослойная
3 - трехслойная
 
то при разборке мы получим такую нумерацию
1 - страница 1
2 - страница 3  
 
если слоя нет, то соответствующее изображение отсутствует и (что страшно) его номер присвоен следующей странице.
В результате получаем рассинхрон задников и передников

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 11:16 09-11-2020 | Исправлено: daa2013, 11:36 09-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Просто импортировать задний слой одной зоной на всю страницу мало толку. Чего потом с этим делать?? Там и картинки будут, и текст раскрашенный.

Ногами не пинайте за идею.
Навскидку напрашивается особый визард импорта. С парой режимов:
- дежавю создан с правильным разбиением на текст, малоцветный текст, и фотокартинки. Тут всё должно быть просто, только ограничения на количество и мин.размер зон надо поставить. А то каждая цветная мусоринка зону станет создавать.
- дежавю требует вручную указания разбиения каждого (или всех) задников страниц на зоны "малоцвет", "фото", "на основную страницу". Некий аналог вызова графредактора из VR, когда СК на время вызова замораживается. Так и здесь - запускается второй СК, которому скармливается задник/задники. Расстановка зон будет служить исходными правилами при импорте в главном задании. Ну или вообще - предусмотреть в СК команду "экспорт зон", и визарду импорта указывать этот экспортнутый файлик-список. Его тогда и из других программ можно пристегивать, если о формате договориться.
 
А авторазбиение - "не наш метод".
 
По улёту: bolega, может для вас ролик снять? У меня улёт произошёл моментально.  
 
UPD
хорошая мысля приходит опосля.
Грузить дежавю "как есть сейчас". Расставить зоны. Экспортнуть их в txt-файлик. Затем открыть новый СК и в импорте указать "для задника использовать разбиение на зоны из файла TXT".

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:47 09-11-2020 | Исправлено: TelecomUral, 12:59 09-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
По улёту: bolega, может для вас ролик снять? У меня улёт произошёл моментально.  

Не надо, что толку если я не могу воспроизвести.  
Лучше выдам версию с логированием, тогда будет проще разбираться в причине.
 
Добавлено:

Цитата:
Расставить зоны. Экспортнуть их в txt-файлик. Затем открыть новый СК и в импорте указать "для задника использовать разбиение на зоны из файла TXT".

Да лишнее это все. если уж есть расставленные зоны, зачем опять импорт? Просто запустить на обработку и получить разделение.
 
А то, что просит daa2013, т.е. не терять пустышки да еще в две папки раскидывать (ужас!), это больше подходит для меню service, но никак не для импорта. Поймите, цель любого импорта в СК создать задание в идеологии СК (т.е. подложка+зоны), а не просто чего то там вытащить и раскидать.  

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 13:56 09-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
зачем опять импорт?

Как зачем. Чтоб не терять исходное расслоение, сделанное кодером дежавю.
Иногда, подтверждаю, именно так хочется сработать, с задниками отдельно от переднего слоя. Прямо напрашивается.
 
 
Добавлено:

Цитата:
Не надо, что толку если я не могу воспроизвести.

ОК.  
А то например я иначе, чем daa2013, работал, когда улёт получал.
 

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:18 09-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
А поправка к порогу бинаризации auto должна быть одна и та же на всех страницах или для каждой страницы должна быть своей?

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:08 09-11-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А то, что просит daa2013, т.е. не терять пустышки да еще в две папки раскидывать (ужас!), это больше подходит для меню service, но никак не для импорта.

Хоть тушкой, хоть чучелом, но дайте возможность получить полный комплект передников и полный комплект задников (проапсемпленных до размера передников) без пропусков и потери нумерации страниц.
 

Цитата:
 Поймите, цель любого импорта в СК создать задание в идеологии СК (т.е. подложка+зоны), а не просто чего то там вытащить и раскидать.  

Сделайте в визарде импорта джву галочку "DAA-режим" DEE-режим.
И если она включена, то совмещенные изображения сложите в папку входных.  
У вас же это  сейчас сделано и здорово сделано, если страница белая, то вместо пропуска как раз и генерируется пустышка. Джвудекоде сам так не делает.
Одновременно сделайте папку out , и туда сложите маски, как если бы они были результатами работы СК (и если маски нет, то генерируйте пустышку) , а задники (там, где они есть), проапсемплите до передников и сделайте зонами величиной на всю страницу. Если задника нет, то можно вместо него тут пустышку и не генерировать. Потом СК входит в режим и RV и можно всё редактировать.
Только хорошо бы, чтобы номера этих зон совпадали с номерами страниц, чтобы руками можно было отсортировать, если что.
(А как это сделать без пустышек, пустые зоны генерировать ? Если никак, тогда будет нужен еще и service.)
 
Да, я понимаю проблему, маска может быть ч/б, раскрашенной через картинку, и раскрашенной как малоцветка. Выкладывать маску как есть:  ч/б, полноцветный тифф, индексированный тиф соответственно. Пользователь дальше сам. Делает оут-задание и занимается постеризацией, если хочет.
 
Upd: и поскольку в джву текст поверх картинок, а не наоборот, то, наверное, в картинках дырки надо прорезать под передник - сгенерировать маску прозрачности.
Upd2: Но тогда уж точно разборка отдельной командой в сервисе будет необходима  
 
 

Цитата:
А поправка к порогу бинаризации auto должна быть одна и та же на всех страницах или для каждой страницы должна быть своей?

 
Сейчас я хотел сделать авто + 10.  
Но ранее, как описывал, в другом проекте я накладывал условие: если расчетный авто менее 170 или 170, то одна прибавка, если более 170, то другая.  
Получается, что у каждой своя, в зависимости от того, что посчитает простое авто.  
Т.е. хорошо бы дать доступ к меню условий на прибавки, но до самого расчета.
Ну а СК когда считает, то знает, если авто = X, то делаю Y.  (Применяемая авто, это некая функция от расчетного авто, в зависимости от заданных пользователем условий.)

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 21:21 09-11-2020 | Исправлено: daa2013, 05:33 10-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
daa2013
Не парьтесь с разделением djvu на слои. В свежем djvulibre (номер на 27 кончается) в опциях ddjvu появилась -eachpage. Она решает ваш вопрос с пустышками.
Команда такого вот вида:
>"L:\Program Files\DjVuZone\DjVuLibre27\ddjvu.exe" -format=tiff -mode=foreground -verbose -page=274-281 -eachpage primer_fajla\c.djvu _output\j%03d.tiff
для передника и -mode=background для задника. Я проверял на файле Колтуна Мир физики из Новых поступлений publ.lib Всё работает.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 09:16 10-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Получается, что у каждой своя, в зависимости от того, что посчитает простое авто.  

Надеюсь, хоть условие будет одно для всех файлов?

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 13:37 10-11-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как я работаю, то да, одно.  
А там, кто его знает, как другие юзеры захотят работать.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 13:47 10-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А вопрос по разделению djvu как я понимаю больше не актуален?

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 14:28 10-11-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я эту новую утилиту пока не пробовал. Потом напишу.
 
Но даже если окажется, что она работает как надо, всё равно считаю импорт джву важной штукой.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 15:02 10-11-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Народ - в отсутствии автосплита при импорте или драфте, есть ли более оптимальный путь обработки разворотов с неодинаковым перекосом страниц и разным уровнем текста на страницах (так, что не получается одним резаком на двух страницах лишнее обрезать) кроме двухэтапной обработки - сначала просто сплит, а потом всё остальное?

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 15:13 10-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
дублируйте скан в списке файлов. один дубль одна половина, второй - вторая. По ПКМ на файле есть команда Clone Create a copy.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 15:18 10-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
И если наклонить резак не помогает??

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 15:51 10-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
для разворота со сканом конца главы, и горизонтальный нижний резак. Он кучу мусора может захватить снизу правой половины, где текста уже нет. Я когда-то прям бесился от невозможности "изогнуть" резак под полезный текст.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 15:55 10-11-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и горизонтальный нижний резак

Так наклоните его. Никогда не встречал скана, в котором бы наклонный резак не мог бы что-то отрезать. За исключением случая, когда на одной половине картинка на всю площадь или впритык к краю.
Если допустить, что все-таки что-то останется, то после обработки можно подправить полезные блоки перед финализацией. Пересчитать размер если понадобится.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 16:14 10-11-2020 | Исправлено: bolega, 16:15 10-11-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru