Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
спасибо, логика понятна.  
 
Но зачем так усложнять. По-моему, можно сначала сработать с новыми файлами, разместив их в самом конце пакета сканов книги, а затем перенести их в нужное место. Я не представляю, как может появиться задачка с несколькими добавляемыми +resultЧ.bookmarks

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 14:51 26-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но зачем так усложнять.  

Опишите свою логику
Последовательность действий

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 15:25 26-04-2023 | Исправлено: bolega, 15:26 26-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Опишите свою логику
Последовательность действий

1. имеем финализированные страницы. Пропущен, условно, 2й и 7й файлы. Распознаем текст, делаем attach bookmarks.
2. добавляем пропущенные файлы в конец.
3. обрабатываем, финализируем, подаем готовые страницы в файнридер, парсером получаем result.bookmark.
4. переименовываем в +result.bookmarks
5. встаем в MV на первый добавленный файл, это будет маркер для СК. Вызываем ocr output files\All или current, главное, пусть СК считает что для файла с плюсиком первый номер это там, где текущий файл. (Или даже пусть автоматом считает, что добавлять после последнего со слоем. хотя это чревато для вклеек и обложек.)
6. распределяем страницы по нужным местам в книге, т.е. после 1го и после 6го.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 16:00 26-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вызываем ocr output files\All

Учтите, что такая команда приведет к полной замене ocr для всех файлов (если в out/ocr будут лежать предыдущие отдельные resultXXXXX.bookmarks). Если были изменения ocr-слоя, то они будут утеряны.

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 17:05 26-04-2023
Wobal

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте, bolega!
 
 
Я бы хотел предложить вам обновить справку для программы ScanKromsator или создать централизованный гайд по ее использованию. Я думаю, что это могло бы значительно улучшить пользовательский опыт и помочь пользователям быстрее и легче разобраться с функционалом программы, без необходимости искать информацию в разных ветках форума.
 
Я понимаю, что создание гайда может занять время и усилия, поэтому если у вас есть возможность рассмотреть мое предложение, я был бы очень благодарен. В любом случае, спасибо за вашу работу над этой программой.

Всего записей: 6 | Зарегистр. 20-04-2022 | Отправлено: 17:05 26-04-2023 | Исправлено: Wobal, 20:09 26-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
пусть СК считает что для файла с плюсиком первый номер это там, где текущий файл. (Или даже пусть автоматом считает, что добавлять после последнего со слоем. хотя это чревато для вклеек и обложек.)  

ну и чем это надуманное ограничение лучше моего, более универсального варианта?

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 17:06 26-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ну и чем это надуманное ограничение лучше моего, более универсального варианта?

тем, что простому юзеру не надо ломать голову над вашим сложным описанием как заставить СК принять дополнительный ocr. Совсем не надо. Для юзера эти добавленные файлы выглядят как независимое задание. Обработал он это допзадание, а потом теми "блинчиками на тарелочки" файлы из буфера обмена раскидал на нужные места. Минимум знаний, заморочек и условностей.

Цитата:
Учтите, что такая команда приведет к полной замене ocr для всех файлов

пусть СК учитывает наличие файла с плюсом. Есть файл - значит режим не "переобновить всё", а "дополнить с текущего".

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 20:55 26-04-2023 | Исправлено: TelecomUral, 21:09 26-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
В чем может быть причина?
Открываю в версии 6.8 черно-белый скан размером 252 КБ. Перехожу в режим Show source files, копирую сравнительно небольшую часть скана и получаю сообщение "Недостаточно памяти". То же наблюдается и в версии 5.94.
Ирфанвью без проблем копирует ту же область из того же скана.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 13:16 27-04-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
В чем может быть причина?
Открываю в версии 6.8 черно-белый скан размером 252 КБ. Перехожу в режим Show source files, копирую сравнительно небольшую часть скана и получаю сообщение "Недостаточно памяти". То же наблюдается и в версии 5.94.
Ирфанвью без проблем копирует ту же область из того же скана.

 
 
см "окончательное решение"  в шапке

Всего записей: 1076 | Зарегистр. 13-06-2013 | Отправлено: 13:54 27-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
 
А Вы прежде, чем писать свою реплику, не пытались на любом своем бинарнике в 600дпи размером 300кб проверить мою ситуацию? У меня не копируется уже зона порядка 3 на 3 см, причем даже пространство без какого-либо текста.
 
Разве из моего описания непонятно, что копируется только НЕБОЛЬШАЯ часть скана общей величиной 252 КБ? Не надо все доводить до абсурда. Мне не будут легче, если кто-нибудь радостно сообщит, что в моем задании такая выборка работает замечательно. Свою систему я все равно предоставить не могу, а оперативной памяти в ней выше крыши.
Я просто спросил у СОЗДАТЕЛЯ программы, что могло бы повлиять на такое поведение ее.
 
P.S. Подобные копирования в прошлом делал часто, но сталкивался с этим только на цветных сканах большого размера.
 
P.P.S. К вышесказанному могу лишь добавить, что выдается системная ошибка 1418
 
И еще доп.информация: Из шахматной диаграммы на странице позволяет копировать только поле не более 6 на 6 клеток. 7 на 7 уже дает сообщение о нехватке памяти (скан бинарный)
 
Тот же Ирфан легко копирует всю страницу целиком.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 16:18 27-04-2023 | Исправлено: shch_vg, 16:50 27-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
я не daa2013, но я попробовал

Цитата:
на любом своем бинарнике в 600дпи размером 300кб проверить мою ситуацию

 - и у меня всё прекрасно работает. В 6.8. Результирующий файл:
https://disk.yandex.ru/i/WWcTUBA0MCeuSQ
как только не изгалялся, никаких проблем.
 

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 17:00 27-04-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А мысль, что что-то не так с файлом вам в голову не приходила ?
Кривой тифф, ложное значение дпи или еще какого-то параметра внутри.
 
Попытка смасштабировать с 1 дпи до 600 дпи (когда реальные 600) легко вешает систему.  
Возможно параллельно переконвертация из flate  или еще чего-то такого идёт.  Альфа-канал кривой. Вы же исходник открываете, а не результирующий файл СК.
 
Кто больше всех ратовал за "окончательное решение" (я даже не помню, чтобы bolega такие слова использовал), а теперь, как бы это сформулировать. Игнорирует.  
 
Хочу заметить, что все так и постят без примеров, так как именно и ожидают ответа "что могло бы повлиять на такое поведение"  СК.    И вы в ту же степь.

Всего записей: 1076 | Зарегистр. 13-06-2013 | Отправлено: 19:12 27-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
продолжу после daa2013:
нехватка места на диске
файл с атрибутом readonly, равно как и параллельно открытый в другой проге
UPD
проблемы с правами на файлы  и папки. далее оффтоп: мы тут на работе третьи сутки "развлекаемся" с ACL (access control lists) на unix-серверах. с NFS и пятью железяками. Я там таких чудес навидался  и наслушался!

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 19:21 27-04-2023 | Исправлено: TelecomUral, 19:26 27-04-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заодно хочу заметить, что не так давно сталкивался с ситуацией, когда СК при импорте пдф генерировал не тиффы, а мульти-тиффы , т.е. вроде как кажется добавлял альфа канал, которого в изображениях изначально не было.  
 
Я не стал разбираться, может всё и нормально и правильно. (Не писал, так как сначала хотел убедиться, кажется мне это или нет. Но раз уж зашло такое обсуждение.)
Но тиффы в результате импорта вот этого файла мне показались подозрительными. (Повторюсь, может, они и нормальные на самом деле.)  PS:  смотрел их через ACDSee   и видел "лишний" слой.
 
https://disk.yandex.ru/i/TVeo9ErJssPmyg

Всего записей: 1076 | Зарегистр. 13-06-2013 | Отправлено: 19:21 27-04-2023 | Исправлено: daa2013, 19:25 27-04-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Перехожу в режим Show source files

Т.е. не копирует только в этом режиме?
Используете hotkey, КМ, или кнопку?
Выделение прямоугольное? А если полигональное, то такой же итог?
У вас вроде Windows 2003?
Исходник - TIF? Ирфан что показывает по формату файла, нет ли там альфа-слоя?

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 19:26 27-04-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проблемы с правами на файлы  и папки.  

 
Кстати да.
 
У меня после восстановления системы из бэкапа половина прог выдаёт странности.
Например, тот же АСDSee   не показывает картинки в ряде папок.  В частности, внутри  Program Files.
 
Так что как вариант, система не дает СК прав редактировать файлы в папке с исходниками.  
 
 
PS
хотя нет маленький же участок копируется.  Значит, что-то с разрешением ИМХО.

Всего записей: 1076 | Зарегистр. 13-06-2013 | Отправлено: 19:38 27-04-2023 | Исправлено: daa2013, 19:40 27-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Поскольку дело для меня становится все более мистическим, решил все-таки выложить саб-таск.
В архиве находятся три тифа: один - выложенный TelecomUral, второй (р_p0021.tif) был вытащен  из дежавю в СК в сером, третий (00021.tif - главный подозреваемый ) получен из второго в Ирфане при переводе в бинарик.
Первый файл приведен как пример того, что у него и у третьего одинаковые параметры, если не считать размеров и компрессии.
Итак: любые манипуляции по копированию после перехода по Alt+S на первых двух сканах никаких вопросов не вызывают.
Мистика с третьим.
Перехожу в режим По высоте и копирую всю страницу по Ctrl+C, СК проглатывает, но в меню по ПКМ не подсвечивается Paste. Приложенный к архиву гиф показывает нехватку памяти при выделении только одной диаграммы.
 
P.S. Тот же результат и в режиме просмотра, проверял только на прямоугольной области, уже три года использую комп с 10-кой и 6-ядерным процессором. Грешил, что м.б. это эффект 6 ядер, но тот же результат и на одном ядре.
 
P.P.S. Реальный глюк (а м.б. фича?) в 6.8.
Просматриваю сканы в главном окне в режиме Fit width (у меня это 25,79), предварительно зафиксировав это.
Сохраняю задание и закрываю CК.
При следующем входе в это задание скан в главном окне открывается при 100.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 15:41 28-04-2023 | Исправлено: shch_vg, 16:08 28-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
у меня ваш файл 00021 проблем с копированием в буфер и вставкой не вызывает.
 
Доведите уж тему до конца: сделайте в ирфане из проблемного скана новый с компрессией как у моего файлика. Потестируйте его. И станет понятнее причина.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 18:35 28-04-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Доведите уж тему до конца: сделайте в ирфане из проблемного скана новый с компрессией как у моего файлика.

А смысл, если у Вас нет проблем?
Похоже проблема в системе.
 
P.S. Вы умеете в Ирфане менять компрессию? Я не нашел.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 19:02 28-04-2023 | Исправлено: shch_vg, 19:18 28-04-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
shch_vg
Вы умеете в Ирфане менять компрессию? Я не нашел.

save as...  и появится опция, окошечко  tiff save options
 
Добавлено:

Цитата:
Похоже проблема в системе

похоже? а вам вообще ответ на ваш первоначальный вопрос - нужен?

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 05:42 29-04-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru