Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
а если экспортировать и разрезать, это не спасет?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 05:15 02-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 

Цитата:
Для тех, которых меньше, используйте "special" на закладке Page.

А там есть автоматические действия?
 
TelecomUral

Цитата:
а если экспортировать и разрезать, это не спасет?

 
А как это решает проблему разного физического разрешения?
 
Касательно пересканировать - идея неплохая, но таких книг, отсканированных давно в читабельном качестве, но с разными огрехами очень много. ИМХО - проще доводить до ума их, нежели искать и пересканировать оригиналы.

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 07:59 02-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как это решает проблему разного физического разрешения?

мне было непонятно, зачем вам одинаковое физическое разрешение, для чтения или печати, например. Ясно, что отмасштабировать листки, случайным образом перемешанные, автоматом затруднительно. Приведите их к одному "внешнему виду", потом уже применяйте какую-то автоматику, по числу пикселей сторон(ы) и т.п.
Ещё, кстати, большой вопрос, разное ли оно, физическое разрешение, в той книжке. Сомнительно мне (книжка не на компе сейчас, поэтому гадаю), что сканировщик (фотограф) делал то 600, то 300дпи, от листа к листу. В смысле, приводил к этим числам. Поэтому разрежьте и не парьтесь. Опираться всё равно не на что, кроме одинаковости ширины строк.
 
оффтоп
По "пересканировать" забираю предложение обратно Попытка сделать из г... конфетку. Ну-ну, мало вам попыток arnyc. Я думал, вам книжка нужна, а вы "лоск наводите". Заметание мусора под ковёр не мой метод.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 08:26 02-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Ещё, кстати, большой вопрос, разное ли оно, физическое разрешение, в той книжке.  

 
Иначе как объяснить почти одинаковость физического размера (в см) страницы и разворота при как бы равном разрешении?
 

Цитата:
Я думал, вам книжка нужна, а вы "лоск наводите"

 
1. Мне информация в книжке нужна (я её уже просмотрел)
2. Мне нужен индексируемый документ, желательно в одном размере (чтобы при перелистывании окно не прыгало - больше-меньше).
 
Насчёт автомата это конечно хорошо, но наверное тяжело. Поэтому может хотя бы кнопку - перемасштабировать до размера страницы.

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 09:04 02-01-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Послушайте, ну так же просто нельзя.
 
1. Вы заставляете лезть на полу-коммерческий сайт, запрещенный в России; регистрироваться на нем, используя обходные маневры и кучу допсофта; тратить баллы...  
Хотите помощи по файлу - выложите его на свободно доступный обменник.
 
2. Далее, видно же что страницы там были сфотканы. То есть вы некорректно описываете, что вы хотите. У вас есть куча фоток, расстояние фотик-сканер там гуляет по определению, развороты там или не развороты. То есть не разрешение ошибочное, а исходники у вас - фотографии.
 
Боюсь прогнозировать ответ болега, но мне кажется, что он принципиально не будет затачивать СК на работу с фотками, и ни одной связанной с этим фичи в СК добавлять.  
 
Техника же обработки фоток такая: обрезать все по границам текста, не наращивая поля. Выбрать страницу-образец. Сделать три комплекта ресайзинга (например, в XnView):  
- ширина образца (с сохранением пропорций)
- высота образца (с сохранением пропорций)
- ширина и высота образца.
Назначить всем одно разрешение.
Увеличить всем до единых размеров холст, одинаково нарастив поля. (Для разных комплектов с разных сторон тут будет разное нарощение).
 
Далее, взяв третий комплект за основу, так как у оригинала могли быть страницы с текстовым блоком разной ширины и высоты, заменить нестандартные страницы на страницы из первого и второго комплектов.
 
 
UPDATE
положил на я.диск, раз уж скачал:
https://yadi.sk/d/xIh0sDGQC0yBwA

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 10:53 02-01-2020 | Исправлено: daa2013, 11:26 02-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
https://www.twirpx.com/file/794339/  

Не успел год начаться, а уже тройная свин... трабла
1) "Доступ к информационному ресурсу ограничен на основании..."
2) Чтобы что-то оттуда скачать, нужна регистрация (у меня ее нет)
3) Даже после регистрации (насколько я знаю), нужно еще заработать право на скачку.
В общем, спасибо за простоту и удобство ...
 
Добавлено:
daa2013
Опередили.  
 
 
Добавлено:

Цитата:
Боюсь прогнозировать ответ болега, но мне кажется, что он принципиально не будет затачивать СК на работу с фотками

Можно придумать простое решение, но при одном условии: если все сканы одного физического размера. Если это не так, то все сложно.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 11:07 02-01-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно придумать простое решение, но при одном условии: если все сканы одного физического размера. Если это не так, то все сложно.
 

так как эти псевдо-фотки предварительно импортируются из джву, то можно было бы в джву-импорт встроить приведение к единому размеру холста. (единому размеру методом нарощения полей).
Если же это реальные фотки - то просто ничего с ними не делать перед засовыванием в СК, то вот и будет один размер. Конечно, еще может быть, что с двух фотиков фоткалось... Но тогда в два прогона делать.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 11:30 02-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
все сканы одного физического размера

в каком это смысле, "физического"? Число пикселей на сторону, то есть все фотки в размер или кратны матрице фотоаппарата?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 11:31 02-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Физического в смысле в мм, т.е. фоткали примерно одну и ту же область.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 11:46 02-01-2020
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
но при одном условии:

Там ещё условие нужно - неизменяемое расстояние между книгой и фотиком. И тут засада, т.к. снимаешь с рук и вот масштаб страниц ужо разный.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 11:50 02-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
1. Вы заставляете лезть на полу-коммерческий сайт, запрещенный в России

Прошу извинить.
 

Цитата:
2. Далее, видно же что страницы там были сфотканы. То есть вы некорректно описываете, что вы хотите.

 
В чём? Ну сфоткали где-то по страницам, где-то по разворотам - в итоге грубо говоря можно считать, что разрешение страницы в 2 раза больше чем у разворота.
 

Цитата:
Техника же обработки фоток такая: обрезать все по границам текста, не наращивая поля. Выбрать страницу-образец. Сделать три комплекта ресайзинга (например, в XnView):  
- ширина образца (с сохранением пропорций)
- высота образца (с сохранением пропорций)
- ширина и высота образца.
Назначить всем одно разрешение.
Увеличить всем до единых размеров холст, одинаково нарастив поля. (Для разных комплектов с разных сторон тут будет разное нарощение).
 
Далее, взяв третий комплект за основу, так как у оригинала могли быть страницы с текстовым блоком разной ширины и высоты, заменить нестандартные страницы на страницы из первого и второго комплектов.

 
Спасибо. Я немного по другому думал - обработал в SK. Там где из-за размера страница с разворота стала на 1/3 или на 1/4 страницы - кнопочка - растянуть на весь лист (с учётом полей).
 
bolega

Цитата:
В общем, спасибо за простоту и удобство ...

 
НУ archive.org позамороченней будет. Там ещё надо софт искать, чтобы скачать и потом чтобы снять DRM.
 

Цитата:
Число пикселей на сторону, то есть все фотки в размер или кратны матрице фотоаппарата?

Да. Но на одной фотке 1 страница, на другой 2. В итоге при приведении 1 страницы в половинный размер разрешение вырастет вдвое.

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 12:00 02-01-2020 | Исправлено: niccolo, 12:00 02-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
НУ archive.org позамороченней будет

Но если найти человека, у которого есть доступ к тамошним сканам, то все проще
 
 
Добавлено:
С фотками все можно упростить, если при фотографировании поступать так, как это делают криминологи: использовать фрагмент линейки. Т.е. класть на поле каждой страницы (разворота) что-то заведомо известного размера: пару см, цветную фигуру (круг, квадрат и т.д.). Затем, зная ее физич. размер и размер в пикселях, точно определить dpi.  
Можно также перед обработкой привести все фотки к одному физ. размеру, при условии, что в область скана попал периметр книги. Перед обработкой все страницы выровнять, затем обрезать сверху и снизу по границе книги (она должна попасть в скан). С боков не пойдет, т.к. ширина из-за переплета варьируется. Дальше дело техники

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 12:07 02-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
daa2013
То есть вы некорректно описываете, что вы хотите.


Цитата:
niccolo
В чём?

Лично я понял вашу задачу так: "а можно ли в СК рассчитать дпи по опознанному полезному контенту?" Никаких "грубо говоря" в исходном тексте нет.
 
Upd
bolega
А возможно, для таких вот "книг" и имеет смысл предусмотреть кнопочку/командочку в Special по ПКМ на DPI "если страница имеет разрезку (Split взведён), измени на DPI вдвое ниже. Для всего выбранного". В виде допгалочки внутри диалога-указания, к каким страницам применять.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:27 02-01-2020 | Исправлено: TelecomUral, 12:39 02-01-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А возможно, для таких вот "книг" и имеет смысл предусмотреть кнопочку/командочку в Special по ПКМ на DPI "если страница имеет разрезку (Split взведён), измени на DPI вдвое ниже. Для всего выбранного".  

Так это уже там есть!
Если пометить, допустим, все двойные, то, зайдя в Special на странице Page любого двойного скана, выставляем галку в опции DPI и при нажатом alt выбираем значение Half smaller для всех выбранных и все!

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 12:56 02-01-2020 | Исправлено: shch_vg, 13:07 02-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Лично я понял вашу задачу так: "а можно ли в СК рассчитать дпи по опознанному полезному контенту?"

 
Вы неправильно поняли. Моя задача  
 
получить из мусора с разным размером и разрешением что-то более менее однородное и одного размера....
 
Разумеется - самое правильное решение - нормально пересканировать книгу.
 
bolega

Цитата:
С фотками все можно упростить, если при фотографировании поступать так, как это делают криминологи:

 
Можно упростить, можно пересканировать......
Пока речь идёт о том, чтобы как-то облегчить работу с мусором - в идеале, если не на автомате - то хотя бы в один клик типа растянуть на лист (а не ручными художествами в граф. редакторах)....

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 12:57 02-01-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
shch_vg
Так это уже там есть!

Точно! Есть же классная команда "Special..." в главном меню Select group. Редко пользуюсь. А вот про Half smaller я не знал.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 13:04 02-01-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Ну, это Вы немного другое смотрите.
Я имел в виду окно "Exclusive page options", открывающееся по щелчку на "special" на любой закладке page. В Вашем варианте я не нашел способа реализовать обсуждаемую проблему.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:22 02-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Можно упростить, можно пересканировать......  Пока речь идёт о том, чтобы как-то облегчить работу с мусором

Вы предлагаете мне все бросить и заняться созданием костыля для вашей сиюминутной задачи? При том, что даже не удосужились выложить свой "мусор" для понимания...
Кстати, растягивать b/w изображение - гиблое дело. Нужно работать с исходником, а это требует еще придумывания алгоритма. Но на это у меня нет к сожалению времени. А костыли я давно зарекся делать.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 13:50 02-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 

Цитата:
Вы предлагаете мне все бросить и заняться созданием костыля для вашей сиюминутной задачи?

 
1. Я спрашивал, есть ли простые пути решения, о которых я возможно не знаю.
2. Поскольку я вижу, что программа развивается, я предложил один из вариантов решения. Использовать его или нет, решать вам.
 

Цитата:
Кстати, растягивать b/w изображение - гиблое дело. Нужно работать с исходником, а это требует еще придумывания алгоритма. Но на это у меня нет к сожалению времени. А костыли я давно зарекся делать.

 
Можно не растягивать. Можно изменить разрешение готового файла, так чтобы он визуально стал в один размер с другими (тогда наверное и размер полей придётся пересчитывать)...
 
Минусом данного решения является то, что FR часто делает очень нестандартные ошибки на нестандартных разрешениях. Хотя, не исключаю, что в последних версиях, благодаря поддержке распознавания фото с телефонов, с этим стало лучше.

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 14:02 02-01-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Я спрашивал, есть ли простые пути решения, о которых я возможно не знаю

нет

Цитата:
Можно не растягивать. Можно изменить разрешение готового файла

daa2013 выложил ваш пример. я смотрю его в windjvu в режиме fit page, выглядят страницы практически одинаково, это не то же самое?  

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 14:08 02-01-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru