Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Оффтоп

Цитата:
никто не будет заморачиваться подпиливанием софта по устаревшую семерку

Ну да, конечно..., люди под ХР модифицируют драйвера, чтобы устанавливать на современное железо, https://hd-24.ru/windows/windows-xp-mod-2021-ustanovka-sistemy-na-sovremennyj-pk/ а про семёрку вообще молчу. И подпиливать софт не нужно, т.к. есть программы непосредственно для этих ОС!  

Всего записей: 137 | Зарегистр. 19-12-2007 | Отправлено: 15:03 31-08-2021 | Исправлено: qwaxym, 15:04 31-08-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поиск по тексту может сократить время нахождения нужного абзаца в десяток раз.Поиск по тексту может сократить время нахождения нужного абзаца в десяток раз.
Самый такой банальный пример - крупное художественное произведение, типа "Война и мир", где вам надо найти места упоминания Наполеона

Кто-то читает книги полностью..., кто-то только про Наполеона. Мой вариант для тех пареньков (а, может, и девиц), которые последовательно читают литературу, от начала до конца. Понятно тогда, почему в кхм-вской Энциклопедии все темы от балды (сначала рассказана работа в программе, а потом показаны функции меню, это потому что главное "Поиск", выцепить что-то, и не важно, как располагаются главы: то ли по уму, то ли через задницу. В инструкции к любому прибору сначала указывают назначение кнопок, их функцию, как управлять, а уж потом разговор идет по непосредственной работе. В моем варианте я поставлю последовательность по уму (пока она тоже сделана, как в оригинале - через задницу).

Цитата:
А зачем? Она уже есть в пдф с окр всего 42Мб.

Когда я спрашивал, есть ли Хрестоматия в пдф, все молчали, как партизаны, а тут она внезапно появилась откуда-то. Ну и где она? Ссылки в студию! Надобно посмотреть, а то, может, ерунда какая: ни текста не разобрать, ни картинок, в эти 42 Мб впёхнутые. У меня высшего качества: я никогда ничего не урезаю. Зачем??? Ну если вы книги для чтения по смартфону делаете, там их и храните, тогда базара нет, а я книги исключительно на компьютере храню и читаю.
 
 
 

Всего записей: 684 | Зарегистр. 23-05-2021 | Отправлено: 16:17 31-08-2021 | Исправлено: kamenkapenza, 16:19 31-08-2021
trion1

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
Цитата:
Когда я спрашивал, есть ли Хрестоматия в пдф, все молчали, как партизаны, а тут она внезапно появилась откуда-то. Ну и где она? Ссылки в студию! Надобно посмотреть, а то, может, ерунда какая: ни текста не разобрать, ни картинок, в эти 42 Мб впёхнутые. У меня высшего качества: я никогда ничего не урезаю. Зачем??? Ну если вы книги для чтения по смартфону делаете, там их и храните, тогда базара нет, а я книги исключительно на компьютере храню и читаю.
В теме надо быть :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1380#8

Всего записей: 2038 | Зарегистр. 15-03-2006 | Отправлено: 16:51 31-08-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
Мой вариант для тех пареньков (а, может, и девиц), которые последовательно читают литературу, от начала до конца.

Вы в своем полемическом запале не доходите до маразма. Научитесь отличать справочную литературу от художественной. В справочной (и ИМХО только в ней) распознавание обязательно, т.к. никому не придет в голову при поиске ответа на конкретный вопрос читать все с начала.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 17:20 31-08-2021 | Исправлено: shch_vg, 17:23 31-08-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В теме надо быть  :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1380#8

 
А вы сами то видели, что там за ерунда? Вот здеся (по вашей ссылке) https://disk.yandex.ru/d/Gp-RQtMgM1dl2Q  В формате rtf текст и рисунки обрезаны по правому краю, то есть остаётся догадываться, что там написано и нарисовано. В формате pdf маненько получше, но такая же беда: обрезка текста и рисунков. Если не верите, посмотрите стр. 73. Ещё эта ваша хваленая Энциклопедия в 40 Мб изначально открывается в треть экрана. В моей Энциклопедии (извиняюсь, не моя , а в моём варианте pdf) страницы открываются на весь экран (это мой стиль работы создания pdf - pdf на весь экран изначально, и никакая страница не обрезана.  
Скажу вам по секрету, что просто так сконвертировать эту Энциклопедию из chm в другой формат без искажений не получится. Поэтому я пошел другим путём и ничего не конвертировал.
 

Цитата:
В справочной (и ИМХО только в ней) распознавание обязательно, т.к. никому не придет в голову при поиске ответа на конкретный вопрос читать все с начала.

Если именно для вас это обязательно, то можете в моей pdf-версии ввести поиск по названию терминов, я не против. Если у вас это получится, я буду очень рад.  
 
 Если кому понадобится нормальный pdf-вариант Энциклопедии, письните мне на почту, дам ссылку.
 
 
 
 
Добавлено:
Может, кто знает, как через Кромсатор создать pdf-книгу? В Энциклопедии чего-то я не нашел, видео тоже не обнаружил на этот счет. Опять тайна за семью печатями. Можно конечно продолжать делать,как я делаю: через Мергезон, а потом из папки аут вставлять в Акробат. Вроде бы,через какое то Какаду делают.

Всего записей: 684 | Зарегистр. 23-05-2021 | Отправлено: 21:36 31-08-2021 | Исправлено: kamenkapenza, 02:28 01-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В Энциклопедии чего-то я не нашел

а вы её читайте сплошняком. там есть
 
Добавлено:
shch_vg
признаю вашу правоту про игнор. Это ж он сначала удаляет ocr (в смысле - собственно текст), а потом я должен быть "поисковой функцией"  по картинкам.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 04:17 01-09-2021 | Исправлено: TelecomUral, 04:58 01-09-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а вы её читайте сплошняком. там есть  

А как же поиск? Вы же тут все говорите, что "Поиск" - неотъемлемая часть этой Энциклопедии. В поиске не находит "Создание pdf" Если "сплошняком", то моя pdf-Энциклопедия лучше, чем допотопная chm. Слишком спесивым паренькам рекомендую попробовать конвертировать chm в pdf и показать результат, ну и посмотрим мастерство, сравним наше и ваше. Много слов, а дел никаких. Про ту ущербную Энциклопедию, которая 40 Мб просьба не упоминать в виду её дефектности (какие именно дефекты, я указывал выше, можете проверить)

Всего записей: 684 | Зарегистр. 23-05-2021 | Отправлено: 09:51 01-09-2021 | Исправлено: kamenkapenza, 09:58 01-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 

Цитата:
В поиске не находит "Создание pdf"

Искать тоже надо с умом. Вы ещё "усваяемость pdf" там поищите, систематизатор.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 11:10 01-09-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
усваяемость

Я её ищу у Данильца с Моисеенко в 3-х-4-х килограммах
   

Цитата:
shch_vg
признаю вашу правоту про игнор

Это вы зря мне пишете, отвечаете, а то "свои" переведут в когорту балбесов и перестанут с вами общаться, имейте в виду. Видите: все сидят и помалкивают, как бы им лиса не говорила: "Петушок! Петушок! Золотой гребешок. Выгляни в окошко, дам тебе горошка.

Всего записей: 684 | Зарегистр. 23-05-2021 | Отправлено: 12:49 01-09-2021 | Исправлено: kamenkapenza, 12:55 01-09-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
Про ту ущербную Энциклопедию, которая 40 Мб просьба не упоминать в виду её дефектности

Я смотрю вашего ума хватает только на производство глупых шуток. В "ущербной Энциклопедии" набрал в поиске pdf, и через минуту нашел в ней места, относящиеся к получению пдф в СК.
Зря вы занялись обработкой, гораздо больше бы пользы принесли, например, в лесном хозяйстве, да и для здоровья это полезней. Если ваша мысль созрела для ответа на это сообщение, то милости прошу в Личный Ящик (заодно и узнаете, что это такое, поищите в самом верху этой страницы).

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 13:10 01-09-2021 | Исправлено: shch_vg, 13:11 01-09-2021
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Зря вы занялись обработкой, гораздо больше бы пользы принесли, например, в лесном хозяйстве, да и для здоровья это полезней.  

Вы, милый друг, за меня не беспокойтесь! У меня времени хватает и на лесное хозяйство, и на всякое другое, и на творчество. Я не видел ваших творений, а то, может, и вас послать в какое-нибудь хозяйство пользу обществу приносить.  Птиц-говорунов, отличающихся умом и сообразительностью, много, а практической пользы никакой. Вот тут мои 7 сотен сделанных книг, с каждым днем прибывающих https://mirknig.su/user/kamenkapenza/news  . (не забываем входить через анонимайзер, приложений типа browsec в виду запрещённости сайта)
 А вы, батенька, что для общества создали?

Всего записей: 684 | Зарегистр. 23-05-2021 | Отправлено: 15:00 01-09-2021 | Исправлено: kamenkapenza, 15:06 01-09-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza
Поскольку вы, не милый и не друг, не соизволили (или просто не смогли) перевести разговор в ЛЯ, а собираетесь вместо признания своей неспособности найти что-то в "ужасной Хрестоматии" меряться причинными местами, считаю недостойным какое-либо дальнейшее общение с вами в этой теме.
Насколько же верно новозаветное высказывание "Не мечите бисер перед свиньями".
Три месяца в теме, а запах...
Безусловный игнор!

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 16:42 01-09-2021 | Исправлено: shch_vg, 17:12 01-09-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Столкнулся с таким случаем.
Обрабатывал очень грязные сканы со скачущим по сканам текстовым блоком.
Т.к. все равно пришлось осматривать каждый скан, решил обработать с очень грубой (далекой от текста) расстановкой резаков, чтобы на стадии предфинализации при просмотре уменьшать выбранную программой текстовую зону (которую в дальнейшем буду называть ВТБ - выбранный текстовой блок) до границ текстового блока.
У всех сканов задал выравнивание по высоте - Т.
Естественно, что после предварительного прогона вокруг текстового блока почти каждой страницы программа захватывала большое лишнее пространство в ВТБ.
Перемещаю стороны ВТБ на границу текстового блока, причем после каждого перемещения стороны программа корректирует положение текстовой области согласно параметрам выравнивания. Корректирует при перемещении всех сторон кроме нижней, перемещение которой НЕ приводит к изменению положения текстового блока.
Когда же я поменял на выравнивание по высоте по центру, то перемещение любой стороны ВТБ сопровождается изменением положения текстового блока.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 00:01 02-09-2021 | Исправлено: shch_vg, 14:57 03-09-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
На скане, импортированном из пдф в СК, появляются "трупные" пятна. В акробате и в нитро скан импортируется нормально. Все это можно посмотреть по этой ссылке.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 17:30 04-09-2021 | Исправлено: shch_vg, 23:07 04-09-2021
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ребята, можно ли средствами СК получить из скана такой результат с минимальными усилиями?
   
То есть получить такую таблицу, с залитыми разным цветом фона хедером и содержанием таблицы, и с белой рамкой. Таких таблиц в книге отосительно много, поэтому не хочется делать их в виде обычной картинки. Хотелось бы, чтобы по стилю не оличалось от основного текста.

Всего записей: 3146 | Зарегистр. 29-09-2005 | Отправлено: 09:32 05-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
DmitryKz
результат с минимальными усилиями

можно, но как только вы дадите адекватное определение минимальных усилий. Потому что самое минимальное - это нулевое. "Кому и кобыла невеста" (с)
 
Иначе говоря, чем вас постеризация в СК не устраивает-то?

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 12:35 05-09-2021
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
адекватное определение минимальных усилий

Да, некорректно выразился. В моем представлении рисовался сложный процесс и в сравнении с ним хотелось минимизировать сложности. Требовался просто аутентичный рецепт для данного случая.
Спасибо, испытаю постеризацию.

Всего записей: 3146 | Зарегистр. 29-09-2005 | Отправлено: 13:46 05-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
если что - ролик есть. https://www.youtube.com/watch?v=FnoqZe-uEhU

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 14:03 05-09-2021
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Ага, сейчас его смотрю и пробую.
Спасибо, кстати, и за ролик)
 
Добавлено:
Крутая фича.
С таким моментом не разобрался — если в одной из ячеек таблицы находится полноцветная графика (картинка, изображение), которая будет отдельной зоной и которая не будет постеризоваться, как сделать, чтобы участок зоны под ней (зоны, которая будет постеризоваться), был пустым, без этой самой картинки, которая увеличивает объем файла "родительской" зоны?

Всего записей: 3146 | Зарегистр. 29-09-2005 | Отправлено: 14:05 05-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
зона на зону не может влиять. Поэтому удалите в нижней (постеризуемой) зоне картинку руками. Ну, ещё можно сложный контур зоны сделать. Типа выпил. Но это, ИМХО, геморно.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 14:49 05-09-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru