Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Способа сделать в VR аккуратные выделения на родительской зоне по дочерним (наложенным) нет?

Всего записей: 3118 | Зарегистр. 29-09-2005 | Отправлено: 14:57 05-09-2021 | Исправлено: DmitryKz, 15:08 05-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
мне неизвестны такие способы. Но, может быть, bolega подскажет. У него часто кролики из шляпы появляются для таких задачек.
 
А почему неаккуратно выходит? Ячейки же прямоугольные. Выделили ячейку с картинкой (в VR Zones) и нажали Del. Всё.

Всего записей: 2106 | Зарегистр. 15-07-2010 | Отправлено: 15:06 05-09-2021
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да-да, мне просто лень. Просто вот она возможность для автоматизации одного из элементов ручного процесса. Ладно, буду надеяться на кролика, а пока ручками.

Всего записей: 3118 | Зарегистр. 29-09-2005 | Отправлено: 15:10 05-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
Если цветов больше двух, то постеризовать.
Если есть черный, то желательно его первым отделить. Как это делать, я показывал в своем ролике https://www.youtube.com/watch?v=zSDnkloduk0 .
К сожалению, вы не дали ни одного примера (в очередной раз из разряда "лечите меня по телефону"), чтобы глянуть, насколько здесь это будет легко и не понадобится ли какой-нибудь другой "кролик", как выразился TelecomUral. Ну на нет и суда нет.
 

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 16:27 05-09-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне по поводу этого примера пришла в голову мысль, что, может, какой векторизатор для построения таблиц и мог бы существовать. Чтобы заданное число вертикальных и горизонтальных линий строил. Либо сам для них (одинаковые) толщины определял, либо заданное число пикселей делал. А потом, может, ещё и цвет менял.
 
Вертикальные и горизонтальные линии ведь часто руками приходится встраивать и копипастить. Может, какая автоматизация тут и возможна. К тому же я не  знаю так сходу, как белую сетку сделать. Инвертировать, построить черную, инвертировать обратно ... ?

Всего записей: 955 | Зарегистр. 13-06-2013 | Отправлено: 16:00 06-09-2021
Rick593

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо вам за прекрасную программу, пользуюсь постоянно.
Не могли бы вы рассмотреть возможность явного задания размера разных полей четных и нечетных страниц или их выравнивания L/R в зависимости от четности? Если обрабатываю изображения, отсканированные разворотами, проблем нет, галка Split активирует настройки второй половины разворота. Но в случае одностраничных сканов, если нужно сохранить оригинальные несимметричные поля, приходится прощелкивать каждый второй файл, задавая нужное выравнивание.
 
Может быть, что-то не так делаю?

Всего записей: 1 | Зарегистр. 06-09-2021 | Отправлено: 22:48 06-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Rick593
размножение свойства на четные/нечетные почему не применяете?

Всего записей: 2106 | Зарегистр. 15-07-2010 | Отправлено: 03:42 07-09-2021
kamenkapenza



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Может быть, что-то не так делаю?

Rick593, разрезку страниц и поля лучше делать в программе Scan Tailor, всё это дело там занимает 5-10 минут даже для книги в 1000 страниц.  

Всего записей: 534 | Зарегистр. 23-05-2021 | Отправлено: 12:14 07-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
поля лучше делать в программе  

Человек, в форуме СК (в других - пожалуйста) отсылающий в другие программы, автоматически попадает в мой личный блэк-лист. Больше меня просьбами можете не беспокоить.

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 17:54 07-09-2021
kamenkapenza



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Человек, в форуме СК (в других - пожалуйста) отсылающий в другие программы, автоматически попадает в мой личный блэк-лист. Больше меня просьбами можете не беспокоить.

 
Ну вот! Хотя я и стал самым злейшим врагом всего Кромсаторного сообщества и личным врагом Главнокомандующего, но правда дороже: ту операцию, про которую я говорил лучше делать... там, где я сказал - большая экономия времени.  
По просьбам и отказам: вы и так дали понять, что к Его Величеству лучше не обращаться.  
Про то, что вы выдали по моей просьбе (один разок) в основном пригодится другим людям, об этом можете не переживать, не зря потратили время.

Всего записей: 534 | Зарегистр. 23-05-2021 | Отправлено: 18:49 08-09-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Снова я с книгой с Архива.
https://archive.org/details/refrigerationair0000lang
Изображений при ней нет
в 6.71 не получается импортировать PDF в SK картинками без зон или подложек в количестве, равном числу страниц.
 
В режиме без зон вообще импортируются картинки, похожие на то, что книгу напечатали плотно тёмнофиолетовыми чернилами и потом полили водой и они потекли.....  
 
Снова поднимаю вопрос - с какими настройками можно втянуть такие книги в СК так, чтобы они выглядели как в Акробате.
 
Вопрос 2. Болега - в вашем видео ч.1 по работе с картинками (там где пушки) в окне результатов самая правая панель инструментов с кнопкой деления окна результатов на окно страницы и картинок — никак не могу её найти в Версии 6.71.... У вас на видео какая-та особенная версия?

Всего записей: 3297 | Зарегистр. 17-09-2001 | Отправлено: 23:10 08-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
niccolo
У вас на видео какая-та особенная версия?

правой кнопкой щелкните на этой панели инструментов, там видимость кнопок настраивается

 
Сама панель включается по ПКМ, это "image adjustments", упс, зарапортовался спросонок. Конечно, это "preferences panel2":

 
 

Всего записей: 2106 | Зарегистр. 15-07-2010 | Отправлено: 04:31 09-09-2021 | Исправлено: TelecomUral, 04:48 09-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kamenkapenza
Это была шутка
 
niccolo
Я посмотрю (если дадите фрагмент своего pdf), но с архива лучше тянуть картинки, а не pdf. PDF там совсем убитые. А картинки нормальные (раз в 5 качественнее, чем pdf), если не считать артефактов сильного jpg-сжатия. На форуме publ.lib.ru уже не раз этот вопрос обсуждался.

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 08:05 09-09-2021 | Исправлено: bolega, 08:10 09-09-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сама панель включается по ПКМ,

 
Спасибо. Несколько нестандартное решение.
 
Кто хочет посмотреть файл, но не имеет доступа к Архиву
https://www.upload.ee/files/13459062/Langley_Refrigeration_and_air_conditioning.pdf.html
 
Добавлено:
Болега, спасибо за ответ. Но к сожалению у данного файла нет опции — исходные изображения.
 
 
Еще вопрос  
такие дефекты (зонное нарушение резкости то ли из-за плохого прижима у CIS-сканера, то ли из-за кривости самого сканера)
 
https://www.upload.ee/files/13459072/0017.tif.html
в СК можно вытянуть хотя бы до уровня распознавания 1-1,5% ошибок (сейчас >8-10%)?

Всего записей: 3297 | Зарегистр. 17-09-2001 | Отправлено: 08:11 09-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Снова я с книгой с Архива.  

Дайте скриншот с вашими настройками импорта pdf
 

Цитата:
Но к сожалению у данного файла нет опции — исходные изображения

Для программиста нет ничего невозможного
Если надо, я дам вам исходные этой книги. Но не быстро
 
 
Добавлено:

Цитата:
В режиме без зон вообще импортируются картинки, похожие на то, что книгу напечатали плотно тёмнофиолетовыми чернилами и потом полили водой и они потекли.....  

Вы не поверите, но именно в таком виде хранятся слои в этом pdf. Забавно, да? При нормальном импорте (не в режиме do not used zones) эти "потеки" вроде бы не видны, но на самом деле они тоже есть на изображении, просто маскируются. В общем, это все типично и даже нормально для Lura с помощью которого этот pdf создавался.  
Чтобы получить вид для таких pdf как в acrobat, нужно сделать так:  
импортировать с опцией use original pdf page size/layout. После импорта отмаркировать все файлы большой кнопкой "сбросить все опции и отмаркировать...", запустить обработку. После обработки сделать полный merge зон. Получившиеся на выходе файлы можно использовать для обработки (можно просто сделать из них out-задание).
 
Добавлено:

Цитата:
Несколько нестандартное решение.

А как по вашему было бы стандартно?

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 09:50 09-09-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Дайте скриншот с вашими настройками импорта pdf

 
Я перепробовал 3 варианта с разными настройками original size и зон.
Получаются пакеты c ~1500 и ~2100 картинок.
 

Цитата:
Если надо, я дам вам исходные этой книги. Но не быстро

Не надо. Я уже на PNG из Акробата карандаш для распознавания подтёр.
 

Цитата:
После импорта отмаркировать все файлы большой кнопкой "сбросить все опции и отмаркировать...", запустить обработку.  

 
А потом ещё третий раз - Deskew. И только потом уже работать..... Так себе алгоритм.
 

Цитата:
А как по вашему было бы стандартно?

 
По моему не знаю. А со времён ворда 97 панели настраивались ПКМ по свободному месту на панели инструментов, как у вас настраиваются кнопки на панелях.  
 
PS. Люра на архиве — очень популярна.  Возможно стоит добавить в экнциклопедию подсказку - как лучше работать с Архивом - если есть оригиналы - тянуть их, конвертировать из JP2000 в JPG и обрабатывать, а если нет — тогда ваш вариант, либо экспорт в картинки из ПДФ в любой программе, которая это позволяет, и далее стандартная работа в SK.

Всего записей: 3297 | Зарегистр. 17-09-2001 | Отправлено: 10:29 09-09-2021 | Исправлено: niccolo, 10:36 09-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Так себе алгоритм.  

Блин, ну я уже запарился объяснять, почему СК именно так импорт делает, т.е. извлекает картинки as is, а не "рисует" их как акробат.

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 10:37 09-09-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Блин, ну я уже запарился объяснять, почему СК именно так импорт делает, т.е. извлекает картинки as is, а не "рисует" их как акробат.

 
Болега - я не прошу объяснений, как устроен импорт PDF в SK. Вопрос стоит в том - как правильно импортировать книги с Архива или возможно ли это сделать, и с какими настройками...
 
Нет, так нет. И если это нигде не написать - он будет задаваться всеми, кто сталкивается с обработкой этих книг в SK.

Всего записей: 3297 | Зарегистр. 17-09-2001 | Отправлено: 12:18 09-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
добавить в экнциклопедию подсказку - как лучше работать с Архивом

светлая мысль, между прочим, а то больно много геморроя при импорте.  
К сожалению, не реализуемо: надо проводить анализ содержимого pdf в каждом конкретном случае, а это потребует высокой (относительно, конечно) квалификации юзера.
Но составить шпаргалку хоть на типовые варианты и разместить в шапке в помощь пользователям - да, имеет смысл. Я не возьмусь, ибо плохо знаю инструменты анализа pdf, но может найдётся герой. Типа "в таком-то случае видим то-то и поступаем так-то, в таком-то - так-то".

Всего записей: 2106 | Зарегистр. 15-07-2010 | Отправлено: 12:27 09-09-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Нет, так нет.  

Не понял, нет что? Я же написал алгоритм, вы его отвергли. Насильно мил не будешь.
 

Цитата:
И если это нигде не написать -  

Почему так, я уже неоднократно писал. Нужен мастер, который это вставит в инструкцию.  
И кстати, архив тут ни при чем, Lura причина. Помню, у гугла такие же файлы были.

Всего записей: 4158 | Зарегистр. 09-09-2002 | Отправлено: 12:46 09-09-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru