Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Torino

Цитата:
Я думаю это глюки отдельно взятого pdf-файла

А я думаю, что нет, т.к. подобное я встречаю не в первый раз, да и NAATH писал, что у него таких пдф-ок много.
Хорошо бы все-таки выяснить, какая программа делает такие пдф.

Всего записей: 6286 | Зарегистр. 14-01-2005 | Отправлено: 23:48 15-09-2011 | Исправлено: shch_vg, 23:51 15-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NAATH

Цитата:
Там еще - на некоторых страницах - какие-то черные вставки были

Это баг старой версии СК.
С новой версией (5.95beta) таких проблем не будет: http://www.onlinedisk.ru/file/734333/
 
shch_vg

Цитата:
Здесь только одна претензия к СК: при импорте из пдф некоторые фрагменты страницы теряют свою четкость и становятся практически невидимы.

Утверждение неверное. СК импортирует как есть. Визуальное ухудшение вызвано особенностью отображения прозрачных picture-зон в отдельном слое поверх скана (для зон без прозрачности такого не бывает). Чтобы убедиться в этом, можете проделать следующее: сбросьте и отмаркируйте все файлы, нажав крайнюю правую кнопку из четырех внизу слева основного окна СК. На закладке Files задайте DPI=300. Обработайте какую-нибудь одну страницу, например, 12. В окне VR перейдите в рехим показа "Zones" (вместо "One page"). Пощелкайте по зонам в ленте зон. Увидите, что все зоны прозрачные, более того, они все ч/белые! Хотя слева видно, что они цветные. В этом и есть преимущество СК по извлечению картинок из pdf: он не только восстанавливает слой прозрачности для них, но и их цвет! (внутри pdf они действительно хранятся как ч/б, а их раскраска выполняется командами pdf). Теперь в левой панели щелкните мышкой на любой зоне и в контекстном меню выберите команду Merge all zones. В итоге получите изображение, полностью идентичное тому, что показывает например adobe reader. Никакой потери четкости нет. Ваша фраза

Цитата:
По-видимому, при объединении в импортированный в СК файл часть этого фрагмента теряется, что приводит к практическому исчезновению самого фрагмента (такое можно заметить, например, на стр.12 этой книги, да и на некоторых других).  

теряет актуальность (я надеюсь).
 
Чтобы убедиться, как СК восстанавливает цвет зон, нужно вернуться в главное окно, вызвать диалог свойств любой зоны (напр., двойным щелчком по ней), перейти на закладку Paint и нажимая стрелки в кружочках, двигаться по всем зонам страницы.
Кстати, удобно в этом же диалоге сначало включить предпросмотр зон, для этого на закладке Format нужно нажать кнопочку с картинкой неба. Окно расширится и будет доступен preview.  
 
Рассмотрим следующую претензию

Цитата:
По крайней мере мне не удалось найти picture-зоны на стр.12, соответствующей  
файлу 71

Такая зона есть. Для быстрого поиска зоны по ее номеру или имени файла используйте команду Zones->Picture zone->Find zone. Там нужно щелкнуть по кнопке с троеточием и выбрать имя файла зоны. СК найдет местоположение этой зоны и активирует ее. В новой версии я обновил эту команду, так что она теперь ищет внешние зоны (импортированные) и по имени файла.  
 

Цитата:
Я ранее сталкивался с подобными книгами, интересно бы узнать, каким способом они создаются

Такие бредовые по структуре pdf создаются сканерами в составе МФУ (Canon и т.п.). Налицо жалкие попытки выполнить автомат. разделение скана на слои. Результат как правило плачевный.
 
 
Добавлено:
Torino
http://www.onlinedisk.ru/file/734357/
Это задание для Вашего примера. Извиняюсь за задержку, но результат можно получить только в новой версии СК, кою я только что выложил.
Эта бетка, возможны глюки, некоторые новые вещи не до конца реализованы.

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 13:44 16-09-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
С новой версией (5.95beta) таких проблем не будет: http://www.onlinedisk.ru/file/734333/

Ура!
 
DJVU Wizard обещает стать очень полезной функцией, но пока неясно вот, что. Загрузил старое задание с уже обработанными сканами. Почему визард видит только сырые серые сканы и не видит обработанные ЧБ?
 
ИМХО, было бы удобнее сделать один Wizard для DJVU и PDF. Параметры будут использоваться одни и те же, а сейчас получается, что PDF и DJVU разнесены по разным областям GUI. Или "Create PDF hyperlinks" и является таким визардом (но там тоже показаны только сырые сканы)?
 
А что еще нового в новой версии (хотя бы в двух словах, если можно)?

----------
пропадет-растает

Всего записей: 6780 | Зарегистр. 21-09-2002 | Отправлено: 14:00 16-09-2011 | Исправлено: ghosty, 14:08 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
ИМХО, было бы удобнее сделать один Wizard для DJVU и PDF

Фактически сейчас так и есть. Чтобы сделать pdf или djvu, нужно загрузить не само задание, а его out-задание! Командой File->Create out-task. СК создаст из выходных файлов осн. задания новое задание, которое и будет делать pdf (достаточно только задать на закладке  Files outputformat=pdf), либо djvu (через wizard). После запуска wizard нужно нажать только одну кнопку Attach auto, после этого можно менять параметры или сразу делать djvu. Предварительно нужно один раз настроить пути к DEE и DjvuLib (Files->Options-> App)

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 14:06 16-09-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Чтобы сделать pdf или djvu, нужно загрузить не само задание, а его out-задание!

Ага, вспомнил. Честно говоря, меня всегда это сбивало с толку. И с точки зрения пользователя и "стороннего наблюдателя", думаю, этот шаг может восприниматься как лишний.  
В чем именно логика создания out-заданий (т.е. в каком случае отделение сырых сканов от обработанных становится необходимым?) и почему нельзя, например, в визарде просто указать папку с обработанными файлами?

----------
пропадет-растает

Всего записей: 6780 | Зарегистр. 21-09-2002 | Отправлено: 14:16 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
А что еще нового в новой версии (хотя бы в двух словах, если можно)?

- descreen для зон
- новый фильтр CSmooth (аппроксимирует контуры ч/б букв кривыми безье и сглаживает их). Неплохо работает для изначально 600dpi сканов (ч/б или серых/цветных). Для сканов, полученных 300dpi grey->600dpi bw, нужно проводить исследования. Фильтр можно применять как ко всей странице, так и к участку, с помощью соответствующей зоны. Хорошо сглаживает векторную графику (при любом dpi), включая шахм. диаграммы.  
 
Добавлено:
ghosty

Цитата:
И с точки зрения пользователя и "стороннего наблюдателя", думаю, этот шаг может восприниматься как лишний.

Как говорится, никого заставлять не буду. Не нравится - не юзайте. Причины есть, и существенные. Описывать их сейчас просто нет времени.

Цитата:
почему нельзя, например, в визарде просто указать папку с обработанными файлами?

Тут главное не папка, а информация о расположении, окраске, форме и т.д. pic-зон.

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 14:22 16-09-2011
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
С новой версией (5.95beta)

Суперррр!
Спасибо!

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 14:36 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Супер - это вряд ли. У меня самого к новой версии куча претензий...

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 14:57 16-09-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Как говорится, никого заставлять не буду. Не нравится - не юзайте. Причины есть, и существенные. Описывать их сейчас просто нет времени.

Многие бы здесь согласились бы, наверное, и на десятикратное усложнение, если это способствовало бы развитию программы. Другое дело, всегда лучше понять логику автора - хотя бы для того, чтобы объяснить другим, когда у Вас нет времени
 

Цитата:
- новый фильтр CSmooth (аппроксимирует контуры ч/б букв кривыми безье и сглаживает их). Неплохо работает для изначально 600dpi сканов (ч/б или серых/цветных). Для сканов, полученных 300dpi grey->600dpi bw, нужно проводить исследования. Фильтр можно применять как ко всей странице, так и к участку, с помощью соответствующей зоны. Хорошо сглаживает векторную графику (при любом dpi), включая шахм. диаграммы.  

Да, интересно, будем исследовать. Пока не работает кнопка Preview на соотв. вкладке.
 
Из возможных багов:
1) В RV в режиме Compare нет возможности масштабировать исходный скан (в том числе при установленной опции синхронизации исходного скана с текущей страницей).
2) Выпадающий список с увеличением масштаба (в процентах) не функционирует.
 
Спасибо за новую версию!
 
Добавлено:

Цитата:
Для сканов, полученных 300dpi grey->600dpi bw, нужно проводить исследования.

На таких сканах, при первом приближении, использовать можно только "на свой страх и риск" - возможны нежелательные артефакты даже с минимальными параметрами сглаживания.
 
Без фильтра:
   
 
С фильтром (все настройки на минимум):
 

----------
пропадет-растает

Всего записей: 6780 | Зарегистр. 21-09-2002 | Отправлено: 15:04 16-09-2011 | Исправлено: ghosty, 17:58 16-09-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
По новой версии:
Т.к. все молчат, значит, это только у меня.  
И в винХР, и на сервере2003 появилась своеобразная заставка при запуске программы.
Проверял и в директории с предыдущими версиями, и в новой директории - результат тот же.
После нажатия на ОК выходит в основное окно СК, дальше пока не смотрел.

Всего записей: 6286 | Зарегистр. 14-01-2005 | Отправлено: 15:28 16-09-2011 | Исправлено: shch_vg, 15:39 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
На таких сканах, при первом приближении, использовать можно только "на свой страх и риск"

Согласен. За исключением крупных шрифтов, напр., заголовков.
Фильтр работает только с ч/б изображениями, поэтому если исх. скан - серый, то Preview не действует. Фильтр является самой последней операцией среди всех фильтров, при обработке применяется уже после бинаризации. Если выходные файлы задания прогнать через этот фильтр, то эффект будет такой же.  
Кстати, если перед Preview (для ч/б сканов) включить опцию "output to gray", то эффект сглаживания виден намного нагляднее. Но в реальности серыми же сканы не будешь оставлять. А последующая биаризация сводит сглаживание на нет.
 
Добавлено:
shch_vg
А Вы fft.dll положили в папку с программой?

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 15:41 16-09-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
А Вы fft.dll положили в папку с программой?

Да, вытащил содержимое архива (2 файла) в одну директорию.
Правда имя файла несколько другое - fftw3.dll.

Всего записей: 6286 | Зарегистр. 14-01-2005 | Отправлено: 16:38 16-09-2011 | Исправлено: shch_vg, 16:40 16-09-2011
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
sk.ini можно переносить из 5.94 в 5.95 или во избежание глюков этого лучше не делать?

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 16:42 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Torino
Можно, и нужно.

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 16:50 16-09-2011
NAATH

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega 13:44 16-09-2011
Цитата:
С новой версией (5.95beta) таких проблем не будет: http://www.onlinedisk.ru/file/734333/

 
Респект и уважуха!

 
Лучший результат работы ресайзера + еще трех разных программ: http://webfile.ru/5549980
А вот так делает - ScanKromsator: http://webfile.ru/5549982
 
Никакой имидж-ресайзер - так сделать не сможет.  
 
Спасибо, большое и человеческое!

Всего записей: 816 | Зарегистр. 20-11-2008 | Отправлено: 17:44 16-09-2011
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вот так делает - ScanKromsator

Здесь скорее всего применен фильтр Smart blur

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 17:49 16-09-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
NAATH

Цитата:
Никакой имидж-ресайзер - так сделать не сможет.

А что было сделано в новой версии СК?
Почему это же нельзя было сделать с предыдущими версиями?

Всего записей: 6286 | Зарегистр. 14-01-2005 | Отправлено: 17:58 16-09-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Такие бредовые по структуре pdf создаются сканерами в составе МФУ (Canon и т.п.).

Поскольку следует ожидать появления все новых образцов "такого творчества", хотелось бы понять, что с ними можно делать в рамках СК.
Пока же я вижу следующее. После импорта подобного pdf возможности работы с ним ограничены. Чтобы получить доступ до picture-зон приходится предварительно обрабатывать загруженные файлы. Здесь возникает проблема выбора dpi для такой обработки.
 
Вопрос: Указанный Вами способ обработки может теоретически ухудшить качество страницы за счет выполнения каких-то дополнительных действий СК, или это просто апсемплинг основного скана с наложением на него сканов зон?
 
Dpi основного скана 150, сканов picture-зон - 300. Если приводить в 150, то как раз очень заметна указанная мной потеря читаемости текста на зонах, если же приводить к 300, то это приведет к резкому увеличению размера основного скана, что скажется на размере итогового pdf.
Таким образом, задача, поставленная NAATH по приведению всех страниц одного pdf к одинаковому размеру в рамках СК, решается следующим образом:
После импорта пдф в СК у всех страниц с увеличенным форматом (они не помечены красным после загрузки) нужно выставить их реальное разрешение (в случае приведенной книги заменить 96 на 300), затем обработать ВСЕ файлы, введенные в СК с выходным разрешением 300 (здесь возможна расширенная обработка, чтобы сделать все страницы одинакового размера с точностью до пикселя), потом объединить зоны с основными сканами и создать из получившихся выходных файлов пдф, задав на закладке Files значение списка DPI = 150 для неувеличения размера выходного пдф по сравнению с исходным.  
 
Жаль, что нет возможности сразу после импорта такого пдф произвести массовое объединение основных сканов с зонами с возможным вопросом о dpi объединенного скана.

Всего записей: 6286 | Зарегистр. 14-01-2005 | Отправлено: 20:10 16-09-2011 | Исправлено: shch_vg, 20:18 16-09-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Поскольку следует ожидать появления все новых образцов "такого творчества", хотелось бы понять, что с ними можно делать в рамках СК.

Думаю, ничего. Это как раз тот случай, когда из pdf нужно не извлекать изображения, а экспортировать в заданном разрешении. Единственная польза тут от импорта в СК в том, что появляется возможность проанализировать результат на предмет выявления максимального dpi, с которым и выполнять потом экспорт. Ведь если задать его меньшим, то будут потери в качестве. Если задать большим - будут апсэмплы, ничего не добавляющие по качеству, а только увеличивающие размер. Ну и остается чисто теоритеческий интерес к тому, чтобы в деталях увидеть, насколько порой сложно и причудливо формируются изображения страниц в pdf-файлах. Чтобы в свою очередь понять, что извлечение изображений из Pdf - иногда бесполезная операция.
 

Цитата:
Жаль, что нет возможности сразу после импорта такого пдф произвести массовое объединение основных сканов с зонами с возможным вопросом о dpi объединенного скана.

Есть, но я ее пока заблокировал из-за того, что она еще недостаточна отлажена. Только без вопроса о dpi, у меня он берется как max из dpi страницы и лежащих на ней зон. Тут правда могут возникнуть большие проблемы, если dpi неправильны.  
 
ghosty

Цитата:
С фильтром (все настройки на минимум):  

Вы правильно все подметили. Но этот фильтр и не предполагалось использовать для хороших сканов (как у Вас в примере). Основное применение - для корявых букв со сколами, выступами и т.д.
 
Добавлено:
shch_vg

Цитата:
Если приводить в 150, то как раз очень заметна указанная мной потеря читаемости текста на зонах, если же приводить к 300, то это приведет к резкому увеличению размера основного скана, что скажется на размере итогового pdf.  

Так и есть. Решений тут три: либо оставить как есть, либо переводить в 300dpi (300, потому что это максимальное dpi, которое встречается на страницах этого pdf; меньшие значения приведут к деградации), либо перевести в 300 и затем обработать по обычной схеме 300->600bw, с ручным выделением зон (это долго, нудно и при таком качестве оригинала неоправдано).

Всего записей: 3788 | Зарегистр. 09-09-2002 | Отправлено: 00:13 17-09-2011
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Такие бредовые по структуре pdf создаются сканерами в составе МФУ (Canon и т.п.). Налицо жалкие попытки выполнить автомат. разделение скана на слои. Результат как правило плачевный.

Ну а смысл винить автоматическое деление, реализованное по остаточному принципу ?

Всего записей: 5038 | Зарегистр. 31-08-2008 | Отправлено: 16:00 17-09-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru