Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.04 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39722 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 05:50 28-09-2025
vilteb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
У меня на одном компе для оптикбука режим NONE, на другом NEUTRAL. (Драйвер почему-то работает по разному.)

Там же:

Цитата:
Color > Black point (%)
The black point marks the darkest spot of an image. A properly set black point will improve an image’s brilliance and contrast, while a careless setting will result in a loss of tonal values (since dark tonal values will be clipped). This functionality is well known from Photoshop, but VueScan has no way to set a black point via a mouse click. You must use cumbersome sliders instead.
Color > Black point (%) will set the black point for all RGB channels combined. By default, it is set to 0; sometimes setting it to a higher value can improve an image, but this depends on the image’s tonal value. Check the histogram. The curves (at least, the outer curves) should ideally start at the histogram’s left corner. In most cases, there will be a gap between the left corner of the histogram and the beginning of the curves. Change the black point settings until the curves start directly at the corner. Avoid cutting off a curve, as you will lose tonal values.
 
Color > Black point red/green/blue
Here you can set the black point for each color channel separately. As these values are applied directly to linear color space (not gamma corrected space), they are only available when Input > Lock image color is set. If you want to survey your changes, you have to display the histogram for the image.
You can do this with (Ctrl)-(4); the graph for the raw scan (Ctrl)-(1) is not helpful for this task. The changes will be applied at the raw level, but they will not change the RAW file itself. You basically apply the same settings here as in Color > Black point (%) ; the only difference is that you can control every channel separately. This option’s controls are difficult to handle; in most cases, you are better off not touching them and sticking to the default value of 0.
 
Color > White point (%)
The white point, like the black point, is generated automatically, and the default value is 1. That means 1% of the brightest pixels in the image are converted to pure white by default. In general, the effect and the handling of the white point equals Color > Black point (%) , but of course the white point affects the highlights. A properly set white point increases the contrast and brilliance of an image. An inaccurately set white point can result in clipped highlights and an overall flat look. In VueScan, there is no way to set the white point via a mouse click; you have to use the slider instead. For better control, display the image histogram. The white point is set correctly when all curves (or at least the outer curve) end at the right corner of the histogram. An empty gap is not ideal, and a curve that is clipped is worse. But there are some cases when you cannot avoid clipping completely, because you cannot move the sliders far enough.
For average daylight photos, the ideal histogram is shaped like a bell. The curves start in the left corner of the bottom line, go up, then down, and end at the right corner of the bottom line. In most cases, this type of histogram produces the best results, and it can be remembered as a rule of thumb. For exotic cases, like high-key or low-key photos, different rules may apply.
 
Color > White point red/green/blue
Here you can set the white point for each color channel separately. As these values are applied directly to linear color space (not gamma corrected space), they are only available when Input > Lock image color is set. If you want to survey your changes, you have to display the histogram for the image and not for the raw scan. The changes will be applied at the raw level, but they will not change the RAW file itself. You basically apply the same settings here as in Color > White point (%) ; the only difference is that you can control every channel separately.
 
Image graph for black and white points
With Image > Graph b/w, you can display the curves and control Color > Black point and Color > White point via triangled sliders. Reset any changes with a double click on the appropriate curve.
 

Всего записей: 26 | Зарегистр. 23-05-2025 | Отправлено: 19:42 16-10-2025 | Исправлено: vilteb, 19:45 16-10-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Только в чем цель? Ловить дырки и спеклы?  

да

Цитата:
если надеяться только на то, что сработает

"Только", конечно, не получится, увы. Но сейчас ведь этого нет. А так было бы полезное подспорье
 

Цитата:
Можно по другому. Морфологией утоньшить

Может быть. Но мне это кажется избыточным усложнением
 

Цитата:
Они могут иметь тонкие связки (перешейки) с периметральной окраской

Теоретически, конечно, может быть всё что угодно. Но ИМХО я сейчас такого либо не наблюдаю, либо наблюдаю минимально, так что у меня этот образ не отфиксирован.
 
Но, допустим, такая связка есть. Она приведёт к тому, что размер спекла/дырки рассчитается как большой.  
Смысл же такой сортировки - отсечь тонкую однопиксельную окантовку, которой суммарно набегает много, но блямб (=спеклов/дырок) она не формирует.  Длинные однопиксельные линии не считать (и занизить их рейтинг в сортировке), потому что они однопиксельные.  Тогда уже по итогу сформируется более короткий список букв с блямбами, чем сейчас.  "Короткий" в том смысле, что глазами придётся меньше отсматривать. (Исключать из списка я тут ничего не предлагаю.)  Вверху рейтинга будут блямбы+окантовки, потом блямбы. А вот просто окантовки уйдут вниз. По-любому блямбы будут сверху.
Как уже писал: попробовать взять за основу дополнительного альтернативного ранжирования не сумму цветных пикселей, а максимальный размер цветного спекла.  
 
UPD
двухпиксельную окантовку, наверное, тоже можно отсекать
Или модификатор встроить: поднимать в рейтинге тех, кто три пикселя и толще.  
 
 
 
Добавлено:
vilteb
 

Цитата:
daa2013 . У меня на одном компе для оптикбука режим NONE, на другом NEUTRAL. (Драйвер почему-то работает по разному.)   Там же:   ...  

 
Не понял, в чём смысл вашего поста. Если в том, что вы мой не поняли, то прокомментирую.  
 
Мой сканер почему-то выдает разные результаты сканирования при подключении к двум разным компам.
На одном компе мне приходится это корректировать, используя  NEUTRAL, на другом же - не задействовать ничего (NONE).

Всего записей: 1187 | Зарегистр. 13-06-2013 | Отправлено: 01:26 17-10-2025 | Исправлено: daa2013, 02:00 17-10-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
отсечь тонкую однопиксельную окантовку,  

Вы наверно плохо представляете как СК ищет спеклы. Спеклы - это связанные области любой формы, размер спекла - это размеры габарита по вертикали и горизонтали, в который спекл укладывается. Они могут быть и однопиксельные по толщине стенки, но за счет сложной формы (изгибов) будут отнесены к огромным спеклам. В отношении спеклов СК понятия не имеет, тонкие они или толстые, он судит только по габаритам. Если окантовка строго вертикальная, или строго горизонтальная (и не имеет никаких касаний с другими), ваш метод сработает. Например, вертикальная палочка-окантовка высотой 10 пикселей и основной толщиной 2 пикселя, но в одном месте имеет выступ в 3 пикселя, то спекл будет опознан как 10*5. Вы это учитываете? Неужели окантовки всегда тонкие, без выступов?

Всего записей: 4744 | Зарегистр. 09-09-2002 | Отправлено: 07:57 17-10-2025 | Исправлено: bolega, 07:59 17-10-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так СК может внутри этого габарита сосчитать цветные пиксели ?
Вот это и будет размер спекла в моём понимании.
 
С выступами есть, конечно.
 

Цитата:
никаких касаний с другими

касание уголками, не считается же ? Только сторонами квадратиков ...
 
Добавлено:
Повторюсь: это не более чем идея. Польза в отличие от зон беспотерьного кодирования и гистограммы  тут не гарантирована.

Всего записей: 1187 | Зарегистр. 13-06-2013 | Отправлено: 08:33 17-10-2025 | Исправлено: daa2013, 08:38 17-10-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
СК может внутри этого габарита сосчитать цветные пиксели ?

считает. И что? Как количество связано с геометрией? Никак.

Всего записей: 4744 | Зарегистр. 09-09-2002 | Отправлено: 09:28 17-10-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да. Может, и не связана. 100% коррелляции тут точно нет.

Всего записей: 1187 | Зарегистр. 13-06-2013 | Отправлено: 19:43 18-10-2025 | Исправлено: daa2013, 02:06 19-10-2025
shikari

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Баг в v7.04 (про предыдущие не знаю, может тоже быть).
 
При сохранении задания разметка резаков и зон для файлов, которые не отмечены галочками (marks) в списке файлов проекта, не сохраняется в файл задания.
Например, если разметить зоны для отмеченных файлов, а потом у некоторых галочки снять и сохранить задание, то визуально зоны останутся на месте, но в файл задания они не сохранятся. При последующем открытии задания придётся эти страницы размечать заново.

Всего записей: 44 | Зарегистр. 07-12-2006 | Отправлено: 08:35 22-10-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
почему же это баг...

Всего записей: 3645 | Зарегистр. 15-07-2010 | Отправлено: 09:08 22-10-2025
shikari

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Потому что поведение совсем неочевидное (и нелогичное, имхо).  
Я давно не работал с СК, и вот решил доделать одну книгу. Страницы были уже обрезаны, надо было дорасставлять зоны. Галочки в списке файлов визуально мне мешали, и я их все снял. Зоны дорасставлял частично, проект сохранил. Так как визуально зоны присутствовали, то подвоха не заподозрил. В итоге попал на потерю пары дней работы над книгой.
 
Добавлено:
Сделал выжимку из этой темы в виде вопросов и ответов. Постарался ничего не пропустить.
 
Читать выжимку...

Всего записей: 44 | Зарегистр. 07-12-2006 | Отправлено: 12:44 23-10-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
shikari
Галочки в списке файлов визуально мне мешали, и я их все снял

угу. "баг", как же. Колёса с автомобиля скрутите и скажите что он теперь не едет это баг.
 
Спасибо за выжимку.

Всего записей: 3645 | Зарегистр. 15-07-2010 | Отправлено: 13:34 23-10-2025 | Исправлено: TelecomUral, 06:18 24-10-2025
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Народ, может у кого есть шрифт DXOldStandardStudium которым можно идеально восстанавливать книги, напечатанные в СССР в 30-50-е годы (шрифт сделан по лигатурам из шрифтовых альбомов тех лет)?
В шрифтовой теме глухо.

Всего записей: 3880 | Зарегистр. 17-09-2001 | Отправлено: 13:57 23-10-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сорри за полуофтоп
niccolo

Цитата:
может у кого есть шрифт DXOldStandardStudium которым можно идеально восстанавливать книги, напечатанные в СССР в 30-50-е годы

Шрифт DXOldStandard Studium (DXOldStandardStudium) - ИМХО такой себе самиздат от Дмитрий Хорошкина (Москва), да ещё платный. В качестве графической основы было выбрано начертание 16-го кегля из шрифта "Гарнитура №3 Учебная" по ОСТ 1337 (1932 г.), которая предназначалась для букварей. Именно 16-й кегль этой гарнитуры был основан на "Гарнитуре №11" словолитни Лемана (1914 ?), в то время как 20-й и 28-й кегль этой гарнитуры был основан на "Гарнитуре №6" Лемана. Причем начертания некоторых символов в DXOldStandard Studium были изменены с оригинальных (которые есть в DXOldStandard Studium Book) на самодельные, похожие по начертаниям на гарнитуру "Обыкновенная". Почему самиздат - потому что это DX Type Foundry, а не известная дизайн-студия типа Паратайпа или Артемия Лебедева.
 
В то же время существует ИМХО хороший и бесплатный для всех применений (лицензия Open Font License Ver. 1.1) шрифт Old Standard от Алексея Крюкова, который является авторским цифровым воплощением гарнитуры "Обыкновенная" (ГОСТ 3489).
 
Какой шрифт - DXOldStandard Studium (см. кириллицу и латиницу) или Old Standard более похож на гарнитуру "Обыкновенная - вопрос дискуссионный, но ИМХО Old Standard имеет лучшее сходство: верхний выносной элемент у "б", равные плечи основания "дД", менее жирные капли, меньшая длина концевых элементов.
 
P.S. Понятное дело, что в СССР даже 30-50-х годов книги печатались не одним шрифтом. Т.е. ни DXOldStandard Studium ни Old Standard сами по себе не могут обеспечить "идеальное" восстановление всех книг советского периода. Для этого нужно иметь весь набор советских шрифтов, вернее их современные цифровые воплощения, которые есть для многих (или для большинства, или для основных) советских шрифтов. Но имеется одна небольшая проблема - определение шрифта, т.е. создание упорядоченного набора символов для облегчения визуального определения. Помощь в этом мог бы оказать как раз СканКромсатор. Второе интересное применение СканКромсатора для "идеального" восстановления книг - создание коллекции глифов определенных шрифтов, для которых нет цифровой копии, для последующего создания их цифровой копии с помощью автоматизированных программ. Дело за малым...

Всего записей: 1062 | Зарегистр. 04-11-2019 | Отправлено: 00:32 24-10-2025 | Исправлено: jourmager, 01:49 24-10-2025
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
 
Спасибо за информацию и ссылку на последнюю версию Old Standart (OS)...
 
По поводу остального - сравнил OS c текстом нескольких книг - он визуально тоньше, возможно из-за растискивания краски при печати.... Вот и хотелось посмотреть DXO - может он чуть толще.
 
Указанный вами ГОСТ был впервые принят в 1946 г. Учитывая инерцию в отрасли, полагаю, массово книги на нем начали выходить с 1947, а учитывая то, что действовавшие до этого ОСТы были отменены позже, то возможно даже и с 50-х годов. Я смотрю книги 30-х.
 
Идея создания коллекции глифов конечно хорошая, хотя на вкус и цвет товарищей нет - кому-то нравятся насыщенные жирные символы, кому-то тонкие бледные (да и FR на них ошибается меньше). Кроме того, могут быть проблемы с масштабированием графических глифов из-за плавающего DPI исходников, ведь нужны они больше порой для приведения в чувство отсканированных ранее непонятно кем и как материалов, которые, если есть доступ к исходникам, в реальности проще пересканировать качественно, чем исправлять.
 
Поэтому лично я за использование шрифтов вместо глифов.

Всего записей: 3880 | Зарегистр. 17-09-2001 | Отправлено: 08:44 24-10-2025 | Исправлено: niccolo, 10:53 24-10-2025
sovokr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
jourmager
Подробнее...

Всего записей: 18 | Зарегистр. 25-07-2024 | Отправлено: 12:24 24-10-2025 | Исправлено: sovokr, 12:38 24-10-2025
shikari

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Колёса с автомобиля скрутите и скажите что он теперь не едет это баг.

Аналогия неверная. Она подошла бы, если бы я файлы удалил из проекта.
Я фалы не удалял, просто снял галки. Программа позволила продолжить размечать зоны. После сохранения, в файле задания файлы присутствуют, но информация о размеченных зонах нет.
Причём, если галки вернуть, то информация о зонах опять будет записана в файл.  
Это баг.

Всего записей: 44 | Зарегистр. 07-12-2006 | Отправлено: 19:53 24-10-2025
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
shikari

Цитата:
Сделал выжимку из этой темы в виде вопросов и ответов.

Стоит уточнить, что это выжимка из пятой части этой темы.

Всего записей: 7285 | Зарегистр. 14-01-2005 | Отправлено: 21:34 24-10-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Просьба подсказать.
Забыл какой-то нюанс.
 
Применяю рамку вместо резаков.

 
На выходе почему-то слева и снизу текст примыкает к краям:

 
Вроде с рамкой такого не должно быть. Какую деталь я забыл?
 
Тест:
Ссылка

Всего записей: 707 | Зарегистр. 04-05-2016 | Отправлено: 00:07 25-10-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
Какую деталь я забыл?

В special - Ignore gaps
 
Добавлено:

Цитата:
shikari
Я фалы не удалял, просто снял галки.

не спец. вот коммент от bolega
http://forum.ru-board.com/topic.cgi?forum=5&topic=51231&start=1060#16

Всего записей: 3645 | Зарегистр. 15-07-2010 | Отправлено: 01:56 25-10-2025
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
http://forum.ru-board.com/topic.cgi?forum=5&topic=51231&start=1060#16

А этого в выжимке нет

Всего записей: 7285 | Зарегистр. 14-01-2005 | Отправлено: 13:50 25-10-2025 | Исправлено: shch_vg, 13:51 25-10-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
jourmager
за ссылку спасибо. там мануал, я из него про шрифты узнал нового чуть ли не столько же, сколько уже знал.

Всего записей: 3645 | Зарегистр. 15-07-2010 | Отправлено: 12:00 26-10-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

LiteCoin: LgY72v35StJhV2xbt8CpxbQ9gFY6jwZ67r

Рейтинг.ru