Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39615 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
А как это сделать?  

 

они же
https://disk.yandex.ru/i/oJSpy-BhVToRWw
https://disk.yandex.ru/i/2FLKSieShu50UQ

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 16:07 06-06-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, у меня вообще не видна эта панелька с кнопками.

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 16:55 06-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
включите. в меню View. Затем по ПКМ выберите видимость нужных кнопок.

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 17:09 06-06-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
один пример импорта из pdf
https://workupload.com/file/XjJ96rswpvw

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 14:52 07-06-2025
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
 
Уважаемый bolega!

Цитата:
Подготовил несколько роликов, касающихся создания линков и букмарков
https://workupload.com/file/Tb5HKYff4YG
https://workupload.com/file/hBFsNKPW7kE
https://workupload.com/file/4LpWLuqFtNn
https://workupload.com/file/Pyp8MrREyxg
https://workupload.com/file/cWUzLmsSct6


Цитата:
один пример импорта из pdf  
https://workupload.com/file/XjJ96rswpvw

 
На заре создания кинематографа первые видеоролики были немыми. Чтобы сделать понятным содержание изображаемого на экране появлялись титры. Этот кинематограф называли «великим немым». С развитием технологий кинематограф был озвучен: герои на экране сами говорили, либо за кадром звучал голос диктора, пояснявший происходящее. Все ранние Ваши ролики полностью соответствовали озвученному кинематографу, а потому были очень понятны.
 
Выше приведённые ссылки на последние Ваши ролики не только не соответствуют современному кинематографу, но и не могут быть отнесены к эпохе «великого немого». Эти Ваши ролики опустились до эмбрионального состояния кино, а потому ничтожны!
 
Почему так произошло?
 
С уважением

Всего записей: 128 | Зарегистр. 26-03-2024 | Отправлено: 14:06 08-06-2025 | Исправлено: zbolv, 15:37 08-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Насчет понятности видео.  
 
Мне, например, из 5 просмотренных роликов (из 7 выложенных в течение месяца), непонятна всего пара кнопок, и то - наверное - потому что я ни разу таких вещей на практике не делал. Доберусь до практики, и их пойму скорее всего. Из перераспознавания слов иного языка кое-что непонятно вначале, какие-то общие переключения.
Хотя, конечно, с таймлайнами/планом показа, титрами либо пунктами whatsnew, или голосом - было бы не так напряжно смотреть. Но можно оставить: кому надо задачу решить, тот поймёт.
 
Благодарю за визард гиперлинков, стало наконец-то универсально. И назначение большинства странных  галок и кнопок прояснилось, а то я глазами хлопал от их обилия. А уж правое окно конечной страницы - !
 
И импорт ocr слоя из дежавю - вещь

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 16:25 08-06-2025
mvk2006



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
кому надо задачу решить, тот поймёт.  

согласен и поддерживаю... поскольку понимаю, что для добавления "недостающих пунктов" требуется на порядок больше времени... и гораздо полезнее это время потратить на саму программу

Всего записей: 525 | Зарегистр. 15-10-2005 | Отправлено: 17:14 08-06-2025
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И импорт ocr слоя из дежавю - вещь

Это как?

Всего записей: 3948 | Зарегистр. 22-03-2005 | Отправлено: 17:44 08-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Самый простой случай. Берется готовый djvu, в котором уже есть текстовый слой. СК импортирует djvu вместе с его текстом, на лету генерируя focr-файлы для всех страниц. С помощью Ocr создаются линки и букмарки.  

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 17:48 08-06-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zbolv, вот pdf-файл, который поможет понять для чего это видео от болега
pdf
 
Сначала попробуйте просто импортировать его в СК: Файл — Импорт — PDF.
Посмотрите, что получилось.
 
Потом сделайте, как показано на видео.
 
Добавлено:
Вот алгоритм действий словами (от bolega):
 
1. импортируете все как есть, только не забудьте про dpi for blank page=auto.
2. потом пометьте все файлы галками (все опции обработки отключены).
3. Задайте input dpi=300, галку с "только для неизвестных" убрать!
4. Запустить обработку.
5. Затем в главном меню основного окна Зоны > picture зона > маркировать.
6. Переключатель zone type на external, включить галки width=2376, height=3313. (эти параметры для конкретного pdf-файла)
7. Запустить.
8. Потом в главном меню Зоны > picture зона > слить зоны.
9. Выбрать merge only mark zones. Запустить.
10. Потом сделать out-задание.
 
Вот с ним далее и работать.
В нем выходной dpi=600, формат = b/w, tiff.
бинаризация = 200, все опции отключены.
Запустить обработку, получить итог.

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 22:54 08-06-2025
vilteb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Оффтоп, прошу не удалять:  

Цитата:
Filename:     archive.7z
Filesize:     716761586 (Byte)
Checksum:     eeedf41cbb31a40679e212287fe1321116c037c3e1e9304557e3b2925d2dc4b6 (SHA256)
Password:     h9MW?oTG$2l-g>$:z%H]q1y4bwxlE%>'N+;.PS<h&]Pv>&w7hl)!tq<0<aPBeeG

Спасибо!

Всего записей: 18 | Зарегистр. 23-05-2025 | Отправлено: 01:44 09-06-2025 | Исправлено: vilteb, 22:26 09-06-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vilteb
Качество печати жуть. Такое лучше оставлять в сером. Но если бинаризовать, то максимум, что у меня получилось: https://workupload.com/file/F76ks3Z6QJY
 
Добавлено:
asku

Цитата:
понять для чего это видео

после импорта "многослойного" pdf часто получаются не готовые странички, а по нескольку зон на странице, сама страница-подложка белая. Чтобы такое обрабатывать, нужно самую большую зону отправить вниз, т.е. сделать ее подложкой (слить с ней - merge). Остальные зоны останутся зонами, т.е. разделение текст/иллюстрации, сделанное до или при создании pdf, останется.  
Другое решение - добавить в СК команду, которая в задании заменит подложки на заданные зоны. Как-нибудь такое сделаю в bulk operations.

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 07:58 09-06-2025 | Исправлено: bolega, 08:06 09-06-2025
vilteb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Цитата:
Качество печати жуть. Такое лучше оставлять в сером. Но если бинаризовать, то максимум, что у меня получилось: https://workupload.com/file/F76ks3Z6QJY

Огромное спасибо. Качество действительно жутковатое - это ксерокопия.
Если оставлять в сером, тогда это должен быть PDF со сжатием flate т.е. без потери качества?
Бинаризованные страницы №8 и №16 суб-задания получились очень неплохого качества - их только почистить осталось, вручную конечно. Тогда можно будет попытаться распознать текст.
Если это не секрет, могу ли просить Вас выложить обработанное суб-задание для изучения? Это, наверное, с применением picture-зон так хорошо удалось текст вытянуть?
Спасибо.

Всего записей: 18 | Зарегистр. 23-05-2025 | Отправлено: 08:58 09-06-2025 | Исправлено: vilteb, 09:00 09-06-2025
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
 
asku

Цитата:
zbolv, вот pdf-файл, который поможет понять для чего это видео от болега  
pdf  

 
Да, Ваши инструкции толковые, интересно по ним работаю. Однако, как ни крутил, импортировать Ваш PDF SK до конца отказывается, процессинг не завершается, хотя странички и картинки в папке импортирования имеются. Но из-за того, что процессинг не завершён, работать с программой и книгой в целом невозможно! В MV программы странички не появляются. Вышел из положения тем, что появившиеся файлы а папке импортирования, вручную перекинул в программу, после чего все они появились в MV, и вот теперь попробую с ними поработать. Но самое странное, что, выполнив Ваши инструкции, процессинг также не завершается, а остановился на 28 файле из 30.
 
У меня версия 7.0, может быть на версии 7.03d, как у bolega и его избранных всё получается, не знаю...
 
Поэтому решил Ваш файл обработать своим старым любимым методом, работающем на всех версиях SK. Результат выложу позднее.
 
Благодарю
 
 
Добавлено:
Уважаемый bolega!

Цитата:
 
vilteb  
Качество печати жуть. Такое лучше оставлять в сером. Но если бинаризовать, то максимум, что у меня получилось: https://workupload.com/file/F76ks3Z6QJY

 
Это позор! Такой результат не достоин достоинств SK! Я полагал, что у Вас как мастера что-то выйдет более толковое. Однако возможности SK никто пересилить не сможет. Не знающий SK, посмотрев такой результат, разочаруется в самой программе. Честнее было бы признать, что при всех огромных возможностях SK - программа не всемогущая и у неё есть предел. Такие сканы не поддаются обработке в SK, разве что, имея большое количество страниц подобного ужасного материала, ситуацию можно исправлять глифами, после чего получишь приемлемое качество выходного файла PDF или DjVu.
 
С уважением





Неуместный религиозный контекст

Всего записей: 128 | Зарегистр. 26-03-2024 | Отправлено: 10:00 09-06-2025 | Исправлено: Maz, 20:13 09-06-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Такие сканы не поддаются обработке в SK

сказали же, что это не сканы, а ксерокс. Да еще какой-то институтской методички. Вы наверно не знаете что такое советская институтская печать, а беретесь судить.

Цитата:
Честнее было бы признать, что при всех огромных возможностях SK - программа не всемогущая и у неё есть предел.

лично я нигде про всемогущество не писал )) Это скорее к вам вопрос

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 11:30 09-06-2025
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
 
Уважаемый bolega!
 
Ну что Вы так обижаетесь? Я же просто высказал свое мнение по поводу Ваших действий. Но, подождите, благородный asku дал мне интересное задание, о нем я писал в предыдущем комменте, и я увидел такое, что даже и не ожидал. Потерпите, ин шэ Аллаh, сегодня отпишу результат! Думаю, Вам будет очень интересно.
 
С уважением
 
 
Добавлено:

Цитата:
сказали же, что это не сканы, а ксерокс.

А какая разница между ними, это сканер и принтер в одном аппарате...

Всего записей: 128 | Зарегистр. 26-03-2024 | Отправлено: 12:01 09-06-2025 | Исправлено: zbolv, 12:06 09-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
zbolv
это сканер и принтер в одном аппарате

Прежде чем что-то тут писать, сходите подучите матчасть.
В институтских типографиях стояли множительные аппараты, делающие копии с оригинал-макета. Тираж - не более 1000 экз. Метод - электрографическая печать.  Условно говоря, наэлектризованный согласно черноте оригинал-макета барабан обмазывался порошком и делал оттиск на рулоне или листе. Почти ничего общего с современным сканированием в цифру в ОЗУ и лазерным восстановлением заряда на пленке.

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 13:16 09-06-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
импортировать Ваш PDF SK до конца отказывается

Да, при импорте pdf СК сильно кушает память. Это не столько баг, сколько результат кэширования. Может быстро привести к нехватке памяти. asku недавно подкинул мне интересный пример pdf размером >4 Gb. СК быстро на нем издох.
Я пересмотрел код, и отказался от кэша при импорте. Сейчас импорт почти не жрет память и может обработать файл любого размера. Надеюсь, новая версия скоро  выйдет. Осталось 2-3 бага, которые я никак не могу победить, и не знаю причин этого. Если не справлюсь, тянуть больше не буду, выложу что есть.

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 13:36 09-06-2025
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
 
TelecomUral
 
Совершенно с Вами согласен, но дело  в том, что суть заключается лишь в технологии нанесения изображения на выходящий лист бумаги. Однако в принципе всё то же самое. Ведь ксерокс, пусть советский или современный, это всего лишь название американской фирмы выпускающий множительные аппараты. И ранее они были с таким принципом печати на бумагу, как описали Вы, но современные - уже печатают лазером с использованием фотобарабана. Но, главное, автор vilteb, выложивший этот ужас, ведь представил нам не сам бумажный лист со старым принципом печати изображений, а отсканировал его современными средствами. Таким образом, как ни крути, мы имеем дело в людом случае со сканами!
 
Уважаемый bolega!

Цитата:
Если не справлюсь, тянуть больше не буду, выложу что есть.

 
Вот это то, что мы давно ждём!
 
Задание благородного aslu, я как всегда хотел делать в моём любимом BMP - нехватка памяти, но теперь перешёл на ТИФФ, и вроде бы дело пошло, ма шэ Аллаh!
 
C уважением
 
 
 
 





Неуместный религиозный контекст

Всего записей: 128 | Зарегистр. 26-03-2024 | Отправлено: 14:07 09-06-2025 | Исправлено: Maz, 20:13 09-06-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп последний раз

Цитата:
zbolv
Таким образом, как ни крути, мы имеем дело в людом случае со сканами!

... сделанными с оригинала, сделанного же на затертом фотобарабане. Проверните любой оригинал через современнейшую технику раз хотя бы пятьдесят, то есть бумага-ксерокопия-ксерокопия2-..., затем посмотрите на результирующий скан. Даже десятка раз хватит.
 
Добавлено:

Цитата:
bolega
Осталось 2-3 бага, которые я никак не могу победить, и не знаю причин этого.

может, помощь в тестах нужна? свежий взгляд на проблему часто помогает.

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 14:26 09-06-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru