Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.99 | ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 38954 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: daa2013, 16:41 19-05-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
В Pdf DEFLATE самое родное сжатие. Хорошо пакует малоцветку целиком без всяких разделений на слои и масок прозрачностей

Нуу... не знаю. Через прямой перенос словаря jb2 один в один получается получше.
Архивчик содержит несколько вариантов
- джву, сжатие словаря aggressive (потом делал lossless, получил 65кб)
- пдф СК
- его оптимизацию в акробате
- пдф из джву через djvutoy
- исходник tiff-lzw, но со слитыми зонами, три цвета в палитре.
Я не нашёл способа корректно загнать в пдф исходный тифф, файл получается не менее 220кб. Видимо, тупым ZIP сжатием. И по-моему такие эксперименты давно уже проводились.
 
https://disk.yandex.ru/d/5ZwIBLQpVm0mGg
 
Возможно, рисунки с ровной заливкой площади, типа рисованных мультфильмов, постеров, и будут ужиматься получше чем текст (буквы), но сомневаюсь.

Всего записей: 3203 | Зарегистр. 15-07-2010 | Отправлено: 17:24 15-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
получается получше.  
 

"Лучше" - это сколько? В цифрах желательно. И желательно, чтобы эти цифры имели отношение к нагрузке на "просмотрщик".
 
PS: "Неважно, сколько времени вы потратили на обработку, важно, сколько неприятностей ваша обработка доставила читателю".
 

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 17:29 15-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
файлы пдф, которые делает автор СК, на моей старой слабой машине летают. Мне этого достаточно. Спорить или высчитывать смысла не вижу.

Всего записей: 3203 | Зарегистр. 15-07-2010 | Отправлено: 17:52 15-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
смысла не вижу.
 

Ну ещё бы. Ты бы хоть малоцветку нормальную выложил, как в своих видео, чтоб не палиться, AAW. Три цвета, да ещё так аккуратно разбитые на фреймы. Ай-ай-ай.
 

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 18:00 15-09-2023 | Исправлено: zvezdochiot, 18:02 15-09-2023
dh0ine

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Помогите, пожалуйста, сделать из исходников готовую книгу (djvu или pdf без разницы). Либо объяснениями, либо под ключ. Моя почта - johnterry.27@mail.ru
Исходники-сканы: цветные, 200dpi, tif LZW, 1187 страниц, общий вес-3,72МБ.
 
У меня не получается в ScanKromsator 6.97 после нарезки сделать равные по размерам страницы. AutoMargins включена, пробовал Page width: и Auto и Fixed, Gap value разные ставил от 200 до 2000 - всё равно все страницы разных размеров. Где туплю?

Всего записей: 4 | Зарегистр. 24-10-2020 | Отправлено: 13:48 16-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dh0ine
в шапке описано что надо предоставить кусочек задания, sub-task. и как это сделать.

Всего записей: 3203 | Зарегистр. 15-07-2010 | Отправлено: 14:02 16-09-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dh0ine

Цитата:
Помогите, пожалуйста, сделать из исходников готовую книгу (djvu или pdf без разницы).  

 
А где взять Ваши исходники? Дайте ссылку, пожалуйста...

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 14:46 16-09-2023 | Исправлено: SVK2I, 14:46 16-09-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Я как-то просил реализовать накидывание битмапов друг на друга в СК  (папку с кучей картинок последовательно расставить поверх файлов существующего проекта, объявив их пикчер-зонами), но увы. Тгда можно было бы разделенные цвета воедино и собирать.  

Наверно, слишком мало информации дали. Нужно подробно описать что СК надо делать, где папку брать, как понять какие зоны к какому файлу относятся и сколько их, где СК брать координаты зон, да наконец, пример этих самых битмапов вместе с заданием, чтобы можно было бы протестировать. Вот это было бы по человечески.  
 
 
Добавлено:
 
К вопросу о скорости листания pdf. Вот недавний образец очень сложного случая: djvu и pdf для сравнения.
https://workupload.com/file/qULSQ8NnVRT
https://workupload.com/file/jUkRx3ZLpaU

Всего записей: 4501 | Зарегистр. 09-09-2002 | Отправлено: 20:06 16-09-2023 | Исправлено: bolega, 21:26 16-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
К вопросу о скорости листания pdf. Вот недавний образец очень сложного случая
 

С учётом, что определённая часть фрагментов - двухцветная, использование CCITT FAX конечно же даёт значительное снижение нагрузки, по сравнению с JBIG2, но как это отразиться на размере файла? - в процессе изучения. В некоторых случаях использование JBIG2 даёт лишь незначительный выигрыш по размеру и его использование не рационально.
Использование JPEG в качестве основного средства упаковки цветного контента так же вызывает определённые вопросы. По скорости и нагрузке JPEG значительно более щадящий, чем JPX (JPEG-2000), но особенности кодирования и последующего отображения склоняют именно в сторону JPX, именно из-за отображения, а не нагрузки. Но один JPEG другому JPEG-у - рознь. Это стандартный кодер плохо подходит к типографскому делу, но есть же "нестандартный": jpge - Research JPEG encoder. И вот jpge очень хорошо подходит для кодирования типографского материала, сохраняя при этом выигрыш по нагрузке.

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 20:39 16-09-2023 | Исправлено: zvezdochiot, 21:09 16-09-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Наверно, слишком мало информации дали. Нужно подробно описать что СК надо делать, где папку брать, как понять какие зоны к какому файлу относятся и сколько их, где СК брать координаты зон, да наконец, пример этих самых битмапов вместе с заданием, чтобы можно было бы протестировать. Вот это было бы по человечески.  

 
Да у меня таких-то книг и было всего пара штук. Фюгнерова, например, так делалась:
http://publ.lib.ru/ARCHIVES/K/KLIMOVA-FYUGNEROVA_Mirka/_Klimova-Fyugnerova_M..html
 
Дополнительный том. Птицы и звери так собирал:
http://publ.lib.ru/ARCHIVES/E/''Enciklopediya_dlya_detey''/_''EdD''.html
 
 
 
Есть ролик от  slava_kry
https://www.youtube.com/watch?v=egJ8IxCxbIg
 
и я в прошлом году текстовое описание в муках состряпал (там третья часть самая важная):
 
https://disk.yandex.ru/i/rR7Q5AEzY4sbaw
 
 
Но это всё прекрасно можно было бы внутри СК делать.
 
 

Цитата:
брать, как понять какие зоны к какому файлу относятся и сколько их, где СК брать координаты зон

Число файлов в исходной паке должно совпадать с числом файлов в накладываемой папке
001, 002, 003, и т.д.
Пиксельные размеры у них также должны быть одинаковые. Это всё забота пользователя, как обеспечить. СК же только наложить и собрать в pdf, djvu  остается.  

Всего записей: 1033 | Зарегистр. 13-06-2013 | Отправлено: 21:50 16-09-2023 | Исправлено: daa2013, 22:13 16-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
К вопросу о скорости листания pdf
 

Небольшое "исследование" компонент выложенного вами pdf, показало, что основная задержка приходится не на сами изображения, а именно на композит этих изображений (ни jpeg-и, ни ccitt fax-ы не тормозят). При перекодировании ccitt fax-ов в jbig2-и задержки удваиваются, т.е. нагрузка от JBIG2 примерно такая же, как от композита. При этом выигрыш в размере несущественный: 14311676 ccitt fax против 9491923 jbig2.
С jpeg-ами я разумеется делать ничего не стал, так как это никак уже не уменьшит плохость отображения.
 
PS: Использование масок прозрачности - это как раз и есть тот самый композит. Так что, ежели хотите, чтобы ваша pdf-ка была как можно более тормозной и доставляла читателю как можно более проблем, используйте маски прозрачности как можно чаще. Я же, будучи "древним", по старинке буду накладывать обрезанные иллюстрации поверх страницы без всяких масок прозрачностей. Да, я знаю, что такой метод применим не к любому материалу.
 

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 22:39 16-09-2023 | Исправлено: zvezdochiot, 22:55 16-09-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
 

Цитата:
Да у меня таких-то книг и было всего пара штук. Фюгнерова, например, так делалась:  
http://publ.lib.ru/ARCHIVES/K/KLIMOVA-FYUGNEROVA_Mirka/_Klimova-Fyugnerova_M..html  
 Дополнительный том. Птицы и звери так собирал:  
http://publ.lib.ru/ARCHIVES/E/''Enciklopediya_dlya_detey''/_''EdD''.html  

 
Пока был в отпуске (купался в бане), внимательно читал комментарии к прекраснейшей из программ оцифровки книг SK.
 
Скажу следующее: эта программа создавалась для обработки сканов таким образом, чтобы в итоге можно было бы повторить оригинал, и при этом обеспечить минимальный размер книги.
 
И вот, что увидел: взял из комментария daa2013 ссылки на Атлас созвездий - Shimbalev(2003) – размер файла 146 Мб, количество страниц – 233.  
Энциклопедия для детей. Том 01 – размер файла 222 Мб, количество страниц -  694.  
 
Посмотрел, думал увидеть работы прекрасных мастеров этого форума, а увидел работы ключницы, а не мастера.  
 
Много ума не надо, чтобы фотосканы просто обрезать SK, а потом упаковать в DjVu или PDF. Разве автор программы только для этого создавал прекраснейшую программу? Для таких поделок достаточно ST.
 
Я считаю, что эти работы позорят прекрасного автора – bolega с его замечательным SK!
 
И вот для примера я нашел на просторах Интернета аналогичную работу, но сделанную SK версией 5.92: Библейская энциклопедия – размер файла 28.6 Мб, количество страниц – 353. Посмотрите все эти работы и сравните! Скачать можете с адреса: https://disk.yandex.ru/d/41gdZ4TNUNjC2Q
 
Чувствуете разницу? И это было сделано прекраснейшей программой SK версии 5.92.
 
 

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 15:16 17-09-2023 | Исправлено: SVK2I, 15:43 17-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVK2I say:

Цитата:
 
Много ума не надо, чтобы фотосканы просто обрезать SK, а потом упаковать в DjVu или PDF.
 

В определённой мере соглашусь (но только очень частично). От SK я ожидал в результате увидеть некий макет страницы (т.е разделение её на области), где каждая из частей обработана по своему и закодирована отдельно. Может быть в плане обработки всё именно так и было, но в плане кодирования никакого макета обнаружено не было, только применение масок прозрачности. Этого достаточно для DjVu, но для PDF это лишь поверхностная обработка. Такие вот дела.
 
PS: Иными словами, в SK есть всё необходимое для воссоздания структуры исходного издания. Но такого воссоздания не производится, что в свою очередь значительно снижает ценность результата.

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 16:00 17-09-2023 | Исправлено: zvezdochiot, 16:07 17-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Этого достаточно для DjVu, но для PDF это лишь поверхностная обработка

аргументируйте
внешний вид ориг/джву/пдф идентичен.

Всего записей: 3203 | Зарегистр. 15-07-2010 | Отправлено: 16:10 17-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
 
внешний вид
 

Именно, что только внешний вид. Только!
zvezdochiot say:

Цитата:
 
что в свою очередь значительно снижает ценность результата.  
 


Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 16:12 17-09-2023 | Исправлено: zvezdochiot, 16:14 17-09-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Всего записей: 3203 | Зарегистр. 15-07-2010 | Отправлено: 16:30 17-09-2023 | Исправлено: TelecomUral, 16:39 17-09-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
оффтоп





Нарушение п. 2.4. главы VIII Соглашения по использованию
Нарушение п. 2.12. главы VIII Соглашения по использованию
Запрета на пост захотелось?

Всего записей: 654 | Зарегистр. 18-05-2023 | Отправлено: 16:40 17-09-2023 | Исправлено: Maz, 07:41 18-09-2023
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...
Многоуважаемый, глубокоуважаемый bolega!
 
Нужна Ваша помощь, вернее разъяснение ситуации, которая возникла у меня в эти два праздничных дня. Помогая одному товарищу с форума, мы проводили эксперименты с Вашей программой. И возникла необходимость исходные файлы без обработки, но с обрезкой, чтобы были страницы одинаковые, получить на выходе, чтобы затем превратить их в DjVu и PDF.
 
Подробнее...
 
И вот, на выходе получили сканы, которые я вставил в Лизард (принципиально пользуюсь только им), он вставил все файлы, кроме второго, который упорно вставлять не пожелал, выдавая ошибку. Все остальные файлы принял и создал замечательный DjVu.
 
При создании PDF (использую принципиально FR12), все страницы были приняты и создан файл PDF.
 
Тогда я взял DjVu Small, та же история: принял все файлы, но конвертировать отказался вовсе. Но когда я удалил из его задания второй файл, то конвертация прошла успешно.
 
Подробнее...
 
Субтаск здесь: https://workupload.com/file/wKJ6f47uu7e , если нужно все мое задание, то можете скачать с адреса: https://f58.workupload.com/download/aPhKLHSkKy4
Подробнее...




Нарушение п. 1. главы VI Соглашения по использованию

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 17:25 17-09-2023 | Исправлено: Maz, 07:46 18-09-2023
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DjVu Small, Лизард, DjVu Imager ,... Было раньше такое. Я теперь ими не пользуюсь, в самом Кромсаторе создается замечательное DjVu. А PDF я создаю путем конвертации из DjVu программой  DjVuToy_eng. Получается 2 замечательных качественных формата! Не нужно никакое Адобе, ФР и тому подобное. Скан Кромсатор самодостаточная программа, даже PDF можно ей создавать, но я не знаю как (как то попробовал, ни фига не получилось), видео по этой теме никто не выкладывал (видимо тоже никто не знает,как это делается). Единственное неудобство для меня что в программе нет пути создания геометрической составляющей страниц подобного конкуренту (ST) через определение полезной области и установление полей (с важной функцией "Выровнять размер с остальными страницами") плюс к тому (в версии Эдвансед есть установка "Оригинал", которая выводит текст так, как он должен быть: с отступом сверху, по центру или снизу, а так же влево, вправо).  Приходится (в виду удобства) пользоваться ST при установке геометрических составляющих книги (полезная область, поля, размер страницы).  Было бы очень удобно, если бы всё-таки на первом этапе обработки книги (я её называю геометрическая составляющая) кроме задействования резаков можно было бы перейти на другой функционал (Исправление ориентации, Разрезка страниц, Полезная область, Поля), что полностью бы перекрыло потребности пользователей-книгоообработчиков: кто хочет облуплять яйца с тупого конца пусть пользуется резаками, а кто с острого - через Полезную область, Поля, Выравнивание страниц. ))) Это было бы супер грандиозно, браво-брависсимо, нескончаемые овации и Нобелевская премия по программированию.

Всего записей: 674 | Зарегистр. 23-05-2021 | Отправлено: 22:58 17-09-2023 | Исправлено: kamenkapenza, 23:26 17-09-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru