Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.99 | ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39008 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: daa2013, 16:41 19-05-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чуваки, мощно задвигающие и раздвигающие!
 
Завершил работу над красивой книгой, которой 30 лет. Моя жена постоянно пользуется ею, считая ее полезной в любые времена истории, а потому книга пришла в жалкое состояние. Решил оцифровать её. Сканировал специально уродливо, чтобы проверить, как SK сможет справиться с таким заданием. SK оказался как и всегда на высоте. Работу сохранил в PDF и DjVu. В архив также положил источниковый файл, чтобы вы могли сравнить с тем, что было и как стало. Качайте с адреса: https://workupload.com/file/n5E5uCRDKNT
 
Рад буду любому комментарию: и специалистов высокого класса и специалистов неважных, потерявших авторитет на форуме, а также жалких завистников. Однако хотелось бы, чтобы при охаивании работы, свои суждения аргументировали, и, если возможно, указывали способы устранения ошибок. Мне это очень важно для совершенствования своего мастерства.
 
Жаль, что другие чуваки не выкладывают свои работы, чтобы можно было изучать их и учиться на них. Смотреть работы других чуваков на форуме очень интересно и полезно!

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 13:12 20-07-2024 | Исправлено: zbolv, 09:19 21-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это вроде бы уже обсуждалось.

Всего записей: 432 | Зарегистр. 22-06-2016 | Отправлено: 19:31 22-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
Это вроде бы уже обсуждалось.

Я не помню, чтобы это обсуждалось, но за Вашу реакцию благодарю. Изучил Ваше фото и сравнил с изображениями в DjVu и PDF. Указание на белые точки мне непонятны, потому, как я понимаю, это и есть особенность этих красных цветов с белыми точками, как снежинок, которые появляются вначале созревания цветков и потом исчезают. А вот указание на два черных пятнышка – это как раз свидетельство различия конвертации в DjVu и PDF. На PDF ясно видно, что это просто тень от двух цветков, переходящая в темноту. Ну а DjVu – таким образом представил это после конвертации. Я сознательно не брал в DjVu для картинок режим фото, иначе тогда размер выходного файла был бы одинаков с PDF – 65 Мб, и смысла тогда уже в DjVu нет никакого. Поэтому я выбрал оптимальный режим, получилось то, что получилось и размер файла – 18 Мб. Однако, при таком увеличении, как Вы представили, обычный читатель картинки не смотрит. Так смотрят только эксперты с форума Руборда и других, увлекающихся оцифровыванием книг. Если смотреть и сравнивать оба формата в страницу целиком или по ширине страницы, как обычно читаются книги, то, согласитесь, различие незначительное.

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 13:23 23-07-2024 | Исправлено: zbolv, 13:27 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
различие незначительное

тогда пдф не нужен.

Всего записей: 3257 | Зарегистр. 15-07-2010 | Отправлено: 13:35 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
тогда пдф не нужен.

В какой—то степени вы правы. Но PDF – это признанный в мире стандарт цифрового документооборота, очень небольшое число серверов органов власти России допускают DjVu, да и эстеты предпочитают его даже в ущерб размерам файла. DjVu предпочитают те, кто любит компактность размера файла и достаточную качественность изображений.

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 14:04 23-07-2024 | Исправлено: zbolv, 14:07 23-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я не помню, чтобы это обсуждалось

Это когда про автосегментацию говорили.

Всего записей: 432 | Зарегистр. 22-06-2016 | Отправлено: 16:21 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zbolv

Цитата:
Рад буду любому комментарию

1) Оглавление с ошибками - необходимо исправить
2) Часть изображений выглядит неестественно. Например на "Рис. 2. М иксбордер из однолетников и многолетников" (стр. 5 книги и стр. 9 файла) левая половина в исходнике - видно, что это что-то типа обыкновенных бетонных плит как в реальной жизни, а в обработанных файлах - такое впечатление, что песчаный пляж.
3) использование автосегментации при создании djvu, на что намекнул esys, выглядит, мягко говоря, спорным. И, да, это уже обсуждалось.
4) Исходник - это pdf размером 25 МБ, внутри которого, грубо говоря, jpeg2000 300 dpi. Непонятно, зачем было из этого исходника делать pdf с jpeg2000 с примерно в 2 раза бОльшим dpi и соответственно увеличением размера файла с 25 до 65 МБ. Скорость листания из-за в 4 раза бОльшего количества пикселей, естественно, также уменьшилась.

Всего записей: 798 | Зарегистр. 04-11-2019 | Отправлено: 16:45 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
дпи в джву скорее всего некорректный. Предполагаю что должен быть 600, а не 300, раз пикселей по высоте почти 4,7 тыс.

Всего записей: 3257 | Зарегистр. 15-07-2010 | Отправлено: 17:49 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прежде всего, благодарю всех, кто не остался равнодушным к моей работе.
 
esys

Цитата:
Это когда про автосегментацию говорили.

Прошу прощение, теперь вспомнил. Более того, покопался в этих вопросах и пришёл к выводу: а собственно говоря, чем плоха автосегментация, если в итоге она дет хороший результат. Просмотрел настройки в DjVu Small Mod в разделе «сегментация», попробовал ручную сегментацию, и честно признаться, кроме сложностей и увеличения размера файла, особой разницы не увидел.
 
jourmager

Цитата:
1) Оглавление с ошибками - необходимо исправить  

Здесь я не могу понять: какое оглавление? Книжное, т.е. в тексте книги в конце, или закладки, создаваемы вручную после изготовления книги? Просмотрел и то и другое, но ошибок не обнаружил. Если можете, разъясните, что имели в виду?

Цитата:
2) Часть изображений выглядит неестественно…

Здесь вы правы, но я сознательно пошёл на это, чтобы приукрасить реальность постсоветской действительности. Всё таки песчаный пляж более привлекателен, чем десятилетиями неремонтируемое дорожное покрытие. Как говорится, стало за державу обидно…

Цитата:
3) использование автосегментации при создании djvu…

Как я указал выше, без сегментации книга не делается, и, если авто дает неплохие результаты, то зачем усложнять ситуацию ручной?

Цитата:
4) Исходник - это pdf размером 25 МБ, внутри которого...

Здесь я с вами в корне не согласен, и не могу понять, откуда вы всё это взяли? Сканирование, как упоминал, делал сам, но никогда не использую  jpeg, я его не люблю! Все исходные сканы были только в bmp! И выходные файлы, соответственно, согласно настроек SK, были в dpi 600. Соответственно FR12, которым я только и пользуюсь, сделал то, что сделал. Хорошо, признаюсь. Прежде чем конвертировать выходные тифы в FR12, я сделал эту же книгу в PDF в SK, верно, получился  PDF легкого листания, но размер книги стал 140 Мб! Допустимо, если DjVu создал размер 18 Мб, а PDF – 140 Мб?
Потому я и остановился на FR12.
 
TelecomUral

Цитата:
дпи в джву скорее всего некорректный…

Все корректно, в настройках DjVu Small Mod указано именно 600 dpi!
Но все равно, благодарю за комментарии, было интересно всё проверить и понять истину!
 
Теперь хотелось бы увидеть работы других чуваков.

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 19:23 23-07-2024 | Исправлено: zbolv, 20:16 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
дпи в джву скорее всего некорректный. Предполагаю что должен быть 600, а не 300

Не понял. Что значит "скорее всего"? Безусловно некорректный.
Формат бумажной книги 70х90 1/16 что по ГОСТу соответствует примерно 170х215 мм.
Размеры страниц исходника 160,9х209,1 мм при dpi внутренних изображений = 300.
А размер страниц djvu 289,6x396,2 мм при dpi 300.
Тут надо учитывать, что поля электронной книги обрезаны по разумению книгодела, а не так, как в оригинале.

Всего записей: 798 | Зарегистр. 04-11-2019 | Отправлено: 19:35 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что значит "скорее всего"?

я просматривал дпи у трех страниц. Может остальные в 600.

Всего записей: 3257 | Зарегистр. 15-07-2010 | Отправлено: 19:36 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Тут надо учитывать, что поля электронной книги обрезаны по разумению книгодела, а не так, как в оригинале.

Вы правы, поля я всегда в своих книгах обрезаю, а не оставляю такими какие они есть в бумажном варианте, делая соответствующие установки в SK в MW. Я много читал бумажных книг, особенно в начале 2000-х годов. Но, когда появился SK, я перешёл исключительно на цифровые варианты. Вы все должны признать, что бумажный формат – это чтение книги напрямую, а цифровая книга – это чтение опосредованное. И я заметил, что цифровые книги, которые имеют размеры полей бумажных книг, читать на цифровых устройствах менее приятно, чем книги, в которых поля обрезаны до определенных размеров. Опытным путем установил, что самое приятное читать книги с обрезанными полями, которые использую я. Особенно это касается при чтении на планшетах и иных мобильных устройствах.
Некоторые любители цифровых книг, читаемых на могилках, считают, что вовсе не надо никаких полей делать, так как мобилки имеют функцию добавления полей к книгам нужных тебе размеров. Но я с ними не согласен!

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 19:44 23-07-2024 | Исправлено: zbolv, 19:48 23-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сканирование, как упоминал, делал сам

Выложите сканы 10 характерных страниц, чтобы другие попробовали сделать свои варианты, тогда сравним вес и качество.

Всего записей: 432 | Зарегистр. 22-06-2016 | Отправлено: 19:47 23-07-2024 | Исправлено: esys, 19:49 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zbolv
Здесь я с вами в корне не согласен, и не могу понять, откуда вы всё это взяли?

Зачем было спрашивать мнение, если потом его отбрасывать?  
Никого, думаю, тут не интересует, с чем вы не согласны. А если вы имеете готовое собственное твердо и железобетонно зафиксированное мнение, как должна быть сделана книга, то вам в другую ветку. Публикуйте и радуйте людей своими творениями. Здесь тема СК и его использования для изготовления книг. Вы полэкрана исписали темами, никак Кромсатора не коснувшимися. Что можно кодить книгу без него, всем скорее всего и без вас известно.
Ближе к теме ветки, плиз.

Всего записей: 3257 | Зарегистр. 15-07-2010 | Отправлено: 19:50 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Зачем было спрашивать мнение, если потом его отбрасывать?  

Я имел ввиду то, что ваше утверждение вовсе ни на чем не основано.
 
Добавлено:
TelecomUral

Цитата:
Вы полэкрана исписали темами, никак Кромсатора не коснувшимися. Что можно кодить книгу без него, всем скорее всего и без вас известно.  

Таким заявлением вы лишний раз показали свою низкую квалификации и то, что каждый раз вы свой авторитет всю более и более уничтожаете.
Свою работу я выложил именно потому, что делал ее в SK и хотел иметь мнение других людей, чтобы усовершенствовать свое мастерство в дальнейшем. Для этого и существует форум. И в целом я получил результат. А вы -  просто не знаете, как еще более утопить себя в низости непрофессионализма и отсутствия авторитета, при амбициозных представлениях о своем величии.

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 20:05 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сорри за оффтоп
zbolv
Про оглавление в закладках
Подробнее...
 

Цитата:
В архив также положил источниковый файл

Не путайте людей. Или это "источниковый файл" - сделанный в FR12 и имеющий внутри jpeg2000
или

Цитата:
Сканирование, как упоминал, делал сам, но никогда не использую  jpeg, я его не люблю! Все исходные сканы были только в tiff, а теперь я вовсе делаю всё только в bmp!

Так исходники в tiff или в bmp?

Всего записей: 798 | Зарегистр. 04-11-2019 | Отправлено: 20:22 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Оглавление в закладках

Здесь я согласен полностью, тогда разъясните, пожалуйста, что понимается под титульным листом в книгах?
 
Добавлено:

Цитата:
Так исходники в tiff или в bmp?

В bmp, просто перепутал, потому что много проектов, из которых есть еще ранее отсканированные в tiff. Я сейчас перегоняю всем вам источникрвые файлы, подождите чуток...

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 20:26 23-07-2024 | Исправлено: zbolv, 20:44 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сорри за офтоп
zbolv

Цитата:
разъясните, пожалуйста, что понимается под титульным листом в книгах?

Возьмём для примера файл "Как вырастить цветы":
стр. 1 файла - обложка
стр. 2 и 3 файла - форзац (2 - оборотная сторона обложки, 3 - бумажная страница)
стр. 4 и 5 - двойной титул, где 4 - фронтиспис (т.к. есть картинка) и 5 - сам основной титул (титульный лист)
Титул - это мягкая бумажная страница, на которой обычно указан автор, название книги, издательство.
если бы 4-я стр. была только с текстом типа заглавия - это был бы авантитул, (контртитул) Сложно это всё.
стр. 6 - выходные сведения (выходные данные)
стр. 180 - выпускные сведения
стр. 181 и 182 - нахзац

Всего записей: 798 | Зарегистр. 04-11-2019 | Отправлено: 20:56 23-07-2024 | Исправлено: jourmager, 21:08 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
был бы авантитул

по-моему, авантитул это "второй титул" или "альтернативный титул". Следующая правая страница, оформленная сходно с титулом, но про начинающуюся за ним часть книги. Например, если в книге две крупных части, могут вставлять авантитул(ы). Но я могу и ошибаться, в книгах реально "сложно" бывает.
 
upd
подумал про "аванпост", то есть "вынесенный вперед пост". Может, авантитул это тот, что на лист раньше основного титула - ? Там где обычно логотипчик издательства (изд."Мир", например, всегда свой значок делало перед титулом). Изредка попадались книги с оформлением этого первого листка побогаче чем просто логотип.

Всего записей: 3257 | Зарегистр. 15-07-2010 | Отправлено: 21:01 23-07-2024 | Исправлено: TelecomUral, 21:27 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Возьмём для примера файл "Как вырастить цветы":  
стр. 1 файла - обложка  
стр. 2 и 3 файла - форзац (2 - оборотная сторона обложки, 3 - бумажная страница)  
стр. 4 и 5 - двойной титул, где 4 - фронтиспис (т.к. есть картинка) и 5 - сам основной титул (титульный лист)  
Титул - это мягкая бумажная страница, на которой обычно указан автор, название книги, издательство.  
если бы 4-я стр. была только с текстом типа заглавия - это был бы авантитул, (контртитул) Сложно это всё.  
стр. 6 - выходные данные  

Благодарю, отличная информация!
 
esys

Цитата:
Выложите сканы 10 характерных страниц, чтобы другие попробовали сделать свои варианты, тогда сравним вес и качество.

Качайте: https://workupload.com/file/Y4ZSVBUpYGB
 

Всего записей: 81 | Зарегистр. 26-03-2024 | Отправлено: 21:10 23-07-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru