Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39616 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
заставить СК зоны беспотерьного кодирования автоматом расставлять ?

А его и заставлять не надо.
Создаете нужный Вам профиль и подсовываете его в СК.

Всего записей: 7278 | Зарегистр. 14-01-2005 | Отправлено: 12:16 13-11-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
daa2013
по мне так избыточно заставлять СК делать коррекции кодирования. Это удаление гланд через задний проход.
Надо разобраться с кодировщиком, отстроить его, убедиться что кодит 100% как требуется. И всё.
В любом случае придётся детальнейшим образом разбираться, как именно косячит кодер, чтобы отловить отличие. Может, вы одно заметили, а три других варианта упустили, и СК сработает все равно впустую.

Всего записей: 3605 | Зарегистр. 15-07-2010 | Отправлено: 12:48 13-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
две зоны сляпать (левая и правая половины разворота) и потом их размножить в out-task. Раньше уже был совет от bolega по аналогичному случаю.

 
Вот так сделал, не могли бы посмотреть?
Ссылка
 
Но вот с такой нумерацией не разобрался, не знаю, как зону поставить:

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 16:20 13-11-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
по мне так избыточно заставлять СК делать коррекции кодирования.

Какое отношение СК имеет к коррекции кодирования?
Ровно такое, как и DJVU Small.Во всех случаях работает только программа documenttodjvu.exe.
Какие ей дают входные параметры, то она и выдает на выходе.
Нужно только создать правильный профиль для конкретной задачи, а потом неважно, где это будет работать: в СК, в DJVU Small или в DEE.
Большой плюс СК в этом плане заключается в том, что есть возможность оперативно, или как сейчас любят говорить "онлайн", модифицировать, причем делать это быстро на одном наиболее проблемном скане, некоторые (но не все) параметры documenttodjvu, стараясь получить нужный вариант компиляции.
Недоступные для СК параметры требуют уже внесения изменения в соответствующий профиль.

Всего записей: 7278 | Зарегистр. 14-01-2005 | Отправлено: 16:38 13-11-2024 | Исправлено: shch_vg, 16:51 13-11-2024
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
Основной тест чернобелить не будете?

Всего записей: 617 | Зарегистр. 22-06-2016 | Отправлено: 17:03 13-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Основной тест чернобелить не будете?

 
Вы имеете в виду тот, что в рамке внутри серой полосы? Нет, наверное. Он как бы рисунком идет в книге. Основной текст в книге оформлен обычно.

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 17:11 13-11-2024
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Потому что невозможно в данном случае этот текст бинаризовать без потери отображаемого качества? Или другая причина?

Всего записей: 617 | Зарегистр. 22-06-2016 | Отправлено: 18:02 13-11-2024 | Исправлено: esys, 18:03 13-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Потому что невозможно в данном случае этот текст бинаризовать без потери отображаемого качества? Или другая причина?

 
Бинаризовать можно, но я думал
 сохранить "видимость" рисунка. Можно в конце при создании
Текстового слоя слить эти зоны.
 
В общем, это не проблема. А вот как сделать
то место, на которое я выше стрелкой указал, вот это интересно.

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 19:04 13-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
вот что у меня получилось https://workupload.com/file/GKTGNbgULcj
здесь исходное и out задания https://workupload.com/file/J6PW66NBSjB
после обработки понадобилось кое-какая постобработка: удаление лишнего, задание прозрачности для области текста
 
 
Добавлено:
daa2013

Цитата:
Джву-кодер непредсказуемо пожирает некоторые точки в формулах.  

этот вопрос уже обсуждался. В 2016 г. вы на него мне и отвечали
в profiles\documenttodjvu.conf нужно везде прописать
render-size=0
Но от удаления совсем мелких точек в режиме lossy это не спасет.  
Есть совет бывалых: использовать только lossless но предварительно 2-4 раза прогонять сканы через CPC, эффект якобы будет такой же, как от lossy.

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 21:01 13-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Спасибо, здорово получилось.
 
А что это за розовая рамка? Она и не двигается мышкой, кажется.  

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 22:58 13-11-2024
esys

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
через CPC

Это что?

Всего записей: 617 | Зарегистр. 22-06-2016 | Отправлено: 23:40 13-11-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say;
Цитата:
Это что?

 
CPC TOOL - тулза для упаковки с потерями TIFF-ов. По заверению авторов результат визуально не отличим (в принципе подтверждаю, но я мало тестировал эту тулзу). Особо не интересно, так как "вещь в себе", об алгоритме которой мало что известно.
 

Всего записей: 976 | Зарегистр. 18-05-2023 | Отправлено: 00:21 14-11-2024 | Исправлено: zvezdochiot, 00:22 14-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А его и заставлять не надо.
Создаете нужный Вам профиль и подсовываете его в СК.

 
Запаковать всю книгу без потерь не сложно. Важная фишка СК - паковать без потерь только проблемные участки. Проблема в том, как найти эти участки.  
 
Если у меня всего две точки пропадает, то зачем мне всю книгу без потерь кодить ?
Вопрос был о возможности автоматического определения зон потерь на основе сравнения черно-белых файлов до и после запаковки.
 
 
Добавлено:
Я когда-то сравнения в Beyond Compare  делал. Там сейчас новая версия вышла. Может, получится пакетом её работать заставить. ...

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 07:11 14-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
этот вопрос уже обсуждался. В 2016 г. вы на него мне и отвечали
в profiles\documenttodjvu.conf нужно везде прописать
render-size=0  

 
Спасибо, напрочь забыл.
Попробую так сделать

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 09:54 14-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
А что это за розовая рамка? Она и не двигается мышкой, кажется.

Рамка и есть. это аналог резаков. Если она задана, то резаки и deskew игнорируются. Ей удобно пользоваться, когда контент на сканах - на всей площади страниц (при этом определение габарита страницы автоматом СК практически невозможно), и нужно получить на выходе одинаковые размеры независимо от перекоса страниц. При обычном deskew СК поворачивает, при этом размер страницы увеличивается (по краям добавляются белые треугольники), это стандартное поведение вращателей. В случае же рамки за угол поворота берется сам угол наклона рамки, при этом ее вращение выполняется так, что размер остается постоянным и не зависит от угла наклона. В одном задании можно совмещать и резаки, и рамки.
В данном задании я нарисовал рамку на одной из страниц и скопировал ее на остальные, потом подвигал ее на них как надо, наклонять даже не потребовалось, т.к. сканы все ровные.

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 10:53 14-11-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
Проблема в том, как найти эти участки.

Допустим, что Вы нашли эти участки. А как создать зоны на них, если их много? Все равно придется делать это вручную.

Всего записей: 7278 | Зарегистр. 14-01-2005 | Отправлено: 15:49 14-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Могу только процитировать своё начальное сообщение, отправленное:   02:08 13-11-2024  
 

Цитата:
Вопрос. Может ли СК как-то самостоятельно опознать такие места и объявить их спецзонами ?  
Т.е. джву, разобрать, сравнить побитово, там где пропали обособленные чёрные участки (а не просто у букв пиксели изменились) - как-то подсветить и забрать в рамки. Рамки объявить спецзонами, автоматически взвести соответствующие галки ?

 
А, если таких мест мало, то можно и вручную.

Всего записей: 1174 | Зарегистр. 13-06-2013 | Отправлено: 00:11 15-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Рамка и есть. это аналог резаков.

 
А как узнать больше об этом? Я ничего не знал о такой возможности. Очень полезная вещь, судя по всему. Где в Хрестоматии об этом написано?
 
Добавлено:
В файле sk.7.00.whats.new.txt нашел инфу. Буду изучать.

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 23:26 15-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
А как у вас такая зона получилась? С таким «вырезом».
 

Всего записей: 695 | Зарегистр. 04-05-2016 | Отправлено: 13:37 16-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
включаете режим задания прозрачности (4-я кнопка после кнопки с красной метелкой) и выделяете нужную область, в момент отпускания мышки выделенный фрагмент становится дыркой (только в редакторе зоны).
В данном случае важно сделать дырку там, где текст.  
В out-задании с этой зоной есть еще один нюанс: в ней включил опцию add trasparency mask from image. Это для того, чтобы рамка, которая вокруг текста на странице, "вылезла" наверх и осталась черной. Если этого не сделать, то рамки будет не видно, она закроется закрашенной серым зоной

Всего записей: 4736 | Зарегистр. 09-09-2002 | Отправлено: 16:13 16-11-2024 | Исправлено: bolega, 16:32 16-11-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru