Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39178 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Экспериментально убедился, что проблема в старых диаграммах на исходном скане. Почему-то СК подставляет их в компиляцию. После ручного удаления их со скана дежавю создается в требуемом виде.

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 00:20 16-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
как вы получили диаграмму на странице, если у зоны галка "clear source area" установлена? Должно было быть чистое белое место.

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 04:35 16-10-2024
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Вы, наверное, делали Process! с диаграммами после предыдущего Process! (без диаграмм!). Поэтому предыдущие диаграммы мешают. Происходит двойное накладывание.  
Сделать надо всё с начала. С чистого листа.
Разделение зон здесь ни причём.

Всего записей: 1870 | Зарегистр. 15-06-2006 | Отправлено: 10:53 16-10-2024 | Исправлено: Benoni, 10:55 16-10-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Benoni
Спасибо за ответы на мои вопросы, только они в свою очередь рождают новые.
Главный из всех: где-нибудь написано, что при раздельном кодировании в СК место под диаграммой должно быть очищено? Мне такое уточнение, увы, не встречалось.
Если же это так, то почему такой же эффект не наблюдался под левой диаграммой, ведь под ней тоже была расположена диаграмма?
Теперь ответы на конкретные вопросы:
 
TelecomUral
Цитата:
как вы получили диаграмму на странице, если у зоны галка "clear source area" установлена?

Элементарно, Ватсон!
Берется уже обработанный дежавю или пдф, в СК из него извлекаются сканы, затем сторонней программой в файл spt по этим сканам заносится информация из сканов, в результате которой в задании появляются эксклюд-зоны на обнаруженных этой сторонней программой диаграммах. Далее остается средствами СК массово превратить эксклюд-зоны в пикчер, и мы имеем решение поставленного Вами вопроса.
 
Benoni
Цитата:
Вы, наверное, делали Process! с диаграммами после предыдущего Process! (без диаграмм!)

Это правда не вопрос, а предположение.
Как я выше написал TelecomUral никаких Process! я не делаю, а только выделяю файлы пикчер-зон в отдельную папку в виде pic.xxxx для дальнейшей работы с ними (создание по ним фен-файла, по которому в свою очередь создаются новые более красивые (на мой вкус!) диаграммы, которые заменяют старые менее красивые.

Цитата:
Разделение зон здесь ни причём.

В свете моего второго вопроса, может быть все-таки причем?
 
Решение возникшей у меня проблемы я как раз и нашел в пустом прогоне сформированного задания в другую папку с единственной целью очистить место под зонами в начальных сканах, но согласитесь, что это как бы лишнее действие в плане рассмотрения моего второго вопроса.
Предвосхищая дальнейшие соображения, сразу хочу сказать, что процесс создания файлов пикчер-зон в задании как правило гораздо более быстрый, чем обработка всего задания.

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 17:13 16-10-2024 | Исправлено: shch_vg, 17:22 16-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
shch_vg
где-нибудь написано, что при раздельном кодировании в СК место под диаграммой должно быть очищено?

а где-нибудь написано что не надо делать Process для раздельного кодирования
Вы умудряетесь использовать экскаватор как корабль и вопрошаете почему до сих пор не доплыли из Лондона в Нью-Йорк.

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 21:17 16-10-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Что-то Вы путаете божий дар с яичницей .
Какое отношение кодирование в рамках СК имеет к обработке (Process) в тех же рамках?
Я могу просто загрузить в СК ряд сканов и получить из них дежавю, не делая никакой обработки.
Не надо замыливать экскаваторами поставленный мной вопрос.
Можете объяснить, почему в приведенном мной примере левая диаграмма получилась нормальной, а правая плохой?
Обе диаграммы по очереди обрабатывались перед вставкой на страницу, но с разным сжатием текста.
Логично предположить, что в обоих случаях обработанные диаграммы помещаются на свое место на странице, затирая все, что под ними находится, не так ли?
Проверено, что тот же результат я получаю, если задам в настройках кодирование одинаковое сжатие для обеих диаграмм.

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 22:42 16-10-2024 | Исправлено: shch_vg, 22:45 16-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можете объяснить

не могу. и даже не хочу - это экскаватор а не корабль. и не замыливание, а попытка прояснения.

Цитата:
Логично предположить

нет, тут нет такой логики. Не затереть, а совместиться, смикшировать значения пикселей, и то логичнее - исходя из постулата "не потерять инфу". Я уж не говорю что играет роль z-порядок слоев. Зоны в дежавю помещаются ПОД чб текстом страницы.
Третий раз говорю: у вас возникают необоснованные фантазии "как по моему мнению должна работать программа". Услышьте. Вы фантазию принимаете за реальность. Реально в проге происходит иначе. И вместо того чтобы отловить и отказаться от фантазий и разбираться с реальностью (как действительно думал и сделал программист) - вы удерживаете фантазию (мыслесхему) и затем задаете вопросы, на которые другим нет смысла отвечать. Сначала мыслесхему обнулите, чтобы быть с другими на одной волне.
Если что-то крякает как утка, плавает как утка и выглядит как утка, это не обязательно утка.
 
upd
забыл ответить.

Цитата:
Какое отношение кодирование в рамках СК имеет к обработке (Process) в тех же рамках?

Прямое.  
Как вы должны знать, для получения правильного (или, лучше сказать, заданного, запланированного) результата кодирования надо не только правильно галки параметров выставить и правильные кнопочки нажать правильно, но и кодируемые данные должны быть в правильной кондиции. Например, если вы кодируете цветную обложку в BG44, а внутри тиффа обложки лежит чб гравюра - ну нелогично от вейвлетного алгоритма ожидать сохранения исходных пикселей.
Значит, кнопка Process что-то выполняет с данными, что влияет на кодирование. Или, скажем, может повлиять. Ну, ведь очевидно, что есть параметры картинок - цветность, размеры, взаимное местоположение - на которые Process  влияет точно, но и в изготовлении дежавю эти же параметры необходимо учесть.

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 04:43 17-10-2024 | Исправлено: TelecomUral, 05:11 17-10-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
В пример ваш не вникал, но если я правильно понял, вопрос про переобработку зоны. Нужно помнить: переобработка зоны никак не затрагивает ранее обработанную страницу. Опция clear under работает только при полной обработке скана.  
Если в итоге под зоной на ч/б странице остался контент или мусор, то в djvu он всегда "всплывет" наверх (в отличие от pdf). Это происходит из-за особенности формата djvu, и с этим ничего не поделаешь.  

Всего записей: 4596 | Зарегистр. 09-09-2002 | Отправлено: 09:34 17-10-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Почему-то я не получаю ответ на поставленный мной вопрос.

Цитата:
Можете объяснить, почему в приведенном мной примере левая диаграмма получилась нормальной, а правая плохой?

В обоих случаях внешняя зона интегрировалась в страницу.
Под обеими интегрируемыми зонами на странице были старые диаграммы.
Перефразируя мой вопрос, его можно сформулировать по-научному так:
Почему при создании дежавю различаются интеграции в страницу простых ч/б зон и зон с галкой на опции "separate b/w coding" ?

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 14:29 17-10-2024 | Исправлено: shch_vg, 14:52 17-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
по вопросу о галке separate bw coding.
предполагаю, прозрачность в процессе спецкодирования отличается от стандартной? Для левой диаграммы автом.прозрачности белого нет, для правой она есть.

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 16:53 17-10-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Вот это уже конкретный разговор .
 
Особенно наглядно видеть это, предварительно удалив под второй диаграммой на основном скане левую половину старой диаграммы.

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 19:45 17-10-2024 | Исправлено: shch_vg, 20:07 17-10-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Почему-то я не получаю ответ на поставленный мной вопрос.

Потому что у меня не было времени разбираться и я не скачивал ваш пример. Теперь вижу, что без этого не обойтись. Скачал, проанализировал. Здесь все отработало правильно, без багов. Почему результат именно такой, сейчас попытаюсь объяснить. При кодировании djvu СК первым делом все зоны, которые b/w (и не special-coding!), сливает с b/w-подложкой (т.к. и то, и другое - bw, соответственно, подавать на вход DEE нужно их объединение). Именно поэтому тот факт, что под левой зоной уже есть диаграмма, никак не сказывается на результате, т.к. при слиянии она замещается содержимым зоны. (Кстати, если бы левая зона была цветной, то результат был бы другой, а именно такой, как я описал в своем предыдущем посте). Special-coding зоны не сливаются, вместо этого они кодируются независимо от страницы и потом получившиеся из них блиты вклеиваются в результат кодирования DEE. В итоге из-за вклеивания в результирующем djvu будут одновременно и блиты зоны, и блиты того, что под ней было. По сути получается такой же эффект, как если бы в правой зоне включить transparency.  
 
 
Добавлено:
TelecomUral

Цитата:
предполагаю, прозрачность в процессе спецкодирования отличается от стандартной? Для левой диаграммы автом.прозрачности белого нет, для правой она есть.

не отличается. Прозрачность получается не специально, а происходит как результат объединения двух наборов блитов: после DEE и после раздельного кодирования зоны.

Всего записей: 4596 | Зарегистр. 09-09-2002 | Отправлено: 20:08 17-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
при слиянии она замещается содержимым зоны

а если бы левая зона была с прозрачностью? стало бы ровно так как на правой?

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 20:18 17-10-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а если бы левая зона была с прозрачностью? стало бы ровно так как на правой?

конечно. Все логично.
Просто в реальности такого случая как здесь, как правило не должно быть, т.е. под ч/б зоной не должно быть ч/б контента, в случае djvu это бессмысленно. В pdf - пожалуйста, там работает принцип z-порядка зон/слоев.
 
Добавлено:
в принципе, чтобы сделать единообразно, можно для случая b/w separate-coding непрозрачной зоны чистить все что под ней, раз уж СК не выполняет для нее слияние. Просто такой вариант я никогда не рассматривал.

Всего записей: 4596 | Зарегистр. 09-09-2002 | Отправлено: 20:21 17-10-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Спасибо за разъяснение!
При нормальной обработке такого не должно происходить, это понятно.
При описанном мною TelecomUral процессе замены диаграмм старые диаграммы с исходных сканов не удаляются. После перевода эксклюд-зон в пикчер есть возможность, не прогоняя обработку всего задания, быстро получить только файлы диаграмм для дальнейшей работы с ними.
Нет ли сейчас возможности автоматически отмаркировать только страницы с диаграммами, чтобы запустить в обработку только их?  
Во многих случаях их заметно меньше, чем общее число страниц.
 
Добавлено:
bolega
Вариант моей нынешней обработки таков: после перевода зон в пикчер, я маркирую все вновь образованные зоны, указываю выходной для файлов зон исходную папку и делаю обработку только пикчер-зон. Если бы такая обработка зон реагировала на проставленный в них признак чистки под зонами, то это вообще бы был идеальный вариант.
Нельзя ли это учесть в последующих вариантах программы?

Всего записей: 7217 | Зарегистр. 14-01-2005 | Отправлено: 20:57 17-10-2024 | Исправлено: shch_vg, 21:05 17-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
чистить все что под ней

в такой формулировке, имхо, неверно. При стирании должна одинаково работать непрозрачность. Допустим, правая диаграмма прозрачна наполовину. Ее нижняя половина прозрачна, а верхняя белая (и черные пиксели тоже везде есть). Мне кажется что правильнее сначала на странице стереть то что под непрозрачными областями (белыми и черными точками), затем закодить страницу, закодить зону, и слить блиты зоны со страницей.

Всего записей: 3377 | Зарегистр. 15-07-2010 | Отправлено: 06:29 18-10-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
При стирании должна одинаково работать непрозрачность.  

это подразумевается. и я же не зря написал "непрозрачной зоны".
 
Добавлено:

Цитата:
Мне кажется что правильнее сначала на странице стереть то что под непрозрачными областями (белыми и черными точками), затем закодить страницу, закодить зону, и слить блиты зоны со страницей.

все так
и когда я писал выше, что "под ч/б зоной не должно быть ч/б контента", имелось ввиду не должно быть совпадения черных пикселей зоны и страницы. Если же они не совпадают (зона задумана как прозрачная), то это вполне нормально.

Всего записей: 4596 | Зарегистр. 09-09-2002 | Отправлено: 07:51 18-10-2024 | Исправлено: bolega, 08:03 18-10-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Прошу подсказать.
Нужно сделать всю страницу цветной. Делаю это в режиме out с помощью зону с типом Special. Указываю нужный цвет. Но на выходе дежавю-страница белая. Почему?
 

 

 
Вот sub-task:
Ссылка
 
Добавлено:
Все, понял. В свойствах зоны нужно было убрать прозрачность.

Всего записей: 613 | Зарегистр. 04-05-2016 | Отправлено: 15:00 28-10-2024 | Исправлено: asku, 15:01 28-10-2024
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В свойствах зоны нужно было убрать прозрачность

где это?

Всего записей: 1870 | Зарегистр. 15-06-2006 | Отправлено: 09:26 29-10-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
где это?

 
На первом скриншоте галочка Transparent.

Всего записей: 613 | Зарегистр. 04-05-2016 | Отправлено: 12:15 29-10-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru