Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
При включенном режиме remove speckles that touch the pasted image  часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).  

Сделал защиту от такого удаления.
 
kamenkapenza

Цитата:
Значит выходит так, что, если делать обрезание и установку полей в другой программе (Тейлоре) , то это влияет на качество, т.е. вызывает его потерю.

Про качество не знаю, но на иллюминацию влияет. Ее желательно исправлять до добавления полей

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 21:28 06-12-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega добрый вечер. Прошу в новой версии СК по возможности расширить выбор символов в вываливающемся меню. Удобная штука.
Вот например, там, где предлагается «и», чтобы было и «й»; там где есть «о», там вместо нее СК бы предлагал еще и «р» и «б».
 


Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 23:53 12-12-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А может вообще дать пользователю возможность это редактировать ? Импортировать некую "таблицу замен" взамен дефолтной, а потом, когда не надо сбросить обратно. Иногда такие вычурные сбои бывают. И регулярные притом.
UPD: для данной конкретной книги регулярные, что-нибудь типа   "з-ц"

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 15:20 13-12-2022 | Исправлено: daa2013, 19:29 13-12-2022
karst

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите как настроить эту программу, чтобы она выполняла только четыре операции и ни в коем случае ничего больше не трогала?
Нужно
1. Разрезать развороты
2. Выровнять разрезанные страницы
3. Обрезать страницы по заданной рамке (размерам)
4. Сохранить полученный результат ничего не меняя ни в цвете, ни в чем нибудь другом
 
Развороты как правило цветные, 600 dpi

Всего записей: 343 | Зарегистр. 05-07-2008 | Отправлено: 00:35 15-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
karst
Хрестоматию читали? В СК разбираетесь (что-то делали уже)? А то довольно много объяснять придётся.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:46 15-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
решил я все-таки разобраться, что такое изменилось в djvulibre версиях 3.5.27-3.5.28, что код СК перестал быть совместим с ним. Пока что обнаружил две вещи: 1) ошибка при извлечении чанка INCL в случае если его нет, т.е. когда djvu вообще не содержит словарь. В версии 3.5.25 djvulibre просто не извлекает этот чанк, более поздние версии возвращают ошибку. Ладно, пусть будет ошибка.  
2) оказалось, при создании djvu из отдельных файлов-чанков чанк имя файла INCL в новых версиях не должно содержать пути! Это очень странно, т.к. для всех остальных типов файлов djvulibre ожидает в командной строке полное имя. Ладно, формирую командную строку с чанком INCL без пути. Как и ожидалось, возникает другая ошибка, типа INCL-файл не найден, что и следовало ожидать. Выход только один - запускать djvulibre, предварительно делая папку с INCL-файлом текущей папкой операционной системы. Так все начинает работать.
Вот фрагмент кода Леона Боту djvumake.cpp:
старая версия 3.5.25 (из командной строки из полного имени файла извлекается только имя):

Цитата:
else if (!dargv[i].cmp("INCL=",5))
{
create_incl_chunk(iff, "INCL", GURL::Filename::UTF8(5+(const char *)dargv[i]).fname());
}
 

новая версия 3.5.27 (из командной строки просто берется имя какое есть):

Цитата:
else if (!dargv[i].cmp("INCL=",5))
{
 create_incl_chunk(iff, "INCL", (const char *)GUTF8String(dargv[i].substr(5,-1)));
}  

Дальше по коду идет проверка, что в имени нет символов /\\ , если есть (а в полном пути они обязательно есть), djvumake считает это катастрофой и вылетает, вместо того, чтобы просто отбросить от имени файла его путь, как это было в предыдущих версиях.  
Интересно, что такая трактовка имени применяется только к одному типу чанка.
 
После того, как я подстроился под эти изменения, СК нормально сгенерировал сложный djvu-файл. Буду еще тестировать, возможно, что еще чего-нибудь вылезет.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 21:40 15-12-2022 | Исправлено: bolega, 08:17 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
теперь у вас в СК нормальный ocr. Вы запланировали сделать генерацию гиперссылок?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:41 16-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Вы запланировали сделать генерацию гиперссылок?  

Уже сделал. И генерацию оглавления для djvu сделал. Но вы же видели какой там убогий интерфейс. Я сам с трудом пользуюсь. Возможно, когда-нибудь дойдут руки причесать там все.  
Была попытка еще автоматизировать задание гиперссылок, которые представляют собой номерные ссылки по тексту и отсылающие куда-нибудь в конец книги или в конец главы. Для этого в функционал поиска добавлен поиск возрастающей последовательности номеров, потом результат поиска копируется в окно гиперссылок и там парсится и расставляется. Но остались проблемы.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 08:46 16-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
он не убогий он сильно нетривиальный в использовании. А идеи заложены толковые.
 

Цитата:
bolega
Уже сделал.

ухх! здорово

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 09:03 16-12-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
А можно все обработки в фоновый режим убрать - примерно как фоновое распознавание в ФР8, чтобы можно было работать с уже обработанными файлами?
И еще непонятка или я что-то неверно делаю - но в последней версии (6.8) мусор из-за пределов страницы (резаков) попадает на обработанные страницы тоже за пределы вырезанной части на добавляемые поля. Как так?

Всего записей: 3671 | Зарегистр. 17-09-2001 | Отправлено: 19:24 16-12-2022 | Исправлено: niccolo, 20:26 16-12-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo

Цитата:
Как так?

Что делать, если ScanKromsator не делает то, что хотелось бы...

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 20:41 16-12-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 

Цитата:
Что делать, если ScanKromsator не делает то, что хотелось бы...  [?]

 
Спасибо за напоминание. Похоже сам ошибся - после обработки последняя версия сама определяет границы текста а весь мусор между текстом и резаком из оригинала выносит на поля....

Всего записей: 3671 | Зарегистр. 17-09-2001 | Отправлено: 21:26 16-12-2022
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И генерацию оглавления для djvu сделал.

Отлично! Спасибо, bolega

Всего записей: 1780 | Зарегистр. 15-06-2006 | Отправлено: 01:21 17-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Отлично! Спасибо

Функционал не скоро появится в публичном СК (если вообще появится), так что не за что...

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 11:48 17-12-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, а когда примерно новая версия появится?)

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 12:33 17-12-2022
karst

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Хрестоматию читали? В СК разбираетесь (что-то делали уже)? А то довольно много объяснять придётся.  

Если для выполнения трех стандартных операций приходится "довольно много объяснять" то значит с интерфейсом программы есть серьезные проблемы.
 
У ABBYY  Разрез разворотов и Выровнивание страниц задаются на одной вкладке и прекрасно решаются, но вот нормальной автоматической обрезки нет

Всего записей: 343 | Зарегистр. 05-07-2008 | Отправлено: 13:38 17-12-2022 | Исправлено: karst, 13:41 17-12-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
karst

Цитата:
Если для выполнения трех стандартных операций приходится "довольно много объяснять" то значит с интерфейсом программы есть серьезные проблемы.

Вам шашечки или ехать?

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 14:33 17-12-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не скоро появится в публичном СК

Хорошая когда-то вышла вещь, к Новому Году новая версия Кромсатора
 
Если что нужно по тестированию фич - у меня новогодние праздники довольно свободны оказались. Дней пять полноценно можно наскрести. Именно ocr и автоглифы я не приветствую, не лежит у меня душа к массовым заменам. Но ради полноценных тестов можно и ими заняться, благо пару-тройку книжек считаю нужным опубликовать, из последних посканенных.
 
Добавлено:

Цитата:
karst
значит с интерфейсом программы есть серьезные проблемы

зато нет проблем с отсеиванием "пользователей".
 
Подробнее...

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:38 17-12-2022
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
karst
https://elarscan.ru/modelnyj-ryad/programmnoe_obespechenie/elar-skanimidzh/
 
И прекращайте уже фигнёй страдать...

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 16:17 17-12-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Именно ocr и автоглифы я не приветствую

если вы против ocr, тогда к чему этот вопрос:

Цитата:
нормальный ocr. Вы запланировали сделать генерацию гиперссылок?  

А вот к автоглифам я тоже с опаской отношусь, это тот же инь/янь только в квадрате Но это меня не останавливает. В некоторых книгах такое ужасное качество текста, что противно смотреть, глифирование единственный способ улучшить. Поэтому в новой версии даже появилась функция, кот. условно пока назвал glyph word replace player. СК меняет текст скана, слово за словом, делая небольшую паузу между ними, а пользователь просто следит за процессом, в любой момент его можно остановить и отменить, продолжить, ускорить или замедлить.
 
asku

Цитата:
а когда примерно новая версия появится?)

Думаю, до НГ дам уже бету потестировать
 
niccolo

Цитата:
А можно все обработки в фоновый режим убрать

я подумаю над этим

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 17:18 17-12-2022 | Исправлено: bolega, 17:45 17-12-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru