Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Вот еще один советчик-доброхот появился.  
Прежде чем делать подобные заявления, лучше еще раз ВНИМАТЕЛЬНО прочитать первоисточник.

 
Я прочитал первоисточник, но заявил своё мнение.
bolega сам пишет, что это задача непростая.
Более того, весь современный Image Processing --- англоязычный. Так зачем тратить время?
С другой стороны, SK --- это мощный продвинутый инструмент и предполагает работу пользователя, который разбирается в терминологии. Я это написал не как совет и не для получения замечаний.
 
Вопрос по теме: как в 6.5.2 отключить русскоязычный перевод во всплывающих подсказках, которые возникают при наведении курсора мыши на элементы управления?

Всего записей: 622 | Зарегистр. 24-12-2005 | Отправлено: 22:29 27-07-2020 | Исправлено: AKazak, 22:30 27-07-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AKazak

Цитата:
Вопрос по теме: как в 6.5.2 отключить русскоязычный перевод во всплывающих подсказках, которые возникают при наведении курсора мыши на элементы управления?

Никак
 
Добавлено:
В новой версии я сломал авто-позиционировании глифа при вставке. Причем только если вставка выполняется перетаскиванием мышкой. По двойному щелчку или горячей клавише все нормально. В этом году я больше не планировал новых версий, но из-за серьезности бага придется выпускать новую версию с исправлением. Впрочем, похоже кроме AAW это никого особо не интересует.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 09:30 28-07-2020 | Исправлено: bolega, 08:28 29-07-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В новой версии я сломал авто-позиционировании глифа при вставке. ... Впрочем, похоже кроме AAW это никого особо не интересует.

 
bolega
 
Вы знаете, я уже смирился, что с глифами я работаю в 6.00.5, с постеризацией - в 6.42, с автолевелами бинаризации - 6.5.1. У меня также недавно был глюк, что пдф не разобрался на картинки в 6.5.2, но разобрался в 6.00.5 (сорри, но так и не заготовил пример).
Что объединение страниц в разворот было в 5.92, а больше этой функции и нету. По слухам, также была непубличная версия, в которой промелькнула автоматизация сборки индексов в джву. Но её буквально пара человек получили. И, как мне кажется, даже не все из них в её работе разобрались.
 
Но это всё, безусловно, всем нужно.
Будем ждать, когда появится интегральная (интегрированная) версия.
 
Лично у меня стоит 5 версий кромсаторов. И я, когда мне надо, тот или иной для нужной операции задействую. А по второму или даже по третьему разу те или иные фичи просить, простите, но ИМХО моветон.
 
 
 

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 17:04 29-07-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Впрочем, похоже кроме AAW это никого особо не интересует.

да это просто я такой безбашенный, что ролики пишу и выкладываю. Пусть некрасивые, но других-то нет. А так ведь многие с СК работают. Я специально не рекламирую свежие выпуски, чтобы смотреть - каков реальный спрос на мои поделки. У 18го уже 20 просмотров, и это в летнее затишье.
И у меня тоже на рабочем столе несколько версий программы. 5.95 потому что надо выпустить описание как с гиперлинками работать, daa2013 давно просит, приходится сравнивать с работой в 6.43. 6.00.5 потому что последний публичный. 5.96.2 потому что кое-кто из тех, кто в личку пишет о совете, так и не привык к финализации. Надо же точный совет давать, у вас, bolega, программа сильно меняется даже по внешнему виду. Ну и все непубличные, потому что где-то что-то ломается и надо проверять как именно работало и работало ли в предыдущих.
Так что - интересует людей, поверьте на слово. Мне "спасибо" пишут с разных сайтов и совсем незнакомые люди. Немного, конечно, но не один и не двое тех, кто самые различные фичи юзает, а не только резаки ставит. Одних только скачек последнего дистрибутива с моего ЯД более 60. А старая версия по-моему за 300 перевалила.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 19:29 29-07-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
из-за серьезности бага придется выпускать новую версию с исправлением. Впрочем, похоже кроме AAW это никого особо не интересует.

 
daa2013

Цитата:
А по второму или даже по третьему разу те или иные фичи просить, простите, но ИМХО моветон.  

Я вроде бы нигде не упоминал про фичи. Я имел ввиду не их, а баги. Если нет жалоб на них, значит, этими функциями либо не пользуются, либо человеку все равно: "не работает, ну и не надо". Только AAW обратил внимание на новые проблемы.
 

Цитата:
была непубличная версия, в которой промелькнула автоматизация сборки индексов в джву. Но её буквально пара человек получили

Да, получили в виде исключения. Но я сразу же сказал: этого функционала никогда в публичной версии не будет. Не потому что жалко, а потому что сделано на скорую руку, топорно, неполно, малопонятно. Т.е. делал чисто для себя. К тому же основано на древних версиях утилит, которыми сейчас уже наверно почти никто в мире не пользуется: FR7 и DjvuOCR.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 12:04 30-07-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
К тому же основано на древних версиях утилит

вот уж проблема для вас Тессеракт ведь прикручен. Измените источник разметки текста, и сделайте полупрозрачное отображение распознанного им слоя букв.
 
Я как-то говорил, что даже то, что
Цитата:
сделано на скорую руку, топорно, неполно, малопонятно
разительно удобнее имеющегося иного софта. Во-первых, можно указать смещения из-за вставок и утрат. Во-вторых, WYSIWYG-групповая работа над размещением гиперссылок на листе. В-третьих, оперативная проверка правильности перехода (кнопка с цепью). Эти возможности легко кроют все неудобства. Ничего подобного в других программах лично я не знаю. И до сих пор убежден, что в СК эта фича должна быть добавлена, пусть в доработанном виде. Но обязательно. Е-книги просто обязаны выходить с подобными электронными плюшками, как я их называю.
И о малопонятности: то, как работать с каналом черного (вы описали на publ.lib.ru), мягко говоря, весьма нетривиально для новичка. Я-то и сам догадался, но я над идеологией СК три года пыхтел плотно. Картинок перепостеризовал не одну сотню. И догадался сходу, правда не успел попробовать. Так что и малопонятность визарда гиперссылок - в ту же степь. Кто хочет, тот разберется. А вот удобство программы - это вещь сильная. Да, можно в экспрессэдиторе линки вставлять. Но в визарде это делать на два порядка приятнее.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:31 30-07-2020 | Исправлено: TelecomUral, 13:18 30-07-2020
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я глифы честно говоря не использую, поэтому этот баг не видел.

Всего записей: 412 | Зарегистр. 20-09-2005 | Отправлено: 12:32 30-07-2020
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Начал пользоваться глифами как раз в последней версии, именно перетягиванием - страшно неудобно оказалось позиционировать, если почините будет здорово

Всего записей: 783 | Зарегистр. 03-07-2005 | Отправлено: 15:01 30-07-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm

Цитата:
если почините будет здорово

 
Все баги уже починил, там мелкие огрехи в коде были, исправилось элементарно за полчаса. Остался еще нерешенный вопрос с warnings и дурацкий вид Task info.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 17:59 30-07-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вдогонку по гиперссылкам. Я тут в фоновом режиме давненько этот визард обдумываю. Есть у вас прекрасная зона Transit. Почему бы ее не использовать для ручных гиперссылок. Если ввести подтип или галку "link", то в дополнительном параметре можно сразу указывать страницу, на которую прыгать и процент ее установки (для пдф это возможно). Прямо мышкой показывать на список файлов в основном задании и "L/R" его половина. Тогда плюс тессеракт для оглавления и индексов, вот нам и нормальный визард, без древних утилит и вполне понятный и логичный. На 2021 год
...а в Page\special можно ставить галку "страница без номера", а в task info или в Files указывать пропущенные сканы. Или в Options, там места больше. Это только что в голову пришло.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:11 30-07-2020 | Исправлено: TelecomUral, 18:24 30-07-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Прямо мышкой показывать на список файлов в основном задании и "L/R" его половина

Вот этого я и боюсь. Пойдет лавина просьб, улучшений и т.д. Сейчас весь механизм ссылок основан на использовании физических номеров страниц. Это универсальный подход, гарантирует независимость ссылок от вставок, утрат и т.д. А вы предлагаете привязывать к порядковым номерам задания, который может изменится в любое время и тем самым разрушить все ссылки. На это я никогда не пойду.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:46 30-07-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
который может изменится в любое время и тем самым разрушить все ссылки.

?.. А разве у вас не отработан аналогичный механизм на перемещение/вставку/удаление в списке файлов... Есть же какая-то внутренняя списочная структура, нельзя без неё.
 
Мне даже в голову не приходило юзать простой текст ссылки. Там действительно возникнет куча глюков при модификации списка файлов, так нельзя делать.
 

Цитата:
Сейчас весь механизм ссылок основан на использовании физических номеров страниц. Это универсальный подход

ну, не такой уж универсальный. Спецнумерация предисловия (сканю 5е ПСС Ленина, в каждом томе от 12 до 52 страниц римскими цифрами, плюс вклейки), и не- или криво-нумерованные многостраничные материалы. Это так, заметки на полях. Бывает нумерация вида номер_главы_точка_номер_страницы_внутри_главы. Нечасто, конечно, но физический номер - необязательно жесткий упорядоченный "от единицы до заднего форзаца".
 
upd
философски если рассудить, то физический номер использовать не следует, потому что гиперссылки не физическая сущность. Другое понятийное подпространство.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 19:23 30-07-2020 | Исправлено: TelecomUral, 06:22 31-07-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер.
Оцифровываю книгу 1950-го года.
 

 
На выходе получается вот такой результат. Вроде бы ничего, но во многих буквах пропадают тонкие линии-«перемычки». Не понимаю, в чем дело. Вроде и похуже сканы обрабатывал, а результат был, как минимум, не хуже.
 
Подскажите пожалуйста, как улучшить.
 
Если если увеличивать бинаризацию, то буквы будут слишком жирные. Да и не очень помогает это с «перемычками».
Прикрепляю файл test:
 
Ссылка

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 22:21 09-09-2020 | Исправлено: asku, 22:26 09-09-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
Давно выяснено, что на таких тонких перемычках 300дпи мало. Они пропадают.
Поднял дпи скана до 600 с помощью photozoom. В СК воспользовался гаммой=5 и аншарпмаск r=3. Illumination тоже включил.
Дальше по вкусу ужирните. Я смартблур включил, но он вроде никак не повлиял на внешний вид.
 
Перемычки все на месте, насколько вижу:
 

 

 
Например в строке "древность" последняя буква "н" в оригинале без перемычки.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 05:41 10-09-2020
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 

Цитата:
В СК воспользовался гаммой=5 и аншарпмаск r=3. Illumination тоже включил.
Дальше по вкусу ужирните. Я смартблур включил

 
А их названия в оригинале? И где их искать?

Всего записей: 1780 | Зарегистр. 15-06-2006 | Отправлено: 07:56 10-09-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Benoni


Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 08:33 10-09-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

TelecomUral
 
Вы не могли бы дать test-файл? У меня почему-то не получается такой результат на выходе.

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 09:05 10-09-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
https://yadi.sk/d/hsTfmaINK4dQ0g

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 09:31 10-09-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Какой хороший результат у вас на выходе, по сравнению с моим ((

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 10:58 10-09-2020
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Спасибо.

Всего записей: 1780 | Зарегистр. 15-06-2006 | Отправлено: 11:55 10-09-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru