Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
italia57

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделайте пожалуйста видео как добавить языки в СК. Хочу попробовать Тессеракт.
ФР лажанул на паре страниц.

Всего записей: 16 | Зарегистр. 25-11-2020 | Отправлено: 00:53 24-05-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сделайте пожалуйста видео как добавить языки в СК.  

 
В папку hunsdict кидаете словари нужных вам языков - aff и dic.
 
Скачать их - по ссылке, которую я давал, либо поиском - Hunspell+dictionaries.
 

Цитата:
ФР лажанул на паре страниц.

 
Лучше настройки ФР проверьте. С русским все распознавалки пока хуже FR.

Всего записей: 3677 | Зарегистр. 17-09-2001 | Отправлено: 01:18 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
medvedik

Цитата:
Pdf файлы я проимпортировал.

так я делал своё видео как ответ на конкретный вопрос конкретного человека (cuneiform) и для вполне определённого файла pdf В котором уже были зоны-"кусочки". Человеку надо было перевести текст в ЧБ.
Так что сначала разберитесь с вашим pdf и опишите (поймите сами для себя), что вам надо и почему не получается именно в вашем случае. Можете и пдф выложить. Там может и зон-то никаких нет. Поглядите структуру страниц(ы) в PDF-XChange Editor например.
 
italia57

Цитата:
Хочу попробовать Тессеракт

по-моему, надо положить в tessdata2 нужные *.traineddata по аналогии с eng и rus
А вот где их брать - ??

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 04:42 24-05-2022 | Исправлено: TelecomUral, 04:51 24-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А вот где их брать - ??

Я конкретную ссылку где брать привел в sk-readme.txt  
 
italia57

Цитата:
Сделайте пожалуйста видео как добавить языки в СК.

В СК сейчас заложено немного языков (опция special > more2 > ocr langs, в выпадающем списке отметить галками нужные для этой конкретной страницы). Если кому нужны те, которых в нем нет, заказывайте, я добавлю. Только если реально нужны. Ссылка на список поддерживаемых тессерактом языков опять же есть в sk-readme.txt  
У FR конечно этот список больше. И наверно, есть словари hunspell для языков, которых нет в тессеракт, но они есть в FR. Поэтому их тоже можно добавить в СК, но не для распознавания, а чтобы можно было пользоваться словарями.
 
Заодно скажу, чего еще пока нет в последней версии: нет замены букв для вертикального текста и для текста в b/w-зонах. Со временем сделаю и это.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:06 24-05-2022
lis105

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем доброго дня!
Для быстрой навигации по видеофайлам от bolega с новыми возможностями SK добавил непосредственно в видеофайлы таймлайны от TelecomUral:
https://disk.yandex.ru/d/EGAHs78LWtygrQ
 

Всего записей: 2 | Зарегистр. 15-04-2006 | Отправлено: 09:58 24-05-2022 | Исправлено: lis105, 10:33 24-05-2022
indinc



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Благодарю bolega за замечательную программу
 
Несколько замечания по работе с программой (SK-6.75.5):
1. В OS XP SP3 (в десятки работает) при распознавании (Special...->OCR page)
показывает сообщения о ошибке:
Access violation at address 03AFA3AF in module 'ocr2.dll'. Read of address 00000000
2. В новый профаил File->Profile->Pages, отсутствует V/H.Align - Auto,
а когда ставишь в H.Align=Left - Apply показывает в Page h.Align = A
3. Буду рад за добавления в OCR pумынскoгo языка
4. Можно ли использовать для распознаваний Finе Rеаdеr 8, есть ли парсер?

Всего записей: 29 | Зарегистр. 02-01-2006 | Отправлено: 14:19 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно ли использовать для распознаваний Finе Rеаdеr 8

нельзя

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 14:34 24-05-2022
medvedik

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Все понятно. Конечно, у  меня никаких зон нет.

Всего записей: 921 | Зарегистр. 18-11-2005 | Отправлено: 14:58 24-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Вопрос по СК.
Есть две зоны, одна поверх другой. А можно (как?) поменять их местами? То есть, чтобы та, что сверху, была снизу, а другая наоборот.
 
И офтопик по Hunspell. Можно ли самому сделать словарь? Допустим, есть куча отредактированных (без ошибок) текстов, и на их основе сделать словарь.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 15:05 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А можно (как?) поменять их местами?

на выделенной зоне ПКМ "send to back" и "bring to front".
Правда, в случае трёх и более накладывающихся зон (я так с малоцветными граф.схемами баловался в древнем СК) будет трудно понять в каком порядке их давить к странице По-моему, надо начинать с верхней и "send to back", иначе не выходит правильный порядок.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 15:22 24-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
на выделенной зоне ПКМ "send to back" и "bring to front".

 
Спасибо! Сейчас попробую.
 
Еще такой вопрос. Все никак не пойму, что там делать нужно.
Вот тест (папка в архиве):
test
 
Первая страница чуть шире остальных. Там картинка на всю страницу.  
 
На вкладке Page, там, где Spec.gaps я выставлю галочки на Left, Right, Top, Bottom, то есть, чтобы не добавлялись поля.
На выходе у меня часто такие страницы отличаются (шире) от остальных.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 16:39 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
На выходе у меня часто такие страницы отличаются (шире) от остальных.

так вы придумайте, что вы хотите. Только тогда станет ясно, как настраивать. Или резать с краев или белые поля делать больше.
 
Обычная проблема, что пара страниц во всю ширину отличаются друг от друга по этой самой ширине
И возможны три варианта, имхо
- оставить каждую как есть
- подогнать узкую к (самой) широкой с помощью надставки (белого или однотонного)
- растянуть узкую пропорционально до ширины широкой
 
Самый такой яркий пример это современный журнал Юный техник. Он 80 страниц, согнут пополам, бумага толстая и первая от 40й отличается миллиметра на 4.
 
Лично мне больше нравится "оставить каждую как есть".

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 16:50 24-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
так вы придумайте, что вы хотите.

 
Я хочу одинаковую ширину для всех страниц дежавю-файла.
У бумажного журнала (моего) все страницы имеют одну ширину.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 17:03 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я хочу одинаковую ширину

тогда вбейте в размеры книги габариты этой оборотки
Наверное, ещё нужно будет подобрать gap, а то в СК заложена хитрая логика на максимум-отклонение.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 17:12 24-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
тогда вбейте в размеры книги габариты этой оборотки

 
А как это делать? На вкладке Book? Я делаю так -- при появлении новой версии СК захожу на вкладку Book. В полях H.Gap value и V.Gap value ставлю примерно 170-200 и больше не захожу туда, потому что боюсь испортить всякие мелочи.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 17:27 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
А как это делать? На вкладке Book?

Да.
 
Я сам также "боюсь испортить". Хотя в Хрестоматии вполне грамотные объяснения что как с чем связано.
 
Щас видео запишу по вашим файлам. Авось получится
 
upd
видео
https://disk.yandex.ru/i/gINvX38WtnYPSw

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 18:01 24-05-2022 | Исправлено: TelecomUral, 18:31 24-05-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я хочу одинаковую ширину для всех страниц дежавю-файла.

asku  
Всё намного проще. Ответил вам тут http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=3514&start=4220#lt
 
6 минут недоумения https://disk.yandex.md/i/vorldiXnCpCgow  Стамп недоумевал "А где же у него кнопка?", а я никак не могу понять: зачем эта кнопка в тех функциях, которые она на  данном моменте представляет?  
 

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 20:18 24-05-2022 | Исправлено: kamenkapenza, 21:00 24-05-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Щас видео запишу по вашим файлам. Авось получится

 
Спасибо за видео. Вот поэтому я и не захожу лишний раз на вкладку Book. Жуть, сколько нюансов.
НО в процессе просмотра я узнал как это сделать просто. То, что вы собственно и сделали в какой-то момент:
В режиме Result view нажимаю на правую кнопку мыши,
там в контекстном меню: Special..., дальше выбираю Resize, потом book size и Ok.
 
Все. Создал дежавю и эта страница с картинкой по ширине такая же, как и остальные.
 
 
Вот под цветной картинкой (первая страница теста) черно-белое (b/w) изображение остается. Я так и не понял почему. Вы на видео говорите про это, но я не понял.
А если под картинкой его нет, а я хочу, чтобы оно было, то, что надо сделать?
 
Добавлено:

Цитата:
на выделенной зоне ПКМ "send to back" и "bring to front"

 
Сейчас только попробовал поместить зону ниже/выше другой зоны.
А где в контекстом меню send to back и bring to front?
 

 
Добавлено:
И еще, вдогонку.
 
Вот страницы финализированы. И какие-то из них отличаются по размерам от других. А как их отсортировать, чтобы я мог сразу их (отличающиеся) найти и поправить размеры путем: ПКМ — Special — Resize — Book size ?
 

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 22:21 24-05-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот под цветной картинкой (первая страница теста) черно-белое (b/w) изображение остается. Я так и не понял почему. Вы на видео говорите про это, но я не понял.
А если под картинкой его нет, а я хочу, чтобы оно было, то, что надо сделать?

у меня нет чб картинки первой страницы под цветной картинкой. Я же показал в конце - чанки BG44 и более ничего.
 
Чтобы чб было вместе с цветом, надо глядеть на страницу как на все обычные страницы в книге, где есть любые цветные картинки. Просто картинка, зона, здесь будет размером со страницу. И надо еще отключить очистку текста под зоной (Clear source area).
 

Цитата:
А где в контекстом меню send to back и bring to front?

В MW же

 

Цитата:
А как их отсортировать

в режиме Thumbs по ПКМ есть виды сортировки.
 
! Всё что вы спрашиваете, имеется в видео и в Хрестоматии. Не ленитесь изучить.
 
Добавлено:

Цитата:
6 минут недоумения

вы сами писали что не делаете полноцветные журналы. Именно при их обработке кнопка справа бывает необходима.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 07:00 25-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Авось получится

Сложно получилось, и много ручной работы. А всего-то нужно было на закладке Book убрать галку Use average sizes. Тогда расчет размеров будет не по среднему, а по максимальному размеру, что в данной книге и требуется, т.к. есть контент на всю страницу и желание обработчика иметь остальные страницы такого же размера. Ну и конечно ignore gaps в special не надо включать, т.к. опция как раз исключает страницу из расчета размеров. Вместо этого для левой половины включить все spec.gaps, т.е. задать нулевые поля со всех сторон.
 
На практике ignore gaps следует использовать для страниц, чьи dpi будут отличаться от основного, например, для обложки, если ее dpi остается на выходе 300. В остальных случаях поля лучше занулять с помощью spec.gaps.
И не забывайте что в отчетах (Reports) после расчета размера книги можно в отчете Book size calculation посмотреть какие страницы повлияли на размер. А в отчете Out page sizes всегда можно увидеть размеры всех страниц, и те, которые отличаются от размера книги, будут подсвечены. Все ссылки на сканы там кликабельны.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 08:08 25-05-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru