Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Это-то я понимаю, я спрашивал, какой смысл заводить 9 хоткеев

Потому что имея разбивку зон по индексам, можно выполнять практически любую массовую операцию, даже не имея карманов. Поэтому для индексов предусмотрено больше возможностей, чем для карманов. Логичнее был бы вопрос "почему карманов не 9 а только 5, карл?"
 
Если вы про это

Цитата:
Дальнейшие изменения какого-нибудь свойства в зоне, привязанной к хоткею, должно приводить к изменению у всех зон привязанных к нему.  

то посмотрите, мне daa2013 всю плешь проел , потому что на удаление глифов у меня всего одно предупреждение, а не три-четыре, как в других порядочных прогах! А вы предлагаете неконтролируемое размножение свойств при каждом чихе. Нет уж, такого не будет. Достаточно и того, что в любой момент можно размножить опции (или даже одну или несколько) на все зоны с одинаковым индексом.  
И не забывайте, что в карман можно помещать не все опции, а часть из них. И именовать их, чтобы не запутаться. Потом эти имена будут подсказками у кнопок.

Всего записей: 4202 | Зарегистр. 09-09-2002 | Отправлено: 07:59 21-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
И именовать их, чтобы не запутаться. Потом эти имена будут подсказками у кнопок.

тэкс! карманы можно именовать? не припомню такого в whatsnew и в роликах. Как сделать это и как сделать в карман пачку опций, а потом на зоны раскидать? Через текущий карман же как-то?  

Всего записей: 2284 | Зарегистр. 15-07-2010 | Отправлено: 08:23 21-11-2022
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Именовать — Правый клик на кнопке Past - нижний пункт меню Edit clipboard comments. Давненько уже эта возможность. По крайней мере, в 6.71 была уже.
Опцию в буфер обмена — правый клик на опции и Copy sup-option to clipboard. Последующие — Add...

Всего записей: 3119 | Зарегистр. 29-09-2005 | Отправлено: 08:45 21-11-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
не припомню такого в whatsnew и в роликах.

Было в моем ролике про чистку зон, еще до тех 4-х

Всего записей: 4202 | Зарегистр. 09-09-2002 | Отправлено: 09:06 21-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Было в моем ролике про чистку зон

да, после комментария DmitryKz вспомнил.
 
UPD
что-то меня по стопам shch_vg повело Начал путать номерные карманы с текущим. Текущий-то я знаю как применять.

Всего записей: 2284 | Зарегистр. 15-07-2010 | Отправлено: 09:08 21-11-2022 | Исправлено: TelecomUral, 09:11 21-11-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
В любой карман можно сохранить зону с любым индексом.

Совсем необязательно сообщать то, что я сказал в предыдущем своем сообщении, что хоткеи и карманы никак не связаны.
 
Добавлено:
bolega

Цитата:
Поэтому для индексов предусмотрено больше возможностей, чем для карманов.

Это тоже понятно, но в моем предложении вообще не требуются карманы. Зона заводится по индексу, если есть соответствующий хоткей. Изменение индекса в зоне либо приводит к изменению свойств, подставляемых из СУЩУСТВУЮЩЕЙ зоны с этим замененным индексом, либо оставляет свойства без изменения, если не активирован соответствующий хоткей.
Насчет изменения свойств в зоне с активированным индексом, то одно предупреждение о том, что будут изменены свойства у всех зон с этим индексом, вполне достаточно задуматься, прежде чем принять окончательное решение.
Мне кажется, что плешь при этом уцелеет, но решать не мне.

Цитата:
И не забывайте, что в карман можно помещать не все опции, а часть из них.

А вот это дает почву для удивленных вопросов, мол, скопировал из кармана, а получил не то, что хотел

Всего записей: 6763 | Зарегистр. 14-01-2005 | Отправлено: 14:18 21-11-2022 | Исправлено: shch_vg, 14:42 21-11-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли в Скан Кромсаторе склеить две страницы в одну? Видеовопрос тут https://disk.yandex.ru/i/GjAdsz46Abo20Q

Всего записей: 620 | Зарегистр. 23-05-2021 | Отправлено: 14:13 22-11-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
Можно ли в Скан Кромсаторе склеить две страницы в одну?

В версии 5.94 и ниже без проблем

Всего записей: 6763 | Зарегистр. 14-01-2005 | Отправлено: 14:31 22-11-2022
serg28serg



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вкладке PDF есть OCR , ни как не могу найти мануал как наложить текст в PDF через SK.  
просто чекбокс включить не достаточно , как я понимаю нужно еще подложить куда то уже распознанный текс в каком то формате  , что бы во время создания PDF его подтянуло
просьба подсказать куда копать .....

Всего записей: 165 | Зарегистр. 03-08-2003 | Отправлено: 18:32 22-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg28serg
в шапке кое-что есть.
распознаете ФР или встроенным тессерактом.

Всего записей: 2284 | Зарегистр. 15-07-2010 | Отправлено: 18:41 22-11-2022
newquaker

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравия, подскажите каким образом выровнять эту страницу, сабж подходит для этого, или что-то другое попробовать? https://i.imgur.com/cS9XECW.jpeg

Всего записей: 645 | Зарегистр. 26-03-2005 | Отправлено: 18:50 22-11-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Здравия, подскажите каким образом выровнять эту страницу

Я страницы в Скан Тейлоре выравниваю.  

Всего записей: 620 | Зарегистр. 23-05-2021 | Отправлено: 20:27 22-11-2022
Skvodo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
newquaker
 
В программах Bookrestorer и Finereader есть геометрическая коррекция строк. http://www.djvu-soft.narod.ru/scan/curved_text.htm

Всего записей: 72 | Зарегистр. 25-09-2004 | Отправлено: 22:33 22-11-2022 | Исправлено: Skvodo, 22:42 22-11-2022
serg28serg



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Цитата:
 или встроенным тессерактом.

так вот не могу найти мануал на "как включить встроенный OCR" (русский и инглиш)
просто галки в чекбоксе OCR , что то еще надо доустановить для тессеракта
есть где то мануал на встроенный в SK OCR ?
 

Всего записей: 165 | Зарегистр. 03-08-2003 | Отправлено: 01:13 23-11-2022 | Исправлено: serg28serg, 01:13 23-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg28serg

Цитата:
есть где то мануал на встроенный в SK OCR ?

размечтались.  
да и кто бы зачем скрывал этот мануал, кабы он был в природе. Слушайте ролики от bolega, он все рассказал. Ну и whatsnew кратко излагает суть.
В принципе, когда вышел новый СК, тут в ветке было много вопросов и ответов, как настроить. Где-то с весны.
научитесь - напишите для других.

Всего записей: 2284 | Зарегистр. 15-07-2010 | Отправлено: 04:57 23-11-2022
serg28serg



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню
что бы откликалось в поисковике яндекса :
"Как распознать текст через встроенный OCR в ScanKromsator", " tesseract"
1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : )  скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72
2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator
3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл
4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!!
5. OCR работает только с BW файлами , выбрать в Files->Color - B/W
6. сохранить как task и Закрыть-Открыт SK , с сохраненным task
......добавляем наши сканы... меняем остальные настройки как нужно нам....
7. Генерим выходной TIFF B/W  
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All  
9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом
 
в ScanKromsator v6.8 есть прямо опция PDF сгенерить с OCR
но распознавание в v6.8 с комплектом sk6.75-add.rar - запустить не удалось, распознавание не работает
поэтому PDF создается без текстовой подложки
 
может будут всплывать сообщения  о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75.
 
может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator"

Всего записей: 165 | Зарегистр. 03-08-2003 | Отправлено: 13:00 23-11-2022 | Исправлено: serg28serg, 13:26 23-11-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg28serg

Цитата:
запустить не удалось, распознавание не работает  

Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.
 
 
Добавлено:

Цитата:
5. OCR работает только с BW файлами

Это потому что OCR изначально предназначался для реставрации букв глифами.  
Потом я подумал, раз он есть, почему бы его не применить для ocr-слоя. Так появилась возможность создавать ocr-слой в pdf и djvu, не пропадать же добру.  
В принципе можно добавить ocr и для цветных страниц, потом сделаю.
 
Добавлено:

Цитата:
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page

Это лишне, если до этого уже было:

Цитата:
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All  


Всего записей: 4202 | Зарегистр. 09-09-2002 | Отправлено: 16:28 23-11-2022 | Исправлено: bolega, 16:47 23-11-2022
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
«Так появилась возможность создавать ocr-слой в pdf и djvu, не пропадать же добру».

А разве в СК можно создавать djvu с текстовым слоем? Я думал, только djvu без, слоя (который я уже потом сторонней программой добавляю).

Всего записей: 391 | Зарегистр. 04-05-2016 | Отправлено: 17:01 23-11-2022
serg28serg



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.

Просьба уточнить , что бы как буду у компа - сразу проверить
вы про связку  
ScanKromsator v6.8 с комплектом sk6.75-add.rar ? - то это я проверил и у меня даже на TIFF  слой текста не наложился, на вьювере смотрел (то есть tocr в принципе не генерится на этой связке версий SK + Add)
или надо ставить в связке  
ScanKromsator v6.8 с комплектом sk6.8-add.rar ? - но тут обыскал всю ветку в печтаном формате, нет упоминаний про sk6.8-add
 

Всего записей: 165 | Зарегистр. 03-08-2003 | Отправлено: 17:23 23-11-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.

не знаю-не знаю, у меня так не выходит. как только не изгалялся.
задание на свой фтп положил.

Всего записей: 2284 | Зарегистр. 15-07-2010 | Отправлено: 17:44 23-11-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru