Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
На первую страницук этому сообщениюк последнему сообщению

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их Настройка внешних программ и утилит
 
Для работы ряда функций СК потребуется установить несколько сторонних приложений/библиотек:
 
- DjVulibre: используется при создании djvu. Библиотека доступна на http://djvu.sourceforge.net.
Важно ! До версии SK 6.91 нужна старая djvulibre, версии 2015 года, например djvulibre_djview_4_9_djvulibre_3_5_25_3
 
- Kakadu: кодек jpg2000, может использоваться при создании PDF. Наличие кодека необязательно.
  Доступен на http://kakadusoftware.com/downloads.
  Достаточно иметь демонстрационную (trial) версию, при условии, что она не используется в коммерческих целях.
  С "Copyright notice" можно ознакомиться на странице загрузки http://kakadusoftware.com/downloads.
- FFTW: используется для работы фильтра descreen. Библиотека dll доступна на http://www.fftw.org.
- DEE (documenttodjvu.exe): используется только при создании djvu.
- DjVuDecode: используется при импорте djvu-файлов. Утилита содержится в дистибутиве DEE или DjVu Small (Mod).
- Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr.
 
 
1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe.
 
2. Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК  
   File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр.,  
   "C:\SK\tessdata\eng.traineddata"
 
3. Файлы kdu_compress.exe и kdu_v77R.dll поместите в любое место на диске. В настройках СК  
   File>Options>Apps>JPG2000 codec укажите полный путь к файлу kdu_compress.exe, напр.,  
   "..\..\Program Files\kakadu\kdu_compress.exe"
 
4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр.,  
   "C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe"
 
5. В настройках СК File>Options>Apps>DjVulibre укажите полный путь к файлу djvumake.exe, напр.,  
   "D:\DjVuLibre\djvumake.exe". Важно, что библиотека DjVulibre должна быть установлена полностью.
   СК использует несколько утилит из DjVulibre, не только djvumake.exe.
 
6. В настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр.,  
   "D:\DEE\documenttodjvu.exe"
.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:

 
v6.52 https://yadi.sk/d/3xPQMUhFkaXXEQ
 
v5.96.2    https://yadi.sk/d/_rmVG3EJ3A8ptP  (только файл sk.exe, утилиты к ней можно взять из 5.96.1)
v5.96.1 https://yadi.sk/d/z9C9krTA2fErk
 
Full-версии включают dll-библиотеки и Help к SK v1.0 в формате Pdf:

 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы:  
Использование ScanKromsator’а v5.91 от Melirius
ScanAndShare v1.07 - инструкция в картинках от VadimirTT
Пособие по Кромсатору от monday2000  
Примеры использования от shch_vg #1, #2
Обработка пикчур-зон от TelecomUral
"Самая краткая инструкция" по работе с СК (включает "сборку" СК) от ghosty
 
 
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
 
serg28serg
ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню
что бы откликалось в поисковике яндекса :
"Как распознать текст через встроенный OCR в ScanKromsator", " tesseract"
1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : )  скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72
2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator
3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл
4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!!
5. OCR работает только с BW файлами , выбрать в Files->Color - B/W
6. сохранить как task и Закрыть-Открыт SK , с сохраненным task
......добавляем наши сканы... меняем остальные настройки как нужно нам....
7. Генерим выходной TIFF B/W  
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All  
9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом
11. File > Create out task
12. в вкладках под файлами - в Files задаем имя выходного PDF - PDF Name :  myfirstOCR (или имя какое придумаем) .
13. так же в  вкладке Files задаем Output format : PDF  
14. в вкладке PDF отмечаем обязательно галочку Add OCR
15. Сохраняем task (не проверял есть ли автосохран)
16. Жмем уже "главную кнопку" в верхней морде "Process!"
и смотрим результат
(указал минималку что нужна для OCR PDF , остальное естественно по желанию и хотелкам)
 
может будут всплывать сообщения  о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75.
 
может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator"
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2980#17
 
обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR.

 | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов:  
  Автор Плейлист    
  wasp238   Основные принципы работы в программе ScanKromsator    
  imwerden   Основы работы программы ScanKromsator
  Установки по умолчанию в ScanKromsator
  Обработка страниц с цветным текстом в ScanKromsator
  Обработка страниц книги с иллюстрациями
  Маленькие хитрости    
  TelecomUral   06. Сохранение светлой зоны под текстом
  07. Бинаризация плохого текста. Групповые операции. Выпрямление строк (в Book Restorer)
  08. Азы подготовки качественных djvu-файлов
  16. Чистка мусора и замена плохих буковок
  17. Как подготовить малоцветные рисунки в СК 6.52
  18. Магическое выделение и другие трюки
     Другие видео на youtube-канале автора
     Другие видео на rutube-канале автора  

 


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самомДайте полную информацию: скан, задание spt, out-файлы. Случай элементарный. Чего там может не получаться - никак не пойму. Сто раз уже говорил: есть проблема - присылайте задание, а не кучу постов про то, как плохо выходит. По заданию сразу можно увидеть, что не так, подсказать, что поправить. А не гадать на кофейной гуще, отчего в таком простом случае может что-то не получаться.  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
   

На первую страницук этому сообщениюк последнему сообщению

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru