gyra
Moderator | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Предыдущие темы: 1 часть | 2 часть | 3 часть ScanKromsator Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц. Автор: bolega ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 | ScanKromsator v6.8 | ScanKromsator v6.75 Добавки и замечания от bolega: к v6.91 |к v6.8 | к v6.75 Туториалы по ScanKromsator v6.72 и выше Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300. Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их Настройка внешних программ и утилит Для работы ряда функций СК потребуется установить несколько сторонних приложений/библиотек: - DjVulibre: используется при создании djvu. Библиотека доступна на http://djvu.sourceforge.net. Важно ! До версии SK 6.91 нужна старая djvulibre, версии 2015 года, например djvulibre_djview_4_9_djvulibre_3_5_25_3 - Kakadu: кодек jpg2000, может использоваться при создании PDF. Наличие кодека необязательно. Доступен на http://kakadusoftware.com/downloads. Достаточно иметь демонстрационную (trial) версию, при условии, что она не используется в коммерческих целях. С "Copyright notice" можно ознакомиться на странице загрузки http://kakadusoftware.com/downloads. - FFTW: используется для работы фильтра descreen. Библиотека dll доступна на http://www.fftw.org. - DEE (documenttodjvu.exe): используется только при создании djvu. - DjVuDecode: используется при импорте djvu-файлов. Утилита содержится в дистибутиве DEE или DjVu Small (Mod). - Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr. 1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe. 2. Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр., "C:\SK\tessdata\eng.traineddata" 3. Файлы kdu_compress.exe и kdu_v77R.dll поместите в любое место на диске. В настройках СК File>Options>Apps>JPG2000 codec укажите полный путь к файлу kdu_compress.exe, напр., "..\..\Program Files\kakadu\kdu_compress.exe" 4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр., "C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe" 5. В настройках СК File>Options>Apps>DjVulibre укажите полный путь к файлу djvumake.exe, напр., "D:\DjVuLibre\djvumake.exe". Важно, что библиотека DjVulibre должна быть установлена полностью. СК использует несколько утилит из DjVulibre, не только djvumake.exe. 6. В настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр., "D:\DEE\documenttodjvu.exe" . Предыдущая стабильная версия: ScanKromsator 6.00.5 Устаревшие версии: v6.52 https://yadi.sk/d/3xPQMUhFkaXXEQ v5.96.2 https://yadi.sk/d/_rmVG3EJ3A8ptP (только файл sk.exe, утилиты к ней можно взять из 5.96.1) v5.96.1 https://yadi.sk/d/z9C9krTA2fErk Full-версии включают dll-библиотеки и Help к SK v1.0 в формате Pdf: - v5.95b2 (4,14 МБ)
- v5.93 (3,44 МБ)
- v5.92 (3,40 МБ)
- v5.91 (3,26 МБ)
- v5.9 (3,19 МБ)
- v5.81 NY (2,42 МБ)
- v5.6А (2,25 МБ)
- v5.52b (2,05 МБ)
- v5.51b (2,06 МБ)
- v5.07 (1,98 МБ)
- v3.5 (1,52 МБ)
Новое в 6-й версии Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов) Учебный пример от bolega по использованию зон Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г. ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018) Включённые в т.ч. материалы: Использование ScanKromsatorа v5.91 от Melirius ScanAndShare v1.07 - инструкция в картинках от VadimirTT Пособие по Кромсатору от monday2000 Примеры использования от shch_vg #1, #2 Обработка пикчур-зон от TelecomUral "Самая краткая инструкция" по работе с СК (включает "сборку" СК) от ghosty Работа с автоглифами Как подключить: шаги Парсер версия 2.3.1 из ветки утилит NME Видео bolega про работу с автоглифами (третья из четырех частей про версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw. Как вставить OCR в PDF serg28serg ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню что бы откликалось в поисковике яндекса : "Как распознать текст через встроенный OCR в ScanKromsator", " tesseract" 1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : ) скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72 2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator 3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл 4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!! 5. OCR работает только с BW файлами , выбрать в Files->Color - B/W 6. сохранить как task и Закрыть-Открыт SK , с сохраненным task ......добавляем наши сканы... меняем остальные настройки как нужно нам.... 7. Генерим выходной TIFF B/W 8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All 9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход 10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом 11. File > Create out task 12. в вкладках под файлами - в Files задаем имя выходного PDF - PDF Name : myfirstOCR (или имя какое придумаем) . 13. так же в вкладке Files задаем Output format : PDF 14. в вкладке PDF отмечаем обязательно галочку Add OCR 15. Сохраняем task (не проверял есть ли автосохран) 16. Жмем уже "главную кнопку" в верхней морде "Process!" и смотрим результат (указал минималку что нужна для OCR PDF , остальное естественно по желанию и хотелкам) может будут всплывать сообщения о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75. может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator" http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2980#17 обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR. | Иллюстрация алгоритма Видеоуроки про ScanKromsator Видео от bolega: Видеоролики других авторов: ВАЖНО! Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK. Инструкция по созданию субтаска в следующей строке! Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самомДайте полную информацию: скан, задание spt, out-файлы. Случай элементарный. Чего там может не получаться - никак не пойму. Сто раз уже говорил: есть проблема - присылайте задание, а не кучу постов про то, как плохо выходит. По заданию сразу можно увидеть, что не так, подсказать, что поправить. А не гадать на кофейной гуще, отчего в таком простом случае может что-то не получаться. и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ. | Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023 |
|