Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Текущая версия:ScanKromsator v6.71 (2,49Мб)  ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г. И более полная от 25.12.2018 Хрестоматия 2.1
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы...  
И ещё bolega о том же самом...
И, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ
.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 11:44 16-08-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня вопрос: где взять DEE (documenttodjvu.exe)? Я скачал DjVuLibre+DjView-3.5.24+4.8-Setup.exe, но в нем не оказалось файла documenttodjvu.exe, чтобы прописать его в настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр., "D:\DEE\documenttodjvu.exe". Подскажите, кто может...
 
Добавлено:
Все, вопрос решил, скачал DjVu Small Mod v0.7.7.7z и там все есть. Благодарю всех!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 16:27 10-07-2021
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SorokaSV, я когда-то давно задавал этот вопрос bolega и он мне указал на глифпанель, с которой работать намного удобнее, чем подрисовывать буквы ластиком.

Всего записей: 34 | Зарегистр. 19-12-2007 | Отправлено: 18:56 10-07-2021 | Исправлено: qwaxym, 21:49 10-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SorokaSV
В последней версии можно сделать такой трюк. Выбрать в списке на кнопке "изменить глубину цвета" 8bit. Нажать на кнопку. СК спросит, действительно ли мы хотим изменит ч/б на 8 bit. Ответить да. Теперь включить кнопку режима клонирования. Нажать shift и щелкнуть мышкой. Вместо клонирования активируется режим ластика (т.е. курсор будет один, а не два как при клонировании). Но в отличие от обычного, размер ластика можно плавно менять комбинацией Shift+колесико мышки. Форму ластика (квадратная, прямоугольная, круглая, эллиптическая) тоже можно задать на панельке image adjustments > tools.  
После чистки на кнопке выбрать глубину цвета 1bit и щелкнуть на ней, файл снова станет ч/белым.  
Этот трюк нужен, потому что продвинутый ластик в текущей версии не работает с ч/б изображением.

Всего записей: 3925 | Зарегистр. 09-09-2002 | Отправлено: 23:54 10-07-2021 | Исправлено: bolega, 23:56 10-07-2021
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
"Элементарно, Ватсон!"

Всего записей: 2283 | Зарегистр. 22-03-2005 | Отправлено: 00:12 11-07-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
размер ластика можно плавно менять комбинацией Shift+колесико

ууу. попробовал. какая прелесть.

Всего записей: 1522 | Зарегистр. 15-07-2010 | Отправлено: 09:36 11-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Еще пару замечаний. При несимметричном курсоре ластике (прямоугольник, эллипс) shift+колесико изменяет ширину, чтобы изменять высоту используйте shift+ctrl+колесико.
Можно также включить tools > transparency (прозрачность), ползунок поставить на четверть от начала. Тогда полного стирания ластиком не будет, будет забледнение, сила которого зависит от силы transparency. Т.е. будет видно, что стерлось. При бинаризации это все уйдет. Кстати, порог, который используется при бинаризации, берется там же с закладки Filters2 > Threshold. С помощью его preview можно в режиме реального времени подбирать порог при необходимости.

Всего записей: 3925 | Зарегистр. 09-09-2002 | Отправлено: 10:11 11-07-2021 | Исправлено: bolega, 10:21 11-07-2021
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, это вещь. Спасибо!

Всего записей: 1586 | Зарегистр. 15-06-2006 | Отправлено: 13:00 11-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SorokaSV

Цитата:
Я конечно это знаю, но как раз это крайне неудобно. Хотелось бы ластик поменьше (а лучше, чтобы изменялся размер, как в фотошопе). Приходится пользоваться фотошопом (в этом моменте), но он очень плохо работает с черно-белыми изображениями.

Каждому свое! Великий лозунг на известном месте в известном месте от известного человека! По мне, лучше чем СК для обработки графики книг, найти не могу! Пользуюсь им и решаю все проблемы, надо просто научиться. А фотошопы - это не для меня, похоже ум мой заточен на другое, например на СК!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 13:34 11-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемый daa2013! Пишите новую редакцию Хрестоматии для последней версии СК, потому что ScanKromsator. Хрестоматия 2.1 читается  как роман на досуге, практически снимаются все вопросы, но хочется, чтобы были внесены последние новые инструменты. Более ранние инструкции, разрозненные, читались с трудом и требовалось много умственных сил приложить, чтобы все понять. А Хрестоматии - замечательны! Успехов Вам в этом прекрасном и добром деле! Да будет доволен Вами Аллах Величайший! Аллахьу Экбэр!
 
Добавлено:
PS. Да, но, пожалуйста, сделайте ее не только в CHM, но и в HTML, как в архиве, который замечательно открывается в браузере и масштабируется превосходно на старых системах.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 22:12 11-07-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я очень рад, что Хрестоматия оказалась вам полезной. Но хочу разочаровать: в ближайшие пару лет я сам ничего про СК писать не собираюсь.  
 
Придется вам новые штучки осваивать самостоятельно. Советую по ходу дела делать где-нибудь об этом для себя делать заметки. Что было непонятно, и как потом оказалось, оно на самом деле работает. Завести отдельную папку для хранения примеров и не лениться туда сканы откладывать. А там, глядишь, у вас и новый параграф появится.

Всего записей: 708 | Зарегистр. 13-06-2013 | Отправлено: 07:01 12-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Придется вам новые штучки осваивать самостоятельно. Советую по ходу дела делать где-нибудь об этом для себя делать заметки. Что было непонятно, и как потом оказалось, оно на самом деле работает. Завести отдельную папку для хранения примеров и не лениться туда сканы откладывать. А там, глядишь, у вас и новый параграф появится.

Очень дельный совет, благодарю.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 10:07 13-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Сейчас если резаки активировать через галочки вверху главного окна, то 3 из 4-х устанавливаются по их крайнему положению, только правый резак остается вместе с левым. М.б. его тоже в этом случае устанавливать в правую позицию главного окна?

Всего записей: 6510 | Зарегистр. 14-01-2005 | Отправлено: 22:38 14-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
 
Благодаря бестселлера daa2013 - "ScanKromsator. Хрестоматия 2.1" - потихонечку осваиваю версию 6,71, начиная понимать его алгоритм работы, в принципе, особых сложностей нет, с той лишь разницей, что в моей любимой версии 5.96.2 финализация по умолчанию включена сразу же, а в 6.71 - отключена. Параллельно провожу сравнительное тестирование этих двух версий: надо признать, что версия 6.71 работает превосходно, и даже несколько удобнее! Качество сканов выходит даже выше. Правда, сравнение провожу с исходников, которые изначально неплохо отсканированы, потому что книга по качеству была отпечатана хорошо, еще по-советски. Надо будет сравнить на очень плохих по качеству источниках. Да, благодарю авторов, версия 6.71 заработала превосходно, без всяких фокусов.
 
Но, уважаемый daa2013, не надо скромничать, если бы не Ваш литературный шедевр, так и считал бы версию 6.71 - более худшей и сложной! А bolega - особенная благодарность за эту превосходную программу, потому что я теперь через не прогоняю все файлы, которые приходят ко мне! Получается очень и очень здорово, нежели простым сканированием и обработкой в FineReader 12. После обработки в СК, FR12 выдает потрясающую конфетку!  
 
Все же выход PDF, сделанный в СК обеих версий, уступает по качеству того же результата, сделанного потом в FR12: размер файла меньше более чем в 1,5 раза, естественно присутствует сразу же OCR, и округлость букв выходит еще более замечательная, даже на очень большом увеличении текста.
Вот книга, на которой я провожу тесты, но уже несколько дней назад сделанная в 5.96.2, затем обработана в FR12, b выложена на Флибусте: https://disk.yandex.ru/d/tRbMidFMPcarnQ
В данному случае ее размер получился даже в два раза меньший, чем если я сделал бы PDF в СК обеих версий (6,71 делает более cжатые PDF, чем 5,96,2), и это притом, что в ней текстовый слой и подробные закладки, которые в итоге увеличивают размер окончательного PDF.
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
(Аллах Единственный, Аллах Абсолютный, Аллах Величайший!)

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 23:12 15-07-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выложили бы сразу и "большой" файл от СК для сравнения.
В этом же файле на мой вкус буквы жирноваты и избыточно сглажены, как будто КлирСкан был применен.
 
Этот pdf файл у вас с jbig2 compession    ч.б страниц внутри.  А СК такое сам не делает.
PDF файл от СК надо открыть в акробате и "оптимизировать" - изменить там сжатие.  
(В хрестоматии я об этом у поминал в разделе 3.5.)
 
Советую также почитать подборку ответов bolega. Они там также сгруппированы по темам. Есть тема и про "создание pdf" (раздел 9.1)

Всего записей: 708 | Зарегистр. 13-06-2013 | Отправлено: 05:24 16-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Выложили бы сразу и "большой" файл от СК для сравнения.  
В этом же файле на мой вкус буквы жирноваты и избыточно сглажены, как будто КлирСкан был применен.

Выложу, тем более, что я сейчас тщательно прорабатываю Ваш литературный шедевр. Ин шэ Аллаh!
 
Про КлирСкан ничего не могу сказать, даже не слышал о нем, Попробовал Тэйлора, простая, но нет того, что есть в СК, поэтому оставил ее в архиве.
 
Согласен, что может быть шрифт жирноватый, но это, можно сказать, моя первая более менее осмысленная работы в 5.96.2, но с другой стороны, я сравнил его со шрифтом, который получился в 6.71. Да, там нежнее, но, как-то, лично для меня жирнее воспринимается более приятно при чтении. Попробую сделать эту книгу чисто в 6.71, и снова выложу ее на Флибусте, Ин шэ Аллаh. Акробатом я пользуюсь в исключительных случаях, когда FR12 что-то не может сделать, но, практика показала, если много работаешь на FR12 и прочитал к нему также хороший литературный шедевр, написанный одним человеком, то практически FR12 уже не нуждается в других программах.
 
Какую технологию сжатия FR12 применяет, я не знаю, нигде об этом не читал, но знаю одно, что в версии последней FR15, качество выходного файла оказалось хуже, как и многое другое, лично сравнивал тщательно!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 13:16 16-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемый bolega!
 
Безусловно, Аллах Величайший, Мудрейший наделил Вас прекрасным даром программиста, коль Вы создали такую замечательную программу, без которой сделать качественную, приятную для чтения книгу в цифре просто невозможно.
 
Я сделал по просьбе Ваших товарищей одну и ту же книгу в версиях 5.96.2 и 6.71. Мне это было самому приятно, потому что, таким образом, я отрабатываю различные приемы работы и осваиваю Вашу программу, особенно, 6.71.
 
Всю работу я выложил по адресу, полагаю, разберетесь: https://disk.yandex.ru/d/0hPV14qszCOurg
 
В целом программа 6.71 вызывает восхищение и удовлетворение качеством итоговых файлов. Похоже, я перехожу на нее.
 
Но вот, что мне уже сейчас не нравится, потому что снизился уровень комфортности работы, в сравнении с версией 5.  
 
Плохо, что Вы удалили возможность создавать по своему усмотрению фон рабочего окна программы и фон окна VR. Легче работать тогда, когда «фонит» твой желанный цвет, а не безликий, как у Вас, по умолчанию, без возможности изменения (я не смог найти функции изменения).
 
И второе, очень плохо, что убрали в VR «лапу»! Когда используешь большое увеличение, пользоваться полосами прокрутки крайне утомительно и неудобно, «лапой» все делается гораздо быстрее и проще, хотелось бы, чтобы Вы вернули ее.
 
Конечно, чтобы освоить все тонкости, а это значит, прелести работы с Вашей программой, надо каждую детальку ручками самому прорабатывать и смотреть на результат, потом анализировать, и получишь на выходе цифровой шедевр. Ма шэ Аллаh!
 
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
 
 
Добавлено:
Да, простите, по ошибке я дал названия файлам одинаковое: 6_*.*, но на самом деле версию программы, в которой делался файл, смотрите по названию папки, в которой находятся эти файлы.
 
И еще: мне очень понравилась в бинаризации опция порога "Auto", на мой взгляд работает превосходно и снимает все мучения с подбором его. Я, выложенные файлы для Вас, делал именно в таком режиме.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 13:28 17-07-2021
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день!
 
Мне попалось несколько djvu-файлов, отсканированных мало того, что в маленьком разрешении, но ещё и большим процентом букв «и», «в» и «н» напрочь перепутанными. Вы меня понимаете, классика маразматического жанра, словосочетание «в немногих» превратилось в «н иемиогнх» и т. д..
 
Я знаю, что в СК есть внешний OCR-инструмент Tesseract, про который я слышал, что он совсем не так уж и плох, как можно подумать (не помню где, но хвалили его). Он может чем-то помочь исправить это буквенное мясо хоть отчасти? И вообще можно с этим что-то сделать? Если даже нет, то помогите, пожалуйста, понять для чего Tesseract вообще можно использовать в СК и как именно это делается (ссылок будет достаточно).

Всего записей: 18 | Зарегистр. 26-02-2014 | Отправлено: 18:22 17-07-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVN75
 
Может быть лучше поиском и заменой по DJVU? Для PDF есть программы, поддерживающие пакетную замену и регвыры. Для DJVU - возможно тут подскажут....

Всего записей: 2822 | Зарегистр. 17-09-2001 | Отправлено: 19:55 17-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVN75

Цитата:
 Мне попалось несколько djvu-файлов, отсканированных мало того, что в маленьком разрешении, но ещё и большим процентом букв «и», «в» и «н» напрочь перепутанными. Вы меня понимаете, классика маразматического жанра, словосочетание «в немногих» превратилось в «н иемиогнх» и т. д..  

 
Это давно известная проблема  djvu-конвертирования. Такие явления происходят тогда, когда сканы очень низкого качества, а главное, разрешения. Исправить этот дефект в готовом djvu, думается, практически невозможно, разве что, "прогнав соответствующие страницы" в СК, затем их редактировать, чтобы буквы «и», «в» и «н» поставить на свои места. На плохих сканах с низким разрешением алгоритм сжатия в djvu не справляется с правильным определением этих букв. Любая программа OCR (а движок этой технологии запатентован компанией AABBYY, и иные компании должны брать лицензию у них на использование) прежде всего рассчитана на отличный скан, где каждая буква достаточно хорошо прорисована и выделена на общем фоне. Иначе, результатом OCR будет большое количество ошибок, которые надо будет исправлять вручную, но, опять таки, это имеет смысл для текстового слоя, картинка (изображение) текста, так и останется с дефектом.
 
Мне думается, самым правильным будет для вас дефектные по тексту страницы файла djvu "прогнать" через СК, тщательно каждую букву дефектную отредактировать, после чего все снова завернуть либо в djvu, либо PDF.
 
Либо запустите этот djvu-файл в FineReader и сделайте распознавание, затем опцией проверки все тщательно проверьте. Полученный текстовый слой наложите сверху изображения и тогда все огрехи изображения исчезнут сами по себе.  
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
 
Добавлено:
SVN75

Цитата:
Если даже нет, то помогите, пожалуйста, понять для чего Tesseract вообще можно использовать в СК и как именно это делается (ссылок будет достаточно).

 
Tesseract нужен для создания текстового слоя, чтобы затем его подставлять в djvu, либо PDF, чтобы обеспечить возможность поиска по тексту в таких документах. Лично я не пользовался пока еще Tesseract (но, попробую ради интереса ин шэ Аллаh), потому что самый лучший OCR это у AABBYY, а значит в программе их же - FineReader (советую брать версию 12, но не 15, она стала хуже), потому что у них разработаны прекрасные словари на очень многие языки, особенно на русский, аглицкий и иные европейские и неевропейские языки. Все специалисты считают, что более точного распознавания (OCR)  не дает ни одна программа, как это делает FineReader!
 
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
 
 
Добавлено:
А в целом, уважаемый bolega, я прихожу к вводу о том, что версия 6.71 проще в пользовании, чем 5.96.2. Вы просто запутали многих тем, что в VR переменяли местами кнопки, и пришлось снова обучаться их расположению, не могу понять, почему Вы это сделали...

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 20:03 17-07-2021
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo, alexarbuzik
Мне кажется, мы не совсем поняли друг друга, вероятно, я плохо объяснил. В указанных djvu-файлах вообще нет текстового слоя.
 
Я мыслю процесс возникновения проблемы следующим образом (насколько я понимаю специфику формата djvu, хотя я не специалист):
1) файл был отсканирован с низким разрешением;
2) запущена какая-то программа создания djvu с OCR-движком, которая плохо справилась с оцифровкой (разумеется, поскольку качество изображений было весьма посредственное с самого начала);
3) при сохранении файла в djvu-формате, были применены алгоритмы сжатия, специфика работы коих, имеющая значение для рассматриваемой проблемы, состоит в том, что сохраняется не собственно изображение, но текстовый слой с координатами каждого распознанного знака (букв, цифр и т. д.) на странице и библиотека изображений отдельных знаков. Поэтому картинки страниц стали выглядеть криво: в текстовом слое прописано, что на задаваемой координатами позиции должна быть буква «н», dvju-просмотрщик djvu подтягивает из библиотеки и отображает на экране соответствующий знак, хотя там, в действительности, должна стоять «и»;
4) потом кто-то текстовый слой удалил (понятия не имею зачем) и теперь мы имеем просто картинки с перепутанными буквами.
 
Вы правы, это можно распознать FR, но что это даст, даже если текст поправить руками? Картинка же всё равно будет выглядеть криво.
 
Мой вопрос был про то, можно ли осуществить обратный процесс хотя бы частично с помощью СК и Tesseract (кстати, думаю, что Вы ошиблись, Tesseract — технология, разработанная Google, насколько мне известно; Abbyy, конечно, есть могучий игрок на рынке ПО для оцифровки, но всё же не единственный, сомневаюсь, что Google им что-то платит).  
 
Вероятно, я слишком многого хочу от СК, но может кто посоветует хоть паллиатив, если не лекарство (проблема-то классическая).

Всего записей: 18 | Зарегистр. 26-02-2014 | Отправлено: 15:37 18-07-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru