Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер!
 
Подскажите, пожалуйста, как лучше поступить, если страницы книги отсканированы с разным разрешением (250, 300 и 400 dpi). На выходе хочется иметь разумеется страницы одного размера.

Всего записей: 20 | Зарегистр. 26-02-2014 | Отправлено: 00:09 22-03-2023
MrLAG

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega,shch_vg
 
Спасибо! Я ведь это пробовал, но успел забыть, привык к вещам попроще. Давно не брался именно за такие сканы.  
------
 
Стал потихоньку разбираться с реставрацией букв. Посмотрел видеоурок - в целом понятно, и не сложно разобраться. Взялся за поправку точек в оглавлении, наиболее насущный для меня вопрос.  
 
Вот задача https://disk.yandex.ru/d/WEqSK4XCPfUqgg . Я уже провёл автоматическую замену, и на обработанном файле это будет легко заметить. И вот в чём мой вопрос: Тессеракт распознал все точки на картинке. СК после нажатия кнопки анализа опознал только часть. В строке со словами "Галогениды лития" идут позиции  1/29 затем 1/32 , т.е. позиции 30 и 31 пропущены.  
 
Поиграв с настройками на закладке "options" мне удалось добиться включения более жирной точки в позиции 33. Но далее как я не менял, добиться включения мелких точек мне не удалось (распознанных тессерактом). Слишком малы?
 
Таких точек не очень много, я могу их заменить щёлкая на каждую. Но я вероятно что-то упустил из виду и буду благодарен за подсказки.  
---
 
asku

Цитата:
В окне Result View в режиме очистки спеклов (Mouse-up-despecle mode) при выделении зоны и одновременном удерживании Ctrl+Shift белые «пятна» внутри черноты (букв и т.п.) окрашиваются черным  
 

 
Посмотрел Ваш пример. Поставил в "Clear options" "White hole size" = 15 - указанные Вами области стали закрашиваться.  
 
Добавлено:
SVN75
 

Цитата:
Подскажите, пожалуйста, как лучше поступить, если страницы книги отсканированы с разным разрешением (250, 300 и 400 dpi). На выходе хочется иметь разумеется страницы одного размера.

 
Можно попробовать установить на закладке Files выходное разрешение вместо Original, то, которое Вы желаете, например 400 или 600. Если это страницы одной книги, то в итоге должны получиться одинаковые.  

Всего записей: 58 | Зарегистр. 19-11-2008 | Отправлено: 00:37 22-03-2023 | Исправлено: MrLAG, 00:50 22-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
На выходе хочется иметь разумеется страницы одного размера

вопрос непонятен. Размер в каких единицах?

Всего записей: 2365 | Зарегистр. 15-07-2010 | Отправлено: 09:15 22-03-2023
SVN75

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MrLAG
 

Цитата:
Можно попробовать установить на закладке Files выходное разрешение вместо Original, то, которое Вы желаете, например 400 или 600. Если это страницы одной книги, то в итоге должны получиться одинаковые.

 
Спасибо, но я именно так и сделал (установил 600 dpi на выходе), но ширина текстовой области для случая, например, исходной страницы с 250 dpi получается больше, чем для страницы с 400-ми.
 
TelecomUral
 

Цитата:
вопрос непонятен. Размер в каких единицах?

Речь идёт во-первых размерах самих страниц (этого одного, конечно, не сложно добиться), во-вторых размерах текстовых областей на них. Вроде бы я читал, что СК не очень уверенно выставляет размеры в миллиметрах (хотя это было давно, может поправили), поэтому речь идёт о пикселях.

Всего записей: 20 | Зарегистр. 26-02-2014 | Отправлено: 19:08 22-03-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
SVN75
ширина текстовой области для случая, например, исходной страницы с 250 dpi получается больше, чем для страницы с 400-ми

Одной и той же страницы?? Или таки разных? А если разных - так может сканеры различаются или сами страницы имеют разное число миллиметров в текстовых областях?
Короче, решение известно и описано в шапке. Насчёт субтаска.

Всего записей: 2365 | Зарегистр. 15-07-2010 | Отправлено: 21:10 22-03-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
SVN75

Цитата:
Вроде бы я читал, что СК не очень уверенно выставляет размеры в миллиметрах (хотя это было давно, может поправили), поэтому речь идёт о пикселях.

СК работает одинаково уверенно что в мм, что в пикселях, но он не обязан разбираться, какое у сканов стоит разрешение. Это сугубо дело обработчика.
Сначала сравните размеры сканов в каждой из указанной вами групп.
Если, допустим, все сканы в одной группе примерно одного размера, то задача для вас заметно упрощается. Надо всего-навсего выбрать из каждой группы по одному скану, заключить их в один subtask и выложить результат сюда в архиве. Как это сделать, указано в шапке.
Если же в одной группе размеры разные, то дело швах , придется много возиться.
 
Hint: Для первого случая надо выравнять разрешение этих групп. Лучше это делать по ширине текстового блока, т.к. высоты могут заметно различаться. Из каждой группы выбираете по одному скану  с полноценными строками по ширине и обрабатываете их в СК, обрезая вертикальными резаками по краям текстовой зоны. Далее принимаете разрешение любой группы (по желанию, я бы выбрал 300) в качестве правильного и простой пропорцией рассчитываете, какое разрешение нужно подставить для двух других групп (каждому свое).
После этого меняете в СК у каждой из этих группы разрешение на вычисленное и, наконец, делаете обработку всего задания. Величины текстовых блоков у всех сканов будут примерно одинаковы.

Всего записей: 6809 | Зарегистр. 14-01-2005 | Отправлено: 00:12 23-03-2023 | Исправлено: shch_vg, 11:31 23-03-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru