Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
некорректно присвоил значения глифам с помощью OCR

По команде Add symbol to glyph library? или что имеется ввиду под значением?

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 19:46 17-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По команде Add symbol to glyph library

 
Да.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 19:57 17-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
А то, что СК, используя словарь Hunspell, правильно учитывает переносы, это благодаря каким-то особенностям Hunspell?
 

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 11:11 18-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
Нет, это СК учитывает перед отправкой слова в hunspell. Переносы также учитываются при поиске.  
Да вы это могли заметить даже по работе команды Edit ocr word. Слова с переносом там отображаются слитно

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 14:16 18-07-2022 | Исправлено: bolega, 14:18 18-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
А как СК это учитывает?
Дело в том, что я сделал hunspell-словарь для осетинской орфографии. Правда я пока собрал временный вариант -- просто собрал большой список слов в разных падежах и т.п., почти не применял hunspell’ских тегов.
И переносы в моем словарике СК не учитывает, да и слова не все видит. Может треть слов (может чуть больше) не видит, хотя они точно есть в dic-файле.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 14:37 18-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как СК это учитывает?  

сливает слово в одно, как будто переноса нет.  
 

Цитата:
И переносы в моем словарике СК не учитывает, да и слова не все видит.

ищите ошибку у себя или в своем dic-файле. СК просто подает на вход функции из libhunspell.dll искомый текст слова и получает результат поиска.
 
Добавлено:
те, которые не видит - сравните попарно код букв, входящих в слово. Может они разные, хоть и выглядят визуально похожими. А слова в вашем dic по алфавиту сортированы?

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 14:46 18-07-2022 | Исправлено: bolega, 14:52 18-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А слова в вашем dic по алфавиту сортированы?

 
Точно. Но там же используется та лигатура (ае -- здесь на форуме она неправильно отбражается, поэтому ее не пишу), так вот она при сортировке помещается последней, то есть алфавитный порядок такой:
а
б
в
...
ае.
 
Добавлено:
Сейчас заметил, что те слова (посмотрел три слова), которые СК не видит в словаре, в dic-файле прописаны с большой буквы, а в ocr в тексте они с маленькой. Может с этим связано.
Но ведь одно и то же слово может начинаться и с большой (в начале предложения) и с маленькой буквы.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 15:08 18-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но ведь одно и то же слово может начинаться и с большой (в начале предложения) и с маленькой буквы.

А может и нет, например, Воронеж.
Наверняка чтобы поиск в hunspell был not case sensitive, нужно какой-нибудь тэг задавать для слова.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 15:28 18-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Наверняка чтобы поиск в hunspell был not case sensitive, нужно какой-нибудь тэг задавать для слова.

 
Проконсультировался:
 
Если слово в словаре с маленькой буквы - то оно при проверке в тексте будет распознаваться корректно и с большой и с маленькой буквы. Если с большой - то корректным написанием будет только с большой.
 
Не знаю, может и проблемы с переносами в СК с этим связаны.

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 16:02 18-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сейчас в словаре везде прописные на строчные поменял и все получилось в СК. )
 
Добавлено:
bolega
А нельзя в новое версии в More2 внести в список языков и осетинский?

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 20:05 18-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А нельзя в новое версии в More2 внести в список языков и осетинский?  

Насколько я знаю, его нет в тессеракт. Сокращенные трехбуквенные обозначения языков я беру именно из него, чтобы была полная совместимость с ним. Для FR без разницы, т.к. СК не управляет им напрямую. В принципе могу внести что-нибудь, только вы сами придумайте уникальное обозначение для него.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 07:51 19-07-2022
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А нельзя в новое версии в More2 внести в список языков и осетинский?

bolega и греческий, пожалуйста.

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 07:59 19-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сокращенные трехбуквенные обозначения языков...только вы сами придумайте уникальное обозначение

помнится, обозначения языков прописаны в давнем международном стандарте. Как двух- так и трехбуквенные.

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 08:21 19-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Тогда "oss"

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 08:27 19-07-2022
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тогда "oss"

 
Да, oss.
 
https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%B4%D1%8B_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2

Всего записей: 535 | Зарегистр. 04-05-2016 | Отправлено: 08:59 19-07-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Привет, что я делаю не так? При вызове OCR  из главного окна, что-то обрабатывается, но никаких новых файлов не наблюдается. При вызове OCR  из окна результата  все распознаётся и файлы появляются.

Всего записей: 783 | Зарегистр. 03-07-2005 | Отправлено: 12:32 19-07-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
что я делаю не так?

Уже обсуждали. Баг. Уже исправлен в следующей версии.

Всего записей: 4435 | Зарегистр. 09-09-2002 | Отправлено: 13:25 19-07-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
спасибо, зачит где-то пропустил обсуждение.

Всего записей: 783 | Зарегистр. 03-07-2005 | Отправлено: 14:07 19-07-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мои пожелания для следующей версии программе остаются прежними - возможность выбора папки и фиксации её в профиле для выходного файла djvu. Выходной файл формата djvu всегда по умолчанию идет в папку out. Поясняю полезность фиксации пути выходного файла.  
Папка out постоянно удаляемая: получили готовый файл djvu и после этого рабочие файлы-сканы вместе с этой  папкой удаляются. Для последующей работы нужно иметь постоянную папку (я, например,назвал "Создание книг", т.е рабочая папка, откуда все последующие программы будут брать исходник, т.е постоянная неудаляемая рабочая папка, в которую можно направлять выходной файл djvu для последующей работы. Это было бы очень удобно.
Как тут некоторые товарищи советовали постоянно перед созданием прописывать путь к рабочей папке.... Но всё можно сделать проще, если дать возможность фиксировать путь выходного файла в профиле.  
Кому то это будет удобно ( не только мне), а во-вторых это будет одна из модификаций программы, отличающей её от предыдущей.  
 
Это пожелания, а вопрос  такой: можно ли отключить колесико мыши от перехода на последующий файл в списке файлов? Чтобы было понятно о чем идет речь, видеовопрос тут https://disk.yandex.md/i/KmNprWm3KHXmuA
 

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 20:14 20-07-2022 | Исправлено: kamenkapenza, 20:39 20-07-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
и после этого рабочие файлы-сканы вместе с этой  папкой удаляются

я после получения джву в Кромсаторе в обязательном порядке отсматриваю его во вьювере. В windjview extended есть команда меню "Save Copy as..." - и она запоминает путь к сохраняемому файлу-копии. То есть открыли дежавюшку, если всё ОК - то "save copy as" в вашу папку "Создание книг".

Всего записей: 3048 | Зарегистр. 15-07-2010 | Отправлено: 20:59 20-07-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru