Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: сканирование, обработка, сборка
 
Текущая версия программы : ScanKromsator v6.8 ScanKromsator v6.75
добавки и замечания к v6.75 от bolega
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate! Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.
 
Предыдущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  Устаревшие версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее...
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...
 


ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом... и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 12:36 25-11-2022
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Да, я не правильно выразился. Действительно, обрезаться не будет, но выравниваться тоже правильно не будет, насколько помню. Это если выравнивание по центру.  
В этом примере выравнивание по правому (и левому — через страницу) краю. В данном случае может выравнилось бы все корректно, но я уже вручную все такие страницы подправил, а потом уже финализировал.

Всего записей: 365 | Зарегистр. 04-05-2016 | Отправлено: 18:19 23-06-2022
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
А возможно ли в качестве словаря сделать возможность использования не только Hunspell, но и например, просто txt-файл (кодировка UTF-8), где был бы просто список слов?

Всего записей: 365 | Зарегистр. 04-05-2016 | Отправлено: 12:09 24-06-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
В 6.75 не нашел опции Zoom в контекстном меню списка файлов гл.окна: Special

Всего записей: 6689 | Зарегистр. 14-01-2005 | Отправлено: 20:52 24-06-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А возможно ли в качестве словаря сделать возможность использования не только Hunspell, но и например, просто txt-файл (кодировка UTF-8), где был бы просто список слов?

 
Никто не мешает вам добавлять слова в словарь Hunspell, не добавляя модифицирующие суффиксы/приставки

Всего записей: 3294 | Зарегистр. 17-09-2001 | Отправлено: 21:12 24-06-2022
kamenkapenza



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Товарищи, добрый вечер!  
Почему то у меня перестал отображаться оригинальный значок программы на панели задач. Вот видеоподтверждение https://disk.yandex.md/i/t48_iZmCc0_Rsg

Всего записей: 534 | Зарегистр. 23-05-2021 | Отправлено: 19:50 26-06-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Поделюсь своим опытом использования новых фич...
 
Для примера взял 5 язычный геологический словарь  
https://www.geokniga.org/authors/56221
 
Импортировал в SK - отмаркировал, сняв все галки, подсунул файлы в портативный FR15(!!!), распознал, скопировал букмарки - в общем всё по описанной схеме.
1. ВРОДЕ как бы получается - но только вроде.....  
Не знаю почему - но часть распознанных страниц не совпала с оригиналами. Выявить закономерность не удалось....То ли пустые страницы помешали, то ли цветные..... Ручные махинации с пакетом в FR15 - удаление картиночных блоков с цветной страницы и добавление пустого текстового блока на пустые страницы ухудшили ситуацию ....
Учитывая частые проблемы у ФР с правильной расстановкой зон/блоков распознавания - для нормальной работы функции явно требуются более глубокие знания структуры пакета/выходных данных FR.
 
IMHO FR8 с отдельными файлами распознавания для страниц кажется более простой альтернативой, если не касаться отсутствующих языков. Касательно вносимых искажений - поскольку ни от кого не слышал, что они заметны визуально - для OCR коррекции в качестве выходных можно использовать вместо пакетных файлы после распознавания FR8... Можно даже распознавать в FR только текстовые зоны до финализации.....
 
Еще одной альтернативой может стать использование Abbyy FR Hotfolder отдельно для самых проблемных файлов...Но тут лучший порядок действий пусть подскажут те, кто интенсивно пользуется данной функцией....
 
2. Опять я буду плакаться о том, что ручной набор глифов, охватывающих алфавиты, в СК - идея не самая здравая, точнее её трудоёмкость (минимум 2-3 гарнитуры по полному алфавиту красивых (т.е. часто требующих поиска) букв) оправдана лишь в исключительных случаях.... При наличии OCR информации собрать такую информацию из файла не проблема...
Второй альтернативой остаётся использование шрифтов - большую часть которых наверняка можно будет подобрать в сервисах подбора шрифтов по картинкам....
 
3. С точки зрения юзабилити - в текущем исполнении для функции FR-OCR разумнее забить Parser в настройки и просить у пользователя указать только расположение пакета FR.
 
4. После проблем с п.1 захотел создать субтаск только с польским индексом - как наиболее проблемным в части марашек.... Выбрать файлы в Windows-манере с нажатым SHIFT/CTRL - нельзя... Указать для субтаска поддиапазон страниц, как в типичном виндовом диалоге печати нельзя... Вроде мелочи - а раздражает....

Всего записей: 3294 | Зарегистр. 17-09-2001 | Отправлено: 23:16 26-06-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
часть распознанных страниц не совпала с оригиналами.

вот здесь наиболее вероятные причины этого..
http://forum.ru-board.com/topic.cgi?forum=5&topic=38467&start=580#9
проблема несовпадения страниц наблюдается при использовании файлов из временной папки, если сохранить проект в новую папку, то страницы встают на свои места..  
если же руками в проекте фр делать правки - то это также может привести к непредсказуемым последствиям вплоть до вылета программы, делать это крайне не рекомендуется..
 
Добавлено:
niccolo
и в данном топике на стр.127 тоже было обсуждение на эту тему..

Всего записей: 1367 | Зарегистр. 26-07-2007 | Отправлено: 00:12 27-06-2022 | Исправлено: NME, 00:14 27-06-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
 
Спасибо за инфо. Как-то пропустил информацию про проблемы с результатами распознавания из TEMP-папки.
 
Остаётся вопрос - что делать со случаями, когда ФР упорно ставит блоки неверно? Для отдельных букв это не особо принципиально или даже вообще непринципиально, когда речь идёт об одноязычных документах, но с многоязычными это уже не так...
 
Сохранять шаблон блоков и накладывать их? Или?

Всего записей: 3294 | Зарегистр. 17-09-2001 | Отправлено: 07:45 27-06-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Можно попробовать вручную расставить блоки, но результат не гарантирован.. и есть особенность - блоки на странице нужно менять абсолютно ВСЕ! т.е. сначала все удалить, а потом вручную нарисовать новые и перераспознать страницу.. двигать блоки и их границы нельзя, т.к. в этом случае фр меняет идентификаторы блоков и программа их не находит..

Всего записей: 1367 | Зарегистр. 26-07-2007 | Отправлено: 08:54 27-06-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
 
 

Цитата:
Можно попробовать вручную расставить блоки, но результат не гарантирован.. и есть особенность - блоки на странице нужно менять абсолютно ВСЕ! т.е. сначала все удалить, а потом вручную нарисовать новые и перераспознать страницу.. двигать блоки и их границы нельзя, т.к. в этом случае фр меняет идентификаторы блоков и программа их не находит..

 
Для одиночных страниц проще - исправил блоки, сохранил шаблон, удалил все, и вернул обратно из шаблона... А провернуть сие даже на 100 страниц уже утомительно...
 
Переносить пакеты блоков другим способом Абби тоже не позволяет...
 
Может тут умельцы напишут макрос сохранения блоков по всем страницам пакета и их последующим наложением например на исправленные страницы....

Всего записей: 3294 | Зарегистр. 17-09-2001 | Отправлено: 09:38 27-06-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
niccolo
абби вам не выполняет пожелания, так вы на болегу насели? Сами давайте.

Всего записей: 2101 | Зарегистр. 15-07-2010 | Отправлено: 10:08 27-06-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 

Цитата:
абби вам не выполняет пожелания, так вы на болегу насели?

 
Вы путаете указание недостатков/альтернативных путей решения проблем с требованиями. Я не заказчик софта и требовать ничего не могу...

Всего записей: 3294 | Зарегистр. 17-09-2001 | Отправлено: 10:18 27-06-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
да я пошутил

Всего записей: 2101 | Зарегистр. 15-07-2010 | Отправлено: 10:38 27-06-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral а возможно при помощи постеризации утолщить контур?
 

Всего записей: 770 | Зарегистр. 03-07-2005 | Отправлено: 22:08 27-06-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm
без примера непонятен вопрос.  
постеризация это уменьшение количества цветов. если, допустим, на полноцветной картинке вокруг линии одного цвета тонкий контур другого цвета, то при постеризации можно особо назначить  этому другому цвету "заменить его на цвет линии". Получится утолщение линии. Иначе я не понимаю, о чём вы.

Всего записей: 2101 | Зарегистр. 15-07-2010 | Отправлено: 22:22 27-06-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral спасибо, это то, что я хотел узнать
 

Всего записей: 770 | Зарегистр. 03-07-2005 | Отправлено: 23:24 27-06-2022
kamenkapenza



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Господа, мир всем! Не в курсе, как в новой версии 6.75 фиксировать масштаб? Пока не смотрел видео от автора (там, наверное, есть). В предыдущей версии масштаб открытия страниц (фикс) делался через Special – Zoom – Fix current zoom. Тут такого пути нет.

Всего записей: 534 | Зарегистр. 23-05-2021 | Отправлено: 21:10 01-07-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kamenkapenza

Цитата:
как в новой версии 6.75 фиксировать масштаб?

На мой аналогичный вопрос я пока не получил ответ.

Всего записей: 6689 | Зарегистр. 14-01-2005 | Отправлено: 23:58 01-07-2022
aylocin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как в новой версии 6.75 фиксировать масштаб?  

Думаю, с помощью меню Image -> Zoom -> Fix current zoom

Всего записей: 136 | Зарегистр. 16-12-2005 | Отправлено: 00:43 02-07-2022
kamenkapenza



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
aylocin, спасибо!!! Работает.
shch_vg, проблема решена.
 
 

Всего записей: 534 | Зарегистр. 23-05-2021 | Отправлено: 08:05 02-07-2022 | Исправлено: kamenkapenza, 10:21 03-07-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2023

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru