Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
nuget2

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Понятия не имею, можно ли оттуда выдрать обратно на локальный диск без потери качества.

А изначально в каком разрешении было видео?
 
Вот что на выходе youtube-dl:

Код:
 
$ youtube-dl -F https://vk.com/video557963068_456239119
[vk] 557963068_456239119: Downloading JSON metadata
[vk] 557963068_456239119: Downloading m3u8 information
[info] Available formats for 557963068_456239119:
format code  extension      resolution note
url240       unknown_video  240p
url360       unknown_video  360p
url480       unknown_video  480p
url720       unknown_video  720p
hls-186      mp4            256x136     186k , 30.0fps
hls-261      mp4            426x226     261k , 30.0fps
hls-445      mp4            640x340     445k , 30.0fps
hls-653      mp4            852x452     653k , 30.0fps
hls-1149     mp4            1280x680   1149k , 30.0fps (best)
 

 
Максимальное разрешение, доступное для просмотра/скачивания, 1280x680.

Всего записей: 234 | Зарегистр. 10-08-2014 | Отправлено: 00:51 24-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
nuget2
я ничего не пережимал. MPC-HC показывает:

Цитата:
Video: MPEG4 Video (H264) 1356x720 29.97fps 629kbps [V: h264 high L3.2, yuv420p, 1356x720, 629 kb/s]
Audio: MP3 44100Hz stereo 256kbps [A: mp3, 44100 Hz, stereo, 256 kb/s]

Вполне вероятно, дело в "1356", потребовалась перекомпрессия с обрезкой, отсюда и потери. Хотя какое кому дело до пикселей на видеосервере, непонятно. Хранилось бы в оригинале.

Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 04:00 24-04-2022
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хотя какое кому дело до пикселей на видеосервере, непонятно.  

Большое дело. У Трубы аппаратные компрессоры (насколько я помню), а у них конкретные значения, как у ваших дежавюшек.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 06:29 24-04-2022
kamenkapenza



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Впечатляет. Хотя без части 3 абсолютно непонятно, в каком виде и от какой версии ФР используется OCR информация.


Цитата:
Такой режим есть. Я вроде демонстрировал его. Возможно, он как раз в не выложенном ролике.

 
Будем ждать третью часть.

Всего записей: 666 | Зарегистр. 23-05-2021 | Отправлено: 07:48 24-04-2022
nuget2

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, как получилось такое разрешение (1356x720)? Формат HD 720p кодируется с разрешением 1280x720 (16:9).

Всего записей: 234 | Зарегистр. 10-08-2014 | Отправлено: 08:14 24-04-2022 | Исправлено: nuget2, 08:18 24-04-2022
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Кто-нибудь знает, в текущей версии (а м.б. в следующей?) СК есть фича автоматического выравнивания по вертикали набираемого из глифов слова?
В старой периодике формата А3, как правило, хранящейся в согнутом состоянии, на сгибе посредине пропадают слова и предложения, которые приходится восстанавливать по смыслу.
Основной геморрой возникает при наборе отдельного слова. Как ни выравниваешь очередную букву к предыдущей, после ее фиксации она часто смещается по вертикали, что сразу же заметно. Приходится повторять этот процесс, делая поправку на будущее смещение.
Мой вопрос о наличии фичи, которая автоматически выравнивает по низу предыдущей буквы.
Буквы типа р, ц, щ и т.д. могли бы дополнительно выравниваться по доп.щелчку на вставляемой букве.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 13:02 24-04-2022 | Исправлено: shch_vg, 13:03 24-04-2022
imwerden

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1 часть на ю-тубе для наших эмигрантских кругов
 
https://www.youtube.com/watch?v=5iHfaVFOfXo
 
2 часть загружаю: https://youtu.be/0j3HQ7VrI6E

Всего записей: 14 | Зарегистр. 06-06-2014 | Отправлено: 15:01 24-04-2022 | Исправлено: imwerden, 15:18 24-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
3-я часть https://workupload.com/file/Tc6ewvvFtXh

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 18:23 24-04-2022
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, спасибо за видео и за sk! Прям революция в нашем деле! Помню как я по глифику реставрировал 300-страничную книгу целый год.

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 19:33 24-04-2022 | Исправлено: sergiokapone, 19:33 24-04-2022
italia57

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
3-я часть на ЯД - https://disk.yandex.ru/i/AbTv4koTmCGogw

Всего записей: 16 | Зарегистр. 25-11-2020 | Отправлено: 20:09 24-04-2022
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Части 1—4 на ютубе
 
https://youtu.be/tds0FR7JYdA
https://youtu.be/brpbjRnvfNY
https://youtu.be/bhkS-asM8bY
https://youtu.be/oLez77QD094

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 21:30 24-04-2022
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
nuget2

Цитата:
как получилось такое разрешение (1356x720)? Формат HD 720p кодируется с разрешением 1280x720 (16:9).

Это разрешение монитора тех времён, когда ФуллХД ещё не вышел толком на рынок.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4309 | Зарегистр. 18-09-2003 | Отправлено: 05:54 25-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
попробовал положить в ВК правильный размер 1280х720, не помогло. Мелкие кусочки букв исчезают (как деспекл )

Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 07:27 25-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ролики посмотрели. Теперь вопрос - а где же сама программа?
 
Еще один вопрос к понимающим — из пакета SK с OCR информацией файлы можно будет сохранять в OCR PDF?

Всего записей: 3675 | Зарегистр. 17-09-2001 | Отправлено: 10:35 25-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Теперь вопрос - а где же сама программа?  

Думаю, в ближайшие дни будет релиз.
 

Цитата:
Мой вопрос о наличии фичи, которая автоматически выравнивает по низу предыдущей буквы.  

Такого пока нет
 

Цитата:
из пакета SK с OCR информацией файлы можно будет сохранять в OCR PDF?

Такого нет. Я как-то пытался добавлять текст, но ничего хорошего не вышло. Поместить в pdf картинку оказалось на порядок проще, чем не-английский текст.
 
 

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 12:30 25-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проще, чем не-английский текст

ну уж, прям сложность. С вашим-то опытом да не подобрать кегль и межбуквенный интервал в слове.
Вот с самим файлом шрифта - да, проблема. И с внедрением, и чтоб все значочки нашлись, и без CMap. Подойдёт только ариал, и то не всегда.

Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 14:17 25-04-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Например, русский текст вставляется с любым шрифтом, и отображается корректно. Но поиск ничего не находит. Вот в чем была у меня проблема

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 17:09 25-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
это неверная отработка CMap (отсутствие её, вероятнее всего). Не хочу хвастать, но  я в общем разобрался, как там всё устроено в стандарте, могу проконсультировать, если что. Уж по неработающему примеру - точно смогу, натренировался на ветке http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&glp#lt

Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 17:36 25-04-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но поиск ничего не находит. Вот в чем была у меня проблема

 
А копи-паст что выдаёт - крякозябры? А что за инструмент для создания PDF использовался?  
Если память не изменяет - почти во всех ПДФ, созданных с адобовским шлаком версий года до 2008-2010, были проблемы кодировкой кириллицы.... Даже сейчас в куче истинных ГОСТов тех лет поиск не работает и копируются крякозябры.....
 
Больше, правда, удивило то, что ударившись головой в PDF, Abbyy не сделало автоматического инструмента для исправления этой проблемы....
А если пытаться через Infix - то если в файле 1-2 шрифта - можно помучиться и сопоставить их - хотя-бы в Infix всё заработает нормально (можно будет скопировать текст только с ошибками набора).... Но когда шрифтов больше 5...... (именно поэтому меня удивляет Bolega ваше стремление выбирать буковки ручками)....
 
При исправлению кривизны строк через OCR пока единственный вариант — выставлять буковки ровно вручную?
 
Вопрос к автору утилитки FR 12-15.  
Для более ранних версий - типа 8, где текст ещё привязан к страничкам и находится в файлах frf, версии инструмента не будет?

Всего записей: 3675 | Зарегистр. 17-09-2001 | Отправлено: 17:38 25-04-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Для более ранних версий - типа 8

кстати, да - восьмерка лучше опознавала буквы, можно ли ее результаты прикрутить к СК ?

Всего записей: 3058 | Зарегистр. 15-07-2010 | Отправлено: 17:54 25-04-2022
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru