Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Текущая версия:ScanKromsator v6.71 (2,49Мб)  ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г. И более полная от 25.12.2018 Хрестоматия 2.1
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы...  
И ещё bolega о том же самом...
И, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ
.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: shch_vg, 11:44 16-08-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVN75
 
Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный.
 
Решение конечной так себе, но лучшего нет. Или искать и пересканировать оригинал

Всего записей: 2822 | Зарегистр. 17-09-2001 | Отправлено: 15:57 18-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVN75
Вы заблуждаетесь! Я Вас прекрасно понял, но, к сожалению, Вы не совсем правильно понимаете процесс создания djvu. Не буду говорить за последнее, может быть компания Лизард, являющаяся автором этой удивительной технологии, в последних своих программах ввела возможность при создании djvu одновременно и создавать текстовый слой OCR, но на момент создания версии их программы Document Express Editor 6.0.1 Build 1320 такой возможности нет! Суть их технологии заключается в оригинальной возможности сжатия графических изображений максимально возможной степени с незначительными потерями качества или без такового, но выходной размер будет в разы больший. Если применять сжатие, то их технология раза в два и более обгоняет технологию AABBYY в PDF.
 
Текстовый слой создается отдельно рамными программами, в том числе, не только FR, но и Tesseract (и здесь вопрос только в качестве распознавания). Но, в djvu, в отличие от PDF, текстовый слой располагается только под изображение, поэтому он не может исправить саму картинку. в отличие от PDF, где текст можно класть как под картинку (и тогда картинка остается с теми дефектами, которые имелись), либо над картинкой, тогда все дефекты картинки по тексту исчезают (можно вообще написать свое и выдать за подлинный текст!).
 
Вы же столкнулись с явлением, которое, как я описал ранее, заключено в самой технологии сжатия изображения djvu. И никакие текстовые слои здесь ни при чем!
 
Еще раз говорю, эта проблема известна давно и решается она только одним способом: создание изображений, которые надо потом конвертировать в djvu, высокого качества и разрешения, тогда никаких ошибок не будет! Тот, кто это знает, так и поступает, а кто не знает, получает то, что имеете Вы.
 
AABBYY запантетовала свой движок на OCR, поскольку в итоге их работа оказалась самой качественной в мире. Это признают пользователи из-за рубежа, потому и их программа получали широкое распространение.
 
Google может у них не покупать лицензию, но потому их детище по OCR стало известно Вам, каким-то образом, и пользователям СК. Но знающие это обстоятельство, будут предпочитать использовать FR. И текстовый слой, созданный FR, потом с помощью программ отдельных разработчиков (а их уже много) затем подкладывать его под изображение в djvu.
 
А потому, если Вы ручками не исправите Вашу картинку с текстом djvu, то все эти огрехи так и будут видны, хотя поиск будет по тексту проводиться правильно, и даже копироваться правильно, чтобы потом его перенести в другие программы текстовых редакторов.
 
Добавлено:
niccolo

Цитата:
Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный.  

 
Вы также ошибаетесь, потому что править текстовый слой после распознавания можно в FR только до создания PDF, так как создание PDF - это заключительный этап, после которого редактировать, достаточно ограниченно, можно лишь в других программах, но это костыли для инвалида, хорошо отредактировать такой PDF весьма сложно, если, в ряде случаев, вообще возможно.  
 
То, что Вы предлагает, приведет его к тому, что открыв PDF в FR15, программа снова его попросит распознать страницы, затем их проверить и отредактировать, а потом уже этот слой можете использовать либо в djvu, либо в PDF.
 
 
 
Добавлено:
niccolo

Цитата:
Исправленный текст FR будет заемнять на печатный.  

Кстати, а иного, кроме как "печатного" текста FR и не создает, и ничего он не заменяет, а просто подкладывает этот печатный текст либо под изображение, либо над изображением, а результат визуальный будет разный! Хотя в обоих случаях поиск по тексту и копирование текста будет присутствовать.
 
Добавлено:
Уважаемый daa2013
Я все наслаждаюсь Вашим литературным шедевром, и все же, не откладывая в долгий ящик, решил сейчас спросить: у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".
Пожалуйста, объясните, с чем ее едят и под каким соусом, да, и каким прибором: ложкой или вилкой?

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 18:20 18-07-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alexarbuzik
 
Ваши знания несколько устарели. Finereader PDF позволяет редактировать PDF прямо, но в отличие от других программ, он еще и заменяет буквы на изображениях или накладывает исправленный текст поверх, независимо от первоначальной настройки ПДФ.

Всего записей: 2822 | Зарегистр. 17-09-2001 | Отправлено: 20:40 18-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alexarbuzik

Цитата:
у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".

Ищите и обрящете!

Всего записей: 6510 | Зарегистр. 14-01-2005 | Отправлено: 21:24 18-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемый niccolo!

Цитата:
Ваши знания несколько устарели. Finereader PDF позволяет редактировать PDF прямо, но в отличие от других программ, он еще и заменяет буквы на изображениях или накладывает исправленный текст поверх, независимо от первоначальной настройки ПДФ.

Потому что Вы говорите о монстре FR15, куда они вставили свой редактор, а Вы пробовали с ним работать?
Гораздо проще все сделать так, как я описал, но FR12, производительность выше и качество выше.shch_vg
shch_vg

Цитата:
Ищите и обрящете!

Где, в Википедии или в англо-русском словаре? Посоветовать с таким апломбом знатока Божественных книг может всякий, а конкретно - только специалист! Вы, к сожалению, не из таких!
Уважаемый SVN75!
Не затруднит Вас выложить проблемный для Вас djvu на файлообменнике и дать мне ссылку, чтобы мог скачать его? Может быть что-то смогу сделать для Вас, тем более, мне самому интересно посмотреть это экземпляр творчества оцифровывания книги...

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 21:50 18-07-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alexarbuzik
 
Гораздо проще все сделать в FR8, если у вас нет хитрых языков

Всего записей: 2822 | Зарегистр. 17-09-2001 | Отправлено: 22:20 18-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
но в отличие от других программ, он еще и заменяет буквы на изображениях

 
Если это так, то сделайте небольшой видеоролик об этом, обработав небольшой djvu, в котором сознательно на изображении страниц измените буквы...
 
А иначе, все, что Вы говорите, - из области Ваших измышлений! То, что говорю я, могу подтвердить видеороликами, могу сам снять процесс, как можно создать текстовый OCR даже из неправильного текстового изображения, но чтобы редактор, пусть даже графический, сам все подставлял на графике, т.е. изменял сам графику да еще интеллектуально? Теоретически все возможно, но практически кто создаст такой код, может быть это и под силу, разве что bolega? Спросите у него, он на этот вопрос точно может ответить, но  даже его прекрасный СК такого делать не умеет! Знаете, даже фотошоп до такого не дошел.
 
Так что, подтвердите, пожалуйста, свое заявление, тогда поверим!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 23:02 18-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alexarbuzik

Цитата:
Где, в Википедии или в англо-русском словаре?

Там, где вы не смогли найти.
Что пардон, то пардон, оказывается я нарвался на знатока "Божественных книг".
Юноша, не надо проявлять в этой теме такую экзальтацию, лучше смотрите внимательнее, прежде чем задавать вопросы.

Всего записей: 6510 | Зарегистр. 14-01-2005 | Отправлено: 23:03 18-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Гораздо проще все сделать в FR8, если у вас нет хитрых языков

 
Это Вы верно сказали, потому что уже, начиная с версии FR10, извлечь текстовый распознанный слой, как это рекомендуется в известной для СК программе DjvuOCR, уже невозможно, но можно сделать, если идти некоторым хитрым путем, я уже это сегодня опробовал и отлично получилось на моем любимом FR12.
 
 
Добавлено:
shch_vg

Цитата:
Юноша, не надо проявлять в этой теме такую экзальтацию, лучше смотрите внимательнее, прежде чем задавать вопросы.

 
Я прочитаю весь литературный шедевр daa2013, но пока еще не нашел, но не проще ли было ответить на этот вопрос  сразу, коль спрашиваю, чем томить меня, тем более, что мне это важно, потому что я отрабатываю сейчас все опции версии 6.71?
 
А так, создается у меня впечатление, что Вы больше изображаете из себя умников, чем действительных знатоков дела.
 
Чем мне нравится bolega, так это тем, что если он может ответить на вопрос, сразу отвечает коротко и точно, а если не знает, - просто молчит. А Вы много говорите, а толку-то мало...
 
Добавлено:
Ин шэ Аллаh!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 23:06 18-07-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Потому что Вы говорите о монстре FR15, куда они вставили свой редактор, а Вы пробовали с ним работать?

Пробовал и решал очень нетривиальную задачу. По выявленным проблемам накатал в Абби кучу замечаний - от багов до предложений, как и что улучшить? Но там всем пофиг....  
 

Цитата:
Если это так, то сделайте небольшой видеоролик об этом, обработав небольшой djvu, в котором сознательно на изображении страниц измените буквы...

 
А мне это зачем - для моих целей это не нужно. Озадачьте лучше свой пытливый ум...
 

Цитата:
Это Вы верно сказали, потому что уже, начиная с версии FR10, извлечь текстовый распознанный слой, как это рекомендуется в известной для СК программе DjvuOCR, уже невозможно, но можно сделать, если идти некоторым хитрым путем, я уже это сегодня опробовал и отлично получилось на моем любимом FR12.

 
Какая цель действий - извлечь текстовый слой или попытаться распознать лучше? По опыту - создавая ПДФ и DJVU никто не заморачивается с правильным наложением блоков и многими другими вопросами. Поэтому, если нужен текст - всегда оказывается лучше перераспознать, при необходимости исправив дефекты изображений страниц....

Всего записей: 2822 | Зарегистр. 17-09-2001 | Отправлено: 23:18 18-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Да, Вы оказались правы, нашел это в разделе "2.2. Черновая расстановка резаков", но возникает вопрос: почему же эту опцию не осветили в предыдущих разделах, где речь шла о DC, причем все опции освещены, а именно об этой ничего не сказали?
Autolevels - осуществляет выравнивание гистограммы. Эта функция, по сути, взята из Фотошопа.
Благодарю Вас, а то уж было расстроился по поводу Вашей специализации. Ма шэ Аллаh!
 
Добавлено:
niccolo

Цитата:
Но там всем пофиг....

 
Это Вы верно сказали, потому я с ними тоже более не общаюсь, после того, как еще на версию 12 писал им кучу замечаний.  
 

Цитата:
А мне это зачем - для моих целей это не нужно. Озадачьте лучше свой пытливый ум...

 
Свой ум я уже проверил, поработав на FR15, и дал себе зарок более эту версию не использовать, ин шэ Аллаh!
 

Цитата:
Поэтому, если нужен текст - всегда оказывается лучше перераспознать, при необходимости исправив дефекты изображений страниц....

 
Вот как раз об этом я и говорил, пытаясь все это объяснить товарищу SVN75.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 23:26 18-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alexarbuzik
Рад, что Вам удалось все-таки это найти. Если желаете более подробно познакомиться с тем, что эта функция еще делает в СК, загляните в раздел 4.11.
 
А теперь у меня есть предложение к niccolo и alexarbuzik.
Посмотрите на название темы, в которой вы находитесь.
Если вынести за скобки упоминание всуе СК, то то, что вы пытаетесь здесь обсуждать, является оффтопиком.
Советую переместиться с этим в тему "Электронные книги: сканирование, обработка, сборка - V".
Хотелось бы в этой теме получать информацию о Сканкромсаторе, а не о том, что и где можно что-то делать с дежавю.
Заранее благодарю.

Всего записей: 6510 | Зарегистр. 14-01-2005 | Отправлено: 00:24 19-07-2021 | Исправлено: shch_vg, 00:28 19-07-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".  

 
 
см. мой пост от     22:36 07-11-2018   в предыдущей ветке про Кромсатор и далее.
 
В самой же Хрестоматии я бы хотел обратить внимание на разделы 3.8. и 3.4.

Всего записей: 708 | Зарегистр. 13-06-2013 | Отправлено: 11:12 19-07-2021 | Исправлено: daa2013, 11:13 19-07-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
загляните в раздел

и вообще я офигеваю. Люди, которые задают вопросы, вы что, уже в принципе разучились условный Ctrl+F нажимать? На дисках личных компов 25 лет хранятся горы информации, а вы всё спрашиваете живых людей. Нонсенс. Бред какой-то. В читалках CHM есть закладка "поиск", я её открыл для себя в 1997м году. Почему не идти туда? Это же на часы проще. Никого не ждёшь. Вбил слово, получил список ответов. Пять-шесть раз слова поперебирал-потыкал, справа наткнулся на абзац с нужной информацией. Это стало так сложно нынче??! Функция поиска есть буквально везде, от тоталкоммандера до винды и гугла.

Всего записей: 1522 | Зарегистр. 15-07-2010 | Отправлено: 15:30 19-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Рад, что Вам удалось все-таки это найти. Если желаете более подробно познакомиться с тем, что эта функция еще делает в СК, загляните в раздел 4.11.  

 
Благодарю Вас, сделаю это обязательно, ин шэ Аллаh!
 
daa2013

Цитата:
см. мой пост от     22:36 07-11-2018   в предыдущей ветке про Кромсатор и далее.  
В самой же Хрестоматии я бы хотел обратить внимание на разделы 3.8. и 3.4.

 
Уважаемый daa2013! Я с наслаждением читаю Ваш литературный шедевр, поэтому все прочитаю, ин шэ Аллаh!
 
TelecomUral

Цитата:
и вообще я офигеваю. Люди, которые задают вопросы, вы что, уже в принципе разучились условный Ctrl+F нажимать? На дисках личных компов 25 лет хранятся горы информации, а вы всё спрашиваете живых людей. Нонсенс. Бред какой-то. В читалках CHM есть закладка "поиск", я её открыл для себя в 1997м году. Почему не идти туда? Это же на часы проще. Никого не ждёшь. Вбил слово, получил список ответов. Пять-шесть раз слова поперебирал-потыкал, справа наткнулся на абзац с нужной информацией. Это стало так сложно нынче??! Функция поиска есть буквально везде, от тоталкоммандера до винды и гугла.

 
Я не понимаю, что значит слово "офигеваю", видимо это опять иностранщина, введенная врагами русского языка, стоящими у власти, но, я не могу читать CHM, потому что на моей системе Win2003Serv. в этом варианте файлов не масштабируется текст, а уважаемый daa2013, изначально установил мелкий шрифт, поэтому я использую другой его вариант, выложенный по ссылке на этом форуме, и очень доволен. Ctrl+F я постоянно использую, потому что занимаюсь текстами  целый день, а значит мне необходим поиск. Весь спор возник из-за нелогичности освещения функций СК, объясняемых в его шикарной Хрестоматии. Я просто хотел все быстрее узнать, но, когда меня "отфутболил" shch_vg, быстро исправить ситуацию помог именно Ctrl+F, но опять, дискуссия продолжилась потому, что "отфутболивать" людей нельзя, особенно на технических форумах, они для того и существует, чтобы давать "бестолковым" советы!
 
Обратите внимание! Все, что происходит в бытии, все происходит по воле Аллаха Величайшего, Благословен и Превознесен Он и хвалою Ему, и все прекрасно, если вы все это поймете. Все это произошло для блага всех, иначе бы многие проблемы не выявились на форуме, особенно этического характера!
 
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
 
Добавлено:
Уважаемый shch_vg!

Цитата:
Советую переместиться с этим в тему "Электронные книги: сканирование, обработка, сборка - V".

Благодарю Вас за совет, но я занимаюсь оцифровкой книг уже 20 лет, мои работы, сделанные еще в 2006 году, кстати, с помощью СК 5.6а, выложены на моем сайте по адресу: http://www.u92698ze.beget.tech/ (обложка на адресе: https://sites.google.com/view/yura123), добро пожаловать, и можете скачивать книги и оценивать мой труд, как цифровальщика.
 
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 16:28 19-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Подробнее...




при нарушении правил есть кнопка "сообщить модератору".

Всего записей: 6510 | Зарегистр. 14-01-2005 | Отправлено: 23:47 19-07-2021 | Исправлено: Maz, 13:18 20-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...




Оффтоп, флуд. Здесь компьютерный форум, а не богословские чтения, не мечеть и не церковь.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 11:03 20-07-2021 | Исправлено: Maz, 11:30 20-07-2021
Egor30



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору





оффтоп

Всего записей: 114 | Зарегистр. 22-11-2007 | Отправлено: 12:20 20-07-2021 | Исправлено: Maz, 13:16 20-07-2021
Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заканчивайте оффтоп, пока он не перерос в большее!

----------
Я прав! Если не прав

Всего записей: 37394 | Зарегистр. 26-02-2002 | Отправлено: 13:18 20-07-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Уважаемый daa2013! Я с наслаждением читаю Ваш литературный шедевр

должен напомнить, большая часть текстов в Хрестоматии написана не мной
 

Цитата:
 daa2013, изначально установил мелкий шрифт

Я, кажется, уже об этом говорил, но еще раз. DrExplain имеет предустановленный размер дефолтного шрифта, который пользователь изменить не может.

Всего записей: 708 | Зарегистр. 13-06-2013 | Отправлено: 10:41 21-07-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru