Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Я уже задавал интересующий меня вопрос, но получил ответ на другой. Меня интересует, как Ваша программа при импорте определяет, с каким разрешением записана та или иная страница. Дело в том, что в других программах разбора pdf на tiff-ы в опциях можно задавать вертикальные и горизонтальные установки DPI, в Вашей эти параметры не задаются, а при разборе pdf тем не менее получаются разные разрешения для текста и обложек. Конечно, меня интересуют не технические детали этого, а возможность хотя бы приблизительно самому определять, с каким DPI содержится информация в конкретном pdf. М.б. это можно делать при просмотре, допустим, в Акробате? Часто встречаются pdf, в которых при просмотре размеры страниц скачут от размера на весь экран до маленького прямоугольника, как, например, в книге Решевского (следующий пост за постом vmik-а) на развороте 53.
Можно ли в этом случае оценить на глаз разрешения 52 и 53 разворотов?
Кстати, разобрав эту книгу Вашей программой, я вижу 96 DPI, что явно неверно, т.к. размер разворота 3507х2480.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 21:56 27-11-2007 | Исправлено: shch_vg, 22:12 27-11-2007
mengzhiyong

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
PIRASOFT
We tried helping you. But what can we do if you tend to make your work even harder.  
The whole technology is optimized for grey scans. If you scan in grey mode, I am ready to write a short instruction with only 3 or 4 short sections.
But if you want to go on scanning in BW, I cannot help you. Alas!  

 
Academician Ghosty:
 
I am trying to read all english posts. I see this post by you and pirasoft.
 
Please explain me in detail what you mean by:
 
The whole technology is optimized for grey scans.
 
Which technology is optimized and in what sense. Give some concrete examples
of how the algorithm is optimized for grey scan ?
 
 
 
automatically translated to russian:
[q] PIRASOFT
Мы старались помочь вам. Но что мы можем сделать, если вы, как сделать вашу работу еще труднее.
Вся технология оптимизирована для серой сканирует. Если сканирование в режиме серой, я готов написать короткое обучение только 3 или 4 коротких раздела.
Но если вы хотите перейти на сканирование в BW, я не могу вам помочь. Увы! [/ q]
 
Академик Ghosty:
 
Я пытаюсь читать все должности английский. Я вижу эту должность вы и pirasoft.
 
Пожалуйста, объясните мне подробно, что вы имели в виду по:
 
Вся технология оптимизирована для серой сканирует.
 
Какая технология оптимизирована и в каком смысле. Дайте несколько конкретных примеров
о том, каким образом алгоритм оптимизирован для сканирования серого?
 

Всего записей: 10 | Зарегистр. 16-06-2006 | Отправлено: 00:54 28-11-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
mengzhiyong

Цитата:
Which technology is optimized and in what sense. Give some concrete examples  
of how the algorithm is optimized for grey scan ?

By happy coincidence I have just written about that here.
Here is a quotation from that forum: Подробнее...

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 01:12 28-11-2007 | Исправлено: ghosty, 01:17 28-11-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
как Ваша программа при импорте определяет, с каким разрешением записана та или иная страница

Очень просто. Из pdf я получаю 2 значения: размеры изображения и размеры области на странице (в пунктах, которые легко перводятся в дюймы), в которые это изображение выводится. Поделив одно на другое, получим dpi. Здесь есть одна неприятность. Если изображение занимает всю страницу, то размеры области в общем случае не имеют никакого значения. Т.е. при создании pdf можно указать хоть метр, хоть километр, в обоих случаях acrobat (и любой другой просмотрщик) все равно правильно покажет страницу (за счет простого масштабирования в процессе вывода на экран). Главное - лишь бы соблюсти пропорции. Теперь понятно, почему может получиться 96 dpi. Если программа, которая создавала pdf, описала неправильно размеры страницы, и области тем самым, (т.е. как бы "натянуло" скан на те размеры, которые указаны и взяты возможно с потолка), то несмотря на правильное отображение, правильное dpi уже не узнать (только методом тыка).
Теперь как узнать эти параметры. Размеры в пикселях хранятся в pdf непосредственно в символьном виде, их можно увидеть, открыв pdf в текстовом редакторе (тэги Width, Height после каждого /Image).
Размеры области, в которую выводится скан, напрямую в pdf не хранятся вообще. Вместо этого хранится матрица, которая переводит логические координаты сканы (а они всегда принимаются равными 0..1) в физические координаты страницы. Эта стандартная 4х4 однородная матрица линейных преобразований содержит в себе результат поворота, смещения, масштабирования и сдвига (shear) изображения. Т.е. в общем случае описывает непрямоугольную область вывода скана. Матрица в pdf может задаваться не единожды (часто так и бывает), в этом случае чтобы получить окончательную матрицу, нужно их все собрать и последовательно переменожить.  
Таким образом, чтобы получить физические координаты области скана, нужно перемножить координыты 4-х точек изображения на эту матрицу, в результате получим четыре точки (left, top, right, bottom), которые и описывают область скана в дюймах. Как я говорил, в общем случае (при наличии поворота) это может быть ромб.
Визуально увидеть в текстовом редакторе матрицу практически невозможно, во-первых, из-за того, что она разбита на несколько подматриц, которые еще нужно найти и объеденить (перемножить), а во-вторых, в отличие от тэгов, она сжимается (методом deflate)
Вроде бы все.
 
Добавлено:
Еще подрбно объясню, откуда взялось именно 96dpi в том файле.  
Как обычно задется физический размер pdf-страницы, состоящей из скана? Берется скан, из него берется dpi, умножается на размеры скана и получается физический размер. Этот размер и устанавливается как размер pdf-страницы (бывают правда и извращения, когда размер страницы берется A4 или A5, и в него уже помещается скан). Теперь представим, что в скане не было прописано dpi, например, это был gif. Обычно в этом случае программы берут dpi монитора, т.е. 96. Исходя из этого и получается неверный размер страницы. Повторюсь, для отображения такого pdf это не играет никакой роли.
То, что кромсатор восстановил 96dpi, говорит как раз о том, что он сделал все правильно, другое дело, что оно уже при создании pdf было неправильным. Также это говорит о том, что сканы скорее всего были гифами. Вообще-то, из pdf можно многое узнать о самом сканировщике (пол, возраст), но это уже другая история

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 10:39 28-11-2007 | Исправлено: bolega, 11:19 28-11-2007
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Возникла серьезная проблема с sk 5.9: при повторной обработке книги (с перезаписью ранее уже созданых страниц) sk доходит до определенной страницы и молча слетает. Я попытался обработать эту же книгу, но записывая результаты в другой (пустой) каталог. sk проходит в обработке чуточку дальше и приостанавливает работу с сообщением Fail to save file. Пытаюсь зайти в File->Options и вижу последовательно два сообщения
---------------------------
ScanKromsator 5.9 [res2]
---------------------------
Access violation at address 7C9122BA in module 'ntdll.dll'. Read of address 036F8070.
---------------------------
OK    
---------------------------
и далее
---------------------------
ScanKromsator 5.9 [res2]
---------------------------
Failed to retrieve tab at index 0.
---------------------------
OK    
---------------------------
кроме того было одно сообщение по поводу access violation in user32.dll (я их сохранил, могу выложить позднее)
 
Что прикажите делать? (я могу выложить в сеть обрабатываемые мной файлы - это около 5Мб) Не связан ли этот глюк с мой ОС (т.е. не с sk)?
 
PS обработку веду с отключенной галкой Use threads
 
Добавлено:
bolega
Похоже, проблема все же в sk: я попытался обработать ту же книгу на другом компьютере - эффекты те же ;(

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 12:59 28-11-2007 | Исправлено: kontiky, 13:02 28-11-2007
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Большое спасибо за столь подробный ответ на мой вопрос. К сожалению, я из него для себя извлек мало пользы, но это потому, что я никак не могу более точно сказать, что же мне нужно.
Попробую еще раз сформулировать. Ваша программа сама разбирает пдф на тифы и ставит в них дпи (какое ей удастся определить). Меня же интересует, как поступать в случае работы, допустим, с программой pdftotiff, для которой нужно задать установки DPI по горизонтали и вертикали. Я понимаю, что можно задать любые, и тогда программа будет переводить, но как я понимаю, любое повышение/понижение разрешения, мягко говоря, не способствует улучшению тифов. Хотелось бы как-то определить, каким было разрешение у большинства тифов в момент помещения их в данный пдф.
Уф, вряд ли мне удастся объяснить более толково.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 15:11 28-11-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Я Вас прекрасно понял.
Из моего ответа следует, что внутри pdf dpi никак не хранится, оно акробату сто лет не нужно. Определить его можно единственным способом, который я описал. Если pdftotiff не предоставляет информации, которая нужна для расчета dpi (размеры изображения, и главное, область в дюймах, занимаемую изображением), значит определить его с помощью нее невозможно никак. Поскольку как я понял, pdftotiff не извлекает изображения, а рисует их, то есстественно, он будет спрашивать у пользователя dpi, чтобы отрисовать в тиф именно в таком dpi.  Т.е. то dpi, которое он получает от вас, ничего общего с реальным dpi не имеет, а определяет лишь качество отрисовки.
 
Добавлено:
kontiky

Цитата:
я могу выложить в сеть обрабатываемые мной файлы - это около 5Мб

Выложите, и задание тоже. Спасибо

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 17:07 28-11-2007
serzfm

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос для Bolega.  
Извиняюсь, можно внести предложения по улучшению работы при редактировании обработанных листов после операции Process! в окне Result View?

Всего записей: 1 | Зарегистр. 28-11-2007 | Отправлено: 19:01 28-11-2007 | Исправлено: serzfm, 16:59 29-11-2007
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Выложите, и задание тоже. Спасибо

Вот. Посмотрите пожалуйста, что там за напасть (смотрите задание res2).

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 21:36 28-11-2007 | Исправлено: kontiky, 00:45 29-11-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky
Похоже, какой-то баг закрался в deskew ч/б сканов.
Точно причину пока установить не могу, т.к. баг проявляется не сразу, а только через некоторое время опосредствованно. У меня Ваше задание сбоит в самых непредсказуемых местах, каждый раз в разных. Из-за этого и причину найти пока не удается. От usethreads не зависит.
Попробуйте поставить для всех файлов Art deskew. Должно помочь.

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 14:08 29-11-2007
pepux



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Почему-то введение exclude или picture zone на странице ухудшает качество upsample при использовании размывания и сглаживания, причем на обеих страницах разворота. Возможно, это тот же эффект, что недавно описывал shch_vg? Задания для версии 5.9:
http://rapidshare.com/files/73085287/zone_influence.rar

Всего записей: 78 | Зарегистр. 27-03-2006 | Отправлено: 15:22 29-11-2007 | Исправлено: pepux, 15:23 29-11-2007
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Напомните, плз, каким инструментом надо делать слияние зон (*.sep.tif) с текстом при кодировании в дежавю?

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 15:39 29-11-2007
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Попробуйте поставить для всех файлов Art deskew. Должно помочь.

Спасибо за помощь. Попробую вечером дома.

Цитата:
Похоже, какой-то баг закрался в deskew ч/б сканов.

Очень надеюсь, что вы это пофиксите. Буду ждать, так как активно работаю именно с ч.б. изображениями.
 

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 15:52 29-11-2007
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Если я правильно понял, после кромсания в СК у Вас есть файлы маски 0*.tif и файлы фона (зоны) *sep.tif. Здесь инструменты для сборки sep файла и кодирования с помощью msepdjvu. Батники придется поправить (или переименовать *sep.tif), так как там предполагается, что файлы фона именуются как bg*.tif. Если придумаете, как поправить батники, сообщите, с ходу не могу сообразить .

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 16:10 29-11-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Zones->Picture zone->Merge zones
В появившемся окошке поставить галку на Create separate files for non-bw zones

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 16:31 29-11-2007
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
В появившемся окошке поставить галку на Create separate files for non-bw zones

Это я, как раз и сделал, интересовало что дальше
 
Arcand
Спасибо, поробую

Цитата:
Если придумаете, как поправить батники, сообщите, с ходу не могу сообразить .

Проще файлы переименовать

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 16:37 29-11-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pepux

Цитата:
Почему-то введение exclude или picture zone на странице ухудшает качество upsample при использовании размывания и сглаживания, причем на обеих страницах разворота

Исправил

Всего записей: 4442 | Зарегистр. 09-09-2002 | Отправлено: 17:16 29-11-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чуть подправил инструкцию, поменял картинки в соответсвии с новой версией -  
_http://rapidshare.com/files/73151336/ScanAndShare1.07.rar

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 21:11 29-11-2007
Gajver100

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ребята, у меня вопросик. Вот я обработал книгу, выскочило окно с результатов и мне хочется отредактировать яркость/контрастность картинки которая попало в область зоны, как мне это сделать? Зона Mark as Picture zone

Всего записей: 114 | Зарегистр. 25-12-2006 | Отправлено: 22:47 29-11-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gajver100
Если даблкликнуть мышой на зоне, то появится окно с её свойствами, поправить по вкусу и перекромсать страницу.

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 22:53 29-11-2007
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru