Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня есть некоторый опыт по дежавючиванию книг с гигапедиии, так, если это векторный пдф,  то 600 это однозначно, результат аналогичен оригиналу, если это скан, то в большинстве случаев это 300 и повышать разрешение до 600 никакго смысла нет, результат также однозначно индентичен оригиналу, все это видно на глазок, ошибиться трудно, но а если попадается 150, то я даже и не связываюсь с этим, нефиг плодить какашку.

Всего записей: 2873 | Зарегистр. 22-03-2005 | Отправлено: 22:17 22-10-2008
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
очень интересная информация об извлечении битмэпов из пдф с помощью акробата.
теперь стало понятно, откуда у людей косяки.
 
вообще-то это очень нетривиальная тема (спасибо разработчикам  пдф за то, что делают нашу жизнь интересной)
 
типичная ситуация: человек отсканировал книгу в 300дпи, на выходе получил сразу пдф.
(драйвер сканера такой)
ну да ладно. Тогда человек взял акробат и сделал вручную crop на каждой странице, чтобы поровнее было.
получился огромный пдф. Затем с помощью ghostscript были извлечены битмэпы в 300dpi JPG. Ясно, что получилось в результате: жуткие артефакты из-за ресемплинга (crop сделал извлечение битмэпов по 2-му способу некорректным). Ну и лишний цвет из-за jpg.
 
кстати: может я уже спрашивал, - а что делает СК если на странице ПДФ файла находится комбинация нескольких растров в разных разрешениях?  (например, ч-б текст и серая картинка.) Надо что-то растеризовать и как-то выбрать разрешение. Что делает СК в такой ситуации?

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 22:49 22-10-2008 | Исправлено: are, 22:51 22-10-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
are

Цитата:
а что делает СК если на странице ПДФ файла находится комбинация нескольких растров в разных разрешениях?  (например, ч-б текст и серая картинка.)  

Текст становится основным сканом, а картинки SK располагает поверху как независимые зоны так же, как они располагались в pdf (SK поддерживает внешние зоны на исходном скане, при этом их цветность и dpi могут отличаться от самого скана). Если в pdf картинки содержали прозрачные области и заливки цветом, то Sk полностью воспроизводит их и в задании. Обработка внешних зон при кромсании практически ничем не отличается от внутренних зон (т.е. тех, которые образуются при кромсании путем вырезания из скана).

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 10:19 23-10-2008 | Исправлено: bolega, 10:23 23-10-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
VadimirTT

Цитата:
но а если попадается 150, то я даже и не связываюсь с этим

Все тот же вопрос, на который я пока не получил ответа: КАК Вы определяете, что 150, а не допустим 200 или 300? Хотелось бы это делать  без применения "тяжелой артиллерии".
Кстати, к разговору о том, в каком разрешении разбирать на тифы пдф: уже упомянутая мной программа Ap PDF to TIFF вообще не знает разрешение 600dpi, у нее максимальное - 500, к чему бы это? М.б. 300 действительно достаточно для получения качественных тифов?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 10:30 23-10-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
КАК Вы определяете, что 150, а не допустим 200 или 300? Хотелось бы это делать  без применения "тяжелой артиллерии".

Вы случайно не в танке сидите?
Из моего ответа по-моему ясно, что простого способа определить dpi в общем случае не существует. Причина этого тоже ясна - акробату он не нужен, поэтому его он никак не хранит. Даже если добавлять какой-то tif в pdf, то он укоротит его заголовок, выкинув тэг, отвечающий за dpi (и еще кое-какие, которые он явно прописывает в pdf, например фотометрический тэг).

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 11:12 23-10-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Текст становится основным сканом, а картинки SK располагает поверху как независимые зоны так же, как они располагались в pdf

Постойте, о чём это речь? СК же может только надёргать картинки из векторного PDF - а причём тут текст, содержащийся в векторном PDF? Текст могут "извлечь" только декодировщики 2 типа - которые "рисуют" PDF и потом рисунок сохраняют в тиф.
 
Для примера можно взять http://www.djvu-soft.narod.ru/kromsator/sk_help1.rar

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:21 23-10-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Мне приходится в 120dpi перегонять для читалки - и то перемычки тонких шрифтов не пропадают...

Научите, как ужирнять.
Я кстати на днях взял себе V3. Местами разочарован. Теперь можно браться за Ваше старое предложение по вертикальному расщеплению тифов, есть на чем проверить. Оно еще в силе?
 
Добавлено:

Цитата:
Постойте, о чём это речь?

Под текстом понимается не векторный объект, а ч/б слой scan-pdf-страницы (как Вы поняли, pdf поддерживает слоистость)

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 11:26 23-10-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Вы случайно не в танке сидите?

У меня танк сломался
Из Вашей информации я это примерно понял, но в сообщении VadimirTT было написано то, что я процитировал, вот я и хотел узнать, КАК ОН ЭТО ДЕЛАЕТ?
 
А к Вам у меня будет один вопрос и одно предложение, поскольку Вы вроде бы не перестали дорабатывать свою программу (я это предположил в связи с тем фактом, что не появляется обещанная Вами версия выше 5.91)
 
Вопрос (возможно, его уже задавали ранее): в Draft kromsite не ставлю галочку в окошке "Ignore blank half-page", а он их все равно "Ignore".
 
Предложение: нельзя ли сделать вроде окна запомненных фрагментов, в котором можно было бы накапливать разные фрагменты, повторящиеся многократно. Это было бы полезно, т.к. довольно часто не удается получить качественную обработку всех шахматных диаграмм и приходится некоторые из них составлять из фрагментов более удавшихся.
В идеале не помешало бы запоминать порядка 25-30 фрагментов.
 
И только что возникший вопрос: нельзя ли удалить зоны сразу на всех сканах. Вроде бы после выборки в меню "Zones" в списке есть пункт "Delete all zones", но как выяснилось, он распространяется только на текущий файл.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 11:47 23-10-2008 | Исправлено: shch_vg, 12:05 23-10-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Научите, как ужирнять.

Кстати, это интересный момент затронулся. Что Вы думаете об алгоритмах erode/dilate? Подходят ли они для сканобработки? Есть ещё и thinning - thickening. Вот тут есть демка и исходники: http://www.codeproject.com/KB/GDI-plus/Image_Processing_Lab.aspx

Цитата:
Mathematical morphology filters (erosion, dilatation, opening, closing, hit & miss, thinning, thickening);

 
Добавлено:

Цитата:
Я кстати на днях взял себе V3.

ИМХО надо ждать не менее 10-дюймовых (а ещё лучше - 12). То, что сейчас (6") - это баловство.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:09 23-10-2008
Kukumber2121



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте, подскажите, пожалуйста, какрешить такую задачу: есть pdf файл в нем на страницу вставлено два рисунка, нужно чтоб эти два рисунка были в двух разных файлах. Кромсатор выделяит два эти рисунка, пространство между ними, обозначает красным цветом. При нажатии Zones-> Picture zone-> Process marked zone for file-> All выскакивает вот такое сообщение: "Command unavailable  for current PageType option value (=Auto)", где меняется это PageType. Заранее благодарен.

Всего записей: 207 | Зарегистр. 31-12-2005 | Отправлено: 09:31 25-10-2008
chesskom



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega,
create stable version ScanKromsator 2008 v6.0 (or ScanKromsator 2009 v6.0)

Всего записей: 1083 | Зарегистр. 02-07-2005 | Отправлено: 14:21 29-10-2008 | Исправлено: chesskom, 14:40 29-10-2008
juvaforza

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
да, избаловали заграницу

Всего записей: 2895 | Зарегистр. 26-11-2005 | Отправлено: 18:37 29-10-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
При импорте пдф Кромсатор сказал, что страница возможно имеет "лоскутную" структуру, и предложил объединить фрагменты. Я согласился, после чего Кромсатор разобрал пдф на страницы, большинство из которых содержат пикчер-зоны с заголовком в свойствах "External picture zone". При попытке сделать merge Кромсатор говорит "Nothing to merge" и ничего не делает.
Если я выставляю свойства этой зоны как и основной (Ч/Б), то получаю в основной области и зоне примерно идентичный результат. НО... Как в основной, так и в зоне есть фрагменты, которые нужно обрабатывать через серые пикчер-зоны. Удается создать эти зоны для обоих вариантов, но после обработки серая зона в основной области обрабатывается как надо, а серая зона в external-зоне все равно как черно-белая. При выходе из result view серая зона в external-зоне пропадает.
Можно ли как-то обработать такую книгу?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 16:29 30-10-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Это какая-то книга, из тех, что проходила в топике по шахматам? Если да, скажите ее название, я сам посмотрю, что происходит

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 17:34 30-10-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Нет, это компьютерная книга - Секреты хакеров. Безопасность Windows Server 2003 - готовые решения - Скембрей, Мак-Клар,2004. В пдф она весит 91 мб. Могу сделать задание из нескольких страниц после импорта книги.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 18:26 30-10-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Последняя версия кромсатора позволяет легко раскрашивать текст (любым однотонным цветом) или фон текста (однотонным или градиентным цветом), или и то, и другое вместе. Т.е. сохранять полное цветное оформление текста. Более того, если Вы делаете pdf, то кромсатор позволит создать его с небольшим объемом, т.к. текст он поместит в pdf ч/белым, а для раскраски текста и фона будет использовать фичи pdf-формата. Это на порядок экономичнее, чем помещать в pdf цветной скан. Плюс отсутствуют артефакты, присущие цветному сжатию.
Не могли бы Вы объяснить чуть подробнее о раскрашивании текста.  
Я понимаю, что вначале  нужно выбрать цвет (Select clean colour), затем можно выделить символ (Ctrl-Shift-Click), после чего выбрать Clean из контекстного меню. А как выделить все символы в выбранной области?
Пример страницы, на которой хочу сохранить цвета:
http://rapidshare.com/files/159749277/Image_0001.rar.html
Может быть, я ошибаюсь, но, вроде, Вы рассказывали о некоей своей методике работы с цветными символами.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 00:20 02-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
текст он поместит в pdf ч/белым, а для раскраски текста и фона будет использовать фичи pdf-формата.

Я сделал утилитку, которая делает нечто аналогичное с DjVu (сегментацию как в VPD). Я предлагаю назвать это "плакатный МРС" (ПМРС) (а обычный МРС - "Фото-МРС") (ФМРС).
Теперь ИМХО есть смысл вместо Picture-зон сделать 2 новых вида зон: Photo-зона и Poster-зона.
 
Photo-зоны (ФМРС) - опции: Blur, удаление растра, и bitdepth.
Poster-зоны (ПМРС) - опции: постеризация (раскраска моно-цветами, заливка моно-фоном и т.п.). На выходе готовую Poster-зону можно оформлять также, как и сейчас оформляется субскан заднего фона - на белом листе небольшая картинка (в нужном месте белого листа), с именем "0001.pst.tif", допустим. Или ещё лучше - ini-файл с координатами Poster-зон на белом листе.
 
А тогда уже кодировщик будет сам обрабатывать нужным образом как Photo-зоны, так и Poster-зоны. Причём на одном скане могут допускаться оба вида этих зон.
 
Как идея?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 08:48 02-11-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Как идея?
Вы безбожно опоздали . Все это можно делать в СК и с помощью макросов Корела. Могу выложить книгу, где есть растровые картинки и цветной текст. Кодировалась она за один проход с помощью только msepdjvu, т.е. размер словаря = числу стр. в книге.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 09:38 02-11-2008
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 

Цитата:
Arcand
 
Вы безбожно опоздали .  

 
Разберитесь в help'e к моему пакету, а? Там всё это есть, и даже выложено на Вашем сайте Вами же лично.
 
 
Добавлено:
ghosty
 
Почитайте help к моему пакету, там это есть: http://www.djvu-soft.narod.ru/kromsator/cla_melirius.htm .

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 13:27 02-11-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
Спасибо! Ваши мануалы - просто кладезь знаний

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 19:49 02-11-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru