Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
ukpyr



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а как (чем) можно максимально автоматизировать преобразование и разбивку по статьям/темам сканов (pdf/djvu) журналов (текст плюс серые/цветные картинки) в html + картинки ?

Всего записей: 35 | Зарегистр. 13-01-2009 | Отправлено: 21:43 13-01-2009 | Исправлено: ukpyr, 21:45 13-01-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ukpyr
Во-первых, абсолютно не ясно, зачем это может быть нужно, во-вторых, с такими вопросами лучше сюда, наверное:
http://forum.ru-board.com/topic.cgi?forum=93&topic=1624&glp#lt
 
AOT: все-таки самое неудобное в последней версии - это некорректная работа Deskew. Придется, видимо, откатиться на 5.91.

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 21:49 13-01-2009
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1. При импорте DjVu указывал разные виды сжатия (и не сжатый) для выходного tiff. А на выходе всё равно получаю G4Fax. Это баг? Если нет, то как исправить?
2. При импорте PDF был случай, когда вместо страниц импортировались только картинки с этих страниц!!! Вот только сейчас стал подозревать, что этот PDF был сборкой текста и картинок... И всё же это баг импорта.
bolega
3. Опечатка: File - Profiles... Вкладка Options - Вместо "Smart contour" написано "Save contour".

Всего записей: 597 | Зарегистр. 28-07-2005 | Отправлено: 00:25 14-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
ОК, deskew откачу как было раньше.
 
denver 22

Цитата:
При импорте DjVu указывал разные виды сжатия (и не сжатый) для выходного tiff. А на выходе всё равно получаю G4Fax. Это баг? Если нет, то как исправить?  

Посмотрю. Но насколько я знаю, LZW в принципе не предназначен для b/w-сканов, только для серых/цветных. Это как jpg в принципе не может сжимать b/w, а если какая-то прога сжимает, значит, идет автоматическая конвертация в оттенки серого.
 

Цитата:
При импорте PDF был случай, когда вместо страниц импортировались только картинки с этих страниц!!! Вот только сейчас стал подозревать, что этот PDF был сборкой текста и картинок... И всё же это баг импорта.

Это не баг. Я намеренно не импортирую векторные pdf. Это из области растеризации TTF и PS-шрифтов, а это уже другая песня. Причем эта операция на порядок лучше и быстрее делается самим акробатом, поэтому я не стал это делать. Прог для растеризации PDF хватает. Почему я ввел импорт pdf? Потому что ни одна прога не сможет импортировать сложные страницы в виде зон. Растеризовать всю страницу как единое целое - пожалуйста. Разбить страницу на несколько файлов - пожалуйста. А совместить их как зоны - только в SK.

Всего записей: 4012 | Зарегистр. 09-09-2002 | Отправлено: 08:46 14-01-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По поводу "нового" deskew.
Мои наблюдения.
Раньше, если на странице был и рисунок и текст я не думая выставлял Art deskew.
Поворот шел дольше, но практически без ошибок.
Попробовал такой же подход в 5.92.
Теперь при установленном Art, текст полностью игнорируется и выравнивание идет по элементам рисунка.
Убираю Art - работает вроде корректно.

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 09:40 14-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Torino
Art режим не претерпел никакого изменения. То, что Вы в конкретном случае столкнулись с этим, говорит о том, что рисунок внес максимальный вклад в наклон (при art используется Hough transform и выбирается точка максимума).
Если рисунок таков, что его внешняя оболочка близка к выпуклому прямо- или многоугольнику, то тогда при простом deskew он не оказывает никакого влияния на искомый угод наклона, и определяющий вклад остается за текстом. При Art, наоборот, форма оболочки не имеет никакого значения, зато имеет значение наличие и количество составляющих его прямых линий (а точнее, "ориентация полигона" как говорят в геометрии, которую можно определить высчитав собственные векторы фигуры).
Была мысль перед определением skew избавляться от крупных элементов типа рисунков и таблиц, но бывают случаи, когда текста мало, а имеющиеся рисунки и линии таблицы, наоборот, служат хорошим (и единственным) ориентиром для определения угла наклона.
Так что тут как говорится палка о двух концах.

Всего записей: 4012 | Зарегистр. 09-09-2002 | Отправлено: 09:58 14-01-2009 | Исправлено: bolega, 10:01 14-01-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может есть смысл добавить новый инструмент "Указать приоритетную зону для определения угла поворота" ?
При запуске которого, на странице можно щелкнуть внутри текста, таблицы, рисунка и Кромсатор будет определять угол поворота по данным, лежащим в окрестностях щелкнутой точки?

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 10:29 14-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Torino

Цитата:
Может есть смысл добавить новый инструмент "Указать приоритетную зону для определения угла поворота" ?  

Нет, имеет смысл заключить рисунок в exclude-зону. При определении угла в SK содержимое таких зон не учитывается.

Всего записей: 4012 | Зарегистр. 09-09-2002 | Отправлено: 10:37 14-01-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Понятно, спасибо.

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 10:43 14-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Даже файнридерный deskew в редчайших случаях ошибается.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:10 15-01-2009
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В книгах, изданных в 60-80х гг. довольно часто встречается, что рисунок стоит криво относиельно текста. В этом случае я его поворачиваю при постобработке - в Кромсаторе есть очень удобный инструмент

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 10:21 15-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Небольшой момент:
 
Я заметил, что в СК реализован механизм т.н. "масштабирование в курсор". То есть при вращении колёсика мыши та точка, которая стоит под курсором, остаётся неподвижной - а вокруг неё всё "сдвигается" в стороны (в процессе масштабирования).
 
Я не припоминаю, чтобы об этой детали где-нибудь когда-нибудь упоминалось.  
 
Вероятно, это некий типичный приём для просмотрщиков графики.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:56 18-01-2009
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Это и в Photoshop реализовано (сейчас CS10 юзаю). Про AutoCAD я вообще молчу...

Всего записей: 597 | Зарегистр. 28-07-2005 | Отправлено: 20:22 18-01-2009
djdtyfhu



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SK 5.9 beta
Вроде баг вылазит:
 
Если выделить в Result View область, потом ее вырезать (Ctrl+X), вставить (Ctrl+V) и передвинуть на новое место, а затем кликнуть мышкой в другое место, чтобы снять выделение, то справа от ранее выделенной области остается мусор в виде пунктирных черточек.
 
P.S. Область выделял по белому фону, т.е. никак мусор не мог захватить.  
 
P.P.S. Перегонял книгу 300dpi gray -> 600dpi BW

Всего записей: 422 | Зарегистр. 28-12-2004 | Отправлено: 18:14 19-01-2009
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
djdtyfhu
 
Вы не указали, была ли копируемая область Picture зоной и делали вы совмещение Picture зоны и общего фона (Zoes -> Picture zones -> Merge..)?
 
 
Добавлено:
А у меня вот какой вопрос, скажи мне пожалуйста, как лучше сканировать 300 dpi или 600dpi? Просто для нового сканера разница не значительная, а с точки зрения Кромсатора - что лучше? могу попробовать, но все-же совет хочу. Кажется, что ворочить 600dpi серого, а уж подавно цветного растра тяжеловато. Или сканить в 600 Ч.Б.?
 
Добавлено:
P.S.
Вопрос конечно же ко всем, описался!

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 17:53 20-01-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gazoved
что за сканер?

Цитата:
Кажется, что ворочить 600dpi серого, а уж подавно цветного растра тяжеловато.

при обработке 300 в 600 кромсатор и так его ворочает, мне кажется, если скорость сканирования в данном случае некритична, и уж тем более если есть мелкий текст и символы, то от скакнирования в 600 хуже не будет.

Всего записей: 2375 | Зарегистр. 22-03-2005 | Отправлено: 20:08 20-01-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gazoved
 
Если скан изначально в 600 dpi, то исключается операция ресемплинга.
Т.е. обработка должна быть быстрее.
А вот при просмотре исходников, загрузка сканов медленее будет.
Я сам в 600 gray сканирую на промышленном сканере.

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 20:11 20-01-2009
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Купил - Plustek OpticPro A360
Кромсатор ворочает 600 ч.б., а не серый, по крайней мере мне так кажется.
Плохо то, что исходники будут место отжирать, сейчас уже несколько сотен гигабайт (приближается к Тб) сожрали (более 200 книг ).

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 20:12 20-01-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
При клике средней кнопкой мыши в СК маркируется файл.
Логично, что при повторном клике галочка будет сниматься.
Но этого не происходит. Может стоит это изменить?
 
Есть предложение: добавить в СК возможность сохранения маркировки файлов для последующего восстановления (как в Тотал Коммандере - Save selection).

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 20:16 20-01-2009
djdtyfhu



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gazoved
 
Нет копируемая область не является picture зоной - простой прямоугольник с текстом. Правда это всегда была таблица со сплошной внешней границей, может это как-то влияет.

Всего записей: 422 | Зарегистр. 28-12-2004 | Отправлено: 04:25 21-01-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru