Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор

Модерирует : gyra, Maz

Widok (17-08-2007 15:16): лимит страниц. продолжаем здесь  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101

   

ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Старые версии:
 
5.52beta (1,81 МБ) + dll-ки, необходимые для работы программы (405 КБ)
 
Full-версии - вкл. dll-библиотеки и Help к SK v1.0 в формате Pdf:
 
v3.5 (1,52 МБ)  v5.07 (1,98 МБ)  v5.51b (2,06 МБ)  v5.52b (2,05 МБ)  
 
Текущая версия:
 
ScanKromsator v5.6А Full (вкл. dll-библиотеки и Help к SK v1.0 в формате Pdf). (2,25 МБ) What's new  Зеркало
 
Хелп v1.0 для Кромсатора:
 
1. В формате PDF:
http://rapidshare.de/files/1815394/ScanKromsator.pdf.html (размещен временно):
 
2. В форматах HTM и DOC:
http://www.djvu-soft.narod.ru/sk_doc_htm_help_v1_0.rar  (537 КБ)
 
Вопросы и ответы по работе со СканКромсатором последних версий:
http://abab.front.ru/QandA_SK.zip (80 КБ, от 20.06.06)
 
Пособие по Кромсатору: http://www.djvu-soft.narod.ru/kromsator/
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности.
 
ScanAndShare - инструкция в картинках, в том числе и начальные установки SK
1.03 или 1.06

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 12:53 17-05-2005 | Исправлено: vitaly1, 16:02 10-01-2007
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо! Теперь чистится прекрасно.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 15:35 26-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand
Вас спасибо за найденный баг!

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 15:38 26-08-2005
sizop



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Я уже задавал такой вопрос, только видимо не в том топе, в котором надо.
Вопрос в следующем, при сканировании картинок (например я сканировал карту из атласа) кромсатор не может выравнивать страницу? Галочки Art и Ortho выставлял.

Всего записей: 1008 | Зарегистр. 02-08-2004 | Отправлено: 19:22 26-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sizop
И не сможет. И вряд ли какая программа сможет на полном автомате.
Дело в том, что в любом из существующих методов определения перекоса сканов, на изображении ищется доминирующее направление элементов (в данном случае строк текста). На карте таких доминирующих элементов не может быть в принципе. Там ведь одни черт-те как направленные линии (реки, дороги, границы берегов и областей и т.д.), и даже если и есть текст, то он тоже располагается часто под разными углами. Имеются методы, которые позволяют вычленять из цветных изображений только текст, Но и в этом случае для определения наклона нужно, чтобы этот текст был всегда вертикальным или горизонтальным (на оригинале). Если на Ваших картах так и есть, и цвет текста отличается от всего остального, то я мог бы быстро что-нибудь сварганить.
Другой быстрый метод - ручное указание на изображении области (например, прямоугольным выделением), где есть только текст, и тогда можно тоже быстро определить его наклон автоматом.
 
 
 
 

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 20:07 26-08-2005
sizop



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
А по пунктам можно? Как указать

Цитата:
 ручное указание на изображении области (например, прямоугольным выделением), где есть только текст

и что делать дальше. Спасибо.

Всего записей: 1008 | Зарегистр. 02-08-2004 | Отправлено: 14:23 27-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sizop
По Вашему вопросу. В постобработке выделяете мышкой прямоугольную область делаете правый клик и берете в меню Rotate selection. Что там делать в общем ясно или можно разобраться методом проб.
 
bolega
Все присматриваюсь к закладке Quality. Хотелось бы разобраться в ее функциональности применительно к исходным серым сканам (на выходе B/W). Исходные B/W сканы меня не очень интересуют - кардинальное улучшение этих сканов ИМХО вряд ли возможно.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 08:45 28-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
По Вашему вопросу. В постобработке выделяете мышкой прямоугольную область

Нет, это не то. Это нужно бы делать в предобработке, т.е. чтобы таким способом заносить фиксированные углы в поля Fixed deskew angle (Pages->кнопка special)  
sizop Но этого пока еще нет. Думаю, что такая фича не помешала бы.
Сейчас же могу вот что предложить, при условии, что на сканах карт присутствуют горизонтальные линии (в оригинале горизонтальные конечно). Например, прямоугольная рамка, ограничивающую карту. Если так, то можно включить режим измерения углов (меню Ruler), щелкнуть на первой точке этой линии и не отпуская кнопку мышки, подвести ее курсор к другой точке этой же линии. За мышкой будет следовать "резиновая" линия, рядом с которой будет выводиться угол наклона линии. Если затем отпустить кнопку мыши и при этом держать нажатым Ctrl, то измеренный угол занесется в поле Fixed deskew angle. На этот жестко заданный угол кромсатор и будет поворачивать скан при обработке. При повороте grey и цветных сканов рекомендую на закладке Options задать Deskew method=interpolate.
Arcand

Цитата:
Хотелось бы разобраться в ее функциональности

Да там собственно ничего такого умного и нет. Стандартный простенький набор фич. Разве что только возможность убирать фон с серых сканов, особенно тени в развороте (некоторые называют это выравниванием освещенности, наверно так точнее). Улучшение качества не-B/W сканов может быть настолько разнообразным и богатым, что я даже и не стал с этим связываться. Это прекрасно делают специализированные программы (фотошоп, растерид и т.д.). Кроме того, не думаю, что это будет подходить к пакетной обработке.

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 12:40 28-08-2005
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
За выходные попробовал покромсать целую книгу Кромсатором, у меня возникли такие пожелания к Кромсатору:
 
1. Перезалить "dlls-rename-to-zip.jpg" как "dlls.zip".
 
2. Убрать функцию "Clear shadow" и ей аналогичные - она только портит сканы, а то, что она призвана делать, делается руками ничуть не медленнее.
 
3. Уменьшить шаг изменения пикселей повсюду в Кромсаторе с 8-10 пикселей до 1 - 8-10 пикселей - это слишком грубо.
 
4. Сделать назначение полей сверху и снизу раздельно - чтобы можно было назначить сверху одно поле, снизу другое.
 
5. Сделать автозапоминание в файл позиций резаков.
 
По редактору постообработки:
 
1. Сделать перемещение обрезанной картинки ("Shift image") 4 стрелками клавиатуры.
 
2. Увеличить точность вставки из буфера (прыгает на 1-2 пикселя вверх при вставке).
 
3. Выделить редактор постообработки в отдельную программу, или добавить туда возможность самостоятельного запуска его и загрузки туда совершенно сторонних tif'ов - для обработки через "Auto Save" и "Auto Clear" (блестящая вещь ).  
 
4. Сделать более простое переключение с редактора постообработки в главное окно и наоборот.
 
Добавлено:
bolega
А вообще общее впечатление по Кромсатору такое: всё-таки не дотягивает он до желаемого уровня. Я решил всё-таки не использовать Кромсатор для КРОМСАНИЯ. Т.е. буду его использовать для всего остального (тут он хорош), а вот качество и уровень кромсания меня не устраивает - точность не та. Не идёт ни в какое сравнение с ручной нарезкой сканов - там я прекрасно вижу, что у меня получается, делаю именно то, что мне хочется. Кромсатор даёт лишь некоторое приближение к такому уровню, которое лично меня, увы, не удовлетворяет. Поэтому буду "кромсать" руками впредь.
 
Я думаю, bolega, что эта задача (кромсание) слишком сложна для решения её одним человеком - тут нужен целый коллектив квалифицированных специалистов. Это напоминает попытку создать в одиночку ABBYY FineReader - это просто не в физических силах одного человека, или же займёт десятилетия. А ведь для кромсания нужны именно такие (как в ABBYY FineReader) технологии. Да и вообще - в такой программе НЕ должно быть никаких резаков вообще - она должна уметь РАСПОЗНАВАТЬ мусор, а не я ей должен указывать, где мусор, а где голый текст. Но даже и сейчас - Ваш Кромсатор неудовлетворительно определяет точное положение контура голого текста - иначе почему приходится в постообработке то и дело двигать текст по картинке влево-вправо (вверх-вниз) на 8-16 пикселей? Если бы контур голого текста находился бы верно, то вот так двигать текст не надо было бы.
 
А вот эта проблема - нераспознавание мелких деталей (номеров страниц и т.п.), отстоящих на расстоянии от основного текста - это очень серьёзная проблема, она практически сводит на нет смысл существования Кромсатора (в плане кромсания).
 
Я думаю, что для кромсания следует использовать технологии ABBYY FineReader'а - распознавание образов, нейросети, генетические алгоритмы, библиотеки распознаваемых образов и т.п. - к сожалению, я в этом совершенно не разбираюсь, но всё равно мне ясно, что именно на таких технологиях и надо строить хороший Кромсатор.
 
И ещё я бы на Вашем месте не распылялся - к чёрту воплощение despeckle, deskew и т.п. - это и другие программы умеют делать, Вы бы лучше били только в одну точку - кромсание, и не отвлекались на всё малосущественное.
 
Так что у меня совершенно пропало желание написать какую-то доку по Кромсатору - толку с этого, если я решил им не пользоваться да и другим буду не советовать. Не стану же я на своём сайте вводить своих посетителей в заблуждение - нет, я предлагаю людям лишь то, в чём я полностью уверен. А хелп надо писать лично Вам, как автору, и странно, что Вы до сих пор это не сделали - тут работы на 3-4 вечера всего лишь.
 
Добавлено:
Кромсатор, по-моему, следует использовать для despeckle, deskew, для финальной чистки сканов через "Auto Save" и "Auto Clear", для отрезания паразитной полосы сбоку от 1 страницы на 1 скане (вот FR7 с нею не может сделать deskew, воспринимая её как основной текст и делая deskew, ориентируясь на неё ). А само "кромсание", на мой взгляд, лучше делать вручную - так точнее и ощутимо качественнее, пусть и дольше. Главное, что получается в итоге вещь, а не какая-то сомнительная поделка.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:14 29-08-2005 | Исправлено: monday2000, 09:38 29-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По 3 и 4 пунктам обеими руками ЗА . Автономный редактор был бы полезен для предобработки сканов.
Цитата:
Убрать функцию "Clear shadow"  
Здесь Вы, monday2000, промахнулись! В случае B/W сканов от этой функции толку действительно не много (здесь ее, как я понял, bolega рекомендует отключать). А вот в случае серых сканов песня совсем другая. Когда я сканировал в B/W я мучился со сгибами - пересканировал, чтобы чернота не налезала на текст. При сером сканировании с функцией "Clear shadow" эта проблема снимается - нет необходимости тщательно прижимать сгиб книги к стеклу сканера. Мой совет (для Вас запоздалый ), сканируйте в Gray!
bolega

Цитата:
возможность убирать фон с серых сканов
Как это делать?

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 10:35 29-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Я понял Ваше мнение.
 

Цитата:
она должна уметь РАСПОЗНАВАТЬ мусор, а не я ей должен указывать, где мусор, а где голый текст

Идеальная программа -  да. Но ABBY тоже не умеет распознавать мусор - он распознает ТЕКСТ, точнее, относит его к нетекстовым элементам. Для него мусор - это все, что НЕ текст. В этом большая разница.  

Цитата:
иначе почему приходится в постообработке то и дело двигать текст по картинке влево-вправо (вверх-вниз) на 8-16 пикселей

Хе-хе. Определяет то он неплохо. А вот располагает потом на странице именно с такой точностью. Абсолютно не вижу никакого смысла в пиксельной точности.  

Цитата:
Увеличить точность вставки из буфера (прыгает на 1-2 пикселя вверх при вставке).  

Хе-хе. Уберите фильтр. И будет вам точность. То, что вы видите на экране -  облагороженное фильтром изображение, обработанное фильтром с окном 1-3 пикселя.
Кроме того, погоня за пиксельной точностью абсолютна бессмысленна на мониторах с размерами 640 - 1200 пикселей. Сами посчитайте, сколько точек изображения помещается в одну точку на экране. И тогда наконец-то поймете, что указывая какую-либо точку на экране, вы на самом деле тыкаете в интервал от 1 до 10 пикселей, соответствующий реальному изображению.

Цитата:
Не стану же я на своём сайте вводить своих посетителей в заблуждение - нет, я предлагаю людям лишь то, в чём я полностью уверен.

После всех Ваших вопросов на форуме (не только по кромсатору, но и по другим программам, которые вы перечисляете на своем сайте), я понял, что все, что вы предлагаете на сайте, вы НИЧЕРТА САМИ НЕ ЗНАЕТЕ. Так что от ваших слов про заблуждение мне просто смешно стало. Ответы на многие ваши вопросы содержатся аж в 1-й доке к кромсатору. Из чего я заключаю, что вы даже ее не читали. А еще требуете новую.
Если Вы сделаете антирекламу (именно антирекламу, а не просто игнорирование)кромсатора на своем сайте (а Ваш сайт всегда и везде упоминается в связи djvu), я буду вынужден навсегда прекратить его публикацию, буду развивать и использовать только для себя. Как говорится, не будет предмета разбирательства, не нужна и антиреклама будет. Какой мне смысл выкладывать программу, против которой настроены тысячи.
Ну и напоследок, почему бы вам не обратиться в Abby с предложениями, что еще должен делать FR? Будет тогда вам счастье.  
Прощайте.
 
 
Добавлено:
Arcand

Цитата:
Как это делать?  

На закладке Quality кнопка enhance.
Задать там Cleaner passes=1. Лучше убрать галку с Protect black pixels.
Если на скане есть иллюстрации, залитые серым или градиентным цветом, то их нужно заключить в exclude-зону, чтобы не повредить. Если тень наползает на текст и очень темна (текст на фоне ее плохо различим), то можно включить галку на Correct low contrast и поиграться значением Sensitivity (5 - 30). Результат можно наблюдать если нажимать на закладке Quality кнопку Preview или Preview with resample (в последнем случае будет выполнено изменение dpi, если задано. В первом же случае оно будет игнорироваться). Если там же взвести Don't change out color, то при preview не будет проводиться и изменение цветности (т.е. grey->bw не будет). Это влияет только на preview.
 
 
 
Добавлено:
monday2000
Еще одно интересное наблюдение.
Я перечитал сотни статей по image-processing и document-layout из зарубежных журналов. И во всех статьях есть одно общее - все они заканчиваются выводом, насколько после обработки алгоритмом автора статьи улучшается качество последующего OCR. Никто не ставил своей задачей обработку сканов ради сканов. Именно поэтому на рынке существует практически только одна программа, которая улучшает сканы и оставляет их сканами. Я имею ввиду BookRestorer за 6000 евро.
А вы мне про пиксельную точность талдычете, т.е. про точность, соизмеримую с самой точностью сканера.  

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 10:41 29-08-2005 | Исправлено: bolega, 11:45 29-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
всё-таки не дотягивает он до желаемого уровня
Господи (устало)... И это после всех усилий, чтобы ознакомить Вас с азами работы СканКромсатора. Он, к Вашему сведению, экономит уйму времени при кромсании книги и делает это качественно!
Цитата:
в такой программе НЕ должно быть никаких резаков вообще
Невероятное заблуждение. В других прогах я НИЧЕГО не могу сделать, чтобы помочь ей правильно покромсать. В Кромсаторе с помощью резаков, которые после чернового кромсания уже в целом стоят как надо, я помогаю ему на сложных сканах и это отнимает совсем немного времени.
Ну и так далее по всем "замечаниям".
Цитата:
И ещё я бы на Вашем месте не распылялся
Эта и другие "рекомендации" выходят за рамки элементарной деликатности и вежливости. Не Вам и не мне давать Автору указания что и как делать!

Цитата:
Поэтому буду "кромсать" руками впредь.
Удачи...

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 14:28 29-08-2005
dimaniac

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мдя понедельник день тяжелый .  
monday2000

Цитата:
А вот эта проблема - нераспознавание мелких деталей (номеров страниц и т.п.), отстоящих на расстоянии от основного текста - это очень серьёзная проблема, она практически сводит на нет смысл существования Кромсатора (в плане кромсания).

Меня тоже напрягает эта проблема. ИМХО после интерфейса эта самая главная проблема кромсатора. Хотя ее можно уменьшить с помощью text sensivity но только при условии что скан чистый.

Цитата:
А само "кромсание", на мой взгляд, лучше делать вручную - так точнее и ощутимо качественнее, пусть и дольше. Главное, что получается в итоге вещь, а не какая-то сомнительная поделка.

По-моему вы слишком придирчивы к качеству книг. Я довольно ленивый человек и скорость для меня все таки важнее.
Кстати стоит добавить что так как ваш сайт посещают много людей в т.ч. и новичков то вам стоит гораздо ответсвеннее относится к его содержанию. В принципе если вам все еще нужно я могу написать краткую инструкцию по скриншотам кромсатора ближе к выходным т.к. сейчас времени нет. Правда опыта обработки серых/цветных сканов у меня мало по ним лучше спрашивать тех у кого больше опыта.
bolega
Вот видите к чему привело отсутствие доки. И народ отпугивайте от кромсатора и себе настроение портите. Не так уж долго ее делать.

Цитата:
Если Вы сделаете антирекламу (именно антирекламу, а не просто игнорирование)кромсатора на своем сайте (а Ваш сайт всегда и везде упоминается в связи djvu), я буду вынужден навсегда прекратить его публикацию, буду развивать и использовать только для себя.

Нас не напугать особенно учитывая что и пятая версия уже обладает вполе приличными возможностями
Один вопрос не в тему. Я обычно сканирую в чб и не понимал почему многие сканируют в сером  

Цитата:
А вот в случае серых сканов песня совсем другая. Когда я сканировал в B/W я мучился со сгибами - пересканировал, чтобы чернота не налезала на текст. При сером сканировании с функцией "Clear shadow" эта проблема снимается - нет необходимости тщательно прижимать сгиб книги к стеклу сканера. Мой совет (для Вас запоздалый  ), сканируйте в Gray!

Теперь вроде понял. А какие еще есть доводы в пользу сканирования в сером?

Всего записей: 99 | Зарегистр. 06-06-2005 | Отправлено: 16:17 29-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dimaniac

Цитата:
Меня тоже напрягает эта проблема.  

И меня честно говоря тоже. Но сами посудите, чтобы понять, является ли какая-то закорючка, например, цифрой "1" от номера страницы или это кусок крошки, попавший на сканер, нужно выполнить очень сложный анализ (например, ОСR или другой). При этом время кромсания увеличится как минимум вдвое. Если учесть, что количество таких страниц составляет не больше 5%, готовы ли вы тратить кучу времени на улучшение таких блох? Или лучше потратить лишние 2 минуты, чтобы снять галки automargins у таких страниц? Я выбрал в кромсаторе второе. И не из-за прихоти, а из твердых убеждений считаю, что так будет правильнее. Если же кто-то требует от кромсатора 100% точности распознавания, значит, этот человек ничего не понимает.  
(Я вот думаю, а что пишут Яну в Abby, если FR не распознает одно-два слова на странице. Неужели, тоже бросаются отсоветовать всем пользоваться им? )
А насчет пугаю-не пугаю -  я имел ввиду, что новые версии не будут выкладываться на сайте, а будут поступать только в закрытые колхозные обменники).
 
 
 
 
 
 
Добавлено:
И насчет интерфейса.
Каков бы он не был, но я не попугай, чтобы копировать чей-то чужой интерфейс.
Мне например, очень непривычен интерфейс BookRestorer, но у и что теперь?

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 16:49 29-08-2005 | Исправлено: bolega, 17:35 29-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dimaniac

Цитата:
Меня тоже напрягает эта проблема.
Еще недавно при ее решении пользовался громоздким приемом. Хотя мог бы сообразить как сделать быстрее. Спасибо, подсказали. На всякий случай подробнее: подгоняете нужный резак впритирку к краю текста, снимаете соответствующую галку в Automargins на закладке Pages и кромсаете проблемную страницу.
Цитата:
А какие еще есть доводы в пользу сканирования в сером?  
В двух словах не скажешь . ИМХО можно улучшить качество сканов с помощью обработки Контурная резкость в РастерИД. Если сканировать в B/W или, что тоже самое, делать без предварительной обработки преобразование серых сканов в B/W, то из-за недостаточной резкости некоторых букв они портятся (появляются паразитные перемычки или заливки, или другая крайность - рваные буквы). Первые пробы с РастерИД обнадеживают. Есть и еще кое-какие соображения.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 17:25 29-08-2005
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Вы делаете очень нужное и  полезное дело.
Именно сейчас, когда технической литературы осталось катастрофически мало и находится она преимущественно в библиотеках, востребованность программы, позволяющей получить качественно подготовленную книгу практически после сканирования, без дополнительных затрат времени, очень велика.
Вчера почти весь день потратил на изучение программы, есть куча предложений, но с ними подожду, пока не сделаю хотя бы пару книг - тут необходим практический опыт.
С черно-белыми сканами я вроде разобрался, результат обработки мне очень нравится, а вот с серыми проблема - у меня никак не получается приблизиться к результату, получаемому в FineReader v7 при преобразовании серого изображения в черно-белое.  Я перепробовал все возможные настройки, в Gray Enhance, но на выходе, при преобразовании серого изображения в черно-белое буквы тоньше, чем в FineReader, а некоторые вообще пропадают. Sand despeckle не помогает.
Я выложил небольшой фрагмет исходной страницы, результат ее обработки в FineReader и в ScanKromsator здесь:
http://rapidshare.de/files/4505919/sample.rar.html
Размер файла 700kb
 
Если кто-нибудь подскажет как надо обрабатывать данный фрагмент, буду ему очень благодарен.  

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 22:48 29-08-2005 | Исправлено: Alexx S, 23:01 29-08-2005
dimaniac

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
 Но сами посудите, чтобы понять, является ли какая-то закорючка, например, цифрой "1" от номера страницы или это кусок крошки, попавший на сканер, нужно выполнить очень сложный анализ (например, ОСR или другой). При этом время кромсания увеличится как минимум вдвое.

Ну дык может сделайте это скажем в 10 версии. И скорость компов подрастет. Тем более для некоторых людей скорость работы не так критична как ее качество. Я лучше комп на ночь оставлю кромсать сканы чем потом полчаса мучаться с расстановкой резаков.
И к тому же кромсатор обычно ошибается на номерах страниц а они распологаются примерно на одном и том же месте поэтому пользователь может сам задать область относительно границ текста где нужно этот номер искать.

Цитата:
 Если учесть, что количество таких страниц составляет не больше 5%, готовы ли вы тратить кучу времени на улучшение таких блох? Или лучше потратить лишние 2 минуты, чтобы снять галки automargins у таких страниц? Я выбрал в кромсаторе второе.

Ну у кого 5% а у кого 25 и не 2 минуты, а все 20, особенно у тех кто не является автором программы, не имеет доки к последней версии, не знает всех горячих клавиш и всю информацию добывает фильтруя форумы где она очень разрознена и никак не систематизирована

Цитата:
И насчет интерфейса.  
Каков бы он не был, но я не попугай, чтобы копировать чей-то чужой интерфейс.  
Мне например, очень непривычен интерфейс BookRestorer, но у и что теперь?

Помните я вам в ПМ на форуме dimaf'а писал что в идеале пользователь при работе с кромсатором не должен отрывать руки от клавиатуры. Возможно кромсатор уже довольно близок к моему идеалу но так как нормальной доки нет то работа с кромсатором временами сильно раздражает меня особенно корректирование резаков и постобработка. Вот к примеру после драфта на каждой странице надо просмотреть правильно ли расположены резаки если неправильно то нужно переместить руку с клавы на мышку убрать галочку в Automargins потом переместить резак потом обратно переместить руку на клаву. Если книга под 1000 страниц человек кромсатором пользоваться не особо умеет и у него на более чем 100 страницах резаки поставились неправильно то сами понимаете какой это геморрой. Для галочек вполне можно было добавить hotkeys(хотя возможно они уже есть) а про перемещение резаков с помощью стрелок и я вам в ПМ уже писал да и на форуме неоднократно встречал такие предложения. А насчет непревычности я например ни BookRestorer ни RasterID в глаза не видел так что когда скачаю они так же могут мне показаться поначалу непривычными. Когда я первый раз увидел кромсатор его вид меня удивил но сейчас я к нему уже привык хотя все равно не могу сказать что он удобен настолько насколько мне этого хотелось бы.

Цитата:
 ИМХО можно улучшить качество сканов с помощью обработки Контурная резкость в РастерИД.

А в Кромсаторе такое есть? А то у меня сейчас нет возможности скачать BookRestorer и RasterID.

Всего записей: 99 | Зарегистр. 06-06-2005 | Отправлено: 23:12 29-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
dimaniac
Одно могу сказать. Наличие даже полной доки снимет только малую часть вопросов - вместо ответов bolega будут ответы типа: читай доку.
Чтобы освоить эффективную работу в мало-мальски нетривиальной программе нужны: большое желание, большое внимание, большое терпение и большая настойчивость. Этого многим и не хватает. Им давай все и сразу. Вспомните свои первые шаги при работе хотя бы с Word (неужели у вас все и сразу получилось и вы сразу все про него узнали?).
Может хватит терзать Автора, а лучше переключиться на Кромсатор .
Вот, что у меня собрано по Кромсатору:
Цитата:
Ваш файл Kromsator_doc.rar (размер 62 кбайт)
доступен по адресу: webfile.ru/489362 в течение 7 дней до 06:40 06.09.2005.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 06:44 30-08-2005
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand
Обижаешь! Я прочитал большинство из того, что ты выложил + документацию в *.pdf. Кроме того, я провел почти целый день пробуя различные комбинации настроек.
Тем более, что я писал

Цитата:
Если кто-нибудь подскажет как надо обрабатывать данный фрагмент, буду ему очень благодарен.  

Попробуй, пожалуйста, обработать то, что я выложил. А то я взял книгу на неделю и не могу определиться - сканировать ее в сером или в ч/б. А время-то идет .

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 07:34 30-08-2005
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Как делать в Кромсаторе лучше знает bolega.
Особо не мудрил и сделал так (можно сделать и лучше):
1) Контурная резкость в РастерИД 3.5: все настройки по максимуму.
2) В СканКромсаторе (основное): Despeckle - Fine, Convert to b/w threshold - MiddleDark, галка на Enhance image, Gray enhance - Cleaner passes=1. Смотрите:
Цитата:
Ваш файл RID_SK.tif (размер 13 кбайт)
доступен по адресу: webfile.ru/489408 в течение 7 дней до 08:35 06.09.2005.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 08:51 30-08-2005
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Я посмотрел Ваш пример.
Разница между FR и SK есть существенная. Вы по видимому не подобрали в SK порог при преобразовании grey->bw (на закладке convert). Для данного примера я бы выставил MiddleDark. Кроме того, на закладке Quality включите Enhance image, щелкните там же на кнопке Gray enhance и задайте Cleaner passes=1. На мой взгляд, после этого результат получается лучше чем в FR. Если Вас не смущает пожирнение текста, выбирете вместо MiddleDark - Smooth. Это специальный метод конвертирования из grey в bw со сглаживанием. После preview вы можете увидеть, что при smooth все разрывы букв исчезли вообще. Но текст слегка пожирнел. Чтобы он не так жирнел можно к примеру на закладке Contrast сдвинуть 2-й ползунок (яркость) на позицию 20 вниз.  
И еще один нюанс. Если будете пользоваться кнопкой preview, надо, чтобы на изображении не было выделений, иначе результат будет неправильный. Старый баг.
 
 
Добавлено:
Arcand
Я посмотрел на Ваш вариант, с использованием РастерИд. Мне кажется, что результат со smooth получился даже глаже, но на 1 пиксель жирнее. Так что кому как больше нравится.

Всего записей: 4396 | Зарегистр. 09-09-2002 | Отправлено: 08:51 30-08-2005
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор
Widok (17-08-2007 15:16): лимит страниц. продолжаем здесь


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru