Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Насколько я понимаю, Ваш замысел был таков. Встать на оутпут, нажать Батч. Потом визуально найти отдельные ошибки и их руками поправить. В каждом случае для одной страницы вставать на оутпут и заменять ее тем самым на отредактировнный вариант.  

Ну на Output сразу встать вам не дадут, только на Page Layout, но в обшем целом все правильно.
 

Цитата:
Так вот, реальная работа получается не так.  
Если правки в случае сложной весртки на этапе page layout много  (часть стр налево, часть направо, часть вверх, часть с полями, часть без полей, так как рисунки вылезают на край страницы и т.д.), то мне после того как все поправлено на оутпуте нужно батчем  
все страницы и переделать по тем параметрам которые РУКАМИ поставлены на пейж лейоут.  
Но если на оутпуте нажать батч, то СТ снова начнет всё-всё считать в режиме авто и я получаю тот самый вариант, от которого и уходил.  

А вот этого по идее не должно происходить.  Вручную введенные параметры должны запоминатся.  Правда если вы зайдете скажем на Deskew и что-то там измените, то да, параметры всех последуюших фильтров для етой страницы (кроме возможно параметров Output'а) будут забыты.  И ето правильно - изменив скажем угол поворота, старую рамку контента наверняка придется менять.
 

Цитата:
Цитата:Например как делать Select Content, когда еще не разрезаны страницы?  
 
 
с ошибкой. Увидел ее - вернулся на разрезку страниц и разрещал.  

Тогда придется заставлять пользователей проходить каждый из этапов полностью, хотя например Deskew почти никогда не ошибается на автомате.
 

Цитата:
Кстати, если селект контент делать при черных краях вокруг скана, то 70% ошибок. Пропустить сканы через СК - 99% верно. Может на автомате делать кроп как в Букресторере (аналог draft kromsate) ?

Оно и так делается, но действительно часто бывают ошибки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:11 07-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:  
 
12. Морфологические фильтры  
 
http://www.djvu-soft.narod.ru/bookscanlib/012.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:47 07-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:  
   
13. Фильтр Unsharp Mask (на базе Gaussian Blur)
   
http://www.djvu-soft.narod.ru/bookscanlib/013.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 00:06 09-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:
 
Возможности GIMP-алгоритма Warp
 
http://www.djvu-soft.narod.ru/bookscanlib/warp.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 15:56 09-11-2008
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вот этого по идее не должно происходить.  Вручную введенные параметры должны запоминатся.  

Однако это происходит.
почему - неясно
 
а) у меня винда
б) использование кнопок apply to вместо "руками"
в) где-то в этой куче руками мог правиться поворот и м.б. поэтому слетают вообще все страницы
 
Как вариант - прикрутите кнопку батч к оутпуту такую, которая предшествующие стадии переделать не пытается, а текущие значения "пейдж лейоут" и использует.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 19:28 10-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:
 
14. Фильтр Selective Gaussian Blur
 
http://www.djvu-soft.narod.ru/bookscanlib/014.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:06 10-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В топике по СканКромсатору Melirius упомянул о книге:
 
Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.  
 
Эта книга есть в электронном виде в формате качественный векторный PDF на англ. языке. Она весит 66 МБ и там 928 страниц. Есть у Ихтика (но оттуда пока не качается). У меня она тоже есть, могу подкинуть.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 08:56 11-11-2008 | Исправлено: monday2000, 08:59 11-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.  

Это может быть полезно - выкладывайте.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:17 11-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
mean filter (не знаю как это по русски).  

Я не совсем пойму, что это такое вообще. Гугл говорит, что это простейший фильтр с весами = 1 и делителем 9:
 
   
 
А в СК 5.91 у Mean filter кроме целочисленного параметра Radius есть ещё и параметр Strengh - от 0 до 100 с шагом 5.
 
Из Corel Scan остаётся самое непонятное:

Цитата:
3) Сглаживание. Эффекты->Размытость->Сглаживание

Что это за фильтр? Это явно не Unsharp Mask - Unsharp Mask там это ИМХО вот это:

Цитата:
4) Контурная резкость. Эффекты->Повышение резкости->Понижение резкости по выделению...

 
В СК 5.91 Unsharp Mask - это по-моему Grey Enhance - Sharpen - Enhance contour.
 
Ещё на вкладке Quality в СК 5.91 есть флажок Smooth - что это за алгоритм интересно? Я нашёл в GIMP 2.6.2 (под windows) Фильтры - Улучшение - Сгладить. Как и в СК - без каких-либо параметров. Может, это и есть сглаживание из CorelScan? Но в сглаживании от CorelScan есть один параметр - процент - от 0 до 100.
 
Добавлено:
Далее по CorelScan: непонятки с медианой:

Цитата:
1) Удаление растра. В зависимости от типа растра применяется Сглаживание (Эффекты->Размытость->Сглаживание) или фильтр Медиана (Эффекты->Шумы->Медиана...)

Алгоритм медианы у меня есть тут:  
 
9. Программная реализация базового алгоритма Despeckle.
Классический Despeckle - это и есть в чистом виде Median filter. Вот только я не заметил, чтобы его применение с окошком 3х3 хоть сколько-нибудь меняло обработанный скан. Только окошко 5х5, поставленное этому фильтру, этак грубо-вульгарно размывает скан (нежелательно ИХМО).
 
Добавлено:
Что касается Lighting Correction, то тут тёмная история. В GIMP 2.6.2 (под windows) есть пункт Фильтры - Свет и тень там полно алгоритмов, которые могут осветить скан всякими хитроумными источниками света - точечный, направленный и т.д. А именно выравнивания освещённости там нет. И в Интернете пока не густо на эту тему. Запрос "Lighting correction" не выдаёт ничего интересного.
 
Кстати, в СК освещенность называется "Illumination". По-моему, это неверно: иллюминация - интенсивность свечения, непосредственно излучаемого объектом. А у нас - отражённый свет, а не собственный, т.е. Lighting.
 
Добавлено:
Классная штука - этот GIMP 2.6.2 (под windows). Почти не хуже Фотошопа. Вполне удобен и много чего умеет делать.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:40 11-11-2008 | Исправлено: monday2000, 18:07 11-11-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
это простейший фильтр с весами = 1 и делителем 9

Гугл, просто приводит один из примеров mean filter (усредняющуй фильтр, т.к. по сути считает среднее арифметическое по окресности). В общем случае апертура не обязана иметь размеры 3x3 и быть квадратной (в СК она по видимому круглая, отсюда и радиус).
Проценты в corel и Strength в SK характеризуют что-то типа альфа блендинга исходного и размытого изображения (ну или, что тоже самое, изменяют центральное значение и делитель в фильтре).

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 18:19 11-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
(в СК она по видимому круглая, отсюда и радиус).  

Да Вы что! Ну и хохма. Радиус - это всего лишь боковой размер окошка - которое может быть квадратным, ромбическим, крестообразным и т.д. Ещё радиус может быть абстракцией - неким параметром при заполнении таблицы свёртки.
 
Добавлено:

Цитата:
Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.  

 
http://rapidshare.com/files/162976286/russ.rar.html
 
Можно скачать только 10 раз - рапида оборзела.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:13 12-11-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно скачать только 10 раз - рапида оборзела

Лучше вообще не качать, так как давно доступно 5-е издание 2007 г.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 10:37 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.  

Вот ещё залил по-нормальному:
 
http://w18.easy-share.com/1702395662.html
 
Кстати, там дерево-оглавление содержит кучу ошибок - и гиперссылочное оглавление в конце тоже. Это книга явно была собрана из PDF-кусков - отсюда такие косяки. Хорошо бы поправить эти оглавления - а то сейчас ими практически невозможно пользоваться.
 
Добавлено:
bolega

Цитата:
Лучше вообще не качать, так как давно доступно 5-е издание 2007 г.

Посодействуйте, пожалуйста, переброске его сюда:
http://lib.homelinux.org/_djvu/_catalog/index_19.html
 
И прочие книги такой тематики, которые существуют, но отсутствуют на хоумлинуксе, неплохо бы суметь туда пристроить - это ведь как-то делается (не знаю как).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:49 12-11-2008 | Исправлено: monday2000, 12:14 12-11-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Посодействуйте, пожалуйста, переброске его сюда

К сожалению (или к счастью), я не имею ни малейшей возможности как-то влиять на содержимое подобных сайтов.
Любые книги по Image processing сейчас легко скачиваются с гигапедии
В частности  
_p://gigapedia.org/items/55633/the-image-processing-handbook--fifth-edition--image-processing-handbook-
-> p://рапидшара/files/160164236/ebook.The_Image_Processing_Handbook.0849372542.zip

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 12:14 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Ого, да она огромная - 123 метра. В 2 раза больше 3 издания.

Цитата:
Любые книги по Image processing сейчас легко скачиваются с гигапедии

А где там посмотреть общий список таких книг?
 
Добавлено:
Интересный линк:
 
Алгоритм сглаживания Smart Filtering.
 
http://bimedev.ru/post/2008/05/SmartFilteringfd.aspx
 

Цитата:
Russ J. C. The Image Processing Handbook (3rd ed.). Boca Raton: CRC Press, 1998.  

 
В формате DjVu, 19 МБ (качество приличное):
 
http://w18.easy-share.com/1702396309.html
 

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:22 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я думаю, что операции Фильтры - Улучшение - Сгладить (в GIMP 2.6.2 под windows) соответствует файл antialias.c из гимповских исходников. Я не заметил практически никакого эффекта от применения этой операции на тестовом скане. И ещё у неё нет никаких параметров. То есть эта операция ИМХО явно не тянет на роль
Цитата:
3) Сглаживание. Эффекты->Размытость->Сглаживание
из CorelScan.
Ещё есть просто обычное слаживание - вроде Bicubic, Bilinear, Lanczos и т.п. Но мне почему-то кажется, что и это не соответствует Сглаживанию из CorelScan.
 
Что вообще делает это Сглаживание из CorelScan? У меня такое впечатление, что это не просто сглаживание - а некое контурное сглаживание (что это такое - не очень ясно). Возможно, тут надо делать некий Selective Bicubic - по подобию Selective Gaussian Blur.
 
Добавлено:
В GIMP 2.6.2 под windows есть ещё один любопытный фильтр: Фильтры - Улучшение - Нелинейный фильтр. Внутри него 3 варианта: Альфа-усечённое среднее, оптимальный расчёт, усиление края. Параметры - Альфа и Радиус.
Я думаю, что этому фильтру соответствует файл nl-filter.c из гимповских исходников.
 
Добавлено:
bolega

Цитата:
Лучше вообще не качать, так как давно доступно 5-е издание 2007 г.

Если не трудно - конвертните его в DjVu через Pdftodjvu (ради снижения размера) и выложите на обменник.
 
Добавлено:
Про контурное сглаживание:
http://forum.sources.ru/index.php?showtopic=249061

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:35 12-11-2008 | Исправлено: monday2000, 14:43 12-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Mean filter - это действительно среднее арифметическое от пикселей окружения.  Приятная особенность этого фильтра - возможность реализации, которая работает с одинаковой скоростью вне зависимости от размеров аппертуры (в случае прямоугольной аппертуры).
Подробности тут:
http://leptonica.com/convolution.html  -> "Grayscale convolution using an accumulator"
 
dma200899

Цитата:
в) где-то в этой куче руками мог правиться поворот и м.б. поэтому слетают вообще все страницы

Вот это вполне вероятно.  Такую страницу можно найти нажав на Widest Page на стадии Page Layout.
 

Цитата:
Как вариант - прикрутите кнопку батч к оутпуту такую, которая предшествующие стадии переделать не пытается, а текущие значения "пейдж лейоут" и использует.  

Ну как же он может не использовать текущие значение "Page Layout"?  Какие же ему тогда использовать?  Вообще концепция GUI в СТ такова, что изменения сразу же применяются к текущей странице, ну а если надо ко всем применить - жмем Apply To.
 

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:08 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В то же время, "Контурное сглаживание" - это же, в сущности, Antialiasing. Короче, ничего не понятно.
 
Добавлено:
Иллюстрации контурного сглаживания: http://photoshop.demiart.ru/book/17/Index4.htm
 
Добавлено:
Smart Filering:
 
http://www.gamedev.ru/articles/?id=30101

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 15:16 12-11-2008 | Исправлено: monday2000, 15:27 12-11-2008
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну как же он может не использовать текущие значение "Page Layout"?  Какие же ему тогда использовать?  Вообще концепция GUI в СТ такова, что изменения сразу же применяются к текущей странице, ну а если надо ко всем применить - жмем Apply To.  

 
Послушайте, я не знаю как СТ устроен изнутри, и даже уже не хочу разбираться.
Я Вам пишу про конкретную проблему. Я делал книгу с помощью СТ.
И в результате я 800 раз подряд жал на клавиатуре пейдж даун в режиме оутпут, что заняло несколько часов. (Ничего в промежутках не меняя.)
 
Сделайте тогда такую кнопку, которая была бы эквивалентна нажатию столько раз на клавишу "пейдж даун" на этапе оутпут, каково число страниц.
Потому что если в этом случае нажать на кнопку "батч", то всё, что я настроил, слетает. А  изменения в результирующий файл не записываются, пока я не встану на страницу. А встать я на нее могу только клавишей с клавиатуры.
 
Почему вы препираетесь вместо того чтобы разобраться, в чем проблема ?

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 16:09 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Интересно - есть ли в Матлабе некий фильтр Smooth (Сглаживание)?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:13 12-11-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru