Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dma200899

Цитата:
Сделайте тогда такую кнопку, которая была бы эквивалентна нажатию столько раз на клавишу "пейдж даун" на этапе оутпут, каково число страниц.
 

Так ведь Batch Processing как раз и эквивалентен N-ному количеству нажатий на page down.
 

Цитата:
Потому что если в этом случае нажать на кнопку "батч", то всё, что я настроил, слетает. А  изменения в результирующий файл не записываются, пока я не встану на страницу. А встать я на нее могу только клавишей с клавиатуры.

Странно все это.  Не должно такого происходить.  У меня и по крайней мере не происходит.
 

Цитата:
Почему вы препираетесь вместо того чтобы разобраться, в чем проблема ?

Это как раз и есть разбирание в проблеме.  Не могли бы вы воспроизвести проблему на пакете из двух-трех страниц, и потом описать точную последовательность действий?
Да, придется приложить некоторые усилия.  Но я как бы тоже со своей стороны прилагаю.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:04 12-11-2008
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, придется приложить некоторые усилия.

На 15 сканах повторить эффект не удалось. Всё фурычит нормально.
800 прогонять - времени пока нет.
 
Единственное обратил внимание, что кнопка батч на оутпуте становится доступной с неким запозданием после того как поправил (deskew).
 
Я вот щас думаю, а может она у меня тогда вообще не загорелась ...
 
 
Да, при 800 сканах:  
 
я иду на deskew, делаю поворот и кнопка батч на оутпуте не загорается вообще (5 мин -точных).
Если же я перед этим встану на пейж лейоут - моментально загорается. (дескью - лейоут - оутпут).
С селект контент я также могу на оутпут перейти и все работает, (контент - оутпут).
А с дескью на оутпут - нет. Нету кнопки.
 
PS
эксперименты продолжу, т.к. эффект точно был.  
 
PPS
вот щас еще обнаружил следующее, если сплиттинг сделать,  
то меняется нумерация страниц в выходной директории.  
идут одинаковые страницы  
0007_0007.png  (первый проход - создан 20.50)
0008_0007.png  (второй проход - создан 21.15)
т.е. старые странички не удалены, т.к. нумерация изменилась.
может у меня и в тот раз что-то похожее было - вот я старые результаты и видел.
 

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 20:27 12-11-2008 | Исправлено: dma200899, 21:25 12-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Вы смотрели ли вот это:
 
SUSAN Low Level Image Processing
 
http://users.fmrib.ox.ac.uk/~steve/susan/
 
Там есть какое-то Structure-preserving image noise reduction

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:54 13-11-2008 | Исправлено: monday2000, 14:28 13-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dma200899
 

Цитата:
я иду на deskew, делаю поворот и кнопка батч на оутпуте не загорается вообще (5 мин -точных).  
Если же я перед этим встану на пейж лейоут - моментально загорается. (дескью - лейоут - оутпут).  
С селект контент я также могу на оутпут перейти и все работает, (контент - оутпут).  
А с дескью на оутпут - нет. Нету кнопки.  

Это похоже на баг - буду разбираться.
 

Цитата:
вот щас еще обнаружил следующее, если сплиттинг сделать,  
то меняется нумерация страниц в выходной директории.  
идут одинаковые страницы  
0007_0007.png  (первый проход - создан 20.50)  
0008_0007.png  (второй проход - создан 21.15)  
т.е. старые странички не удалены, т.к. нумерация изменилась.  
может у меня и в тот раз что-то похожее было - вот я старые результаты и видел.

Это тоже возможно. СТ старается ничего не удалять без крайней необходимости.
 

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:09 13-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посмотрел я исходники последнего ImageMagick. У меня от этого ImageMagick сплошное разочарование. ИМХО несовершенная вещь этот ImageMagick. Вроде бы много алгоритмов - а начинаешь пытаться разобраться в исходниках - и обнаруживается, что полно непонятных функций, определения которых уходят в другие файлы - оттуда ещё в другие - и т.д. Хелп - бестолковый и неудачный, почти ничего не объясняющий. Дистрибутив - гигантский, 11 метров. FreeImage на мой взгляд гораздо проще в понимании и использовании - хотя там и маловато алгоритмов (надеюсь, это временно).
 
Лицензия у ImageMagick даже не GPL - хотя написано, что совместимая.
 
ImageMagick показался мне сложнее и бестолковее, чем даже GIMP (!) Кстати, GIMP - ИМХО изумительно замечательная вещь во многих отношениях. Простой, понятный, и маловесящий.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:22 14-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ImageMagick показался мне сложнее и бестолковее, чем даже GIMP (!) Кстати, GIMP - ИМХО изумительно замечательная вещь во многих отношениях. Простой, понятный, и маловесящий.

Мне как то раз приходилось заглядывать в исходники ImageMagick.  Да - сложно, но чтобы бестолково, я бы не сказал.  Вот перейдет Gimp окончательно на библиотеку GEGL - пропадет и оттуда простота, поскольку GEGL поддерживает такие вещи, как 16ти битный цвет и различные цветовые пространства.
 
Добавлено:
dma200899
 

Цитата:
Цитата:я иду на deskew, делаю поворот и кнопка батч на оутпуте не загорается вообще (5 мин -точных).  
Если же я перед этим встану на пейж лейоут - моментально загорается. (дескью - лейоут - оутпут).  
С селект контент я также могу на оутпут перейти и все работает, (контент - оутпут).  
А с дескью на оутпут - нет. Нету кнопки.  
 
Это похоже на баг - буду разбираться.  

А вообще нет - это нормальное поведение. Вывод вам делать не разрешают, пока полностью не пройдена стадия Select Content. Это потому что рамка контента любой страницы может повлиять на размеры всех остальных.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:05 14-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:  
 
15. Простейший фильтр Adaptive Smoothing
 
http://www.djvu-soft.narod.ru/bookscanlib/015.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:34 14-11-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Вы ответили 16:49 06-11-2008
Мне это понятно, я разбирался с кодом U235. Меня заинтересовал второй этап

Цитата:
Работаю над гибридным алгоритмом выравнивания освещения.  Первый этап - то, что мне предложил U235 (морфологическое выделение фона, если кому интересно - расскажу подробности).  Второй этап - генерация полиномиальной поверхности на основе того, что выдал первый этап, не принимая во внимание области явного foreground'а.  
Что это дает?  
Я сделал плагин на базе кода U235. На мой взгляд чистит фон очень хорошо. Единственное, если контент зацепит двухпиксельнную границу, он будет вычищен. Но это можно поправить.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 11:05 16-11-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand
Собственно второй  этап (кусочная поминомиальная аппроксимация фона) и предусматривается для такого случая:
Цитата:
... если контент зацепит двухпиксельнную границу, он будет вычищен.

p.s. Где можно скачать плагин для тестирования?
 

Всего записей: 881 | Зарегистр. 14-12-2005 | Отправлено: 12:01 16-11-2008
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Где можно скачать плагин для тестирования?

В топике по сканированию выложил.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 12:21 16-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал примерчик сравнения алгоритма выравнивания освещённости у Book Restorer 4.1, Scan Kromsator v5.91 и ImCb. Пример выложил:  
 
http://www.djvu-soft.narod.ru/bookscanlib/sl_example.rar  (744 КБ)  
 
Там внутри исходный скан, затем он же обработанный в BR, он же обработанный в SK, и он же обработанный в ImCb.
 
На мой взгляд, единственный алгоритм, который действительно выравнивает освещённость - это тот, который встроен в Book Restorer 4.1. Все остальные реализации ИМХО не дотягивают до понятия "выравнивание освещённости". Это заметно при внимательном рассмотрении выложенного примерчика. Например, чрезмерно высвеченные буквы (в засвеченной полосе) темнеют (в достаточной степени) до уровня нормальных букв только у BR - и ни в одной из 2 альтернативных реализаций.
 
Кстати, в проекте AForge.NET тоже есть попытка реализации Illunation Correction - но я не смог там разобраться, точнее, то, что получилось у меня при перенесении их Illunation Correction во FreeImage - полная фигня.
 
У меня есть одна идея: поковыряться в алгоритмах освещения в GIMP - и посмотреть, как там реализуется освещённость точечным источником - а затем постараться сделать выравнивание данного свойства.
 
Добавлено:
Arcand
Для реализации Вашего CorelScan не хватает по большому счёту только путёвого алгоритма Smoothing (вместо этого барахла) - всё остальное уже практически есть.  
 
Bместо Smart Blur -> Selective Blur, автоуровни  - кажется, есть в GIMP, хитрые бинаризации - есть в AForge.NET, контурная резкость - реализована - это Unsharp Mask, причём это высококачественный Unsharp Mask.
 
Добавлено:

Цитата:
Идея выравнивания освещения заключается в том, чтобы выделить фон изображения, то есть убрать оттуда весь контент и залить эти места цветом бумаги, и потом пересчитать исходное изображение по этой формуле:  
new_gray_level = orig * 255 / background  

Вот это сделано в AForge.NET как Illumination Correction. Только вместо 255 берётся средний цвет исходной картинки, а в качестве background - оригинальное изображение, подвергнутое сильнейшему Gaussian Blur.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:52 16-11-2008 | Исправлено: monday2000, 18:09 16-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:  
   
16. Простейший фильтр Illuminance Correction
   
http://www.djvu-soft.narod.ru/bookscanlib/016.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 00:15 17-11-2008
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я вот думаю, может в СТ можно сделать что-нибудь типа кнопки
"а вот тут ко всем картинкам применяется скрипт/плугин пользователя"
а monday2000 свою кипучую энергию и направит на написание таких плагинов/скриптов.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 04:54 17-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я вот думаю, может в СТ можно сделать что-нибудь типа кнопки  
"а вот тут ко всем картинкам применяется скрипт/плугин пользователя"  
а monday2000 свою кипучую энергию и направит на написание таких плагинов/скриптов.  

Это в принципе можно, но отношение полезности к сложности реализации будет слишком низким.
 
Добавлено:

Цитата:
Цитата:Работаю над гибридным алгоритмом выравнивания освещения.  Первый этап - то, что мне предложил U235 (морфологическое выделение фона, если кому интересно - расскажу подробности).  Второй этап - генерация полиномиальной поверхности на основе того, что выдал первый этап, не принимая во внимание области явного foreground'а.
 
Что это дает?  
Я сделал плагин на базе кода U235. На мой взгляд чистит фон очень хорошо. Единственное, если контент зацепит двухпиксельнную границу, он будет вычищен. Но это можно поправить.

Когда фон расчитывается с помощью морфологии, на этом самом фоне хорошо видны буквы, которые были в тени разворота книги, а это снижает качество выравнивания освещения. Если буквы хорошо отделены друг от друга, пострадают только крайние буквы, вне зависимости от ширини тени, а если нет - то целые слова, а это уже очень заметно.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:00 17-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я поставил себе Corel PHOTO-PAINT 12 - чтобы посмотреть на фильтры из CorelScan. Интерфейс оставил английский - русик на него не буду ставить.
 
Меню Effects-Blur содержит помимо прочего такие интересные нам пункты: Smooth..., Soften..., Smart Blur.... Вот что о них сказано в хелпе:

Цитата:
Smooth — mutes the differences between adjacent pixels to smooth an image without losing detail. It is especially useful for removing the dithering that is created when you convert an image from the paletted mode to the RGB mode. The Smooth effect produces a more pronounced effect than the Soften effect. The Smooth effect is also a preset lens type.
Soften — smooths and tones down the harsh edges in an image without losing important image detail. The difference between the Smooth and Soften effects is subtle but is often apparent when images are viewed at high resolution. The Soften effect is also a preset lens type.
Smart blur — blurs an image but retains the edge detail. This effect is useful if you want to retain the sharp lines and edges, such as the ones that form the letters in text, when you export an image to a file format that would normally reduce the amount of detail.

 
Меню Effects-Sharpen содержит помимо прочего такие интересные нам пункты: Unsharp mask..., Adaptive unsharp..., Sharpen..., Directional sharpen.... Вот что о них сказано в хелпе:

Цитата:
Unsharp mask — lets you accentuate edge detail and focus blurred areas in the image without removing low-frequency areas.
Adaptive unsharp — lets you accentuate edge detail by analyzing the values of neighboring pixels. This filter preserves most image detail, but its effect is most apparent in high-resolution images.
Sharpen — lets you accentuate the edges of the image by focusing blurred areas and increasing the contrast between neighboring pixels. Move the Background slider to set the threshold for the effect. Lower values increase the number of pixels changed by the sharpening effect.
Directional sharpen — lets you enhance the edges of an image without creating a grainy effect.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:27 17-11-2008 | Исправлено: monday2000, 22:28 17-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:    
   
17. Простой Bicubic Resize
   
http://www.djvu-soft.narod.ru/bookscanlib/017.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:33 18-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Smoothing Operations
 
http://www.ph.tn.tudelft.nl/Courses/FIP/noframes/fip-Smoothin.html
 
Conservative Smoothing
 
http://homepages.inf.ed.ac.uk/rbf/HIPR2/csmooth.htm
 
Добавлено:
Image Scaling With Bresenham
 
http://www.ddj.com/architect/184405045
 
Добавлено:
Source Code for Smooth Image Resampling (Resizing) in C/C++ (Visual Studio)
by Ryan Geiss - 3 July 2008
 
http://www.geisswerks.com/ryan/FAQS/resize.html
 
Добавлено:
Quick image scaling algorithms
 
http://www.compuphase.com/graphic/scale.htm
 
Добавлено:
Digital Image Restoration
 
http://www2.imm.dtu.dk/~pch/PPTSVD/pptsvd.html

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:12 19-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал новую заметку:    
     
18. Простой Bilinear Resize.
     
http://www.djvu-soft.narod.ru/bookscanlib/018.htm
 
Добавлено:
У меня всё не идёт из головы этот Сorel Smooth. Что же это такое? Смотрел в Гугле по ключевым словам "Image smooth algorithm" и "Adaptive smoothing". Ссылки - в предыдущем посте.
 
Вот сейчас "перебивал" ресайзинговые алгоритмы и случайно заглянул очередной раз в табличку визуальных образцов качества работы различных ресайзинговых алгоритмов FreeImage. Эта табличка - в самом конце PDF-хелпа к FreeImage - там женская грудь в жёлтом купальнике. .
 
Посмотрел - и тут меня осенило: из всех имеющихся там алгоритмов сглаживания - Box, Bilinear, Mitchell and Netravali's Bicubic, Catmull-Rom, Lanczos3, Cubic B-Spline - самое лучшее на вид сглаживание даёт Cubic B-Spline! Это там хорошо по картиночке видно.
 
А я же ещё днём, когда в Гугле искал, то и дело натыкался на какие-то "сглаживание числовой последовательности сплайном", "сплайновое сглаживание экспериментальных данных" и т.п.
 
То есть, пожалуй такой некий Smooth-алгоритм можно сделать, возможно так: скрестить воедино 2 алгоритма - 14. Фильтр Selective Gaussian Blur и FreeImage_Rescale(...FILTER_BSPLINE). И не делать при этом ресайзинг - т.е. чтобы размер картинки на входе и выходе не менялся (это даст даже небольшое упрощение).
 
Но есть проблема: 14. Фильтр Selective Gaussian Blur - однопроходный, а FreeImage_Rescale(...FILTER_BSPLINE) - двухпроходный. Так что, возможно, потребуется ещё заглядывать в обычный (не selective) двухпроходный Gaussian Blur, который есть в 13. Фильтр Unsharp Mask (на базе Gaussian Blur).
 
Вот что написано про Cubic B-Spline ресайзинг в PDF-хелпе к FreeImage:

Цитата:
B-Spline filter
 
The B-spline filter produces the smoothest output, but tends to smooth over fine details. This function requires the same processing time as Mitchell and Netravali’s Bicubic filter. B-spline filter is recommended for applications where the smoothest output is required.

 
Добавлено:
Я сделал новую заметку:      
     
19. Nearest Neighbor Resize  
     
http://www.djvu-soft.narod.ru/bookscanlib/019.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:34 19-11-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
The B-spline filter produces the smoothest output, but tends to smooth over fine details.

Для текстовых сканов сильное размывание будет вредным.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:49 19-11-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Речь идёт исключительно о краевом размытии контуров букв - т.е. это как раз то, что делает Corel Smooth. Если же сплайн будет слишком сильным по размытию - то у нас же в запасе ещё пяток сглаживающих техник из FreeImage.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:01 20-11-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru