Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
- "По пункту 3 - я ничего необычного в картинках не заметил" - ну как же? Я тебе выслал исходный файл и результат. Да, отедльные участки рисунка бинаризованы. И ты считаешь это нормально? Результат выглядит крайне грубо. Плавность изменения тона (говорю своими словами) исчезла. Если на данный момент такую ситуацию алгоритмами исправить невозможно, то вот он тебе - пример, который доказывает необходимость появления функции "исключения картинки из обработки".

Я сказал ничего необычного, потому что знаком с этим явлением и привык к нему.  Да, это слабость данного алгоритма автовыделения картинок.  Не любит он, когда картинки плавно переходят в фон.  И действительно, ручное выделение не помешало бы.
Кстати, U235: у меня есть идея улучшения вашего алгоритма как раз в этом плане.  Сейчас маска картинок получается с помощью простой бинаризации серой "карты вероятности" так сказать.  А что если бинаризованные области использовать как затравку для алгоритма наращивания областей, такого как SIOX?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:06 25-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А можно как-то для определения области рисунка учесть, что он прямоугольной формы? Спрашиваю как ламер, конечно.
Хотя судя по результату, алгоритм проверяет попиксельно? Вот если бы он очертил для себя весь прямоугольник, внутри которого имелись признаки картинки, тогда бы вся картинка сохранилась.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 15:30 25-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А можно как-то для определения области рисунка учесть, что он прямоугольной формы? Спрашиваю как ламер, конечно.  

Можно было бы, если бы картинки всегда были бы прямоугольниками.  В журналах например это часто бывает не так.  А если уж делать ручное выделение картинок, то там действительно не помешала бы функция "превратить автовыделение в прямоугольник".

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:45 25-01-2009
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
На первый взгляд, SIOX - вещь достаточно интересная. Это действительно может улучшить выделение картинок (как в автоматическом, так и в ручном режиме).
Еще замечания по ST:
1. Не всгда верно определяется линия разрезки страниц (пробовал на книге в мягком переплете).  В отладочном режиме, на картинке с преобразованием Хафа нужная точка есть, но выбирается другая (т.к. тень переплета идет слегка под наклоном). Т.е. желательно бы усовершенствовать логику выбора нужной точки в пространстве Хафа (можно попробовать умножать преобразование на весовую функцию или отбирать сначала точки по числу пиков горизонтального сечения преобразования Хафа).  
Вообще, угол, под которым делается  разрез разворота должен быть примерно равен среднему из угла компенсации наклона левой и правой страницы.  
2. Выделение полезной области.  Можно ли сделать так, чтобы пользователь мог выбрать рамку контента и "применить" ее к нескольким страницам. Т.е. размеры рамки фиксированы (+-, допустим, сотня пикселей), а СТ ищет только её положение?

Всего записей: 976 | Зарегистр. 14-12-2005 | Отправлено: 21:15 25-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Не всгда верно определяется линия разрезки страниц (пробовал на книге в мягком переплете).  В отладочном режиме, на картинке с преобразованием Хафа нужная точка есть, но выбирается другая (т.к. тень переплета идет слегка под наклоном). Т.е. желательно бы усовершенствовать логику выбора нужной точки в пространстве Хафа (можно попробовать умножать преобразование на весовую функцию или отбирать сначала точки по числу пиков горизонтального сечения преобразования Хафа).  
Вообще, угол, под которым делается  разрез разворота должен быть примерно равен среднему из угла компенсации наклона левой и правой страницы.  

Пример в студию!  Трудно что-то сказать, не зная даже в каком режиме был разрез.  Например в режиме с двумя страницами, тупо выбирается ближайшая к центру линия, а вот в режиме с одной страницей полно всяких эвристик.
 

Цитата:
2. Выделение полезной области.  Можно ли сделать так, чтобы пользователь мог выбрать рамку контента и "применить" ее к нескольким страницам. Т.е. размеры рамки фиксированы (+-, допустим, сотня пикселей), а СТ ищет только её положение?

Теоретически это возможно, правда у меня пока нет никаких идей, как я буду искать наиболее удачное размещение рамки с уже известным размером.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:31 25-01-2009
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, как раз двухстраничный разворот. Вот пример. 3Мб

Всего записей: 976 | Зарегистр. 14-12-2005 | Отправлено: 21:50 25-01-2009 | Исправлено: U235, 21:51 25-01-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нашёл баг, смотри скриншоты Версия программы: 20090125
 
Добавлено:
Чтобы вызвать ошибку делаем следующее:создаеём новый проект (я создал его на основе 32 tiff-файлов), разворачиваем первый скан на 180 градусов вправо, затем последовательно проходимся по пунктам меню "split pages", Deskew и наконец нажимаем "Select content".
 
Добавлено:
Вот пример изображения, возможно дело в нём http://narod.ru/disk/5228121000/ScanImage12.tif.html

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 22:39 25-01-2009 | Исправлено: CrackMe, 22:42 25-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Нашёл баг, смотри скриншоты Версия программы: 20090125  

По скриншотам проблему не найти, но к счастью она воспроизвелась у Arceny, с помощью которого я получил трассировку стека и пофиксил этот баг в SVN.  Кстати у меня самого этот баг в принципе не мог воспроизвестись - на PowerPC даже цельночисленное деление на ноль не выкидывает исключение.
 
Добавлено:
U235
Посмотрел ваш пример, и решил что нет смысла возиться с таким редким случаем.
В области разворота были найдены две непересекающиеся линии.  Если бы они пересеклись - была бы выбрана наиболее сильная из них (по моему правильная была сильнее в смысле показателя Хафа).  И так уж получилось, что центр неправильной линии был ближе к центру картинки, чем центр правильной.  Надо сказать, что хоть была выбрана и неправильная линия, но благодаря тому, что она не пересекла полезного контента, рамка все равно была выбрана правильно - на обоих половинках.  Надо этот момент отразить в руководстве - идеальной точности при указании линии разреза обычно не требуется, лишь бы она не отрезала кусок полезного контента.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:59 25-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Частота обновления все увеличивается. Такими темпами скоро к сборкам надо будет и время указывать. 3-я сборка за 3 дня. Ладно хоть полночь прошла
Итак, новая сборка Scan Tailor 0.9.1 от 20090126 - http://narod.ru/disk/5230478000/scantailor20090126.7z.html

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 01:04 26-01-2009 | Исправлено: denver 22, 01:05 26-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дело близится к оффициальному релизу.  Осталось несколько мелочей только.  И одной из этих мелочей будет перенос маленького окна внутрь большого.  Сегодня весь день этим и занимался.  За одно сделал список недавних проектов.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:34 26-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Прошу не забыть к релизу добавить новые горячие клавиши (Q-W).

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 06:10 26-01-2009
superpavlo



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Отлично! последняя версия (126) не сбоит и нормально делает обрезку цветного журнального скана.
Реализовали ли заливку рамки белым?
Былоб очень неплохо, еслиб был выбор сохранять итоговый файл в одностраничном tif или многостраничном....
 
Добавлено:
Upd, запустил пакетное сохранение на выводе в 600х600 dpi вот что в итоге...

Всего записей: 15 | Зарегистр. 04-01-2006 | Отправлено: 08:00 26-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
savage2000

Цитата:
Пусть модератор разбирается с вашими выходками - вы своим флеймом уже загадили топик.

Ну-ну. Вот и пусть разбирается - как Вы тут устраиваете выходки и провокации с целью разжечь флейм. А что касается "загадили" - не Вашего ума дело, не суйте свой нос куда не надо - без Вас разберёмся. Я знаю что делаю - и не Вам меня судить.
 
Добавлено:
Tulon

Цитата:
Не надо переходить на личности.

Я только в ответ.

Цитата:
А если уж кто-то перешел на личности в ваш адрес - лучше проигнорировать это, чем отвечать тем же.

О нет. Таких я буду "мочить в сортире" - чтоб другим неповадно было.
 
Добавлено:
denver 22

Цитата:
Да, и мы вроде договаривались обращаться на "ты"

Давайте лучше наоборот. Здесь не свойская компания студентов - а взрослые люди, занимающиеся серьёзным делом. Заметьте, что я с Вами общаюсь крайне неохотно именно по этой причине.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:30 26-01-2009 | Исправлено: monday2000, 09:41 26-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
superpavlo

Цитата:
Реализовали ли заливку рамки белым?  

Пока нет.
 

Цитата:
Былоб очень неплохо, еслиб был выбор сохранять итоговый файл в одностраничном tif или многостраничном....  

Это проблематично.  LibTiff позволяет только дописывать страницы в многостраничный TIFF, но не вставлять в середину или заменять.  А СТ позволяет обрабатывать страницы в любом порядке.
 

Цитата:
Upd, запустил пакетное сохранение на выводе в 600х600 dpi вот что в итоге...  

Выкладывайте пример.  Кстати проблемный файл может быть не тот, что выбран в данный момент, а следующий.  Это относиться только к пакетному режиму.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:32 26-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
На скриншоте superpavlo ошибка Visual C++ Runtime Library. Я считал, что СТ под Винду, которую делает denver 22, компилится не в Visual C++. Или я что-то пропустил? Тогды ой

Всего записей: 2494 | Зарегистр. 28-05-2004 | Отправлено: 13:47 26-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
На скриншоте superpavlo ошибка Visual C++ Runtime Library. Я считал, что СТ под Винду, которую делает denver 22, компилится не в Visual C++. Или я что-то пропустил? Тогды ой

Не в Visual C++, но проги, собранные MinGW линкуются с msvcrt.dll, а это как раз Microsoft Visual C Run Time (Library).  Так что такая ошибка вполне возможна.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:15 26-01-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделатйте, пожалуйста, чтобы при выборе опции применить ко всем странцам в диапазоне, в первой ячейке был бы номер выделеной страницы. И добавьте, пожалуйста правее изобржения номер старницы. Сейчас, чтобы понять какой диапахон задавать, приходиться сильно напрягаться.
 
Добавлено:
Неправильно автоматически разрезает http://narod.ru/disk/5245664000/ScanImage04.tif.html и подобные страницы (мятые)

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 17:50 26-01-2009 | Исправлено: CrackMe, 17:59 26-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сделатйте, пожалуйста, чтобы при выборе опции применить ко всем странцам в диапазоне, в первой ячейке был бы номер выделеной страницы. И добавьте, пожалуйста правее изобржения номер старницы. Сейчас, чтобы понять какой диапахон задавать, приходиться сильно напрягаться.  

То что есть сейчас, осталось еще с тех времен, когда вместо ленты предпросмотра был слайдер + спинбокс с номером страницы.  Сейчас действительно жутко неудобно пользоваться диапазонами страниц.  В идеале я бы решил это концепцией групп.  То есть например можно будет создать группу "Мятые страницы", и как-нибудь визуально внести в эту группу нужные вам страницы.  И во всех диалогах "Применить к" появился бы пункт "Применить к группе <выбор группы>".  Это в идеале.  Не знаю, когда руки доберутся.  А то, что вы предлагаете, сделать в принципе можно, как временную меру.  Текущий номер в первой ячейке я бы сделал хоть сейчас, а вот отображение номера страницы в ленте предпросмотра - с этим придется подождать.
 

Цитата:
Неправильно автоматически разрезает http://narod.ru/disk/5245664000/ScanImage04.tif.html и подобные страницы (мятые)

Это оказалось багом - при проверке, какая линия ближе к центру, не учитывалось, что картинка может быть повернута.  Уже исправил в SVN.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:28 26-01-2009
CrackMe

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Былобы не плохо, если бы можно было удалить скан их проекта, у меня есть несколько сканов 1 страницы в проекте, мне нужен только  лучший их них. Думаю я не одинок.

Всего записей: 711 | Зарегистр. 18-07-2006 | Отправлено: 19:33 26-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Былобы не плохо, если бы можно было удалить скан их проекта, у меня есть несколько сканов 1 страницы в проекте, мне нужен только  лучший их них. Думаю я не одинок.

Ограничение известное, но эта задача на будущее - там и добавление и удаление сделаю.  Пока же, если сильно припрет, можно открыть проектный файл в любом текстовом редакторе, поддерживающим UTF-8 (попробуйте Notepad++ или UniRed), найти имя файла, который нужно удалить, и удалить тег, в котором это имя встретилось, а также все теги-потомки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:28 26-01-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru