Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077

Цитата:
Извините, не понял, что именно.

Вручную править авто-распознанные зоны (под "править" я подразумеваю ручное подправление контура авто-распознанных зон).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:15 09-12-2009
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
продолжаю тестировать СТ, на сей раз - сканы чёрно-белые, исходно 600дпи. Версия 0.9.7.1 под windows/crossover office/linux.
 
всё вроде хорошо, кроме двух вопросов:
 
1) очень долго продолжается конечный этап (экспорт тиффов). Настройка - выключен despeckle, 600дпи, ч-б. Вроде бы не нужно делать никакого upsample, а всё равно операция занимает такое же время, как и если бы upsample был нужен. Почему это? Я ожидал очень быстрой обработки на последнем этапе.
 
2) предположим, полезная зона уже была выбрана на всех страницах автоматически, теперь я хочу просмотреть и проконтролировать. Вижу, что одна из страниц нуждается в корректировке. Тыкаю мышкой в страницу. поелс этого, вроде как, на этой странице снова происходит детектирование полезной зоны, и только через секунд 10 я вижу страницу. Почему это? Я ожидал, что полезная зона уже везде выбрана, и я сразу всё увижу.

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 16:10 11-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
are

Цитата:
1) очень долго продолжается конечный этап (экспорт тиффов). Настройка - выключен despeckle, 600дпи, ч-б. Вроде бы не нужно делать никакого upsample, а всё равно операция занимает такое же время, как и если бы upsample был нужен. Почему это? Я ожидал очень быстрой обработки на последнем этапе.  

А вы включите режим отладки (Tools -> Debug) и посмотрите сколько всего делается на этапе вывода.  Тут вам и выравнивание освещения, и сглаживание в оттенках серого, и бинаризация, и удаление зазубрин в черно-белом режиме.  Сравните с режимом вывода "Серый / Цветной", где почти никакой дополнительной обработки не делается.  Кстати пора бы уже переходить на версию 0.9.7.2 - там исправлены пара падений, в том числе из-за неконтролируемого потребления памяти в режиме отладки.
 

Цитата:
2) предположим, полезная зона уже была выбрана на всех страницах автоматически, теперь я хочу просмотреть и проконтролировать. Вижу, что одна из страниц нуждается в корректировке. Тыкаю мышкой в страницу. поелс этого, вроде как, на этой странице снова происходит детектирование полезной зоны, и только через секунд 10 я вижу страницу. Почему это? Я ожидал, что полезная зона уже везде выбрана, и я сразу всё увижу.

Это говорит о том, что не прошла проверка по зависимостям.  Скорее всего вы возвращались на предыдущие этапы и что-то там меняли.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:28 11-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000,
Цитата:
Вручную править авто-распознанные зоны (под "править" я подразумеваю ручное подправление контура авто-распознанных зон).
На примере моей страницы, допустим, сбрасываю созданные автоматические, затем обвожу прямоугольниками 20 зон при помощи мыши, на всё - 15-30 секунд. Более точная подгонка повлияет на размер итогового файла в пределах 1%, вывод - вредна. Сложности так и не нашёл. Если не усложнять искусственно.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 17:05 11-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
0.9.7.2
При увеличении полосы прокрутки загораживают края страницы (снизу и справа). Можно конечно их увидеть с Shiftом, но лучше поправить. Проверял на этапе полезная область.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 17:30 11-12-2009 | Исправлено: StanFreeWare, 17:31 11-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
При увеличении полосы прокрутки загораживают края страницы (снизу и справа). Можно конечно их увидеть с Shiftом, но лучше поправить. Проверял на этапе полезная область.

Это такая вещь, которая не сильно мешает жить, но поправить которую весьма непросто.  Спрашивать почему не надо - либо поверьте на слово, либо попробуйте сами исправить это.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:43 11-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
У меня нет причин не верить вам на слово, Joseph Artsimovich. Непросто, значит непросто.
По поводу моих возможностей в QT-проектах я уже высказывался выше. Кроме того, я сейчас веду свой проект, Djvu Bookmarker.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 19:42 11-12-2009
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Разрешите мне сказать, как я видел зонирование. Я предлагал в своё время в СК сделать просто чтобы выделять картинки квадратиками вручную сквозным методом по всем страницам книги. Быстро и удобно. Где надо - парочкой прямоугольников со слиянием зон. Где непрямоуголные картинки. Это было бы интуитивно понятно и просто в реализации. И чтобы они сразу по ходу вырезались на диск в соответствующие картинки. И ещё очень важно. Способ разделённых сканов для многоцветных (чаще всего трёхцветных) сканов. Кстати, подобных прог пока что в природе нету! Кто первым реализует, получит первую нобелевскую премию по такому разделу делов чеоечских.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 23:51 11-12-2009 | Исправлено: VidelSamogO, 01:47 12-12-2009
coffeeMAN1973

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
День добрый!
1) Уже год как делаю книги, но о ST только неделю назад узнал от своего товарища. Да и об этом форуме не слышал…
До этого времени всю информацию получал на djvu-soft.narod.ru - но там об ST - не читал. Видать слово «прототип» отпугивало.

Вот за пару деньков осилил этот форум. Интересно было наблюдать рост программы.
Общие впечатления от ST – очень понравился .
 
2) Знакомство с программой я начал со статьи (из шапки) - "Scan Tailor. Программа для обработки отсканированных книг" . Думаю её можно рекомендовать начинающим, для предварительного ознакомления с ST
Всё на одной странице. Ясные и яркие принтскрины. Только по ним одним можно понять как работать с программой.
*
Мне тоже очень понравилось использование 2-х цветов при определении зон в «Разрезке страниц». По сравнению с SC это оживило программу.

Понравился штурвал и фон в клеточку – «Компенсация наклона». Отлично реализовано.  
Зум классный.
6) Полезная площадь - пришлось вручную 3-4 (из 97) дотянуть до номера страниц, что просто замечательно.
7) Макет страницы - пришлось немного повозиться - чтобы оптимизировать поля. Сверху уменьшить, снизу увеличить. Выровнять по центру...
Думаю, опыт появится и следующие книги пойдут проще.
8) Вывод.
Поначалу стоял крыж - удалить пятна. Но в итоге удалил нужные знаки (типо тире) (я ноты сканировал).  
Решил, что уберу галку – «Удалять пятна». Но и в таком режиме страницы были почти идеальны. По привычке, позже страницы почистил в SC.
Пытался позже проверить эффект на отдельных страницах, всё что нужно - было оставлено. (?) В следующий раз попытаюсь поработать уже с очисткой пятен.
.
Раньше (почему не помню) в SC обложку обрабатывал отдельно. Здесь решил добавить к главному проекту – результат поразил отличным качеством.
.
Можете просмотреть мою книжку .
 
*
3) С иллюстрациями в ST ещё не работал. Но т.к. учился по технологии «ScanAndShare»,  
также разделяю на графику (sep файлы) и на текст. Потом дополнительно удаляю растр в фотографиях и иллюстрациях и потом объединяю в DJVU.  
В этом отношении я присоединяюсь к той группе просящей о разделении вывода изображений и текста.
Но если будет встроена возможность удаления растра, то возможно сама необходимость пост обработки фотографий отпадёт.
*
4) Сначала не мог понять, где находится, обсуждаемый всеми, "Смешанный" режим.
(для меня это было неочевидно). Но теперь-то знаю.
Т.е. ниспадающее меню (Ч/Б, Цветной серый, Смешанный) - это не очевидно.
Для юзобильности было бы плюсом сделать это в виде кнопок,  по аналогии с кнопками в режиме "Тип разреза".  
(это было все в одном стиле).
.
После этого решил, что также возможна замена на кнопки в Поля (выбор миллиметров и дюймов) в режиме "Макет странцы".
Но это конечно же предложения из разряда низкоприоритетных.
 
5) На «Выводе»
В поле «Режим»
Я думал, что чекбокс «Удалять пятна» и ниже шкала «Тоньше – Жирнее» относятся друг к другу. Уж очень близко они стоят друг к другу.
А вот оказалось нет.
Думаю, что правильней было бы их разделить. Может быть горизонтальной линией.  


А также шкалу подписать "Порог бинаризации".
 
6) Хочется ещё:  
Зум: при двойном щелчке левой клавишей мыши чтобы изображение возвращалось в исходный размер.
(Приоритет низкий.)
 
7) Этап 3 - Компенсация наклона.
Дополнительно сделать управление наклоном с помощью клавиш (при режиме "Вручную").
(+) и (-).
Это и логично и удобно.
(Приоритет низкий.)
.
 
8) Можно для сайта favicon.ico поставить.
Пока у себя расположил.    
 
9) Вопрос по despeckle
 
То что ластик будет – это озвучено.
Планируется ли внедрение очитки - в ручном режиме? Как это видится?
.
Будет ли что-то подобное как в SC – в редакторе можно настроить размер точек которые подпадают под удаление. И эти точки подсвечиваются красным цветом и начинают мигать, а основной текст – бледно серого цвета (как буд-то защищён). И потом либо ластиком либо выделением областей  эти точки стираются.  
.

Всего записей: 1 | Зарегистр. 09-12-2009 | Отправлено: 17:39 12-12-2009 | Исправлено: coffeeMAN1973, 11:43 16-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO

Цитата:
Способ разделённых сканов для многоцветных (чаще всего трёхцветных) сканов.

Что Вы имеете в виду? И тут не всё так просто: в общем случае будет непонятно, куда помещать 3 цвет - в чанк FGbz или FG44, так что ИМХО уж лучше довериться автоматической сегментации в documenttodjvu (в общем случае).
 
Добавлено:
coffeeMAN1973

Цитата:
Видать слово «прототип» отпугивало.

Спасибо, что напомнили. Я убрал оттуда слово "прототип". И ещё добавил фразу:

Цитата:
Особенность: на мой взгляд, годится только для обработки достаточно качественных сканов (в силу особенностей архитектуры).

(Tulon и сам об этом как-то говорил, но оно и так понятно).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:41 12-12-2009
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня проблема. После добавления файлов в проект в окне вывода не видно результатов. Конечный результат отображается только в миниатюрах. Также не видно кружков вращения страницы. Поэтому вопрос: с какими программными приложениеями работает Scan Tailor. Никто не сталкивался с подобным?
Убрал галочку в настройках "Использовать 3D-ускорение для интерфейса пользователя" - резульат стал виден.
Похоже проблемы с драйверами видеаокарточки.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 00:11 18-12-2009 | Исправлено: woodyfon, 00:24 18-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
woodyfon

Цитата:
Убрал галочку в настройках "Использовать 3D-ускорение для интерфейса пользователя" - резульат стал виден.
Похоже проблемы с драйверами видеаокарточки.

Надо полагать.  Версия последняя, 0.9.7.2?  Там 3D ускорение стало более стабильно работать, а при нехватке фичей со стороны драйвера оно вообще не будет включаться.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:36 18-12-2009
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да использовал последнюю версию 0.9.7.2. У меня этих фичей в видеокарте . Проблема именно в драйверах. Знаю, что Вам уже много чего наговорили по поводу улкчшения программі, но хочу также вісказать соображения по улучшению. Но сначала несколько хороших отзывов. Добавление областей - супер. Стало гораздо легче редактировать цветные сканы. Если бы еще добавить выделение областей в прямоугольник и ластик на этапе обработки.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 13:44 18-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Замечание. Сложилось впечатление, что в режиме цветной/серый, вывод происходит по большой пунктирной рамке, а по логике, если я уже сделал обрезку и выбрал полезную зону( а ч/б вывод по каким либо причинам не получился), то пусть она эта полезная зона и выводится.То что осталось за ее пределами (до внешней пунктирной рамки) пусть выводится белым цветом. В вывод должна попадать только полезная зона, независимо от режима вывода? Например имею две серые страницы. У первой полезная зона пол страницы (остальное - мусор мне не нужно), у второй почти полная страница.На выводе от первой страницы должен видеть половину (полезную зону).

Всего записей: 1452 | Зарегистр. 02-08-2008 | Отправлено: 23:26 20-12-2009 | Исправлено: alpopo, 23:40 20-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo

Цитата:
То что осталось за ее пределами (до внешней пунктирной рамки) пусть выводится белым цветом.

Для этого имеется соответствующий чекбокс.
 

Цитата:
В вывод должна попадать только полезная зона, независимо от режима вывода?

В такой формулировке это можно понять как нежеление иметь каких-либо полей, что кстати вполне можно устроить - поля в ноль, и выключить выравнивание размеров.
А если вы имели в виду, что контент за пределами полезной зоны не должен попадать в вывод, то это хорошо прокатывает только на чистом белом фоне, иначе очень заметен переход контент / поля.  Так или иначе, для этого есть чекбокс "Белые поля".

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:45 20-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TulonБлагодарю за оперативный ответ. Замечание снимаю - не знал назначение чекбокса. С ним все работает
Еще один неприятный момент.Я уже тут писал, что иногда на диске не остается для вывода свободного места при больших  файлах, а теперь о неприятном.Вывод съел все свободное место, я этого не заметил(и бог с ним),операция вывода завершилась. Далее я сохраняю проект(который у меня на этом же диске).Из главного меню операция Сохранить проект прошла.Закрываю проект.Появляется дополнительное сообщение - сохранить или нет проект.Жму сохранить операция проходит(вроде бы повторно - из главного меню ведь уже сохранял).Закрываю проект.Открываю проект для работы и получаю сообщение файл проекта поврежден - всю свою обрезку и выравнивание (которая хранится в файле проекта, а не  в фале вывода) я потерял. А это день работы для книги более1000 страниц.Файл проекта не очень большой, но при отсутствии свободного места он недозаписывается?Выкрутится можно - буду записывать файлы проекта на другом диске нежели вывод, где им места заведомо хватит.
Теперь ВОПРОС.При закрытии файла проекта вместо повторного запроса на сохранение проекта лучше вывести сообщение о нехватке места на диске и дать возможность его записать в режиме "Сохранить как"

Всего записей: 1452 | Зарегистр. 02-08-2008 | Отправлено: 11:39 21-12-2009 | Исправлено: alpopo, 13:28 21-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Планируете ли Вы сделать разделённый вывод в СТ - по методу разделённых сканов? Т.е. чтобы получались пары субсканов:
 
 

 
Только хорошо бы при этом учитывать пользовательские зоны (а не только авто-распознанные).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:58 21-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon, monday2000 поддерживаю, http://forum.ru-board.com/topic.cgi?forum=5&topic=27424&start=1700#13

Цитата:
Оригинал можно сшивать из основного и дополнительных файлов, представленных в виде дерева. При этом, вращение дополнений производится относительно основного скана, а вращение основного - для всего сборного листа.
...
Так же точно, деревом, могли бы выглядеть исходный (составной) скан и полученные из него две и более страниц.
Переключение вида - к примеру, закладками.  

Т.е. из 1, 2 либо более, сканов - сведение, из результата которого - вывод желаемого числа страниц.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 16:08 21-12-2009
vkni

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Пара вопросов по внутреннему устройству ST:
 
1) Правильно ли я понимаю, что у ST 2 потока исполнения - основной и BackgroundExecutor?
 
2) В BackgroundExecutor отправляются сообщения с указателями на функцию-задачу (BackgroundTask),  
которая потом исполняется?
 
3) Или же задачи по выполнению фильтров обработки выполняет WorkerThread?
 
К сожалению, по коду это мне не очень понятно.

Всего записей: 9 | Зарегистр. 02-10-2007 | Отправлено: 18:35 21-12-2009
vkni

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Я это к тому, что у меня есть желание поставить наинизший приоритет (QThread::Idle) для процесса, в котором происходит фоновая пакетная обработка. С другой стороны, приоритет фонового процесса, масштабирующего картинки для вывода на экран должен быть большим.  
 
Естественно, возможность смены приоритета фонового процесса обработки будет засунута в диалог настройки.
 
Это мелкое исправление поможет полностью использовать то обстоятельство, что ST не жрёт память дикими количествами и даёт возможность работать на компьютере, когда идёт фоновая обработка рисунков. В отличие от SK.
 
Поэтому мне нужно знать, какие структуры ответственены за фоновую пакетную обработку, а какие за фоновое масштабирование изображений для показа на экране.

Всего записей: 9 | Зарегистр. 02-10-2007 | Отправлено: 09:16 22-12-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru