Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Замечание. Почему-то захотелось вставить в диалог разделительная линия кнопку (посередине) в дополнение к кнопкам (автоматически) (вручную).Чтобы разделительная линия ставилась автоматом но посередине скана. Если на скане не видно линии разворота книги, на автомате разделительная линия прижимается очень сильно к тексту правого или левого разворота и ее вручную на каждой странице надо отжимать (это уже не автоматически).

Всего записей: 1443 | Зарегистр. 02-08-2008 | Отправлено: 09:35 22-12-2009 | Исправлено: alpopo, 09:38 22-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo
Проверять ошибки записи можно и нужно, особенно при сохранении проекта, однако сейчас я занят более важными вещами.  Может найдутся другие желающие реализовать это?  Если ограничится проверкой при сохранении проекта, никаких сложностей там нет.
 

Цитата:
Планируете ли Вы сделать разделённый вывод в СТ - по методу разделённых сканов?  

В ближайшем будущем - нет, потом - возможно.  Как я уже писал, меня бы устроил вариант с записью дополнительных слоев (а именно маски картинок) в TIFF файлы.
 
Andriuha077

Цитата:
Т.е. из 1, 2 либо более, сканов - сведение, из результата которого - вывод желаемого числа страниц.

С ходу не понял, о чем речь, а читать залинкованный пост времени нет.
 
vkni

Цитата:
1) Правильно ли я понимаю, что у ST 2 потока исполнения - основной и BackgroundExecutor?  

Больше двух - 4 если я не ошибаюсь.  BackgroundExecutor - это обобщенный механизм выполнения заданий в фоновом потоке.  То есть он может использоваться для всяких разных целей.  Для непосредственно фоновой обработки он по историческим причинам не используется, а используется WorkerThread.  Можете попробовать реализовать установку его приоритета.
 

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:00 22-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Как я уже писал, меня бы устроил вариант с записью дополнительных слоев (а именно маски картинок) в TIFF файлы.

Давайте хоть так пока.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:57 22-12-2009 | Исправлено: monday2000, 15:06 22-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчера обновился с 0.9.7.1 на 0.9.7.2. И нарвался на оригинальную багу:
В Основном окне программы все листы белые. На ленте предпросмотра всё есть. Более того, программа контент распознает, полезные области находит. Вижу эти полезные области на чистых листах... содержимого не вижу. Пробовал на 2-х разных исходниках - одинаково.
Вернулся на 0.9.7.1 - всё отлично.
После обновления не перезагружался (раньше не требовалось). Какие будут мнения?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 09:41 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
Проблемы с 3D ускорением скорее всего - советую отключить.  В версии 0.9.7.2 используется непрямой рендеринг, что в моем случае помогло избавиться от артефактов (встроенная видюха Intel).  Возможно в вашем случае от этого только хуже стало.  Какая у вас видюха и операционная система?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:47 24-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Отключил 3D ускорение - всё заработало. Спасибо.
WinXP SP3, Nvidia 6600.
Я не заглянул в эту настройку ранее, т.к. где-то тут Вы говорили, что по-умолчанию отключили 3D ускорение по причине глюков на некоторых видюхах.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:42 24-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Что-то у меня в маленьком окошке "Недавние проекты" при старте программы отображаются 2 одинаковые записи "sample", а пути у них такие:
 
D:/Мои документы/sample.ScanTailor
 
D:\Мои документы\sample.ScanTailor
 
Добавлено:
Tulon
А где хранятся координаты пользовательских зон? В файле задания я их что-то не увидел.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:59 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Где-то нехватает нормализации пути.  Такими мелочами я обычно занимаюсь непосредственно перед релизом.  Вспомню - сделаю, не вспомню - не сделаю.  Список задач я теперь намеренно не веду - иначе он будет давить психологически.
 
Добавлено:

Цитата:
А где хранятся координаты пользовательских зон? В файле задания я их что-то не увидел.
 

В файле проекта поищите по тегу <splines>.  Вот только они в координатах исходного, а не выходного изображения, и перевести их туда довольно сложно.  В принципе я готов продублировать их в нужных координатах, но только после того, как у вас будет готова программа для работы с ними.  А иначе может получиться что я добавлю костыль, который так никому и не понадобится.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:09 24-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
1. Нет ли у вас мыслей по поводу возможности использования многоядерных процессоров наподобие того, как это сделано в FR9+?  
Для этой цели сначала хотел было запустить две копии ST для одного проекта и в первой сделать вывод с начала списка, а во второй - с середины. Но вовремя понял, что в этом случае будет невозможно без дополнительных программных ухищрений сохранить в проект информацию о зонах полученную копиями программ с обеих половин списка...  
 
2. Есть ли возможность сделать применение значения полей на стадии макет страницы не во время их редактирования, а по Enter или по потере этим полем фокуса? Допустим, мне нужно поменять значение 10 на 7 - я удаляю 0, жду пока завершится пересчет, удаляю 1, опять жду, и только потом могу ввести 7... (касается самых высоких и широких страниц).
 
 
Добавлено:
Хотя, по идее, для склейки двух подпроектов достаточно будет в банальном текстовом редакторе объединить соответствующие куски filters-output, так ведь?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 13:51 24-12-2009 | Исправлено: StanFreeWare, 13:52 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Нет ли у вас мыслей по поводу возможности использования многоядерных процессоров наподобие того, как это сделано в FR9+?  
Для этой цели сначала хотел было запустить две копии ST для одного проекта и в первой сделать вывод с начала списка, а во второй - с середины. Но вовремя понял, что в этом случае будет невозможно без дополнительных программных ухищрений сохранить в проект информацию о зонах полученную копиями программ с обеих половин списка...  

Я считаю распараллеливание по ядрам процессора неперспективным подходом.  Гораздо более перспективно - использовать видеокарту для вычислений.  На видеокарте вычислительных блоков гораздо больше, чем ядер на процессоре, и вполне реально ускорить тот или иной алгоритм раз в 20-30.  Я эту цифру не из головы взял - мы на работе используем видеокарты для вычислений.  Плюс если использовать OpenCL - то он может использовать и ядра процессора, если нет поддержки от видюхи.  Конечно алгоритмы должны быть параллелизуемы, но самые тяжелые алгоритмы в ST как раз такие.  Так или иначе, до этого дело дойдет еще не скоро, что даже хорошо - к тому времени даже встраиваемые видюхи будут поддерживать вычисления общего назначения.
 

Цитата:
2. Есть ли возможность сделать применение значения полей на стадии макет страницы не во время их редактирования, а по Enter или по потере этим полем фокуса? Допустим, мне нужно поменять значение 10 на 7 - я удаляю 0, жду пока завершится пересчет, удаляю 1, опять жду, и только потом могу ввести 7... (касается самых высоких и широких страниц).  

Теоретически возможно, но довольно сложно.  Думаю оно того не стоит, особенно учитывая, что эту операцию обычно делают только на одной странице книги, после чего применяют настройки ко всем остальным страницам.  Можно еще делать даблклик перед редактированием, чтобы засветить все цифры.
 
 
Добавлено:

Цитата:
Хотя, по идее, для склейки двух подпроектов достаточно будет в банальном текстовом редакторе объединить соответствующие куски filters-output, так ведь?

Попробуйте, хотя я не уверен что такое прокатит.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:18 24-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
В файле проекта поищите по тегу <splines>.

Ну это я видел, конечно. Только вот почему координаты зон не убираются из файла, если зону убрать в СТ, и сохранить проект?
 
Добавлено:

Цитата:
костыль, который так никому и не понадобится.

Нужен разделённый вывод - т.к. вручную расставлять Picture-зоны в СК - легче повеситься. А вот как его сделать - тут возможны варианты. Идеально - Вам его сделать. А пока что мне нужно самому делать алгоритм заливки - да ещё чтобы он работал точно также, как Ваш...

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:51 24-12-2009 | Исправлено: monday2000, 14:59 24-12-2009
Alfizik

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000, скажите пожалуйста умеет ли Scan Tailor работать с серыми сканами (преобразовывать их в черно белые, чтоб черные пятна не поглощали буквы текста)?

Всего записей: 199 | Зарегистр. 14-12-2006 | Отправлено: 15:14 24-12-2009 | Исправлено: Alfizik, 15:14 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alfizik
Умеет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:23 24-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Попробуйте, хотя я не уверен что такое прокатит.

Попробовал, прокатило, распараллелил на два ядра. Вывод 2 часа вместо 4х часов. Правда рекомендовать всем такой метод сложно - не каждый найдет в xml-файле проекта цепочку преобразований от имени файла изображения до идентификатора данной страницы  на выводе. С другой стороны, если не нужно в конце вывода сохранять проект - например, в случае вывода одной из составляющих при уже заданных ранее зонах - то вполне себе можно просто запускать N скантэйлоров (по количеству ядер) на свой диапазон страниц. Возможно, тут пригодилась бы возможность делать вывод только для выбранных на ленте страниц.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 17:20 24-12-2009
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
сложно..., а не проще оптимизировать работу ядер программой (например) Ashampoo Core  
Tuner
4 часа..., - это сколько страниц? Что то слишком много время уходит

Всего записей: 1132 | Зарегистр. 15-01-2005 | Отправлено: 18:02 24-12-2009 | Исправлено: Dashout, 18:03 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Такая просьба: для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего, но при этом сканы не должны быть совсем чистыми, на которых удалять нечего.  Чем грязнее, тем лучше, но не настолько, чтобы пятна грязи сливались и доходили до размеров букв - такие у меня как раз есть.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:44 24-12-2009
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
для тестирования нужны сканы, на которых ST'шный despeckle удаляет лишнего,

http://www.onlinedisk.ru/file/302860/

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 19:16 24-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olive77
Слишком стерильные сканы - там нечего чистить.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:47 24-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout

Цитата:
Ashampoo Core Tuner  

А вы сами пробовали ею пользоваться в контексте СТ? Было бы интересно получить реальные результаты сравнения с утилитой и без нее..
Процессор AMD слабенький двухядерник ноутбучный Turion TL-56.  Книжка грязненькая такая 200 dpi, 900 страниц... В общем был повод задуматься об увеличении производительности.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 19:50 24-12-2009
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
а какой смысл засекать время? надо оптимизировать загрузку процессоров, загрузка - это и есть работа (в данном случае СТ). Что касается утилиты, то безусловно она нужна  

 
 
 
Добавлено:
P.S. это снимок с экрана при работе СТ на стадии обработки полезной области.

Всего записей: 1132 | Зарегистр. 15-01-2005 | Отправлено: 23:53 24-12-2009 | Исправлено: Dashout, 23:54 24-12-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru