Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хм, я качал по той же ссылке, и у меня получилось 556.  Может оборванный download?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:13 26-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не пойму в чем ошибка при компиляции: http://paste.org/pastebin/raw/13597

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 23:44 26-12-2009 | Исправлено: denver 22, 23:45 26-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробуйте собрать на родном линуксовом разделе.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:56 26-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Теперь всё собралось. Спасибо за помощь. Программа запустилась.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 01:13 27-12-2009 | Исправлено: denver 22, 01:14 27-12-2009
vkni

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
 
Извините, что подоспел к шапочному разбору. Я держу rpm-ку Scantailor'а для ALT Linux в актуальном состоянии (последняя стабильная версия). Если вам нужно собрать rpm-ку для другого дистрибутива, мою можно использовать в качестве базы - http://sisyphus.ru/ru/srpm/Sisyphus/scantailor смотрите вкладку Загрузить.

Всего записей: 9 | Зарегистр. 02-10-2007 | Отправлено: 20:18 27-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vkni
Спасибо за предложение. У меня собралось нормально. Проблемы были странного характера, не относящиеся напрямую к сборке. По крайней мере буду знать, что если меня "дернет" все таки установить ALT Linux 5.0 KDE, то собирать программу мне не придется .
P.S. К тому же я новичок в сборке пакетов и все равно не знаю что значит "использовать в качестве базы" (можете не отвечать, дабы не я не стал причиной засорения топика).

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 21:46 27-12-2009
vkni

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
> У меня собралось нормально.
 
У меня всегда в rpm собирался без малейших проблем. Пару раз были глюки, когда я собирал не "начисто".
 
> не знаю что значит "использовать в качестве базы"
 
Rpm пакет собирается из архива с текстом программы с помощью инструкции по сборке, записанной в "файле спецификации", оно же .spec или спек. Из-за зоопарка rpm'ок ALT'овская сборка может не подойти к вашему RPM дистрибутиву. И чтобы собрать rpm-ку для него, нужно взять исходники моей rpm-ки и подправить .spec файл для вашего дистрибутива.
 
Разумно ещё попробовать собрать в вашей системе rpm файл из srpm файла (в нём хранятся тексты программы и spec) - ftp://ftp.altlinux.org/pub/distributions/ALTLinux/Sisyphus/files/SRPMS/scantailor-0.9.7.2-alt1.src.rpm
 
Если отличия в rpm-ах у вас и у ALT не велики, оно соберётся и вы получите нормальный scantailor-0.9.7.2-alt1.rpm
для вашей системы.

Всего записей: 9 | Зарегистр. 02-10-2007 | Отправлено: 23:43 27-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я вот думаю, выпускать версию 0.9.7.3 или не выпускать, или как-нибудь потом.  В Git уже давно исправлены (надеюсь последние) два падения: при удалении всех страниц из проекта (может упасть, а может и не упасть) и при скармливании ST картинки 1x1 пиксель (тут падение гарантировано).  С одной стороны неохота делать релиз только из-за этих двух мелких проблем, а с другой - неприятно почти ежедневно получать краш репорты.
 
Кстати за последний месяц в среднем выходило под сотню скачиваний.  Это результат статьи в SourceForge Community Blog, а также упомянания в статье на Wired.com.  Помню потратил больше часа, отвечая на вопросы от Wired.com, а в статью попало ровно два предложения от меня.  Ну хоть что-то.
 
В последнее время работа идет медленно.  Над despeckling'ом работал очень мало - что-то настроения нет.  Время от времени экспериментирую с исправлением геометрических искажений.  Алгоритм Rob'а как выяснилось работает только в очень простых случаях.  От моих экспериментов пока практических результатов нет, впрочем Rob и со своей стороны работает над его улучшением.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:18 28-12-2009 | Исправлено: Tulon, 00:19 28-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я смотрел результаты его работы на английском форуме - впечатлили (как не профессионала конечно). Видел, что и Вы добавили чекбокс для выравнивания. Но наверное он ещё не скоро появится как работающий. А если внедрите алгоритм Rob'а, то может и сборку выложите? Пусть будет только на простых случаях работать. Зато сможем локально - вручную применительно к отдельным сканам - применять. Может и идеи кто тут подкинет для алгоритма...

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:43 28-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
А если внедрите алгоритм Rob'а, то может и сборку выложите?

В Git он есть - первый вариант алгоритма.  Работает правда только в черно белом режиме, и редко кодга правильно срабатыват.  Недавно Rob выложил второй вариант - пока только на Java.  Его я еще не смотрел.  Думаю нет пока смысла делать сборку с первым вариантом, когда уже есть протоип второго.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:55 28-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
А вы добавьте на 4 этапе ссылку на самую широкую и высокую страницы без учета полей, и благодаря новой фиче появится смысл в выпуске новой версии... ссылка
 
На Wired.com они чуток поторопили события -  Scan Tailor can ... process all of the images into a single file. Хотя.. практически не осталось для этого препятствий. Более того, есть все предпосылки (чем мучать тифки многостраничностью). Только нужно нормальный какой-нибудь алгоритм против растра засунуть (ну или гауссом его фильтровать).
 
Добавлено:
Кстати, благодаря возможности свободного перемещения изображения при нажатом shift необходимость в использовании на 5 этапе внутренней рамки как способа изменения полей в случае  

Цитата:
Не так все просто. Как вы собираетесь тянуть внешнюю линию для расширения полей, если она и так у края экрана?  

уже не столь очевидна. Может быть, все-таки пусть полезную область позволяет править?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:12 28-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может и с опозданием, но лучше поздно, чем...
(кусок новости)
"Подведены итоги конкурса свободных разработок России"
- Помимо официальной тройки победителей конкурса в каждой из номинаций, экспертное жюри отметило высокий уровень следующих свободных проектов:
Scan Tailor – интерактивный инструмент для пост-обработки сканированных страниц
 
Tulon
Искренне поздравляю с общественным признанием Вашей работы!

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:59 28-12-2009 | Исправлено: denver 22, 12:00 28-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
А вы добавьте на 4 этапе ссылку на самую широкую и высокую страницы без учета полей, и благодаря новой фиче появится смысл в выпуске новой версии...

Если я взялся за одно большое дело, то лучше в это время не отвлекаться на другие.  Это все равно, что начав готовить еду, решить вдруг приостановить это дело, и сначала сделать уборку.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:44 28-12-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Возникла потребность задать более высокий порог бинаризации, нежели позволяет соответствующий ползунок. Не подскажете, насколько сложно будет расширить диапазон допустимых значений и какие именно файлы нужно смотреть?
 
И еще вопрос: на этапе разрезки страниц можно применить выбранный тип разреза ко всем страницам или определенному их подмножеству, после чего СТ останется только определить позицию резака. Но если выбран тип "одиночная страница без огрызка", то определять уже нечего, так что по идее следовало бы сразу же пометить соответствующие страницы как обработанные и больше ничего на них не делать. Вместо этого СТ всё-таки ищет линию разреза и иногда ее находит, тем самым игнорируя явно указанное пользователем предпочтение. Как-то нелогично это.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 14:02 28-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
Возникла потребность задать более высокий порог бинаризации, нежели позволяет соответствующий ползунок. Не подскажете, насколько сложно будет расширить диапазон допустимых значений и какие именно файлы нужно смотреть?

Диапазон значений прописан прямо в UI файле: filters/output/ui/OutputOptionsWidget.ui
Можно его открыть в Qt Designer, но проще - в обычном текстовом редакторе (только не notepad, и не Word'ы всякие - рекомендую Notepad++), и сделать поиск по -15
 

Цитата:
И еще вопрос: на этапе разрезки страниц можно применить выбранный тип разреза ко всем страницам или определенному их подмножеству, после чего СТ останется только определить позицию резака. Но если выбран тип "одиночная страница без огрызка", то определять уже нечего, так что по идее следовало бы сразу же пометить соответствующие страницы как обработанные и больше ничего на них не делать. Вместо этого СТ всё-таки ищет линию разреза и иногда ее находит, тем самым игнорируя явно указанное пользователем предпочтение. Как-то нелогично это.

Ну то, что вопросительный знак появляется, это мелкая недоработка, которая по идее не должна влиять ни на работу в целом, и даже на производительность.  А вот этого "СТ всё-таки ищет линию разреза и иногда ее находит" происходить не должно, и у меня не происходит.
Версия ST последняя?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:22 28-12-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Версия ST последняя?

 
Последний релиз, т. е. не git. Ладно, при случае посмотрю еще раз, и если воспроизведется -- напишу.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 14:35 28-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
подтверждаю,если все стоит на автомате (допустим сразу запускаю на полезную зону)и скан отличный одностраничный,некоторые картинки (1-2 на 100) разбиваются с огрызком слева,из-за чего на правом остатке может слева съестся пару букв.Если вручную поставить одностраничный режим - все нормально вплоть до макета страницы.

Всего записей: 1450 | Зарегистр. 02-08-2008 | Отправлено: 14:52 28-12-2009 | Исправлено: alpopo, 14:54 28-12-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Аналогично подтверждаю. Раньше вроде этого не было. И сейчас думал. что у меня сканы такие "особенные", что программа спотыкается. А оказывается - у многих.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 14:55 28-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo

Цитата:
подтверждаю,если все стоит на автомате (допустим сразу запускаю на полезную зону)и скан отличный одностраничный,некоторые картинки (1-2 на 100) разбиваются с огрызком слева,из-за чего на правом остатке может слева съестся пару букв.Если вручную поставить одностраничный режим - все нормально вплоть до макета страницы.

У anagnost96 ситуация другая.  Там речь шла о том, что после применения типа разреза "страница целиком" к группе страниц, на некоторых их них все равно ищется и находится линия разреза - чего быть не должно.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:58 28-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
"Подведены итоги конкурса свободных разработок России"  

Вот линк: http://ruformator.ru/news/article05F94/default.asp
 
Добавлено:
ИМХО основание для восстановления статьи об СТ в Википедии (но не факт).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:28 28-12-2009 | Исправлено: monday2000, 17:37 28-12-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru