Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Arceny



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Код:
arceny@Metal-Alpha:~/Src/scantailor $ cmake .
-- Checking pthreads with CFLAGS="-pthread" and LIBS="-pthread" -- yes
CMake Error: The following variables are used in this project, but they are set to NOTFOUND.
Please set them or make sure they are set and tested correctly in the CMake files:
JPEG_LIBRARY
    linked by target "scantailor" in directory /home/arceny/Src/scantailor
    linked by target "imageproc_tests" in directory /home/arceny/Src/scantailor/imageproc/tests
    linked by target "tests" in directory /home/arceny/Src/scantailor/tests
TIFF_LIBRARY
    linked by target "scantailor" in directory /home/arceny/Src/scantailor
    linked by target "imageproc_tests" in directory /home/arceny/Src/scantailor/imageproc/tests
    linked by target "tests" in directory /home/arceny/Src/scantailor/tests
 
-- Configuring done
 

 
libjpeg-dev стоит
 
В последней версии из svn. Кстати как полностью очистить сгенерированые cmake'ом Makefile'ы ? какой нибудь cmake clean не прокатывает...

Всего записей: 27 | Зарегистр. 17-01-2009 | Отправлено: 14:53 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
При выводе в TIFF надо явно прописывать тег 262 - Photometric Interpretation (в данном случае надо в Photometric Interpretation записывать 0.0), иначе просмоторщик XnView показывает негатив.

Тэг этот я прописываю, просто раньше для черно-белых картинок прописывал PHOTOMETRIC_PALETTE и естественно при этом прописывал черно-белую палитру.  Потом выяснилось, что многие проги такой комбинации не понимают.  Теперь явно проверяю цвета, и если там действительно черный и белый - прописываю PHOTOMETRIC_MINISWHITE.  Это изменение совсем недавно внес, в последней бете его еще нет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:59 21-01-2009
Arceny



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Update: помог ccmake . с ручным указанием пути до либ....
 
Но:

Код:
make[2]: *** Нет правила для сборки цели `/usr/lib/libtiff.so', требуемой для `scantailor'.  Останов.
make[1]: *** [CMakeFiles/scantailor.dir/all] Ошибка 2
make: *** [all] Ошибка 2
 

 
Указаны были /usr/lib/libjpeg.so и /usr/lib/libtiff.so

Всего записей: 27 | Зарегистр. 17-01-2009 | Отправлено: 15:07 21-01-2009 | Исправлено: Arceny, 15:10 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
libjpeg-dev стоит  

В данном случае он не может найти саму библиотеку, а не хэдеры.  Либо она у вас лежит в нестандартном месте, либо нестандартно называется.
В принципе можно прописать полный путь вручную, вызвав cmake в интерактивном режиме:
ccmake .
Как найдете эти либы, отпишите, в чем там дело было.  Возможно надо альтернативные имена или пути прописать в систему сборки.
 

Цитата:
Кстати как полностью очистить сгенерированые cmake'ом Makefile'ы ? какой нибудь cmake clean не прокатывает...

Явный вызов cmake перегенерирует все Makefile'ы, а если вы хотите убрать вообще все, что нагенерировал CMake, то тогда надо использовать out-of-source build:
1. Создаете в исходникак поддиректорию build (в принципе она может быть и за пределами дерева исходников).
2. В этой директории делаете "cmake .." и потом "make".
Теперь в директорию с исходниками ничего писаться не будет, а директорию сборки можно в случае чего польностью очистить.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:12 21-01-2009
Arceny



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Кажется разобрался.
 
Ссылки libtiff.so и libjpeg.so были почему-то битыми, помогла переустановка пакетов.
 
Библиотека libjpeg ссылку не создала автоматически, в моей системе установленный файл зовётся /usr/lib/libjpeg.so.62 (Debian Lenny).  
 
libtiff ссылку пересоздал....
 
После этого собралось нормально
 
Добавлено:
Не совсем понял как работает функция коррекции DPI.
 
Описываю последовательность действий.
Был файл png полученный с помощью xsane, сканированный в 300 dpi.
Он был обрезан в gthumb и сохранён опять же в PNG. Информация о dpi потерялась видимо.
При открытии в ST был задан запрос о dpi. Я указал 300*300.
Что в итоге имеем: на выводе очень долгие операции и огромный по разрешению файл. 5654 вместо положеных 1847 пикселей (апскейл до 600 dpi не делал)
 
То есть либо мне при старте надо было указывать другое значение (какое?) либо что-то  работает некорректно.
 
Добавлено:
Ещё не понял чем отличается вкладка "нужно исправить" от "все страницы" в диалоге изменения dpi
 
Добавлено:
Вот прикладываю ссылку на архив с 3мя тестовыми png:
http://narod.ru/disk/5129988000/scans-tmp.tar.bz2.html
P.S. Писано не моею рукою За корявый подчерк не бить.

Всего записей: 27 | Зарегистр. 17-01-2009 | Отправлено: 15:23 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Был файл png полученный с помощью xsane, сканированный в 300 dpi.
Он был обрезан в gthumb и сохранён опять же в PNG. Информация о dpi потерялась видимо.
При открытии в ST был задан запрос о dpi. Я указал 300*300.
Что в итоге имеем: на выводе очень долгие операции и огромный по разрешению файл. 5654 вместо положеных 1847 пикселей (апскейл до 600 dpi не делал)  

А сколько пикселей было в исходном изображении?
 

Цитата:
Ещё не понял чем отличается вкладка "нужно исправить" от "все страницы" в диалоге изменения dpi  

"Нужно исправить" - в этом списке только те файлы, где DPI совсем не указан, либо явно неправильный.  "Все страницы" - в этом списке все файлы, и с DPI и без.  Это чтобы можно было указав один DPI, потом передумать и указать другой - из первого списка при указании DPI файл убирается.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:46 21-01-2009
Arceny



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Я там приложил тестовые файлы

Всего записей: 27 | Зарегистр. 17-01-2009 | Отправлено: 15:48 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пофиксил проблемы с DPI.
 
Вот еще бы воспроизвести проблему с пропаданием контента на выводе, и тогда можно следующую бету выпускать.  А на днях выложу в SVN новый алгоритм автовыделения рамки контента.  Он справляется даже с бинарным мусором, который наезжает на буквы (при условии что наезжает не по всей длине / высоте страницы).  Это уже будет повод для оффициального релиза.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:43 21-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Пофиксил проблемы

Ну, при таком подходе к делу, появилось желание поучаствовать в сборке. Как я понял Qt4 неофициально поддерживается Visual. Что нужно скачать и как компилить? Все таки под Винды Visual ИМХО даст наилучший по быстродействию и надежности вариант.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 18:06 21-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Размышление представителя бывшей "ск-колхозной" мафии, как кое-кто тут выразился
Сегодня попробовал сделать полностью книгу с помощью СТ. Книга "тяжелая" - старая, желтая, плохо пропечатанная.
Сделать целиком я ее не смог, т.к. несколько раз был вылет (на пустых страницах, и при mixed mode на страницах где не было картинок). Но это мелочь.  
Результат работы в целом мне очень понравился. Сработало хорошо (хотя наверное тут больше заслуги U235) Otsu неплохо справился, но добавив еще порога (порядка 10-20) , вышло еще лучше (добавлял в ск). Так часто бывает: автоматика срабатывает неплохо, но ручной "юстировкой"-доводкой можно сделать еще лучше. Поэтому мне не очень понятна категоричность, с какой автор не хочет дать пользователю (продвинутому) самому под конец обработки пошалить ручками Например, это могло бы быть не абсолютное значение порога, а некоторое отклонение от того, что вычислил Otsu. Полная автоматика - это конечно хорошо (для подавляющего числа пользователей), но для тех, кто стремится делать с максимальным качеством, нужно предусмотреть такую возможность.
Автор почему-то не спешит реализовывать мелочи (типа добавить в уже готовое задание сканы), но IMHO, как-раз таки мелочи нужно делать сразу же по мере их вскрытия и забыть про них. Например, типичная ситуация (для тех, кто сам сканит; видимо, автор к ним не относится): отсканил, сделал задание, обработал и по ходу дела увидел, что при сканировании пропустил какие-то страницы (у меня так практически всегда выходит). И что теперь делать? По новой задание составлять? Подумайте над этим.
 
   

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 18:14 21-01-2009 | Исправлено: bolega, 18:17 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну, при таком подходе к делу, появилось желание поучаствовать в сборке. Как я понял Qt4 неофициально поддерживается Visual. Что нужно скачать и как компилить? Все таки под Винды Visual ИМХО даст наилучший по быстродействию и надежности вариант.

Поддерживается то оно поддерживается, но моя система сборки пока поддерживает только MinGW.  Добавить поддержку MSVC вполне реально, но для этого вам придется разобраться в CMake.  Впрочем больших сложностей там не будет - я и советом могу помоч, и даже кое-каким кодом - у меня есть один заброшенный проект на CMake, в котором поддерживается MSVC.  Начать надо с файла packaging/windows/build_deps/CMakeLists.txt - он управляет сборкой зависимостей.
 
Добавлено:
bolega

Цитата:
Автор почему-то не спешит реализовывать мелочи (типа добавить в уже готовое задание сканы), но IMHO, как-раз таки мелочи нужно делать сразу же по мере их вскрытия и забыть про них.

До сих пор были более приоритетные задачи (на мой взгляд).  Вот сейчас доведу до ума автовыделение рамки контента, и после этого займусь этими самыми мелочами.
 

Цитата:
Поэтому мне не очень понятна категоричность, с какой автор не хочет дать пользователю (продвинутому) самому под конец обработки пошалить ручками Например, это могло бы быть не абсолютное значение порога, а некоторое отклонение от того, что вычислил Otsu.

Я не против такой фичи в принципе, просто не считаю ее высокоприоритетной.  Ну а пока я не увидел примера, где ручной порог заметно улучшает качество, приоритет у этой задачи нулевой.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:17 21-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
я и советом могу помоч, и даже кое-каким кодом - у меня есть один заброшенный проект на CMake, в котором поддерживается MSVC.
Так в чем дело? Давайте, втолковывайте. Только учтите, что программированием я занимаюсь изредка и очень редко (это типа хобби). По профессию я э ... не буду говорить, чтобы не приняли меня за динозавра (я самый молодой среди них )
Цитата:
Ну а пока я не увидел примера, где ручной порог заметно улучшает качество,
Зря, тут bolega 100% прав. Варьируя порог получаешь жирность по вкусу - например, я предпочитаю пухленьких

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 18:43 21-01-2009 | Исправлено: Arcand, 18:50 21-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Ну а пока я не увидел примера, где ручной порог заметно улучшает качество, приоритет у этой задачи нулевой.

Вы рассуждаете как человек, который уже обработал как минимум книг 100-200. Уважаю...
А как в СТ можно в принципе это увидеть? Если нет возможности играться порогом.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 18:52 21-01-2009
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Воспроизвел.  Значит скоро исправлю.  
 
Добавлено:  
Исправил.

   
Где можно потестить?

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 18:56 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Так в чем дело? Давайте, втолковывайте. Только учтите, что программированием я занимаюсь изредка и очень редко (это типа хобби). По профессию я э ... не буду говорить, чтобы не приняли меня за динозавра (я самый молодой среди

Хм, ну давайте начнем.  Сразу предупреждаю, что процесс будет долгим.
В исходниках СТ, делаем копию директории packaging/windows/build_deps.  Обзовем ее скажем msvc_build_deps.  Потом возможно опять объединим их.
Там в CMakeLists.txt комментируем строку ST_SET_DEFAULT_GCC_FLAGS()
 
Теперь читаем packaging/windows/readme.ru.txt (файл в кодировке UTF-8), и следуя инструкциям, с поправкой на то, что не используем MinGW, пытаемся добраться до шага 7.  Как доберетесь, скажу что делать дальше
Qt я думаю можно взять и MinGW'шную - ее так и так пересобирать, но хоть тулзы уже будут готовые.
 

Цитата:
Зря, тут bolega 100% прав. Варьируя порог получаешь Жирность по вкусу - например, я предпочитаю пухленьких  

Ну так продемонстрируйте мне это на конкретном примере.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:57 21-01-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Варьируя порог получаешь жирность по вкусу - например

Именно, по вкусу. Правильное слово. Нельзя писать программу, исходя из того, что пользователь - среднестатистический болван, которому ничего позволять нельзя.

Всего записей: 4443 | Зарегистр. 09-09-2002 | Отправлено: 18:59 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Где можно потестить?

Единственный сборщик у нас на данный момент denver 22, придется ждать его.  Сам я не могу собрать виндовую версию - под рукой только старый PowerPC iBook.
 
Добавлено:

Цитата:
Именно, по вкусу. Правильное слово. Нельзя писать программу, исходя из того, что пользователь - среднестатистический болван, которому ничего позволять нельзя.

Я несколько лет использовал OSX в качестве основной ОС, так вот с тех пор я склонен считать, что чем больше в программе опций и настроек - тем хуже.  Конечно что нужно - то нужно, а от остального лучше избавиться.  Вот вам пример простоты в OSX:
Двойной клик по архиву сразу начинает его распаковку в текущую директорию.  Если в архиве было несколько элементов верхнего уровня - он их завернет в отдельную папку, если только один - не будет заворачивать.  А что в Windows что в Linux приходится делать Right Click -> Extract Here.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:00 21-01-2009
savage2000

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Если СТ и дальше будет развиваться без родного хелпа - то ИМХО одно это достаточное основание для иной альтернативы. См. на СК как пример.

Пример неудачный. В СК трудно освоиться на чисто интуитивном уровне, в СТ же это - без проблем (за что Tulon'у большое спасибо!). Так что если для СК хелп - это почти необходимое условие для нормальной работы, то для СТ хелп - почти необязательное приложение (возможно, что только пока).

Цитата:
Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения.

Если программа сделана энтузиастом, бесплатна и к тому же выложена с исходниками, то именно собственное желание разработчика имеет первостепенное значение. Не нравится - можете со своими "собственное хочу/не хочу уже не имеет никакого значения" идти искать другой вариант.

Цитата:
я давно естественным образом утратил к СТ хоть какой-либо интерес - раз уж там нет того, что мне хотелось бы там обязательно увидеть.

Ну тогда чего же вы здесь пишите? Я, например, тоже утратил интересы к многим десяткам программ, но ведь не хожу по соответствующим топикам, не капаю на мозги заявлениями типа "Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения" и "Я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу и ещё раз посмотреть, что она такое есть".

Всего записей: 102 | Зарегистр. 07-12-2002 | Отправлено: 19:26 21-01-2009 | Исправлено: savage2000, 19:28 21-01-2009
Arceny



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
Ну, при таком подходе к делу, появилось желание поучаствовать в сборке. Как я понял Qt4 неофициально поддерживается Visual. Что нужно скачать и как компилить? Все таки под Винды Visual ИМХО даст наилучший по быстродействию и надежности вариант.

Вам нада использовать коммерческую версию библиотеки, качать можно тут: http://torrents.ru/forum/viewtopic.php?t=1260002
Если торрент не устраивает то могу выложить куда нибудь на http шару ( и соответственно используемую версию Visual Studio скжаите )

Всего записей: 27 | Зарегистр. 17-01-2009 | Отправлено: 19:30 21-01-2009 | Исправлено: Arceny, 19:39 21-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вам нада использовать коммерческую версию библиотеки, качать можно тут: http://torrents.ru/forum/viewtopic.php?t=1260002
Если торрент не устраивает то могу выложить куда нибудь на http шару

Я какое-то время назад проверял, и обнаружил, что открытая версия поддерживает сборку с MSVC.  То есть Qt'шный configure.exe его опознает (если он в PATH) и генерирует Makefile'ы для nmake.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:36 21-01-2009 | Исправлено: Tulon, 19:38 21-01-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru