Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Неправильный DPI -- очень возможно. Теперь ясно, что это очень важный параметр. Но вычислить его бывает проблематично, если размеры книги неизвестны, а скан -- это фотографии.  

Тут кто-то давал совет по определению DPI.  Открываете файл в графическом редакторе (Gimp подойдет), выделяете прямоугольник так, чтобы в него попало 6-7 строк текста.  Высота прямоугольника в пикселях как раз и будет примерным DPI.
 

Цитата:
Да и Photoshop тоже по умолчанию сохраняет в *.tif

Ну сохраняют Irfan и Photoshop по умолчанию в *.tif а не *.tiff, но где проблема то?  Открыть они *.tiff файл могут, по Ctrl+S сохранят изменения, что еще надо?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:43 02-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Еще было бы очень здорово иметь возможность удалять (не учитывать) определенные самые высокие/широкие страницы при вычислении мягких полей.

По хорошему отключение опции "Выровнять с другими страницвми" должно давать такой результат, но почему-то не дает.  То ли я просто об этом не подумал, когда ее реализовывал, то ли на потом отложил.  На днях посмотрю, насколько сложно будет реализовать такое поведение.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:37 03-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
но где проблема то?

Проблема в том, что нет ластика. Поэтому я использую панель редактирования Irfan. Irfan открывает *.tiff, но сохраняет только *.tif. Потом приходится запускать массовое переименование через коммандер. Поэтому я и попросил о небольшом упрощении своей жизни. Если это сделать нельзя -- жалко, но не фатально.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 01:40 03-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Irfan открывает *.tiff, но сохраняет только *.tif

А как вы сохраняете?  Я так полагаю (проверить пока не могу), что Ctrl+S должен сохранять под оригинальным именем и расширением.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:46 03-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как вы сохраняете?  

Сохраняю Ctrl+S (Save). Сохраняет tif вместо tiff. При попытке указать расширение получаются файлы с расширением tiff.tif

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 07:06 03-04-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
У СТ исходники открыты - есть желающие сделать такой плагин на основе кода из СТ?  
Скоро не обещаю, завяз с плагином выделения рисунков. Сам код выделения готов, но засада - Filter plugin не поддерживает редактирование/создание выделения, вынужден разбираться с Selection plugin.
Желательна ссылка на код деспекла, чтобы не терять время на его поиск.
И еще, как-то Вы говорили о сглаживании букв. Можно еще раз, по возможности поподробнее.
Хотелось бы иметь и такой плагин, но подходящего алгоритма у меня пока нет.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 08:39 03-04-2009 | Исправлено: Arcand, 08:41 03-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Желательна ссылка на код деспекла, чтобы не терять время на его поиск.  

Despeckle.h
Despeckle.cpp
Есть у этого кода кое-какие еще зависимости, например от класса ConnectivityMap из директории imageproc, но в общем зависимостей минимум.
 

Цитата:
И еще, как-то Вы говорили о сглаживании букв. Можно еще раз, по возможности поподробнее.
Хотелось бы иметь и такой плагин, но подходящего алгоритма у меня пока нет.

У меня используются два вида сглаживания:
1.  Фильтр Savitzky-Golay на сером изображении.
2.  Удаление зазубрин на черно-белом.
 
Реализацию фильтра Savitzky-Golay ищите в imageproc/SavGolFilter.{cpp,h} и imageproc/SavGolKernel.{cpp,h}  Зависимостей почти нет.
Удаление зазубрен зарыто глубоко в файле filters/output/OutputGenerator.cpp - функция morphologicalSmoothInPlace().  И вот она как раз тянет довольно длинную цепочку зависимостей.
 
Добавлено:
Кстати сделал чтобы страницы с выключенным выравниванием не влияли на мягкие поля других страниц.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:47 04-04-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А с DjVu Small вообще странный глюк (это, наверное, не к Вам, но все же) -- не хотел писать файлы в список обработки, оказалось, не выносит подстроки "pic" (!).  

Это не глюк. Инструкцию надо читать. Сбросьте флажок "Omit SK5.91 sep-files" в опциях - и этот "глюк" уйдёт.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:07 06-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сбросьте флажок "Omit SK5.91 sep-files" в опциях

2 Tulon: так может быть, тогда сохранять все же файлы без подстроки "pic" и с расширением "tif"? Наверное, сильно менять код для этого не потребуется? Пожалуйста...

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 09:19 06-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512
Нет нужды в этом!

Всего записей: 6525 | Зарегистр. 31-08-2008 | Отправлено: 09:37 06-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
2 Tulon: так может быть, тогда сохранять все же файлы без подстроки "pic" и с расширением "tif"? Наверное, сильно менять код для этого не потребуется? Пожалуйста...

Идея убирать *pic* мне совершенно не нравится.  Не СТ его туда добавляет и не СТ на них глючит.  К тому же как оказывается это фича такая, хотя на мой взгляд криво реализованная.
Что касается *.tif вместо *.tiff - вы сначала попробуйте сообщить об ошибке авторам Irfan'а - в конце концов проблема именно там.  Если открыт файл *.tiff, то будь добр по Ctrl+S сохранить туда же, а не создавать новый файл *.tif.  Может пофиксят эту проблему, и менять ничего не придется.
 
Кстати купил новый ноут, так что с визуальными проблемами скоро разберусь.
 
Добавлено:
Насчет визуальных проблем; скроллбар на списке стадий у меня и в винде не хочет воспроизводится.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:52 06-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большое спасибо за ответ.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 02:38 07-04-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Кстати купил новый ноут, так что с визуальными проблемами скоро разберусь.

Да уж пока эти E-Ink читалки разовьются до нормального размера-качества, тут ноги протянешь - т.е. в плане чтения DjVu-книг. Одна надежда - купить ноутбук и там их и читать... Жаль только, что клавиатуру там не отстегнёшь.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:08 07-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемые, быть может добавить в шапку
RSS ленты:
 
http://scantailor.wiki.sourceforge.net/space/xmla?v=rss_2_0
SourceForge : scantailor - all changes
Всяческие изменения на сайте, в частности:
scantailor : Сборка из исходников под Linux
 
 
http://sourceforge.net/export/rss2_keepsake.php?group_id=227253
SourceForge.net - Recent activity for project: scantailor
Всяческие изменения бета-версий, в частности:
jart committed revision 328 to the Scan Tailor SVN repository, changing 3 files
 
 
 
http://sourceforge.net/export/rss2_projfiles.php?group_id=227253
Информация о релизах:
SourceForge.net: Project File Releases: Scan Tailor

Всего записей: 6525 | Зарегистр. 31-08-2008 | Отправлено: 09:55 11-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос почему бы не сделать ST c "shared dll" ?
 
http://www.smlabs.net/tsmuxer.html
3mb static dll
300k shared dll

Всего записей: 6525 | Зарегистр. 31-08-2008 | Отправлено: 16:14 11-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Уважаемые, быть может добавить в шапку  
 RSS ленты:  

Для конечных пользователей может быть интересна разве что последняя лента - информация о релизах.  Кстати SourceForge может и по мылу оповещать о них.  Если зайти на сайт, оттуда на SourceForge Project Page -> Download -> Browse All Packages, то там иконки с конвертом - это как раз подписка на оповещение о релизах.
 

Цитата:
Вопрос почему бы не сделать ST c "shared dll" ?  

 То есть разделить пакет на две части - сама программа и библиотеки.  Экономия будет только при обновлениях, а гемороя значительно прибавится - и пользователям, и мне.  Например когда я захочу обновить какую-либо из этих библиотек, то придется писать на странице закачки: "если вы скачивали пакет с dll'ками до такого-то числа", значит вам нужно их обновить".  Кстати в первый раз качать придется больше, чем сейчас - поскольку исполнительный файл + dll'ки будут всяко больше, чем статически скомпилированный исполнительный файл.  В общем овчинка выделки не стоит.  Что такое два-три лишних мега по сравнению с потерей удобства?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:48 12-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
При всём моём уважении-напишите линию партии, дабы не было таких вопросов.
Может как помочь ?

Всего записей: 6525 | Зарегистр. 31-08-2008 | Отправлено: 14:15 12-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
При всём моём уважении-напишите линию партии, дабы не было таких вопросов.  
 Может как помочь ?

Задавание вопросов - это как раз способ узнать линию партии.
 
А помочь всегда можно найти чем.  Можно улучшить или нарисовать новую иконку к программе - кстати в ближайших сборках она уже будет нормально прицепляться к экзешнику.  Можно улучшить документацию (на wiki можно вносить изменения без регистрации), можно сделать перевод на другой язык (пока есть английский и русский, скоро возможно будет немецкий).  В конце концов можно пропиарить программу на своем блоге или где-нибудь еще.  Больше известность -> больше пользователей -> больше вероятность найти еще программистов для участия в проекте.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:02 12-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
так может быть, тогда сохранять все же файлы без подстроки "pic"

Прошу прощения, это был даже не глюк DjVu Small, а сугубо мой личный глюк.
===
Может, кому-нибудь будет полезно...
Сейчас работаю с исчерканной, потрепанной, цветной (и рисунки, и фото) книгой. Результаты хороши, но только если выводить и в цветном, и в смешанном режиме, а потом в фотошопе совмещать куски.
Еще наблюлось, что при "удалять пятна" куски текста пропадают даже при адекватной установке разрешения. Пришлось эту галку отключить, а пятна удалять вручную.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 22:25 12-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сейчас работаю с исчерканной, потрепанной, цветной (и рисунки, и фото) книгой. Результаты хороши, но только если выводить и в цветном, и в смешанном режиме, а потом в фотошопе совмещать куски.  

Тут поможет ручное выделение картинок, которое я еще не начал делать, хотя задача приоритетная.  Уже почти сделал удаление / добавление файлов в проект, а потом как раз займусь ручным выделением картинок.
Кстати вместо фотошопа можно наверное приспособить СК.  В СТ вывести в режиме Цветной / Серый и скормить это Кромсатору.  Правда сглаживания букв не будет, то есть будет, но СК'шное.
 

Цитата:
Еще наблюлось, что при "удалять пятна" куски текста пропадают даже при адекватной установке разрешения. Пришлось эту галку отключить, а пятна удалять вручную.  

Давайте пример.  Это надо сказать довольно странно.  Куски текста должны были сохраниться и на основании размера, и на основании близости к другим буквам.  Кстати какая у вас версия?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:51 12-04-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru