Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
1. Увеличение "без потери качества" не явлется увеличением "с добавлением информации", поэтому никаких преимуществ в обработке дать не может.
2. Старайтесь оперировать еще и пиксельными размерами изображений, иначе сложно понять вашу мысль... а заодно, может и никаких ИП не потребуется.
3. На всякий случай: размер изображения в дюймах = размер изображения в пикселях / dpi. Таким образом задав одному и тому же растровому изображению различное dpi, можно изменять соответствующий размер в дюймах. Dpi - это, по большому счету информация о том, как масштабировать растровую картинку при передаче из/в реальный мир (со сканера, на монитор или на принтер) - и ничего более.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 17:26 29-01-2010 | Исправлено: StanFreeWare, 17:28 29-01-2010
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Вы не в курсе, ваш патч примлем для любых версий ST? Пока интересует последняя (0.9.7.2). Ну вдруг руки дойдут собрать...
monday2000
Вы можете либо дополнить статью об использовании DjVu Imager (с SK) применительно к Scantailor 0.9.7.1 anagnost96 или написать отдельный вариант? Если ДА, то и ссылочку сюда же...
 
Пока приходится парсить весь топик, вылавливая советы по работе с этими программами. Раньше - игнорировал. Сейчас - хочу тоже посмотреть что за зверь получается...

Всего записей: 591 | Зарегистр. 28-07-2005 | Отправлено: 17:45 29-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Пока приходится парсить весь топик

а в Вике Скантейлора не догадались посмотреть раздел Создание качественных DjVu методом вклейки иллюстраций? Там как раз про это написано... Про СТА+Djvu Imager.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 17:49 29-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01

Цитата:
А что ты курил?  

Может по-вежливее...

Всего записей: 1129 | Зарегистр. 15-01-2005 | Отправлено: 18:03 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
А грузить народ понятиями "сырьё-вторсырьё" - это вежливо?

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 18:13 29-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
не понимаю, что Вас так обидело...
предмет-процесс-продукт - это филосовское определение любой (любой!) работы. На этом понятии построена вся управленческая культура производства.
Применительно к промышленным технология - сырье-процесс (функция) - продукт.
В данном случае, в разряд сырья входят 1) сканы, как продукция процесса сканирования и 2) сканы (как правильно назвать?) от процесса декодирования книг в формате djvu, pdf.
при этом, я не навязываю свое мнение, а высказал собственную точку зрения. Речь не о форме, а о содержании...

Всего записей: 1129 | Зарегистр. 15-01-2005 | Отправлено: 18:25 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
Я тоже высказал свою точку зрения. При чём тут обида? Все термины и понятия в технологии сканобработки уже давно устаканились и всякий терминологический постмодерн только глаза режет своей экзотической эклектичностью.
 
А по содержанию интересны не концептуальные реверансы, а конкретные алгоритмы, как было выше сказано, - определение кривизны строк, эффективные алгоритмы улучшения освещённости изображения и т.п. Тут добавление новых понятий из фабрично-заводского тезауруса - как мёртвому припарка.
 
Расскажи лучше, чем и как сгладить буквы в двухбитовом черно-белом тексте. Мне это сейчас нужно. Все граф. "редактора" как только видят такое изображение - сразу прячут все свои "процессоры для сырья", гады.
 
А "управленческая культура производства", по-моему, построена на такой цепочке: деньги-товар-кучаденег-Куршевель.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 18:37 29-01-2010 | Исправлено: amz01, 18:45 29-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Последующие Ваши посты игнорирую

Всего записей: 1129 | Зарегистр. 15-01-2005 | Отправлено: 18:58 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
Я этого не переживу...

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 19:00 29-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добавил ссылку на раздел, касающийся совместного использования STA + Djvu Imager в шапку темы.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 19:18 29-01-2010
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
 

Цитата:
Что меня достаёт в BR - он, собака, на выходе меняет названия файлов на 1,2,3... Прямо "унтер Пришибеев в натуральную величину". Потом приходится выяснять что к чему относится, блин

 
поставьте в настройках стандартной страницы галочку в поле "сохранять начальное имя"
или выберите тот вариант нумерации, который вам симпатичнее.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 19:33 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dma200899
Вот за это биг мерси! Я туда даже не заглядывал ни разу - лазил только в общие настройки. Теперь будет гораздо проще обрабатывать сканы. Позор на мою лысую голову...

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 19:37 29-01-2010
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Спасибо за ссылку. Смотрел страничку, когда не нужна была. А сейчас - забыл. Буду изучать

Всего записей: 591 | Зарегистр. 28-07-2005 | Отправлено: 22:58 29-01-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот сделал подборку статей на тему исправление кривизны строк.
_http://narod.ru/disk/17402999000/Dewarping.rar.html [2,18 Мб]
В данных статьях осуществлен обзор существующих методов, перечислены их недостатки и достоинства. Метода применяются как к серым, так и бинарным изображениям. Хотелось, чтобы их посмотрели несколько человек, сделали свои замечания. В конце концов нужно определить один (самый универсальный) метод. Если кого заинтересовал, прошу в личку

Всего записей: 412 | Зарегистр. 03-08-2007 | Отправлено: 23:11 29-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделал сборку из текущих исходников:
http://www.onlinedisk.ru/file/334746/
 
Сделана попытка обрабатывать сложные случаи неравномерности освещения, которые случаются при съемке камерой.
 
Также присутствует вторая версия алгоритма выпрямления строк от Rob'а, хотя и в недоделанном виде.  Во первых, у него на данный момент есть три булевых параметра, которые я просто зашил в код.  Во вторых, он пока работает только в режиме черно-белого вывода в 600 dpi.  А еще он медленный, хотя я уже вижу пару способов его ускорить.  В общем все его ограничения будут со временем сняты.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 03:16 30-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TulonНадо обязательно включить туда патч из STA, чтобы можно было разделять текст и картинки. Без этого нет смысла юзать эту версию.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 13:56 30-01-2010
Sensile

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При использовании dewarp получилось интересное геометрическое искажение  
http://s003.radikal.ru/i204/1001/ac/0958d726e089.tif (300 кб)

Всего записей: 18 | Зарегистр. 30-11-2008 | Отправлено: 15:57 30-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01

Цитата:
TulonНадо обязательно включить туда патч из STA, чтобы можно было разделять текст и картинки. Без этого нет смысла юзать эту версию.  

Включать все, что требуют пользователи - верный путь загубить проект.
 
Sensile

Цитата:
При использовании dewarp получилось интересное геометрическое искажение  
http://s003.radikal.ru/i204/1001/ac/0958d726e089.tif (300 кб)

Алгоритм экспериментальный, бла-бла-бла, и вообще не я его автор - ко мне не приставайте.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:34 30-01-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Перелопатив много статей, понял,  что лучшим алгоритмом будет аглоритм "Восстановление формы страницы текста для коррекции геометрических искажений ". Для начала думаю его реализовать для бинарных (черно-белых) изображений. Краткая схема алгоритма следующая:
1.  Подавление  неравномерного  освещения  и бинаризация  
2.  Объединение символов в строки  
3.  Анализ  геометрии  строк  и  построение  карты глубины  
4.  Построение поверхности по карте глубины  
5.  Проецирование с учётом полученной поверхности  
Предлагаю, что каждый, кому интересный данный вопрос взял по пункту и детально разобрал. Например, первый требует выравнивания освещенности изображения в целом. Для этого используется два метода – деление  изображения  на  его  низкочастотную  
составляющую и ретинекс. Связался с автором алгоритма. Поссмотрим, что ответит. Жаль, конечо, если не будет сотрудничать. Статью по алгоритму можно скачать по ссылке, которую давал выше постами.

Всего записей: 412 | Зарегистр. 03-08-2007 | Отправлено: 19:54 30-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Потенциально возможная методика создания малоцветных книг с помощью СТА:
1. Проходим все стадии с нормальными настройками, получаем два слоя - растровая часть и полноцветная картинка с дырками от растровой части (то, что сейчас делается Grey Text).
2. "Дырявые" страницы обрабатываются алгоритмом разделения текста по цветовой составляющей.  
3. Полученные составляющие обрабатываются в ST только на этапе 6 (сейчас невозможно из-за невозможности группового обхода стадий 2 и 4) для получения гладкого бинарного вида для каждой составляющей.
4. Бинарные составляющие собираются в малоцветный tif, где каждой из составляющих задается свой цвет - черный, синий, красный и т.д., из которого получается малоцветная djvu-заготовка без иллюстраций.
5. Иллюстрации, выделенные на этапе 1 и обработанные с целью исключения растра  подключаются к заготовке с помощью Djvu Imager.
Вновь приходим к необходимости наличия пресловутых трех фич.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:57 31-01-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru