Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как это что? Мы всегда запускаем незнакомую программу - просто, чтобы на неё взглянуть, оценить интерфейс, потыкать по кнопочкам, открыть и почитать хелп, посмотреть, какая лицензия и линк на её сайт.
 

Вот как раз без исходного материала там и тыкать-то некуда.  Насчет хэлпа - ну предположим кто-то действительно начинает знакомство с программой с чтения хэлпа.  Но ознакомившись с программой, ему станет реально удобнее та схема, что реализована сейчас.  А хэлп (которого пока и нет) - вполне можно поместить в меню рядом с самой программой.
Я помню каким неудобным был Nero, пока не появился Nero Smart Start.  До этого открывалось пустое окно - и давай ищи там в меню то, что ты хотел сделать.  Так вот СТ как-раз стремится быть похожим на Nero Smart Start.
 

Цитата:
И не всегда надо указывать выходную папку - я могу захотеть просто загрузить пару файлов, обработать и посмотреть результат прямо в программе - не желая сохранять результат.

Не так все просто.  Выходная папка используется также для кэширования данных данного проекта (там создается поддиректория cache), так что она должна быть известна сразу же.
 

Цитата:
И Files in Project / Not in project в 90% случаев никому не нужны - т.к. наиболее часто мы загружаем некую заранее подготовленную папку со сканами, подлежащими обработке. Просто можно поставить там фильтр на автоматический отбор только графических файлов (по расширению) и всё.  

Ну это уже реализовано, не убирать же готовый и хотябы иногда полезный функционал.
 

Цитата:
Цитата:
Page Layout - выставление полей и выравнивание по размерам с остальными страницами.  
 
Это должно делаться исключительно автоматически - и уж никак не вручную.

И как вы себе это представляете?  Откуда программе знать, какие поля вы хотите?  Там ручной работы на самом деле минимум.  Запускаете пакетный режим, если обобщенные размеры слишком велики (пунктирная линия), кликаете на Widest Page / Tallest Page и либо уменьшаете там поля, либо исправляете зону контента.  После этого при желании можно подправить размеры полей на одной странице, и применить их ко всем остальным стнаницам.  А главное все визуально, не нужно гадать как в СК, сколько пикселей делать поля.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:00 18-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
этого открывалось пустое окно - и давай ищи там в меню то, что ты хотел сделать.

1. Там я не лишён возможности сразу же запустить нужную мне программу.
2. Nero Smart Start не заставляет меня сначала всунуть чистую болванку в привод, а уже только потом предлагать что-либо сделать с ней.
 
Если Вы хотите сделать помощник - то его ведь можно сделать отдельно. А многим захочется просто запускать программу - и без всяких выкрутасов вначале.

Цитата:
Я помню каким неудобным был Nero, пока не появился Nero Smart Start.

Зачем сразу же начинать с создания помощника - когда сама программа ещё не готова?

Цитата:
Ну это уже реализовано, не убирать же готовый и хотябы иногда полезный функционал.  

Не убирать, но маленькое окошко при запуске - убрать надо бы непременно и заменить его на File -> Open files(s) - и вот там уже и засунуть этот функционал.

Цитата:
Не так все просто.  Выходная папка используется также для кэширования данных данного проекта (там создается поддиректория cache), так что она должна быть известна сразу же.

Ну тогда пусть юзер указывает выходную папку в том окошке, которое будет открываться по File -> Open files(s). Можно сделать её по-умолчанию подпапкой входной папки (да ещё и с заданным именем) - как в СК.
Цитата:
После этого при желании можно подправить размеры полей на одной странице, и применить их ко всем остальным стнаницам.  А главное все визуально, не нужно гадать как в СК, сколько пикселей делать поля.

Примерно ясно - звучит неплохо.
 
Ещё раз повторюсь: маленькое окошко, появляющееся сразу после запуска программы - это страшно раздражающая вещь. Всё, что нужно сделать - пусть это окошко открывается не при запуске, а после запуска - при нажатии File -> Open files(s). Заметьте, что я как минимум третий, кто об этом говорит. Можем хоть голосование устроить - скорее всего, практически все захотят того же.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:38 18-07-2008 | Исправлено: monday2000, 12:04 18-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По поводу невозможности открыть главное окно без создания или открытия проекта:
Не разделяю вашей точки зрения.  Думаю сейчас оно реализовано вполне удобно.  Я бы не стал возражать, если бы кнопки New Project и Open Project появлялись бы прамо в главном окне.  Показать их пользователю надо, чтобы ему их искать не пришлось, а в главном окне или в отдельном - не суть важно.  Но сделать это не так то просто.  Есть архитектурные ограничения, которые мешают этому.  Я в любом случае буду их решать, потому что это нужно для реализации добавления файлов в проект.  Может тогда и перемещу эти кнопки в главное окно, если это не окажется слишком сложно.
 
Насчет выходной папки:
Ну так ли сложно ее указать в самом деле?  Ну я мог бы автоматом забивать туда ${input_dir}/out, или типа того.  В любом случае это весьма несущественное неудобство.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:12 18-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Не разделяю вашей точки зрения.  Думаю сейчас оно реализовано вполне удобно.

Я просто хотел бы, чтобы Ваша программа стала действительно популярной. Но если Вы сами этого не хотите - воля Ваша. В таком виде, как сейчас (с этим маленьким окошком, выскакивающим при запуске) все, конечно, будут пользоваться Вашей программой - но, во-первых, будут всякий раз мысленно Вас материть (по поводу окошка), а во-вторых - будут бомбардировать Вас письмами с просьбой убрать это несчастное окошко (например, в Files -> Open File(s) ).

Цитата:
Насчет выходной папки:  
Ну так ли сложно ее указать в самом деле?

ИМХО несложно. В момент указания папки-источника. В этом нет проблемы - проблема в маленьком окошке при запуске, которого не должно быть, о чём уже высказалось 3 человека в 2 форумах.

Цитата:
В любом случае это весьма несущественное неудобство.

Я с этим вполне согласен.

Цитата:
Есть архитектурные ограничения, которые мешают этому.

Я так и знал, что эти кросс-платформенные решения - вредный универсализм, пытающийся совместить несовместимое (Windows и Linux). Вот в чисто Win32-программе это делается элементарно.
 
Добавлено:
Tulon
Здесь и на форуме Натахаус собрались люди, которые своими руками сделали не один десяток DjVu-книг. Поверьте на слово - мы Вам плохого не посоветуем. И если 3 человека так категорично высказались против выскакивания маленького окошка при старте - значит, к этому коллективному мнению вполне можно прислушаться.
 
Я даже не поднимаю больше тему отсутствия скроллбаров при зуме и сглаживающего фильтра - хотя совершенно очевидно, что без этих вещей Ваша программа никогда даже и приблизиться не сможет к СК по нужности/полезности. Ну да чёрт с этим - пусть хоть делает более простые вещи - например, пакетный split-page (я это называю унификацией - концепция, увы начисто проигнорированная в СК) или пакетное обрезание (batch-crop) по прямоугольной рамке фиксированного размера (это исключительно нужнейшая задача - для обрезки журналов типа "Техника-Молодёжи" - до сих пор не решённая по-человечески). Или же вот задача: берём группу grayscale-сканов, проходим по ней, руками выделяем каждую grayscale-картинку в прямоугольную зону, и запускаем пакетную обработку - пороговая (хотя бы; но это не лучшее) бинаризация сканов + blurring (или опционально dithering - для эстетов, т.к. даёт лучше качество, но гигантский размер) выделенных в зоны картинок -> на выходе смесь: Tif Fax G4 для простых сканов и Tif LZW для содержащих размытые картинки - далее раздельное кодирование: Tif Fax G4 - через DjVu Small, Tif LZW - отдельно через DE Editor 6, а потом вставляем 2-ые в 1-ые. Эта задача даже пока не имеет названия - можно назвать как "бинаризация с селективной обработкой картинок" (напоминает "Метод разделённых сканов"). Blurring нужен как подсказка для documenttodjvu - "поместить картинку целиком в background, а не размазывать её по 3 DjVu-слоям (порождая при этом артефакты)".
Все эти 3 задачи делает СК - но там не слишком удобно.
 
Добавлено:
Я занёс ссылки на просмотрщики растровой графики под Windows с открытыми исходниками сюда: http://www.djvu-soft.narod.ru/bookscanlib/
 
Также нашёл и выложил кем-то скомпилированный экземпляр вьювера Cornice:
 
Portable Cornice v0.6.1
 
http://www.djvu-soft.narod.ru/bookscanlib/port_cornice_0_6_1.rar  (3,84 МБ)
 
(Может, кто-то захочет его посмотреть - а на офф.сайте только его исходники и всё).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:04 19-07-2008 | Исправлено: monday2000, 17:44 19-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://tifftool.sourceforge.net/ - интересно

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:17 19-07-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
 Ну а там и до вывода рукой подать.
Действительно, сделайте уже вывод Чтобы можно было протестировать хоть как-то по полному циклу.  
Так и потенциальные пользователи подтянутся, наконец. Иначе топик может утонуть во флуде, как уже не раз бывало, увы...

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 21:48 19-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ага, я придумал для себя оправдание чтобы игнорировать запросы пользователей .  Вот оно:
Я должен концентрироваться на том, над чем работаю в данный момент (вывод).  Если я буду брать в голову все пожелания и недовольства пользователей, она у меня взорвется
В общем не надо пока доставать меня всякими мелочами.  Когда важные задачи будут решены, всегда можно будет к ним вернуться.
 
Кстати пакетный режим работает для всех этапов.  Другое дело что только последний этап будет генерировать файлы, но в этом я не вижу проблемы.
 
Вывод я думаю закончить через неделю-полторы.  Сейчас работаю над улучшением качества черно-белых результатов.  Попробовал алгоритм kFill - медленный и не слишком эффективный.  Сейчас буду пробовать чистку на основе hit-miss transform.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:46 20-07-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Или же вот задача: берём группу grayscale-сканов, проходим по ней, руками выделяем каждую grayscale-картинку в прямоугольную зону,

Какая же тогда это автоматизация, если все руками придется делать?
ИМХО, лучше использовать концепцию слоев, а не зон. Автоматическое деление на слои например на основе морфологии вполне  можно сделать. На всякий случай добавить инструмент типа "ластик/кисть" для ручной правки (переноса из одного слоя в другой), если будет неточная сегментация.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 08:30 21-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Вывод я думаю закончить через неделю-полторы.

Не торопитесь слишком уж сильно - ничего, мы подождём.

Цитата:
Сейчас работаю над улучшением качества черно-белых результатов.

Можно сделать Normal Despeckle - такой же, как в СК. Это ЧБ фильтр "по среднему": квадратное окошко 3 на 3 пикселя ("апертура") пробегает по всем пикселям, белые пиксели сразу пропускаем при проходе (от этого качество чуть снижается, зато скорость - радикально повышается), на каждом шаге находим среднее арифметическое и подставляем его в картинку. По краям - не помню, кажется, просто пропускаем. Именно так и работает Normal Despeckle в СК.
Fine Despeckle в СК - это, т.ск. "геометрический" Despeckle - там апертура пробегает и все пятнышки с размером меньше либо равным пороговому стирает.
U235

Цитата:
ИМХО, лучше использовать концепцию слоев, а не зон. Автоматическое деление на слои например на основе морфологии вполне  можно сделать.

В этом я не разбираюсь. Может быть, так лучше. Просто понятно, что "ручной" вариант - наиболее точный.
 
Добавлено:
U235

Цитата:
Автоматическое деление на слои например на основе морфологии вполне  можно сделать.

Сделайте, пожалуйста, это в виде хоть какой-то простейшей демо-программы со сканом-примером - а то на пальцах непонятно. Только - можно не на Матлабе? Попробуйте FreeImage (freeimage.sf.net) - с ней довольно просто работать, скажем, на СИ или на СИ++, и к ней есть прекрасная документация. Вот посмотрите, например - http://www.djvu-soft.narod.ru/bookscanlib/001.htm - ИМХО очень просто для понимания.
 
Добавлено:
http://alexrey036.narod.ru/graylayers.html - тут мало что понятно, т.к. Матлаб.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:06 21-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно сделать Normal Despeckle - такой же, как в СК. Это ЧБ фильтр "по среднему": квадратное окошко 3 на 3 пикселя ("апертура") пробегает по всем пикселям, белые пиксели сразу пропускаем при проходе (от этого качество чуть снижается, зато скорость - радикально повышается), на каждом шаге находим среднее арифметическое и подставляем его в картинку. По краям - не помню, кажется, просто пропускаем. Именно так и работает Normal Despeckle в СК.
Fine Despeckle в СК - это, т.ск. "геометрический" Despeckle - там апертура пробегает и все пятнышки с размером меньше либо равным пороговому стирает.  

Мелкие пятна удалить - не проблема.  Мне бы хотелось еще и удалять зазубрены на буквах.  С однопиксельными зазубренами kFill нормально справляется, а для двух пиксельных буду пробовать hit-miss transform.
 

Цитата:
http://alexrey036.narod.ru/graylayers.html - тут мало что понятно, т.к. Матлаб.

Мы уже пообщались с U235 на эту тему в личной переписке.  Предыдущий вариант у него был на черно-белой морфологии, и там я все понял.  Вариант с серой морфологией мне сложно понять, поскольку я никогда визуально не видел, как она работает.  Плюс не реализована она у меня пока.  А FreeImage тут не подойдет - там вообще никакой морфологии нету.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 09:51 21-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
А FreeImage тут не подойдет - там вообще никакой морфологии нету.

А что подойдёт? Явно ведь не Матлаб - он же "вещь в себе". Т.е. не будут же книгосканировщики себе Матлаб ставить. А то, что там нет морфологии - надо искать этот алгоритм где-то на стороне и добавить его в FreeImage (не нравится FreeImage, можно взять другую графическую библиотеку).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:16 21-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А что подойдёт? Явно ведь не Матлаб - он же "вещь в себе".

leptonlib подошел бы.  Тут еще проблема что не все знают C/C++.  Так или иначе матлабовские скрипты там совсем небольшие, и разобратся в них без самого матлаба вполне реально.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:23 21-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
leptonlib подошел бы.

А где именно это там? Кстати, практический любой алгоритм оттуда можно "перебить" под FreeImage.

Цитата:
Так или иначе матлабовские скрипты там совсем небольшие, и разобратся в них без самого матлаба вполне реально.

Да, но ведь они же, как я понимаю, обращаются к высокоуровневым матлабовским функциям - поэтому эти скрипты "в лоб" не переносимы в любую другую любительскую программу - а значит, не имеют (почти) практического смысла.
Вот если бы перенести с Матлаба на leptonlib (т.е. подменяя высокоуровневые функции Матлаба аналогичными функциями из leptonlib) - то результат уже на FreeImage реально перенести, а оттуда - вообще куда хочешь можно переносить, на любую другую граф.либу, т.к. "язык" библиотеки FreeImage исключительно прост для понимания.
 
Добавлено:

Цитата:
Мелкие пятна удалить - не проблема.  Мне бы хотелось еще и удалять зазубрены на буквах.

Просто Normal Despeckle - исключительно быстрый алгоритм, и в этом ИМХО его главное достоинство (хотя это не настоящий Despeckle, а более загрублённый и более радикально-чистящий, чем настоящий, потому что настоящий не пропускает при проходе белые пиксели).
 
Добавлено:
U235
То есть я клоню к тому, что не могли бы Вы перенести свои матлабовские скрипты с Матлаба на какую-то более низкоуровневую библиотеку (например, leptonlib или какую-то другую) - чтобы этот материал стало возможно интегрировать в любительские программы?
 
Добавлено:
А доступны ли исходники вот этих высокоуровневых матлабовских функций? Если они есть, тогда всё гораздо проще.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:55 21-07-2008 | Исправлено: monday2000, 11:01 21-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кстати, практический любой алгоритм оттуда можно "перебить" под FreeImage.
 

Можно-то можно, только никто этим заниматься не будет.  Это далеко не пятиминутное дело.
Кстати есть надстройка над FreeImage - FreeImageAlgorithms: https://code.launchpad.net/~glennpierce/+junk/main
Там есть бинарная морфология.  Серой нет.
 
Я на самом деле планирую реализовать алгоритм, предложенный U235, но он в итоге будет завязан на Qt и на мою библиотеку обработки изображений.  Для этого мне придется cначала реализовать гауссово размывание и dilate, erode, seedfill в серой морфологии.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:42 21-07-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
...seedfill в серой морфологии

Есть в leptonlib.
monday2000

Цитата:
А доступны ли исходники вот этих высокоуровневых матлабовских функций?

Да, доступны, и лежат где-то на этом сайте: http://djvu-soft.narod.ru/
 

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 08:23 22-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
лежат где-то на этом сайте

Я их вчера смотрел - http://www.djvu-soft.narod.ru/bookscanlib/mipt_u235.rar (235 КБ) - там нет всего, что нужно. Возьмём, например, функцию imdilate из http://alexrey036.narod.ru/graylayers.html - её исходников нет, и она даже и не упоминается в этом наборе исходников.
 
Хотя, в целом кое-какие сишные исходники там есть любопытные.
Tulon

Цитата:
Я на самом деле планирую реализовать алгоритм, предложенный U235, но он в итоге будет завязан на Qt и на мою библиотеку обработки изображений.  

Можно узнать в 2 словах, какой там принцип действия?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:10 22-07-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Я их вчера смотрел - там нет всего, что нужно.  

Все там есть.

Цитата:
Возьмём, например, функцию imdilate  её исходников нет.  

В архиве есть m-функция imdilate, открываем ее в блокноте и видим что она в конечном итоге (после всех проверок аргументов) вызывает другую функцию: morphop(A,se,'dilate',mfilename,varargin{:})  
эта функция есть в файле morphop.m из папки private,  смотрим ее и видим, что она вызывает morphmex, это dll, там же ее исходники .h и .cpp и файлы dilate_erode_gray_flat.cpp

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 10:03 22-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Здорово. Видимо, именно так был сделан pagetools.sf.net (наверно).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:08 22-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня возникла идея по поводу обработки сканов с картинками: предположим, Tulon сделает вариант (то ли ручной, то ли автоматический по способу U235) бинаризации серых сканов с селективным размытием картинок. Тогда, скажем, ST мог бы выдавать на выходе 2 папки: одна - с ч.б.бинаризованными сканами, а 2-я - с grayscale-сканами, содержащими картинки. Тогда можно было бы так модифицировать, допустим, DjVu Small, чтобы он сначала скопом кодировал все готовые ЧБ сканы в один многостраничный DjVu, затем кодировал бы по одному grayscale-сканы, содержащие картинки, и далее автоматом вставлял бы "DjVu-сканы с картинками" в нужные места в полученном многостраничном ЧБ DjVu-файле (посредством djvused). "DjVu-сканы с картинками" можно перед вставкой просматривать - насколько хорошо они получились.
 
Т.е. можно автоматизировать закодирование в DjVu смесь разнородных по глубине цвета TIF-файлов - это не так сложно чисто технически. Насколько я помню, это умеет делать JRA Publish (т.е. кодировать такую разнородную смесь), чем Джим Райли особенно гордился.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:38 22-07-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чем выводить по две версии каждого файла, проще выводить в черно-белом файлы где нет картинок, и в сером / цветном - где есть.  После чего научить DjVu Small или какой другой кодировщик выставлять оптимальный режим для каждого типа файлов.  Я вообще удивлен, что они такого до сих пор не умеют.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:12 22-07-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru