Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я уже не раз пожалел что ввязался со своими советами.
Все. Прошу закрыть вопрос

Всего записей: 1131 | Зарегистр. 15-01-2005 | Отправлено: 22:38 26-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я обновил своё зеркало с документацией к Scan Tailor:
 
http://www.djvu-soft.narod.ru/st_index.htm
 
Обновлена также соответственно и его оффлайн-версия там.
 
Также я чуть подправил там кое-что:
 
1. Тут http://www.djvu-soft.narod.ru/st_deskew.htm сделал более актуальный скриншот - с квадратной сеткой.
 
2. Пункт http://www.djvu-soft.narod.ru/st_zones.htm теперь легко доступен из любого места доки.
 
3. Внизу каждой страницы где есть "Перейти к произвольной стадии:" после него приведён полный список стадий (а в оригинале - за вычетом текущей).
 
4. Пункт "Создание качественных DjVu методом вклейки иллюстраций" я туда не стал включать - т.к. ИМХО он не относится напрямую к инструкции по использованию программы. Относительно него я подумаю отдельно.
 
Добавлено:
PS C сайта sourceforge.net вся эта документация грузится довольно тормознуто (по крайней мере, у меня ), а также в IE 6 sourceforge.net некорректно отображается.
 
С моим зеркалом таких проблем нет (для русских IP, конечно ).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:03 27-01-2010 | Исправлено: monday2000, 19:08 27-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Я решил повторно изложить мои предложения к Вам по поводу необходимейших улучшений Вашей модификации ST.
 
На мой взгляд, сделать данные вещи было бы крайне желательно - чтобы довести Вашу СТ-модификацию до ума.
 
Мои предложения такие:
 
1. Сделать каждый сорт вывода (серое, чёрно-белое, "только текст", "только изображения", и т.д.) ВСЕГДА в свою папку внутри папки out (сейчас - любой сорт выводится просто в папку out). Соответствующая папка могла бы создаваться, например, в момент переключения с одной категории на другую (на стадии "Вывод").
 
2. Сделать новый сорт вывода - "Только текст (серый)". Т.е. серые сканы с белыми бельмами, откуда вырезаны картинки. Сейчас такие сканы приходится создавать при помощи программы ST GreyText http://www.djvu-scan.ru/forum/index.php?topic=19.0 - так зачем же городить такой огород, если можно сделать такую фичу прямо в Вашей модификации СТ (и ликвидировать нужду в ST GreyText)?
 
Я занёс ссылку на этот пост в шапку - чтобы он не затерялся и не забылся.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:18 27-01-2010
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
1.
Пример с черными объектами обязательно соберу из разных книг и выложу. Это очень-очень нужно.
 
2.  
Почему то сортировка при добавлении сканов пошла так
 
0001.tif
2_01_1.tif
0002.tif
 
Это глюк или фича ?

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 05:18 28-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Кстати, вот реальный из жизни пример, зачем может понадобиться только разрезка.
Взял старую книгу переплетенную по всем правилам, т.е. сшитую из брошюр. Аккуратно расшил брошюры (если расшивать аккуратно, то сшить обратно потом не очень сложно, можно даже ребенку поручить), получил парные страницы, с брошюрной нумерацией 1-20,... 10-11 и т.д. Отсканировал на сканере с автоподачей листов. Получил много проблем с поиском местоположения страниц, у которых на этапе определения полезной области номер страницы обрезало.
Было бы удобно сначала только разрезать страницы, восстановить естественную нумерацию в одностраничных файлах, и затем уже обрабатывать естественно пронумерованную последовательность файлов далее.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 06:44 28-01-2010
VladEMO

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго всем времени суток.
 
В первую очередь хотел бы высказать большое спасибо автору данной программы. В свое время немало времени было потрачено мною в гимпе, для обработки каждой страницы вручную, обрезая изображение и поворачивая ее на пол градуса.
 
Уже некоторое время слежу за течением разговора в данной теме и хотел бы высказать свое конструктивное мнение.
 
Очень много различных просьб поступает по нагромождению в программу новых функций.
Я и сам частенько пользуюсь программой не совсем по назначению, и действительно часто кажутся лишними некоторые операции.
 
Я считаю что эту проблему (проблему новых фич и нестандартного использования) можно решить если перевести программу в режим плагинов.
 
Как я себе представляю это с точки зрения интерфейса: все остается по прежнему кроме того что последовательность действий и сами действия которые в списке в левом верхне углу можно было бы менять.
 
Тогда во-первых ненужные шаги можно просто удалить. И потом можно добавлять один и тот же инструмент несколько раз, если это понадобится.
 
Кроме того можно будет использовать посторонние плагины написанные либо своими руками либо любителями.
 
В частности и плагины вывода изображений например (о чем немало споров здесь уже было как нужно сохранять в три папки или в одну и нужно ли разделение).
 
Плагин склейки изображений (если книга большая - приходится страницу по два раза сканировать и два раза обрабатывать в СТ - первый раз поворот, обрезка, затем склейка сторонней программой в пакетном режиме и затем повторная обрезка и подгонка под один размер)
 
И каждый плагин можно изменять не боясь за целостность самой программы.
Например частенько не хватает опции "применить к каждой второй выделенной странице" на этапе макет страницы (бывает что нужно поля задать зеркально для четных и нечетных страниц).
 
 
Я понимаю что для плагинной работы необходимо определить некий интерфейс и внутреннюю структуру данных хранения изображения.
 
Я считаю что уже на имеющемся опыте можно определить внутренний формат данных плагинного СТ (например цветной слой, серый слой, чб слой). АПИ у плагинов на мой взгляд прост - взять объект-страницу - обработать - вернуть объект-страницу.
 
На входе плагин для чтения - для каждого формата, на выходе плагин для записи - хочешь - просто изображение, хочешь - многослойные изображения, хочешь - в три папки.
 
программа же при этом может иметь шаблоны для новичков, в частности тот шаблон который используется сейчас - прочитал, разрезал, повернул, обрезал, добавил поля, сохранил.
 
 
С радостью выслушаю критику моего предложения.

Всего записей: 2 | Зарегистр. 28-01-2010 | Отправлено: 11:28 28-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VladEMO

Цитата:
С радостью выслушаю критику моего предложения.

Вообще идея хорошая - только, по-видимому, её время ещё не пришло. Одному Tulon чисто физически явно со всем этим не справиться.
 
Как упрощённый вариант, все желающие ИМХО могут помочь путём разрабатывания всяких полезных алгоритмов для книгосканирования - и выкладывания их исходников в некоем удобном для восприятия-повторного использования виде. В качестве иллюстрации см. http://www.djvu-soft.narod.ru/bookscanlib/project.htm .
 
Например, на сегодняшний день наиболее актуальны ИМХО 2 алгоритма:
 
- Выравнивание освещённости как в Book Restorer 4.1.
 
- Выпрямление искривленных строк как в Book Restorer 4.1.
 
С выпрямлением строк сейчас вроде наметился неплохой прогресс, а вот с выравниванием освещённости (и не просто какой-нибудь - а такой, как в Book Restorer 4.1) - глухо как в танке.
 
Вот если бы удалось разработать 2 этих алгоритма в открытых исходниках и хорошего качества - то тогда бы стало возможным отказаться от использования Book Restorer 4.1. (заманчиво).
 
Добавлено:
А ещё в обозримом будущем ожидается появление готового билда проекта http://code.google.com/p/artscan/ - вот он как раз на плагинах и построен изначально.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:12 28-01-2010
Rsbr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Tulon:С какой точки не посмотреть на выпуск платной версии - ничего хорошего не получается.  Во первых я терпеть не могу закрытых программ.  Во вторых ее не будут покупать.  В третьих, лишние 50, 100, или даже 200 фунтов в месяц не изменят ровным счетем ничего в моей жизни.  Ну накоплю я на начальный взнос в ипотеку не через 3 года, а через 2 и 8 месяцев.  Вряд-ли мысли об этом будут греть мою душу.

 
+очень много. Закрытую-не надо.
Единственное- на сайте программы я не наблюдаю возможности дотаций.Это на самом деле не страшно,дело-то полезное и благодарность сообщества может выражаться в чём угодно...
Меня ещё интересует: появится ли СТ в репозитарии Debian?
 
Уже год назад программа полностью удовлетворяла моим запросам (да,нехватало ластика)
Только недавно мне потребовалось разрезать и исправить ориентацию.И хорошо бы вывод...
Но нет,а полезная область в этом случае определялась неверно.Отсюда хотелось иметь возможность задавать её вручную на все страницы  или сделать отключаемой.
Прнишлось поручить работу ImageMagik. Оговорюсь сразу,чтобы получить такое плохое определение полезной области в СТ были использованы (не нарочно) снимки сделанные с сотового телефона с тетради с рукописным текстом.Но тем не менее разрезал он их без ошибок.
Насчёт плагинов и комбайнов:
Есть такая штука - Phatch
Я к тому,что если есть алгоритмы ,почему бы не добавить новые действия в эту программу?
По-моему она вполне соответствует идеологии с наборами действий,этапов обработки.И уже сейчас реализовано много что и вывод во что угодно.Да,оно сейчас на фотографии ориентировано.Но можно значительно расширить возможности.
А назначение СТ по-моему- быстрая обработка сканов от среднего качества,в той концепции в которой он есть сейчас-простой и удобный инструмент с достаточным уровнем автоматизации.Звуковой сигнал добавили,насчёт ластика- иногда просто досадно очень,какое-нибудь пятно или штамп видно а удалить нельзя,это надо открыть именно этот tiff в Gimp...
 

Всего записей: 10 | Зарегистр. 17-04-2009 | Отправлено: 15:42 28-01-2010 | Исправлено: Rsbr, 15:56 28-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
monday2000...bookscanlib/project.htm...
А тамошние исходники не подходят? Там же почти все алгоритмы приведены.
 
Было бы хорошо, для начала, реализовать в версии STA 0971 возможность сохранения файлов на любой стадии обработки. Этого требует здравый смысл и реальная потребность 99% юзеров проги. Пока внутри не реализованы нормальные алгоритмы коррекции, можно было бы прогонять обрезанные файлы в других обработчиках.
 
И, лично для меня, единственно пригодная версия - это STA 0971, а 0972 - бесполезная, так как на выходе качество хуже.
 
Принципиальная позиция - это здорово, но надо быть последовательным - если прога делается для народа, то надо корректировать её, как народ просит. А так - принудиловка получается.
 
Если бы были исходники для Builder C++, я бы тоже включился в доработку. А-то этот Qt - жуткая тягомотина, от него линухом за версту несёт.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 20:04 28-01-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
от него линухом за версту несёт

Что-то имеете против?

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 20:21 28-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что-то имеете против?  
Это не важно. Я спросил про исходники для Builder C++. Или VC++.

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 20:28 28-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Это не важно. Я спросил про исходники для Builder C++. Или VC++.  

ST можно собрать и соответственно вести разработку на VC++.  Процесс сборки неплохо документирован в архиве с исходниками, в packaging/windows/readme.ru.txt  От Qt вы естественно никуда не денетесь.
 
Разрешите однако высказать мнение, что с таким отношением к делу, как у вас, я скорее выиграю джек-пот в лотерею, чем увижу ваш вклад в ST.
 
Добавлено:
dma200899

Цитата:
0001.tif
2_01_1.tif
0002.tif
 
Это глюк или фича ?

Недоработка.  Сортировка в ST умная, но этот случай не берет.  Поправить кстати несложно, но мне не до этого.  Если кто захочет взяться и поправить, расскажу что именно надо сделать.
 
Добавлено:
Rsbr

Цитата:
Единственное- на сайте программы я не наблюдаю возможности дотаций.Это на самом деле не страшно,дело-то полезное и благодарность сообщества может выражаться в чём угодно...  

Есть.  Смотрите внимательнее - темная кнопка внизу каждой страницы.
 

Цитата:
Меня ещё интересует: появится ли СТ в репозитарии Debian?  

Я считал, что он уже там есть, но сейчас проверил - нету.  Попробуйте задать этот вопрос мэйнтейнеру Убунтовского пакета - он вроде собирался его и туда и туда пропихнуть.
 

Цитата:
Оговорюсь сразу,чтобы получить такое плохое определение полезной области в СТ были использованы (не нарочно) снимки сделанные с сотового телефона с тетради с рукописным текстом.Но тем не менее разрезал он их без ошибок.  

Такой материал ST никогда не сможет обрабатывать.  Это просто использование не по назначению.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:43 28-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
...я скорее выиграю джек-пот...
Спасибо за добрые слова... Это вдохновляет...
 
А, как насчёт добавления кнопок сохранения на всех этапах? Или я "скорее выиграю джек-пот..."?

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 07:36 29-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01

Цитата:
А тамошние исходники не подходят?

Куда не подходят?  

Цитата:
Там же почти все алгоритмы приведены.

Но там нет ничего на распознавание образов.

Цитата:
это STA 0971, а 0972 - бесполезная

Я, похоже, что-то пропустил - разве уже было 2 версии СТА?
 
Добавлено:
Я заметил ещё один недостаток в СТ: при разрезании страниц пополам обратило на себя внимание то обстоятельство, что головки резака (такие синие кругляши) почему-то находятся в рабочем окне - а не за его пределами, как в СК. Поэтому они мешаются там - и даже уменьшение масштаба не помогает - они всё равно не "выводятся" за пределы скана.
 
И ещё моментик: считаю, что в СК удобнее сделано - там тянешь за ползунок резака влево-вправо - и сам резак тоже едет влево-вправо при этом. А в СТ - нет, тут (в СТ) тянешь за головку резака влево-вправо - и влево-вправо едет лишь сама головка - а резак при этом только накреняется. Чтобы подвинуть резак в СТ влево-вправо - нужно тянуть за сам резак - а не за его головку.
 
На мой взгляд, такой подход гораздо неудобней, чем СК-шный.
 
Отсюда следуют достаточно важные выводы:
 
1. Я бы ещё раз рекомендовал всем разрезать сканы именно в СК, а не в СТ (исходя из вышеуказанных недостатков СТ).
 
2. В пособиях типа ScanAndShare теперь следует писать так: "начинаем сканобработку всегда в СК - а именно, разрезаем там сканы пополам. Далее порезанные сканы перегружаем в СТ, и докрамсываем их уже там. В случае, если результат (в СТ) получился не очень - выгружаем сканы из СТ в сером виде (опционально - с помощью ST GreyText), правим их в сторонней программе (СК - ради ластика, BR - искривленные строки + выравнивание освещённости)", загружаем подправленные сканы снова в СТ, и снова докрамсываем их уже там".
 
Вот такая, достаточно сложная схема (не оставляющая никаких шансов розовой иллюзии "делать всё в СТ").
 
В то же время, конечно же, с появлением СТ жизнь DjVu-книгосканиировщика заметно упростилась - что правда, то правда.
 
Добавлено:
Кстати - мне даже страшно представить, какие муки ожидали бы Tulon, пожелай он сделать в СТ ластик - это с его-то (мягко говоря, нелепым; хотя на языке так и вертятся более сильные выражения по этому поводу ) стремлением менять исходный скан лишь на стадии "Вывод", сводя все до-"Вывод"ные обработки лишь к записям насчёт "выводных" изменений исходных сканов.
 
Добавлено:
amz01

Цитата:
если прога делается для народа, то надо корректировать её, как народ просит. А так - принудиловка получается.

Ну, это у нас известная "болезнь" всех разработчиков самодельных DjVu-книгосканировочных программ (кроме меня и Жежеруна) - они, увы, всегда руководствуются лишь принципом "хочется" - а не "надо".

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:41 29-01-2010 | Исправлено: monday2000, 11:33 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
разве уже было 2 версии СТА?
Нет, с сожалению одна. Я имел ввиду ST 0972. Если бы она была STA - было бы здорово.
 
Что меня достаёт в BR - он, собака, на выходе меняет названия файлов на 1,2,3... Прямо "унтер Пришибеев в натуральную величину". Потом приходится выяснять что к чему относится, блин.  
 
Насчет ползунка - не согласен. Сейчас разделил 900 страниц - сказка. И очень полезно, что кружки резака двигаются независимо - часто бывает, что книгу перекашивает. Не пересканировать же из-за этого 100 страниц? А так - подвел весь резак к нужной точке и второй кружок поправил. Вчера попробовал расставить резаки на 50 страниц в СК - мазохизм высшей степени. Получилась жуткая каша и 100% ручной работы. Бред полный. Я вообще не собираюсь больше им пользоваться.
 
Вообще STA с делением на текст и картинки + Djvu Imager - это супер оптимальный вариант для создания книг. Получается самый компактный и качественный текст с приличными иллюстрациями.
 ST и STA - это два самых гениальных изобретения, как мне кажется.
 
Насчет "нелепых стремлений" - полностью согласен. Надо бороться с "диктатором в себе".
 
Счас дособираю книгу Трельсона по ATL и попробую подключиться к теме. Я ST и STA нашел только на прошлой неделе. Теперь появился смысл сканировать книги и ваять проги для сканов.
 
 
А кто этот Жежерун и какие проги он делает?  

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 12:00 29-01-2010 | Исправлено: amz01, 12:17 29-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
На мой взгляд, такой подход гораздо неудобней, чем СК-шный. Отсюда следуют достаточно важные выводы

Подход прекрасен. Реализация гениальна. Выводы нелепы  

Цитата:
хотя на языке так и вертятся более сильные выражения по этому поводу

 

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 12:25 29-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ранее уже хвалил, теперь попробую выступить с критикой и конструктивными предложениями.
Несмотря на удобство, качество выхода со СТ желательно улучшить, концепцию - оставить!
На мой взгляд, существенным сдвигом могло бы быть пояснение понятий в триаде: сырье-процесс-продукт.
 
Допустим, функция процесса в СТ, обеспечивающая качество выходного продукта реализована. Эта функция опирается на ряд допущений: 1) сырье (сканы) должны быть некоего нормального качества; 2) формат А4.  
При обеспечении этих требований к сырью функция обеспечит выход продукта некоего нормального качества!
Проблема в том, что вариаций в отношении качества сырья может быть бесконечное множество, а следовательно и критики, и ожидания хорошего результата.
Для того, чтобы неким образом унифицировать качество сырья нужны некие правила, действия, подготовительные процессы.
До СТ, напрашивается некая новая стадия анализа сырья, обеспечивающая возможность его унификации (приведения к приемлемому уровню качества для конвейера (СТ).
Рассматривая варианты унификации, необходимо опираться на конечный продукт СТ.
Вопрос - что является конечным продуктом в СТ, соответствующий неким качественным критериям?
Ответ - читабельная страница с текстом в формате А4.
Читабельная, это значит страница с упорядоченными символами, каждый из которых имеет ровный контрастный фону цвет и толщина отображения этого символа имеет зависимость от его размера и количества знаков на странице. Одновременно, края отображения символа должны иметь максимально ровную грань (желательно векторную). (В технике есть такой термин: чистота поверхности, определяющий высоту микрозазубрин на поверхности материала).
 
Отсюда, условная страница имеет некую площадь, на которой упорядоченно располагаются символы. Имеется зависимость между размером этой площади, количеством расположенных на ней символов, их высотой и толщиной (а также чистотой) их отображения.
При этом, отображение площади в целом фиксировано - это страница А4 минус поля.  
Именно эта страница должна быть отображена в 21*29 (или чуть меньше!).
 
Давайте введем понятие ИНФОРМАЦИОННОЙ ПЛОЩАДИ (ИП) - это та же самая полезная площадь в СТ, за исключением что она всегда (в книге) постоянна не зависимо от наполнения страницы символами.
т.е. ИП - это А4 (21*29) минус фиксированные поля (пусть 1,5 см).
качественно подготовленная ИП - это конечный продукт СТ
 
Достаточно ли существующих понятий DPI для получения качественной ИП? Нет! есть еще размер холста и т.д. свои зависимости.
Пример,
обрабатываю книжку из DJVU к СТ, реальный размер в  DJVU со сдвоенной страницей 26,5*18,5 см.

пробую подготовить на FR 10
получается, увеличивая разрешение я уменьшаю размер (в см) ИП
понятно, у FR другая задача, у него другой конечный продукт - ему нужно увеличить и прочитать символ, в то время как у меня - получить читабельную страницу!!!
Далее, пробую разобрать варианты подготовленные в FR на СТ;
увеличиваю страницу без потери качества в Xara и тоже пытаюсь разобрать ее на СТ
см. http://slil.ru/28565817 (смотреть лучше в FastStone Image Viewer, там есть лупа)
и что вижу: увеличенную мной в Xara страницу до размера 58,7*41,1 см СТ уменьшает автоматом до 9,5*13,6 см!
Выигрывает от этого читабельность - конечно нет!
 
На мой взгляд, без введения понятия ИП (со всеми ее зависимостями) нам не обойтись!
Предложение:
Перед СТ, ввести стадию анализа сырья: вычислить ИП, предложить! варианты обработки сырья дополнительными плагинами и уже после предварительной обработки передавать в СТ.
На стадии анализа формировать файл для передачи данных в СТ
Для корректировки ИП применять некие типовые сценарии (плагины) из свободного (например) XnView, позволяющего проводить пакетную обработку.
Важно, что по результатам анализа эти сценарии должны быть предложены (рекомендованы), либо выполнены автоматом из собранной библиотеки.
Непосредственно в СТ жестко зафиксировать ИП (т.е., убрать возможность регулирования полей, перейти на жесткую конструкцию – ширина полезной области будет строго равна зафиксированной ИП.

Всего записей: 1131 | Зарегистр. 15-01-2005 | Отправлено: 15:13 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DashoutТакой бурный поток сознания!... А что ты курил?  

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 15:52 29-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01
Андрей Жежерун - это, как минимум, автор WinDjView.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:28 29-01-2010
amz01

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, убедился. Я его смотрелку предпочитаю. Но он только вьювером занимается, получается?

Всего записей: 171 | Зарегистр. 15-09-2005 | Отправлено: 16:47 29-01-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru