Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Важная оговорка. СканТэйлором с моей точки зрения пользоваться "нельзя" - т.е. достаточно затруднено (нет хелпа - раз, есть маленькое окошко на старте - два), чтобы необходимость во вменяемой альтернативе СК не была удовлетворена.  

Значит пользоваться нельзя, потому что нет хэлпа и не нравиться окно, которое появляется только при старте?  Я бы еще понял, если в качестве аргументов вы бы привели невозможность добавить / удалить файл из проекта или скажем отсутствие возможности вручную выделить зону картинки, но ваши аргументы просто смехотворны.  СТ без хелпа освоить проще, чем СК с хелпом.
 

Цитата:
Цитата:
и наличие десятка-другого алгоритмов бинаризации, вращения и масштабирования погоды вовсе не сделают.
 
Извините - не согласен. Как раз наоборот - иной раз и один-единственный, но удачный алгоритм, способен радикально изменить дело. Пример - BookRestorer - программа нам нужна всего лишь ради 3 алгоритмов.  

Я не о том.  Я имел в виду, что альтернатива СТ или СК - это десятки тысяч строк кода, и вращение, масштабирование и бинаризация являются каплей в море.  Приведу статистику по СТ.  Там имеется директория imageproc, в которой собраны алгоритмы обработки изображений, структуры данных, и все что с этим связанно и пригодно для повторного использования.  В других директориях есть еще две-три тысячи строк кода обработки изображений, который жестко привязан к СТ.  Погоды они не делают.
Так вот, на данный момент мы имеем:
imageproc: 22 тысячи строк
все остальное: 36 тысяч строк
То есть видите, даже если бы у вас была библиотека алгоритмов, в которой есть все что нужно, все равно пришлось бы написать десятки тысяч строк кода, чтобы создать альтернативу СК или СТ.
 
Кстати может bolega поделится статистикой по СК?
 

Цитата:
Я уже прямо сейчас мог бы сделать некий "консольный СК" (правда, пока без алгоритмов автообрезки) - с просмотром сканов в стороннем вьювере (просто такая программа не нужна) - ничего особо хитрого нет именно в такой задаче.

И получилось бы что-то вроде unpaper - есть такая консольная прога как раз для наших целей.  Совершенно непригодная к использованию надо скадать - как по функциональности, так и по удобству.
 

Цитата:
СК отличается от любой иной обычной самодельной программы именно наличием специфических алгоритмов + специфический графический движок. Соответственно, если под эти "отличия" сделать готовые самодельные хорошо документированные программные компоненты - то задача создания СК сведётся к написанию рядовой компьютерной программы.  

Разница в сложности между законченной, юзабельной программой и прототипом, даже демонстрирующим похожую функциональность - огромна.  Это понимают все, кто делал эти самые законченные программы (не считая совсем мелких - до 10 тысяч строк).

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:14 19-01-2009 | Исправлено: Tulon, 20:19 19-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
СканТэйлором с моей точки зрения пользоваться "нельзя" - т.е. достаточно затруднено

Категорически не согласен. Может в моем случае сказался опыт в книгопроизводстве в целом и работы в SK в частности. Не спорю. Но на данный момент СТ реально прост. Думаю, что потом он будет сложнее. Я даже надеюсь на это. В плане гибкости настроек. А вот эргономичность их внесения - это уже будет важной задачей для разработчика. Пока он делает это великолепно.

Цитата:
СТ без хелпа освоить проще, чем СК с хелпом.  

Это уж точно. Помню как я голову ломал, пытаясь понять, что же вообще может делать СК. А изучение форумов, дабы познать его особенности - страшно вспоминать. Благо сейчас я в нем разбираюсь достаточно для моего уровня потребностей.

Цитата:
Я бы еще понял, если в качестве аргументов вы бы привели невозможность добавить / удалить файл из проекта или скажем отсутствие возможности вручную выделить зону картинки, но ваши аргументы просто смехотворны.

Tulon, лично я обе эти функции жду с нетерпением. Ценность программы возрастет на 2 головы!

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 21:45 19-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Значит пользоваться нельзя, потому что нет хэлпа и не нравиться окно, которое появляется только при старте?  

Я же написал "нельзя" в кавычках. Можно - но неудобно. И это неудобство достаточно велико, чтобы потребность в нормальной альтеративе СК считалась неудовлетворённой. Я не говорю что "СТ - это зло". Нет, СТ - это, конечно, ещё один шаг вперёд - к созданию альтернативы. Но ещё не сама альтернатива. И вряд ли ею когда-нибудь станет (а скорее, никогда - если уж совсем начистоту сказать). Ибо маленькое окошко на старте - это вовсе не просто так - а это показатель.

Цитата:
но ваши аргументы просто смехотворны.

Жизнь покажет. Кстати, не один я так считаю.  
Объективная реальность не зависит от наших мнений и желаний. Вопрос лишь в том, насколько полно мы желаем удовлетворить запросы этой реальности (довольно жёсткие, кстати). И те, кто не желает с этим считаться - обречены на неуспех.

Цитата:
все равно пришлось бы написать десятки тысяч строк кода, чтобы создать альтернативу СК или СТ.

Не поленюсь повторить уже сказанное: существует понятие "модульность кода". Эти десятки тысяч строк возможно разбить на модули - удобные в повторном использовании.
Да, сложность после этого не исчезнет вовсе - но она уменьшится настолько, что многие программисты-одиночки смогут делать такие программы. Сейчас же они пока ещё не могут - пока нет таких модулей - порог сложности ещё велик. Модули нужны ИМХО такие (к примеру):
1. Bookscanlib - вполне можно сделать в виде dll с простым и удобным для чайника API. Туда должны войти 2 части - сканобработка - и распознавание образов.
2. Графический движок. Можно оформить как готовый MFC-класс - подключаемый в виде dll с простым и удобным для чайника API. Да, сложновато такое сотворить - но можно.
3. FreeImage - уже есть.
 
Этих 3 компонентов будет достаточно, чтобы довести сложность создания альтернативы до принципиального уровня сложности, скажем, DjVu Sep или DjVu Small. Это всё равно, что собирать нечто из Lego-конструктора (а не самому обжигать кирпичи из глины и т.д.).
 
Вы читали PDF-инструкцию к FreeImage? Если нет - то многое потеряли. Это ярчайший пример того, как можно (при желании) свести сложное к простому. Мне всё равно, сколько там внутри FreeImage строк кода - тысяча или миллион - я работаю там всего лишь с несколькими дясятками простых, понятных, и удобных функций.
 
Тем более, что функциональность СК надо разбить на 3-4 независимые программы - а Вы наступаете на те же грабли, что и bolega - всё лепите в одну и ту же программу.

Цитата:
Кстати может bolega поделится статистикой по СК?

Я думаю, что bolega крайне не хотел бы лишиться своего монопольного статуса - чтобы он там ни говорил. Я думаю, что одна из причин - обычное мелкое тщеславие. Отсюда и чрезмерная скрытность.
 
Кстати - предлагаемая мною модель (модульность) заодно навсегда покончит с опасностью монополизации технологий сканобработки теми или иными лицами (что мы наблюдаем сейчас).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:46 19-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Цитата:
Я бы еще понял, если в качестве аргументов вы бы привели невозможность добавить / удалить файл из проекта или скажем отсутствие возможности вручную выделить зону картинки, но ваши аргументы просто смехотворны.
 
Tulon, лично я обе эти функции жду с нетерпением. Ценность программы возрастет на 2 головы!

Редактирование списка файлов в проекте - приоритетная задача, уступающая только доведению до ума автовыделения рамки контента.  А вот что касается ручного выделения картинок - сначала дайте пример, где автовыделение лажает.
 
monday2000

Цитата:
Не поленюсь повторить уже сказанное: существует понятие "модульность кода". Эти десятки тысяч строк возможно разбить на модули - удобные в повторном использовании.
Да, сложность после этого не исчезнет вовсе - но она уменьшится настолько, что многие программисты-одиночки смогут делать такие программы. Сейчас же они пока ещё не могут - пока нет таких модулей - порог сложности ещё велик. Модули нужны ИМХО такие (к примеру):
1. Bookscanlib - вполне можно сделать в виде dll с простым и удобным для чайника API. Туда должны войти 2 части - сканобработка - и распознавание образов.

imageproc
 

Цитата:
2. Графический движок. Можно оформить как готовый MFC-класс - подключаемый в виде dll с простым и удобным для чайника API. Да, сложновато такое сотворить - но можно.  

Qt, в частности QPainter.
 

Цитата:
3. FreeImage - уже есть.

Qt плюс классы TiffReader, TiffWriter, ImageMetadataLoader, TiffMetadataLoader, PngMetadataLoader, JpegMetadataLoader.  Эти классы в сумме дают 1480 строк.  Они не в imageproc (хотя TiffReader и TiffWriter не привязаны к СТ - могли бы быть в imageproc), так что вычтем эти полторы тысячи строк из тех 36 тысяч.  А за остальные 34 с половиной вы никак на отчитались.  В общем никакая модульность не понизит сложность разработки ниже нескольких десятков тысяч строк.  Кстати, а поддерживает FreeImage многостраничные TIFFы?  Нет?  Тогда класс TiffReader вам всетаки придется написать.  А поддерживает считывание ширины / выстоты и DPI из файла, не загружая его целиком?  Тоже нет?  Тогда и все *MetadataLoader вам тоже понадобятся.  В общем программирование это не сборка конструктора Lego.
 

Цитата:
Цитата:
Кстати может bolega поделится статистикой по СК?
 
Я думаю, что bolega крайне не хотел бы лишиться своего монопольного статуса - чтобы он там ни говорил. Я думаю, что одна из причин - обычное мелкое тщеславие. Отсюда и чрезмерная скрытность.  

Ну, поделиться статистикой это ему никак не может помешать.  Разве что там сильно мало строк, что сомнительно.
 

Цитата:
Кстати - предлагаемая мною модель (модульность) заодно навсегда покончит с опасностью монополизации технологий сканобработки теми или иными лицами (что мы наблюдаем сейчас).

А почему это "теми или иными" во множественном числе?
Ко мне это не относиться.  Исходники открыты, я даже готов объяснить непонятные места, если кто попросит.  Кроме того, imageproc нисколько не зависит от СТ - отодрать его от СТ не составляет проблемы.  К Qt он правда привязян, но не более чем ваши алгоритмы привязаны к FreeImage.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:34 19-01-2009 | Исправлено: Tulon, 22:37 19-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
О приоритетной задаче - это хорошо.
Выделение картинок на моих 2-3 проектах пока не "лажали". Но мало ли... Да и мысль все таки осталась об использовании DjVu Sep. Хотя её я и в проектах SK ещё не тестировал. Хотя эту идею тут уже вроде успели раскритиковать.
Tulon, в личку скинул материал с проблемными местами. Надеюсь найдешь с его помощью баги. А то мне ничего другого не оставалось, как необрабатываемые в СТ сканы доработать в СК.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:44 20-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
Ответил в личку.
Походу ru-board не умеет оповещать о личных сообщениях, или я чего пропустил?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:48 20-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Умеет, поищите в настройках (будет выскакивать окошко, когда вы открываете/обновляете закладки).
 
Добавлено:
denver 22

Цитата:
Да и мысль все таки осталась об использовании DjVu Sep. Хотя её я и в проектах SK ещё не тестировал. Хотя эту идею тут уже вроде успели раскритиковать.  
Метод нормальный, правда я предпочитаю кодировать книги с картинками в DEE - я выкладывал профиль, который у меня нормально работает. А вот для кодирования методом разделенных сканов лучше использовать FSDv1.2. За DjVu Sep не ручаюсь - monday2000 сильно мудрил с методом разделенных сканов.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 03:33 20-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В IE у меня сообщение выскакивало. В FireFox в верхней шапке появляется анимированное сообщение. Tulon, значит не зря я заранее оповещал о своих сообщениях?
Arcand, я сейчас как раз и использую те профили кодирования, которые ты мне дал для DEE. При этом в СТ для вывода использую смешанный режим. А в СК - "Zone – Picture zone – Merge zones...".  
Я лишь хотел посмотреть какие результаты будет давать метод разделенных сканов. FSDv1.2 - это что за программа?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 07:14 20-01-2009 | Исправлено: denver 22, 07:17 20-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
За DjVu Sep не ручаюсь - monday2000 сильно мудрил с методом разделенных сканов.  

Зато я ручаюсь. Если что не так - давайте конкретные примеры. А голословно обвинять - нехорошо.

Цитата:
А вот для кодирования методом разделенных сканов лучше использовать FSDv1.2.

FSD v1.2 - это принципиально одно и то же, что и DjVu Sep. Разница только в интерфейсе. И FSD v1.2, и DjVu Sep построены на Вашем с manfred исходнике pnmtodjvurle.
 
Tulon

Цитата:
imageproc

Что это такое? Библиотека алгоритмов?

Цитата:
Qt, в частности QPainter.

Почему же в СканТейлоре нет скроллбаров? Они что, не поддерживаются этим QPainter? А экранное сглаживание в QPainter есть?

Цитата:
Кстати, а поддерживает FreeImage многостраничные TIFFы?

Да. И метаданные тифа тоже.

Цитата:
А поддерживает считывание ширины / выстоты и DPI из файла, не загружая его целиком?  

Кажется, нет. Точно не могу сказать - надо узнавать. Даже если и нет - то это можно реализовать (обкорнать существующий там класс я и сам смогу) - и просто ввести в FreeImage дополнительную функцию.

Цитата:
А за остальные 34 с половиной вы никак на отчитались.

А что они делают? Может, и там можно что-то в модули упаковать?

Цитата:
В общем никакая модульность не понизит сложность разработки ниже нескольких десятков тысяч строк.

"Большой размер" это не всегда синоним понятия "сложность". Программа может быть большой - но состоять из относительно простых типовых элементов - и наоборот. Если эти "десятки тысяч строк" состоят из типовых конструкций Qt (или MFC) - то это относительно не так уж страшно. Страшно - это когда нужен, например, компонент-графический движок - а его нет. Даже если он и в пределах тысячи строк.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:35 20-01-2009 | Исправлено: monday2000, 10:00 20-01-2009
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
FSDv1.2 - это что за программа?

GUI для msepdjvu от manfred

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 09:57 20-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
FSDv1.2 - это что за программа?

http://www.djvu-soft.narod.ru/fsd_manfred_v1_2.rar
 
Добавлено:
Tulon

Цитата:
А почему это "теми или иными" во множественном числе?  
Ко мне это не относиться. Исходники открыты, я даже готов объяснить непонятные места, если кто попросит.

Ну тогда я Вас попрошу написать хелп к Вашей программе.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:02 20-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
Цитата:
я сейчас как раз и использую те профили кодирования, которые ты мне дал для DEE.
Я пропустил важный момент - для получения приемлегого качества при кодировании на рисунках надо удалить растр, а то могут вылезать дефекты и искажения из-за растра. О смысле настроек профилей я говорил здесь
Если результат по качеству не устраивает поиграйтесь Quality и BackGround Subsample. Если не устраивает разделение рисунка на маску и фон соответственно поиграйтесь Threshold Level, Pixel-Filter Level и Shape-Filter Level. Но надо набить руку. Поначалу результат может показаться неожиданным. Например, начинаешь уменьшать Threshold Level (больше в маску) а в маску попадает тем не менее меньше (это потому, что большие обекты из маски перекидываются в фон).
 
monday2000
Цитата:
Если что не так - давайте конкретные примеры. А голословно обвинять - нехорошо.
Так мои слова "я не ручаюсь" не есть обвинение - их надо понимать как не тестил. В свое время было много говорено, что и как делается в методе разделенных сканов и я совсем не уверен, что Вы поняли меня и сделали все оптимальным образом.
Для уточнения задам вопрос. Как кодируется в DjVu Sep книга состоящая из bw сканов (текст) и gray сканов (текст и с рисунки). Насколько я понял из Ваших слов bw кодируется в DEE (в documenttodjvu.exe), gray в msepdjvu.exe, потом дежавю склеиваются. Слишком хитромудро .
В FSD все сканы кодируются в msepdjvu.exe, ничего не склеивается - словарь можно сделать один на книгу.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 12:25 20-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Цитата:
imageproc
 
Что это такое? Библиотека алгоритмов?  

Алгоритмов и структур данных.  Все что касается обработки изображений и не привязано к СТ.
 

Цитата:
Почему же в СканТейлоре нет скроллбаров? Они что, не поддерживаются этим QPainter? А экранное сглаживание в QPainter есть?  

Скроллбаров нет потому, что мне больше нравиться драг чем скроллбары.  Кстати учтите, что колесо мыши уже задействовано для зума, так что если бы скролбары и были, их пришлось бы скролить вручную.  К тому же в последних бетах зуминг стал центрированным по курсору, а не по центру.  То есть я могу навести курсор на ту зону, которую хочу увеличить, и при увеличении она не уедет за пределы экрана.
А что касается сглаживания в QPainter - оно есть, только походу использует билинейную фильтрацию (даже если бикубическую - это ничего не меняет), которая плохо подходит для уменьшающих преобразований, поскольку интерполирует только между четырьмя соседними пикселями.  В общем пришлось мне городить свой механизм для высококачественного антиалиазинга.  Но даже с учетом некоторых слабостей, QPainter все равно самый мощный движок 2D рисования из тех, что я видел.
 

Цитата:
Цитата:
А за остальные 34 с половиной вы никак на отчитались.
 
А что они делают? Может, и там можно что-то в модули упаковать?  

Они много всего делают, и они специфичны для СТ.  Например класс PageId привязан к СТ в том смысле, что предполагает раздельную обработку половинок двухстраничного скана.  А уж к этому классу привазана добрая половина всех остальных.
 

Цитата:
Цитата:
В общем никакая модульность не понизит сложность разработки ниже нескольких десятков тысяч строк.
 
"Большой размер" это не всегда синоним понятия "сложность". Программа может быть большой - но состоять из относительно простых типовых элементов - и наоборот. Если эти "десятки тысяч строк" состоят из типовых конструкций Qt (или MFC) - то это относительно не так уж страшно. Страшно - это когда нужен, например, компонент-графический движок - а его нет. Даже если он и в пределах тысячи строк.

А что значит типовые конструкции Qt или MFC?  Естественно активно используются Qt'шные классы, там где Qt предоставляет то, что надо.
Я просто хочу сказать, что других альтернатив ждать не стоит, потому что это огромный объем работы, даже если выдрать и использовать ту же imageproc из СТ.  Вообще, если существует проект с открытыми исходниками для определенной задачи, то нужны очень веские причины, чтобы начинать делать альтернативу.  Такой причиной например может быть "легче написать с нуля, чем довести это до ума", что к СТ явно не относиться.  Так какая же по вашему может быть причина создавать еще одну альтернативу?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:17 20-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Как кодируется в DjVu Sep книга состоящая из bw сканов (текст) и gray сканов (текст и с рисунки).

Всё подробно расписано тут:
 
http://www.djvu-soft.narod.ru/scan/djvu_sep.htm
 
Обычные Сканы-текст ЧБ кодируются в documenttodjvu.exe. Сканы, имеющие картинку, разделяются в СК на пару субсканов - и эта пары кодируется через сsepdjvu.exe.
Затем то, что получилось из пар, автоматом вставляется в нужные места того, что вышло из-под documenttodjvu.exe.

Цитата:
и я совсем не уверен, что Вы поняли меня и сделали все оптимальным образом.

Всё я так понял и всё оптимально сделал. Народ на ершовском форуме уже потестил и благодаря им я нашёл все баги и устранил их.

Цитата:
В FSD все сканы кодируются в msepdjvu.exe, ничего не склеивается - словарь можно сделать один на книгу.

Это-то да. Но msepdjvu.exe - это варез. ИМХО нам ни к чему лишний раз использовать варез - если можно достаточно удовлетворительно обойтись легальным софтом. DjVu Sep - абсолютно легальная программа, а FSD - варез.
Вот когда Леон Боту подправит подклейку фонов - тогда можно будет сделать программу, работающую точно так же, как и msepdjvu.exe - т.е. с единым словарём.
 
Добавлено:
Tulon

Цитата:
Скроллбаров нет потому, что мне больше нравиться драг чем скроллбары.  Кстати учтите, что колесо мыши уже задействовано для зума, так что если бы скролбары и были, их пришлось бы скролить вручную.  

Да, вручную - ну и что? А таскать рисунок мышкой вручную - что, легче?

Цитата:
Например класс PageId привязан к СТ в том смысле, что предполагает раздельную обработку половинок двухстраничного скана.

ИМХО это нерационально. Проще изначально делить скан на 2 половинки - и потом работать с каждой отдельно. Тут Вы также повторяете такую же ошибку bolega.

Цитата:
А что значит типовые конструкции Qt или MFC?  

Я имел в виду стандартные классы Qt или MFC.

Цитата:
Я просто хочу сказать, что других альтернатив ждать не стоит, потому что это огромный объем работы, даже если выдрать и использовать ту же imageproc из СТ.

Я не говорю, что все бросятся делать эти альтернативы. Разумеется, всё это достаточно непросто. И потом - я не знаю, что там и как в Qt - не могу судить.
Я могу лишь с точки зрения MS Visual C++ и MFC объяснить:
MFC - это библиотека классов и функций. Написание MFC-программы, грубо говоря, сводится к использованию этих классов и функций. Конечно, это достаточно непростое занятие - писать MFC-программу.
Но если под какую-то задачу нет нужного класса или нужных функций - то тогда задача написания программы усложняется вообще неимоверно. Именно такая ситуация и наблюдается ИМХО - по крайней мере, с точки зрения MS Visual C++ и MFC. Qt я не знаю и пока не собираюсь изучать.
Логика в том, чтобы сделать эти самые недостающие MFC-классы и функции - и тогда задача создания альтернативы сильно упростится (перейдя из категории "невозможно" в категорию "трудно").
 
Добавлено:

Цитата:
Так какая же по вашему может быть причина создавать еще одну альтернативу?

Да причин немало. Я вообще вижу сканобработку концептуально немного не так, как Вы её делаете в СТ. В СТ можно насобирать много мелочей - которые в сумме слишком меня не устраивают. Вот список ещё раз:
 
1. Маленькое окошко на старте.
2. Нет хелпа.
3. Нет скроллбаров.
4. Сглаживание и TIF - если будет, то хорошо.
5. Вся функциональность лепится в одну программу.
 
Вы вообще так как-то говорите, словно не хотите появления ещё одной альтернативы. Да хотя бы то, что я, к примеру, не хочу лезть в Qt - а кто-то, может, признаёт только Delphi. По крайней мере, библиотека алгоритмов пригодится решительно всем, кто бы ни вознамерился делать ещё одну альтернативу - ибо её относительно нетрудно будет перебить и под Qt, и под Delphi (под Delphi сложнее, мне Delphi очень не нравится - по синтаксису языка). И графический движок - его архитектура будет одинаковой что под Visual C++, что под Делфи.
 
Кроме того - не только в альтернативе дело - есть потребность в целом спектре скан-программ.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:24 20-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 

Цитата:
Цитата:
Так какая же по вашему может быть причина создавать еще одну альтернативу?
 
Да причин немало. Я вообще вижу сканобработку концептуально немного не так, как Вы её делаете в СТ. В СТ можно насобирать много мелочей - которые в сумме слишком меня не устраивают. Вот список ещё раз:
 
1. Маленькое окошко на старте.
2. Нет хелпа.
3. Нет скроллбаров.
4. Сглаживание и TIF - если будет, то хорошо.
5. Вся функциональность лепится в одну программу.  

То есть по вашему проще создать альтернативу СТ чем написать хэлп и добавить скроллбары?  Даже если я не приму скроллбары в основную ветку (ну не нравится мне эта идея и все тут), можно в принципе выпускать свою модификацию со скроллбарами.  Кстати программисты хэлпов обычно не читают, так что этот пункт можно смело исключить.  А TIFF и высококачественный антиалиазинг есть в последних бетах.
 

Цитата:
Вы вообще так как-то говорите, словно не хотите появления ещё одной альтернативы.

Я бы предпочел чтобы народ работал над улучшением СТ, а не над альтернативами или бесполезными для СТ алгоритмами обработки изображений.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:13 20-01-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Цитата:
Обычные Сканы-текст ЧБ кодируются в documenttodjvu.exe. Сканы, имеющие картинку, разделяются в СК на пару субсканов - и эта пары кодируется через сsepdjvu.exe.

Цитата:
Но msepdjvu.exe - это варез. ИМХО нам ни к чему лишний раз использовать варез - если можно достаточно удовлетворительно обойтись легальным софтом.
Я балдею - documenttodjvu.exe (чистейший варез) использовать можно, а msepdjvu.exe уже нельзя, видите ли варез. Ха-ха. Не надо вешать лапшу, сознайтесь лучше, что не разобрались в методе разделенных сканов.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 16:21 20-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
То есть по вашему проще создать альтернативу СТ чем написать хэлп и добавить скроллбары?

Если СТ и дальше будет развиваться без родного хелпа - то ИМХО одно это достаточное основание для иной альтернативы. См. на СК как пример. Правда, здесь, в отличие от СК, можно залезть в исходники и посмотреть. Понимаете, у меня своё видение подобной программы - и если СТ ему не соответствует хоть в чём-то существенном (как хелп) - то по мне - он вообще неинтересен - кроме как копилка агоритмов и идей.
Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения.
"Добавить скроллбары" - не знаю, насколько это сложно. Я в Qt не разбираюсь. Что если сложность добавления скроллбаров равна написанию новой программы - мне не известно.

Цитата:
А TIFF и высококачественный антиалиазинг есть в последних бетах.

Это очень хорошо.

Цитата:
Я бы предпочел чтобы народ работал над улучшением СТ, а не над альтернативами или бесполезными для СТ алгоритмами обработки изображений.

Одно другому не мешает. Но, раз уж Вы не хотите убирать маленькое окошко, писать хелп - то я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу и ещё раз посмотреть, что она такое есть. Т.е. я давно естественным образом утратил к СТ хоть какой-либо интерес - раз уж там нет того, что мне хотелось бы там обязательно увидеть. Я просто не представляю себе пока при всём желании - как такую программу можно применить для сканобработки... Это ИМХО всё что угодно - но пока уж никак не программа сканобработки.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:37 20-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Мне хотелось бы увидеть успешную у юзеров программу - а это налагает достаточно жёсткие рамки - когда собственное "хочу-не хочу" уже не имеет никакого значения.  

Но собственное-то ваше "хочу-не-хочу" похоже имеет для вас значение, иначе вы взялись бы, да написали этот самый хэлп для СТ.  Тем более что я готов отвечать на вопросы / дополнять / исправлять.
 

Цитата:
Но, раз уж Вы не хотите убирать маленькое окошко, писать хелп - то я уже просто не могу себя заставить хотя бы просто ещё раз запустить Вашу программу и ещё раз посмотреть, что она такое есть.

Я так и понял
И когда же вы в последний раз его пробовали?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:46 20-01-2009 | Исправлено: Tulon, 16:47 20-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Я балдею  - documenttodjvu.exe (чистейший варез) использовать можно, а msepdjvu.exe уже нельзя, видите ли варез.

И documenttodjvu.exe тоже нельзя - да вот деваться некуда - так что ПОКА вынуждены. А в случае msepdjvu.exe такой безнадёги нет - взамен msepdjvu.exe вполне можно применить не намного более худшую сsepdjvu.exe.
Надеюсь, придёт время - и от documenttodjvu.exe откажемся. Это просто случайность, что пока никому нет дела до широкого распространения documenttodjvu.exe и нас никто не взял за задницу. А Вы попробуйте кряк от ФайнРидера, Касперского или 1С свободно пораспространять.

Цитата:
сознайтесь лучше, что не разобрались в методе разделенных сканов.

Да в чём там разбираться-то? Там всё элементарно просто.
 
Я не исключаю, что 3-х ступенчатая схема, предложенная мною в http://www.djvu-soft.narod.ru/scan/djvu_sep.htm , ещё сложновата для восприятия. Хотя уже сейчас конечному пользователю не надо вникать в детали МРС. Достаточно разметить Picture-зоны в СК, обработать - и затем последовательно:
 
1. Бросить папку out в DjVu Small и нажать Пуск.
2. Бросить папку out в DjVu Sep и нажать Пуск.
3. Нажать Источн. в DjVu Sep и выбрать результат из п.1.
4. Нажать "Вставить в DjVu" в DjVu Sep.
 
Сложно? Да, что-то есть. Но это же молодая технология - она ещё может совершенствоваться. Всё новое сначала рождается как сложное - и только потом со временем упрощается.
Конечно, объединять DjVu Small и DjVu Sep в одну программу (как это сделал бы bolega на моём месте) глупо и неправильно.
Пусть сначала вся технология обкатается "как есть". А дальше время покажет, как её упростить/улучшить.
 
Добавлено:
Tulon

Цитата:
иначе вы взялись бы, да написали этот самый хэлп для СТ

Ну почему этот хелп должен писать кто-то, отличающийся от Вас? Только Вы один знаете свою программу до мозга костей - и можете дать наиболее полное её описание, весь её концептуальный замысел. Некоторые моменты там мне совершенно непонятны. К тому же - меня вот оскорбляет идея написания хелпа к чужой программе, когда доступен её автор.

Цитата:
И когда же вы в последний раз его пробовали?

Версию 0.9 запускал - и, ничего не поняв с налёту, "закрыл и забыл". Беты не смотрел. Я рассуждаю так: "раз нет хелпа - то не стоит и трудиться пытаться разобраться". Потому что именно так поступит львиная доля потенциальных юзеров - я стараюсь ставить себя на их место, чтобы представить себе их реакцию на программу. Только они-то Вам ничего не скажут - просто молча проигнорируют СТ - и по привычке откроют СК.
 
Я бы делал всё так:
 
1. Сначала - программа, разрезающая сдвоенные развороты (ошмётки) и делающая deskew. И всё, и больше ничего! Никаких "лишних" наворотов! Режим цветности не меняется - вошло серое - и вышло серое и т.д. Сложна ли такая программа? Нет, относительно проста. Только вот нет пока графического движка для неё (это там самое сложное). Смысл - отправить в топку все эти "левые-правые" страницы - как в СК. Все сканы должны изначально становиться и не левыми, и не правыми - а "одинаковыми".
 
2. Затем программа по Grey - Color Enhance + расстановка Picture-зон.
 
3. Наконец, программа по автообрезке (понимающая на входе Picture-зоны из п.2).
 
Вот так - минимум 3 независимые программы - и не меньше. Иначе - чудовищная перегрузка интерфейса и внутреннее неимоверное усложнение программы - вплоть до такой степени, когда она выходит из-под контроля самого автора.
 
Кроме того - наличие именно как минимум 3 раздельных программ позволяет проделывать отдельные этапы обработки в иных программах - кому как захочется.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:51 20-01-2009 | Исправлено: monday2000, 16:57 20-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну почему этот хелп должен писать кто-то, отличающийся от Вас?

Кому больше всех надо, тот вполне мог бы и написать - дело это вполне посильное.  А автор между прочим и так вложил много усилий в этот проект, и по моему вполне в праве надеятся на то, что хоть какие-то задачи кто-то сделает за него.
 

Цитата:
Версию 0.9 запускал - и, ничего не поняв с налёту, "закрыл и забыл".

Так вы вообще никаких усилий не хотите прилагать.  С таким отношением я не уверен, что вы и хэлп прочитали бы.  Или скажем начали бы читать, и на первом же непонятном месте забросили бы.  Вполне можно было бы спросить здесь, что вам там не понятно было.  Да, я понимаю: "есть кромсатор, им я пользоваться умею - зачем мне прикладывать усилия для изучения чего-то другого".  Это в принципе нормальная реакция пользователя СК, которого он в общем и целом устраивает.  Но вы то вроде не из тех, кого он устраивает

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:44 20-01-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru