Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amz01, три первые статьи были выложены мной ранее. Тролль должен каго-то зацепить. Кипешь подняли как малое дите. Лучше б изображения дали.  
Tulon, это указывается в исходниках. Я думаю, автор хочет, чтобы было и в бинарниках. Это можно будет осуществить?

Всего записей: 412 | Зарегистр. 03-08-2007 | Отправлено: 23:39 03-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Tulon, это указывается в исходниках. Я думаю, автор хочет, чтобы было и в бинарниках. Это можно будет осуществить?

Я конечно могу это сделать, но это будет под честное слово, так как в GPLv3 такого требования нет.  Если скажем кто-то захочет взять этот код и вставить в свою собвственную программу, он не обязан упомянать авторов в окне About или где-либо еще, кроме как в исходном коде.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:03 04-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот пример работы dewarp от Rob в новом СТ:
 
http://www.djvu-soft.narod.ru/scan/curved_sample.rar (1 МБ)
 
В этом примере алгоритм Rob вообще никак не меняет исходный искривленный скан.
В этом примере алгоритм Rob выпрямляет исходный искривленный скан, но при этом сильно уродует часть строк скана.
 
Для сравнения там же прилагается тот же образец, но выпрямленный в Book Restorer 4.2.1 (получилось отлично).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:03 04-02-2010 | Исправлено: monday2000, 16:16 04-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Алгоритм Rob'a заточен под серые сканы и жестким ограничением разрешения. Может поэтому и не обработал. Согласен, алгоритм странно себя ведет - иногда так искривляет изображения (изначально без геометрических искажений для текста), что и нарошно не сделаешь .
monday2000, просьба выложите исходную картинку в bmp или tiff. Желательно серую.

Всего записей: 412 | Зарегистр. 03-08-2007 | Отправлено: 14:09 04-02-2010 | Исправлено: woodyfon, 14:13 04-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хм. Я попробовал обработать черно-белую страницу из Djvu (предварительно удалив красный штамп), и вот что у меня получилось:
 
http://www.thessalonica.org.ru/downloads/curved_sample.tiff
 
Как видим, результат обработки некорректен и, можно сказать, демонстрирует разом все глюки алгоритма, но тем не менее нельзя сказать, что скан "никак не меняется"

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 14:16 04-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
woodyfon
Выложил. Линк тот же.
 
Добавлено:
anagnost96

Цитата:
но тем не менее нельзя сказать, что скан "никак не меняется"

Извиняюсь, я ошибочно не придал значения замечанию Tulon насчёт только чёрно-белого режима. Это Tulon забыл сделать, чтобы флажок Dewarp не показывался при режиме "Смешанный".
 
Добавлено:
anagnost96
Я подправил свой пример - сделав dewarp в новом СТ в режиме "Чёрно-белый". Ссылка та же.
 
Добавлено:
Я, кстати, именно под эту книгу делал ST GreyText - т.к. на сканах этой книги полно скриншотов диалоговых окон, и при этом все сканы этой книги нуждаются в выравнивании освещённости и выпрямлении искривленных строк а-ля BR.
 
Очевидно, что СТ пока что на это неспособен - но и cделать предложенный мною вывод "только текст (в режиме серого)" пока что никто не торопится (чтобы делать выравнивание освещённости и выпрямление искривленных строк в BR).
 
А как иначе прикажете делать такие сканы (если с участием СТ)? Так что, именно для таких сканов ST GreyText (или иное похожее решение) - пока что единственный выход.
 
Добавлено:
Я занёс в шапку 2 ссылки: на последний СТ и на свой пример исправления искривления строк, а также немного "причесал" шапку.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:21 04-02-2010 | Исправлено: monday2000, 17:08 04-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 

Цитата:
Я конечно могу это сделать, но это будет под честное слово, так как в GPLv3 такого требования нет.

 
Более того, добавление подобного требования к лицензии сделает ее заведомо несовместимой с GPL. В этой связи уместно вспомнить историю с XFree86 4.4: там попытка модифицировать лицензию именно в таком духе привела к всеобщему бойкоту проекта.
 
monday2000
 

Цитата:
А вывод каждого сорта сканов в свою папку внутри "out" Вы смогли бы сделать?

 
А смысл? Всё равно файлы после каждого прогона требуют переименования и некоторой постобработки (хотя бы приведения пиксельных размеров к кратным значениям).
 

Цитата:
все сканы этой книги нуждаются в выравнивании освещённости и выпрямлении искривленных строк а-ля BR

 
Ну, по выложенной странице не видно, чтобы там требовалось какое-то особое выравнивание освещения: уж бинаризацию-то СТ делает вполне прилично.
 
Кстати, я обнаружил интересный момент: оказывается, результат работы dewarping'а зависит от настроек порога бинаризации. В данном случае его уменьшение на несколько единиц существенно улучшает картину.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 19:19 04-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
Всё равно файлы после каждого прогона требуют переименования и некоторой постобработки (хотя бы приведения пиксельных размеров к кратным значениям).

Это я не понял. Что такое "файлы после каждого прогона"? Имеется в виду "каждый сорт выводных сканов (типа "только текст, только изображения")"? Зачем переименование? Зачем приведение пиксельных размеров к кратным значениям? Я бы ничего этого не делал.

Цитата:
А смысл?

Ну как же - а зачем же Вы делали свой патч для СТ? В смысле, для чего Вы делали возможность вывести "только текст", "только изображения"? Я-то подразумеваю, что Вы это сделали для одной-единственной цели: чтобы получить пары субсканов для метода разделённых сканов. Никакой другой цели ведь просто и быть не может (по крайней мере, на сегодняшнем уровне развития технологий DjVu-книгосканирования).
 
А для метода разделённых сканов как раз было бы удобно, чтобы соответствующие виды субсканов (передние субсканы - "только текст", задние субсканы - "только изображения") изначально накапливались каждый вид в своей папке.
 
А сейчас ведь надо сначала получить "только текст" в папке out - и скопировать эти сканы в отдельную папку, затем получить "только изображения" в папке out - и тоже скопировать эти сканы в свою отдельную папку, т.е. лишние телодвижения.

Цитата:
Ну, по выложенной странице не видно, чтобы там требовалось какое-то особое выравнивание освещения: уж бинаризацию-то СТ делает вполне прилично.

Да, не очень видно. Если попадётся под руку - я выложу более очевидный пример. Я имел в виду, что примерно половина сканов той книги одновременно и содержат полутоновую иллюстрацию, и нуждаются в выравнивании кривых строк-коррекции освещённости в BR. А в BR-то загоняются все сканы книги без разбора - те, которые нуждаются в обработке, и те, что нет (поэтому на этом скане и не видно, что ему нужно освещённость выравнивать).
 
Добавлено:
Кстати - действительно можно вместо раскладывания по папкам задавать в именах сканов из каждого сорта вывода свой некий суффикс - так, как это делается в СК. Например, в имена сканов "только изображения" добавлять сзади суффикс ".sep" (как в СК).
 
Сделайте хоть так (хотя раскладывание по папкам куда предпочтительнее).
 
Добавлено:
anagnost96
Как бы Вы ни сделали - то ли раскладывание по папкам, то ли добавление суффикса - я потом просто модифицирую и DjVu Small, и DjVu Imager так, чтобы они смогли напрямую "понимать" этот отличительный признак (разных сортов вывода).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:41 04-02-2010 | Исправлено: monday2000, 20:56 04-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Имеется в виду "каждый сорт выводных сканов (типа "только текст, только изображения")"?

 
Ну да.
 

Цитата:
Зачем переименование?

 
В первую очередь именно ради того, чтобы имена задних субсканов отличались специфическим суффиксом (я использую 'bg', но можно и 'sep').
 

Цитата:
Зачем приведение пиксельных размеров к кратным значениям?

 
Затем, что по спецификации djvu размеры маски должны быть строго кратными размерам фона. Без этого склеивание слоев посредством djvumake просто не работает. По уму, конечно, СТ сам должен следить, чтобы пиксельные размеры соответствовали данному требованию, но я не очень представляю, как это сделать.
 

Цитата:
Кстати - действительно можно вместо раскладывания по папкам задавать в именах сканов из каждого сорта вывода свой некий суффикс - так, как это делается в СК.

 
Это будет совсем плохо. Ну, допустим, заднему субскану суффикс и правда нужен, но для остальных вариантов вывода (а их минимум два: "только текст" и "текст и изображения") он будет только помехой. Нет, раскладка по папкам выглядит более выигрышно с точки зрения логики, но и ее не так просто реализовать. Ведь как минимум понадобится вместе с основными субсканами выводить и несколько наборов уменьшенных изображений для ленты предпросмотра, а потом еще и переключаться между ними по мере необходимости. Причем, прошу заметить, лично для меня польза от этой работы будет нулевая, пока не найдется решения по предыдущим двум пунктам.
 
И еще: вот, допустим, некоторые страницы выводятся в черно-белом режиме, а другие -- в смешанном с установкой "только текст". Куда их класть: в ту же папку, или в разные?

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 21:43 04-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
А как продвигается поддержка пользовательских зон в ST Pic 1.0? Вы же разобрались, они в xml прописаны?
Ведь, доведи Вы ее до конца, особой необходимости в патче (по крайней мере в текущей редакции) не было бы.. Прошел в смешанном режиме в один проход, чуть поправил зоны, разложил через ST Pic на составляющие, и в путь!
И поддержка новых версий ST была бы автоматической...

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 22:23 04-02-2010 | Исправлено: StanFreeWare, 08:20 05-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
По уму, конечно, СТ сам должен следить, чтобы пиксельные размеры соответствовали данному требованию, но я не очень представляю, как это сделать.

Что-то я не понимаю: зачем что-то делать в этом отношении? Когда я создаю "только текст" (передний субскан), а затем "только изображения" (задний субскан) в Вашем клоне СТ (СТА), то пиксельные размеры обоих получаемых субсканов одинаковы. Всё, больше ничего не требуется - кратное изменение размеров следует делать уже в программе, кодирующей задние субсканы по методу разделённых сканов (у передних субсканов менять пиксельный размер не требуется). Например, DjVu Imager делает такое кратное изменение размеров - при использовании параметра ДЗФ. Я бы даже сказал, что делать такое кратное изменение размеров в СТ ни в коем случае не следует.
 
Кстати, раскладывание по папкам достаточно сделать только для режимов "только текст" и "только изображения", а "текст и изображения" пусть себе выводятся в out (как сейчас).
 
Добавлено:
StanFreeWare

Цитата:
А как продвигается поддержка пользовательских зон в ST Pic 1.0? Вы же разобрались, они в xml прописаны?

Я забросил эту программу. Когда я её делал, я ещё не вполне понимал, что такое СТА, и что он делает. Оказалось, что СТА ликвидирует нужду в такой функциональности ST Pic 1.0, как генерация субсканов из чёрных трафареток обычного СТ + файл задания СТ. Это был бы такой страшенный геморрой для меня, что без крайней нужды делать это мне не захотелось.
 
Добавлено:
StanFreeWare

Цитата:
И поддержка новых версий ST была бы автоматической...

Гораздо разумнее, и во всех отношениях правильнее было бы, если бы Tulon сделал СТА основной версией СТ. Думаю, ему было бы несложно разобраться в коде патча от anagnost96.
 
Я даже не знаю - и почему это Tulon пока не сделал СТА основной версией СТ? Сделать это совершенно необходимо - т.к. СТ в чистом виде никуда не годится, а только лишь СТА более-менее приемлем как средство сканобработки (разумеется, только вкупе с ST GreyText).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:49 05-02-2010 | Исправлено: monday2000, 09:58 05-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Что-то я не понимаю: зачем что-то делать в этом отношении? Когда я создаю "только текст" (передний субскан), а затем "только изображения" (задний субскан) в Вашем клоне СТ (СТА), то пиксельные размеры обоих получаемых субсканов одинаковы.

 
Патч делался не в последнюю очередь для того, чтобы избежать потребности в выводе картинок в увеличенном разрешении. Т. е. я вывожу текст на 600 dpi, а картинки -- чаще всего в родном разрешении (например, 300). При таком использовании пиксельные размеры никак не могут быть одинаковыми.
 

Цитата:
кратное изменение размеров следует делать уже в программе, кодирующей задние субсканы по методу разделённых сканов (у передних субсканов менять пиксельный размер не требуется).

 
А придется менять: ведь вполне может получиться, что длина или ширина переднего субскана элементарно не делится на нужное число (например, 2). Между прочим, спецификация djvu рекомендует, чтобы пиксельные размеры были кратными двенадцати, чего СТ, конечно, не соблюдает.
 

Цитата:
Я бы даже сказал, что делать такое кратное изменение размеров в СТ ни в коем случае не следует.  

 
Смысл как раз в том, чтобы по возможности не менять размеры картинок (ни в СТ. ни где-либо еще), а вместо этого всё время работать с родным размерением.
 
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 10:11 05-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
И еще: вот, допустим, некоторые страницы выводятся в черно-белом режиме, а другие -- в смешанном с установкой "только текст". Куда их класть: в ту же папку, или в разные?

В разные. Всегда в разные. Это пусть потом DjVu Imager разбирается, где в какой папке что лежит - не так уж и трудно. Я буду указывать DjVu Imager СТ-шную папку out и некий признак "сканы из СТ" - и он сам будет рыскать по папкам внутри out и разбираться, где там что лежит.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:12 05-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
В разные. Всегда в разные. Это пусть потом DjVu Imager разбирается, где в какой папке что лежит

 
Не все работают с DjVu Imager. Лично для меня такое количество папок только затруднит работу. Я бы сортировал сканы просто по принципу цветности, независимо от того, из какого режима они получены. Ну, смешанные ("Текст и изображения"), конечно, отдельно.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 10:17 05-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
Т. е. я вывожу текст на 600 dpi, а картинки -- чаще всего в родном разрешении (например, 300).  

Не понимаю. Я только что попробовал сделать вывод и "только текст", и "только изображения" в СТА - получил 2 субскана, оба по 600 dpi, и оба одинаковых пиксельных размеров. В таком виде нормально, больше ничего не нужно.
 
А, так Вы при выводе "только изображения" переключаете выводное DPI на 300 dpi? А зачем? Не надо этого делать - пусть остаётся на 600 dpi - так же, как и "только текст".

Цитата:
А придется менять: ведь вполне может получиться, что длина или ширина переднего субскана элементарно не делится на нужное число (например, 2).  

Да нет же, не прийдётся. Ну и что, что не делится на 2? Это не проблема, вот формула: http://www.djvu-soft.narod.ru/soft/fi_c44.htm :

Цитата:
dib = FreeImage_Rescale(dib_tmp, (int)((width+(flag_bsf-1))/flag_bsf),(int)((height+(flag_bsf-1))/flag_bsf), FILTER_BICUBIC);

flag_bsf - коэффициент масштабирования, 2...12.
Формула рассчитана на любое значение пиксельных размеров. Формула официальная, взята из csepdjvu, и не раз была проверена в деле.

Цитата:
Смысл как раз в том, чтобы по возможности не менять размеры картинок (ни в СТ. ни где-либо еще), а вместо этого всё время работать с родным размерением.

В смысле, не поднимать выводное разрешение "только изображения" с 300 dpi до 600 dpi? ИМХО ничего страшного - можно и поднимать. Зато как удобно - получаем на выходе из СТА оба субскана одинакового DPI и разрешения - и не морочим себе голову. Качество изображения, если и упадёт от ресэмплирования с 300 dpi до 600 dpi, то незначительно. Всё равно ведь потом, уже в DjVu Imager, эти самые изображения приходится, как правило, уменьшать до ДЗФ значений 4-5 (ради качества) - а это куда как бОльшая потеря качества.
 
Добавлено:
anagnost96

Цитата:
Не все работают с DjVu Imager. Лично для меня такое количество папок только затруднит работу.

Ах да, Вы же в Линуксе... Но мне кажется, я предложил наиболее оптимальное решение - одновременно и минимальное по сложности реализации, и по удовлетворению потребностей всех потенциальных пользователей.
 
А Вы в Линуксе ведь тоже можете себе скрипт сделать - эквивалентный DjVu Imager.
 
Добавлено:

Цитата:
Я бы сортировал сканы просто по принципу цветности, независимо от того, из какого режима они получены.

Можно и так - но это хуже, т.к. дольше. Чтобы узнать цветность, надо открыть файл, и загрузить хотя бы его заголовок. А по пути к файлу понять, что он такое, куда быстрей.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:32 05-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Я даже не знаю - и почему это Tulon пока не сделал СТА основной версией СТ? Сделать это совершенно необходимо - т.к. СТ в чистом виде никуда не годится

СТ в чистом виде не годится для нас с вами. Большинство "обычных" книгосканировщиков прогонят папку OUT через Djvu Small и вполне удовлетворятся результатом, который им даст автосегментация documenttodjvu.
 
А CTA, еще раз повторюсь, нельзя включать в существующем виде из-за необходимости многих проходов (отнюдь даже не двух) для получения результата.  
Т.е. решение должно быть однопроходным, но позволяющим вывод в разных разрешениях (в том числе и из соображений быстродействия - уменьшение разрешения в 2, 3 раза относительно 600dpi увеличат скорость вывода на величину, кратную 4 и 9). А это уже серьезные изменения и в концепции программы и в структуре UI.  
 
Попробуйте загнать изображения с некратными чб части размерами в Djvu Imager. У меня не получалось, приходилось обрезать до кратности.
Удивительное дело, пришел к правилу кратности 12 пикселам сегодня утром - а оно уже в стандарте )

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:40 05-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
вполне удовлетворятся результатом, который им даст автосегментация documenttodjvu.

Да, но такую DjVu-книгу следует отправить прямиком в мусорную корзину.

Цитата:
А CTA, еще раз повторюсь, нельзя включать в существующем виде из-за необходимости многих проходов (отнюдь даже не двух) для получения результата.

В любом случае, СТ выглядит гораздо бОльшей недоделкой, нежели чем СТА.

Цитата:
но позволяющим вывод в разных разрешениях

Зачем вывод в разных разрешениях? Я же только что объяснял: наоборот, только в том же разрешении, что и "только текст".

Цитата:
(в том числе и из соображений быстродействия

Это бессмысленно. Допустим, так. Тогда уже DjVu Imager должен будет приводить размеры входных задних субсканов после СТ к размерам входных в DjVu Imager задежавюченных передних субсканов. Та же потеря скорости - но только плюс дополнительные проблемы по определению величины перемасштабирования (чреватые ошибкой).
 
В общем, чего мы изобретаем велосипед насчёт размеров-DPI - посмотрите на ScanKromsator: там выводятся пары субсканов, имеющих одинаковые DPI и пиксельные размеры. И я считаю, что это наиболее правильное решение. Это даёт простой стандарт - для любой последующей программы разделённых сканов (DjVu Imager, ....).
 
Добавлено:
anagnost96

Цитата:
Не все работают с DjVu Imager. Лично для меня такое количество папок только затруднит работу.

Зато это дало бы нам простой и чёткий стандарт: чтобы ни происходило, мы всегда твёрдо знаем, что все передние субсканы - всегда в такой-то папке, все задние - в такой-то. Просто, удобно, понятно. Стандарт.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:01 05-02-2010 | Исправлено: monday2000, 11:05 05-02-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
А, так Вы при выводе "только изображения" переключаете выводное DPI на 300 dpi? А зачем? Не надо этого делать - пусть остаётся на 600 dpi - так же, как и "только текст".  

 
Что ж, каждому свое. Лично я не могу делать так, как Вы предлагаете: это мало того, что чревато потерей качества, так еще и ведет к забиванию мусором места на жестком диске. А этого места никогда не бывает много, если уж человек активно занимается сканобработкой.
 

Цитата:
Да нет же, не прийдётся. Ну и что, что не делится на 2? Это не проблема, вот формула

 
Ну да, масштабирование к приближенному значению. Это не поможет. Вот, StanFreeWare только что подтвердил: если размеры маски не делятся без остатка на соответствующие размеры фона, ничего работать не будет.  
 

Цитата:
Зато как удобно - получаем на выходе из СТА оба субскана одинакового DPI и разрешения - и не морочим себе голову.

 
Абсолютно неудобно: десятки гигабайт на диске забиваются впустую.
 

Цитата:
Всё равно ведь потом, уже в DjVu Imager, эти самые изображения приходится, как правило, уменьшать до ДЗФ значений 4-5 (ради качества)

 
У меня картинки всё больше такие, что требуют минимального ужатия и максимального качества.
 

Цитата:
А Вы в Линуксе ведь тоже можете себе скрипт сделать - эквивалентный DjVu Imager.  

 
Естественно. Но чтобы получить пары субсканов, готовые для обработки, всё равно требуется несколько предварительных этапов, и именно поэтому мне неудобно работать с папкой out непосредственно. Отсюда и отсутствие заинтересованности в автоматической раскладке по папкам.
 

Цитата:
В общем, чего мы изобретаем велосипед насчёт размеров-DPI - посмотрите на ScanKromsator: там выводятся пары субсканов, имеющих одинаковые DPI и пиксельные размеры.

 
ЕМНИП, там можно отдельно настроить разрешение вывода для каждой зоны. И это правильно.
 

Цитата:
Чтобы узнать цветность, надо открыть файл, и загрузить хотя бы его заголовок.

 
Зачем? Я же рассматривал вариант, при котором сканы изначально сортируются по цветности. Т. е. мы знаем, что в определенной папке лежат, допустим, только черно-белые страницы в формате TIFF G4. А как уж они получены (в черно-белом режиме или смешанном) -- не важно.
 
 
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 11:27 05-02-2010 | Исправлено: anagnost96, 11:28 05-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
Абсолютно неудобно: десятки гигабайт на диске забиваются впустую.  

Но это же только на время сканобработки.

Цитата:
Вот, StanFreeWare только что подтвердил: если размеры маски не делятся без остатка на соответствующие размеры фона, ничего работать не будет.

Что-то я не понимаю. Если выводить оба субскана в СТА с одинаковым DPI и пиксельными размерами - то никаких таких проблем не возникнет (потом с DjVu Imager).  
 
Почему они возникают у Вас - мне тоже непонятно. Допустим, Вы выводите в СТА передние субсканы с 600 dpi - а задние с 300 dpi. В таком случае, пиксельные размеры переднего субскана (как я понимаю) должны быть кратны пиксельным размерам заднего субскана - т.к. оба субскана производятся из одного и того же скана.

Цитата:
Отсюда и отсутствие заинтересованности в автоматической раскладке по папкам.

Значит, Вы вручную забираете сейчас из out по-очереди те или иные субсканы. Вручную - это не очень удобно.

Цитата:
А как уж они получены (в черно-белом режиме или смешанном) -- не важно.

А как тогда различать "только изображения" и "цветное/серое" только по цветности?
 
Добавлено:
StanFreeWare

Цитата:
Попробуйте загнать изображения с некратными чб части размерами в Djvu Imager.

А он вообще рассчитан исключительно на равные DPI и пиксельные размеры. То, что у Вас получилось ещё и с кратными размерами - чистая случайность.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:59 05-02-2010 | Исправлено: monday2000, 14:09 05-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Вы доминируете в этой теме
Эта тема по СТ - ее просматривают много людей, в том числе и уже поблагодаривших автора за сделанную работу.

Цитата:
СТ в чистом виде никуда не годится

Это не корректное заявление
Вы же ставите множество людей с форума в неловкое положение.
Спорить и препираться с Вами, либо промолчать.
Промолчал - вроде как бы согласился. Но ведь это не так!
Предложили 1 раз автору - он промолчал - значит, не считает нужным.
Никто никому ничего не должен.
Прошу Вас подоброжелательней... Не надо агрессии.

Всего записей: 1129 | Зарегистр. 15-01-2005 | Отправлено: 14:23 05-02-2010 | Исправлено: Dashout, 14:24 05-02-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru