Перейти из форума на сайт.


Система IP-видеонаблюдения "Линия". Скачать бесплатную демо-версию для 16 камер. НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии)
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: 4lex4, 08:20 12-02-2018
ndch

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Игнор-лист для RuBoard под браузеры FireFox, Chrome, Opera  
Не нравится кто-то - просто введите его в игнор, чтоб глаза не мозолил, вот и всё.
Скрипт

Всего записей: 4532 | Зарегистр. 31-08-2008 | Отправлено: 14:37 17-02-2010 | Исправлено: ndch, 12:35 25-08-2016
VidelSamogO



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Категорически необходим пункт меню, позволяющий "не определять зоны картинок автоматически" для режима "смешанный". На случай неверного их определения.

Всего записей: 581 | Зарегистр. 16-08-2008 | Отправлено: 02:02 18-02-2010 | Исправлено: VidelSamogO, 02:54 18-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO
Согласен, но скорее в такой форме. Вряд ли сейчас (с тремя параллельными ветками проекта) ответ Tulon'a станет другим. Хотя мне кажется, что реализация предложения даже упростит внутреннюю структуру ST.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:51 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Полезная область:
Допустим, в этой стадии вручную найти и привязать полезную область к ИП, привязать к номеру страницы

далее сказать, ОБУЧИСЬ, привяжи оставшиеся страницы по углу; запомни габариты ИП для вывода к масштабу 100% относительно ширины строки

Всего записей: 1063 | Зарегистр. 15-01-2005 | Отправлено: 14:39 18-02-2010 | Исправлено: Dashout, 14:59 18-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
далее сказать, ОБУЧИСЬ, привяжи оставшиеся страницы по углу; запомни габариты ИП для вывода к масштабу 100% относительно ширины строки

ОЧЕНЬ абстрактно и как следствие бесполезно.  Одно слово "обучись" чего стоит!  Кроме того, напоминаю, что фич-реквесты продолжают игнорироваться.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:04 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
уважаемый Tulon, лишние слова
Все что не входит в логику реализации Вашей модели будет по определению

Цитата:
абстрактно и как следствие бесполезно

 

Цитата:
фич-реквесты продолжают игнорироваться

как угодно
 
 
 
 
Добавлено:
хотел пояснить - говорю не со зла
в принципе я понимаю эту позицию, возможно в данном случае (один разработчик на такой объем работ) она верная
Остается ждать, когда Вы замкнете на DJVU, отдохнете и, если будет вдохновение,  пойдете по второму кругу.
 

Всего записей: 1063 | Зарегистр. 15-01-2005 | Отправлено: 16:28 18-02-2010 | Исправлено: Dashout, 16:29 18-02-2010
ndch

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
Вы говорите приблизительно об этом

Всего записей: 4532 | Зарегистр. 31-08-2008 | Отправлено: 17:29 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
об этом

Вы знаете, нет, не совсем
это ручной режим, подобный реализован в PDF-Viewer (Обрезка страниц). На 500 страниц - "устанет рука"!
У СТ есть шик - это автоматизация, причем, интеллектуальная.
Убежден, что этот шик нужно сохранить.
Насколько я понимаю - это возможно. Но, меняется логика обработки страниц и дальнейшего использования результатов.

Всего записей: 1063 | Зарегистр. 15-01-2005 | Отправлено: 18:14 18-02-2010
ndch

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
гораздо универсальнее была бы такая фича:
центрированная по полезной области
рамка контекста
фиксированного размера.
 
Правильно понимаю что для Вашего случая данной  фичи было бы достаточно ?

Всего записей: 4532 | Зарегистр. 31-08-2008 | Отправлено: 20:51 18-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
нет, я имею виду не конкретную операцию, а подход, логику обработки изображения относительно конечной продукции.
Что объявляем конечной продукцией? Тут у каждого свои представления: это и автоматизированный процесс обработки, и корректировка, и т. д. Все, каждый будет прав! - но это все процессы. Где продукция?
По-любому, на данном этапе разработки, конечной продукцией являются обработанные в СТ изображения страниц книги, которые далее переводятся в е-книгу. т.е., читабельная страница (не текст, а именно страница с текстом! в книге все страницы равны).
Если так, то есть противоречие: существует вероятность получения на этапе вывод изображений размером 9,5*13,6 см! (не говорю про DPI, это технический показатель).
Выигрывая на скорости я сжимаю изображение, но далее-то мне его нужно восстановить!? СТ, сжимая на 600 DPI, как-бы оставляет резерв на восстановление...
Что дальше, начиная после СТ увеличивать размер (растягивая картинку) я неизбежно ухудшаю полученное в СТ качество.
Учитываем, что в страницах "плавает" фокус (масштаб) - еще хуже!
 
Поэтому, мое предложение было ввести маску читабельной страницы сразу в процесс обработки первичного изображения. Предлагал название этой маски - информационная площадь страницы (ИП).
В этом случае, DPI, как и обрабатываемое изображение страницы, становятся переменной величиной.
На выходе задача ставится так: на какой коэффициент увеличить изображение, чтобы ИП (страницы) была равна ИП (маски).
В настоящее время, логика модели (и далее, алгоритмы) не учитывает качество конечной продукции читабельной страницы, поэтому, надо ждать второго круга.

Всего записей: 1063 | Зарегистр. 15-01-2005 | Отправлено: 21:52 18-02-2010 | Исправлено: Dashout, 22:34 18-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я тут вот о чем подумал.  Есть фичи, которые могут в принципе быть полезными, да и реализуются не слишком сложно, но которые я все равно не хочу добавлять.  Мое мнение состоит в том, что любая новая галочка в интерфейсе - это удар по простоте использования.  Соответственно нужна весьма веская причина для ее добавления.  Для энтузиастов же, чем больше фичей, тем лучше - в конце концов они знают, для чего каждая из них нужна.  Так вот - а нет ли желающих сделать мод или даже форк ST как раз с целью добавления всевозможных фичей?  По типу как существуют всякие там eMule Plus и Dreamule - форки eMule.  Меня бы такая ситуация вполне устроила.  И энтузиасты получили бы, что хотели, и на меня давление ослабло бы.  А так я и творец-создатель, и тех-саппортер, и учитель младших классов (очевидности часто объяснять приходится), и диктатор, которому наплевать на нужды народа.  Вполне готов поделиться некоторыми из этих титулов  Желающие есть?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:16 19-02-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
мод или даже форк ST

А может быть, Вы сделаете ST способным принимать плагины? Это было бы идеально.
===
Не фичи:
1) Деспекл. По роду деятельности я аккумулирую различные биологические книги, и в последнее время все больше и больше книг приходит без точек в оглавлениях, формулах и разных других местах. Это значит, что начинающие сканировщики все чаще и чаще пользуются ST, но никто из них не знает об особенностях деспекла. Я пытаюсь с этим бороться, но во многих случаях с автором файла связаться нельзя или уже поздно -- оригинальные сканы стерты. Нельзя ли, пока Вы не наладили деспекл, либо (а) сделать галочку "удалять пятна" по умолчанию не нажатой либо (б) где-то на видном месте поместить предупреждение? Первое лучше, потому что предупреждений, как правило, никто не читает.
2) Разрешение. Несколько раз уже возникали проблемы с файлами, в которых разрешение записано неправильно (и к тому же разное в разных файлах), а ввести его насильно не удается, кнопка "Применить" не активна. Я пытался удаленно помочь человеку, дело кончилось тем, что он просто взял СК. По-моему, надо сделать возможным насильственное введение разрешения во всех случаях. Уж если пользователь нажал галочку "Править разрешение", то он, скорее всего, знает, что делает.
Еще одна неприятность в таком случае -- это на стадии макета обнаружить, что некоторые страницы в разы больше остальных. Начинающего пользователя это просто вводит в ступор.
3) Наклон. ST регулярно "врет" на страницах с таблицами рисунков. Если рисунков много, то редактирование превращается в тихий ужас. К тому же логика программы страдает -- ведь на всех этапах, кроме этого (и полезной области), можно массово применить параметр ко всем или части страниц. Поэтому я думаю, что массовое применение наклона не новая фича, а необходимое дополнение к логике программы.
4) Бинаризация. Существующего движка не хватает для оптимального "зачернения". Особенно это сказывается в режиме "Смешанный", если есть одна-две больших фотографии (не нашел закономерности, но это как-то связано с положением фотографий в текстовом блоке). В этом случае текст, нормально бинаризующийся на остальных страницах, просто пропадает, то есть перестают быть видимыми отдельные слова. Отключение деспекла и доведение движка до 15 решает проблему только в половине случаев. Дело недавно дошло до того, что 12 страниц мне просто пришлось выводить в цветном режиме и руками бинаризовать текстовые области в фотошопе. Я не думаю, что это правильно. Можно ли хотя бы увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Всего записей: 176 | Зарегистр. 18-05-2005 | Отправлено: 03:25 19-02-2010 | Исправлено: iit512, 03:37 19-02-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Желающие есть?

Конечно есть. Но моды станут известными только в узком кругу пользователей, которые хотят до конца разобраться со всеми возможностями программы.

Всего записей: 412 | Зарегистр. 03-08-2007 | Отправлено: 07:03 19-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Разъясните, пожалуйста, Ваш пост http://forum.ru-board.com/topic.cgi?forum=5&topic=27424&start=2100#4 - а то абсолютно ничего не понятно.
 
Tulon

Цитата:
Устал я от потока негатива, который идет с этого форума.

Этот негатив порождаете Вы сами. Так что не надо пытаться обвинять кого-то ещё, когда на самом деле причина - в Вас. Не хотите получать негатив - делайте программу для людей, а не для себя. Это единственный выход, как Вам избавиться от негатива. А то я ведь могу и со страниц своего сайта подвергнуть СТ критике. "Против правды не попрёшь", знаете ли.

Цитата:
Решение, к которому я стемлюсь, это отдельная программа, которая будет принимать вывод ST, проделывать с ним всякие операции - подавление шума в картинках, увеличение контраста, коррекция уровней, и кодировать все это в DjVu.

Так что же Вы раньше молчали? Это полностью меняет дело - при условии, конечно, что такая программа будет производить вывод по принципу СТА.

Цитата:
Цитата:А остальные DjVu-кодировщики? DEE 5.1, Document Express Editor 5 и 6 - их что, выбрасывать?
Метод раздельных сканов с ними все равно не используется.

Да - но только по вине bolega, не захотевшего сделать вывод субсканов в раздельные папки. В принципе, это возможно.

Цитата:
Либо я сделаю так, что они не будут замечать второго слоя в TIFFах

Думаю, никак Вы это не сделаете.
 
Альтернативы СТА нет.
 
Добавлено:
Tulon

Цитата:
Так вот - а нет ли желающих сделать мод или даже форк ST как раз с целью добавления всевозможных фичей?  

Это тоже хороший выход. Я как раз недавно предлагал то же самое.
 
Добавлено:
Я решил тоже связаться с Рамизом Зейналовым, автором варианта алгоритма Dewarping. Вот что он мне ответил:

Цитата:
Моя система справляется и с геометрическимими искажениями, и с неравномерным светом. Есть некоторые проблемы, связанные с user-friendly - много параметров, не совсем очевидных. По-хорошему, это надо дорабатывать.
Скоро моя система будет встроена в СканКромсатор.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:19 19-02-2010 | Исправлено: monday2000, 11:20 19-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А может быть, Вы сделаете ST способным принимать плагины? Это было бы идеально.  

Это потребует уйму усилий с моей стороны.  Плюс проблемы кросс-платформенности и бинарной совместимости.  Плюс ограниченность интерфейса плагинов.  Заведомо проиграшный вариант в общем.
 

Цитата:
(а) сделать галочку "удалять пятна" по умолчанию не нажатой либо (б) где-то на видном месте поместить предупреждение? Первое лучше, потому что предупреждений, как правило, никто не читает.  

В следующем релизе либо доведу до ума деспекл, либо отключу его по умолчанию.
 

Цитата:
надо сделать возможным насильственное введение разрешения во всех случаях

Ввод разрешения, сильно ниже реального, приводит к падениям из-за нехватки памяти.  Если же там реальное разрешение ниже 150, то использование СК для таких файлов - наилучший для меня вариант.
 

Цитата:
массовое применение наклона не новая фича, а необходимое дополнение к логике программы.  

Имеет смысл только массовый сброс в ноль - для уже выровнянных сканов.  Любой другой угол не имеет смысла применять массово, потому как от страницы к странице он гуляет.  Массовый сброс в ноль планируется, но не доходят до него руки.
 

Цитата:
Можно ли хотя бы увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Увеличу, когда руки до этого дойдут.  Скорее всего проблема там в чем-то другом, например плохо работет выравнивание освещения на данном скане.  Посмотрел бы, но уж больно устал заниматься тех-саппортом, так что лучше не надо.
 
woodyfon

Цитата:
Конечно есть. Но моды станут известными только в узком кругу пользователей, которые хотят до конца разобраться со всеми возможностями программы.

Остальные меня и не грузят.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:12 19-02-2010
ntsx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 

Цитата:
Есть фичи, которые могут в принципе быть полезными, да и реализуются не слишком сложно, но которые я все равно не хочу добавлять.  Мое мнение состоит в том, что любая новая галочка в интерфейсе - это удар по простоте использования.

 
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

Всего записей: 8 | Зарегистр. 12-02-2010 | Отправлено: 13:22 19-02-2010
ILHS

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ntsx

Цитата:
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

За.

Всего записей: 587 | Зарегистр. 06-12-2004 | Отправлено: 13:36 19-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А Вы не рассматриваете вариант разделения интерфейса на "Basic" / "Expert" (в рамках одного проекта).

Пользователей оно бы конечно избавило от усложнения интерфейса, но кто избавит меня от усложнения кода?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:08 19-02-2010
ntsx

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так синхронизация двух активных веток (в случае форка) будет еще затратнее.

Всего записей: 8 | Зарегистр. 12-02-2010 | Отправлено: 17:43 19-02-2010
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru