Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии); ветка develop
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: ndch, 16:47 18-07-2018
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
RiffSkill
Цитата:
сё получилось снятие галки "Выравнивать размеры с другими страницами"
Это не решение проблемы. На выходе будут страницы разного размера.
После некоторых экспериментов подозреваю проблему в низком разрешении исходных сканов. При загрузке изображений в СТ могут быть два варианта.1)Реально низкое разрешение (70дпи). 2)Реальное разрешение 300дпи, отображаемое как 72дпи. Во втором случае надо выбрать при загрузке в СТ 300дпи и все будет хорошо. Пришел к выводу, что в случае 1) надо выбирать при загрузке минимальное возможное разрешение (150дпи) и смотреть что из этого выйдет и выйдет ли. Если в случае 1) при загрузке поставлю разрешение 600дпи будут проблемы и с полями в том числе.
Вопрос - какое реальное минимальное разрешение можно загружать в СТ? 150дпи?
Тренировался на http://depositfiles.com/files/5237840

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 23:27 08-02-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
RiffSkill
 
Вы, видимо, недопоняли концепцию полей.
 
Результирующий размер полей задается по странице с максимальным размером. Ее можно найти с помощью раскрывающегося списка сортировки под панелью предпросмотра на стадии Полезная область.
 
У вас после задания полей размер страницы и расположение информации на ней получились таким же, как и у оригинальной бумажной страницы.  
И это правильно.
 
Более того, для лучшего соответствия форматированию оригинальной книги поля сверху и снизу на максимальной странице, скорее всего, стоит еще увеличить, до касания границ бумажного оригинала.
 
Удалять обложки из проекта не нужно. Флажок "Выровнять размеры с другими страницами" и цветной/серый режим вывода именно для них.
 
Советую еще разок внимательно перечитать Быстрый старт
 
P.S. Как бы убедить Tulon'а сделать верхнее и нижнее поля по-умолчанию тоже в 10 мм?...

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 06:43 09-02-2011 | Исправлено: StanFreeWare, 06:50 12-02-2011
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Цитата:
Результирующий размер полей задается по странице с максимальным размером
Не думаю, что поля и размер страницы связаны. Поля это поля, а размер страницы это размер. Когда обложка очень большая и хочется всю ее поместить на страницу, приходится уменьшать размер исходного скана в другом ПО, чтобы после обработки в СТ обложка не вылазила за размеры самой большой информативной страницы. Попадаются сканы с разным размером изображений. Тут приходится вручную подгонять "выпавшие" размеры под размер основной массы сканов, чтобы на выходе СТ получить страницы с одинаковым наполнением.
Цитата:
Более того, для лучшего соответствия форматированию оригинальной книги поля сверху и снизу на максимальной странице, скорее всего, стоит еще увеличить, до касания границ бумажного оригинала.
Проблема в том, что оригинал - это исходный скан. Все остальное форматирование грубо говоря не есть оригинал. Поля при форматировании оригинала стараюсь выбирать минимальными (2), поскольку они не несут информативной нагрузки, а только занимают место. Например при форматировании стихов можно выбрать размер страницы по самому большому стихотворению и поля сделать минимальными. Размер обложки подогнать под этот размер.Убрать желтый фон при обработке в ч/б варианте. Это уже не оригинал. Повсей видимости задача форматирования не сохранить оригинал, а максимально его приспособить к компьютерному чтению (с монитора). Тут лишние поля по пол страницы наверное не нужны
 

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 08:51 09-02-2011 | Исправлено: alpopo, 09:07 09-02-2011
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alpopo

Цитата:
Когда обложка очень большая и хочется всю ее поместить на страницу, приходится уменьшать размер исходного скана в другом ПО, чтобы после обработки в СТ обложка не вылазила за размеры самой большой информативной страницы.

Зачем уменьшать обложку? Ее размер совпадает с размером остальных страниц только если книга в мягком переплете. В большинстве остальных книг обложка чуть больше внутренних страниц и это нормально.

Цитата:
Попадаются сканы с разным размером изображений.
Нам же по барабану размер изображений? Все равно они обрезаются по полезной области и потом уже реконструируются реальные поля и от них уже будет зависеть размер страницы. Связь полей и размера страницы очевидна.


----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 09:02 09-02-2011
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN
Цитата:
Зачем уменьшать обложку? Ее размер совпадает с размером остальных страниц
Размер обложки на величину полей больше информативной части остальных страниц. В "чужих" сканах, где цветную обложку сканируют отдельно от остальных страниц и выбирают иное разрешение, ее размер может быть очень большим
Цитата:
Нам же по барабану размер изображений?
В этом случае у Вас могут быть страницы на которых полезная область "малого скана" будет занимать только половину размера остальных "нормальных" страниц
Цитата:
обрезаются по полезной области
и вкладываются в максимальный размер страницы, если размер страниц выравнивается
 

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 09:13 09-02-2011 | Исправлено: alpopo, 09:24 09-02-2011
DikBSD

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
StanFreeWare


Цитата:
P.S. Как бы убедить Tulon'а сделать верхнее и нижнее поля по-умолчанию тоже в 10 мм?...

Я писал Tulon`у о возможности расширения опций и т.д. в программе. Он сторонник минимизации интерфейса - так проще для большинства пользователей. Это так, он прав. Но мы договорились (жду окончательного письма от него), что он сделает ветку в проекте, где будет разрабатываться ST для "продвинутых" пользователей., и в эту ветку будут вливаться все изменения, дополнения и тд. из основной, официальной ветки программы, ST для простых пользователей. Т.е. новая ветка будет содержать тот же код, что и нынешняя, только в ней будут разрабатываться различные фичи...
Когда он создаст эту ветку, первым делом я планирую создать управление настройками по умолчанию...

Всего записей: 177 | Зарегистр. 23-11-2009 | Отправлено: 14:43 09-02-2011
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alpopo
Цитата:
Размер обложки на величину полей больше информативной части остальных страниц.
Совершенно верно. Либо обложка чуть больше.  
 

Цитата:
обложку сканируют отдельно от остальных страниц и выбирают иное разрешение

А какие проблемы? Нас не должно беспокоить разрешение. Главное, чтобы оно было прописано в свойствах сканов.  Поля же проставляются согласно физическим размерам страниц а не пиксельным.  
 
Или вы в jpg/bmp сканируете? Тогда да

Цитата:
могут быть страницы на которых полезная область "малого скана" будет занимать только половину размера остальных "нормальных" страниц

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 15:37 09-02-2011
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USINДа в основном приходится работать с jpg. Если в СТ работа с jpg и tiff существенно различаются, то эти различия надо где-то перечислить (имею ввиду не качество букв, а размеры полей, страниц, различия в загрузке исходных сканов и т.д.). В СТ я загружаю изображение измеряемое в пиксельном измерении и могу ему задать на этапе загрузки, если СТ его просто так не взял любое (150-600) разрешение. Вот именно этим разрешением и будет определяться физический размер загруженных страниц и видимый размер полей. А если пиксельные размеры входных изображений отличаются в 1,5-2 раза (и не вы их сканировали), то в 1,5-2 раза будут отличаться и размеры страниц вСТ. В этом случае приходится выравнивать (подбирать) пиксельные размеры исходных изображений, будь то обложки или какая-то группа страниц сосканированная почему-то с иным разрешением и в силу этого имеющая разные пиксельные размеры. Ведь исходные страницы на сканере предполагаем имели один и тот же физический размер

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 15:59 09-02-2011 | Исправлено: alpopo, 16:20 09-02-2011
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
alpopo
Различия несущественны и описаны в документации кажется.
Просто если разрешение исходных сканов утеряно, то его нужно указать вручную. Для этого при создании проекта там есть галка "править DPI". И для разных страниц можно проставить там реальные DPI.
 
Если не указывать DPI, то не только размер полезной области будет в два раза отличаться, но и буквы будут соответственно в два раза меньше
 
Добавлено:

Цитата:
В этом случае приходится выравнивать (подбирать) пиксельные размеры исходных изображений

Не пиксельные размеры подбирать нужно а DPI.

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 16:39 09-02-2011 | Исправлено: C0USIN, 16:45 09-02-2011
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN
Цитата:
Не пиксельные размеры подбирать нужно а DPI
Это занимает намного больше времени. Подбирать  DPI при загрузке это как минимум все время открывать новый проект, а половину работы вы уже сделала в старом проекте. Попробуйте описать и выполнить вашу методику. Похоже с этим вы еще не сталкивались

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 17:07 09-02-2011 | Исправлено: alpopo, 17:15 09-02-2011
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Странно. Я сейчас специально скормил ST пачку jpg с разными разрешениями. Он автоматом проставил где 150 а где 300 dpi. Ни разу не ошибся. О каком времени идет речь?
 
Хотя нет. Я ошибся. Там разрешение было зашито в свойствах файла. Видимо jpg тоже умеет хранить dpi.

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 17:12 09-02-2011 | Исправлено: C0USIN, 17:24 09-02-2011
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USINРечь о том, когда СТ предлагает установить DPI вручную. А про автомат это интересно и не задокументировано? Как этим автоматом пользоваться? В каких случаях он работает?

Всего записей: 1041 | Зарегистр. 02-08-2008 | Отправлено: 17:19 09-02-2011 | Исправлено: alpopo, 17:20 09-02-2011
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
Подбирать  DPI при загрузке это как минимум все время открывать новый проект

При добавлении страниц в существующий проект тоже можно вручную указать DPI если оно не указано в метаданных файла. Неудобно только что нельзя добавить пачку страниц. Только по одной позволяет.

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 17:47 09-02-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo
Нет никакого автомата. Есть механизм, оценивающий прописанное в свойствах изображения DPI. И если оно явно некорректное, предлагается изменить его пользователю (опять же в разумных для данного пиксельного разрешения пределах).

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 21:30 09-02-2011
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Умоляю, сделайте автосохранение!
Ужасно неприятно перезапускать весь вывод сначала, когда большая часть уже выведена, а СТ почему-либо упал. (Не воспроизводится, проверял). Особенно когда множество страниц в смешанном режиме, и все равно надо перепроверять зоны картинок.

Всего записей: 176 | Зарегистр. 18-05-2005 | Отправлено: 23:05 10-02-2011
OleM2k



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос знатокам: сколько на вскид может стоит обработка отсканированной книги?
Заранее спасибо за ответ.

Всего записей: 8 | Зарегистр. 01-06-2010 | Отправлено: 15:03 13-02-2011
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
OleM2k
Сделайте одну и поймёте.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4125 | Зарегистр. 18-09-2003 | Отправлено: 15:43 13-02-2011
ycheff



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
сколько на вскид может стоит обработка отсканированной книги?  

 
Зависит  
от потраченного времени, которое зависит  
от количества сканов,  
от качества сканов (от dpi, от того, одинаковы ли dpi у сканов, от грязи на сканах...)
от быстродействия компа,  
от требуемого качества обработки...
от типа книги (djvu, pdf...)
от необходимости ocr
 
Средняя по размерам, простая книга может потребовать 1-2 часа работы.  
Со сложностью время может заметно вырасти.    

Всего записей: 249 | Зарегистр. 27-09-2008 | Отправлено: 16:24 13-02-2011 | Исправлено: ycheff, 16:59 13-02-2011
OleM2k



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
нема питань! оттого и задаю вопрос
ycheff
Спасибо за ответ!
Как мне видется, некоего списка цен (ок-ок - прайса) не существует.
Т.е. нет возможности отправить кому либо файл и согласовать стоимость работ.
Если так дело и обстоит, то ycheff, не утруждайте себя ответом.
Вы и так описали все, что необходимо при разговоре с предполагаемым заказчиком.
 
Спасибо Вам за внимание и ответ!

Всего записей: 8 | Зарегистр. 01-06-2010 | Отправлено: 09:23 14-02-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я снова завёл в Википедии статью о Scan Tailor:
 
http://ru.wikipedia.org/wiki/Scan_Tailor
 
Она там уже ранее создавалась, но потом её убрали - по 2 мотивировкам:
 
1. Малозначимость (теперь ИМХО этот недостаток давно преодолён).
2. Нарушение авторских прав текста (кто-то бездумно взял с моего сайта описание СТ и воткнул его, видимо, в статью) - это вообще по-глупости получилось.
 
Приглашаю всех желающих подправить эту заметку. Тем более, что мне не удалось там исправить пару мелких косячков в оформлении статьи - если кто хорошо знает Вики-синтакс, подправьте, пожалуйста.
 
PS Я просто подумал, что СТ давно уже должен быть в Википедии - в Википедии есть статьи и о гораздо менее значимых программах.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:54 16-02-2011
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru