Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
 

Цитата:
Вы серьезно хотите уложиться с кривизной строк всего за пол-года?  
Мне кажется, что исправление кривизны строк - это даже не кирпич в рюкзаке, а скорее колосник, привязанный к ногам..  

Ну скажем Rob первую версию своего алгоритма написал за пару недель.  Вторую - трудно сказать, но скажем за месяц.  Понятно, что там есть, над чем работать, но также видно, что за пол-года можно сделать очень многое.
 

Цитата:
Потеря информации - это очень серьезно. Это дискредитирует.  

Despeckle я доведу до ума всяко раньше, чем выравнивание строк.
 
А насчет картинок - да, типографский растр конечно помогает.  Работало бы и без него, если бы были четкие границы со всех сторон картинки.  С картинкой, большая часть которой ушла в черный цвет - отдельная история.
Так или иначе, зонами я в ближайшее время заниматься не собираюсь.
 
И действительно, переделка уже оцифрованных книг - дело гиблое.  С ними столько проблем, что там не то что на пол года - на всю жизнь работы хватит, еще и останется.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:46 25-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Я берусь за переделку только 200-300dpi книг, сжатых в photo-режиме. Такой первоисточник мало отличается от jpeg-сканов. Для них мне функционала СТ вполне достаточно (за исключением моментов, отмеченных в моих предыдущих сообщениях)
Исправлять книги, сделанные иным способом - согласен, дело гиблое.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:22 25-02-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
С картинкой, большая часть которой ушла в черный цвет - отдельная история.  

Кстати, если предварительно сделать небольшое увеличение яркости (чтобы убрать просвечивающие с другой стороны буквы), а затем автоконтраст, то эта картинка выделяется правильно, да и выглядит всё получше: черное - черным, белое - белым.

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 11:52 25-02-2010
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
И действительно, переделка уже оцифрованных книг - дело гиблое.  С ними столько проблем, что там не то что на пол года - на всю жизнь работы хватит, еще и останется.

Так же как и сканирование новых
 
StanFreeWare

Цитата:
Исправлять книги, сделанные иным способом - согласен, дело гиблое.

Все зависит только от наличия свободного времени и желания, я знаю человека, который даже перенабором книг в TeX занимается в тяжелых случаях.

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 12:06 25-02-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
дело гиблое

Любая книга - это информация. Полностью согласен, что ее нужно уважать.
Неоднократно говорил о необходимости зацепиться за базис - информационную площадь скана.  
наложить прямоугольную маску, зафиксировать ее к углу и технологической метке (номер страницы), привязать маску к формату вывода на печать (А4 и др.), привязывать маску к скану страниц, корректируя при выходе на коэффициент соответствия (соотношение диагонали маски книги к диагонали маски страницы)
Все! Забудем про целый ряд проблем и не нужных операций.
Все корректировки (текста и строк), разделения (текст, картинка, пустая область) реализуются внутри ИП.
Одновременно увеличим удобство пользователя и качества книги на выходе!
С удивлением и надеждой увидел, что мои логические предположения уже фактически реализованы в интерфейсе программы "Фото на документы"

сама программа (portable)
http://slil.ru/28702838 (2,84 Мб)
как видно, они пошли по другому пути - не изысканные алгоритмы, а просто человеко-машинная среда - зацепился за метки и вперед...
Я бы сказал, что вполне возможно, что либо в той, либо в другой программе эта ниша будет в скором времени занята

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 12:43 25-02-2010 | Исправлено: Dashout, 12:46 25-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout

Цитата:
Неоднократно говорил о необходимости зацепиться за базис - информационную площадь скана.  
наложить прямоугольную маску, зафиксировать ее к углу и технологической метке (номер страницы), привязать маску к формату вывода на печать (А4 и др.), привязывать маску к скану страниц

Это утверждение верно при идеальной верстке.
 
Добавлено:
Зы. здесь не варёз.
 
Добавлено:

Цитата:
как видно, они пошли по другому пути - не изысканные алгоритмы, а просто человеко-машинная среда - зацепился за метки и вперед...

Баян - для этого есть, например,  фотошоп с направляющими. В новых версиях фотошопа - smart rulers. + автоматизация (actions).
 
Это как бы оффтопик.
 
И это идёт явно вразрез с концепциями обработки ст, ск и прочая.

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 18:30 25-02-2010 | Исправлено: ndch, 18:35 25-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Думаю Tulon в какой-то мере согласен с данным графиком
 

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 17:49 26-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Зачетная картинка.  Захотелось в подпись воткнуть ссылку на нее, что и было сделано.
P.S: но по какой-то причине не сработало.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:52 26-02-2010 | Исправлено: Tulon, 22:53 26-02-2010
juvaforza

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
[off] На ру-борде подпись включить - это дело слегка запутанное.

Всего записей: 2895 | Зарегистр. 26-11-2005 | Отправлено: 23:14 26-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Несмотря на график, и, надеюсь, не баян:
1) есть разворот, слева пустой, справа информация, нахожусь на 4 стадии, удаляю пустую половину, СТ опять проходит стадии до 4, делит страницу по переплету в режиме "+огрызок", и в 3 из 4 случаев оставляет пустую половину разворота...  
2) 5 стадия. Нужно вытянуть поле с одной стороны. Разрываю цепь, вытягиваю. Ухожу на другую страницу, возвращаюсь. Цепь замкнута (хотя значения разные). Как следствие начинаю еще подтягивать ранее вытянутое поле, сцепленное поле становится такой же величины. По-моему, если значения разные, цепь замыкать уже не нужно.
3) Неплохо было бы дополнительно выделить на 5 стадии "застраничную" область хотя бы в полосе предпросмотра.  
По этой области очень здорово ориентироваться, когда полезная область определяется, например, в нижней половине страницы.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 00:11 27-02-2010 | Исправлено: StanFreeWare, 00:13 27-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
 

Цитата:
1) есть разворот, слева пустой, справа информация, нахожусь на 4 стадии, удаляю пустую половину, ...

Я правильно понял, что "нахожусь на 4 стадии, удаляю пустую половину" означает "правый клик -> удалить рамку"?  В таком случае надо полагать режим разреза на тот момент был "две половинки", поскольку "слева пустой, справа информация".
 

Цитата:
СТ опять проходит стадии до 4, делит страницу по переплету в режиме "+огрызок", и в 3 из 4 случаев оставляет пустую половину разворота

Так так, а что же заставило ST пересмотреть тип разреза?  Изначально разрез был ручной или автоматический?  Меняли ли вы что-то на стадиях 1-3 после удаления рамки на стадии 4?
 

Цитата:
2) 5 стадия. Нужно вытянуть поле с одной стороны. Разрываю цепь, вытягиваю. Ухожу на другую страницу, возвращаюсь. Цепь замкнута (хотя значения разные). Как следствие начинаю еще подтягивать ранее вытянутое поле, сцепленное поле становится такой же величины. По-моему, если значения разные, цепь замыкать уже не нужно.  

Это мелкая недоработка.   Действительно, надо проверять, одинаковы ли размеры, и если нет, сразу размыкать цепь.
 

Цитата:
3) Неплохо было бы дополнительно выделить на 5 стадии "застраничную" область хотя бы в полосе предпросмотра.  
По этой области очень здорово ориентироваться, когда полезная область определяется, например, в нижней половине страницы.

Фич реквесты по прежнему игнорируются.


----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:52 27-02-2010 | Исправлено: Tulon, 11:59 27-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
1) С точки зрения пользователя - удаляю пустую страницу с ленты предпросмотра на 3-4 этапе. Вместо нее удаляется следующая за ней страница, а пустая остается.
 
С точки зрения программы - есть скан разворота. На 2й стадии автоматически определен разрез в режиме двухстраничного скана. После удаления одной из двух получившихся из скана страниц (половина изначального скана разворота) тип разреза автоматически переопределяется как страница с обрезком. Обрезком в ряде случаев считается не та половина скана, которую удаляли.
 
3) Достаточно было бы даже более яркого цвета для застраничной области на 5-м этапе. Что-то типа этого

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 13:36 27-02-2010 | Исправлено: StanFreeWare, 13:50 27-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
1) С точки зрения пользователя - удаляю пустую страницу с ленты предпросмотра на 3-4 этапе. Вместо нее удаляется следующая за ней страница, а пустая остается.  

Вспомнил - об этой проблеме уже сообщалось.  Надо при удалении половинки скана не просто менять режим разреза на "страница с огрызком", а еще и переключаться в ручной режим, так как "страница с огрызком" ничего не говорит о том, с какой стороны страница, а с какой - огрызок.  Походу я это уже даже пофиксил - попробуйте последнюю сборку от U235.
 

Цитата:
3) Достаточно было бы даже более яркого цвета для застраничной области на 5-м этапе. Что-то типа этого

Все равно не сейчас, и когда - не знаю.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:13 27-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Действительно, в последней сборке от U235 удаление половинок отрабатывает корректно.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 17:54 27-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Похоже мои усилия по минимизации негатива (игнор отдельных личностей а также всех фич реквестов) начинает приносить плоды.  Настроение улучшилось, появилось желание кодить, и за последние пару недель деспеклинг значительно продвинулся.  Еще через пару недель надеюсь закончить его.
 
Подразню вас скриншотом пока что:


----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:43 28-02-2010
domo22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А есть уже в СТ возможность пропускать стандартные стадии  обработки, чтобы пользователь сам решал, какие этапы СТ будет отрабатывать, а какие нет? Чтобы при хорошем скане СТ не пытался ничего "улучшать" или менять.

Всего записей: 428 | Зарегистр. 03-04-2007 | Отправлено: 16:07 02-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А есть уже в СТ возможность пропускать стандартные стадии  обработки, чтобы пользователь сам решал, какие этапы СТ будет отрабатывать, а какие нет? Чтобы при хорошем скане СТ не пытался ничего "улучшать" или менять.

Такого нет.  На самом деле на всех стадиях это можно эмулировать, кроме как на стадии Deskew, где не помешал бы массовый сброс угла в ноль.
Ну и как всегда можно добавить, что улучшение уже обработанных сканов - не основное направление ST, и соответственно не имеет высокого приоритета.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 03:47 03-03-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
На самом деле на всех стадиях это можно эмулировать, кроме как на стадии Deskew

.. и на стадии Полезная область. Или вы уже что-нибудь придумали в плане обхода этой стадии?
Кстати, возможно уже предлагалось - но для улучшения определения полезной области для сканов журналов без полей можно попробовать предварительно сэмулировать эти поля, через групповой инструмент "Добавить рамку" в каком-нибудь просмотрщике (в FS ImageViewer такой инструмент, по крайней мере, есть).

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:24 03-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
.. и на стадии Полезная область. Или вы уже что-нибудь придумали в плане обхода этой стадии?  

Ну да, и это тоже.  Только в этом случае я не хочу добавлять такую функциональность как "рамка на всю страницу".  Очень костыльная получилась бы фича, как бы намекающая, что рамку контента можно использовать и не по назначанию, а именно обводить большую зону, чем сам контент.  А потом еще неопытные пользователи начнут по ней тыкать, в результате в лучшем случае получая гуляющие поля на выходе, а в худшем еще и плохую бинаризацию, из-за попадания корешка в рамку контента.  В общем лучше доверьтесь автомату на этой стадии.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:17 03-03-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
деспеклинг значительно продвинулся.  Еще через пару недель надеюсь закончить его.  

Ура!!! Спасибо!

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 04:04 05-03-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru