Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy
Тогда вам наверное следовало бы сначала изучить, как создавалась программа, благо это просто. Узнать что делал её один человек и сейчас его здесь нет... по некоторым причинам. Кстати, такие как вы тоже были причиной. Некоторые товарищи только и делали что писали, что им хочется, но при этот никто из них ничего не сделал для воплощения своих хотелок в жизнь.
Последняя моя строчка успешно проигнорирована?...
 
Посмотрите историю СК. Там дела несколько лучше только потому, что автор программы сам занимается обработкой книг до сих пор.
 

Цитата:
Попробую, но что-то есть большие сомнения.  

Ну и чем вы лучше моих слов?
Для начала могли бы выложить пару страниц для экспериментов, аднака...
 


----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 13:05 31-08-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цитата:
Попробую, но что-то есть большие сомнения.  
    Ну и чем вы лучше моих слов?  

Попробовал, результат еще хужий, и что?

Цитата:
Для начала могли бы выложить пару страниц для экспериментов, аднака...  

Сначала было желание, но такие как вы сразу отбивают всякую охоту. Может причину, что автора в этой ветке нет лучше поискать в себе, а не в других? Нет?
Я ничего ни от кого не требую, просто описал проблему и пожелание. Принял бы кто во внимание, хорошо, нет, так нет.
Был бы програмистом, не переживайте помог бы и программным кодом, можете не сомневаться.  

Цитата:
Некоторые товарищи только и делали что писали, что им хочется

Вы что-то путаете. Неужели в моих пожеланиях есть то, чего категорически не хотят другие? Пора бы ответить себе на этот вопрос. Думаю, тогда бы глупостей не писали.
 
 

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 14:03 31-08-2016 | Исправлено: Fafy, 14:13 31-08-2016
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Селяви

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 08:19 01-09-2016
derrikF



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
версию 0.9.12.2 никто не компилировал под Windows?

Всего записей: 235 | Зарегистр. 25-02-2007 | Отправлено: 21:09 20-09-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
 
1) Столкнулся с такой проблемой, нужно оцифровать одно многотомное издание, в котором номера страниц от текстового блока отстоят аж на 3 сантиметра. Инструмент Полезная область не смотря на отличное качество сканов почти никогда не вносит номер страниц в полезную область, а вручную подправлять очень затруднительно, когда речь идет о двадцати томах по 500-600 страниц. Я тогда хотел пойти в обход через задание полей. Но, если выводить результат в Черно-белый, то все страницы оказываются закрашенными белым фоном, ведь сейчас опция "Белые поля" можно отменить только для вывода в Цветной/Серый. Можно ли сделать что бы опция: "Белые поля" была доступна во всех режимах вывода? Это очень важно не только к конкретной ситуации, но и когда инструмент Полезная область немножко не правильно определит область и белыми полями полезная область будет подрезаться. Чтобы такого не было, нужно очень внимательно следить за точностью определения полезной области, вплоть до миллиметра. Но с возможностью отключить опцию Белые поля все становится намного проще и можно очень быстро и качественно сделать книгу не высматривая на каждой странице миллиметры.  
 
2) Было бы очень удобно, если бы была возможность постраничного листания колесиком мыши, когда курсор расположен ЗА областью страницы. А когда курсор лежит НА странице, то при прокрутке колесиком, как и сейчас реализовано, будет масштабироваться страница.  
 
3) В режиме Полезная область, когда сортируется по Возрастающей ширине или высоте, при изменении полей страница перемещается в другое место, и конечно так и должно быть, но постоянно теряешь то место где она была изначально, что бы перейти на следующую страницу. В общем путанка. Можно реализовать запоминание двух страниц - предыдущей и следующей страницы относительно выделенной в данный момент, чтобы можно быстро переходить на следующую или предыдущую страницу колесиком мыши или через клавиатуру.  
 
4) Также не хватает кнопочек Первая страница (сверху списка страниц) и Последняя страница (снизу списка страниц) для быстрого перехода на них мышкой.  
 
5) Быстрое масштабирование страницы удобно будет реализовать через двойной клик по странице. Т.е. когда мы увеличили масштаб страницы колесиком до приемлемого вида и дважды кликаем по странице то программа возвращает вид целой страницы но с сохранением в настройках масштаба увеличения какой был до двойного клика. В дальнейшем опять даажды кликаем и страница увеличивается до нужного нам масштаба. Это будет намного быстрее чем постоянно крутить колесико и таким образом искать нужный масштаб.
 
6) Вы раньше писали, что намерены улучшить качество распознавания полезной области. Как с этим делом сейчас? Это пожалуй было бы самым существенным обновлением программы. Именно на правку полезной области после автоматического их определения программой уходит много драгоценного времени.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 23:07 21-09-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy
 
1) Сделаю обязательно.  
В таких случаях можно решить проблему уже и сейчас: выводите сканы в цветном режиме с выключенными белыми полями -> бинаризуете сторонним приложением, например, тем же FineReader'ом.  
 
Я например не пользуюсь черно-белым режимом СТ вообще, делаю выход в цвете -> Обработка в Photoshop (сглаживание, очистка фона и т. п.) -> бинаризация сторонними приложениями, качество в разы лучше, потом объясню и покажу почему, когда анансирую новую версию сборки.  
 
2) Когда мышь находится над областью с миниатюрами, колесико управляет ползунком, а не увеличивает страницу, что логично. Для перелистывания удобно юзать PgUp, PgDown.
 
3) Уже реализовано!
Просто щелкните колесиком мыши по ползунку, и он закрепится. Измененная страница уйдет за границу, а ползунок останется на исходной позиции и вы спокойно можете перейти к следующей странице.  
Чтоб снова открепить ползунок и перейти к убежавщей странице, можно просто щелкнуть кнопку над областью с миниатюрами и ползунок снова будет следовать за убегающей страницей.
 
4) Уже реализовано!  
Просто щелкните колесиком мыши по верхней или нижней области прокрутки, ползунок мгновенно перейдет в эту область (то есть в самое начало и конец).
 
5) Посмотрим.
 
6) Я собираюсь реализовать свой алгоритм, ибо существующий очень неточен и кушает многие элементы, не только номера страниц.  
Я уже весной помню слегка модифицировал существующий алгоритм, просто потестировать, жрать номера страниц стал меньше, но стал медленнее раза в 2-3, меня это не устраивает.
Поэтому сделаю свой с чистого листа с выбором из двух алгоритмов (старый тоже оставлю).
 
 
*Сейчас свободное время занято другим и не до этого, СТ займусь в следующем году, тогда же и анонсирую.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 04:26 22-09-2016 | Исправлено: 4lex4, 04:58 22-09-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
2) Когда мышь находится над областью с миниатюрами, колесико управляет ползунком, а не увеличивает страницу, что логично. Для перелистывания удобно юзать PgUp, PgDown.  

Я имел ввиду не область миниатюр, а область в которой отображается одна страница, но там, кроме самой страницы есть еще много пустого пространства ПОЗА страницей. Именное ее я и имел ввиду, когда говорил:
Цитата:
когда курсор расположен ЗА областью страницы
Для масштабирования страницы эта область не годится, так как на ней нечего разглядывать при увеличении, а вот использовать ее для листания колесиком мышки будет в самый раз.
 

Цитата:
щелкните колесиком мыши по ползунку, и он закрепится. Измененная страница уйдет за границу, а ползунок останется на исходной позиции и вы спокойно можете перейти к следующей странице.  
Чтоб снова открепить ползунок и перейти к убежавщей странице, можно просто щелкнуть кнопку над областью с миниатюрами и ползунок снова будет следовать за убегающей страницей.  

Уже конечно получше будет, но все-равно приходится постоянно переключаться мышкой из одного окна в другое и выбирать нужную страницу, но если бы, как я писал выше, реализовать листание колесиком мышки и программа будет помнить предыдущую и следующую страницу, то эти  постоянные переключения сами собой отпадут. Подправил поле, чуть отодвинул мышку от страницы и листнул колесиком. Или же темиже клавишами. Но без памятования следующей и предыдущей страниц это не получится.
 
Пришла еще одна мысль. Если будет реализован быстрый масштаб двойным кликом, то колесико мышки будет редко использоваться, и тогда можно задействовать колесико для листания страниц не только ЗА областью страницы, а и когда курсор лежит на самой странице.  Например, подправил поле полезной области, круть колесиком и правим поле уже на следующей странице. И не надо постоянно переключаться на список страниц, выбирать там нужную, а потом опять возвращаться в область для ее редактирования.  А подправить значение масштаба по двойному клику можно тоже колесиком мышки, но с зажатой клавишей Ctrl. Конечно, можно оставить и старый вариант через настройки, так будут и овцы целы, и волки сыты.
 

Цитата:
Просто щелкните колесиком мыши по верхней или нижней области прокрутки, ползунок мгновенно перейдет в эту область (то есть в самое начало и конец).
Х-м! Никогда бы не догадался! Конечно, такой вариант рабочий, но интуитивным его никак не назовешь да и удобным можно назвать с натяжкой. А если сделать такой вариант, как на скрине ниже? Ведь после указания сортировки всегда нужно перейти на начало или конец, а тут и кнопочки рядом и вид не портит и интуитивно.
 
   
 
ПОСТОЯННО при запуске программы окно не открывается на полный экран, а сначала в уменьшенном виде располагается в верхнем левом углу, при попытке развернуть окно на весь экран оно теперь отображается уже по центру экрана  и также в уменьшенном виде, и только после еще одного нажатия Развернуть на весь экран получается это сделать.  Конечно не нервировать такое поведение программы не может. Можно как-то это дело подправить? Хочется чтобы программа всегда запускалась в полноэкранном режиме.
 

Цитата:
 Обработка в Photoshop (сглаживание, очистка фона и т. п.) -> бинаризация сторонними приложениями, качество в разы лучше, потом объясню и покажу почему, когда анансирую новую версию сборки.  

А как в Photoshop делать пакетную бинаризацию, и какие оптимальные настройки для этого там делать?

Цитата:
Я уже весной помню слегка модифицировал существующий алгоритм, просто потестировать, жрать номера страниц стал меньше, но стал медленнее раза в 2-3

Можно потестировать ее?

Цитата:
 СТ займусь в следующем году, тогда же и анонсирую.

Очень хочется верить, что это будет не конец, а начало следующего года!?
 

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 17:20 22-09-2016 | Исправлено: Fafy, 10:57 23-09-2016
Dmb_2007

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Сейчас свободное время занято другим и не до этого, СТ займусь в следующем году, тогда же и анонсирую.

 
А можно по быстрому, не меняя алгоритмов, поправить косметику?
Конкретно:
- изменить цвет фона окна
- исправить масштабирование левой панели, чтобы не прятала элементы управления

Всего записей: 340 | Зарегистр. 07-05-2004 | Отправлено: 21:48 22-09-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dmb_2007, на.
Ссылка старая.
 
Интерфейс профиксил, окно профиксил - теперь открывается в полный экран. Второе - баг qt на винде.
Пока без цвета фона, ибо по быстрому уже не получится.
 
Fafy, ага, вот только еще мне еще ста кнопок под миниатюрами не хватало. Может миниатюры вообще убрать, чтоб не мешали на кнопки смотреть?

Цитата:
Можно потестировать ее?

Ссылка - кидать в директорию с СТ.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 13:45 23-09-2016 | Исправлено: 4lex4, 11:24 24-09-2016
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
А какими стороним софтом бинаризацию проводить?

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 19:25 23-09-2016
Dmb_2007

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Dmb_2007, на.  

 
Заранее спасибо! Пока посмотреть не могу, отпишусь чуть позже.

Всего записей: 340 | Зарегистр. 07-05-2004 | Отправлено: 00:01 24-09-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так, произошла ошибка - в исправленной версии тестовый алгоритм поиска контента (тот что медленный), а не нормальный.  
Всем кто скачал - перекачайте.
 
А тем, кто тестит, удалите старый scantailor_contentfind_mod_test.exe.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 07:05 24-09-2016 | Исправлено: 4lex4, 07:10 24-09-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
У сборки, что в последней ссылке - старый, некачественный, но более быстрый вариант распознавания полезной области.
 
Немного потестировал сборки из предыдущих постов.
 
Книга - 344 страниц. Качество сканов отличное, рисунков нету, развороты уже были разбиты на страницы файнридером.
Операции замерялись по отдельности.
 
Операция - затраченное время
1) - 7с.
2) - 7 с.
3) - 7 с.
А первые три операции вместе обработало за - 8 с.
Т.е.  6 с. уходит на считывание файлов всей книги (общий вес файлов книги - 1.13 ГБ.), а на обработку книги из первых трех операций по отдельности счет идет уже в милисекундах. Как-то так!
 
=========================
Распознавание полезной области:
=========================
Обновленный движок (более качественный, но и более медленный) - 59 с.  
Старый движок (менее качественный, но более быстрый) - 26 с.
Разница во времени на конкретную книгу - 33 секунды.
После обновленного метода пришлось подправить всего 1 страницу, а после старого движка из 344 стр., номера страниц внесено в полезную область только на 25 страницах.
Т.е. подправлять только одни незахваты номеров страниц нужно у 315 стр. А ведь еще немало ошибок и по ширине...
И отсюда вопрос, на скольких страницах подправишь полей за 33 с. ???
 
Лично для себя оставил сборку с обновленным, пускай даже и более медленным, движком.
Большое вам спасибо, 4lex4, и надеемся что этот движок будет и более быстрый и более качественный.  
Позже потестирую распознавание полезной области на более сложных вариантах.
 
4lex4
Много ли займет времени, чтобы опция "Белые поля" была доступна во всех режимах вывода?
Без нее как без рук, а следующий год не близок.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 14:29 24-09-2016 | Исправлено: Fafy, 15:10 24-09-2016
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тоже протестировал.
Книга 255  цветных страниц.
Быстрый алгоритм неверно определил номера 52 страниц
Медленный -7
НО. Медленный алгоритм на 46 страницах включил обложку в полезную область.
А быстрый сделал это только 3 раза.
Так что вопросов пока больше, чем ответов.

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 15:21 24-09-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy,

Цитата:
Лично для себя оставил сборку с обновленным, пускай даже и более медленным, движком.  

Можно и обе оставить, чтоб тестить, теперь они полностью одинаковые и отличаются лишь алгоритмом поиска контента. Только убедитесь, что сборка scantailor_contentfind_mod_test.exe от 23 сентября (в окне о программе - About).
 

Цитата:
Много ли займет времени, чтобы опция "Белые поля" была доступна во всех режимах вывода?
Без нее как без рук, а следующий год не близок.

Сколько времени займет неизвестно, поэтому придется подождать, сейчас точно не буду делать. В следующем году думаю зимой-весной выложу.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 16:11 24-09-2016 | Исправлено: 4lex4, 16:36 24-09-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
1) Разница между сборками от 23 сентября и от 24 сентября только в exe-файле?
Т.е. можно держать два исполняемых файл в одной папке с программой, только под разными именами?
 
2) Так как до весны следующего года еще очень далеко, то не подскажете варианты по качественной пакетной бинаризации.? Как, чем..?
 
3) Хочу попробовать доделать перевод программы, QtLinguist_4.8.4 у меня есть. Где и что править?

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 17:03 24-09-2016
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
w10. Как переключить интерфейс с англ на русский?
СТ скачал из последней ссылки (перекачайте)

Всего записей: 1430 | Зарегистр. 02-08-2008 | Отправлено: 12:47 27-09-2016
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo
Никак, в этой сборке нет русского языка.

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 23:33 27-09-2016
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
allo04 Спасибо
Цитата:
Никак, в этой сборке нет русского языка
Переживем
Но все таки
Fafy Несколько постов выше у Вас картинка с русским интерфейсом. Где взять эту версию СТ? СПАСИБО!
 
 
 
 

Всего записей: 1430 | Зарегистр. 02-08-2008 | Отправлено: 09:57 28-09-2016 | Исправлено: alpopo, 06:00 06-10-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo
Полной локализации данной сборки пока нет, но вы можете скинуть файлы локализации из других сборок.
Скачать

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 12:13 28-09-2016
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru