Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Интересные идеи. Только не пойму, зачем рисовать этот прямоугольник и тратить на него время, когда можно это просто одним кликом мышкой сделать, например, Alt+Клик. Тыкаем в любое место и область автоматом расширяется/сужается до этой точки, автоматически корректируясь по контенту.  

Тоже вариант, но будет ли ясно при этом, что мы хотим залить фон, в случае с большими пустотами?
И если честно, то мне проще и наверное быстрее выделить не целясь, чем тянуться левой рукой к клавиатуре. Тут уж точно дело привычек. Или уж тогда давайте самый минимум - двойной клик ЛКМ.
 
И как все таки на счет разделения понятий Полезная область и Базовая зона? Нам нужна реальная база. Кому, что то не ясно могли бы ее вовсе не трогать, изначально она равна Полезной области. Но она может быть в ручную настроена для каждой страницы и может быть  равной для всех. Тем самым мы имеем более точное прзиционирование контента относиттельно краев листа и края контента не будут скакать. Сами поля будут именно такими какими мы их задаем, например 10мм, а не скакать от этой величны в пределах 1мм.
 
Все, что для этого нужно - позволить двигать границы полезной области на этапе Поля.

Всего записей: 1558 | Зарегистр. 29-01-2009 | Отправлено: 04:28 24-02-2018 | Исправлено: BKSRU, 06:14 24-02-2018
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
4lex4, народ безмолствует ))  

Народ не безмолствует! И я об этом уже писал.
4lex4
Дабы не было непоняток что кто называет в каждой описываемой ситуации Включеной/Отключеной клавишу "Следовать за страницей" сделайте пожалуйста индикацию  кнопки вкл./откл. кнопки "Следовать за страницей" ТЕКСТОВОЙ в названии самой кнопки. Чтобы можно было хоть понять в каком она на данный момент режиме, а то сейчас как у цыганки-гадалки.
Как сейчас обсуждать режим "Следовать за страницей" если каждый может один и тот же режим называть совсем противоположно?
 
Вобщем я за то чтобы по-умолчанию кнопка "Следовать за страницей" имела поведение,  которое не перемещало бы правленную страницу на новое место. Или же сделать опцию в настройке. Я только одним режимом и пользуюсь. Не знаю что удобного в переходе на новое место а потом после каждой правкой искать то место где она была чтобы продолжить править следующую страницу?... Может кому-то и удобней чесать левой ногой правое ухо, но лично мне как-то не очень.

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 14:02 24-02-2018
derrikF



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
исправление геометрии - очень тяжелая операция, быстроты тут не ждите.

я боюсь не потери быстроты при исправлении геометрии, а потери быстроты при отображении страниц на пятой стадии в EXP, ибо выпрямление там на 3 стадии а не на выводе... хотя есть в этом свой плюс - например, если выпрямление на 3 стадии, то полезная область будет определяться с учетом выпрямления...
 
отсюда вопрос - вы просто поменяете движок выпрямления или также хотите выпрямление вынести на 3 этап?
 
Добавлено:
касательно того, что происходит в списке миниатюр... непонятки разные...  
 
например, я сейчас открыл проект для исправлений... на экране страница отображается после открытия проекта под номером 0196, а в списке миниатюр номер 0068... я переключаюсь на стадию Поля, без сортировки, и вместо страницы открытой под номером 0196 я имею страницу в списке миниатюр под номером 0037... я такое поведение характеризую так -то и так-то, а у вас свое мнение... в данном случае, для меня логичнее чтобы в данном случае кнопка "Следовать..." была нажата... ибо я могу закрыть проект, а позже открыть его и продолжить продолжать работу, и у меня будет такая неразбериха между открытой страницей и той которая в списке миниатюр...
 
значит, я должен я просить разраба сделать как мне хочется?  
 
хорошо, прошу! - 4lex4 - да настанет уже день выхода версии 1.1.0!

Всего записей: 235 | Зарегистр. 25-02-2007 | Отправлено: 22:23 24-02-2018 | Исправлено: derrikF, 22:50 24-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid, сделано.
 
Фичу авто-коррекции полезной области запилил, работает по двойному клику по контенту.  
Работает как на сужение (когда клик по контенту внутри области), так и на расширение (когда нужный контент снаружи).

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 02:43 25-02-2018 | Исправлено: 4lex4, 02:48 25-02-2018
derrikF



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Implemented the feature of auto adjusting content area.  

СУПЕР! то что доктор прописал - клацаешь по номеру страницы или чуть ниже номера, так полезная область сама захватывает номер, клацать нужно от чуть выше середины номера... здорово, не авто, но экономии времени будет ощутимо...

Всего записей: 235 | Зарегистр. 25-02-2007 | Отправлено: 08:42 25-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
derrikF, область становится точно такой же, как бы она стала после авто алгоритма, если бы последний включил этот контент.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 15:34 25-02-2018 | Исправлено: 4lex4, 15:37 25-02-2018
derrikF



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
вы или меня не поняли, или я вас не понял...
 
просто я хотел подметитить, что если.............
 
да юзеры сами разберуться как она себя ведет... главное, что это здорово..

Всего записей: 235 | Зарегистр. 25-02-2007 | Отправлено: 17:24 25-02-2018 | Исправлено: derrikF, 17:35 25-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU,

Цитата:
Нам нужна реальная база. Кому, что то не ясно могли бы ее вовсе не трогать, изначально она равна Полезной области. Но она может быть в ручную настроена для каждой страницы и может быть  равной для всех. Тем самым мы имеем более точное прзиционирование контента относиттельно краев листа и края контента не будут скакать. Сами поля будут именно такими какими мы их задаем, например 10мм, а не скакать от этой величны в пределах 1мм.

Тот же вопрос, на что будет опираться ваша базовая зона. Эти десятые от миллиметра неустойчивы и скачут по разному, ибо это простая погрешность авто-алгоритма - случайная величина. Например, если задать эту зону от левого верхнего угла, для одних страниц это подойдет, а для других ваша базовая зона сожрет части букв с правой стороны и снизу.
 
То есть в любом случае вам придется ее двигать. Смысла ее корректировать на 5й стадии нет, проще перейти в ручной режим и взять за базу зону для какой-нибудь страницы на 4й стадии, применить ее ко всем другим страницам, и двигать полезную область для каждой страницы, где это нужно, используя Shift+ЛКМ, и только потом переходить на 5ю стадию.
 
Можно было бы сделать отдельную настройку для авто-алгоритма - коррекцию результата после нахождения области, чтобы автоматом точно скорректировать эти микрометры по контенту. Естественно это увеличит время обработки. Это займет определенное время и отнимет у меня ресурсы, а лично мне это не нужно, да и вообще мало кому нужно. Вообщем, если вам сильно надо, то такие узкие вопросы можно решить деньгами.
 
Добавлено:
derrikF, да, я согласен, это действительно здорово.

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 19:43 25-02-2018 | Исправлено: 4lex4, 20:51 25-02-2018
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
 
Тот же вопрос, на что будет опираться ваша базовая зона. Эти десятые от миллиметра неустойчивы и скачут по разному, ибо это простая погрешность авто-алгоритма - случайная величина. Например, если задать эту зону от левого верхнего угла, для одних страниц это подойдет, а для других ваша базовая зона сожрет части букв с правой стороны и снизу.
 
То есть в любом случае вам придется ее двигать. Смысла ее корректировать на 5й стадии нет, проще перейти в ручной режим и взять за базу зону для какой-нибудь страницы на 4й стадии, применить ее ко всем другим страницам, и двигать полезную область для каждой страницы, где это нужно, используя Shift+ЛКМ, и только потом переходить на 5ю стадию.  

Не всегда удается понять друг друга посредством письма, как это сделано, например, с полуавтоматической подгонкой страниц (кстати скомпилировали бы на пробу местным тестерам). Однако можно договориться и понять друг друга, например через скайп.
 
Но я думал, что вы поняли проблему представленного примера http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=2420#6
Например, необходимо выровнять полезную зону относительно краев формата, ширина ее варьирует в пределах, почти 2х мм. И вовсе не потому, что автоалгоритм ошибается. С ним как раз все в порядке. Все дело в некоторых буквах. И пример это ясно показывает.
Как можно было бы справиться с такой задачей? Все просто, на самом деле ширина основного контента одинакова и она могла бы быть взята за более менее реальную базу:
- На 4й стадии, как обычно выделяем полезные зоны.
- На 5й стадии, для примера равняю все страницы по левому краю.
- Выбираю страницу и срезаю проблемный выступ (это не единственная причина, влияющая на то, что Полезная зона не может являться базовой), например:

Автоматически идет выравнивание страницы. Если на этой стадии сработает нововведеннная фишка автокоррекции зоны по двойному клику, то скорость ручной обработки еще больше увеличится.
Одно только это позволит увеличить скорость ручного выравнивания контента относительно формата до приемлевого уровня.
Можно ли это сделать на 4й стадии? Нет!!! Придется срезать полезный контент либо отказаться от заливки полей, либо создавать дублирующий проект. Это не выход и не решает проблемы, не увеличивает скорость ручной обработки.  
Единственно, что мы можем сейчас сделать, это на 5й стадии подогнать с помощью нелепой системы навигации левый край контента на глаз. При этом придется тыкать пальцем, как некоторые, либо выставить экранную линеечку. Мало того, двигать зону с помощью ОГРОМНОГО ШАГА, как раз равного типичной погрешности авторасчета - 1мм. Что остается? В ручную вписывать цыфры. Подогнать можно, но скорость никак не возростет. Это занятие нудное. Тот ручной способ который вы предложили на 4й стадии, извините, но вообще ни в какие ворота не лезет ни по точности ни тем более по скорости.
Тому, что предложил реальной альтернативы нет в нынешней реализации.  
 
На самом деле на 5й стадии быстро можно проверить все странички переназначив проблемную левую базовую линию. Левая база менее проблематична и от нее легче оттолкнуться, с меньшими затратами на ручной труд. И при выравнивании по ней, контент страничек встанет ровно в колонку.
 
Однако это еще не все. Точность позиционирования можно визуально увеличить, если ровнять контент по центру. Но сейчас это бесмысленно, поскольку ширина контента варьирует в пределах 2мм.
Но:
- Надо иметь возможность назначать базовую ширину контента, меньше чем ширина базовой области. Именно ее назначаем для каждой стрницы. НЕ ДВИГАЯ ЛЕВЫЙ КРАЙ ЗОНЫ.
Эта базовая ширина позволит очень точно выровнять контент почти на всех страницах, не прибегая к ручной подгонке.
Иными словами мы можем иметь точные: ширину контента и поля страниц ровно какими они были заданы.
- Мало того это могло бы помочь состыковать развороты, поскольку можно выбрать за базу любую точку стыка.
 
Подобный подход никак не влияет на то как сейчас устроено выравнивание страниц на 5й стадии, он просто расширяет его возможности до уровня более менее разумного.
 
Уверен, что подобного рода проблему можно было бы возложить и на более продвинутый алгоритм автоматизации. Но для начала хоть что то сдвинуть на 5й стадии. Она не пригодна для выполнения максимально скоростной обработки. Т.е. ощущается остаточный подход - лучше чем ничего.
 
Например можно было бы просто двойным щелчком мыши по левому полю (рядом с беспроблемной зоной), выровнять контент. Т.е. если на приведенном скрине сделать двойной клик на левом поле практически в любом месте, то 10мм должны были бы отсчитаны не от хвостика J, а от реального края. Визуально, в данном случае, даже Полезная область может не меняться (но тогда не будет видно где уже произведена коррекция). Происходит автоподгонка поля под реальную базу, пусть даже виртуальную, видную только программе.

Всего записей: 1558 | Зарегистр. 29-01-2009 | Отправлено: 08:42 26-02-2018 | Исправлено: BKSRU, 11:40 26-02-2018
Dmb_2007

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU
 
Я правильно понимаю, что проблема в оптическом выравнивании?

Всего записей: 341 | Зарегистр. 07-05-2004 | Отправлено: 13:49 26-02-2018
tlotr

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Цитата:
Implemented the feature of auto adjusting content area.  
 
derrikF
СУПЕР! то что доктор прописал - клацаешь по номеру страницы или чуть ниже номера, так полезная область сама захватывает номер, клацать нужно от чуть выше середины номера... здорово, не авто, но экономии времени будет ощутимо...
 

Тоже очень хотелось бы пощупать.  
 
Если я правильно понимаю, то данная фича будет работать и в случае, если какая-то часть текста не была распознана, как полезная? В тех двух страницах, что я вам присылал, одна была именно такая:
 
Отправлено: 20:12 07-02-2018
tlotr

Цитата:
6. Если не сложно, гляньте, пожалуйста, почему автоматически неправильно определяется полезная область у Scan-009 - сверху отсекается текст, который, вроде, не выглядит совсем уж мусором. Причём, это происходит и в других форках. Попробовал скормить эту страницу в STF, там то же самое. Слишком малоконтрастный текст?

Всего записей: 85 | Зарегистр. 16-09-2009 | Отправлено: 15:30 26-02-2018
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dmb_2007
Проблема в том, что Полезная область  в основном скачет не потому, что она не точно определяется. Здесь достаточно точное определение. Устроит большинство. Проблема в выступающих частях за основную линию края текста. Например как в моем случае, слева выступает хвостик J. Справа (на скрине не показывал) выступает намного чаще хвостик f. Как показывал ранее, этот хвостик вовсе не микроны, а 0,9мм. Т.е. в целом отклонение 1,8мм. Иными словами мы имеем несколько основных ширин Полезной области текста: 120мм, 120.9, 121.8. И это не единственные выступающие части, ими могут быть: буквицы, рисунки... Таким образом Полезная область не может являться базой.
А вот основная линия текста, может быть взята за основу базы и это позволило бы довольно быстро производить коррекцию положения контента. На предыдущем скрине как раз показана та часть текста, которая должна была быть взята за основу выравнивания.
 
На самом деле с моей точки зрения это все равно полумера.

Всего записей: 1558 | Зарегистр. 29-01-2009 | Отправлено: 15:44 26-02-2018 | Исправлено: BKSRU, 15:56 26-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU, на том примере это не погрешность, а ошибка авто-алгоритма. Киньте мне то изображение в личку, скорее всего простая предобработка перед суванием в СТ исправит положение.
 
Вы ввели уже кучу понятий, вроде формат, базовая зона и т.п., так и не дав точное строгое определение ни одному из них, прям какое-то словоблудие. Так не пойдет.
 
Вообщем, на 5й стадии мы имеем три прямоугольника:
1. Прямоугольник с контентом.
2. Прямоуголик жестких полей.
3. Прямоугольник мягких полей, который получаются в результате выравнивания с самой широкой и высокой страницей в проекте. Прямоугольник мягких полей имеет всегда имеет высоту = высота самого высокого прямоугольника жестких полей из всех страниц, для которых включено выравнивание, тоже самое и для ширины.
 
Отталкиваясь от этих понятий, можете объяснять свою концепцию.
Если вводите новое понятие, математически строго объясняйте его. То есть если это новый прямоугольник, должны быть объяснены его ширина и высота, а также где находится точка левого верхнего угла.
Все должно быть по строгим шагам: если юзер взаимодействует с программой, должны быть описаны входные параметры и результат, причем точно описаны.  
Никакой воды, расплывчатых понятий и эмоций быть не должно.
 
Добавлено:
tlotr, естественно. Иначе в чем была бы была суть этой фичи?

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 16:41 26-02-2018 | Исправлено: 4lex4, 18:27 26-02-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
BKSRU
Я вот со стороны гляжу... А не проще перечислить (опционально, конечно) возможные форматы, то есть форматирование контента по листу? И ввести это как маску, которая будет подбираться к скану. Расположение контента на странице ведь довольно подробно исследовалось книготеоретиками. Всякие золотые сечения, деление в три четверти, полуторные отступы и так далее. Никакая "J" хвостик не потеряет - типографские машины ведь железные.
Опционально и отключаемо у конкретного листка, потому что оригиналы бывают разные. И не только книги. Пусть BKSRU, раз он такой настойчивый, и видит чего другие не видят, формализует шаблон описания габаритной маски для листа. Типа "прямоугольник контента текста в диагонали 1:2 плюс левый верхний угол для номера страницы для чётных сканов плюс правый верхний для нечётных сканов плюс нижний колонтитул на 1/16 ниже контента текста".
Причина предложения: если выбран метод автораспознавания габаритов, то без уточнения опорных характеристик всегда придётся закладывать запас по захвату, чтобы повысить вероятность успеха распознавания "чего угодно и расположенного как угодно". Так введите опоры для алгоритма.
 
В порядке безумия, конечно, предложено: ST не СК, и должен быть, на мой взгляд, намного проще. Мне понравилось с ним работать - примитивно и надёжно.

Всего записей: 3056 | Зарегистр. 15-07-2010 | Отправлено: 18:45 26-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А не проще перечислить (опционально, конечно) возможные форматы, то есть форматирование контента по листу? И ввести это как маску, которая будет подбираться к скану.

Это уже есть в СТА, но при сканировании края страниц у корешка загибаются, получается контент скачет по горизонтали и страницы разной ширины. На идеальных сканах, где книга разрезалась по корешку, мы можем просто применить полезную область ко всем страницам, а так как четные и нечетные страницы имеют разное форматирование, то применяем два раза в режиме через одну. Я уже применял этот подход на сканах, у которых не было изгиба у корешка, работает отлично.

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 18:56 26-02-2018 | Исправлено: 4lex4, 19:01 26-02-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
получается контент скачет по горизонтали

а я думал что поля вычисляются после распрямления строк. Если до - тогда конечно метод годится только для развёрнутых в плоскость сканов. Никакие фотки, например, в маску не влезут.

Всего записей: 3056 | Зарегистр. 15-07-2010 | Отправлено: 19:01 26-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, имеются ввиду не выпрямление геометрии, а именно изгиб у корешка, его нельзя ничем выпрямить и вычислить точную ширину, которую этот изгиб забрал от страницы, ибо он в трехмерном пространстве, и мы видим лишь его проекцию на двухмерное. Сами строки могут быть и идеально ровными, имелось ввиду смещение контента, а не искривление.
 
Кстати, для фоток текущая версия СТА плохо подходит. Для фоток подходит СТ Experimental, там как раз сделано исправление геометрии на 3й стадии, плюс есть исправление трапецевидных искажений, плюс фича ремасштабирования на 5й стадии. Но вот для сканов последняя плохо подходит. Если перенести эти фичи в СТА, можно будет получить универсальный инструмент.

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 19:10 26-02-2018 | Исправлено: 4lex4, 19:28 26-02-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
имелось ввиду смещение контента

я, наверное, подзабыл: имхо, букресторер правил "трёхмерную" картинку. Смещал контент обратно. Кажется, я на это специально обращал внимание, что он не тупо сдвигает пиксели в линию. Может, и "недодвигает" в ноль, но пытается, и успешно - это же бумага с текстом, можно рассчитать по шрифту. Давно было, мог запамятовать.
Но не суть. Я же так, свежий взгляд со стороны на посты BKSRU
.

Всего записей: 3056 | Зарегистр. 15-07-2010 | Отправлено: 19:41 26-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, нет, это невозможно даже теоретически, ибо имелось ввиду, что сканы нормальные и в корешке нет контента.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 20:22 26-02-2018 | Исправлено: 4lex4, 20:26 26-02-2018
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В порядке безумия, конечно, предложено: ST не СК, и должен быть, на мой взгляд, намного проще. Мне понравилось с ним работать - примитивно и надёжно.

Лично моя задача - это не простой инструмент, а быстрый и автоматизированый, мне на сложность наплевать вообще.  
Официальный СТ мне не подходит из-за недостатка возможностей для многих случаев и полной неуправляемости - жертва упрощения вообщем. Упрощение настолько сильное, что даже при всем желании опытный обработчик не сможет получить качественный результат для многих случаев из-за ограничений инструмента.
СК мне не подходит из-за топорности: после обработки необходимо проверять каждую страницу, нельзя как в СТ отсортировать и просмотреть только проблемные страницы, да и миниатюр вообще нет, плюс недостаток автоматизации (в СК зоны картинок автоматом не распознаются), да еще и сам СК медленно обрабатывает. Результат один и тот же, только в СК надо потратить кучу времени и ручного труда. В плане ручной доработки СК тоже не интересен, ибо нет нормальной работы со слоями и нет многих фишек граф. редакторов, поэтому приходится выкручиваться всякими окольными путями.
Плюс СК только в том, что это инструмент все в одном, и сразу после СК можно получить качественный результат, правда с большими временными затратами. Для СТА это не так: для получения качественного результата СТА должен использоваться только в комбинации с граф. редактором, кроме разве что простых случаев, но это стоит того, ибо во многом быстрее и удобнее, да и процесс более контролируемый и позволяет автоматизировать некоторые части.
Единственная проблема - для СТА нет нормальных туторов, как пользоваться новыми фичами и получать качественный результат, используя СТА в комбинации граф. редакторами, и писать их кроме меня некому, и эту проблему я планирую решить после выхода СТА 1.1.x, через месяц-два. Правда каждый может и сейчас прочитать README на гитхабе, я там обычно описываю детали этих фич, и додумать как их юзать самому, ибо на самом деле ничего особо сложного нет, если есть опыт использования граф. редакторов.

----------
ScanTailor Advanced v1.0.16 | Пожертвования

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 22:36 26-02-2018 | Исправлено: 4lex4, 00:32 27-02-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru