Перейти из форума на сайт.


Система IP-видеонаблюдения "Линия". Скачать бесплатную демо-версию для 16 камер. НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии)
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: 4lex4, 08:20 12-02-2018
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Первая сборка с регулируемым деспеклом: http://www.onlinedisk.ru/file/371938/
Регулировку не стал делать плавной (трудно сбалансировать параметры), а вместо этого сделал три уровня плюс четвертый - отключено.  Планируется сделать еще пару улучшений, не связанных с качеством удаления пятен, а в остальном все уже имеется.
 
Прошу потестировать и сообщать случаи, когда на крайних режимах (не считая отключенного) не удается достичь желаемого эффекта.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:36 08-03-2010
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Правильно ли я понимаю, что красным обозначаются зоны удаления контента? Если так, то...
Самый жесткий уровень делает губительные ошибки. Причем на страницах содержания удаляет не точки (беда прежнего алгоритма), а текст.
Tulon
Просто интересно, а изначальный алгоритм какому из нынешних уровней очистки соответствовал? Или их теперь сравнивать уже нельзя?
 
Добавлено:
Мда... Dewarp создает причудливые формы на выходе ))). Да, знаю, что он в сыром виде.
Ожин раз программа вылетела. Но, думаю, это по моей вине: нажал на вывод, прога стала обрабатывать скан, а я сразу нажал Dewarp. Если повторится - извещу.
Tulon
Спасибо за деспекл! По предварительному тестированию средний уровень хорошо справляется. Будем тестировать дальше... на рабочих материалах.

Всего записей: 579 | Зарегистр. 28-07-2005 | Отправлено: 01:14 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Правильно ли я понимаю, что красным обозначаются зоны удаления контента? Если так, то...
Самый жесткий уровень делает губительные ошибки. Причем на страницах содержания удаляет не точки (беда прежнего алгоритма), а текст.  

Ну так давайте примеры.  Может там DPI неправильный или еще чего.  А если ничего такого, то можно и параметры подкрутить.  Для этого собственно говоря и прошу тестировать.
 

Цитата:
Просто интересно, а изначальный алгоритм какому из нынешних уровней очистки соответствовал? Или их теперь сравнивать уже нельзя?  

Было сделано два изменения в алгоритме, из-за которых точного соответствия уже не получится.  В частности, близость по горизонтали теперь ценится больше, чем  по вертикали.
 

Цитата:
Мда... Dewarp создает причудливые формы на выходе ))). Да, знаю, что он в сыром виде.
Ожин раз программа вылетела. Но, думаю, это по моей вине: нажал на вывод, прога стала обрабатывать скан, а я сразу нажал Dewarp. Если повторится - извещу.  

Dewarp я в релизе вообще отключу, иначе меня задолбают баг репортами.
Падать не должна, даже в таком случае.  В этой сборке я отключил обработчик падений, но если надо - включу в следующей.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:45 08-03-2010
U235

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
По поводу Dewarp'а:  алгоритм в том виде в котором есть сейчас будет давать искажения на страницах типа содержаний, т.к. вертикальное положение центра тяжести букв и отточий изначально различаются.  
Самый простой выход могу предложить такой: в cc_box поудалять слишком маленькие прямоугольники, соответствующие точкам,  запятым и т.д. Т.е. вообще не учитывать их при расчете линии строки.

Всего записей: 513 | Зарегистр. 14-12-2005 | Отправлено: 02:42 08-03-2010
VidelSamogO



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Ух! Спасибища! Главное неудобство для про-обработки, учтено! Всё, можно подработать свои запасы.
 
Добавлено:
Благодарность Вам от имени Infanata! Вас там очень ценят. И ваши разработки.

Всего записей: 584 | Зарегистр. 16-08-2008 | Отправлено: 03:20 08-03-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо за ваш труд!
 
1. Даже в смешанном режиме картинка на вкладке depesking остается битональной, и находит точки для удаления в области автозоны.
2. Чтобы разглядеть удаленную песчинку на фоне depesking-пятна приходится сильно увеличивать масштаб, почему бы не рисовать ее черной?
3. Мне одному кажется очень странной пустая кнопка? Может быть, все-таки чекбокс + ползунок на три положения? Сейчас с учетом кнопки Применить панель Depeskling выглядит несколько громоздко..
4. Не забудьте поправить заголовок окна "Применить к.."

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:45 08-03-2010 | Исправлено: StanFreeWare, 08:50 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. Даже в смешанном режиме картинка на вкладке depesking остается битональной, и находит точки для удаления в области автозоны.  

Деталь реализации.  Возможно в релизе сделаю смешанный вывод.
 

Цитата:
2. Чтобы разглядеть удаленную песчинку на фоне depesking-пятна приходится сильно увеличивать масштаб, почему бы не рисовать ее черной?  

Представьте, что две песчинки были рядом и одна удалилась, а другая нет.  В этом случае пятно от удалившейся покроет и оставшуюся, но оставшаяся останется черной.  Можно попробовать и другие способы повышения разборчивости удаленных объектов, например сделать пятна бледнее.  На практике однако очень редко нужно смотреть, а что именно там удалилось - достаточно издалека взглянуть, где оно было и какой размер имело.
 

Цитата:
3. Мне одному кажется очень странной пустая кнопка? Может быть, все-таки чекбокс + ползунок на три положения? Сейчас с учетом кнопки Применить панель Depeskling выглядит несколько громоздко..  

Изначально было с ползунком, но получилось, что три кнопки - гораздо удобнее эргономически.  А насчет пустой кнопки - можете нарисовать перечеркнутый веник, или что-то еще.  Сам то я рисовать не умею.
 

Цитата:
4. Не забудьте поправить заголовок окна "Применить к.."

OK
 
Добавлено:
U235

Цитата:
По поводу Dewarp'а:  алгоритм в том виде в котором есть сейчас будет давать искажения на страницах типа содержаний, т.к. вертикальное положение центра тяжести букв и отточий изначально различаются.  
Самый простой выход могу предложить такой: в cc_box поудалять слишком маленькие прямоугольники, соответствующие точкам,  запятым и т.д. Т.е. вообще не учитывать их при расчете линии строки.

Учту.
 
Добавлено:
VidelSamogO
Спасибо за позитив.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:57 08-03-2010
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Первая сборка с регулируемым деспеклом: http://www.onlinedisk.ru/file/371938/

у меня под WS2008, к сожалению, после загрузки файлов вылетает.
 
Пока не разбирался, времени вчера не было.
Может быть проблема и у меня. Чего я туда только не установил.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 13:46 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olive77
Вечером выложу сборку с краш репортером.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:28 08-03-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
1. Дело не только в смешанном выводе - а в том, что, повторюсь, в автозоне ищутся и находятся песчинки..
 
2. Перечеркнутый веник никак не впишется. Да и неясно, какого размера брать размер веник для перечеркивания.  
В данном случае оптимум - это, imho, чекбокс + три кнопки (неактивные при выключенном чекбоксе). Такое решение уже привычно по панели Выравнивание этапа Макет страниц. Плюс уйдет ненужный дребезг границ кнопок (воспринимаемый как неряшливость) из-за того, что ширина кнопки Применить примерно равна ширине двух кнопок с веником.
 
Добавлено:
А примерно, в сравнении с типографской точкой чему каждый веник соответствует?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:20 08-03-2010 | Исправлено: StanFreeWare, 16:27 08-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчерашняя сборка, только с краш репортером: http://www.onlinedisk.ru/file/372680/
 
StanFreeWare

Цитата:
1. Дело не только в смешанном выводе - а в том, что, повторюсь, в автозоне ищутся и находятся песчинки..  

Это не важно.  Зона, в которой они находятся, все равно накроется картинкой.  В общем не беспокойтесь на этот счет, а подождите до релиза.
 

Цитата:
2. Перечеркнутый веник никак не впишется. Да и неясно, какого размера брать размер веник для перечеркивания.  
В данном случае оптимум - это, imho, чекбокс + три кнопки (неактивные при выключенном чекбоксе). Такое решение уже привычно по панели Выравнивание этапа Макет страниц. Плюс уйдет ненужный дребезг границ кнопок (воспринимаемый как неряшливость) из-за того, что ширина кнопки Применить примерно равна ширине двух кнопок с веником.  

Мне все же четыре кнопки в ряд больше нравятся.
 

Цитата:
А примерно, в сравнении с типографской точкой чему каждый веник соответствует?

Это не просто фильтр по размеру, там все сложнее:
Есть верхний предел по размеру, достигнув которого объект определенно удален не будет.  Он достаточно высок, с таким расчетом, чтобы буквы его достигли, а пунктуация и другая мелочь - нет.  Ну а дальше строится такая модель:
Объект может удерживать другой объект, если тот не сильно большой и не сильно далеко.  Тот в свою очередь тоже может удерживать другие объекты.  Потом для каждого объекта проверяем, есть ли в цепочке его удерживающих объект, достигший верхнего предела по размеру.  По аналогии с небесными телами в общем.
 
Добавлено:
Olive77
Падает при попытке использовать OpenGL.  Возможно связано с новой версией Qt.  Может быть 3D ускорение тоже стоит в релизе отключть - больше проблем от него чем толку.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:02 08-03-2010
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Может быть 3D ускорение тоже стоит в релизе отключть

Так Вы же вроде давно его отключили в настройках по-умолчанию. Снова вернули? ИМХО, лучше отключить

Всего записей: 579 | Зарегистр. 28-07-2005 | Отправлено: 00:16 09-03-2010
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Падает при попытке использовать OpenGL.  Возможно связано с новой версией Qt.  Может быть 3D ускорение тоже стоит в релизе отключть - больше проблем от него чем толку.

Так и есть.
Правда в начальных версиях использующих 3D ускорение проблем не было.
 
На выходных потестю с пристрастием.
Спасибо за новую версию.

----------
Believe it or not, every fool you meet is the end result of millions of years of evolution.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 00:35 09-03-2010
Mandor Sawall

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчера вечером попробовал на маленкую книжку (80 стр.) – все на самый сильный деспекл. Только на одну страницу удалила три тире – вот на ету (левый разворот).
Мои заметки:
1. По моему, даже самый сильный деспекл немножко недостаточен. На одну страницу заметил пятно, которое входит в квадрат 3х3 пикселя.
2. Почему-то настройки деспекля не записываются в проект. Каждий раз после загрузки проекта начинает с средный режим.
3. Если на страницу нет контента (пустая страница), закладка Despecle вылетает с ошибкой.
Кстати, болгарский перевод еще старый – с множество опечатками. Пожалуйста, не выпускайте релийз с етим переводом.
 
Надеюсь, что внятно обяснил (словарь у меня бедный…)
 
Добавлено:
Да, и еще – что думаете о возможность удалять (запрещать) конретний деспекл через правый клик на красные пятна?

Всего записей: 119 | Зарегистр. 20-03-2003 | Отправлено: 09:55 09-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Так Вы же вроде давно его отключили в настройках по-умолчанию. Снова вернули? ИМХО, лучше отключить

Я имел в виду что лучше его совсем убрать.  Еще не встречал человека, у которого эта фича не просто работает, а работает лучше чем режим по умолчанию.
 
Mandor Sawall

Цитата:
1. По моему, даже самый сильный деспекл немножко недостаточен. На одну страницу заметил пятно, которое входит в квадрат 3х3 пикселя.  

Значит оно совсем близко от чего-то более крупного.
 

Цитата:
2. Почему-то настройки деспекля не записываются в проект. Каждий раз после загрузки проекта начинает с средный режим.
3. Если на страницу нет контента (пустая страница), закладка Despecle вылетает с ошибкой.  

Вечером посмотрю.
 

Цитата:
Да, и еще – что думаете о возможность удалять (запрещать) конретний деспекл через правый клик на красные пятна?

Пока нет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:18 09-03-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Возможно, следует сделать (в отдалённом будущем) возможность вращения зон (авто- и пользовательских).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:46 14-03-2010
U235

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Не представляю, зачем  поворачивать картинки отдельно...?
Есть реальный пример такого скана, где это необходимо?

Всего записей: 513 | Зарегистр. 14-12-2005 | Отправлено: 01:25 15-03-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Второй пререлиз версии 0.9.8: http://www.onlinedisk.ru/file/378694/
 
Теперь планирую исправить пару мелочей и посмотреть, нет ли мест, где легко можно поднять производительность.  Потом, если к тому времени не пропадет желание, спрошу здешних форумчан на предмет того, какие еще мелочи стоит исправить к релизу.  А сам релиз будет через пару недель.
 
Dewarp и 3D ускорение, которое до сих пор падает, я в релизе уберу.  В этой сборке и то и другое еще есть.
 
Кстати до сих пор мне не предоставили ни одного примера, где деспекл работет сильно плохо.  Если есть такие примеры - выкладывайте пока не поздно.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:28 15-03-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
какие еще мелочи стоит исправить к релизу

Если будет возможность -- можно увеличить линейку бинаризации, скажем, до -30 ... +30 (в тех же единицах)?

Всего записей: 176 | Зарегистр. 18-05-2005 | Отправлено: 04:13 15-03-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Не представляю, зачем  поворачивать картинки отдельно...?

Для взыскательных сканировщиков, думаю.

Цитата:
Есть реальный пример такого скана, где это необходимо?

Под рукой нет, но изредка бывала такая нужда. Типичный пример - повернули скан по Deskew - а картинки после этого просятся, чтобы их ещё чуть крутануть - до точно горизонтального положения. Это, конечно, на сканах не самого хорошего качества (скажем, неравномерно от верха к низу по вертикали - "гнутых" или "раздутых").

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:36 15-03-2010 | Исправлено: monday2000, 11:38 15-03-2010
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru