Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В чистом виде патч от angnost96 все-таки недостаточно удобен, требует даже не двух - для текста и изображений, а зачастую и четырех, и шести прогонов - для исправления ошибок определения зон, которые заметны только на одном из режимов. Если уж делать, то "по-взрослому" - с одновременным выводом и текста и изображений (и, если угодно, серого текста с дырками от картинок) в один проход. И лучше все-таки в раздельные папки, а не в  многостраничный tif (который все равно в подавляющем большинстве случаев придется раскладывать на составляющие вручную для последующей обработки).

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:02 13-01-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon, нет полного описания делать не нужно, хотя не мешало бы, просто достаточно точного названия того или иного алгоритма и этого. Исчерпывающую информацию будет не сложно найти. Пока интересует алгоритм авторазрезки скана на две страницы и компенсация наклона.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 11:08 13-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Если уж делать, то "по-взрослому"

Ну, об этом я пока вообще даже и не заикаюсь. Это было бы круто, конечно.

Цитата:
И лучше все-таки в раздельные папки, а не в  многостраничный tif

Это была бы вообще просто песня.
 
Добавлено:
Это всё вообще-то нужно, как воздух.
 
Добавлено:
Причём, "только текст в режиме серого" можно было бы выводить в свою отдельную папку, а не в папку с "только текст", и по дополнительному запросу.
 
Например, сделать бы так: в папке "out" сделать папку "text", куда выводить "только текст" и папку "images", куда выводить "только изображения". А ещё, по дополнительному запросу пользователя, создавать в папке "out" папку "text_grey" - и туда выводить "только текст в режиме серого".
 
Допустим, я выбрал в программе гипотетическую опцию "Раздельно текст и изображения" и сделал вывод. Пусть бы при этом заполнились папки "text" и "images". Далее я смотрю и вижу: ага, качество бинаризованного текста мне не нравится. Тогда я нажимаю некую доп. кнопку "Вывести серые тексты" - и пусть при этом создаётся папка "text_grey" и туда выводится "только текст в режиме серого" (а уже созданная папка "text" с бинаризованными текстами пусть будет - она не мешает).
 
 
Добавлено:
В случае же, когда полутоновых картинок нет ни одной - всё равно пусть создаётся папка "text" внутри "out" - но уже ради однообразия со случаем наличия полутоновых картинок.
 
Да, забыл сказать: выводя "только изображения", надо бы пропускать вывод чисто белых листов. Сейчас они выводятся. А вот чисто белые "только текст" пусть выводятся (как и сейчас).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:13 13-01-2010 | Исправлено: monday2000, 11:14 13-01-2010
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
К вопросу порога ч/б.Посылаю пример для Tulon. На правом развороте внизу вроде +15 немного не хватает? http://www.onlinedisk.ru/file/318831/

Всего записей: 1453 | Зарегистр. 02-08-2008 | Отправлено: 12:13 13-01-2010 | Исправлено: alpopo, 12:14 13-01-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo
Низкое разрешение сканирования ~150 dpi + сильные JPEG артефакты.
Исправить такое малореально, даже меняя порог в большем диапазоне.

Всего записей: 983 | Зарегистр. 14-12-2005 | Отправлено: 13:10 13-01-2010
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235я пытаюсь с разных сканов, плохих и хороших, сделать ровные и читаемые книжки. В данном конкретном случае с пользовательской точки зрения при положении регулятора +0 - много пробелов, при положении +15 их гораздо меньше, а при +20 вроде бы для данного случая было бы и вообще хорошо,ведь на сером скане визуально я буквы различаю. Я послал пример, где вроде бы диапазона немного не хватает - с практической точки зрения (как говорится пример из жизни).Если с теоретической точки зрения этот скан к увеличению порога до +20 не имеет отношения, меня вполне устроил бы ответ - ваш пример не из той оперы. Вас благодарю за внимание и разъяснение.

Всего записей: 1453 | Зарегистр. 02-08-2008 | Отправлено: 20:51 13-01-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 

Цитата:
Вы же вроде написали патч для расширения диапазона?  Или не вы? Если вы, то надо было выложить три скана: оригинал, результат без расширения диапазона и с расширением.

 
Хм. Я полагал бессмысленным выкладывать результаты обработки, которые, во-первых, легко воспроизводимы и, во-вторых, сами по себе мало о чем говорят, т. к. в данном случае смотреть надо не только на два крайних значения, но и на промежуточные между ними. Но если надо -- значит надо: вот в архиве по ссылке исходный скан и вывод СТ при установке порога в 12 и 48:
 
http://www.thessalonica.org.ru/downloads/threshold.zip .

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 00:41 14-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
На Вас одна надежда - в плане доп. модификации Вашего патча (Tulon ведь занят). Не могли бы Вы пока что просто туда добавить вывод "только текст (серое)"?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:05 14-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал небольшую вспомогательную программку для генерации вывода, который получался бы при гипотетическом "Только текст (в режиме серого)" - для Scan Tailor, модифицированного anagnost96.
 
Программка простейше-примитивная, называется "ST GreyText v1.0".
 
Подробности см. тут: http://www.djvu-scan.ru/forum/index.php?topic=19 .
 
Надеюсь, вся эта функциональность (в немного улучшенном виде согласно предыдущим постам) со временем попадёт в основной Scan Tailor (чем скорее, тем лучше).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:40 14-01-2010
Kiev78

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-то сканирует книги по одной странице (не разворотами)?
Как вы поворачиваете парные (или непарные) страницы? Неужели вручную по одной?
Или есть какие-то утилиты, которые делают это автоматом? Скачал IrfanView, думал он то в режиме batch processing сможет - ан нет! В СканКромсаторе тоже этого не нашел. Кто как решает эту проблему? Как с этим делом в этой программке?

Всего записей: 244 | Зарегистр. 17-06-2006 | Отправлено: 22:12 14-01-2010 | Исправлено: Kiev78, 22:13 14-01-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kiev78
В Total Commandere Поиск:
Код:
*0.*;*2.*;*4.*;*6.*;*8.*

Найденное переносим в другую папку, там пакетно переворачиваем Irfan'ом или XnView и возвращаем в исходную папку.
Я обычно сканирую сначала все левые, затем все правые страницы если книга большого формата, после чего переименовываю в TC.

Всего записей: 983 | Зарегистр. 14-12-2005 | Отправлено: 23:05 14-01-2010 | Исправлено: U235, 23:11 14-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kiev78
Программки в театре выдают.  
В этой же программе с этим делом дела обстоят очень хорошо.
В СК, возможно, делается так.
FastStone Image Viewer по F3 пакетно делает очень многое, в том числе поворот.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 04:25 15-01-2010 | Исправлено: StanFreeWare, 10:10 15-01-2010
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как вы поворачиваете парные (или непарные) страницы? Неужели вручную по одной?  

VBA (нужен установленный Excel) + IrfanView
если интересует, могу выложить в более подходящем топике
http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=3172&start=380#lt.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 09:53 15-01-2010 | Исправлено: Olive77, 09:58 15-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kiev78

Цитата:
Как вы поворачиваете парные (или непарные) страницы? Неужели вручную по одной?

Разумеется, нет. Это наиболее просто делается так:
 
1. Нажимаете "Мой компьютер" и там добираетесь до папки со сканами (ну как обычно).
 
2. Мышкой сужаете ширину этого окна так, чтобы там помещалось только 2 столбца сканов. При необходимости пересортировываете их.
 
3. Мышкой выделяете один из столбцов и перетаскиваете его в другую папку. Там поворачиваете оптом.
 
4. Возвращаете этот столбец в исходную папку.
 
Это я сам придумал.
 
Как это делается в СК - сейчас смотрел-смотрел, да так и не нашёл. Может, там это не сделать?
 
В СТ я бы это не стал делать - т.к. там после поворота надо ещё неминуемо пройти через все последующие стадии - а зачем это нужно, если задача ставиться просто повернуть все чётные и всё?
 
СТ, разумеется, нужно "разбить" хотя бы на 2 программы: 1 программа - нынешние стадии 1-3, а 2 программа - нынешние стадии 4-6.
 
Кончится это всё тем, что кто-то сделает программу, выполняющую стадии 1-3 - в ней все и будут работать (вместо использования СТ на стадиях 1-3) - а после перегружать результат в СТ (ради его стадий 4-6) и докрамсывать до конца.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:12 15-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
А не хотите ли сами сделать нечто подобное - всего-то нужно патчить XML-файл проекта СТ, чтобы размер полезной области был равен размеру скана, поля были равны нулю, а вывод был в режиме цветной/серый (или черно-белый, на выбор) с dpi, равному dpi оригинала (в принципе, кроме полей все можно делать и из-под ST). Естественно, все на галочках. Я думаю, такому программисту, как Вы, это вполне под силу. И свою нишу такая утилитка могла бы найти, например для обменами документами между конторами (вместо факса).

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:40 15-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Да ну это изврат ИМХО - лучше сразу пусть кто-нибудь сделает по-человечески.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:17 15-01-2010 | Исправлено: monday2000, 11:30 15-01-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kiev78, сканируйте в пакетном режиме Irfan View, нумерной индекс должен совпадать с номером страницы. Например, имени Scan037 будет отвечать страница 37, а Scan050 соответственно 50. Если четные/нечетные страницы сканировать по одной системе (не изменяя начальной ориентации) то в ST есть опция поворота сканов. Назывется "Применить к каждой второй странице". То есть поворот всех четных страниц(если выбираете второй скан), если первый - поворот будет осуществлен нечетных страниц. Возможно, я вас не понял. Дайте знать. Придумаем еще что-нибудь.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 11:31 15-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
А пока что проще стадии 1-2 делать в СК - и перегружать результат в СТ ради стадий 3-6.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:31 15-01-2010 | Исправлено: monday2000, 11:33 15-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
В чем приемущество делать разворот и разрезку половинок в СК?
 
anagnost96
В вашем примере расширение диапазона действительно помогает.  Значит будем расширять.  Какой диапазон будет оптимальным с вашей точки зрения?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:19 15-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Постом ранее говорите, что не нашли поворот в СК, и тут же рекомендуете его для данной функции. Тем более, что хотелось бы остаться по-возможности в рамках одной программы сканообработки - СТ.
По поводу патча проекта - не такой уж и изврат - допустим, я хочу просто бинаризировать страницы алгоритмом СТ (ну, и, может, только повернуть предварительно) отсканированные на работе документы для отправки по почте вместо факса. Без лишних телодвижений. Подсовываю проект патчу, потом прогоняю пропатченный проект в СТ - получаю нужный результат.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 13:48 15-01-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru