Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
rrr777

Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
Новая сборка Scan Tailor 0.9.1 - 20090112

Переложите плиз на др. обменник

Всего записей: 2850 | Зарегистр. 22-12-2005 | Отправлено: 19:54 13-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Да, действительно неудобно.  Наверное сделаю W и S и за одно статус бар с подсказками сделаю - а то кто же догадается что страницы можно и так перелистывать.  


Цитата:
А эргономически - да, Q-W конечно лучше.

Ну раз ты согласился с эргономичностью Q-W, то теперь буду более упорно настаивать на применении этой комбинации, т.к., повторюсь, при долгой работе со сканами важнее эргономика, чем привычки гамеров.
А по поводу "кто догадается", это не проблема. Узнают, уверяю тебя . И с этого форума, и из будущей справки .
 
P.S. Вот и я ощутил какое качество получается на выходе из серых сканов .
 
Добавлено:
rrr777
Другие обменники у меня глючат. Может кто другой поможет человеку?
Хотя нет, получилось. Смотри пост со ссылкой.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 20:12 13-01-2009 | Исправлено: denver 22, 20:30 13-01-2009
rrr777

Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
denver 22
спс.

Всего записей: 2850 | Зарегистр. 22-12-2005 | Отправлено: 21:11 13-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Во, забыл сказать.  
Tulon, я очень надеюсь, что ты всё таки вернешь очистку (Despeckle) в программу. Конечно в более лучшем виде, раз даже тебе не нравился.
А то я сейчас переделываю кучу книг. Большинство из них в ч/б. И требуют очистки. А без Despeckle чистить все эти точки в Photoshop-е... лучше сразу застрелиться.
Поэтому не могу полномасштабно тестировать твою программу. Приходится пользоваться SK. Благо он все таки продолжил развиваться и новые версии очень радуют... но только потому, что я уже знаком в ним.
А пользоваться хочу твоей программой . Так что желаю удачи и дальнейших успехов!
 
Добавлено:
Кстати, по ссылке в шапке есть Gimp Despeckle Plug-In (плагин для Gimp, с исходниками)... Может подойдет? Если прикрутить.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 22:00 13-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но сразу появился новый баг: выводит tiff в красно-белом.

Не получается воспроизвести - выложите пример.
 

Цитата:
1. Начал впервые обработывать серые сканы с проге. Стадия "Полезная область" действительно ещё требует доработок. Довольно часто область больше области текста.

В последнее время как раз над этим и работаю.  Уже много всяких идей перепробовал - результаты так себе, но прогресс есть.
 

Цитата:
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax)

Хм, для меня не проблема переключиться на LZW и для черно-белых картинок тоже.  Если общественность попросит, так и сделаю.  Но вообще, попиксельная пропорция, на которую ворчит фотошоп, не должна по идее зависеть от метода сжатия.  Кстати, а у вас горизонтальные и вертикальные DPI на выводе одинаковые?  Это бы как раз объяснило такое сообщение от фотошопа.  Вообще я собираюсь убрать возможность вывода с несимметричными DPI.  На входе пускай будут, а на выводе от них только проблемы.
 

Цитата:
Отсюда вопрос: перекодирование tiff из G4Fax в несжатый или другие типы сжатия ведет к потере качества?

Нет, если конечно целевой метод сжатия тоже без потерь (а это все кроме jpeg сжатия).
 
Добавлено:

Цитата:
Ну раз ты согласился с эргономичностью Q-W, то теперь буду более упорно настаивать на применении этой комбинации, т.к., повторюсь, при долгой работе со сканами важнее эргономика, чем привычки гамеров.  

Ну ладно, пускай будет Q-W, мне не принципиально.  А чтобы юзеры это нашли, придется все-таки делать статусбар с подсказками.
 

Цитата:
Переложите плиз на др. обменник

Следующий билд (как пофиксим баг с цветами в TIFFах) отзеркалирую куда-нибудь.  Куда вам удобнее?
 

Цитата:
Tulon, я очень надеюсь, что ты всё таки вернешь очистку (Despeckle) в программу. Конечно в более лучшем виде, раз даже тебе не нравился.  

Верну конечно, наверное даже в следующем оффициальном релизе.  Просто не хотелось задерживать предыдущий релиз из-за кривого Despeckle.
 

Цитата:
Кстати, по ссылке в шапке есть Gimp Despeckle Plug-In (плагин для Gimp, с исходниками)... Может подойдет? Если прикрутить.

Посмотрю.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:45 13-01-2009
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
По-быстрому не удалось найти профиль для DEE от ghosty. Можешь слить на файлообменник и дать ссылку? (лучше на iFolder или Narod)

сорри, напутал.
было в топике по СК.
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=24351&start=1260#15
 
Добавлено:

Цитата:
Проблема в Photoshop появляется только при сжатии в CCITT Group4 (G4Fax)

понятно, а я всегда в LZW жал.

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 00:01 14-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не получается воспроизвести - выложите пример.  

Вот те раз... Ну хорошо. Только сканы на работе. там Инета нет. Значит принесу только завтра вечером домой.

Цитата:
Хм, для меня не проблема переключиться на LZW и для черно-белых картинок тоже.  Если общественность попросит, так и сделаю.

Я за 2 дня уже во многих местах читал рекомендации делать именно так, как реализовано у тебя. Так что я пролсить не буду, ибо сам начал только сейчас изучать эти форматы. Посмотрим что общественность скажет.

Цитата:
Нет, если конечно целевой метод сжатия тоже без потерь (а это все кроме jpeg сжатия).  

Хорошая новость для меня на данным момент (учитывая имеющийся у меня инструментарий и знания). Значит попробую конвертнуть файлы батником от Arcand.

Цитата:
Кстати, а у вас горизонтальные и вертикальные DPI на выводе одинаковые?

Проверю. А это разве не должно зависеть от программы-декодировщика? Точнее от алгоритма. Ведь все перечисленные мной программы вроде являются только ГУЯ-ми к одному алгоритму.

Цитата:
Ну ладно, пускай будет Q-W

Тихо и без истерик - УРА!!!!

Цитата:
Переложите плиз на др. обменник  

Это он мне. Я уже отзеркалировал в том же сообщении.
Olive77
Спасибо.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 01:23 14-01-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Despeckle есть у меня:
 
http://www.djvu-soft.narod.ru/bookscanlib/010.htm
 
И ещё тут я видел:
 
http://gamera.sourceforge.net/doc/html/morphology.html#despeckle
 
Добавлено:
http://sourceforge.net/projects/dustcleaner/
 
http://www.easysw.com/~mike/gimp/despeckle.html
 
Да и в исходниках GIMP есть файл despeckle.c.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:11 14-01-2009 | Исправлено: monday2000, 09:42 14-01-2009
nursus



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня тоже проблема с открытием в Photoshop'е G4Fax: Pixel Aspect Ratio - 0,5 (в других редакторах все нормально).
Отключить-то легко:
Image -> Pixel Aspect Ratio -> Square (или 1 в Custom)
Как избавиться от таких манипуляций?

Всего записей: 24 | Зарегистр. 05-03-2006 | Отправлено: 13:10 14-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
В личку скинул исходники и результаты с багом вывода в красном цвете. Ещё раз пробелал - получил то же самое. Будет интересно услышать комментарии. Хотя одна догадка уже есть.
Но на данный момент очень хочется узнать, смогу ли довести работу в Scan Tailor, т.к. немало сил потратил, чтобы Полезную область вручную расставить

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 22:21 14-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну на этот раз надеюсь все проблемы с записью TIFF'ов поправил (сжатие CCITT Group4 пока не менял).  Можете собирать новую версию.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:15 15-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так это был баг? Мне просто интересно.
 
Добавлено:
Исходники качаю. Сборка будет наверное к вечеру

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 01:54 15-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так это был баг? Мне просто интересно.  

Два отдельных бага.  В случае с черно-белыми картинками, оказывается LibTIFF по дефолту считает, что точкам слева направа соответствуют биты от старшего к младшему.  Я сначала считал, что это зависит от порядка байтов в системе (little endian vs big endian).  Потом решил, что дефолт соответствует константе HOST_FILLORDER, но и тут ошибся.
Второй баг связан с порядком цветовых компонентов в (A)RGB картинках.  Я опять же думал, что это зависит от порядка байтов в системе.  Оказывается не зависит (хотя например палитра - зависит).  LibTIFF хочет порядок RR GG BB (AA) - нестандартный, ну да ладно.
 
А почему эти баги были мне не заметны, так это потому, что мой iBook G4 - Big Endian система, в отличии от всех Intel-совместимых систем.  Был бы у меня обычный комп - скорее всего подобные баги все равно были бы допущены, только наоборот - все работало бы на Little Endian но не на Big Endian.  В общем LibTIFF - редкостная гадость, а за концепцию "родного" порядка битов - отдельный незачет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:26 15-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Новая сборка Scan Tailor 0.9.1 от 20090115 - http://narod.ru/disk/4981740000/scantailor20090115.7z.html
Зеркало сделать не смог. Сайт iFolder ошибку выдавал. Может кто другой в этот раз отзеркалирует.
 
Добавлено:
Tulon
Сегодня буду проверять на своем проекте. Надеюсь закончить его наконец .
Можешь сказать, те сканы, что я тебе скинул - это серые или опять "псевдо"?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 06:10 15-01-2009 | Исправлено: denver 22, 06:12 15-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можешь сказать, те сканы, что я тебе скинул - это серые или опять "псевдо"?

Эти конечно лучше тех, что были раньше, но все равно не оригинал.  По ним прошелся DJVU, и если внимательно присмотреться к буквам на картинках, то кое где видно, что DJVU не распознал их как буквы, и соответственно размазал.  А после СТ и последующей сборки в DJVU он их размажет еще сильнее.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:31 15-01-2009
Mikhaluch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А программа выводит только в формате png , то боролись за tiff , а теперь что-то поменялось? или есть в настройках где-то.
 
А вообще есть описание програмы, вроде quick start или faq?

Всего записей: 54 | Зарегистр. 23-12-2008 | Отправлено: 17:37 15-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
По ним прошелся DJVU, и если внимательно присмотреться к буквам на картинках, то кое где видно, что DJVU не распознал их как буквы, и соответственно размазал.  А после СТ и последующей сборки в DJVU он их размажет еще сильнее.

Да, проблема "инь" здесь во всей красе. Ну а по качеству - у меня выбора нет. Результат может и будет похуже оригинала по четкости, но на 2 головы удобнее для чтения (я уж постараюсь).
 
Новая сборка программы удалась. Tulon, спасибо за быстрое реагирование на найденные баги. При таком режиме приятно программу тестировать
Кстати, в Смешанном режиме вывода - ну очень долго всё обрабатывалось даже на "хорошей" рабочей машине. Что было бы на моей домашней "тележке", страшно подумать.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 20:32 15-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А программа выводит только в формате png , то боролись за tiff , а теперь что-то поменялось? или есть в настройках где-то.  

Последний оффициальный релил выводит только в PNG.  Текущие беты (ссылки есть в этом топике) - только в TIFF.  Последующие оффициальные релизы тоже будут только в TIFF выводить.
 

Цитата:
А вообще есть описание програмы, вроде quick start или faq?  

Как такового нет, но в этом топике я пару раз давал примерную схему действий.
 

Цитата:
Кстати, в Смешанном режиме вывода - ну очень долго всё обрабатывалось даже на "хорошей" рабочей машине. Что было бы на моей домашней "тележке", страшно подумать.
 

Там все в быстродействие памяти упирается, насколько я понимаю.  Так что может не так уж и медленнее будет.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:05 16-01-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Режим "Смешанный" вроде работает как надо.
Вот почитал статьи о sep-файлах и альтернативном способе изготовления книги с полутоновыми картинками. Отсюда вопрос: будет ли в будущем реализован способ сохранения отдельно картинок и битональных сканов на выходе с этими sep-файлами? Чтобы потом можно было их отдельно собирать, например программой DjVu Sep.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 06:40 16-01-2009 | Исправлено: denver 22, 06:42 16-01-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот почитал статьи о sep-файлах и альтернативном способе изготовления книги с полутоновыми картинками. Отсюда вопрос: будет ли в будущем реализован способ сохранения отдельно картинок и битональных сканов на выходе с этими sep-файлами?

Пока такое не планируется.  Этой фичей будут пользоваться только единицы, и к тому же я не уверен, а стоит ли ей вообще пользоваться.  Бинаризованные области DJVU вряд-ли перепутает c картинками, а вот на картинках он может найти буквы, и соответственно не станет их размазывать.   А  с sep файлами он ничего искать не будет и размажет все, что СТ посчитал за картинку.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:16 16-01-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru