Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Видел и одобряю.  Может стоило побольше удачных моментов показать, чтобы уравновесить неудачные, но что есть, то есть.  
Пара моментов:  
1. С падением при вставке файлов в проект ничего поделать не могу - надо ждать новой версии Qt.  
2. Не понял, почему неправлильно определилась линия разреза на первых сканах.  Хотелось бы увидеть исходный файл.  

 
Вот та самая страница:
http://www.onlinedisk.ru/file/162606/
Оговорку в начале урока о том, что мною специально подобраны только неудачные моменты я сделал. Спасибо за программу, кстати.
Воспользуясь моментом хотелось бы поинтересоваться: в какой версии (какие сроки) будет реализована возможность выделять определенные области как картинки, т.е. делать sep-файлы (извиняюсь, если неправильно применяю терминологию)?

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 13:09 19-06-2009 | Исправлено: dabudada, 13:12 19-06-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в какой версии (какие сроки) будет реализована возможность выделять определенные области как картинки,
Как ни крути, текст и картинки нужно обрабатывать по разному. Сейчас картинки, насколько я понял, специально не обрабатываются.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 13:23 19-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Опять большую часть выходных без инета просидел.  Это уважительная причина, если кому не ответил.
 
Получил наконец один полностью хороший краш репорт.  Упало из-за нехватки памяти - скорее всего неправильный DPI.  Уже начал делать более строгие проверки на правильность DPI.  Случайные падения у кого-нибудь еще происходят?  Предыдущие неполные краш репорты тоже походят не нехватку памяти, и такие падения должны быть легко воспроизводимы.
 
Добавлено:
dabudada

Цитата:
Вот та самая страница:  
 http://www.onlinedisk.ru/file/162606/  

Линия разреза определилась неправильно из-за полей искуственного происхождения - результат компенсации наклона до обработки в ST.  А на первый взгляд сырой скан - не совсем сырой как выясняется.
 

Цитата:
Воспользуясь моментом хотелось бы поинтересоваться: в какой версии (какие сроки) будет реализована возможность выделять определенные области как картинки, т.е. делать sep-файлы (извиняюсь, если неправильно применяю терминологию)?

Понятия не имею - времени очень мало.  В рабочие дни почти ничего не удается сделать.
 
Arcand

Цитата:
Как ни крути, текст и картинки нужно обрабатывать по разному. Сейчас картинки, насколько я понял, специально не обрабатываются.

Раздельный вывод картинок и не картинок вообще-то не планируется, хотя сделать его не сложно - в программе разделение все равно происходит (в смешанном режиме).  Причина - оно нужно буквально единицам.  Сколько человек захотят вручную обрабатывать картинки и потом как-то объединять их с текстом?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:15 21-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сколько человек захотят вручную обрабатывать картинки и потом как-то объединять их с текстом

Мне например надо было.
И сейчас надо, но только не в такой формулировке, а ручное редактирование слоёв в режиме вывода "смешаный".
Т.е. вручную определять что должно быть чб, а что цветное.
 
Вылезла бага: при сильном увеличении невозможно изменить размер "полезной области"
http://ipicture.ru/uploads/090622/52469/YxguXvWMDv.png
Точнее как выяснилось можно менять но где-то "сбоку припёка"
 
Ещё очень хочется автоматического выделения по максимально возможному  размеру, приблизительно вот так:
http://ipicture.ru/uploads/090622/52469/Nb4Qo30F86.png

Всего записей: 6487 | Зарегистр. 31-08-2008 | Отправлено: 06:55 22-06-2009 | Исправлено: ndch, 06:57 22-06-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Здесь дело не в том, чтобы дополнительно обрабатывать картинки (для этого их можно было бы и вручную вырезать), а в возможности получить на выходе отдельные заготовки для маски и фона, вместо того, чтобы возлагать задачу по их разделению на DJVU-кодировщик. Если оно и надо единицам, то эти единицы -- именно те люди, которые стремятся к наиболее качественной обработке сканов, так что к их мнению есть смысл прислушаться.
 
К тому же в пользу раздельного вывода картинок и текста говорят два очевидных соображения. Во-первых, вывод текстовых страниц обычно делается с повышением разрешения, а применять ту же самую операцию к полутоновым изображениям нет решительно никакого смысла.
 
Во-вторых, ST работает и в Линуксе, а под Линукс нет DJVU-кодировщика, который умел бы отделять маску от фона. В то же время задача отдельного кодирования того и другого с последующим объединением решается штатными средствами.
 
Кстати, необязательно выводить два файла одновременно. Может быть, было бы проще добавить флажок, который подавлял бы вывод текста, или, наоборот, картинок. Кому надо, сделает последовательно два вывода с нужными настройками.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 12:50 22-06-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
Раздельный вывод картинок и не картинок вообще-то не планируется, хотя сделать его не сложно - в программе разделение все равно происходит (в смешанном режиме).
Я имел ввиду не вывод, хотя и он не помешает, а возможность обработки картинок - поправить тоновый баланс, удалить растр и т.д. Это позволит получить при кодировании в дежавю более качественный результат.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 16:51 22-06-2009
Nikola7



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-то просил "на видном месте отображать максимальную ширину и высоту рамки контента" (неважно в чём - при неизменном dpi вывода будет понятен размер) - это вещь необходимая, знать выходные размеры полезной области.
 
Как и возможность редактирования границ "картинок" и отнесения изображений в группы "цвет. картинки", "текст", " серые картинки".
 
Tulon:
"если оно и надо единицам, то эти единицы -- именно те люди, которые стремятся к наиболее качественной обработке сканов" - двумя руками присоединяюсь...

Всего записей: 127 | Зарегистр. 15-09-2004 | Отправлено: 17:14 22-06-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
неважно в чём - при неизменном dpi вывода будет понятен размер

 
В том-то и дело, что важно, в чем, поскольку результаты округления сложно посчитать в уме с точностью до одного пикселя. А между тем, когда выводишь заготовки для маски и фона в разных dpi, нужна именно такая точность, потому что иначе размеры окажутся не кратными друг другу, и совместить файлы без дополнительных телодвижений не получится.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 19:05 22-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
Вылезла бага: при сильном увеличении невозможно изменить размер "полезной области"  
 http://ipicture.ru/uploads/090622/52469/YxguXvWMDv.png  
 Точнее как выяснилось можно менять но где-то "сбоку припёка"  

Не смог воспроизвести.
 

Цитата:
Ещё очень хочется автоматического выделения по максимально возможному  размеру, приблизительно вот так:  
 http://ipicture.ru/uploads/090622/52469/Nb4Qo30F86.png  

Такое будет иметь смысл только для уже обработанных изображений с идеально белым фоном.  Вопрос - зачем такие изображения вообще гузить в СТ?
 
 
Добавлено:
Поправил очередную (надеюсь последнюю) проблему со сменой выходного DPI (rev 379).
 
Добавлено:
И давайте пока повременим с фич-реквестами.  Времени мало - задач много.  Даже если взять только то, что я сам считаю высокоприоритетным - работы там до конца лета.  В такой ситуации фич-реквесты только портят мне настроение.  Я даже специально перестал их записывать.  Если бы записывал - там уже на всю жизнь работы бы накопилось.  Напоминаю, что делаю я все это за бесплатно, в свободное время, практически без помощи из вне.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:05 23-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
>>Вылезла бага:
>Не смог воспроизвести.
Вот такой ультра-зум:
http://ipicture.ru/uploads/090623/52469/lV8Ft3ihVD.png
 

Цитата:
Вопрос - зачем такие изображения вообще гузить в СТ?

Компенсировать наклон.
 
При обработке журналов компенсация наклона и максимальное выделение - прожиточный минимум.

Всего записей: 6487 | Зарегистр. 31-08-2008 | Отправлено: 04:22 23-06-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Один человек сделал видеоурок по программе -  
Создание djvu с помощью ScanTailor

Я сделал зеркало:
 
http://www.djvu-soft.narod.ru/scan/st_lesson.htm
 
Только вот не получилось у меня пока пристроить сам тот видеофайл - на Народ файл не влезает - большой, а на nxt.ru, куда я обычно кладу большие файлы, сегодня штормит опять и при заливке выскакивает ошибка. Постараюсь позже всё-таки закинуть на nxt.ru.
 
Добавлено:
Занёс линк в шапку.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:54 23-06-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Раздельный вывод картинок и не картинок вообще-то не планируется...

 

 

Цитата:
...а в возможности получить на выходе отдельные заготовки для маски и фона...

 
Вот именно об этом я коряво хотел сказать в предыдущем посте, очень не хватает данной функции.

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 11:32 24-06-2009
zhenyamerezhko

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вчера при использовании Scantailor 0.9.6 pre возникли некоторые сложности:
- первая папка чуть больше 100 серых tiff обработана нормально, единственно, хотелось бы возможность тут же почистить "резиночкой" результат
- вот со второй папочкой чуть больше 170 серых tiff (сжаты несколько иначе) исходное разрешение 300dpi проблемы, после двух попыток где-то на стадии 5 обрабатывается после 4-5 страницы приложение закрывается, попытка перезагрузится и снова повторить приводит к тому же результату.
 
Наверное должен был создаться crashreport, но у всех файлов в папке program files в подпапке scantailor дата изменений несколько дней назад. Может я не там или не так ищу
 
и есть еще скромный вопрос по поводу видеокурса. Звука только у меня нет. K-lite Codec мега версии 4.90.  
судя по настройкам звук AAC есть, и значок ffdshow есть возле часов.
 
 
Итак, два вопроса:
- как сформировать и отправить crashreport?
- а был ли звук?

Всего записей: 45 | Зарегистр. 17-12-2002 | Отправлено: 14:31 24-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
наблюдал ситуацию:
rgb-tiff сырой скан со значительным перекосом - баг на выходе создается тиф размером 8 БАЙТ (и 324 и 371 билды)

Всего записей: 6487 | Зарегистр. 31-08-2008 | Отправлено: 22:07 24-06-2009
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
Можно было бы написать и короче: "В программе баг!".
 
Если есть баг, то чтобы его устранить, надо прислать Tulon'у (или дать ссылку)  файл на котором он наблюдался.  

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 22:38 24-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zhenyamerezhko

Цитата:
- вот со второй папочкой чуть больше 170 серых tiff (сжаты несколько иначе) исходное разрешение 300dpi проблемы, после двух попыток где-то на стадии 5 обрабатывается после 4-5 страницы приложение закрывается, попытка перезагрузится и снова повторить приводит к тому же результату.  

Это хорошо, что приводит к такому же результату - найти проблему будет несложно.  Выложите эти 5 первых страниц куда-нибудь и дайте ссылку сюда.
 

Цитата:
Наверное должен был создаться crashreport, но у всех файлов в папке program files в подпапке scantailor дата изменений несколько дней назад. Может я не там или не так ищу  

По идее при падении должно было произойти следующее: главное окно закрывается; открывается другое, где вас просят подтвердить отправку сообщения о падении.  А почему этого не произошло - разбираться надо.  Неужто сломал эту фичу в последнем релизе?
 
P.S: звука в уроке у меня тоже не было - видимо так и было задумано.
 
Добавлено:
ndch

Цитата:
rgb-tiff сырой скан со значительным перекосом - баг на выходе создается тиф размером 8 БАЙТ (и 324 и 371 билды)

Правильно U235 говорит - нужен исходный файл, на котором такое происходит.  А если не воспроизводится - так и пишите.  Получившийся 8-ми байтовый tiff тоже выложите на всякий случай.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:02 25-06-2009 | Исправлено: Tulon, 00:08 25-06-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
- а был ли звук?  

Звук изначально не предполагался, чураюсь популярности
Может быть в следующем уроке, если он вообще будет.

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 11:21 25-06-2009
zhenyamerezhko

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот все файлы из второй "плохой" папки
http://ifolder.ru/12825118
Размер: 17.32 Мб

Всего записей: 45 | Зарегистр. 17-12-2002 | Отправлено: 23:32 25-06-2009
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zhenyamerezhko
У Вас там dpi неправильное...
 
Добавлено:
Tulon
Нельзя ли перенести (задублировать) "самая широкая/высокая страница" с "Макета страницы" на "Полезную область". Или на "на макете" добавить возможность изменять "полезную область" например, удерживая Shift.  Сейчас приходится делать так: Найти  самую широкую страницу, перейти в "полезную область", поправить рамку, перейти опять в макет, найти следующую самую широкую и т.д.

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 07:33 26-06-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Нельзя ли перенести (задублировать) "самая широкая/высокая страница" с "Макета страницы" на "Полезную область".

Очень поддерживаю! Именно из-за описанного выше алгоритма работы в программе.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 15:25 26-06-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru