Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nick222

Цитата:
Я ничего не спрашивал, в общем-то, я предлагал разделить алгоритмы выделения:
а) колонтитула и страницы;
б) разных типов (кусков) страниц.  

У меня нет идей насчет того, как это сделать.
 

Цитата:
И ещё - почему-то вокруг страницы на выходе получаются огромные поля - гораздо больше указанных 5 или 10 мм - каков алгоритм создания полей конечных изображений?

В документации стадии "Макет страницы" этот вопрос описан.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:49 05-12-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В прошлый раз это просили из-за того, что не помню какая программа, открывая tiff файл, сохраняла изменения не в него самого, а в другой файл с расширением tif.  Мой ответ в тот раз был:
Сообщите о баге авторам той программы.  Посмотрим, что они ответят, и тогда и будем решать, стоит ли менять расширение на tif или нет.  Продолжения не последовало.
Если причина та же, то и мой ответ будет тем же.  

Да, это был мой вопрос. Есть такие две ерундовые программки, IrfanView и Photoshop (если задана Batch mode), которые так делают.
Пока обхожусь пакетным переименованием в Total Commander.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 08:35 06-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большое спасибо, Tulon, это прекрасная программа. Я узнал о её существовании сегодня, поискав "djvu" в Центре приложений Ubuntu 9.10, затем, сходу и без особых проблем, перегнал первую книгу. Пока удобно и понятно почти всё.
От души желаю Вам творческих успехов.
 
После получения файлов tiff, очень хотелось бы, не покидая программы, нажатием кнопки отправить их во внешнее приложение, создающее файл djvu.
 
Заметил, что финальный процесс "Вывод", будучи запущен не с первого листа книги, останавливается на последнем листе, хотя мог бы быть автоматически продолжен с первого, до полного цикла.
 
Было бы логично, если бы раздельные папки "out" под каждый вариант проекта имели бы имена "out_Имя Проекта". Предвижу протесты о потреблении дискового пространства. Полагаю, однако, что достигнутая предлагаемым новшеством чёткость и определённость окупит затраты.
 
Возможно, целесообразной опцией явилось бы автоматическое удаление временных файлов, располагающихся во вложенных папках внутри папки вывода. Например, посредством подтверждения запроса при закрытии проекта.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 19:46 06-12-2009 | Исправлено: Andriuha077, 20:02 06-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512
Неужели и фотошоп так делает?  То есть вы открываете скажем файл 1.tiff, вносите изменения, нажимаете Ctrl+S, и получаете в результате 1.tif?  Кто-нибудь может подтвердить?
 
Andriuha077
Всегда приятно слышать положительные отзывы.
 

Цитата:
После получения файлов tiff, очень хотелось бы, не покидая программы, нажатием кнопки отправить их во внешнее приложение, создающее файл djvu.  

Не все так просто.  Во первых откуда мне знать, какую именно программу вы хотите использовать.  Во вторых, под Linux полноценной программы сборки DjVu просто нет.  То, что есть - это отдельные утилиты для кодирования черно-белого контента, и другие - для картинок.  В принципе ST знает, где у нас картинки а где Ч/Б контент, и поэтому можно было бы встроить кодер DjVu прямо в ST, но это для меня низкоприоритетная задача.
Так что пока придется использовать либо платный DEE из под Windows или Wine, ну или методологию от anagnost96, которая правда требует значительно больше усилий.
 

Цитата:
Заметил, что финальный процесс "Вывод", будучи запущен не с первого листа книги, останавливается на последнем листе, хотя мог бы быть автоматически продолжен с первого, до полного цикла.  

Можно наверное сделать и до текущего, просто руки не доходят.
 

Цитата:
Было бы логично, если бы раздельные папки "out" под каждый вариант проекта имели бы имена "out_Имя Проекта". Предвижу протесты о потреблении дискового пространства. Полагаю, однако, что достигнутая предлагаемым новшеством чёткость и определённость окупит затраты.  

Я не понимаю, что вы имеете в виду под "каждый вариант проекта".  Тут нужен конкретный пример.
 

Цитата:
Возможно, целесообразной опцией явилось бы автоматическое удаление временных файлов, располагающихся во вложенных папках внутри папки вывода. Например, посредством подтверждения запроса при закрытии проекта.  

Это не просто временные файлы - это кэш, который ускорит работу при повторном открытии проекта.  К тому же они не растут безконтрольно - для каждого входного изображения в папке cache/thumbs имеется не больше одного файла, и тоже самое относится к папке cache/automask по отношению к выходным изображениям.  Ну и в третих, они имеют мизерный размер по сравнению с размером исходный данных.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:38 06-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Большое спасибо, Tulon, это прекрасная программа.
Andriuha077 И так программу начали осваивать чайники, каким и я являюсь.Попробую высказать свой взгляд на Ваши замечания.
1)
Цитата:
После получения файлов tiff
Сразу отправить в приложение - какое?Ведь Вы пользуетесь одним, а я другим.Затем перед передачей в приложение иногда надо несколько переставить файлы tiff,потому что последовательность и количество страниц скана и книги может не совпадать.
2)
Цитата:
Заметил, что финальный процесс "Вывод", будучи запущен не с первого листа  
Как правило ВЫВОД запускается с наиболее заполненного листа, после его обрезки.Процесс ВЫВОДА не быстрый.Мне важнее зафиксировать, что он дошел до последней страницы. А затем вручную перехожу в начало и довывожу.Все равно автоматический ВЫВОД надо хоть один раз пролистать и сделать на некоторых картинках автономную обработку.
3)
Цитата:
если бы раздельные папки "out"
Варианты ВЫВОДА они и есть произвольные варианты.Напримемер ВЫВЕЛ я 300dpi - переименовал папку вывода out300.Вывел затем 600, появилась новая папка out - переименовал ее out600 и так далее.Andriuha077 Прочел Ваше последующее сообщение - проект не надо переименовывать - надо переименовывать папки вывода, чтобы сохранить его разные варианты.
4)
Цитата:
автоматическое удаление временных файлов
Скорее всего это не временные файлы, а файлы сохраняющие Вашу работу над картинками проекта
 
 
 
 
 

Всего записей: 1427 | Зарегистр. 02-08-2008 | Отправлено: 20:46 06-12-2009 | Исправлено: alpopo, 21:07 06-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon,

Цитата:
Было бы логично, если бы раздельные папки "out" под каждый вариант проекта имели бы имена "out_Имя Проекта". Предвижу протесты о потреблении дискового пространства. Полагаю, однако, что достигнутая предлагаемым новшеством чёткость и определённость окупит затраты.  
 
Я не понимаю, что вы имеете в виду под "каждый вариант проекта".  Тут нужен конкретный пример.  

Например, после всех этапов форматирования, вывод файлов tiff нового проекта в проведён в папку out,
затем проект сохранён под определённым именем, пара поправок - и вывод идёт уже в папку out_Имя,
затем разрешение изменено с 600 на 400, сохранён проект Имя400, с выводом в out_Имя400, и т.д.
 
alpopo
Цитата:
автоматическое удаление временных файлов
 
Скорее всего это не временные файлы, а файлы сохраняющие Вашу работу над картинками проекта  
к счастью, как и предполагал, нет -
Цитата:
 - это кэш, который ускорит работу при повторном открытии проекта
- однако, признаю низкий приоритет полезности такой опции.
 

Цитата:
Во первых откуда мне знать, какую именно программу вы хотите использовать.  Во вторых, под Linux полноценной программы сборки DjVu просто нет.  То, что есть - это отдельные утилиты ...
Я надеялся временно пребывать среди не нашедших этого решения
Это могло бы быть умолчание,
либо выбор из списка,
либо автоопределение,
либо выбор на данный конкретный раз. Увы - лишь при наличии такой утилиты.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 20:59 06-12-2009 | Исправлено: Andriuha077, 21:15 06-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077

Цитата:
Например, после всех этапов форматирования, вывод файлов tiff нового проекта в проведён в папку out,
затем проект сохранён под определённым именем, пара поправок - и вывод идёт уже в папку out_Имя,
затем разрешение изменено с 600 на 400, сохранён проект Имя400, с выводом в out_Имя400, и т.д.

Понятно.  Только это грязное решение.  Чистым решением было бы позволить менять директорию вывода у уже существующего проекта.  Сам я на такие мелочи отвлекаться не стану, но патч принял бы.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:10 06-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon,
Цитата:
... Только это грязное решение.  Чистым решением было бы позволить менять директорию вывода у уже существующего проекта.
Возможно, не столь грязное: оно не потребует поля ввода директории, а лишь переменной с именем проекта, которая и так имеется. Кроме того, сохранит в файлах проекта оба (и более) его варианта.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 21:19 06-12-2009 | Исправлено: Andriuha077, 21:22 06-12-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Неужели и фотошоп так делает?  То есть вы открываете скажем файл 1.tiff, вносите изменения, нажимаете Ctrl+S, и получаете в результате 1.tif?  Кто-нибудь может подтвердить?

ctrl+shift+s == save as
ver 5.5 - отрицательно
ver 8.0;11.0 - положительно
 
Добавлено:
Похоже на старческое брюзжание, но "сейчас как раньше не делают".
:(

Всего записей: 6467 | Зарегистр. 31-08-2008 | Отправлено: 21:44 06-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo.
Цитата:
... Напримемер ВЫВЕЛ я 300dpi - переименовал папку вывода out300.
Я так и делал сегодня. Однако...
Я согласен с тем, что, разумеется, возможно все шаги производить руками, но, исходя из факта популярности графических интерфейсов вообще - автоматизация удобна. Кроме того, у неё выше надёжность, в сравнении с работой оператора, вынужденного выполнять простые машинные функции руками, используя сторонний браузер либо терминал.

Цитата:
... Затем перед передачей в приложение иногда надо несколько переставить файлы tiff,потому что последовательность и количество страниц скана и книги может не совпадать.
Мне показалось, это - перед выводом, перед обработкой, командами "Удалить из проекта, Вставить перед, Вставить после". Никакой путаницы с переименованием отдельных файлов сторонними программами. Далее используется автоматически созданная нумерация, что очень быстро и удобно.

Цитата:
Как правило ВЫВОД запускается с наиболее заполненного листа, после его обрезки.Процесс ВЫВОДА не быстрый.Мне важнее зафиксировать, что он дошел до последней страницы. А затем вручную перехожу в начало и довывожу.Все равно автоматический ВЫВОД надо хоть один раз пролистать и сделать на некоторых картинках автономную обработку.
То же самое, что и в вышеописанном случае: лишнее вынужденное действие под контролем человека.
Несколько калорий (на сознание рутинности и вытаскивание ошибочно удалённого из корзины ), альтернатива - автопереход, и около нуля ватт-секунд.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 21:54 06-12-2009 | Исправлено: Andriuha077, 22:00 06-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077
Цитата:
лишнее вынужденное действие под контролем человека
Что делать руками, а что ногами (автоматом) это вопрос.Как там говорилось - ружье, трубку и жену не дам никому.Мне кажется, что скан это одна сущность (дистрибутив), а вывод это много разных сущностей (разных вариантов обработки). В данном случае проект это дистрибутив, а out это вариант результата.Вариант вывода он потому и вариант, что осталась какая-то неудовлетворенность после проверки работы автоматики под контролем оператора.Вобщем дистрибутив (а это скан и его первичная обработка в СТ - проект) сохраняем неизменным, а out варьируем как хотим ручками, потому что это произвол.

Всего записей: 1427 | Зарегистр. 02-08-2008 | Отправлено: 22:40 06-12-2009 | Исправлено: alpopo, 08:36 07-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon, на странице, содержащей много мелких и нечётких снимков, в "Смешанном" режиме часть снимков стала ч/б, часть - серой шкалой, как и необходимо. Примерно в шахматном порядке. Пришлось объявить всю страницу gray.
Было бы интересно вручную править области, отбираемые "Смешанным" автоматически.
 
Ещё пару ненужностей, заранее извиняюсь.
Перемещение страниц в листинге с помощью "^ и v", вместо "Удалить и Добавить".
Перемещение самого листа справа в низ левой части, "< либо >" наверху листа, для максимизации области просмотра.
 
alpopo, Полностью согласен, исходник неприкосновенен всегда, это естественно. Хотя бы потому, что может отличаться по числу и принадлежности страниц вывода частям сканированного оригинала.
 
Дополнением кнопок "Целиком, Часть, Две" (названия условны, все - на этапе "Разрезка страниц") послужит произвольное выделение областей.
 
Оригинал можно сшивать из основного и дополнительных файлов, представленных в виде дерева. При этом, вращение дополнений производится относительно основного скана, а вращение основного - для всего сборного листа.
Интересно, как бы могли объединиться пункты-этапы "1, 2, 3", без отступления от теперешнего вида и функций.
 
Так же точно, деревом, могли бы выглядеть исходный (составной) скан и полученные из него две и более страниц.
Переключение вида - к примеру, закладками.
 
Всё сказанное - очень далёкая перспектива. А пока продолжу поиск необходимого мне djvu...nix-решения.
 
P.S.
Цитата:
... - ружье, трубку и жену не дам никому
- У последней-то и отнимается время на рутину

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 16:41 07-12-2009 | Исправлено: Andriuha077, 17:04 07-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077

Цитата:
А пока продолжу поиск необходимого мне djvu...nix-решения.

Посмотрите это: http://djvu-soft.narod.ru/soft/all2djvu.htm

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:02 07-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000, Спасибо! Уже смотрю.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 17:08 07-12-2009
KlsAlex

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077

Цитата:
Было бы интересно вручную править области, отбираемые "Смешанным" автоматически.

Ссылка

Всего записей: 13 | Зарегистр. 23-12-2008 | Отправлено: 17:17 07-12-2009 | Исправлено: KlsAlex, 17:18 07-12-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кто-нибудь может подтвердить?
 
ctrl+shift+s == save as
ver 5.5 - отрицательно
ver 8.0;11.0 - положительно  

Особенно пикантны результаты, если использовать "Authomate" в фотошопе и "Batch" в ирфане. Рекомендую
Если бы в СТ была бы хотя бы минимальная постобработка (самый примитивный ластик, например), то в половине случаев ирфан/фотошоп был бы не нужен.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 20:38 07-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KlsAlex

Цитата:
Ссылка

В шапке.
Andriuha077

Цитата:
Уже смотрю.

Можете спросить в Личный Ящик у самого are.
 
Добавлено:
Tulon

Цитата:
В таких случаях всегда надо писать - зачем.

Уже не нужно, спасибо.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:37 07-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KlsAlex

Цитата:
Цитата:
Было бы интересно вручную править области, отбираемые "Смешанным" автоматически.
 
Ссылка title=Зоны_картинок

Многоугольники мне представляются даже избыточно сложными, вполне устроил бы набор простых, вертикальных-горизонтальных накладывающихся прямоугольников, без сохранения редактирования каждого посредством вершин - просто наложением новых. Тип слоя - видом граничной линии.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 10:56 08-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andriuha077

Цитата:
Было бы интересно вручную править области, отбираемые "Смешанным" автоматически.

ИМХО это почти нереально. Поскольку они чисто растровые, то у них зачастую безумно прихотливый контур - как у морского побережья на карте.
 
Другое дело - нельзя ли сделать алгоритм, который строил бы описанный вокруг авто-распознанных "растровых" зон более простой по форме "векторный" контур (задаваемый набором вершин)? И нужно ли это?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:39 08-12-2009 | Исправлено: monday2000, 16:41 08-12-2009
Andriuha077

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000,
Цитата:
...более простой по форме "векторный" контур (задаваемый набором вершин)? И нужно ли это?
Вероятно, нет.
Быстрее и надёжнее произвести ручную правку содержимого одной страницы из книги, как мне понадобилось в этот раз. Остальные автоматически распознаны хорошо.
 
При ручной правке этой единственной страницы мне вполне бы хватило возможности быстрой обводки нескольких прямоугольников.
 

Цитата:
...это почти нереально
Извините, не понял, что именно.

Всего записей: 10 | Зарегистр. 06-12-2009 | Отправлено: 17:15 08-12-2009 | Исправлено: Andriuha077, 17:18 08-12-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru