Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Насчет коррекции геометрических искажений - как считаете, имеет ли смысл при фотографировании книги со штатива при использовании простейшего фотосканера - недавно упомянутого на форуме инфанаты - разработать методику коррекции искажений макросъемки, базирующейся на предварительном фотографировании тестовой страницы (сетки).  
По этой фотографии некая программа пусть создает набор корректирующих преобразований для данного объектива на данном расстоянии до цели (по заданной сетке это по-идее сделать проще, чем по произвольной странице книги) и применяет их ко всем фотографиям страниц ДО обработки в СТ (или нулевым шагом СТ)?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 15:51 22-01-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
 
Вы имеете в виду бочкообразные искажения? По моему опыту, они при правильном методе съемки ничтожны и не идут ни в какое сравнение с теми видами искажений, которые в принципе никак не нормализуемы и, главное, от объектива не зависят. Например, позиция фотика на штативе не является постоянной величиной, а при малейшем повороте относительно плоскости листа его прямоугольные пропорции хоть немного, да нарушатся. Еще более важно, что прижатие страниц стеклом неодинаково у обреза и у корешка и опять же зависит от многих факторов. Так что я не представляю, как можно говорить о каком-то универсальном наборе корректирующих преобразований.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 16:07 22-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Да, я имел в виду бочкообразные искажения. Спасибо за пояснения.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:29 22-01-2010
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
1.
Объясню еще раз зачем нужно определение всей полезной области в границах исходника.
Вот есть фото страниц книги. Расстояние фотик-книга скачет. Я обрезаю в СТ по границам полезной области, вывожу без выравнивания страниц полями, и в XnView задаю выровнять ширину всех картинок.
(Просил-просил Вас на натахаус-форуме сделать такую возможность в СТ - Вы никак.)
Затем я гружу эти выровненные картинки обратно в СТ. И при переопределении полезной области, т.к. элементы касаются границ картинки, она определяется неправильно. Т.е. вот мне щас, например, для 1200 страниц руками границы поправлять.
А там поджидает другая засада. Когда я руками поправляю границы полезной области (растягиваю ее до краев), при выводе возникают линии на границе полезная область - скан. То что Вы успешно побороли для других случаев. И мне эти 1200 стр еще руками редактировать: линии стирать.
 
По-моему на англоязычном СТ-форуме люди как раз фоткают книги. Мне не верите - можно там это обсудить. Насколько это важно и нужно.
 
2.
Начал пользоваться Вашими зонами. Заметил следующее. Когда граница серой зоны не определяется точно, то как  правило (у меня 95% случаев) выводится черная фигня с точными контурами целевого криволинейного объекта.  
Когда мы ставим многоугольник - то он неизбежно захватывает фон-паразит.
Может можно сделать такой тип зоны, чтобы СТ в ней сделал черно-белую бинаризацию, а затем из цветного (серого) оригинала взял те пиксели, которые при бинаризации определились как черные.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 16:20 24-01-2010 | Исправлено: dma200899, 16:24 24-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dma200899
Получается, что второй раз вы грузите сканы в ST с одной единственной целью - добавить отсутствующие поля.  Мне кажется, что это стрельба из пушки по воробьям.  Наверняка есть способ проще.
А опция "область контента: вся страница" вам нужна потому, что вы грузите в ST страницы совсем без полей (созданные тем же ST), которые ST плохо переваривает, считая все, что касается края - мусором.
Мне не нравится идея добавления этой опции уже хотя-бы потому, что не были испробованы другие варианты, а именно улучшить распознаватель рамки контента, чтобы он отличал черные бордюры от текста, касающегося краев.
 
Что же касается вашего оригинального запроса, а именно возможности масштабировать страницы на выводе не до заданного DPI, а до заданной ширины рамки контента в пикселях, то я признаю, что фича была бы полезной, но:
1.  Я плохо себе представляю, как эту фичу можно интегрировать с существующей системой.
2.  Есть много более приоритетных задач.
 

Цитата:
Начал пользоваться Вашими зонами. Заметил следующее. Когда граница серой зоны не определяется точно, то как  правило (у меня 95% случаев) выводится черная фигня с точными контурами целевого криволинейного объекта.  

Давайте пример.
 
 
P.S:
По поводу фич реквестов могу сказать, что на данном этапе просить фичи - дело совершенно бесполезное.  Разработка идет черепашьеми шагами.  Я устал и немотивирован.  Ну и естественно не закончив одно, нельзя браться за другое.  У меня и так на данный момент три начатых и незаконченных направления.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:33 24-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Наверняка есть способ проще

Если достаточно задания симметричных рамок в пикселях, то можно использовать Пакетное преобразование (F3) - Расширенные настройки - Рамка в FastStone Image Viewer.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 18:06 24-01-2010
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
просить фичи - дело совершенно бесполезное.  Разработка идет черепашьеми шагами.  Я устал и немотивирован.  Ну и естественно не закончив одно, нельзя браться за другое.  У меня и так на данный момент три начатых и незаконченных направления.

Вот этого то я и боялся.   Неужели так со всеми талантливыми проектами? Начали за здравие... "За полчаса написал ещё одну..." А может это потому, что не видно простых путей радикального улучшения? Путей, реализуемых на раз. Кризис... Ну что ж. Подождём. У меня тоже проект не идёт. Да ещё чуть квартиру сегодня не сжёг. Чужую... Фух. Весь в струпьях вонючего пластика.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 18:34 24-01-2010
pusto1



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
  Попробывал три версии программы, и старую и новую, и среднюю. Хочу высказаться. Неудобная прога, но это можно исправить. Мешают механизмы автоматизации. Привык ручками делать, как в ФР, там это удобно. Но вот отсканишь журнал, к примеру, цветной или с оттенками серого, а ФР начинает страницы под разными углами вращать, просто беда. В остальном очень всё удобно, если сканы черно-белые.  
   Вашей программе не хватает этого, не удобная она. Вернитесь пожалуйста назад, попробуйте переоценить задачи. Безполезен в ней механизм автоматического определения полезной области. Полезная область выбираеться один раз на четвертой-пятой странице, затем просто переноситься на остальные, кроме титульной, ну и последней. Поэтому, мне кажеться нет смысла в опции "Макет страницы".  
   Компенсация наклона несомненно нужна, это плюс. Но в автоматическом режиме принесет тоько зло, ибо привык сканировать аккуратно, ровно. На выравнивание уйдет много времени, если автомат вмешается.
   Конечно в сравнении с Кромсатором, она намного выигрывает.
   Вы, бесспорно человек талантливый, и у Вас всё получиться. Хочеться сказать спасибо за ваш труд.
  С уважением,  
pusto1

Всего записей: 2 | Зарегистр. 13-08-2008 | Отправлено: 19:13 24-01-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это если слушать каждого и реализовывать все, то получится без преувеличения второй ScanKromsator. Как по мне программа сейчас просто класс. Аккуратненько сканируем, а не фоткаем. Она ж называется не photo tailor. И в программу, уделяем установке параметров до часа времени и дальше фильм смотреть. Просматриваем через вьювер какой-нибудь, отмечаем страницы, которые нужно подправить, и снова в ST. Все-таки произвольной прямоугольной области не хватает, ну и ластика.

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 02:59 25-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Я устал и немотивирован.

Возьмите тайм-аут со Скан Тейлором. Глядя на программу, я даже удивляюсь, когда это Вы успели проделать такую прорву работы (со Скан Тейлором).
 
На мой взгляд, сейчас как раз такой момент, когда Скан Тейлор впервые в жизни достиг состояния "реально полезная программа" - т.е. окончательно выйдя из статуса "прототип" (правда, не сам Скан Тейлор, а лишь связка Скан Тейлор-anagnost96 + ST GreyText, но это уже не важно).
 
Так что сейчас вполне можно и отдохнуть - важная промежуточная цель наконец-таки достигнута.
 
Добавлено:

Цитата:
По поводу фич реквестов

Их возросший поток ИМХО указывает на рост популярности-совершенства программы.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:45 25-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня ещё такая идея: нельзя ли выложить СТ-anagnost96 на оффсайт СТ? Чисто для удобства. Кстати, предлагаю для краткости называть СТ-anagnost96 "СТА" - а то как-то длинно писать.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:11 25-01-2010
are



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
кажется баг обнаружен (0.9.7.2):
если на входе один многостраничный тифф-файл, то вроде бы всё в порядке, все страницы распознаются и обрабатываются, но обработка не производит на последнем этапе директорию out/ и каких-либо файлов в ней. И процессы все идут медленнее, чем при обработке отдельных исходных тифф файлов.

Всего записей: 552 | Зарегистр. 06-03-2005 | Отправлено: 12:15 25-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
кажется баг обнаружен (0.9.7.2):
если на входе один многостраничный тифф-файл, то вроде бы всё в порядке, все страницы распознаются и обрабатываются, но обработка не производит на последнем этапе директорию out/ и каких-либо файлов в ней. И процессы все идут медленнее, чем при обработке отдельных исходных тифф файлов.
 

Папка out создается при создании проекта, а не при выводе.  Попробуйте воспроизвести, создав новый проект с этим multipage tiff'ом.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 12:24 25-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я устал и немотивирован.  

Да, 20 лет страна в оккупации...
Конечно, больно на это смотреть...
 
Есть такое определение - ПАССИОНАРИЙ
На мой взгляд, Вы уважаемый Tulon этому определению соответствуете - такая большая работа проведена совершенно бескорыстно.
И таких людей много, особенно на ru-board
нельзя не сказать про уважаемого monday2000, anagnost96, других ребят..., ... список форумчан большой
 
Что касается данного случая, мне кажется, вам надо объединиться и выпустить платную версию для простого пользователя. Это будет выгодно и простым потребителям, и Вам (хоть теоретически будет какая-то мотивация).
 
Вы уже много сделали! Кто-то будет покупать, кто-то может пользоваться бесплатными (по отдельности), кто-то будет пользоваться ломанными..., мир большой.
 
Тема которой Вы занимаетесь очень важна! Переход к экономике знаний потребует вернуть технические библиотеки (теперь уже в электронном виде), а следовательно и инструментарий для работы с текстами (в т.ч.). Следовательно, эта работа на пользу.
Я искренне желаю Вам удачи с этим проектом!!!
 
P.S. пользуясь случаем, вопрос и просьба к уважаемому monday2000:
1. Почему Вы делаете версии Ваших программ исключительно с английским интерфейсом?  
2. Просьба сделать вариант DjVu Small 3.4 RUS
 
прошу прощения, если сказал что-то не так...
 
 

Всего записей: 1131 | Зарегистр. 15-01-2005 | Отправлено: 12:43 25-01-2010 | Исправлено: Dashout, 12:45 25-01-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout
DjVu Small: Options->Language.
Djvu Imager: Options->Interface Language.
А вот почему они по-умолчанию не русские - это вопрос..

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 13:10 25-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
вот я баран!!!
 
Добавлено:
хотя если честно, для таких профанов как я термин "ресемплинг, доли, ..." одинаково непонятен, как на англ., так и на русском
поэтому я крайне ограниченно использую возможности этой безусловно нужной и хорошей программы (только для конвертации, и в этом ей нет равных!).
мне кажется, нужна система каких-то подсказок, но в этом случае мы опять приходим к идеологии Tulon.  
Но это только мое мнение

Всего записей: 1131 | Зарегистр. 15-01-2005 | Отправлено: 13:13 25-01-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что касается данного случая, мне кажется, вам надо объединиться и выпустить платную версию для простого пользователя. Это будет выгодно и простым потребителям, и Вам (хоть теоретически будет какая-то мотивация).  

С какой точки не посмотреть на выпуск платной версии - ничего хорошего не получается.  Во первых я терпеть не могу закрытых программ.  Во вторых ее не будут покупать.  В третьих, лишние 50, 100, или даже 200 фунтов в месяц не изменят ровным счетем ничего в моей жизни.  Ну накоплю я на начальный взнос в ипотеку не через 3 года, а через 2 и 8 месяцев.  Вряд-ли мысли об этом будут греть мою душу.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:00 25-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
А вот почему они по-умолчанию не русские - это вопрос..

Я просто пока не разбирался, как сделать авто-определение языка винды точным на 100% - чтобы нужный интерфейс авто-включался при запуске. А английский интерфейс - по-умолчанию, для всех, чтобы. Кроме того - может, кто-то из русскоговорящих любит исключительно английские интерфейсы? (bolega )
Dashout

Цитата:
Что касается данного случая, мне кажется, вам надо объединиться и выпустить платную версию для простого пользователя.

Нет, лучше не надо.

Цитата:
уважаемому monday2000

Пожалуйста - пишите просто "monday2000", ладно?

 
И политику, давайте, тоже не будем примешивать - ничего хорошего из этого не выйдет.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:26 26-01-2010 | Исправлено: monday2000, 10:31 26-01-2010
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Принято.

Всего записей: 1131 | Зарегистр. 15-01-2005 | Отправлено: 12:34 26-01-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dashout

Цитата:
Что касается данного случая, мне кажется, вам надо объединиться и выпустить платную версию для простого пользователя.


Цитата:
Переход к экономике знаний потребует

Извиняюсь за оффтоп, но не смог удержаться. Экономика знаний - это экономика, где основным мерилом ценностей выступают знания, а не деньги. Вы же предлагаете двигаться в её направлении на денежной основе. Разве не забавно?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:18 26-01-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru