Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне не помешала бы сетка хотя бы горизонтальных направляющих на этапе выравнивания. Одного перекрестия очень часто недостаточно.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 23:49 29-03-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Мне не помешала бы сетка хотя бы горизонтальных направляющих на этапе выравнивания. Одного перекрестия очень часто недостаточно.

Сделаю, когда руки дойдут.  Задача не очень приоритетная, поскольку автоматическая компенсация наклона почти никогда не ошибается.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:16 30-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Тогда залейте куда-нибудь одну-две страницы, где отрезаются номера страниц, и ссылку сюда

Вот: http://rghost.ru/177826
Но все-таки мне кажется, что было бы здОрово иметь возможность где-то указать, что полезная область в данном случае просто равна странице.
Еще:
1) Программа вылетает. Сегодня много мучался с этим. К сожалению, плохо воспроизводимо. Чтобы вылетало, надо, чтобы были большие файлы (на выводе > 10 Mb) и быстро листать. Можно ли добавить автосохранение проекта? Очень бы помогло.
2) Очень жалко, что нет ластика.
3) Смешанный режим иметь бы возможность хоть как-то регулировать. Мучался сегодня с несколькими страницами -- упорно считает цветной рисунок черно-белым. А на соседней странице, такой же по площади и похожий в принципе рисунок -- нормально. Еще странно, что иногда (видел трижды) одну и ту же страницу обрабатывает по-разному.
4) Опция "Удалять пятна" сегодня мне съела значительные куски текста. Хорошо, что я это вовремя заметил...
5) Можно ли, чтобы расширение вывода было не *.tiff, а *.tif? А то с Irfan проблемы. А с DjVu Small вообще странный глюк (это, наверное, не к Вам, но все же) -- не хотел писать файлы в список обработки, оказалось, не выносит подстроки "pic" (!). Хорошо, что в коммандере все можно быстро переименовать.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 10:30 31-03-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Еще было бы очень здорово иметь возможность удалять (не учитывать) определенные самые высокие/широкие страницы при вычислении мягких полей.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 19:16 01-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цитата:
Тогда залейте куда-нибудь одну-две страницы, где отрезаются номера страниц, и ссылку сюда
 
Вот: http://rghost.ru/177826

Тут проблема в неуказанном DPI.  Вы видимо выставляли 300, но реально там всего 150.  При выставлении 150 - номера страниц не обрезаются.
 

Цитата:
1) Программа вылетает. Сегодня много мучался с этим. К сожалению, плохо воспроизводимо. Чтобы вылетало, надо, чтобы были большие файлы (на выводе > 10 Mb) и быстро листать. Можно ли добавить автосохранение проекта? Очень бы помогло.  

Это была бы борьба с симптомами проблемы, а не с самой проблемой.  Надо искать и исправлять причину вылетов.  На каком этапе вылетает?  Стабильная или бета версия?
 

Цитата:
2) Очень жалко, что нет ластика.  

Будут ручные Picture зоны - ластик добавить будет элементарно.
 

Цитата:
3) Смешанный режим иметь бы возможность хоть как-то регулировать. Мучался сегодня с несколькими страницами -- упорно считает цветной рисунок черно-белым. А на соседней странице, такой же по площади и похожий в принципе рисунок -- нормально. Еще странно, что иногда (видел трижды) одну и ту же страницу обрабатывает по-разному.  

Ручные Picture зоны как раз и нужны для случаев, когда авто-выделение не справляется.  Задача - приоритетная, но свободного времени совсем мало.
А насчет разных результатов от одной и той-же страницы - такое бывыет при различных разрешениях вывода.
 

Цитата:
4) Опция "Удалять пятна" сегодня мне съела значительные куски текста. Хорошо, что я это вовремя заметил...  

Скорее всего неправильный DPI у входных файлов.
 

Цитата:
5) Можно ли, чтобы расширение вывода было не *.tiff, а *.tif? А то с Irfan проблемы.

Неужели Irfan не ассоциирует себя с *.tiff?  Ведь стандартное расширение - имменно .tiff, а .tif - тяжелое наследие DOSа.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:18 02-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо!
Неправильный DPI -- очень возможно. Теперь ясно, что это очень важный параметр. Но вычислить его бывает проблематично, если размеры книги неизвестны, а скан -- это фотографии.
Вылетание -- это предпоследняя бета. Воспроизвести очень трудно.
Irfan ассоциирует себя с *.tiff, но не сохраняет без специальных усилий с этим расширением.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 04:34 02-04-2009 | Исправлено: iit512, 08:31 02-04-2009
Admig314

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Irfan ассоциирует себя с *.tiff, но не сохраняет без специальных усилий с этим расширением.

Да и Photoshop тоже по умолчанию сохраняет в *.tif

Всего записей: 17 | Зарегистр. 19-12-2005 | Отправлено: 13:00 02-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, в оригинале Tagged Image File Format, а .tif это legacy.
Так же как и эмуляция dos, win16 и т.п.

Всего записей: 7016 | Зарегистр. 31-08-2008 | Отправлено: 18:20 02-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Неправильный DPI -- очень возможно. Теперь ясно, что это очень важный параметр. Но вычислить его бывает проблематично, если размеры книги неизвестны, а скан -- это фотографии.  

Тут кто-то давал совет по определению DPI.  Открываете файл в графическом редакторе (Gimp подойдет), выделяете прямоугольник так, чтобы в него попало 6-7 строк текста.  Высота прямоугольника в пикселях как раз и будет примерным DPI.
 

Цитата:
Да и Photoshop тоже по умолчанию сохраняет в *.tif

Ну сохраняют Irfan и Photoshop по умолчанию в *.tif а не *.tiff, но где проблема то?  Открыть они *.tiff файл могут, по Ctrl+S сохранят изменения, что еще надо?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:43 02-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Еще было бы очень здорово иметь возможность удалять (не учитывать) определенные самые высокие/широкие страницы при вычислении мягких полей.

По хорошему отключение опции "Выровнять с другими страницвми" должно давать такой результат, но почему-то не дает.  То ли я просто об этом не подумал, когда ее реализовывал, то ли на потом отложил.  На днях посмотрю, насколько сложно будет реализовать такое поведение.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:37 03-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
но где проблема то?

Проблема в том, что нет ластика. Поэтому я использую панель редактирования Irfan. Irfan открывает *.tiff, но сохраняет только *.tif. Потом приходится запускать массовое переименование через коммандер. Поэтому я и попросил о небольшом упрощении своей жизни. Если это сделать нельзя -- жалко, но не фатально.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 01:40 03-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Irfan открывает *.tiff, но сохраняет только *.tif

А как вы сохраняете?  Я так полагаю (проверить пока не могу), что Ctrl+S должен сохранять под оригинальным именем и расширением.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:46 03-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как вы сохраняете?  

Сохраняю Ctrl+S (Save). Сохраняет tif вместо tiff. При попытке указать расширение получаются файлы с расширением tiff.tif

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 07:06 03-04-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
У СТ исходники открыты - есть желающие сделать такой плагин на основе кода из СТ?  
Скоро не обещаю, завяз с плагином выделения рисунков. Сам код выделения готов, но засада - Filter plugin не поддерживает редактирование/создание выделения, вынужден разбираться с Selection plugin.
Желательна ссылка на код деспекла, чтобы не терять время на его поиск.
И еще, как-то Вы говорили о сглаживании букв. Можно еще раз, по возможности поподробнее.
Хотелось бы иметь и такой плагин, но подходящего алгоритма у меня пока нет.

Всего записей: 2496 | Зарегистр. 28-05-2004 | Отправлено: 08:39 03-04-2009 | Исправлено: Arcand, 08:41 03-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Желательна ссылка на код деспекла, чтобы не терять время на его поиск.  

Despeckle.h
Despeckle.cpp
Есть у этого кода кое-какие еще зависимости, например от класса ConnectivityMap из директории imageproc, но в общем зависимостей минимум.
 

Цитата:
И еще, как-то Вы говорили о сглаживании букв. Можно еще раз, по возможности поподробнее.
Хотелось бы иметь и такой плагин, но подходящего алгоритма у меня пока нет.

У меня используются два вида сглаживания:
1.  Фильтр Savitzky-Golay на сером изображении.
2.  Удаление зазубрин на черно-белом.
 
Реализацию фильтра Savitzky-Golay ищите в imageproc/SavGolFilter.{cpp,h} и imageproc/SavGolKernel.{cpp,h}  Зависимостей почти нет.
Удаление зазубрен зарыто глубоко в файле filters/output/OutputGenerator.cpp - функция morphologicalSmoothInPlace().  И вот она как раз тянет довольно длинную цепочку зависимостей.
 
Добавлено:
Кстати сделал чтобы страницы с выключенным выравниванием не влияли на мягкие поля других страниц.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:47 04-04-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А с DjVu Small вообще странный глюк (это, наверное, не к Вам, но все же) -- не хотел писать файлы в список обработки, оказалось, не выносит подстроки "pic" (!).  

Это не глюк. Инструкцию надо читать. Сбросьте флажок "Omit SK5.91 sep-files" в опциях - и этот "глюк" уйдёт.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:07 06-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сбросьте флажок "Omit SK5.91 sep-files" в опциях

2 Tulon: так может быть, тогда сохранять все же файлы без подстроки "pic" и с расширением "tif"? Наверное, сильно менять код для этого не потребуется? Пожалуйста...

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 09:19 06-04-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512
Нет нужды в этом!

Всего записей: 7016 | Зарегистр. 31-08-2008 | Отправлено: 09:37 06-04-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
2 Tulon: так может быть, тогда сохранять все же файлы без подстроки "pic" и с расширением "tif"? Наверное, сильно менять код для этого не потребуется? Пожалуйста...

Идея убирать *pic* мне совершенно не нравится.  Не СТ его туда добавляет и не СТ на них глючит.  К тому же как оказывается это фича такая, хотя на мой взгляд криво реализованная.
Что касается *.tif вместо *.tiff - вы сначала попробуйте сообщить об ошибке авторам Irfan'а - в конце концов проблема именно там.  Если открыт файл *.tiff, то будь добр по Ctrl+S сохранить туда же, а не создавать новый файл *.tif.  Может пофиксят эту проблему, и менять ничего не придется.
 
Кстати купил новый ноут, так что с визуальными проблемами скоро разберусь.
 
Добавлено:
Насчет визуальных проблем; скроллбар на списке стадий у меня и в винде не хочет воспроизводится.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:52 06-04-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большое спасибо за ответ.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 02:38 07-04-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru