Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Меня бы устроил вариант с дополнительными слоями в ST'шных TIFF файлах.  

Вы имеете в виду многостраничные TIF-файлы? DjVu Small с ними не умеет работать - для этого туда пришлось бы запхнуть freeimage.dll - а делать этого не хочется, т.к. увеличение размера дистрибутива.
 
Добавлено:
То же самое касается масштабирования.
 
P.S. Подобную функциональность не проблема реализовать в DjVu Imager, т.к. там есть в составе freeimage.dll.
 
Добавлено:

Цитата:
либо ждать придется неопределенно долгое время

Да ничего страшного, ИМХО подождём, сколько нужно .

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:19 30-11-2009 | Исправлено: monday2000, 10:24 30-11-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Возможно потенциальная проблема со слоями TIF будет в том, что формат не даст сохранить ч/б слой в G4FAX, что может значительно увеличить размер результирующих файлов.
 

Это не проблема.  Черно-белые изображения простой формы можно сжимать чем угодно, хоть RLE, и все равно получить очень маленький размер.  Файлы automask кстати сжаты LZW.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:41 30-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сижу вот и думаю: как бы мне подсунуть в СТ сканы с полутоновыми иллюстрациями, прошедшие выравнивание освещённости в BR. Причём картинки портятся после выравнивания освещённости в BR.
 
Получается, что пока никак.
 
Хорошо хоть, что исправление искривленных строк в BR вроде бы работает для серых сканов.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:10 30-11-2009 | Исправлено: monday2000, 17:30 30-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Наличие неактивной галочки 3D ускорения требует хотя бы минимальных объяснений рядышком - мол, поменяйте видюху на NVIDIA, или что-то наподобие. В противном случае первая мысль пользователя - "автор забыл установить enable на чекбоксе".. Не каждый же знает об упоминании причин этой неактивности, указанных в посте на 83 странице на руборде.
 
И неплохо было бы ссылку на вики внедрить каким-нибудь простым образом (например, в окошке "О программе" в саму программу. А то она после инсталляции - вещь в себе, и никакой информации ни о том, где новые версии посмотреть, ни где помощь получить. Так можно оттолкнуть потенциальных пользователей.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:50 01-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Наличие неактивной галочки 3D ускорения требует хотя бы минимальных объяснений рядышком - мол, поменяйте видюху на NVIDIA, или что-то наподобие. В противном случае первая мысль пользователя - "автор забыл установить enable на чекбоксе".. Не каждый же знает об упоминании причин этой неактивности, указанных в посте на 83 странице на руборде.  

У этого чекбокса имеется тултип, в котором и указана причина его неактивности.  Скорее всего - встроенная видюха не первой свежести без поддержки мультисэмплинга.
 

Цитата:
И неплохо было бы ссылку на вики внедрить каким-нибудь простым образом (например, в окошке "О программе" в саму программу. А то она после инсталляции - вещь в себе, и никакой информации ни о том, где новые версии посмотреть, ни где помощь получить. Так можно оттолкнуть потенциальных пользователей.

Вы же вроде программист, нет?  Так возьмитесь и добавьте диалог "О программе".  За одно и более наглядное информирование о причине недоступности 3D ускорения могли бы сделать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:32 01-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
С точки зрения QT я пока, увы, не программист...

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 23:35 01-12-2009
Super Baby

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Скажите, а как перевести программу на другой язык (хотелось бы перевести её на белорусский). Файл "scantailor_ru.qm" - ничем не открывается.

Всего записей: 88 | Зарегистр. 14-02-2008 | Отправлено: 03:19 02-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Открывать нужно *.ts файлы, которые в исходниках, в папке translations.  Открываются они Qt Linguist'ом.  Кто-то тут выкладывал Qt Linguist отдельно, чтобы не качать весь Qt SDK, который весит весьма не хило.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:51 02-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При операции ВЫВОД, если на диске не хватает места,записываются пустые Tiff. Нельзя ли выводить предупреждение (звуковое) или с остановкой процесса вывода - на экран о том что свободное место закончилось? Или справа на иконках делать отметки о нудавшейся записи. На диске было места как оказалось впритирку. В конце пакета пару картинок не записалось - им места не хватило, потом три картинки следюущие записались (они занимали меньше места), потом опять пять пропусков и записалась финальная маленькая картинка. Пакет OUT был около 1Гб

Всего записей: 1453 | Зарегистр. 02-08-2008 | Отправлено: 12:00 02-12-2009 | Исправлено: alpopo, 12:12 02-12-2009
Mandor Sawall

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Немного офтопик: Появилась более новая и полная инструкция для работе с ScanTailor на болгарском языке: http://www.chitanka.info/lib/help/scantailor

Всего записей: 119 | Зарегистр. 20-03-2003 | Отправлено: 12:42 02-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo

Цитата:
на экран о том что свободное место закончилось?  

По-моему, это уже явный перебор.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:25 02-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alpopo

Цитата:
При операции ВЫВОД, если на диске не хватает места,записываются пустые Tiff. Нельзя ли выводить предупреждение (звуковое) или с остановкой процесса вывода - на экран о том что свободное место закончилось? Или справа на иконках делать отметки о нудавшейся записи.

Отправляется в долгий ящик.  Он у меня весьма долгий к сожалению.
 
Mandor Sawall
Если хотите, можно хостить болгарское руководство на официальном Wiki - вместе с русским и анлийским.  Ну или ссылку хотя бы дать.  Хотите - дам права редактирования Wiki.  Для этого нужно зарегистрироваться на SourceForge, зайти на Wiki Scan Tailor'а под своим логином, после чего сообщить этот логин мне.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:49 02-12-2009 | Исправлено: Tulon, 22:51 02-12-2009
alpopo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделал несколько толстых книжек используя СТ
1)Выражаю свое восхищение автору, наконец-то появилось то что надо (это тебе не СК, где месячишко надо осваивать установки птичек в разных окошках, а потом по пол дня подбирать кучу настроек, а затем на каждой картинке все это проверять и подправлять)
2)СТ позволяет на порядок экономить время при обработке сканов. В работе с СТ убеждаешься - тому что СТ делает автоматом можно доверять!(при хороших сканах правки очень незначительны)
3)Поддерживаю автора в стремлении дать обычному пользователю (не эстету) максимально простую (с фиксированным алгоритмом) программу для удобной потоковой обработки сканов многостраничных книжек.
4)В основу проги заложена очень правильная  методология (железобетонная конструкция) обработки, которую нельзя разрушать идя на поводу удовлетворения требований больших специалистов (от искусства для искусства). Для них могут существовать отдельные навороченные версии.(Речь не идет о внутренних алгоритмах обработки бинарной информации, которые безусловно будут совершенствоваться)
5)Думаю это начало революции в нетовском книгоиздательстве. Вместо кривых и косых сканов, в нете будут храниться ровненькие, удобочитаемые книги, полученные после быстрой первичной обработки в СТ, которую сможет выполнить любой желающий.

Всего записей: 1453 | Зарегистр. 02-08-2008 | Отправлено: 10:06 03-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Не могли бы Вы сменить расширение выходных файлов с "tiff" на "tif"? И вообще работать исключительно с "tif" вместо "tiff"?
 
Добавлено:
И нельзя ли использовать имена типа 0001, 0002 и т.д. вместо 0001_0001, 0002_0002?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:22 03-12-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Не могли бы Вы сменить расширение выходных файлов с "tiff" на "tif"? И вообще работать исключительно с "tif" вместо "tiff"?  

 
Лично я с этим несогласен. 'tiff' -- более правильный вариант, да и с чего бы это нам в XXI веке оглядываться на соглашение 8.3?
 

Цитата:
И нельзя ли использовать имена типа 0001, 0002 и т.д. вместо 0001_0001, 0002_0002?

 
Вы имеете в виду генерировать совершенно новые имена файлов на выходе вместо добавления числового префикса к исходному имени? Тогда это неприемлемо: лично для меня важно, чтобы имена файлов соответствовали определенной схеме, и для достижения этого гораздо проще убрать ненужный префикс, чем переименовывать после обработки все страницы заново.
 
Tulon здесь когда-то высказывал мысль о том, чтобы вместо числовых префиксов сделать суффиксы '_left' и '_right' для половинок страниц (а если страницы одинарные, то можно и ничего не добавлять). Вот это IMHO было бы самое правильное.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 13:31 03-12-2009
Mandor Sawall

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Я думаю, что ето неправильно – чтобы каждый делал свое руководство. Если кто-то будеть делать „нормальная“ документация в SF (мне кажется, что там еще есть остатки из ранных версий, которые уже не неактуальны), тогда – да, я знаю человека, которой будет переводить и поддерживать изменения в документации. А так… немножко неприятно.
 
Пока поправил болгарский перевод: заменил досадное „Каждая другая страница“ и поправил несколько опечаток: http://slil.ru/28290075

Всего записей: 119 | Зарегистр. 20-03-2003 | Отправлено: 18:00 03-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Не могли бы Вы сменить расширение выходных файлов с "tiff" на "tif"? И вообще работать исключительно с "tif" вместо "tiff"?  

В таких случаях всегда надо писать - зачем.
В прошлый раз это просили из-за того, что не помню какая программа, открывая tiff файл, сохраняла изменения не в него самого, а в другой файл с расширением tif.  Мой ответ в тот раз был:
Сообщите о баге авторам той программы.  Посмотрим, что они ответят, и тогда и будем решать, стоит ли менять расширение на tif или нет.  Продолжения не последовало.
Если причина та же, то и мой ответ будет тем же.
 
Mandor Sawall

Цитата:
Я думаю, что ето неправильно – чтобы каждый делал свое руководство. Если кто-то будеть делать „нормальная“ документация в SF (мне кажется, что там еще есть остатки из ранных версий, которые уже не неактуальны), тогда – да, я знаю человека, которой будет переводить и поддерживать изменения в документации. А так… немножко неприятно.  

Да, есть в документации неточности.  Например черно-белый вывод сейчас кодируется не G4Fax, а LZW алгоритмом, а BMP на входе Scan Tailor с роду не понимал.
Что же касается одной или нескольких версий руководства, то я надо сказать не вижу приемуществ в том, чтобы иметь одну версию и основанные на ней переводы.  Кто сказал, что эта основная версия заведомо лучше других?  Эту основную версию тоже писали добровольцы, с минимальным участием с моей стороны.  И там тоже могут быть и ошибки, и устаревшая информация, и недостаток материала.  Вот например в той же Wikipedia статьи на разных языках не являются переводами друг друга.  И проблемы тут никакой нет.
 

Цитата:
Пока поправил болгарский перевод: заменил досадное „Каждая другая страница“ и поправил несколько опечаток: http://slil.ru/28290075

Ой, а ведь автор болгарского перевода уже давно исправил эту проблему.  Возможно я забыл внести эти изменения в проект.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:27 03-12-2009
Nick222

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо, программа очень интересная
 
У меня, к сожалению, возник ряд неправильных определений границы полезной области - если широкая таблица располагалась на листе "боком" и заканчивалась на середине страницы (получается вертикальная линия конца таблицы), а верхний колонтитул уходил правее.
 
Может быть, для устранения таких проблем разделить алгоритм (и этапы обработки) - отдельно определять колонтитул, отдельно - основной текст.
 
При этом, следует учитывать, что куски страниц (страницы) бывают:
а) "обычный" текст, обычно портретная ориентация.
б) таблицы, могут быть портретной ориентации и альбомной.
в) иллюстрации, могут быть расположены как угодно и иметь поясняющий текст где угодно (справа, слева, вверху, внизу).
г) предисловие - в англоязычных книгах имеет часто другие поля, шрифты и нумерацию страниц, чем основной текст книги (то же самое наблюдается, например, в ряде  собраний сочинений).
На одной и той же странице может быть и текст, и иллюстрация с пояснением, и таблица.

Всего записей: 2288 | Зарегистр. 28-11-2004 | Отправлено: 17:00 05-12-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nick222
Это часто задаваемый вопрос.  Вам сюда:
http://sourceforge.net/apps/mediawiki/scantailor/index.php?title=%D0%A7%D0%B0%D1%81%D1%82%D0%BE_%D0%B7%D0%B0%D0%B4%D0%B0%D0%B2%D0%B0%D0%B5%D0%BC%D1%8B%D0%B5_%D0%B2%D0%BE%D0%BF%D1%80%D0%BE%D1%81%D1%8B

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:14 05-12-2009
Nick222

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Я ничего не спрашивал, в общем-то, я предлагал разделить алгоритмы выделения:
а) колонтитула и страницы;
б) разных типов (кусков) страниц.
Если это уже есть - хотелось бы знать, как с этим работать.
 
И ещё - почему-то вокруг страницы на выходе получаются огромные поля - гораздо больше указанных 5 или 10 мм - каков алгоритм создания полей конечных изображений?

Всего записей: 2288 | Зарегистр. 28-11-2004 | Отправлено: 20:36 05-12-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru