Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не запускаеццо! Не работает!
 
Добавлено:
Приложение не было запущено, поскольку оно некорректно настроено. Повторная установка приложения может решить данную проблему.

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 09:39 14-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Директория Microsoft.VC90.CRT в C:\Program Files\Scan Tailor есть?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:13 14-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ЕСТЬ!

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 12:14 14-06-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня запускается и работает

Всего записей: 2494 | Зарегистр. 28-05-2004 | Отправлено: 12:24 14-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня свежепоставленная винда.
 
12:44:09,4689800    scantailor.exe    2220    Process Start        SUCCESS    Parent PID: 3336
12:44:09,4689811    scantailor.exe    2220    Thread Create        SUCCESS    Thread ID: 3696
12:44:09,4765759    scantailor.exe    2220    QueryNameInformationFile    C:\BIN\BOOK\096\scantailor.exe    SUCCESS    Name: \BIN\BOOK\096\scantailor.exe
12:44:09,4775277    scantailor.exe    2220    RegOpenKey    HKLM\Software\Microsoft\Windows NT\CurrentVersion    SUCCESS    Desired Access: Read, Maximum Allowed
12:44:09,4776488    scantailor.exe    2220    RegQueryValue    HKLM\SOFTWARE\Microsoft\Windows NT\CurrentVersion\SystemRoot    SUCCESS    Type: REG_SZ, Length: 22, Data: C:\WINDOWS
12:44:09,4776796    scantailor.exe    2220    RegCloseKey    HKLM\SOFTWARE\Microsoft\Windows NT\CurrentVersion    SUCCESS    
12:44:09,4785204    scantailor.exe    2220    Load Image    C:\BIN\BOOK\096\scantailor.exe    SUCCESS    Image Base: 0x400000, Image Size: 0x91e000
12:44:09,4787328    scantailor.exe    2220    Load Image    C:\WINDOWS\system32\ntdll.dll    SUCCESS    Image Base: 0x7c900000, Image Size: 0xb3000
12:44:09,4787550    scantailor.exe    2220    QueryNameInformationFile    C:\BIN\BOOK\096\scantailor.exe    SUCCESS    Name: \BIN\BOOK\096\scantailor.exe
12:44:09,4789923    scantailor.exe    2220    CreateFile    C:\WINDOWS\Prefetch\SCANTAILOR.EXE-232C1C72.pf    NAME NOT FOUND    Desired Access: Generic Read, Disposition: Open, Options: Synchronous IO Non-Alert, Attributes: n/a, ShareMode: None, AllocationSize: n/a
12:44:09,4790682    scantailor.exe    2220    Thread Exit        SUCCESS    Thread ID: 3696, User Time: 0.0000000, Kernel Time: 0.0000000
12:44:09,4791063    scantailor.exe    2220    Process Exit        SUCCESS    Exit Status: -1072365566, User Time: 0.0156250, Kernel Time: 0.0000000, Private Bytes: 159 744, Peak Private Bytes: 163 840, Working Set: 94 208, Peak Working Set: 98 304
 
 
Добавлено:
Может ей какой .net надо ?
 
Добавлено:
build 376
 
На стадии "полезная область" "не захватывается" номер страницы
Если поправить гамму-захватывается.
Вот бы какую "ручку" чуствительности на стадии полезная область.
 
http://pic.ipicture.ru/uploads/090614/ZpD4epSKT1.jpg

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 12:45 14-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну у Arcand понятно почему запускается и работает - он разработчик, и у него видимо стоит VS 2008.  Там scantailor.exe и находит .dll'ки, которые ему нужны.  Надо конечно разбираться, почему он не хочет подцеплять dll'ки из Microsoft.VC90.CRT.  Причем не то чтобы он их совсем не видит - тогда бы он сказал "не найдена DLL".  Он их походу видит, но все равно грузить не хочет.
 
В общем если сильно хочется запустить, попробуйте два варианта:
1. Скопировать файлы из Microsoft.VC90.CRT на один уровень выше, то есть туда, где лежит scantailor.exe.
2. Установить вот это: http://www.microsoft.com/downloads/details.aspx?FamilyID=9b2da534-3e03-4391-8a4d-074b9f2bc1bf&displaylang=en
Собственно директория Microsoft.VC90.CRT как раз и существует для того, чтобы не надо было ставить эту фигню.
 
Рано или поздно проблема будет конечно решена.
 
Добавлено:

Цитата:
На стадии "полезная область" "не захватывается" номер страницы
Если поправить гамму-захватывается.
Вот бы какую "ручку" чуствительности на стадии полезная область.  

Тут сразу несколько проблем.  Верхняя область не попадает в рамку потому что:
1. ST плохо обрабатывает светлый текст на темном фоне.
2. Темный фон касается края страницы.
 
Нижняя строка не попадает потому, что кроме номера страницы там есть еще текст, который очень бледный, тонкий, да еще и jpeg сжатие - и как результат - после бинаризации буквы раcпадаются на фрагменты.  Фрагменты не образуют достаточного количества углублений, и в результате эта строка вообще не определяется как текст, что увеличивает ее шансы быть отрезаной.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:22 14-06-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Цитата:
и у него видимо стоит VS 2008
Стоит. Дилетанское предположение - может дллки надо зарегистрировать?

Всего записей: 2494 | Зарегистр. 28-05-2004 | Отправлено: 13:49 14-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Стоит. Дилетанское предположение - может дллки надо зарегистрировать?  

Эти не нужно - он их сам должен подцеплять по идее.  И ведь все делаю по инструкции Microsoft'а.  Причем диагностировать такую фигню на машине, где стоит VS 2008 практически невозможно.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:02 14-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заработало!
 
http://download.microsoft.com/download/0/5/c/05c912c6-ba17-4909-9371-cad89bd8dcef/vcredist_x86.exe  
 
Добавлено:
Tulon

Цитата:
он их сам должен подцеплять по идее

 
Я ведь выше лог Process Monitor-а приводил.
Никакие dll не цепляет, а потом происходит
scantailor.exe    2220    Thread Exit
 
 
С установленым [#] Microsoft Visual C++ 2008 Redistributable Package - установка [#]
Thread Exit не происходит,  программа продолжает работу.

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 15:23 14-06-2009
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А какой метод бинаризации используется в ST?
Какой метод сегментирования изображения используется при определении полезной области?
Tulon, а в ближайшем времени устранение кривизны строк не предвидится вообще?

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 18:54 14-06-2009 | Исправлено: woodyfon, 03:46 15-06-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотел бы тоже высказаться в поддержку того, чтобы можно было задать фиксированный размер вывода, причем не только в миллиметрах, но и в пикселях. Дело в том, что при кодировании в djvu рекомендуется делать размеры страниц кратными двенадцати, а при нынешней системе этого добиться, ясное дело, практически невозможно.
 
А что до страниц, не влезающих в заданную рамку, то с ними, по-моему, всё просто: либо пользователь их найдет и задаст для них другие размеры, либо пусть обрезаются нафиг.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 01:55 15-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Последние новости:
Понял кое-что из того, почему не хотят подцепляться Microsoft'овские DLLки.  Оказалось что компилятор генерирует код, который требует рантайм библиотеки версии 9.0.21022.8, а те, что лежат в папке redist и предназначены как раз для распространения вместе с приложением, имеют версию 9.0.30729.1
И хотя имеется более поздняя версия чем требуется, все равно загружаться она отказывается.  Если открыть .manifest файл в директории Microsoft.VC90.CRT и заменить одну версию на другую - все заработает.  Короче виноват как всегда Microsoft
Буду искать альтернативные способы решения этой проблемы.
 
Хотя сборка с обработчиком падений из коробки и не работает, два краш репорта я все же получил.  И там и там упало в одном и том же месте, но вот облом - трассировка стека неполная - всего четыре уровня.  И все 4 уровня - Qt'шный код отрисовки, так что даже не понятно, из какого места в Scan Tailor'е этот код был вызван.  В других тредах трассировка полная.  Походу Microsoft'овский компилятор сгенерировал такой хитрожопый код, в котором Google'овский обработчик падений не разобрался.  Надо будет попробовать с отключенными оптимизациями собрать.
 
У меня инет временами вырубается (блин, в Литве инет работал и стабильнее и быстрее!), так что я не успеваю ответить всем на все вопросы.  Если сейчас начну отвечать, сегодня ни строчки кода уже не напишу

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:21 16-06-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Последние сборки (375 и 376) позволяют поменять разрешение вывода для группы файлов, но не позволяют поменять разрешение для текущего файла.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 06:10 16-06-2009
Jenyay



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Tulon

Цитата:
Понял кое-что из того, почему не хотят подцепляться Microsoft'овские DLLки.  Оказалось что компилятор генерирует код, который требует рантайм библиотеки версии 9.0.21022.8, а те, что лежат в папке redist и предназначены как раз для распространения вместе с приложением, имеют версию 9.0.30729.1  

 
Попробуй из манифеста удалить параметры publicKeyToken. Вот здесь есть кое-что по этому поводу на английском.

----------
http://jenyay.net - софт, исходники и фото

Всего записей: 1773 | Зарегистр. 13-10-2001 | Отправлено: 11:04 16-06-2009 | Исправлено: Jenyay, 11:05 16-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот две картинки, очень похожие.
Не пойму почему в одной из них отберезается верхушка, а в другой нет.
Махинация с гаммой на результат не влияет.
 
http://ipicture.ru/uploads/090616/CaDDEXhRpT.jpg
http://ipicture.ru/uploads/090616/H23xRP6E57.jpg
 
Может быть всё же добавить "крутилки" агрессивности, раз на автомате не получается ?

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 19:04 16-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И снова.
Можно ли сделать кроп специально предназначеный для журналов, т.е:
На этапе "полезная область" создавать по центру область фиксированного размера.
Без возможности изменения размеров области, но с возможностью перемещать область правой кнопкой мыши.
 
Очень полезно для журналов!!!
 
Добавлено:
Для обработки журналов фиксированная область с возможностью премещения гораздо полезнее чем интеллектуальное распознавание области предполагаемого контента.
 
Очень нужен такой режим !

Всего записей: 6785 | Зарегистр. 31-08-2008 | Отправлено: 21:56 16-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
 
Насчет фиксированной рамки контента - в отдаленных планах такое есть (даже есть на сайте в предложенных улучшениях), но приоритет тут не высокий.
 
Насчет ваших двух примеров:
на самом деле и там и там верхняя область обрезалась, просто в одном случае рамка контента зацепилась за черную рамку, а в другом - нет.  Не знаю почему - видимо расстояние от рамки до текста очень близко к пороговому значению.  А почему самая верхняя часть не попала в рамку - тут все ясно.  Темные картинки ST принимает за тень, светлые пропадают при бинаризации.  А если картинка касается края страницы - тогда вообще без шансов.  Кстати спрашивали тут насчет метода бинаризации.  Отвечаю:
На разных этапах используются разные методы.
Этап разрезки страниц вообще обходится без бинаризации, если удается найти линию сгиба.  Если нет - бинаризация Otsu.
Этап компенсации наклона - тоже Otsu.  То, что тень от сгиба может стать полностью черной - это даже хорошо.  В этой области текст все равно кривой - лучше его совсем не учитывать.
Этап выделения контента - бинаризация по методу Wolf'а.  Текст получается жирным, что лучше, чем если бы буквы распадались на сегменты; тени становятся белыми.  Качество бинаризации неважное, но это же не для вывода, а просто для нахождения этой самой рамки.
Этап вывода - выравнивание освещения + Otsu.  Тут упор на качество.  Вы спросите, почему бы не использовать этот метод и на остальных этапах?  Потому, что выравнивание освещения работает хорошо только если известна рамка контента.  Алгоритм выравнивания освещения собственный, но основанный на известных методах.
 
Добавлено:
Jenyay
 

Цитата:
Попробуй из манифеста удалить параметры publicKeyToken. Вот здесь есть кое-что по этому поводу на английском.

Можно и так наверное, но такое вроде как нарушает условия распространия Microsoft'овских redistributables.  Там написано, что их можно распространять только в неизменном виде, и даже переименовывать папку Microsoft.VC90.CRT запрещают.
Нашел два других способа:
1. Пересобрать прогу и все зависимости с дефайном _BIND_TO_CURRENT_VCLIBS_VERSION=1
Сейчас пытаюсь как раз это и сделать.  В результате получил зависимости от обоих версий.  Видимо где-то что-то без этого флага пролезло.  И ведь фиг найдешь где.
2. Положить файл scantailor.exe.config рядом со scantailor.exe, и там прописать редирект с одной версии на другую.  Способ плох тем, что полагается на конкретные версии.  Собираете с другой версией Visual Studio?  Придется узнавать и прописывать уже другие версии.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:43 17-06-2009 | Исправлено: Tulon, 02:31 17-06-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Насчет фиксированной рамки контента - в отдаленных планах такое есть (даже есть на сайте в предложенных улучшениях), но приоритет тут не высокий.  

Вот, я практически о том же все время говорю. ndch, поднимем приоритет?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 01:40 17-06-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А может быть, проще так будет сделать: где-нибудь на видном месте отображать максимальную ширину и высоту рамки контента в пикселях, а поля разрешить задавать тоже в пикселях. Тогда при необходимости легко будет подогнать файл под нужные размеры.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 01:49 17-06-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Новая сборка:
http://www.onlinedisk.ru/file/162525/
По идее должны быть решены проблемы с DLL'ками, а также отключил часть оптимизаций, в нажежде получить нормальный краш репорт.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 02:29 19-06-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru