Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Критика в любом деле неизбежна. Особенно если она публично публикуется. Торвальдса тоже в начале пути пытались остановить.  

Тут мы имеем не просто критику, тут мы имеем slander (нет в русском хорошего эквивалента, что поделать).  Подобные вещи могут даже навредить карьере, поскольку все работодатели нынче гуглят имена-фамилии кандидатов.  Естественно я буду добиваться удаления этих комментариев.
 
Добавлено:

Цитата:
Есть ситуации, когда зоны нужны именно как "зоны-исключения" из стандартной обработки. Пример: вывод в ч/б с деспеклом. Но деспекл на нескольких рисунках удаляет полезный контент. Выделяем эти области зонами исключений - и из обработки они выпадут. сохранив внутри содержание.  

Я сначала  хотел как раз сделать зоны с произвольными аттрибутами - например тот же запрет деспекла.  Получилось все запутано и неудобно.  Понадобятся зоны на другом этапе - добавим их туда.  Ну а с deskpeckl'ом буду разбираться отдельно.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:32 28-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я тут по случаю спросил у Ильи Межирова, не слыхал ли он что об алгоритме dewarping. Вот что он мне ответил:

Цитата:
Раньше в DFKI над этим работал Ульгес - вот, собственно, демо:
http://demo.iupr.org/dewarp/dewarp.php
К сожалению, Томас http://homepages.iupr.com/tmb был единственным из начальников, кто планировал протолкнуть этот код в open source, а теперь он ушел и лавочка накрылась. Ну и ладно - все равно работало хреново. Хотя один раз мы таки продали.
 
Теперь над этим работает Сакиб Бухари. Вот, можете изучить его статью:
http://pubs.iupr.org/DATA/2009-IUPR-21Aug_1705.pdf
Тут надежды на open source больше, потому что он делает это в рамках декапода http://sites.google.com/site/decapodproject/ и под руководством Томаса.

 
Добавлено:
Оказывается, у них там в http://pubs.iupr.org/ аж штук 5 таких алгоритмов - и они даже недавно устраивали между ними соревнование - понаделали 102 искривленных снимка и прогоняли через них каждый из алгоритмов - с целью выявить алгоритм-победитель.
 
Только вот в open source они эти алгоритмы что-то не выпускают...
 
Добавлено:
Вот что пишет по этому поводу Thomas Breuel http://groups.google.com/group/ocropus/browse_thread/thread/c6d28de40ec975c6 :

Цитата:
This may require document dewarping; there is no dewarping code in OCRopus yet.  We have a lot of document image dewarping code and hopefully will be able to integrate that.  It also requires intensity normalization.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:22 28-09-2009 | Исправлено: monday2000, 23:39 28-09-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пожаловался на chotarajkumar администрации SourceForge.  Там сказали "ты же админ своего проекта - бери и помечай эти комментарии как спам - кроме тебя и других админов их никто не увидит".  А я и не знал, что так можно.  Сейчас как раз этим и займусь.  Правда chotarajkumar не успокаивается и постит все новую и новую грязь в мой адрес.  Надеюсь ему скоро надоест.
Сами оценки удалять правда нельзя - можно только текст, но это я как-нибудь переживу.  Кстати намек - отрицательные оценки можно компенсировать положительными.  Только не надо жульничать и пытаться выставить больше одной оценки.
 
Добавлено:
monday2000
Просмотрел статью по вашей ссылке.  С научными статьями, у меня как правило две проблемы:
1. Они ссылаются на другие статьи, которых часто нет в открытом доступе.
2. Я не очень силен в математике.
 
К этой статье второй пункт не относится, потому что там нет ни одной формулы и ни одного описания алгоритма - только обзор их методологии и ссылки на другие публикации.
 
Ну и как всегда - нехватка времени.  Думаю не скоро до этого дойдут руки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:15 29-09-2009
romanpolansky

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет, друзья, я новичок в этом форуме. Может кто-то рассказать о статусе scantailor и как она соотносится с Snapter, ScanKromsatoru и другие программы, в ту же категорию?  
 
@Tulon, вы можете получить все документы из ebdb.ru улучшить вашу математику.  
 
Вы не можете быть настолько наивны, чтобы не знать, где вы можете получить эти Warez Если вы не используете, чтобы покрывать большие проекты. Существует никаких преимуществ политически правильным.  
 
@monday2000 взглянуть на все публикации на эту ссылку. Можете ли вы помочь ему получить ссылки и все мы можем работать вместе сплоченно, чтобы сделать хорошую программу?  
 
http://pubs.iupr.org/

Всего записей: 2 | Зарегистр. 29-09-2009 | Отправлено: 07:22 29-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Ну и как всегда - нехватка времени.  Думаю не скоро до этого дойдут руки.

А я ничего и не предлагаю в данном случае. Я просто хотел показать, что и с dewarping не всё так плохо, как могло бы показаться - т.е. некие небольшие подвижки идут.
 
Можно ожидать ИМХО, что со временем dewaping будет добавлен, скажем, в OCRopus в виде open-source алгоритма (откуда его можно будет легко позаимствовать).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:02 29-09-2009 | Исправлено: monday2000, 10:03 29-09-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romanpolansky

Цитата:
Привет, друзья, я новичок в этом форуме. Может кто-то рассказать о статусе scantailor и как она соотносится с Snapter, ScanKromsatoru и другие программы, в ту же категорию?  

Про Snapter я вообще узнал пару дней назад на Slashdot'е - ничего сказать не могу.
Про ScanKromsator - он мощнее, но гораздо сложнее в использовании.
BookRestorer я один раз пробовал, но толком с ним не разобрался, так что сказать ничего не могу.
 

Цитата:
Tulon, вы можете получить все документы из ebdb.ru улучшить вашу математику.  

С книгами то проблем нет, а вот с научными статьями - есть.
Ну вот например, ссылка 29 из статьи, которую запостил monday2000:
L. O. Gorman. Matched filter design for fingerprint image enhancement.
Где ее взять?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 10:41 29-09-2009
estimated



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
например, ссылка 29 из статьи, которую запостил monday2000:  
L. O. Gorman. Matched filter design for fingerprint image enhancement.  
Где ее взять?

 
Можно попробовать через местный универ:
http://copac.ac.uk/search?&any=ICASSP+88
 
Или может у кого из форумчан есть доступ на IEEE Xplore:
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?tp=&arnumber=196738&isnumber=5035

Всего записей: 1088 | Зарегистр. 15-02-2002 | Отправлено: 14:13 29-09-2009
ukpyr



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
L. O. Gorman. Matched filter design for fingerprint image enhancement.
Где ее взять?

первая ссылка в гугле : http://www.google.com/search?q=Matched+filter+design+for+fingerprint+image+enhancement+pdf&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:en-US:official&client=firefox-a
http://www.stevens.edu/jnickerson/MatchedFilterDesign.pdf
или забанили ?

Всего записей: 35 | Зарегистр. 13-01-2009 | Отправлено: 14:25 29-09-2009 | Исправлено: ukpyr, 14:26 29-09-2009
estimated



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ukpyr: да уж, воистину на всякого мудреца довольно простоты

Всего записей: 1088 | Зарегистр. 15-02-2002 | Отправлено: 14:29 29-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Про Snapter я вообще узнал пару дней назад на Slashdot'е - ничего сказать не могу.  

Её ( http://www.snapter.atiz.com/index.php ) Astra55 критиковал вроде бы (тогда она вроде бы называлась "Snapter Ice 2.0").

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:41 29-09-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, ленивый поиск у меня получился - надо в таких случаях всегда добавлять filetype:pdf - тогда бы нашел.  Остальные нужные статьи тоже вроде нашлись - правда у каждой их них есть свои ссылки.
Dewraping - задача конечно интересная, но все же не самая приоритетная на данный момент.
Сначала надо довести до ума deskpeckling, а я пока вообще отвлекся на переделку архитектуры обработки событий ввода.  Поломка драга в последней версии меня к этому подтолкнула.  Можно было конечно его и так починить - но это была бы борьба с симптомами, а не с проблемой.
 
Может кто желает поспособствовать прогрессу так сказать?  Можно например начать реализовывать тот же dewarping.  Первый шаг - направленное размытие под силу даже мне, а значит практически кому угодно  Писать код можно на чем угодно - хоть на матлабе - все же понятнее, чем сухие формулы.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:36 29-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Можно например начать реализовывать тот же dewarping.  

ИМХО нет нужды реализовывать dewarping самостоятельно. Скорее всего, это будет сделано в рамках проекта OCRopus или Декапод.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:17 30-09-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поломка драга в последней версии меня к этому подтолкнула.

Да уж. Нерабочий драг напрягает. Хотя 3 проекта уже сделал и без него . Куда деваться-то?

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 10:19 30-09-2009
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А я все о том же: мне кажется, не стоит как-то существенно менять деспекл, главное, что надо сделать -- это распознавание (и исключение из деспекла) точек, стоящих на одной горизонтальной линии. Поверьте, это очень важно. Я-то помню про отключение, но мне уже начали присылать книги с покореженным оглавлением. Надо это остановить поскорее.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 21:41 02-10-2009
romanpolansky

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon работает в одиночку, и многие проблемы. Он нуждается в помощи. Кроме того, я вижу эти комментарии на SourceForge ищет последний релиз:
 

Цитата:
Very high success rate on automatic scan. For me much better and easier than scankromsator. removes gray scanning artifact in the middle of the book. Only missing the dewarp function. Great work anyway! Thumbs up.


Цитата:
The Author, JART or Joseph Artsimovich told me that he is not even a university graduate and poor in mathematics. When I asked him about any test images that he tried, he went into paranoid mode, accusing me of being FBI and trying to entrap him by involving him in downloading the files. I consider the future of this project very bleak. When I asked him about the documentation, software design or architecture, he flatly cut me short. This was voice conversation and it gave me a good idea of his intentions and tenor of voice. He wants to make the project closed by poor commenting and poor readability. Furthermore, the software sucks. "Very High" is very relative. As an example, in OCR you need 99.99% success for it to be worthwhile. He has no numbers and because of his real or "manufactured" paranoia, test cases cant be discussed. He has no UML or other documentation to explain the program gui architecture and I sincerely wanted to help him but he turned me off by his rude behaviour. He regularly and deliberately misinterpreted my conciliatory and constructive attitude as weakness and my eagerness to understand so I can help him as "pumping him". Even if he is capable of doing a good project - which I doubt - he will leave the users with a bad version and take his program to some company and sell them. Otherwise, why is he so resistant to just a few pages of documentation ?!


Цитата:
After trying Snapter with mixed results I thought I'd try Scan Tailor on some book page photo's I'd taken. I was impressed with what it did although for some reason I needed to do each page manually and it wasn't obvious why. Given I just downloaded it & started using it straight away without reading any instructions I'd say that was more my problem! V0.96 worked fine on my Win2k machine despite suggestions it would crash. On the whole a definate thumbs up from me, will be awesome in time when some other features are implemented - wish I was a programmer & able to help!


Цитата:
Scantailor has very weak algorithms as compared to scankromsatoru. Bolega was ONE of the pioneers in this field. There are better programs coming out of Finland, Thailand, Malta, Switzerland, Germany, India, China, Vietnam for image processing of books. The program has dark future due to difficult and uncooperative personality of the author.

 
сочувствие Tulon  
 
Товарищ Tulon, демонстрируют комментариев ложных вашими действиями.
 

Всего записей: 2 | Зарегистр. 29-09-2009 | Отправлено: 01:26 03-10-2009 | Исправлено: romanpolansky, 01:46 03-10-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Слёт сотрясателей воздуха уже объявлен ?

Всего записей: 6488 | Зарегистр. 31-08-2008 | Отправлено: 07:50 03-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
А я все о том же: мне кажется, не стоит как-то существенно менять деспекл, главное, что надо сделать -- это распознавание (и исключение из деспекла) точек, стоящих на одной горизонтальной линии. Поверьте, это очень важно. Я-то помню про отключение, но мне уже начали присылать книги с покореженным оглавлением. Надо это остановить поскорее.

Если бы деспекл лажал только на отточиях, так ведь нет - он например норовит удалить знаки = в формулах, если справа и слева достаточно большие пробелы.  Я вижу идеальную реализацию деспекла такой:
По умолчанию аггрессивность достаточно низкая, так что никакой полезный контент не удаляется.  На выводе появляется еще одна вкладка, в дополнению к Output и Picture Zones.  В этой дополнительной вкладке вы можете "побрызгать" на грязь, чтобы повысить аггрессивность деспекла в этой области.  Ну и глобальный регулятор аггрессивности тоже нужен, по типу регулятора "тоньше - жирнее" для бинаризации.
Это пока только идея - реализовывать еще не начал.
 
Добавлено:
romanpolansky

Цитата:
Tulon работает в одиночку, и многие проблемы. Он нуждается в помощи. Кроме того, я вижу эти комментарии на SourceForge ищет последний релиз:  

Роман, зря вы это процитировали.  Просто у товарища chotarajkumar много свободного времени и желания меня достать.  Я уже ввел в распорядок дня новое действие:
1. Просыпаюсь.
2. Принимаю душ.
3. Завтракаю.
4. Удаляю очередной такой комментарий этого товарища.
5. Иду на работу.
 
Так что удалите пожалуйста эту цитату из вашего сообщения (ссылка Редактировать).  Сам я не могу этого сделать - здесь я не модератор и не админ.  А если вам интересна предистория всего этого, почитайте последние 2-3 страницы этого топика.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:00 03-10-2009
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это только мне кажется, что romanpolansky и ramanujan -- одно и то же лицо?

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 14:05 03-10-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Если удалит эти цитаты, будем считать что нет

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:15 03-10-2009
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
да напишите или сгенерируйте вы ему диаграмму классов. И выложите на первой странице. Вот и все.
 
anagnost96

Цитата:
Это только мне кажется, что romanpolansky и ramanujan -- одно и то же лицо?

 
может быть. Но скорее всего в этом виновен "литературный стиль" транслятора гугла

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 15:25 03-10-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru