Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Алгоритм распознавания текста

Модерирует : ShIvADeSt

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6

Открыть новую тему     Написать ответ в эту тему

TheBlackAngel

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Задача: распознать текст из трех символов. картинка цветная. кроме символов присутствует шум в виде векторной графики.
Пример картинки:  
   
 
Результаты попытки очистки от мусора:  

 
Начало обсуждения  тут
 

Всего записей: 26 | Зарегистр. 21-09-2003 | Отправлено: 23:50 12-06-2006 | Исправлено: TheBlackAngel, 23:16 15-06-2006
cwll



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Совершенно дилетантское мнение: а если анализировать RGB спектр каждого пикселя, потом считать количество пикселей одного цвета - возможно с неким % допуском , затем выкинуть все что меньше/больше мин/макс пикселей знака и дальше от этого плясать?  
Возможно не пикселей как таковых, а группы одноцветных пикселей, скажем 3х3.  
 
Например так: считаем, что минимальная толщина символа Х пикселей, максимальное У.  
Все что больше У*У можно сразу исключить, то бишь закрасить.  
Ищем максимальное количество _одноцветных_ пятен Х*Х  - это и будут наши базовые цвета. Если получили ХХХ пикселей Х+Z*Х+Z добавляем погрешность N%. То есть если база 100*100*100, а допуск 5%, получим базу+допуск 95-105*95*105*95-105 как вариации базового цвета. Тут надо подумать, у всех ли цветов должен быть одинаковый допуск...
 
Далее так: если квадрат 2*2 не содержит цветов базы+допуск, то он должен стать белым. Если содержит одна грань, проверяем что за гранью, и если не содержит - тоже белый.  Содержит - на пиксель в сторону, опять проверяем и закрашиваем. Затем обрабатываем одиночные пиксели по тому же алгоритму.  
 
Надеюсь, мой поток сознания хоть частично можно понять...

Всего записей: 206 | Зарегистр. 26-10-2005 | Отправлено: 02:00 13-06-2006
ns56



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выделять символы на основе суммы пикселов бессмысленно, так как все символы, квадратики и розочки  рисуются с прозрачностью.
 
Поэтому первоночально надо очистить от мусора...но самое убийственное это розочки.

Всего записей: 64 | Зарегистр. 05-12-2003 | Отправлено: 03:46 13-06-2006
cwll



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ns56
Вряд ли получится очистить от мусора, не вычислив базовые цвета символов. Думаю, базы найти реально. Из-за прозрачности и предлагается задавать допуски на базовые цвета, как вариант. Дальше можно построить прямоугольник с символом, повернуть его вертикально и уже как-то анализировать.  
 
Вообще идея была - отбросить максимум левой информации на первом этапе, при этом гарантированно не тронуть полезную.  
 
Слышал другое предложение: использовать нейронные алгоритмы. Тут ничего сказать не могу, бо совсем профан.  
 
Есть еще момент: толщина линии в символе всегда одинакова, это тоже можно использовать.  Правда не факт, что завтра они не применят другой шрифт.  
 
 

Всего записей: 206 | Зарегистр. 26-10-2005 | Отправлено: 04:57 13-06-2006
alexpin



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а нельзя ли все это добро перевести в градацию серого и сравнивать с шрифтом

Всего записей: 638 | Зарегистр. 16-10-2003 | Отправлено: 09:54 13-06-2006
WiseAlex



Софтовых дел М...
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TheBlackAngel
вот цитата с http://filepost.ru/?act=news

Цитата:
 
Недавно измененный алгоритм работы хостинга Rapidshare привел в негодность написанный нами ранее плагин. Теперь это исправлено и вы снова можете скачивать с Rapidshare.de, не ожидая 45 секунд и не вводя никакого кода с картинки!
 

может вы пошли не по тому пути?

Всего записей: 1001 | Зарегистр. 02-03-2003 | Отправлено: 10:43 13-06-2006
rapget



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
WiseAlex
 

Цитата:
может вы пошли не по тому пути?

 
 
Или они стали использовать премиум аккаунт, ведь у них тоже платные услуги - расходы у них окупятся

Всего записей: 82 | Зарегистр. 12-06-2006 | Отправлено: 11:05 13-06-2006
SlavaMSK



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
WiseAlex

Цитата:
может вы пошли не по тому пути?

 
Причём здесь filepost.ru? Ветка иначе называется. Какие дела у filepost.ru уже в прошлом. Рапидовскую закачку всё равно они теперь на халяву не отдадут (в техже новостях написано почему). Пусть ребята обсуждают как рапиду обмануть, всё таки две проги простаивают.

Всего записей: 1090 | Зарегистр. 23-05-2006 | Отправлено: 11:48 13-06-2006 | Исправлено: SlavaMSK, 11:49 13-06-2006
Dimoniusis



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
WiseAlex пока я у них вижу "Закачка файлов с сайта rapidshare.de временно отключена. Администрация приносит свои извинения за предоставленные неудобства. Включение закачки ожидается сегодня ближе к вечеру."
 
Насчет вечера - не знаю...

Всего записей: 4134 | Зарегистр. 18-10-2005 | Отправлено: 12:39 13-06-2006
XDiaBLo



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Тут без нейронных нереально

Всего записей: 244 | Зарегистр. 13-05-2004 | Отправлено: 12:46 13-06-2006
cwll



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alexpin
Смысл выкидывать дополнительную информацию? Это только затруднит распознавание.

Всего записей: 206 | Зарегистр. 26-10-2005 | Отправлено: 13:02 13-06-2006
AndreySh



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
WiseAlex
Эта новость от 2005-12-07!
На дворе 2006!!! И новые выбрыки рапиde.
Я понимаю, что хочется поучавствовать в их партнерской программе.

Всего записей: 889 | Зарегистр. 27-03-2002 | Отправлено: 13:31 13-06-2006
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
еще одно мнение неспециалиста по ОЦР
 
Если хорошо настроить тресхолд, то можно попробовать разбивать картинку на слои по цветам- это реализовано неплохо например в BookRestorer,  или RasterID (не помню уже точно), думаю это не сложно реализовать.
Потом по геометрическим признакам выделить слои с текстовыми символами, или точнее говоря- отбросить явно не текстовые.- те, которые занимают больше половины картинки, очень тонкие линии и т.д
Остальные - сделать Smooth,  поднять контраст, в чб, и распознавать посимвольно! потом сформировать код в соответсвии с расположением символов от левого края картинки

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 13:50 13-06-2006
Dimoniusis



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r а что за проги? ссылку можно ?

Всего записей: 4134 | Зарегистр. 18-10-2005 | Отправлено: 14:08 13-06-2006
cwll



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimoniusis
BookRestorer = xttp://doronin.nnov.ru/djvu/BR41en.rar
(xttp://dstu2204.narod.ru/djvu/index.htm)
Не качал не юзал, слышал, что стоит она 6000 евриков!
 

Всего записей: 206 | Зарегистр. 26-10-2005 | Отправлено: 14:38 13-06-2006
Dimoniusis



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати, пообщался с ребятами из файлпоста.... у них идей нет, они сейчас делают полуавтоматический режим... то есть как и у меня сейчас работает - спрашивать будут у пользователя код при добавлении ссылки

Всего записей: 4134 | Зарегистр. 18-10-2005 | Отправлено: 17:03 13-06-2006
SlavaMSK



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimoniusis если не секрет, кто на кого вышел?

Всего записей: 1090 | Зарегистр. 23-05-2006 | Отправлено: 18:05 13-06-2006
Dimoniusis



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SlavaMSK я у них спросил Еще интересно как там у рапгета дела... Все таки пярмой конкурент (пока местами выигрывающий)
 
На меня тоже выходили некотрые люди котрые разные проги делают... Тоже думают все

Всего записей: 4134 | Зарегистр. 18-10-2005 | Отправлено: 18:07 13-06-2006 | Исправлено: Dimoniusis, 18:08 13-06-2006
SlavaMSK



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А ты разве не в курсе? Он 12 июня здесь прописался. Подымись до моего сообщения где я упрекаю народ что не туда влез, и прям надомной его пост. Кстати попасть в эту ветку можно только с твоей ветки.

Всего записей: 1090 | Зарегистр. 23-05-2006 | Отправлено: 18:12 13-06-2006
AndreySh



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пока никто ни у кого не выигрывает. Есть определенные опережения но в угоду стабильности! А это тоже очень важно, я из-за ошибок в РапГете потерял много КилоМетров и времени
Кстати сегодня вечером Александр обещал обновление.

Всего записей: 889 | Зарегистр. 27-03-2002 | Отправлено: 18:14 13-06-2006
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6

Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Алгоритм распознавания текста


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru