Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » OCR CuneiForm

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8

Открыть новую тему     Написать ответ в эту тему

Crag Hack



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Cuneiform

 

 
OCR CUNEIFORM - это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним.
OCR CuneiForm отличается от других программ этого класса высоким уровнем распознавания, особенно текстов низкого качества и наличием встроенных мастеров - помощников в работе; мощным встроенным текстовым редактором.
12 декабря 2007 г. Компания Cognitive Technologies объявляет о запуске программы "Распознавание должно быть на каждом компьютере", о выпуске free-ware версии OCR CuneiForm и об открытии исходных кодов OCR CuneiForm.
Домашняя страница
Прямая ссылка на загрузку
Прямая ссылка на загрузку - 2
Давайте обсудим работу данного пакета - как никак бесплатная альтернатива FineReader' у
Cuneiform-Qt - графический интерфейс для системы оптического распознавания символов для Linux

Всего записей: 437 | Зарегистр. 11-07-2002 | Отправлено: 11:06 14-12-2007 | Исправлено: Start, 14:04 19-12-2017
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
У меня тоже не работал, подправил инишку, как в FAQ и все пошло. Но батчскана нет и вообще, сканирование сделано откровенно плохо и неудобно. Поэтому пусть OCRит, а сканить проще в Ирфане с макросом. Будет быстро и качественно.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 10:19 03-01-2008
Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
шапка включена

----------
Тень превращается в фантазии, таящиеся в глубине вашей души.
Пока идёшь ты среди теней, да не будет зла с тобой.

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 14:17 04-01-2008
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Еще сильно напрягает отсутствие поддержки tif LZW, пожалуй, основного формата для цвета и серого. Приходится разжимать tif, а это место на винте и время на разжим. Опять таки, это длится с давних пор, будем надеяться на включение этого формата в будущий CF.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 17:07 04-01-2008
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
 
Кстати, я например убедился, что прекрасно сканирует и XnViewer, PhotoFiltre (сам правда пользуюсь PhotoFiltre Studio), PhotoLine 32, Paint Shop Pro, Paint.NET, ... Так, что выбор инструмента сканирования это по большому счёту дело вкуса и навыков пользователя. Имеется только одна разница - в редакторах есть возможность при необходимости осуществить предварительную обработку изображения до его распознавания. А вот её итог будет зависеть как от возможностей редактора, так и от умения пользователя с ним работать. Поэтому я бы не стал давать однозначных советов. Ведь на тебя, как и на любого опытного человека смотрят новички и часто пытаются повторить то, что мы делаем "на автомате" как шаблон на все случаи жизни. И у них естественно, возникают проблемы.
 
А вот что касается DjVu и поддержки TIFF/LZW, то тут я согласен полностью - по идее, такую поддержку, как и поддержку других возможных входных форматов стоит реализовать через механизм подключаемых фильтров импорта со стандартным API. Да и возможность вывода результата с использованием подобного механизма также прибавит программе гибкости в применении.
 

Наверное стоит сказать об этом на форуме программы. Хотя уверен, что разработчики и сами об этом знают - как никак, а модульный принцип построения систем из функциональных блоков давно стал самым удобным инструментом разработчиков. Ведь это значительно проще, чем делать систему-монолит: просто берём готовый блок ("чёрный ящик") из некоторого набора (библиотеки блоков)  имеющий набор соответствий "поступило на вход - получили на выходе", стандартные подключения входа-выхода и управления, и не смотрим "А что внутри и как это сделано?". А просто соединяем "кубики" в необходимую нам логическую цепь обработки. Итоговая система будет иметь свойства, определяемые набором свойств использованных блоков. В цифровой схемотехнике впервые принцип модульных блоков был реализован ещё в начале 50-х годов прошлого века. И верой-правдой работает до сих пор. А уж о том, сколько тысячелетий он людям служит уже и вспоминать не приходиться... Просто иные "особо конгениальные" товарищи хотят всё сами "...от нуля времён.." сделать - "...До нас никто этого не делал, а если и делал то не так как надо! Мы единственные знаем истину ..."... Ну, флаг им в руки, барабан на шею и  вперёд заново изобретать каменный топор... Дурак-то, он потому и дурак, что ничего не замечает, никого не слушает, и утверждает, что он всегда и во всём первый, и единственный умный во Вселенной...
 
Добавлено:
Astra55
 
А насчёт сбоя сканера, то есть такое явление. У меня сканер Visicom 4400 USB. Так вот, к нему даже дрова шли разные! На диске отличные: и сканирование в 42 бит (это предел матрицы), и разрешение (оптическое, равное физическому разрешению матрицы 600 x 1200 dpi) до 2400 dpi, и настройки, и прекрасная цветопередача. А те что идут в пакете 4400.exe не то что использовать, а "драйверами" назвать не возможно - предел глубины цвета 15 бит, реальное разрешение не выше 300 dpi (выставляется правда 24 бит цвет и до 600 dpi, но не работает - специально проверял когда то на приборах), а о цветопередаче лучше промолчать, одним слово не драйвера, а так, недоразумение... С FineReader что я только не делал - при сканировании ошибки вылетали сразу. С CF реже, и удаётся сканировать через драйвер.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33221 | Зарегистр. 31-07-2002 | Отправлено: 07:12 06-01-2008 | Исправлено: Victor_VG, 07:23 06-01-2008
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
что касается DjVu и поддержки TIFF/LZW

Можно и помечтать в плане прикрутки движка OCR CF к djvu софтам, чтобы можно было несколько языков выбирать... А то этот ИРИС, который суют все, кому не лень и куда попало, не выдерживает никакой критики. Софт Генчо на базе ФР, конечно, хорошо, но необходимость в куче промежуточных операций отпугивает народ. Словом, пока придется ждать дальнейшего развития событий. Но заявка очень серьезная, я пробую все OCR софты, которые попадают в руки, аналогов среди фривари нет, поэтому следует ожидать большого интереса самых широких кругов к исходникам CF. Так ли это будет - поглядим, уже недолго осталось. А доработать движок сканирования не должно представлять проблемы, равно как и батчсканирование.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 08:53 06-01-2008
bredonosec



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вопросик имеется:  
1) по распознаванию эта прога как? лучше фр? Хуже? намного? По удобству раоты, скорости..
2) сколько весит? (дистр, раскрытая на винте, сколько кушает ресурсов при работе(
3) есть ли ограничения по ОСям - там, ХР и выше, и т.д.? На 98 встанет?

----------
Вопрос: 'Что человек курит?' как правило возникает не когда ты слышишь, как он дышит, а когда видишь, что он пишет
Пропеллер играет роль вентилятора, он останавливается -пилот потеет
Аськи нету.

Всего записей: 16257 | Зарегистр. 13-02-2003 | Отправлено: 23:11 14-01-2008
sanb



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bredonosec
Программные и аппаратные требования.
       При установке CuneiForm необходима следующая конфигурация:
ПК на базе Pentium и выше
MS Windows 2000/XP с не менее чем 64 MB (рекомендуется 128 MB) оперативной памяти и около 65 MB свободного дискового пространства  
TWAIN совместимый сканер.
дистр 34мб

Всего записей: 2189 | Зарегистр. 26-07-2006 | Отправлено: 00:55 15-01-2008
bredonosec



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
спасибо.  
А по распознаванию?

Всего записей: 16257 | Зарегистр. 13-02-2003 | Отправлено: 05:07 15-01-2008
Crag Hack



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
При установке CuneiForm необходима следующая конфигурация:
ПК на базе Pentium и выше
MS Windows 2000/XP

 
Поправлю и дополню  
Для полноценного использования системы CuneiForm необходимо следующее оборудование и программное обеспечение:
·    PC-совместимый компьютер с процессором не ниже Intel Pentium 133 МГц и 50 Мб свободного дискового пространства. При использовании системы CuneiForm в среде Windows 95/98 рекомендуемый объем оперативной памяти 64 Мб, минимальный — 32 Мб. При использовании в среде Windows NT рекомендуемый объем оперативной памяти 96 Мб, минимальный — 64 Мб. При использовании в среде Windows 2000 или XP требования к процессору и оперативной памяти не ниже чем необходимо для данной системы.
·    Сканер: TWAIN-совместимый.
·    Операционная система Windows 95, Windows 98, Windows NT 4.0, Windows 2000 или Windows XP.
 

Цитата:
раскрытая на винте

61 Мб
 

Цитата:
сколько кушает ресурсов при работе

16Мб если просто запущена, около 40 Мб при распознавании
 

Цитата:
по распознаванию эта прога как?

неудобство (по крайней мере для меня) - не распознает скриншоты, pdf, djvu
 
качество и скорость распознавания вполне приемлимые.  
На обычном куске книги djvu и FR и CF распознали одинаково

----------
Качественно, быстро и дешево? Так не бывает!!!

Всего записей: 437 | Зарегистр. 11-07-2002 | Отправлено: 08:57 15-01-2008 | Исправлено: Crag Hack, 08:58 15-01-2008
DOE_JOHN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Всего записей: 1595 | Зарегистр. 09-05-2004 | Отправлено: 17:17 23-01-2008 | Исправлено: DOE_JOHN, 17:19 23-01-2008
Crag Hack



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Программу кто-нибудь запускал с правами, отличными от "Администратор"?
 
При запуске с правами "Пользователь" появляется сообщение об ошибке
"Failed to update the system registry.  
Please try using REGEDIT."
После чего вроде работать можно, но результат распознавания не отображается.
 
Кто нибудь поборол эту неприятность?
 
Добавлено:
На данный момент решилось добавлением прав пользователю на ветку реестра
HKLM\Software\Classes\
но что то как то некрасиво

----------
Качественно, быстро и дешево? Так не бывает!!!

Всего записей: 437 | Зарегистр. 11-07-2002 | Отправлено: 15:03 01-02-2008 | Исправлено: Crag Hack, 16:38 01-02-2008
SAOPP

Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Ребят, тулза портабельная?

Всего записей: 1048 | Зарегистр. 28-11-2004 | Отправлено: 18:11 04-02-2008
ZEWS



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
SAOPP
На предыдущей странице выкладывал ссылки на портабельный вариант, но это неофициальная версия.

Всего записей: 2873 | Зарегистр. 25-02-2006 | Отправлено: 18:35 04-02-2008
SAOPP

Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Оп как-то прозивал, спасибо, думал две страницы на топик этого "маловато" для...

Всего записей: 1048 | Зарегистр. 28-11-2004 | Отправлено: 20:10 04-02-2008
maix



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А подскажите как ее скачать. Может кто ссылку даст? а то с сайта производителя не качается

Всего записей: 194 | Зарегистр. 14-06-2006 | Отправлено: 14:53 07-02-2008
CoDderR



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
maix все нормально качается по ссылке из шапки.  
С моим стареньким HP 1200 работать не захотела( по распознаванию картинок рулит нормально,но видать сыровата еще прога...

Всего записей: 779 | Зарегистр. 05-12-2007 | Отправлено: 16:06 07-02-2008
Loafer



Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
CoDderR это пробовал?

Цитата:
Ошибка передачи данных при работе со сканерами HP, Epson, BENQ, Canon, Xerox, Mustek и др.  
 
Описание ошибки:
Причина в особенностях работы TWAIN драйверов сканера, в CuneiForm используются 2 режима передачи memory-buffered (режим по умолчанию) и memory-native. Раньше драйвера сканера не всегда реализовали оба, или один из них был не очень стабилен. Была ситуация когда это зависело и от производителя, и от версии драйвера. Сейчас у производителей промышленных сканеров (Fujitsu, Kodak и др.) поддерживаются все режимы, а у остальных производителей видимо ситуация с режимами передачи иногда остается нестабильной.  
 
Лекарство:  
Необходимо отредактировать файл face.ini, который находится в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native. То есть должно быть TWAIN_TransferMode=memory-native

 
 
Добавлено:
maix
забирай, переложил с офсайта http://rapidshare.com/files/89964729/CuneiForm_12.7z

----------
Никнейм зарегистрирован

Всего записей: 6458 | Зарегистр. 09-12-2001 | Отправлено: 22:58 07-02-2008 | Исправлено: Loafer, 23:02 07-02-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Да пусть даже не прикручивают к программам создания djvu-книг. Программе ещё есть в чем развиваться и так.
А вот сохранять распознанные страницы в формате FR-ра, чтобы их подсовывать программе DjvuOCR 2.2 beta - вот это было бы козырно. По крайней мере гарантия того, что хорошую книгу в djvu с OCR уже можно будет сделать.
Правда этот формат вроде закрыт и я не знаю каким образом автор DjvuOCR смог раскодировать.
Тестовое распознание tiff-страничек мне понравилось. Но пользуюсь этим только для djvu-OCR. Поэтому буду ждать дальнейшего развития программы и надеяться на портирование в среду Linux. Там этого очень не хватает (про Wine знаю, не надо напоминать).

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 13:03 06-03-2008
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
 
Я её и под FreeBSD 6.3/7.0 хочу видеть. Так же использую через Wine 0.9.5.6. Не самый удобный вариант. Причина в шрифтах. Пока поставишь, да намучаешься с их настройкой семь потов сойдёт. Особенно когда через каждую секунду тебя дёргают и мешают работать...
 
Crag Hack
 
Решение описано на Форуме программы в ветке  Запуск программы с правами пользователя.. Лично мне оно не нравится. Действительно, грубая недоработка авторов.

Цитата:
А на всю и не надо, достаточно только на эти ветки:
 
HKEY_CLASSES_ROOT\CuneiformFace.Document\CLSID
 
HKEY_CLASSES_ROOT\CLSID\{5D1A5D06-7F90-11D2-9B06-000000000000}
 
Кстати помимо окошка с ошибкой исчезают тормоза при запуске, программа открывается моментально.

bredonosec
 
На Win98 если посмотреть в ту ветку что я указал установить не удалось. Я не проверял.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33221 | Зарегистр. 31-07-2002 | Отправлено: 13:42 06-03-2008 | Исправлено: Victor_VG, 14:13 06-03-2008
RRaa

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При заходе на http://www.cuneiform.ru/ пишут что "Проект закрыт".

Всего записей: 107 | Зарегистр. 13-12-2005 | Отправлено: 08:53 01-04-2008
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8

Компьютерный форум Ru.Board » Компьютеры » Программы » OCR CuneiForm


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru