Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
vvvvv2



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
10-версия очень огорчила с таблицами.... Она совершенно игнорирует вручную размеченные таблицы (на строки и столбцы) - многое сваливает в кучу, будто нет отдельных горизонтальных и вертикальных границ разметки... Глюк серьезный.  
В целом прога работает мощно - грузит на полную Core i7 и, как минимум, 1 Гб оперативки. Создает 8 потоков на каждый проц. А, вот еще, после обработки и удаления задания, при новой задаче память будто бы не освобождается, т.е. забрав, например, 1,5 Гб при новой задаче начинает увеличиваться от этого значения. А если перезапустить прогу, то начинает с минимума. Так не всегда, но нередко...
Нужно ждать новой сборки...

Всего записей: 107 | Зарегистр. 16-07-2007 | Отправлено: 03:00 08-11-2009
domo22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Когда я добавляю кучу картинок для последующего распознавания в FineReader 9, то они на ленте выстраиваются правильно - по порядку - 1, 2, 3, и т.д. Когда же смотрю сохраненный проект, там полный беспорядок - только первый файл всегда первый. А вот немного дальше может идти 22, 21 (а не 21, 22) и подобное. Как уберечься от этой ерунды и заставить сабж размещать файлы в каталоге проекта именно по порядку, а не вразброс? Команда "Перенумеровать файлы" не действует или может действует, но на один лишь файл, а меня их сотни и тысячи. Помогите.

Всего записей: 428 | Зарегистр. 03-04-2007 | Отправлено: 16:14 09-11-2009
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Nikollay: А кто подскажет где можно посмотреть, так называемый ChangeLog , то есть изменения по сравнению с девяткой

Авторы не выкладывают чейнжлоги, пишут, что он есть, но только для внутреннего пользования.

Цитата:
bolvanchik: Если нужно что-нибудь проверить - пишите - проверю

У тебя лицензионная, зарегистрированная версия? Нужно проверить как быстро сохраняются результаты больших пакетов, страниц 100 и более.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 17:00 09-11-2009
Lesmo



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
0SHV, djshkiper, bolvanchik спасибо большое!
 
В принципе впечатление от 9-ки у меня по сравнению с той же 7 такое, будто суеты прибавилось при распознавании небольших (5-15 стр) текстов с каждого источника. И никак от этого отделаться не могу. Может я так и не смог полностью "принять" новый интерфейс.
 
Как сказал vvvvv2, для 10-ки нужен 4 ядерник с гигом-полутора ОП??? Но системные требования-то на сайте производителя - ...Процессор: Компьютер с тактовой частотой процессора 1ГГц или выше. Объем оперативной памяти: не менее 512 Мб, дополнительно для каждого ядра процессора 256 Мб... Минимальные конечно, но не настолько же. Мой  PentIV 1,8 ГГц и 512 ОП с WinXP загнется в раз?
 
Еще такой вопрос: имеем толстую книгу (3-4 см), бумага сероватая, размер шрифта 10. Берем разворот по середине. Как правило, плотно к сканеру приложить всю поверхность разворота не получается и зона переплета по всей высоте книги распознается похуже с неверно распознанными символами. Так как в данном случае 8-ка справляется? 9-ка вроде как почти все видит. Но может косячить в практически безобидной ситуации с более четкими на мой субъективный взгляд символами.  
 
bolvanchik, если не трудно, не мог бы ты снять реальные затраты ЦП и ОП в 9-ке и 8-ке на одних и тех же страницах для сравнения.

Всего записей: 12 | Зарегистр. 23-01-2009 | Отправлено: 17:19 09-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Lesmo
 

Цитата:
Мой  PentIV 1,8 ГГц и 512 ОП с WinXP загнется в раз?  

 не загнется.  
 
при распознавании FR (любой)  проц забивает на 100%
 
по выделению памяти:
8-ка - 120-150 мб (один процесс)
9-ка - 220-300 мб (три процесса)
10-ка - 250-350 мб (три процесса)
книга - 330 страниц. скорость распознавания не измерял
 
по распознаванию "загибов" страниц - тут 9 и 10 рельно лучше справляются

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 12:36 10-11-2009
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik
Вы уже смотрели, как 10-я распознает технические тексты - с формулами, графиками, диаграммами?
Точнее даже не как распознает, а насколько аккуратно нарезает на блоки?
 
Если бы FineReader наконец научился аккуратно отделять то, что распознать можно, от того, что пока распознать нельзя - это сняло бы немало проблем. Особенно в текстах набитых мат. формулами.
Пока что во всех версиях на месте "формульных" кусков страницы дикая каша из паршивой разметки на блоки.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 14:12 10-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shangry
 
Хотел написать много букв, да передумал.
ниже ссылка на архив - сравнивайте. Разрешение - 600dpi.  
Во всех случаях использовался набор: Простые химические формулы, Русский и Английский, Греческий языки. (для 8 - Русский, Английский, Греческий)
для выделения блоков использовалось автоопределение
 
Onlinedisk

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 14:59 10-11-2009
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik
Спасибо.
 
Картинки и таблицы действительно выделяются несколько лучше.  
С многоэтажными формулами практически ничего не изменилось - как прежние версии считали их обычным текстом, так и 10-я то же самое.
Формулы идущие внутри текста распознаются немного лучше, но именно немного - без серьезной правки практически не обойдешься.
Символы с верхними и нижними индексами - тоже прежний гармыдр, править надо в трех случаях из четырех.
 
Спасибо за хорошую идею. Давать, как результат тестирования, вот такие скриншоты похоже гораздо продуктивнее, чем просто описывать происходящее при распознавании.
 
Еще любопытно - изменили в 10-й что-нибудь, в смысле многочисленных FontStyle*** и Style***, которыми форматировался распознанный текст и  которые потом, при экспорте, всей своей свалкой переезжали в Word.
Меня уже изрядно достает переформатирование этого "стихийного бедствия" при копировании куска распознанного в другой документ.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 16:26 10-11-2009 | Исправлено: Shangry, 17:36 10-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Еще любопытно - изменили в 10-й что-нибудь, в смысле многочисленных FontStyle*** и Style***, которыми форматировался распознанный текст и  которые потом, при экспорте, всей своей свалкой переезжали в Word.  
Меня уже изрядно достает переформатирование этого "стихийного бедствия" при копировании куска распознанного в другой документ.  

 
В десятке, в режиме простой текст можно задать свой шрифт. на счёт стиля увы
это не так страшно - можно одним выделением в ворде привести к одному стилю.
Страшнее всего когда передача идет из режима "точная копия". что в 9, что в 10 каждая страница в рамке. это "добивает" иногда.    

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 18:20 10-11-2009
PopovSergej



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik 18:20 10-11-2009
Цитата:
Страшнее всего когда передача идет из режима "точная копия". что в 9, что в 10 каждая страница в рамке. это "добивает" иногда.

Действительно раздражает. Неужели никак нельзя избавиться ?

Всего записей: 1190 | Зарегистр. 09-01-2006 | Отправлено: 18:28 10-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Действительно раздражает. Неужели никак нельзя избавиться ?

 
Можно.
1. Выделить весь текст.
2. Формат -Стили и форматирование - на том стиле что выбран - выбрать "очистить формат"
 вот только результат будет отображаться по вашему стилю, т.е как настроены они у вас
почти аналогично тексту переданному из режима "простой текст".  
 
 
Добавлено:
ALEX666999
 
просмотрел твое сообщение.  
нормально сохраняются. тут скорость то не важна. главное - сохранить
p.s. пакет 10-ки меньше, чем у 9 на 6-7%

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 18:50 10-11-2009 | Исправлено: bolvanchik, 18:57 10-11-2009
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolvanchik: просмотрел твое сообщение.  
нормально сохраняются. тут скорость то не важна. главное - сохранить  
p.s. пакет 10-ки меньше, чем у 9 на 6-7%

Интересует время сохранения TXT-результата в секундах и именно на лицензионной версии. По моим тестам 9-ка нормально "вылеченная" сохраняет результат пакета 310 файлов за ~7 сек, а 10-ка "сыро-вылеченная" за ~49 сек, то есть в 7 раз дольше + назойливо при этом хрумтит винт, чего не наблюдается на 9-ке. Хочется понять где собака порылась. Я думаю дело в пилюле, продвинутые же во врачевании товарищи говорят, что скорей всего не в ней.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 19:30 10-11-2009
Lesmo



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik, большое спасибо за тестирование, выручил.
 
В итоге прихожу к выводу, что оставаться мне надо на 9-ке.
Вопрос тут новый возникает: на какой? У меня сейчас 9.0.0.662. Стгоит ли мне обновляться и на какую именно ревизию. Я слышал, что это имеет значение в FR, как собственно и почти везде. Какая же ревизия в FR в v9 оптимальная?

Всего записей: 12 | Зарегистр. 23-01-2009 | Отправлено: 19:55 10-11-2009
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Lesmo: Какая же ревизия в FR в v9 оптимальная?

"Оптимальность" - субъективизм. Я бы на твоём месте ставил 9.0.0.1042 и никого не слушал.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 20:04 10-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Интересует время сохранения TXT-результата в секундах и именно на лицензионной версии. По моим тестам 9-ка нормально "вылеченная" сохраняет результат пакета 310 файлов за ~7 сек, а 10-ка "сыро-вылеченная" за ~49 сек, то есть в 7 раз дольше + назойливо при этом хрумтит винт, чего не наблюдается на 9-ке. Хочется понять где собака порылась. Я думаю дело в пилюле, продвинутые же во врачевании товарищи говорят, что скорей всего не в ней.

 
 с учётом того, что текст уже сохранялся ранее в doc, получились следующие результаты
330 страниц
 9-ка - 24 сек
10-ка - 11 сек  

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 20:04 10-11-2009
zhe_zho



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я бы на твоём месте ставил 9.0.0.1042 и никого не слушал.

Ну если нужно чтобы работала передача из Screenshot Reader в FineReader то тогда 9.0.0.724, если не обязательно то 9.0.0.1042 (Screenshot Reader для 1042 придётся ставить отдельно).

Всего записей: 2916 | Зарегистр. 24-04-2008 | Отправлено: 23:36 10-11-2009 | Исправлено: zhe_zho, 00:03 11-11-2009
matheiiv

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik

Цитата:
 
с учётом того, что текст уже сохранялся ранее в doc, получились следующие результаты  
330 страниц  
 9-ка - 24 сек  
10-ка - 11 сек  
 

 
проверьте написанное!
какая 9-ка (лицензионная или крякнутая)?
какая 10-ка (лицензионная или крякнутая)?
10-ка что, быстрее?

Всего записей: 1235 | Зарегистр. 10-04-2007 | Отправлено: 14:05 11-11-2009
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
matheiiv
 
у меня лицензия

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 14:23 11-11-2009
matheiiv

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik
1) не верю...
выставляйте скриншот "License Info"! Там ничего "секретного" нет!
 
2)  что значит  
"9-ка - 24 сек  
10-ка - 11 сек"?  

Всего записей: 1235 | Зарегистр. 10-04-2007 | Отправлено: 18:43 11-11-2009 | Исправлено: matheiiv, 18:52 11-11-2009
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
matheiiv: что значит  
"9-ка - 24 сек  
10-ка - 11 сек"?  

Значит сохраняет пакет из 330 файлов в режиме "с именами страниц в TXT" за указанное время.
 
Мой сегодняшний тест сохранения с именами страниц в TXT, 300 файлов, все версии FR "Medic-Edition"
 
9.1019 В память: 6 сек, на ЖД - 21 сек.
 
9.1042 В память: 7 сек, на ЖД - 19-20 сек.
 
10.56, В память: 42 сек, на ЖД - 47 сек.
 
Распознавание в 10-ке по тесту примерно на 20 сек дольше, чем во обеих версиях 9-ки. Дополнительные опции (развороты и т.д) везде были отключены, режим распознавания "тщательный", языки: русский, английский.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 20:29 11-11-2009 | Исправлено: ALEX666999, 20:38 11-11-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru