Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Talay: зачем ждать, на трекерах уже репаки есть о этой версии

Да вы, батенька, Генерал Очевидность!
Это ничего, что  на момент публикации решений не было?!
А трекеры ваши всё отсюда один фиг тащат.
 
distortion
Тоже с советом запоздал, считай на недельку.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 12:50 12-06-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-нибудь пробовал в 11-й версии ставить в настройках сохранения PDF "Использовать смешанное растровое содержимое (MRC)"?
У меня все руки не доходят, а было бы интересно оценить насколько хорошо там сейчас сегментация сделана.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 13:27 14-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Привет всем!
Стоит задача распознать много страниц вида:

 
FR11 не справляется. Какой можно применить фильтр или настройку?

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 21:46 17-06-2013 | Исправлено: AKazak, 21:46 17-06-2013
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
AKazak

 
Вот что дал FR11
Принципиальная схема генераторного устройства для создания возбуждающего иола с регулируемым спектром для электроразведки методами НЭЗ, ДЭЗ, ДОЗ аредотавлен на рио. а-?. Формирование единичных имдульсов    осуществляется    здесь    о    помощью    моста, соз-
дающего два противофазных напряжения ^/MoSinnJot /, тиристоров Тд и Т^, включаемых в заданные моне ты времени командным программируемым устройством (на схеме не показав), синхронизируемым напряжением Мсмн* . Начальная отсечка фазы импульса Ц. (t ,^ ) регулируется блоком задержки, контакты Км    осуществляются подключение
нагрузки    (питающих    электродов    АН)    к    силовому    блоку. Отли-
чительной особенностью генератора являетоя отсутствие специальных
 
Вот что дал FR 8
Принципиальная схе^а генераторного устройства дла создания возбуждающего ноля с регулируемым спектрод для электроразведки методами йЭЗ, ДЭЗ, ДОЗ аредотавлен на рас и-?. Формирование единичных импульсов U.(t,^) осуществляется здесь о помощью моста, создающего два противофазных напряжения ^/MoSinnJot /, тиристоров Тт и Т., включаемых в заданные моме ты времени командным программируе-ыым устройством (на схеме не доказан), синхронизируемым наыражени-ем Цсмих . Начальная отсечка фазы импульса И. (t ,^ ) регулируется блоком задержки, контакты Км Км  осуществляются подключение нагрузки R^P-Kb (питающих электродов Ас) к силовому блоку. Отличительной особенностью генератора является отсутствие специальных
 
 
На 11 на пару ошибок меньше но много левых табов.  
Можно ли лучше - не скажу.
 
Результат получен после подготовки изображения.
 
Повышаем разрешение до 300х300. Каналом Luminosity в PaintDotNet повышаем резкость и засеряем изображение. Затем в SK - чтобы превратить исходный растр в буквах в сплошные линии. На выходе Tiff 300x300 чб.
 
В ФР Сервис -Опции - Документ (Общие - Дополнительные опции в 8) ОБЯЗАТЕЛЬНО тип текста - ПЕЧАТНАЯ МАШИНКА.
 
Остальное ручками.
 
Вариант - перескан в сером 300 -> SK -> tiff Ч/б 600DPI - и FR, как описано. Полагаю, будет немного лучше. Но рукопись всё равно придётся ручками править.
 
 

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 00:17 18-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
 
Спасибо за подробный ответ. Рукопись, конечно буду руками набирать.
По обработке изображения вопрос: как эту последовательность процедур обработки можно прогнать на нескольких десятках tif'ов?

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 07:07 18-06-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AKazak
Для начала выложили бы сами tif-ы, вместо скриншотного куска, тогда разговор об обработке перешел бы в практическую плоскость.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 10:16 18-06-2013
antz13



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AKazak
 
1. Тифы распознает лучше
2. При неувернном распозновании лучше ставить 600 т на дюйм
3. Пользоваться проверкой словарем. Добавление незнакомых слов идет в разных словоформах и значительно улучшает качество распознавания.
4. Прогонять через проги типа AfterScan, правда с потерей форматирования и картинок.
 
На приличной выборке книг диссертаций и документов - этот порядок распознавания неплохо срабатывает, очень мало ошибок. Самое главное чистый скан с ровными строками.
 
PS. Это печать такая или скан? В любом случае нужна обработка в фотошопе, типа размытия/контрастность/яркость/резкость... чтонть в таком порядке, чтобы убрать зернистость букв.
И чб распознается хуже чем серое изображение

Всего записей: 442 | Зарегистр. 28-03-2005 | Отправлено: 11:30 18-06-2013 | Исправлено: antz13, 15:49 18-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
antz13
Спасибо за рекомендации
 
Astra55
Пожалуйста, пример такого tif'а. Все остальные - в том же духе.

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 19:43 18-06-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AKazak
Это не сканы, а набор черных точек. Если нет серых сканов, проще перепечатать все заново, меньше времени уйдет.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 20:44 18-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
К сожалению, пресканировать будет сложно.
 
Качество распознавания, которого вы добились выше меня вполне устраивает. На выходных попробую реализовать последовательность.

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 22:17 18-06-2013 | Исправлено: AKazak, 22:29 18-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Пара вопросов:

  • Какие конкретно настройки вы использовали в Paint.NET?  
  • SK - это Scan Kromsator?

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 21:27 19-06-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
AKazak
Вы меня перепутали с niccolo, и не первый раз. Неужели так сложно прочесть эту страницу?


----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 21:55 19-06-2013
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Какие конкретно настройки вы использовали в Paint.NET?  
 SK - это Scan Kromsator?

 
Визуально менял канал Люминосити чтобы изображение стало светло-серым, но буквы не начали расплываться - но PDN не поддерживает автоматику.
 
SK=Scan Kromsator
 
Попробуйте поиграть контрастом, гаммой, блюром и порогом ч/б в SK. Задача - получить из растра сплошные линии.
 
Quality — Флажок Enhance image - gray enhance - и в появившейся панели в закладках Gamma - поднимайте, Contrast/Brightness меняйте, как описано выше про PDN.
 
Порог ч/б -Binarization — convert  to bw threshold - light dark, middle dark
 
Может маэстро Болега подскажет как с такими сканами Блюром и Шарпом бороться.
 
Как вариант - серый фон реальной страницы сложить с подобранным коэффициентом прозрачности в Фотошопе - он автоматику поддерживает - а потом в SK.

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 22:43 19-06-2013
AKazak



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55, прошу прощения.
 
niccolo, застрял на шаге 1 с Paint.net. Изменение канала Luminosity никак визуально не сказывается на изображении. Может быть нужно сначала изображение из BW перевести в Color?

Всего записей: 638 | Зарегистр. 24-12-2005 | Отправлено: 16:47 23-06-2013
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
niccolo, застрял на шаге 1 с Paint.net. Изменение канала Luminosity никак визуально не сказывается на изображении. Может быть нужно сначала изображение из BW перевести в Color?

 
выровняйте кривую по низу в первых трёх четвертях и отрегулируйте верхнюю точку в четвертой четверти.
Если слабо в этом понимаете - лучше работайте с Brightness/Contrast, даже прямо в SK

Всего записей: 3729 | Зарегистр. 17-09-2001 | Отправлено: 20:45 23-06-2013
smersh2012



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
просветите, плиз, ABBYY Fine Reader обладает всеми функциями, которые есть у PDF Transformer или трансформер может что-то больше?

Всего записей: 2472 | Зарегистр. 30-01-2012 | Отправлено: 10:37 09-07-2013
antz13



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Ставил как то обе - похоже что движок одинаковый, FR пофункциональней будет.

Всего записей: 442 | Зарегистр. 28-03-2005 | Отправлено: 11:21 09-07-2013
redson



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Дорогой Astra55 сделай нам портебл версию для нового фанридера 11.0.113.164. Заранее спасибо!

Всего записей: 1340 | Зарегистр. 23-04-2007 | Отправлено: 20:05 12-07-2013 | Исправлено: redson, 20:09 12-07-2013
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
redson
В варезном топике сделали в трех экземплярах на выбор:
http://forum.ru-board.com/topic.cgi?forum=35&topic=46259&start=2180#15
http://forum.ru-board.com/topic.cgi?forum=35&topic=46259&start=2220#9
http://forum.ru-board.com/topic.cgi?forum=35&topic=46259&start=2220#16

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 20:31 12-07-2013
vraldislav

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте!
Подскажите следующий момент:  
имеется МФУ Canon MF3228, Windows7 x64, FineReader 11.0.113
 
При сканировании через интерфейс FR, вне зависимости от комбинации свойств в диалоговом окне, сканируется только часть документа (1/4), при этом FR считает, что отсканировал 100%.  
Перевыставление размеров и другие "пляски" не помогают, при этом если сканировать в FR через интерфейс сканера - всё ок, аналогично и при сканировании стандартной прогой Windows. Подскажите, в чем может быть дело? Пробовал разные версии и билды 11-ки - везде та же история.

Всего записей: 1 | Зарегистр. 23-03-2010 | Отправлено: 00:18 19-07-2013
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru