dmitin
Full Member | Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору bdfy Цитата: разрешение ему подавай от 600дпи | Это, наверно, чтобы он мог распознавать индесы индексов. Цитата: мне кроме демки ихней ни одного листа формул распознать так и не удалось | А мне удалось. Вот пример: Ваш файл test_tiff.rar (размер 281 кбайт) доступен по адресу: webfile.ru/259724 в течение 21 дня до 04:34 06.05.2005. Ваш файл test_iml.rar (размер 87 кбайт) доступен по адресу: webfile.ru/259727 в течение 21 дня до 04:40 06.05.2005. Мои выводы: С тех пор, как Ридер стал запускаться из командной строки, стал работать корректнее: вылетает не так часто, правда не некоторых сканах в 600 dpi всё равно вылетает без объяснения причин - то ли не нравятся ему неидеальные буквы, то ли пугается каких-то математических символов. Так что для перевода электронных документов в редактируемый формат еще может сойти, но не советую пробовать распознавать реально отсканированные в 600 dpi книги. Хронически путает в формулах латинское "а" и греческое альфа. Хронически распознаёт запятую как закрывающую скобку. Вы только посмотрите, что он делает с английским предлогом "on" - буква "о" и большой символ дизъюнктного объединения! Естественно, путает курсивный текст с математикой. На последней странице $D_x^{\epsilon_1}\subset D_x^{epsilon_2}$ распознал как $D_{x^1}^{\epsilon}\subset D_{x^2}^{\epsilon}$, т.е. распознал нижние индексы у верхних индексов как верхние у нижних - вот вам и нейронные сети. Вообще иногда путает символы, а также текст и математику. Я распознавал за один раз сразу несколько тиффов - так он зачем-то каждый распознал дважды. Несмотря на мои баг-репорты доктору Сузуке, символы суммы, пересечения, тензорного произведения, пустого множества, многие готические буквы так и не отображаются. С символом бесконечности есть прогресс - в текстовом режиме он отображается, в математическом нет. В своем родном формате iml сохраняет. (Не хватало, чтобы еще и в нем не сохранял! Хотя когда-то и такое было.) В html сохраняет (с формулами в png) - суммы не отображаются тоже. Даже в xml (mathml) сохраняет, но он ИнтернетЭксплорером не читается, зато Мазиллой читается - причем тут суммы уже отображаются. Но ни в tex, ни в human readable tex не сохраняется! Это при том что и его родной latex стоит, и нормальный miktex и еще куча всего. Не знаю, может, кроме того, что прописать переменные среды, надо было еще вокруг него потанцевать с бубном? На самом деле распознаёт лучше, чем можно было ожидать. Кроме шуток! Хотя, конечно, далеко не так идеально, как родные демки - естественно. Хорошо бы пообкатывать на большем числе разных файлов.
|