Braintank
Junior Member | Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Цитата: ИМХО очень хорошая программа, аналогов лучшего качества я не видел. Интерфейс очень своеобразный, но на безрыбье... | И рыбу раком? Да, есть такое понятие в тюремной психологии — компенсаторный гомосексуализм. Однако при наличии выбора большинство заключённых всё же придерживаются традиционной ориентации. Я не сравнивал FR с конкурентами. В сравнении с его собственной версией 1.0 качество распознавания возросло в разы, однако если сравнивать уже с 4.0, то… я бы сказал, что разница не так уж и разительна. Оно и в четвёрке (ещё в четвёрке!) было достаточно хорошим (на то время, кажется, лучшим в мире). Только с тех пор утекло немало воды, и что считалось нормальным под Windows 95 как-то иначе воспринимается под Windows 7. Распознаванием-то дело не ограничивается, есть ещё предварительная работа с оригиналом и постредактирование… Цитата: А что со сложными документами? Да, может подвести автоматическое разбиение страницы на разные типы блоков - находит таблицы и картинки там где их нет или лепит текстовые блоки на мусор. Но если выделить блоки вручную то результат хороший. | Во-первых, это не сложный документ, а всего лишь сложный макет. Но даже ручная работа с макетом и даже в последней, 10 версии сделана дилетантски — специалист по UX туда и не заглядывал (впрочем, он вряд ли когда-либо посещал даже территорию ABBYY). Во-вторых, сложные документы могут содержать посредственные таблицы, набранные гарнитурой старого стиля, текст на разных языках со включением иноязычных слов, специальные символы, отсутствующие на клавиатуре и расположенные в разных блоках Юникода… А там и в 2011 году невозможно ни отобрать произвольный набор символов для замены, ни привести в порядок стили, созданные просто бредовыми алгоритмами. Цитата: С книгами и любыми печатаными документами файнридер справляется. | Когда распознают романы с примитивным набором? На ура и запросто. Если печать и скан хорошие. А вы попробуйте распознать «Иностранные имена и названия в русском тексте» Гиляревского. Или «Памятную книгу редактора» Мильчина (исключая из области распознавания то, что распознавать не следует, но оставляя то, что нужно). Чтоб долго не объяснять на пальцах… Кстати, офтопик это. Добавлено: Цитата: Источниками сведений не поделишься? А то как-то голословно, понимаешь | Личные наблюдения и практический опыт примерно с первой половины 90-х и по настоящее время. Так что источник — я. Лично мне этого достаточно, а кому мало, может опираться на собственные знания об этом мире. Добавлено: Цитата: Braintank, а мультитран не пробовали? | Я не просто так писал выше, что Lingvo — наименее дрянной из имеющихся на рынке словарей. Я им пользуюсь не потому, что он особенно пригоден для работы, а потому, что остальные не пригодны никак. Где-то году в 2004 или 2005 я начал с того, что отправился на одну из последних всероссийских выставок ПО как раз на предмет поговорить на стендах с представителями ABBYY и «Мультитрана». Lingvo тогда у меня уже давно был куплен, и я как раз искал, на что бы его сменять… Так вот, на стенде я задал Поминову один вопрос: не сочтите за оскорбление, но состояние вашего сайта просто вынуждает уточнить — какая кодировка используется в настольной коммерческой версии словаря? Понял меня Помидоров не сразу, но таки сообщил, что и в первом десятилетии XXI века его лингвистический (sic!) программный продукт хранит словарные данные в 8-разрядной кодировке. Нет, не UTF-8. В соответствующих кодовых страницах Windows. Впрочем, если бы я раньше прочитал историю создания словаря, ответ меня удивил бы меньше. Пробовать такое просто не имеет смысла: сей товар предназначен для публики, которая собирается в его форуме. Да почиет в мире. | Всего записей: 188 | Зарегистр. 12-10-2006 | Отправлено: 18:44 08-06-2011 | Исправлено: Braintank, 19:08 08-06-2011 |
|