Alex1234444a
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Позже соберу под 32, пока времени нет, объяснять как собирать еще дольше. Вообще планирую доработать ST для своих нужд: 1. Новый алгоритм бинаризации для корректной обработки сканов с неравномерной освещенностью или картинками в сером (метод Оцу с динамическим порогом). 2. Новый режим вывода в ST для сложных книг и журналов ClearColor (удаление только фона с мусором и артефактами, сохраняя все картинки и цветной текст). Что-то похожее на MagickColors из проги CamScan под андроид. Затем это надо будет экспортировать в FineReader для создания PDF с MRC, где уже FineReader с помощью OCR сам найдет тест и бинаризует его для одного из слоев MRC. Придется писать прогу для выдергивания текта и картинок из такого PDF для обработки и обратного внедрения. 3. Новый, более точный алгоритм для распознование контента. (щас некоторые элементы теряются, приходится тратить время на корректировку) Новые алгоритмы будут работать дольше, но результат будет намного лучше, ибо все ручками править не айс. Но это на будущее. Щас возникла необходимость пилить прогу для автоматической проверки результатов Adobe ClearScan на основе метода скелетного сравнения ч/б изображений, а то он зажовывает некоторые элементы и иногда искажает ч/б картинки и формулы. |