TelecomUral
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Archivist картинок, которых там по тысяче на том, т.ч. СТ без вариантов | ну почему "без вариантов". Когда-то я сканировал пятитомник "Искусство стран и народов мира", _http://publ.lib.ru/ARCHIVES/S/Sovetskaya_Enciklopediya/_SE.html#0033 кое-что посканил плохо, потом пересканировал по просьбе обработчика, пересканировал тяп-ляп, так обработчик упомянул по этому поводу, что в одном томе более 2500 мелких иллюстраций. И перевыставлять их из-за моих косяков заново, пусть и частично, ему довольно накладно. Так что варианты бывают разные. Я пробовал автосегментер ST и ему не верю. Лажает влёгкую, и вычислить ошибку трудно. Если предварительно готовить сканы, так это сожрёт время. Как ни крути, надёжнее не спеша глазами всё один раз отсмотреть, зоны обозначить, и к этому вопросу не возвращаться. Чем каждый раз тревожиться за конечный результат, запуская автораспознавалку. Если, конечно, результат вообще важен. Где-то есть внятные рекомендации, как заюзать сегментер, чтобы быть уверенным в его работе? Что он берёт, что не берёт в распознавании. Потому что я подсовывал при тестах что ни попадя. И криволинейные рисунки, и завороты, и обрезанные по краю книги. Более-менее уверенно рамка ставится только на беленых страницах с прямоугольной фоткой внутри текстового блока. А это 5% литературы. |