Highlander_2
Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору zvezdochiot, Цитата: Ничего сложного в принципе в ST (независимо от разновидности) нет и не было никогда. Никакого АИ (и соответственно, логики). Схема определения границ проще не придумаешь: порог Otsu -> грубый despeckle -> обрезка белого до "содержимого". Учитывая, что despeckle в ST реализован через карту связности, то он не то что запятые, а целые слова способен сносить, ежели эти слова удалены от общего контекста. На данный момент ни в одной из разновидностей ST данный набор действий не регулируем. Почему не регулируем? Потому что проще сразу подправить границы ручками, чем долго и упорно подбирать параметры, после чего опять подправлять ручками, но уже другие страницы. | Так я и не понимаю. Две одинаковые страницы. На каких-то сабж захватывает корректно область, включая нумерацию, в других игнорит. Я вот и пытался выявиться закономерность от чего подобное выходит. https://i.postimg.cc/cHTMxYkx/15-08-2023-150555.png yozhic, все верно, не спорю. Но, если бы речь допустим о книге объемом 200-300 стр, ладно бы еще. Но когда возникает необходимость обработать книги по 600-900 стр, тут эти нюансы предстают действительно существенными. | Всего записей: 224 | Зарегистр. 19-05-2017 | Отправлено: 07:29 16-08-2023 | Исправлено: Highlander_2, 07:32 16-08-2023 |
|