Alexey_Gawrilow
Advanced Member | Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору tanaseduard Цитата: Определить пустая страница или на ней есть текст. | Конвертируешь в монохром. Строишь гистаграмму. Определяешь % соотношение. Добавлено: Цитата: когда дали пустую страницу он на ней что то даже нашел | Буквы из распознанного получаются? значит текст есть. OCR Это много математики. OCR от WinSoft, это насколько помню, обвязка на Tesseract. Tesseract сам по себе из свободных - неплох. Cognitive отдавала свой движок распознавания сообществу. FineReader - имеет COM/OLE интерфейс. Добавлено: tanaseduard поставке с Windows уже давно идет OCR-IFilter для MS-продуктов, поддерживающих поиск и индексацию. http://en.wikipedia.org/wiki/Windows_Search http://windows.microsoft.com/en-us/windows7/products/features/windows-search |