Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Как зашумить PDF, затруднив распознование

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

Vladlp



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Когда-то в инете видел пример программы (может скрипта уже непомню)  на примере картинок. Суть была в том что страница с текстом зашумлялась, шрифт корябился, изменялись  межбуквинные растояния, кривились строчки... вообщем делалось все возможное что бы возможное будущее распознование  было как можно более геморойно, но при этом документ оставался читабельным для глаз.
 
Есть проблема в том что надо начальству для отчетности приложить кое-какие результаты в PDF, и очень не хочется что бы оно потом могло их безгоморно скозлить и использовать.
 
Если нет готового софта, может кто когда сталкивался и есть наработки как добится такого результата допустим PDF->TIFF->усердно фильтруем (допустим в Photoshop) ->TIFF->PDF. ну или что-то подобное, главное идея и фильтры - а скрипт уже и сам наваяьб могу

Всего записей: 549 | Зарегистр. 10-01-2003 | Отправлено: 17:10 19-12-2006
DiMaS_2006



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Ты на верном пути. фотошоп (9-й по крайней мере) сразу умеет импортировать pdf. Фильтр почти любой пойдет - эффект отличный. Сам пробовал.

Всего записей: 523 | Зарегистр. 01-08-2006 | Отправлено: 17:58 19-12-2006
Vladlp



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DiMaS_2006
а можно поподробней какими конкретно фильтрами пробовал, что б мне не перебирать все подряд
спасибо

Всего записей: 549 | Зарегистр. 10-01-2003 | Отправлено: 18:27 19-12-2006
DiMaS_2006



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Vladlp
Я использовал сначала размытие по гауссу, затем добавление шума. Вот только интенсивность надо подбирать вручную, это зависит от текста.

Всего записей: 523 | Зарегистр. 01-08-2006 | Отправлено: 16:11 29-12-2006
Vladlp



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я использовал сначала размытие по гауссу, затем добавление шума. Вот только интенсивность надо подбирать вручную, это зависит от текста.  

слабовато... если не перебарщивать оставляя текст читабильным - то файнридер (да и новый адоб 8 проф) справляется с достаточно малым кол-вом ошибок

Всего записей: 549 | Зарегистр. 10-01-2003 | Отправлено: 18:42 13-02-2007
promo2003



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Vladlp, пробегись по тексту в шопе фильтром Liquify... покорёжится он в завасимости от настроек так, что ни один FR не прочитает.

Всего записей: 201 | Зарегистр. 24-01-2007 | Отправлено: 19:43 13-02-2007
Vladlp



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
promo2003
спасибо за идею... попробую на днях автоматизировать процесс. Попробую добиться результатов что бы и выглядело прилично (ну вроде как так и надо и ничего плохо с докуметом не делалось;) )  и при этом кол-во ошибок распознавания зашкаливало;)
 

Всего записей: 549 | Зарегистр. 10-01-2003 | Отправлено: 22:31 13-02-2007
Kommunist

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Лучший способ, по качеству.
 
1. Распечатать книгу
2. Сбрушировать страницы в книгу.  
3. Сфотографировать камерой мобильника 2 MP или с большей матрицей.
 
Если фотографировать не сшивая в книгу, то листы будут ровные и искажений будет не очень много. А когда книга, будет хорошо

Всего записей: 1919 | Зарегистр. 02-03-2003 | Отправлено: 23:52 15-02-2007 | Исправлено: Kommunist, 23:52 15-02-2007
Aleha88



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На месте начальства я бы указал вам принести информацию в формате doc (rtf), а наиболее важные параметры (если возможно) продублировать в txt.
Чтобы сложнее было зашумить

Всего записей: 426 | Зарегистр. 19-10-2006 | Отправлено: 02:50 02-04-2007
Vladlp



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нашел неплохое решение - плашин для шопа Alien Skin Xenofex. Эфект - Crumple. Если выбрать положение истоничка света 90, 90 то практически не будет тени, зато сам текст можно курочить как хочеш.  
В последнее время правда OCR стали значительно лучше с покаребанным текстом работать... но всеравно иногда бывает надо.
надеюсь данная инфа будет полезной

Всего записей: 549 | Зарегистр. 10-01-2003 | Отправлено: 03:27 22-11-2007
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » Как зашумить PDF, затруднив распознование


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru