Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Помогите вытащить формулы из *.pdf файла!

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

DNA DAN



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Текст нормально копируется из Acrobat Reader'а - а вот вместо формул всякая абракадабра!!!
что делать??
Люди - Help - формулы позарез нужно выдрать и отредактировать(В вордовском Math Type)!!!

Всего записей: 158 | Зарегистр. 29-09-2001 | Отправлено: 21:50 07-06-2002
vengr



Рафинированный Теоретик
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
DNA DAN
Acrobat (не Reader) немного лучше копирует.
 
но думаю, надо искать конвертор.

Всего записей: 3579 | Зарегистр. 21-08-2001 | Отправлено: 01:40 08-06-2002
lucky



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DNA DAN,
если те в граffiческой форме надо, то мОжу предложить "быструю" операцию
2 раза подряд стукни по кнопке "Print" - должен произойти сброс экрана в буфер обмена, потом Ctrl+V в любом граф.редахтуре и вырежи. А потом как графику вставляй в Word =)
С редактированием, правда, не прокатит =(

----------
я буйный, но прикидываюсь тихим
ага.... и фигачу свой старый проектег Лунная База

Всего записей: 675 | Зарегистр. 10-04-2002 | Отправлено: 04:25 08-06-2002 | Исправлено: lucky, 04:27 08-06-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Скорей всего никак.  
Т.к. формула это сложный объект со всякими извратами, и ты можешь ее нарисовать (засунуть в PDF), а вытянуть врядли, т.к. это просто набор управляющих кодов для формирования изображения на принтере. И конвертору не определить что кончился текст, и началась формула (особенно если она шестиэтажная). Так что действуй по методе lucky или перебирай ручками. :(

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 09:51 08-06-2002
DNA DAN



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот то что я имею в акробате:
 
   
 
Не правда ли формулы сильно смахивают на MathTyp'овские из Ворда?
они в Reader'е выделяются даже не так как картинки(т.е. целиком), а по отдельным буквам и знакам!
Не может быть чтобы они обратно не могли вернуться в ворд!!!

Всего записей: 158 | Зарегистр. 29-09-2001 | Отправлено: 12:20 08-06-2002 | Исправлено: DNA DAN, 12:28 08-06-2002
oio



Дочкин папа
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DNA DAN

Цитата:
Не может быть чтобы они обратно не могли вернуться в ворд

Обратно в ворд, да ещё как мастайп они уже никогда не вернутся... Посимвольно - тоже без мазы - сам такой фигнёй маялся с месяц...
Только как битмап (в смысле растр).

Всего записей: 1635 | Зарегистр. 01-02-2002 | Отправлено: 13:01 08-06-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да там скорей всего и набиралось, хотя может какой нибудь PageMaker тоже нельзя исключать.
 
PDF это просто скомпилированный PostScript, который в свою очередь предназначен для вывода на печать очень сложных текстов. Принтер их обрабатывает, и рисует их на бумаге.
Т.е. для  двух этажной формулы x/y, это сивол х, затем некий промежуток, затем линия, затем некий промежуток, затем символ y.
При засовывании их в pdf, сформировать как обыкновенные символы (заданного шрифта, с необходимыми директивами) непредставляет труда, а вот вытащить их обратно, да еще в OLE-объект MathType, да еще в правильной последовательности (со всеми верхними/нижними индексами, подчеркиваниями, спец. символами) задача для конвертора очень не простая.  
Если кто-то и создал такой конвертор, то стоить он будет очень дорого.

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 13:17 08-06-2002
Advanced_Guest



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DNA DAN
А кто тебе мешает заново их вручную ввести В вордовский Math Type ?
 
IMHO - будет гораздо проще

----------
The Abyss - UO, LA2, Ботва, BSFG

Всего записей: 2446 | Зарегистр. 14-04-2002 | Отправлено: 16:13 08-06-2002
DNA DAN



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Advanced_Guest
Да мешает та уйма времени которая уйдет на это заново-вбивание их в MathType с нуля...

Всего записей: 158 | Зарегистр. 29-09-2001 | Отправлено: 23:25 09-06-2002
Uncle KILLER



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DNA DAN, а если так: выдергиваешь их плугинами к Акробат Ридеру как картинки, а потом распознаешь в OCR-системе какой-нибудь?

Всего записей: 6501 | Зарегистр. 01-04-2002 | Отправлено: 02:55 10-06-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uncle KILLER
Чем распознавание формул через OCR отличается от вытягивания их сразу через конвертер?  
Ответ ничем. Т.к. создатель OCR врядли будет мучатся с созданием OLE объекта MatchType.
DNA DAN
Неужели тебе нужно их все перенабирать? ведь это специализированный текст, и формулы там, в разных источниках, везде одинаковые, перенабирай только те, котрые нужно править.

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 09:31 10-06-2002
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Программы » Помогите вытащить формулы из *.pdf файла!


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru