Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Из pdf в текст (doc, txt, html)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6

Открыть новую тему     Написать ответ в эту тему

Margel

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Братва срочно нужен конвертер с PDF на Текст (*.Doc,*.Txt ) !  
 
Кто знает откуда скачать полную версию?????




название темы изменил
/Widok/

Всего записей: 1 | Зарегистр. 30-05-2002 | Отправлено: 12:55 30-05-2002 | Исправлено: vitaly1, 12:16 10-10-2005
snop



local root
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
da i ne polnuu toje neploho
est pdf2doc,no on tolko dlia Palm doc files

Всего записей: 1591 | Зарегистр. 27-04-2002 | Отправлено: 13:18 30-05-2002
Ant



Аналитик
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf. Картинки тоже можно отдельно вытащить. В чем проблема??

Всего записей: 851 | Зарегистр. 26-01-2002 | Отправлено: 14:14 30-05-2002
snop



local root
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ant
thanks,
ia daje i ne podumal chto tak mojet bit

Всего записей: 1591 | Зарегистр. 27-04-2002 | Отправлено: 14:57 30-05-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ant
--------------------------------------------------------------------------------
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf.  
 В чем проблема??  
 --------------------------------------------------------------------------------
проблема вот такая :  
 
Aaei,  anniio aiiia Eiinoeoooeiiiui Noaii  inneeneie Oaaa aoee (Iinoaiiaeaiea io 20 oaa aey 2001 a.   3-I) ii  aei-aa CAI «Ainoieiaooa ano n», ii ao neo eou i eia ii oiai, eae i aaii eiaieoaeuiua i aaiu ia ianoao, iieucoynu ia aoeinou  ii iu iaeiaiaiai caeiiiaaoaeunoaa,  ac aoa o aaei oaeoe anee i iecaieuii, ii naiaio oniio aie . I e eiie oaeiai i iecaiea ii
 
Не знает ли кто  
как это всё  профиксить ???  
( оригинал pdf-документа был по - русски )
 

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 23:45 31-05-2002 | Исправлено: 4567, 23:49 31-05-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4567
1. Попробуй выделить текст и назначить русский шрифт.
2. Посмотри чем создавался документ. Если pdfWriter то, ой. Он русские буквы картинками делает.

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 09:43 01-06-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vserd
1. Попробуй выделить текст и назначить русский шрифт.
2. Посмотри чем создавался документ.

------------------------------------------
 
Что надо сделать я понял !
("назначить" + "чем создавался документ")
 
 
Но как это "назначить" ?
Где посмотреть "чем создавался документ" ?

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 21:05 01-06-2002 | Исправлено: 4567, 21:06 01-06-2002
DiCH



IRC-маньяк...
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Adobe Acrobat (ne Reader). В меню файл выбираешь сохранить как... в списке типов файлов выбираешь rtf. Картинки тоже можно отдельно вытащить. В чем проблема??

А если есть только reader и rtf меня не устраивает?
 
Может есть какие-то утилиты?

Всего записей: 965 | Зарегистр. 13-09-2001 | Отправлено: 23:27 01-06-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DiCH
>>>Может есть какие-то утилиты?  
 
---  
            Плагины для Adobe Acrobat
 
http://www.pdfzone.com/products/software/toolinfo_extract.asp
 
 
BCL Drake v.5.0
Инструмент для конвертации PDF в RTF.
Запуск программы из меню Plugins Acrobat'а.
 
BCL Freebird v.5.0
Инструмент для конвертации PDF в TIFF, JPEG и BMP.
Запуск программы из меню Plugins Acrobat'а.
 
BCL Jade v.5.0
Инструмент вытаскивания содержимого PDF файла в любой текстовый процессор.
Запуск программы из меню Plugins Acrobat'а.
 
BCL Magellan v.5.0
Инструмент для конвертации PDF в HTML.
Запуск программы из меню Plugins Acrobat'а.
http://www.epublishstore.com/details.asp?ProdID=24
 
Crackerjack v.3.2
Плагин для цветной печати.  
 
 
CreoScitex PDF Seps2Comp v.1.5 with S2C Plateview
Плагин для трансформации разрозненных PDF файлов в один.  
 
 
Image Solutions Icopy v.1.2.01
Плагин для работы с графическими PDF файлами.
 
 
Image Solutions ISI Toolbox v.3.1.05
Набор инструментов для создания гипертекстовых ссылок и закладок, копирования текста, таблиц и  
графики из PDF файлов.  
 
 
 
PDF Librarian v.1.01
Плагин превращает PDF документ в архив
 
 
PDF-iT v.4.020
Программа предлагает уникальное решение конвертации большого количества сканированных документов  
в набор PDF файлов.  
 
 
Quite A box of tricks v.1.2h
Плагин для работы с графикой: трасформация в SMYK, градации серого, обрезка и многое другое.
 
 
Quite Imposing Plus v.1.2j
Плагин для конвертирования отдельных страниц в книгу, брошюру и так далее.
 
 
StampPDF v.2.3
Плагин для печати PDF файлов. Водяные знаки, нумерация страниц, ориентация, шапки и многое другое.  
 
 
 

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 14:30 02-06-2002
Klirik



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот здесь ftp://ftp.ogo.ru/pub/cooler.irk.ru/pdftohtml031.zip прога PDF в HTML. Сам не пробовал...  

Всего записей: 1330 | Зарегистр. 02-09-2001 | Отправлено: 15:38 02-06-2002
Dust



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Самый лучший конвертер - гугль.
Находишь нужный пдф, а хатем кликаешь - открыть как HTML

Всего записей: 460 | Зарегистр. 01-03-2002 | Отправлено: 15:47 02-06-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Klirik
 
>------------------------------------------
Вот здесь ftp://ftp.ogo.ru/pub/cooler.irk.ru/pdftohtml031.zip прога PDF в HTML. Сам не пробовал...  
>------------------------------------------

 
Ссылка дохлая или пароль надо !  
тут рабочая (ссылка , а не прога) - первая точно :
 
http://www.filesearch.ru/cgi-bin/s?t=n&q=ftp.medcity.ru/pub/software
ftp://cooler.irk.ru/pdftohtml031.zip
http://www.filesearch.ru/cgi-bin/s?t=n&q=ftp.ssc.nsu.ru/pub/Mirrors/cooler.irk.ru
 
Скачал ... запустил инсталляцию ... чё-то она пропала после этого куда-то  
(антивир проверял - всё ок ) бред короче ... или под XP не катит ...
 
 
 
Dust
--------------------------------------------------------------------------------
Самый лучший конвертер - гугль.  
Находишь нужный пдф, а хатем кликаешь - открыть как HTML

 
--- Ага , лучшая , если PDF на рабочем столе лежит .....  

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 20:17 03-06-2002 | Исправлено: 4567, 20:36 03-06-2002
Klirik



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4567
Да, умерла уже... Но когда постил, я ее проверил, живая была.
А прога досовская, ее с ключами запускать надо, разбираться неохота...

Всего записей: 1330 | Зарегистр. 02-09-2001 | Отправлено: 21:56 03-06-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4567
 
 

Цитата:
Что надо сделать я понял !  
("назначить" + "чем создавался документ")  

 Открываешь в Word  сконвертированный RTF, выбираешь весь текст, назначаешь ему новый шрифт (Надеюсь как поменять шрифт пошагово объяснять не надо?).
 

Цитата:
Где посмотреть "чем создавался документ"  

В Acrobat (неважно каком) FIle->Document info -> General
строчка Producer.

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 09:53 04-06-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vserd
(Надеюсь как поменять шрифт пошагово объяснять не надо?).  
 
---- все шрифты подряд что ли перепробовать :(  ?
их там штук 30 - 40
 
 
>>>Где посмотреть "чем создавался документ"  
--- посмотрел : Acrobat Distiller 4.05 for Windows
--- это чем - нибудь может помочь ? (ни*ига не понимаю )

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 21:32 04-06-2002 | Исправлено: 4567, 21:38 04-06-2002
rammstein



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
FineReader 6.0 могет распознавать PDFины...

Всего записей: 243 | Зарегистр. 22-01-2002 | Отправлено: 22:23 04-06-2002
vserd

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4567

Цитата:
их там штук 30 - 40  

Ну поставь Timies new Roman Cyr, главное чтобы Сyr было.
Либо в свойствах шрифта выставь Кирилица.

Цитата:
Acrobat Distiller  

Это значит, что символы в нем как символы, а не как картинки.  

Всего записей: 2065 | Зарегистр. 08-05-2002 | Отправлено: 09:18 05-06-2002
naPmu3aH



Из лесу вышел
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Короче, всем кому это надо...
PDF2HTML (возможно не тот о котором шла речь выше, а другой) я брал на сайте автора sourceforge.bla-bla-bla.  
Я столкнулся с той же самой проблемой со шрифтами и при копировании/выдираниями другими программами получались закорючки, причем никак в русский не конвертируемые (шрифтами, установкой языка и т.п.).  
Эта прога конвертировала все в HTML без всяких проблем очень быстро, ну разве что в конце каждой строки воткнула <BR>, что конвертировалось в "ручной конец параграфа", когда я открыл этот HTML в Word'е. Вроде у нее есть режим конвертирования с доставанием картинок, но у меня был PDF чисто текстовый, так что я не совсем в курсе...
Вот ссылка: http://prdownloads.sourceforge.net/pdftohtml/pdftohtml_0_33a-win32.zip, но все же советую сходить на сайт - возможны новые версии (о которых кстати можно тут и сообщить)
 

Всего записей: 4642 | Зарегистр. 30-10-2001 | Отправлено: 22:24 05-06-2002 | Исправлено: naPmu3aH, 22:28 05-06-2002
4567



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
naPmu3aH
 

Цитата:
Короче, всем кому это надо...  

-- Мне очень-очень надо ...  
я УЖе ненавижу PDF !!!
 

Цитата:
>>>>Вот ссылка: >>> http://prdownloads.sourceforge.net/pdftohtml/pdftohtml_0_33a-win32.zip

--- вот результат :
   
 
архив - битый ...
 
 

Цитата:
все же советую сходить на сайт - возможны новые версии

--- И чё тут скачать ??? (см ниже )
-- ближе к делу я по указанному адресу ничего не смог открыть ...
 
 

Цитата:
Current Directory: http://prdownloads.sourceforge.net/ pdftohtml/  
File Name Size Date  
 -- Parent Directory -- - Jun 06, 2002 11:04  
 horde.zip                     134 kb Feb 21, 2002 21:03  
 pdftohtml-0-32.tar.gz   250 kb Feb 22, 2002 00:19  
 pdftohtml-033.zip        229 kb Apr 20, 2002 18:19  
 pdftohtml032a-win.zip  201 kb Mar 05, 2002 13:14  
 pdftohtml032b-win.zip  349 kb Mar 21, 2002 15:06  
 pdftohtml033.zip          220 kb Apr 20, 2002 18:17  
 pdftohtml_0.32b-1_i386.deb 346 kb Apr 13, 2002 12:11  
 pdftohtml_033.zip        229 kb Apr 20, 2002 18:22  
 pdftohtml_0_32.tar.gz   250 kb Feb 21, 2002 23:59  
 pdftohtml_0_32a.exe    372 kb Feb 25, 2002 14:13  
 pdftohtml_0_32a.tar.gz 234 kb Feb 22, 2002 12:54  
 pdftohtml_0_32b.tar.gz 234 kb Mar 17, 2002 00:38  
 pdftohtml_0_33.tar.gz   233 kb Apr 20, 2002 18:15  
 pdftohtml_0_33a-win32.zip 230 kb Apr 21, 2002 20:02  
 pdftohtml_0_33a.tar.gz  232 kb Apr 21, 2002 15:35  
 

 
 
 
rammstein
--------------------------------------------------------------------------------
FineReader 6.0 могет распознавать PDFины...  
--------------------------------------------------------------------------------
 
--- Ну один раз распознает ... ну другой .. а дальше ?  
---Да и не люблю я Файн редер из реестра после удаления выковыривать ....
---Нет , хочется проще чего - нибудь , универсальное , независимое от исходного шрифта в оригинальном документе .
 
 
 
Добавлено
Вот нашёл онлайновый конвертер :
http://access.adobe.com/simple_form.html
 
&'$ департамента налогов и права фирмы &'$  
 !"#$%&'$  
()*+,-     . '  ' /&      
&&   /      0&/1 / 2  /3 .................................
 
 
но даже он глючит со шрифтами ... видно не судьба ...

Всего записей: 390 | Зарегистр. 08-02-2002 | Отправлено: 21:27 06-06-2002 | Исправлено: 4567, 00:53 07-06-2002
naPmu3aHka



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4567

Цитата:
архив - битый ...

Уупс... Извини. Этот линк - на самом деле страница по выбору зеркала для скачки (такая вот у них там дебильная система)
Правильный линк (и ответ на второй вопрос) вот:
http://telia.dl.sourceforge.net/sourceforge/pdftohtml/pdftohtml_0_33a-win32.zip

Всего записей: 132 | Зарегистр. 20-02-2002 | Отправлено: 01:54 07-06-2002
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6

Компьютерный форум Ru.Board » Компьютеры » Программы » Из pdf в текст (doc, txt, html)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru