Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертация Word-TXT

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2

Открыть новую тему     Написать ответ в эту тему

vse



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто знает как быстро сконвертировать много файлов из word 2000 и xp в обычный текст. Обычный способ "Сохранить как" не подходит так как файлов очень много!!!

Всего записей: 98 | Зарегистр. 08-12-2001 | Отправлено: 16:23 24-04-2003
Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vse
http://forum.ru-board.com/forums.cgi?action=filter&forum=5&filterby=topictitle&word=doc

----------
Тень превращается в фантазии, таящиеся в глубине вашей души.
Пока идёшь ты среди теней, да не будет зла с тобой.

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 16:40 24-04-2003
vse



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Извини, ничего не нашел.

Всего записей: 98 | Зарегистр. 08-12-2001 | Отправлено: 17:11 24-04-2003
gera serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Макрос напиши в ворде и повесь на копку

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 18:02 24-04-2003
stass10



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня около 300 файликов в формате *.txt
 
существует ли способ их слить в один
не открывая каждый...?

Всего записей: 1313 | Зарегистр. 20-01-2003 | Отправлено: 18:48 30-12-2003
tumber

Друг
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
stass10
В командной строке командой copy file1 + file2 + file3 + file4 + ... outfile
Например, в FAR или NC имя файла сбрасывается в строку клавишами Ctrl+Enter.
Так как длина командной строки ограничена, придется делать это в несколько приемов.
Например, сливаешь по 20 файлов, а потом сливаешь получившиеся файлы-результаты.
 
Добавлено
А еще проще - в WinRAR указать Метод сжатия - Без сжатия, а потом подчистить начало и конец получившегося архива.
Правда, порядок следования файлов в первом случае ты сам задаешь, а как это сделает WinRAR - не знаю.
 
И еще - чтобы каждый файл начинался с новой строки, надо, чтобы предыдущий заканчивался переводом строки.
 
Добавлено
Насчет WinRAR - к сожалению, не пройдет, для архивации многих файлов придется править еще и стыки между ними. Остается - copy.

Всего записей: 2707 | Зарегистр. 13-09-2002 | Отправлено: 19:13 30-12-2003 | Исправлено: tumber, 19:23 30-12-2003
Dinxor

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
stass10
Кроме copy можно применить команду type
Сначала формируешь список файлов, например командой  
dir /b /on | find /i ".txt" > list.bat
потом редактируешь полученный файл чтобы в каждой строке было
type filename.txt >> output.txt
Редактировать батник удобно в текстовом редакторе поддерживающем поиск/замену сразу по всему файлу (я использую UltraEdit)
После запускаешь батник и получаешь файл output.txt
Могут быть проблеммы с кодировкой, но это легко решается. А так метод наиболее быстрый.

Всего записей: 406 | Зарегистр. 17-09-2003 | Отправлено: 01:16 04-01-2004 | Исправлено: Dinxor, 21:56 04-01-2004
gera_serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vse
поищи ABC Text Converter
 

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 14:03 05-01-2004
MetroidZ



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vse
В TC выделяешь все txt файлы.
Меню Файл Групповое переименование
добиваешся того, чтобы
все файлы имели название
 
anekdot.001
anekdot.002
anekdot.003
anekdot.004
...
anekdot.996
 
далее выбери anekdot.001 и
Меню Файл/Склеить файлы
получится один большой файл.
Затем этот файл хоть в Word...

Всего записей: 1795 | Зарегистр. 12-07-2003 | Отправлено: 17:49 05-01-2004
gera_serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может поговорим о преимуществах шипованной резины?
Вопрос же был:
>Кто знает как быстро сконвертировать много файлов из word 2000 и xp в обычный текст
Так какая утилита обработает папку с сотнями вордовых файлов в обычный текст?

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 18:52 05-01-2004
MetroidZ



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так какая утилита обработает папку с сотнями вордовых файлов в обычный текст?

 
_http://www.metroidz.narod.ru/DOC2TXT.rar
 
DOC2TXT
Программа конвертирования файлов Word в текст.
Просто бросайте нужный файл (или группу файлов)
на нижнюю часть формы. Должен быть установлен Word.
Тестировалось на W2000Rus SP3 + WordXP
 
Если что не работает или ещё что нибудь пишите.

Всего записей: 1795 | Зарегистр. 12-07-2003 | Отправлено: 23:32 05-01-2004 | Исправлено: MetroidZ, 23:35 05-01-2004
gera_serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тем кто любит немного напрячь мозги - есть такой проект - Antiword
http://www.winfield.demon.nl/index.html
версии (кроме прочих операционных систем) для DOS и Win из коммандной строки, bat- файла, скрипта, своей программы ... позволяют сконвертировать вордовый файл в простой текст с минимальными потерями (сам WORD не нужен!)  
Немного о потерях. Например сам Word, выгружая в простой текст, напрочь забывает о тексте в колонтитулах страниц.  
Перед использованием любого конвертора стоит проверить, не теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок...  А потом решить - не оставить ли все как есть

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 13:45 06-01-2004
MetroidZ



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gera_serg
конвертация DOC файлов естественно приведёт к некоторым потерям. Например рисунки уж точно вылетят. Но иногда DOC файлы простые и легко переносятся в текст.
DOC2TXT обрабатывает хоть сотни файлов сразу. Она только для этого и предназначена. Пока она конвертирует в txt и очень простая.
Но есть возможность переделать и в html rtf dostext и другие, которые есть в Word.

Всего записей: 1795 | Зарегистр. 12-07-2003 | Отправлено: 14:39 06-01-2004
gera_serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MetroidZ
Я понимаю, что работа неблагодарная разгребать все навороты ворда, а использованием стандартных библиотек MS не обойдешься без потерь.
Теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок, объединенных ячеек таблиц, таблиц в таблице...?
Получается ли (при твоей возможности) на выходе html, который реально далее редактировать простыми редакторами?
 
Хотелось бы найти утилиту, которая могла бы выгрузить, не теряя из ворда отдельно ВСЮ текстовую информацию в txt, а все внедренные картинки, например, в tiff.
 

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 18:52 06-01-2004
MetroidZ



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gera_serg

Цитата:
ВСЮ текстовую информацию в txt, а все внедренные картинки, например, в tiff.

 
случаем не в полиграфии работаешь :)
А по идее  html должен получится редактируемый другими редакторами. Не знаю только как удобнее сделать. Сейчас просто все файлы Word конвертируются в TXT с названием которое получается из исходного , с прибавлением ".txt".
Утилитку за короткое время сделал. Особо не смотрел сложные тексты. Но она точно так же всё делает, как и Word.
 

Цитата:
Теряется ли текст из примечаний, колонтитулов, рамок с текстом, сносок, объединенных ячеек таблиц, таблиц в таблице...?

что то не вижу, для чего может такое пригодится. Может на самом деле оставить тогда Doc/Rtf ?
А разве ABC Text Converter нельзя для этого приспособить?

Всего записей: 1795 | Зарегистр. 12-07-2003 | Отправлено: 19:02 06-01-2004
gera_serg

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MetroidZ
> случаем не в полиграфии работаешь
бывают работы связанные с ней
вот нашел утилиту которая максимально пытается выдрать зажатые картинки (лучше чем принтскрин с ворда)
 
Антиворд старается максимально выгрузить текст, но не любит имен файлов с пробелами в имени, а DOS версия требует имена 8+3, что неудобно для современной пакетной обработки
 
HTML выгруженный средствам 97 винворда и 2000 ворда очень различен для дальнейшего подредактирования.
у 2000 приоритет внешний вид документа, у 97 более простой код html  
 
ABC Amber Text конвертеру тож не плохо заранее сказать с каким форматом ворда он имеет дело
 
Я не отметаю все эти решения, просто стараюсь относиться к ним с заметной степенью острожности

Всего записей: 788 | Зарегистр. 24-07-2002 | Отправлено: 19:45 06-01-2004
surgutfred



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
MetroidZ
DOC2TXT - робит по принципу drag@drop, а шоб из консоли запускалось? Знает кто?
Нихочу мышкой таскать. Хочу батник сделать, что бы в текущий папке из всех doc и rtf
сделал тхт с такими же именами.

Всего записей: 589 | Зарегистр. 21-08-2001 | Отправлено: 13:03 20-02-2007
eshil

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
surgutfred
Попробуй программу ZD2T консольная, сделает все, что хочешь. Автор Zmiy.

Всего записей: 67 | Зарегистр. 29-03-2003 | Отправлено: 13:49 20-02-2007
domo22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, какой программой сконвертировать файл DOC или RTF в EXE - т.е. чтобы было постраничное слайд-шоу без использования других сторонних программ. Или хотя бы сначала файл DOC или RTF в картинки, а картинки уже можно как-то потом собрать в слайд-шоу.

Всего записей: 428 | Зарегистр. 03-04-2007 | Отправлено: 17:28 19-01-2009
Liya

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ultra_Document_Text.Converter извлекает простой текст из файлов - даже пакетно.
 
Ultra Document To Text Converter converts PDF, Rich text (*.RTF),  
  Word document (*.DOC), Powerpoint file (*.PPT), Excel spreadsheet  
  (*.XLS), Web pages (*.HTML, *.HTM) and MHT files to text in batch.  
   
You don't need to have PDF reader or Office application installed.  
  Just add the PDF, RTF, DOC, PPT, XLS, HTML and MHT files to the list  
  and click "Convert" button. The text will be automatically extracted  
  quickly  
 
Добавлено:
Возможно, к этой программе придется добавить другую: TXT Collector прекрасно объединяет все txt-файлы в указанной папке.

Всего записей: 114 | Зарегистр. 26-11-2003 | Отправлено: 12:46 01-02-2009
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2

Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертация Word-TXT


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru