Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертер *.doc -> *html с сохранением только нужных тего

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
- Имеется некоторое множество текстов в формате *.doc;
- Эти тексты необходимо опубликовать на некотором количестве ресурсов, по возможности сохранив оригинальное форматирование;
- Владелцы каждого из ресурсов предъявляют свои особые требования к форматированию. В основном требования связаны с поддержкой тех или иных тегов: одни поддерживают только <b> и <br>; другие - <b>, <i>; третьи - вообще не поддерживают тегов (т.е. жирный шрифт, к примеру, желательно было бы заменить на прописные буквы) и т.п..
 
Вопрос: как можно оптимизировать процесс пакетного форматирования при условии, что как текстов, так и ресурсов достаточно много?
 
Данный вопрос я разбил на два подвопроса:
1. Какой текст обрабатывать: оригинальный вордовский, предварительно написав достаточно гибкий макрос (уже начинаю писать) или конвертировать оригинальный текст в html, а из него уже вычищать все теги, кроме необходимых (есть ли html-редакторы с такими возможностями?).
2. Возможна ли пакетная конвертация/форматирование?
 
Заранее благодарен за любую помощь.

----------
пропадет-растает

Всего записей: 6814 | Зарегистр. 21-09-2002 | Отправлено: 21:28 29-08-2004
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите хотя бы наиболее удачный html-редактор для этого дела

Всего записей: 6814 | Зарегистр. 21-09-2002 | Отправлено: 16:08 30-08-2004
Khotckevich



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1.

Цитата:
 
Doc2HTML - плагин к текстовому процессору MS Word , выполняющий конвертацию загруженного документа в формат HTML 4.0 .Не используется стандартное микрософтовское решение , поэтому в отличие от встроенных средств ,данный конвертер не применяет излишние и нестандартные теги и генерирует читаемый html-код небольшого размера с таблицей используемых в документе стилей. Текущая версия сохраняет следующие элементы форматирования: у шрифта - размер , жирность , подчеркивание , цвет(приблизительно) , наклон , имя , верхние и нижние индексы , перечеркивание и др.;для структурных элементов - картинки и OLE-объекты в потоке текста (без свободной привязки), таблицы(кроме некоторых особых случаев) , списки(простые) , параграфы(с сохранением выравнивания, отступов, частично - параметров положения на странице ) , заголовки , гиперссылки. Корректно обрабатываются русские буквы(по идее должны корректно обрабатвываться любые буквы при любой текущей системной кодовой странице). Исходный документ остается в неприкосновенности.
 

 
2.
Где-то (уже не помню где, читал про программку TextPipe

Всего записей: 394 | Зарегистр. 07-04-2003 | Отправлено: 20:44 07-10-2004
memo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NoteRepad - небольшой, простой, халявный: RTF->HTML

Всего записей: 663 | Зарегистр. 10-08-2004 | Отправлено: 00:52 29-05-2005
8AleX8



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://spectator.ru/technology/html/word_to_html
http://tidy.sourceforge.net/
 
Добавлено:
http://tidy.sourceforge.net/docs/quickref.html#word-2000

Всего записей: 1813 | Зарегистр. 11-12-2001 | Отправлено: 04:01 09-07-2005
memo



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NoteRepad - с забега снимается, там троян New.Malware.y
 
Добавлено:
8AleX8
 

Цитата:
http://spectator.ru/technology/html/word_to_html

 
Только для MS Office 2000 - не актуально
 

Цитата:
http://tidy.sourceforge.net/  
http://tidy.sourceforge.net/docs/quickref.html#word-2000

 
Что это такое и как работает разобрать не удалось, во всяком случае это никак не конвертер. Какая-то фигня для унификации чтоли...
 
 

Всего записей: 663 | Зарегистр. 10-08-2004 | Отправлено: 21:58 15-02-2006
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертер *.doc -> *html с сохранением только нужных тего


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru