Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Как большой текст из Word правильнее отверстать в HTML?

Модерирует : Cheery

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

vell



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть большой текст, набран в Word'e его надо опубликовать на сайте.
При переносе просто текстом, теряется разбиенеи на абзацы, выравнивание по ширине. Если экспортировать из ворда штатным сохранение в "Веб-файл" сам ворд обавляет кучу всякой лабуды, которую я удаляю, но форматирование все равно не такое как долно быть: опять теряются красные строки, причем не все, абзацы по-другому выглядят.
В общем, как правильнее и лучше-то делать?

Всего записей: 579 | Зарегистр. 06-10-2004 | Отправлено: 19:05 23-12-2020
Xant1k



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ходит слух, что у матёрых веб-мастеров держателей статейников с сёрча есть волшебные скрипты которые всё это дело преобразуют и очищают.
 
Я бы и сам не отказался
 
Добавлено:
Если что-то найдёшь, чирикни в личку=)

Всего записей: 2918 | Зарегистр. 20-02-2009 | Отправлено: 20:38 23-12-2020
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell

Цитата:
В общем, как правильнее и лучше-то делать?

https://word2cleanhtml.com/
https://html-cleaner.com/
и так далее

Всего записей: 11636 | Зарегистр. 20-09-2014 | Отправлено: 23:04 23-12-2020
Xant1k



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
mammoth
https://pypi.org/project/mammoth/
https://github.com/mwilliamson/python-mammoth

Всего записей: 2918 | Зарегистр. 20-02-2009 | Отправлено: 06:31 24-12-2020
vell



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Mavrikii
первая ссылка не плохо справилась, но загвоздка в том, что в ворде под форматирование листа А4 много переносов строк (служебные символы CR LF)  
Их как-то адекватно можно почистить? Ну кроме тупой замены на пробел, скажем.
 
Вторая ссылка хорошо справилась с переносами, но не справилась со списками, вернее их понадобавляла, а они не нужны, потому что там прямая речь, а не пункты.

Всего записей: 579 | Зарегистр. 06-10-2004 | Отправлено: 10:50 24-12-2020 | Исправлено: vell, 10:56 24-12-2020
Mavrikii

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vell
выложите пример word файла.

Цитата:
что в ворде под форматирование листа А4 много переносов строк

не должно быть лишних, не созданных вручную.

Всего записей: 11636 | Зарегистр. 20-09-2014 | Отправлено: 00:06 29-12-2020
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Интернет » В помощь вебмастеру » Как большой текст из Word правильнее отверстать в HTML?


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru