Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертер txt-utf8 в rtf из командной строки

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите конвертер из txt в кодировке юникод в rtf или doc(docx) из командной строки (можно не консольную но с пакетной обработкой).  
Word что-то некоторые буквы не корректно кодирует, поэтому пришлось озаботится поиском проги.  
Многие не понимают utf8 и тупо крякозябры в конечном файле. А некоторые масадонты - такие как pandoc, наоборот кодируют слишком "хорошо". По доброте душевной  преобразуют все html-тэги в текст, а этого не нужно делать.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 02:03 14-06-2020 | Исправлено: Maz, 09:20 15-06-2020
Inoz2000



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вы хотите конвертировать txt, тогда о каких html тегах идёт речь? Определитесь.

Всего записей: 4891 | Зарегистр. 23-04-2009 | Отправлено: 05:52 14-06-2020
Fenrizz



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
https://www.coolutils.com/TXT-to-RTF-In-Batch
 
Или написать макрос на VBScript для Word-а, типа такого https://www.cyberforum.ru/vbscript-wsh/thread1988790.html

Всего записей: 677 | Зарегистр. 12-09-2017 | Отправлено: 06:12 14-06-2020 | Исправлено: Fenrizz, 06:29 14-06-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll,
для какой ОС?

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 09:57 14-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Inoz2000 В txt и базы данных хранят. В чем проблема что у меня там присутствуют некоторые html теги среди текста?
Fenrizz Total Doc Converter я пробовал. С ним та же беда что и с pandoc - он теги убирает.
Может и можно настроить, но там мануал надо пару дней курить.
Скрипт для Word-а не вариант, т.к. сам ворд и глючит иногда: некоторые буквы не корректно кодирует, когда utf8 кодировка. И из-за этого ошибки в словах (т.е. ворд не воспринимает слово целиком). Изредка бывает, но бесит.
Прога нужна для Windows. Чем проще тем лучше.
Вроде была легендарная прога txt2rtf для подобных целей, но древняя живых ссылок нет и не знаю как она с utf8 дружит. Может у кого есть?
Вообщем, для примера: если взять страницу 1.html и переименовать ее в 1.txt то прога должна на выходе получить вордовский файл где будут сохранены теги, а не только содержимое. Как если бы я отрыл ее в Notepad++ и скопировал содержимое и вставил в ворде. Разумеется, я не собираюсь вручную это делать. Поэтому и нужна простая прога для пакетной конвертации.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 13:52 14-06-2020 | Исправлено: Azrailll, 13:52 14-06-2020
Fenrizz



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
Опишите ТЗ поподробнее, что Вам нужно в результате? А то не совсем понятен смысл этих действий.

Всего записей: 677 | Зарегистр. 12-09-2017 | Отправлено: 16:57 14-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fenrizz Куда уж подробнее описанного, целая простыня получилась.
Мне нужна прога для конвертирования файлов формата txt в формат doc, docx или rtf.
И чтобы в ней была опция выбора кодировки входного файла или только unicode.
И чтобы она конвертила текст как есть, без применения шаблонов и расширений.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 18:26 14-06-2020
Sinclair83

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
посмотрите, устроит ли вас такой вариант. Всё просто до безобразия, как и просили. Запуск с единственным параметром (собственно путь до txt-файла). В итоге получите одноимённый файл, рядом с указанным, но с расширением ".rtf". Если такой rtf-файл уже существовал, то он будет перезаписан.
 
Ну а пакетную обработку можно батником оформить(как вариант). И да, это не та программа, про которую писали выше. Просто назвал также, но с подчёркиванием.

Всего записей: 757 | Зарегистр. 07-01-2009 | Отправлено: 18:35 14-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Sinclair83
Прога простая, это хорошо. Вот только текст в кодировке utf8 она не понимает.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 19:11 14-06-2020
Sinclair83

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
выложите куда-нибудь небольшой фрагмент/образец того что было и что должно получиться в конечном итоге. Разумеется в интересующей кодировке (utf8).

Всего записей: 757 | Зарегистр. 07-01-2009 | Отправлено: 19:30 14-06-2020
Fenrizz



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll

Цитата:
Куда уж подробнее описанного, целая простыня получилась.  

Типичная Проблема X-Y
 
Я имел ввиду конечную цель этих преобразований - зачем преобразовывать html файлы в rtf? Что Вы дальше с ними делать собираетесь?

Всего записей: 677 | Зарегистр. 12-09-2017 | Отправлено: 20:22 14-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Sinclair83
Вот архив с txt и файлом docx который будет если просто открыть файл txt-utf-8.txt в MS Word. Обратите внимание на слова "Управляющий военным" в полученном документе doc-utf-8.docx.
https://www.upload.ee/files/11877854/txt-utf-8.zip.html
Fenrizz
Буду в Ворде обрабатывать.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 03:30 15-06-2020 | Исправлено: Azrailll, 03:51 23-06-2020
Skif_off

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
Попробуйте AkelPad и плагин Coder: сливаете, распаковываете, можно убрать всё, кроме \AkelPad.exe и \AkelFiles\Plugs\Coder.dll, рядом с AkelPad.exe создаёте файл AkelPad.ini в кодировке UTF-16 LE (в блокноте Win зовётся просто Юникод) с таким содержимым.
Командная строка что-то вроде:

Код:
AkelPad.exe /Show(0) "INPUT" /Call("Coder::Settings", 4, 137217, "OUTPUT") /Command(4109) /Command(4318)

INPUT и OUTPUT - входящий и результат, соотв.
Как скормить файлы пакетно - в теме по батникам можно уточнить. Или, если пользуетесь Total Commander, то как-то так можно попробовать сделать кнопку для всех выделенных файлов:
команда: %ComSpec% /c for /f "delims=" %f in
параметры: ('type %WL') do path-to\AkelPad.exe /Show(0) "%%f" /Call("Coder::Settings", 4, 137217, "%%f.rtf") /Command(4109) /Command(4318)
Путь запуска оставить пустым.
В случае Double Commander в поле команды оставьте только %ComSpec%, а остальное - в начало поля пареметров перенесите, только заменив %WL на %LW

Всего записей: 6462 | Зарегистр. 28-01-2008 | Отправлено: 03:42 15-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Skif_off Спасибо большое.
AkelPad с плагином Coder действительно конвертирует как надо.
Заодно не подскажите какие настройки нужны для этого плагина для перекодировки utf в ANSI (1251) кодировку?

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 07:12 15-06-2020 | Исправлено: Azrailll, 09:34 15-06-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
этот файл
https://workupload.com/file/fJQwafLsUWC
преобразован в *.rtf так как нужно?

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 10:19 15-06-2020
Skif_off

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll

Цитата:
конвертирует как надо

Там с порядком команд напутал, должно быть наоборот: /Command(4318) /Command(4109)
В принципе, если настройки не менять и не использовать эту копию AkelPad и просто как редактор, то некритично, но всё же...

Цитата:
Заодно не подскажите какие настройки нужны для этого плагина для перекодировки utf в ANSI (1251) кодировку?

Этот плагин умеет экспортировать в RTF, остальное делает сам AkelPad. Так можно попробовать:

Код:
AkelPad.exe /Show(0) "INPUT" /Command(4131) /Command(4318) /Command(4109)

файл будет пересохранён. Но это ведь не очень хорошо, в однобайтной cp1251 можно не все символы сохранить, их либо отбрасывать, либо пропускать файл, либо спрашивать. В общем, это вам решать, в справке посмотрите параметры командной строки, этим рулят /L, /L+ или /L- (добавьте первым параметром). Если спрашивать, то в /Show(0) надо заменить 0 на что-то другое, см. там же чуть ниже.

Всего записей: 6462 | Зарегистр. 28-01-2008 | Отправлено: 11:12 15-06-2020
Azrailll

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Skif_off
Спасибо, более менее понятно, дальше сам разберусь.
los
Да вполне.

Всего записей: 30 | Зарегистр. 19-09-2013 | Отправлено: 11:35 15-06-2020
Sinclair83

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Azrailll
 
Вам уже ответили, но всё же оставлю здесь конвертер файлов utf8_to_1251. Может пригодится. Также требует только одного параметра (полный путь до файла-оригинала). Сконвертированный файл "ляжет" рядом(к имени будет добавлено "_1251").
Посмотрите, устроит ли такой вариант.
 
что-то upload.ee "капризничает", поэтому вот содержимое...

Всего записей: 757 | Зарегистр. 07-01-2009 | Отправлено: 16:36 17-06-2020 | Исправлено: Sinclair83, 16:46 17-06-2020
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » Программы » Конвертер txt-utf8 в rtf из командной строки


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru