Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » xdoc2txt

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2

Открыть новую тему     Написать ответ в эту тему

Leagnus

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
С задачей: постоянно конвертить doc в txt прекрасно справляется xdoc2txt.  
Да вот незадача: есть символы, которые txt-файл может держать только если сам будет в Unicode или UTF-кодировке.  
Пример: × (знак умножения), ² (цифра 2 апперскриптом), ° и т.п.  
Вопрос к сообществу: встречал ли кто-нибудь утилиту лучше xdoc2txt,  
которая могла бы конвертить doc в txt так,  
чтобы по запросу сохранять в вышеуказанных двух кодировках?
OOo (Open Office) не предлагать, т.к. нужна утилита, а не ракетный комплекс.

Всего записей: 148 | Зарегистр. 12-09-2008 | Отправлено: 23:11 14-10-2010 | Исправлено: Maz, 15:43 18-10-2020
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Leagnus
 
Распишитесь и получите - xdoc2txt v2.0.0.4 UNICODE, документация на японском, но я в корень архива положил relnotes.txt с кратким описанием программы. Проверено на RTF, PDF, XLSX что при вызове с русским языком у неё проблем нет:
 
xdoc2txt -8 -f <input file> - вывод в UTF-8 |  xdoc2txt -u -f <input file> вывод в UTF-16 LE (CP-1200)  
 
выходной документ получает имя как у входного файла, расширение .ТХТ, но утилита в выходной файл BOM не ставит, так что грузим в текстовый редактор, учитываем кодировку и добавляем BOM.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 15:40 29-10-2014 | Исправлено: Victor_VG, 15:42 29-10-2014
Leagnus

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Фантастика! Все символы сохраняет! Спасибо, Витторе!
Три года юзал скрипт, использующий COM-модель к монстрообразному текстовому редактору.
Перед этим перепробовал antiword, DOC2TXT[MZ], ZD2T и др.

Всего записей: 148 | Зарегистр. 12-09-2008 | Отправлено: 11:12 04-01-2015 | Исправлено: Leagnus, 11:18 04-01-2015
caxap



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
http://ebstudio.info/home/xdoc2txt.html

Цитата:
Ver2.x(Unicode&#29256;)
New ! 2014/10/28
xdoc2txt 2.07( xd2tx207.zip )
•xdoc2txt 2.06 ( xd2tx206.zip )  
•xdoc2txt 2.05 ( xd2tx205.zip )  
•xdoc2txt 2.04 ( xd2tx204.zip )  
•xdoc2txt 2.03 ( xd2tx203.zip )  
•xdoc2txt 2.02 ( xd2tx202.zip )  
•xdoc2txt 2.01 ( xd2tx201.zip )  
•xdoc2txt 2.00 ( xd2tx200.zip )  
 
Ver1.x(MBCS&#29256;)  
•xdoc2txt 1.50 ( d2txt150.zip )  
•xdoc2txt 1.49 ( d2txt149.zip )  
•xdoc2txt 1.48 ( d2txt148.zip )  
•xdoc2txt 1.47 ( d2txt147.zip )  
•xdoc2txt 1.46 ( d2txt146.zip )  
•xdoc2txt 1.45 ( d2txt145.zip )  
•xdoc2txt 1.44 ( d2txt144.zip )  
•xdoc2txt 1.43 ( d2txt143.zip )  
•cryptlib.dll Ver1.00 ( crypt100.lzh / 37KB ) -
 

http://ebstudio.info/download/KWICFinder/xd2tx207.zip

Всего записей: 1968 | Зарегистр. 07-02-2002 | Отправлено: 15:30 04-01-2015 | Исправлено: caxap, 15:31 04-01-2015
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xdoc2txt211.zip (1317Kb) сборка от 29 мая 2015. Отличия от авторского архива:
 
xdoc2txt.txt - краткое английское описание со списком ключей комстроки (поправлено на основании японского текста)
xdoc2txt_jp.chm - копия оргинальной авторской страницы (на японском - может кто владеющий языком уточнит мой перевод ?)
xdoc2txt_ru.chm - отредактированный машинный перевод с японского страницы с описанием программы. Не трогал стилистику блоков истории и лицензии, что касается ключей комстроки и поддерживаемых форматов - там повозился.
xdoc2txt_ru.txt - выписка из перевода может кому пригодится в качестве комплекта подсказок.
 
Всё остальное точно соответствует оригиналу. Автор предупредил, что разработка версии 1.0 завершена и последняя в данной ветке версия 1.50.  
 
* Для работы версии 2.0 требуется рунтайм от MS VC++ 2008 SP1 x86, но по идее должно хватить просто положить рядом с xdoc2txt.exe/xdoc2txt.dll библиотеки atl90.dll (для COM сборки), msvcp90.dll и msvcr90.dll v9.00.30729.5570 из архива - по крайней мере MSDN возражать не будет.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 17:15 07-06-2015 | Исправлено: Victor_VG, 17:56 07-06-2015
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xdoc2txt212.zip
 
xdoc2txt212.zip (1322Kb) сборка от 18 июля 2015. Отличия от авторского архива:
 
Отредактированный машинный перевод с японского страницы с описанием программы. Не трогал стилистику блоков истории и лицензии, что касается ключей комстроки и поддерживаемых форматов - там повозился.
 
xdoc2txt_en.chm -  en-US
xdoc2txt_ru.chm -  ru-RU
 
Всё остальное точно соответствует оригиналу. Автор предупредил, что разработка версии 1.0 завершена и последняя в данной ветке версия 1.50.  
 
* Для работы версии 2.0 требуется рунтайм от MS VC++ 2010 SP1 x86, но по идее должно хватить просто положить рядом с xdoc2txt.exe/xdoc2txt.dll библиотеки atl100.dll (для COM сборки), msvcp100.dll и msvcr100.dll v10.00.40219.1 из архива - по крайней мере MSDN возражать не будет.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 15:39 01-08-2015
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xdoc2txt213.zip
 
xdoc2txt213.zip (1340Kb) сборка от 25 августа 2015. Отличия от авторского архива:
 
Отредактированный машинный перевод с японского страницы с описанием программы. Не трогал стилистику блоков истории и лицензии, что касается ключей комстроки и поддерживаемых форматов - там повозился.
 
Добавлено:
 
xdoc2txt_en.chm -  en-US
xdoc2txt_ru.chm -  ru-RU
xdoc2txt.txt - краткое описание и список ключей командной строки консольной версии (англ.)
./cryptlib.dll - требуется для работы с PDF зашифрованными AES-128 (добавлено в v2.13)
./atl100.dll, ./msvcp100.dll. /msvcr100.dll необходимые рунтаймы от MS VC++ 2010 SP1 x86.
 
DLL положите рядом с EXE/DLL конвертера.
 
Всё остальное точно соответствует оригиналу.  
 
Автор предупредил, что разработка версии 1.0 завершена и последняя в данной ветке версия 1.51 от 25.08.2015 изменения в которой аналогичны изменениям в v2.13.  

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 04:00 05-09-2015
VictorVG2

Редактировать | Цитировать | Сообщить модератору
Продолжение банкета - версия XDoc2Txt v2.14 (анонсирована 19.11.2015, мне на глаза попалась сегодня ), общие изменения похожи на v2.13 только документация слегка поправлена, а в самой v2.14 устранено падения на некоторых PDF (впрочем и в 1.52 автор внёс те же исправления).

Отправлено: 03:32 10-12-2015
VictorVG4



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xdoc2txt215.zip сегодня заметил, снова перевод документации, пополнен архив. Разработка ветки 1.хх прекращена - там старшая версия 1.52.
 
v2.15 - Исправлена ошибка показа в тексте невидимых управляющих символов DOCX
 
Ну, смотрим что получилось...

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")

Всего записей: 1248 | Зарегистр. 26-03-2016 | Отправлено: 15:38 26-04-2016
VictorVG4



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xdoc2txt216.zip от 26.04.2016 снова перевод документации, пополнен архив.  
 
v2.16 26.04.2016 Исправлена ошибка отображения в списке When кодов форматирования в XLSX

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")

Всего записей: 1248 | Зарегистр. 26-03-2016 | Отправлено: 19:54 05-05-2016
wvxwxvw

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VictorVG4
В прошлый раз смотрел и вот как я кое что перевел

Всего записей: 5677 | Зарегистр. 02-04-2015 | Отправлено: 23:13 05-05-2016 | Исправлено: wvxwxvw, 23:14 05-05-2016
VictorVG4



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
wvxwxvw
 
Годится. Сегодня править не буду, а после праздников как вернусь - почему бы и нет?

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")

Всего записей: 1248 | Зарегистр. 26-03-2016 | Отправлено: 23:51 05-05-2016
AVI

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Аналогичная программа blb2txt http://www.cross-plus-a.ru/btext.html

Всего записей: 73 | Зарегистр. 22-02-2003 | Отправлено: 20:52 11-05-2017
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AVI
 
Только размер 5342 Кб а у xdoc2txt 563 Кб и зависимостей меньше. А остальное надо проверять. Мало ли какие ошибки вылезут?

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 22:57 11-05-2017
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xd2tx2161_x86_x64.7z от 06.07.2017
 
  • в архиве 32 и 64 бит версии (автор добавил х64)
  • поправки в документации
  • для работы нужны рунтаймы от MS VC++2010 (в архиве)
     


    ----------
    Жив курилка! (Р. Ролан, "Кола Брюньон")
    Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

  • Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 05:55 08-07-2017
    Victor_VG



    Tracker Mod
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    xd2tx218_x86_x64.7z от 08 апреля 2019
     
  • в архиве 32-х и 64-х битные сборки для x86 и AMD64
  • В xdoc2txt.exe поправлен номер версии и копирайт (в оригинале указаны старая версия и год выпуска)
  • Обновлены русский и английский переводы документации

    ----------
    Жив курилка! (Р. Ролан, "Кола Брюньон")
    Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

  • Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 18:51 13-04-2019 | Исправлено: Victor_VG, 18:55 13-04-2019
    Victor_VG



    Tracker Mod
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    xd2tx219_x86_x64.7z от 03 мая 2019
     
  • в архиве 32-х и 64-х битные сборки для x86 и AMD64
  • В xdoc2txt.exe поправлен номер версии и копирайт (в оригинале указаны старая версия и год выпуска)  
  • Обновлены русский и английский переводы документации
  • Архив включает необходимые DLL зависимостей


    ----------
    Жив курилка! (Р. Ролан, "Кола Брюньон")
    Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

  • Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 22:35 26-05-2019
    Victor_VG



    Tracker Mod
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    xdoc2txt v2.20 x86 и x86-64 от 26 июня 2020
     
  • в архиве 32-х и 64-х битные сборки для x86 и x86-64
  • Обновлены русский и английский переводы документации
  • Архив включает необходимые DLL зависимостей (для версии 2.20 нужны библиотеки VC++ 2017, но годятся библиотеки и от VC++ 2019).

    ----------
    Жив курилка! (Р. Ролан, "Кола Брюньон")
    Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

  • Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 09:01 05-07-2020 | Исправлено: Victor_VG, 09:02 05-07-2020
    mbku

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Victor_VG
    Для чайника обьясните, я скачаю xdoc2txt.exe и могу пользоваться
    xdoc2txt 1.doc >1.txt  ?
    или мне надо еще что-нибудь?

    Всего записей: 26 | Зарегистр. 03-08-2007 | Отправлено: 15:28 18-10-2020
    Victor_VG



    Tracker Mod
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    mbku
     
    Да, сможете, только задайте правильные ключи вызова xdoc2txt -f -8 <file> если входной файл в UTF-8 или xdoc2txt -f -u <file> если входной файл в UTF16 LE. Имя выходного файла фиксировано и всегда совпадает с именем входного, а ключ -f указывает "записать вывод в текстовый файл".  
     
    Например преобразуем входной HTML в UTF-8 в текст. В консоли увидим:

    Цитата:
    $ ls -fR *  
    .
    ..
    ./History_DiskInfo.htm
    $ xdoc2txt -f -8 History_DiskInfo.htm
    History_DiskInfo.htm ==> History_DiskInfo.txt
    $ ls -fR *
    .
    ..
    ./History_DiskInfo.htm
    ./History_DiskInfo.txt


    ----------
    Жив курилка! (Р. Ролан, "Кола Брюньон")
    Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

    Всего записей: 33134 | Зарегистр. 31-07-2002 | Отправлено: 17:11 18-10-2020 | Исправлено: Victor_VG, 17:16 18-10-2020
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2

    Компьютерный форум Ru.Board » Компьютеры » Программы » xdoc2txt


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru