PaulGor
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Ну, .doc то при чём здесь? Мы ведь говорили о неюникодовом .TXT, это совсем разные вещи, ничего общего нет у такого .TXT с файлом специального формата MS Word .doc. В .TXT, в отличие от .DOC - только сам текст, нет никакого указания ни на язык, ни на кодировку, ни на шрифт - только байты текста и всё. Байт со значением 0xE4 (десятичное 228) это это только байт и есть, совершенно неизвестно, 'д' ли это, либо а-умляут, либо 228 из другой какой кодировки. Поэтому вопрос > напрашивается вопрос, что мешает всем техтовикам быть как > UltraEdit?.. неправомочен: - все не-Unicode редакторы простого текста (Plain Text, .TXT) работают одинаково - UltraEdit просто один пример, их полно -популярный Bred, и ещё куча таких же, работающих так же plain text editors на http://www.shareware.com, на http://tucows.com, на http://freeware.ru. А именно, т.к. они не-юникодовые, то им не надо конвертировать ничего в Unicode (при File/Open) и из Unicode (при File/Save), они просто загружают в себя байты этого .TXT 'as is' - им не надо знать, в какой кодировке этот текст. Теперь, имея скажем байт 0xe4 (228) внутри себя, такой редактор покажет его пользователю с помощью того шрифта, который выбран рабочим. Если это шрифт кодировки Cyrillic 1251, то на экране этот байт будет показан как русская 'д' - т.к. именно такой символ стоит в данном шрифте в позиции 228. Если же я выберу западно-европейский шрифт - кодировки Western 1252, то редактор покажет мне этот же байт как немецкую а-умляут. - и все Unicode-based редакторы работают с неюникодовыми .TXT (Plain Text) файлами тоже одинаково, будь то EmEditor или MS Word или UniPad (http://www.unipad.org/main/) - им приходится, при File/Open, конвертировать неюникодовый plain text - .ТХТ в Unicode - ведь это их формат хранения, и если им не указать, какая же кодировка у этого неюникодового .TXT, то они считают, что это кодировка самой системы: system code page - системная кодовая страница, и на Вашей машине такие редакторы конвертируют русский текст по схеме "Western"--->Unicode, получаются естественно кракозябры. Если же явно указать такому редкатору, что надо именно из Cyrillic 1251 конвертировать в Unicode, то всё нормально будет. |