destiny_child
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Ок, упростим задачу. Некий чувак накидал 500 символов `g` в файле. Это латиница. В коде это 0x67 И это входит в первую часть таблицы символов, значит принадлежит "первичной", скажем так, вариации 7 битового набора ASCII. И значит везде-везде мы увидим этот символ именно таким. Ибо все другие под виндой таблицы символов эту (первую) часть не меняют. Значит файл корректен же? Согласны, что в принципе пофигу под какой кодировкой в редакторе, позволяющим ее менять, его стоит открывать? Ок, теперь тот чувак по недомыслию, случайно, влепил символ `П`, что в кодировке его любимого редактора СР866 имеет код 0x8F. Вместо нужного `g`. А это уже вторая часть таблицы символов как мы видим. Файл отослали другу чувака. Внимание вопрос. Стоит ли другу верить кодировке CP1251, что у него по умолчанию открывается в его любимом редакторе? И да, символ там уже будет выглядеть как `Џ`, т.е. вроде как покрякозяблински. НО! 99,9% другого текста выглядит же верно! Так почему эти погрешности должны выводить этот файл в СР866? Только потому, что есть этот 1 символ из 500? |