AZJIO2
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору DmitryFedorov Цитата: Не буду все обсасывать но все что ты говорил до этого, мало того что само по себе не имеет логики, все это противоречит твоему новому аргументу. И в итоге ты не доказываешь, не проясняешь свою позицию, а все время увиливаешь пытаясь оказаться правым. Это не первый раз. Я усё помню. | Кратко о том коде: Он проверяет каждую букву текста на совпадение с несколькими символами на наличие некоторых. Кстати в той статье было описано хотя бы 500 символов, а в этом коде нет ограничения, наверно это неправильно файлы то могут быть большими. Я думаю эти символы часто-встречающиеся, как я и говорил. И когда символ совпадает то на счётчик кодировки добавляется очко (+1), итак, какая кодировка наберёт больше всего очков. Далее проверка какая набрала больше всех и она назначается как угаданная. Цитата: а по оставшимся "прочим символам" ты без труда найдешь кодировку, которую и создали ради того, чтобы эти прочие символы были разными. | Допустим ты исключил 0-127, это не даёт преимущества в определении кодировки. Если бы кодировки были одинаковы в русском алфавите, то ты с большей вероятностью не определил бы кодировку по прочим символам, так как эти прочие символы отсутствовали бы в тексте. По поводу картинки - ты видел как выглядят другие кодировки в кодировке 1251, поэтому ты легко определяешь кодировку, иногда, особенно ту что с большинством PPP, ты визуально вместо частых гласных видишь частые заглавные буквы PPP, так что даже визуально тот же принцип. Цитата: ты без труда найдешь кодировку | там нет отсчета, нет координат. кодировка это таблица символов. Представь, что я загадал что 1=А, 5=В, 9=Г, потом даю тебе цифры 951 и говорю, что здесь написано? Потом я даю тебе расшифровку и ты понимаешь что понимается под этими цифрами. Проще пареной репы? А теперь посложнее, я даю тебе десяток разных расшифровок, какой ты воспользуешься? Каждая таблица вернёт тебе некое содержимое, какое будет очевидным? Да никакое, они имеют равную ценность. Предположим ты подставляешь разные расшифровки и какая то одна даёт тебе вменяемый текст. Вот момент где ты ошибся, потому что комп не может определить где вменяемый текст в отличии от тебя. Да можно было бы прогнать тексты по словарю, присутствует ли эта последовательность чтобы определить вменяемость текста. И опять же алгоритм определения кодировки содержащий словарь просто увеличил бы код N++ на несколько мегабайт. А учитывая все языки - несколько сотен мегабайт. | Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 20:18 15-03-2016 | Исправлено: AZJIO2, 20:28 15-03-2016 |
|