Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Notepad++ (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176

Открыть новую тему     Написать ответ в эту тему

DmitryFedorov

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущая часть темы: часть 1
 

 
Notepad++ — это бесплатный редактор текстовых файлов (замена стандартного Блокнота) с поддержкой синтаксиса большого количества языков программирования, ориентирован для работы в операционной системе MS Windows. Этот проект базируется на компоненте Scintilla (очень мощном компоненте для редактирования) написанном на C++ с использованием только Win32 API и STL (что гарантирует максимальную скорость выполнения при минимальном размере программы), распространяется под лицензией GPL.  
 

Переводы на русский
 
  • (полный перевод!) Npp_exe_7.9.5_Ru + Плагины_RU от Dm.Fedorov
  • Русификатор 7.8.9 без сКаКаНиЯ текста от wvxwxvw
  • Notepad++Portable 7.9.1 AkulaBig от 21.11.2020 г.  
  • Как в Notepad++ включить проверку орфографии
     

    ! Проблема с "макинтош"-распознаванием кириллицы в кодировке 1251 (и другим неверным авто-распознаванием, где часть символов отображается кракозябрами) решается снятием галки "Autodetect character encoding" в Preferences|Misc.
    - Если в NP++ до v7.32 ссылка не подчеркивается, нужно применить плагин ScrollPastEOF


    ! Все вопросы и обсуждения по поводу поиска/замены текста задавайте пожалуйста в теме Регулярные выражения
     
    Системные требования, совместимость с Win2K,WinXP
     
    Любое упоминание политических аспектов, не касающихся непосредственного функционирования ПО, в данной теме будет заканчиваться запретом на пост.


  • Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 01:23 02-12-2015 | Исправлено: MAX63ru, 08:03 30-03-2024
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Daniyar91

    Цитата:
    ..то не пиши здесь, и вличку тоже не надо, т.к. мне не интересно.
    Если тебе не интересно не х..р здесь страницы марать.
    Тебе ответили, что CudaText мог бы быть отличным редактором, но не судьба ему.
    Npp может открыть большие файлы, CudaText - нет, UltraEdit на раз.
    ----
    А если ты не только подпевать умеешь, напиши автору этой проги или исправь код сам или добей проблему.
     
    Добавлено:
    Вообще что такое кириллица MAC?
    Это очередной изврат, наподобие ISO-8859-5, OEM 855, OEM 866, KOI8-R, KOI8-U
     
    Почему я так говорю? - наплодив кодировок пришли к Юникоду. Потом трансформировали его в UTF (Unicode Transformation Format), где порядок символов совпадает с 1251. Поэтому в NPP этот формат до сих пор поясняется словами: ANSII как UTF-8
     
    Как размещен наш алфавит по номерам символов:
     
    1251: 192..255 с буквы А как в UTF-8 по порядку
     
    ISO-8859-5: 176..239 по порядку буквы ЁЪ отдельно.
    KOI8-R и KOI8-U: 192..255 с буквы ю вразброс
    OEM 855: 128..252 вперемежку, пытаясь выдать буквы парами по регистру
    OEM 866: 128..175 224..239 прерываемый порядок с буквы А
    MAC: 128..159  221..254 прерываемый порядок с буквы А
     
    Фирма Мелкософт оказалась единственной, кто сделал что-то логически.
    Жмем Ctrl+N, меняем кодировки и смотрим таблицу символов.
    ---------
    Примечательно что каждый новый создатель кодировки обязательно располагал латиницу неизменно в начале таблицы.
    Но другие символы кидал куда угодно.  
    Хотя у всех народов есть алфавит. Так расположи его до конца таблицы.  
    В середине напихай еще символов, которые собственно и будут отличать твою кодировку от других.
    Нет. Во всех кодировках номера символов у букв разные. Хотя буквы те же самые - Алфавит.  
    Надо быть полным идиотом чтобы так сделать.

    Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 20:14 13-03-2016 | Исправлено: DmitryFedorov, 21:20 13-03-2016
    Valery_Sh



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Npp может открыть большие файлы

     
    И даже оччень большие. Ищет и заменяет по шаблону без проблем.
    Иной раз открываюю файл-индекс после индексирования видео, когда нужно скопом исправить разные мелочи
     
    И да, отцы, чем кидаться друг в друга чем ни попадя, лучше б объясняли для тех кто не сильно шарит, как "делать правильно".
    Я вот, положим, вообще не шарю и 9/10 из того что вы пишете во время "дружеских перепалок", для меня - китайская грамота.

    Всего записей: 2171 | Зарегистр. 30-06-2008 | Отправлено: 22:28 13-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Автор CudaText бросил отполированную прогу и перешел на другой движок.  
    Это несколько лет работы. Значит намерения серьезные.
    Движок дает кросс платформенность,  
    Посмотри в википедии, Scintilla тоже кроссплатформенный. Я даже ставил SciTE в Linux'е, но оболочка-надстройка слабая, чтобы назвать это удобным редактором.
     

    Цитата:
    Я лишь подсказал то, на чем можно спотыкнуться, можешь просто учесть чтоб не влипнуть.
    Тут двояко можно рассуждать. Если мне пришлось восстанавливать файлы, то это порча, просто она другого вида, не преднамеренная и не в полной мере, но достаточная чтобы перечитывать весь файл. Это ещё хуже когда ты не можешь откатить, но не знаешь где погрешено, хуже нет. Если ты определил это быстро, это не значит что у других это произойдёт также быстро, до того как не испорчены все тексты.
     

    Цитата:
    Встретить в Винде реальные файлы с кодировкой Макинтош нереально. Их просто нет.  
    я тоже не думал что файлы винды не могут быть в линуксе, и вот они есть, а файлы линукса в винде. И вот я взял да и указал редактору в Linux'е, что если файл в ANSI, то применить к нему кодировку Windows-1251, и ура, теперь у меня между файлами нет конфликтов.
     

    Цитата:
    Почему?
    Да потому что Npp работает как на Винде так и на Макинтоше.
     
    Значит единственное что нам надо - это чтобы автор ввел  уточнение:  
    На Винде, в которой для не Юникод-файлов стоит поддержка кирилицы, автообнаружение Макинтош считать равным 1251 и всё.  
    Вот поэтому я и говорю пиши сам чтобы я потом не выглядел... Доказательства нет, что автор применяет кодировку макинтош как наиболее вероятную, потому что N++ работает и в макинтош.
     
     
     
     
    Добавлено:
    DmitryFedorov

    Цитата:
    Почему я так говорю? - наплодив кодировок пришли к Юникоду. Потом трансформировали его в UTF (Unicode Transformation Format), где порядок символов совпадает с 1251. Поэтому в NPP этот формат до сих пор поясняется словами: ANSII как UTF-8

    не уверен строка "ANSII как UTF-8" отображается для кодировки UTF-8 без BOM. А кодировки UTF-8 и "UTF-8 без BOM" отличаются только 3-мя символами в начале текста. Эти символы упрощают определении кодировки, с вероятностью 100% даже для пустого файла. А "UTF-8 без BOM" возможно применяется в случаях когда программе мешают эти первые 3 символа. К примеру в Autoit есть подключаемые библиотеки UDF, она как бы вставляется целиком внутрь кода в место где указано подключение и когда туда вставляются эти 3 символа то интерпретатор встаёт в ступор, ему нужно чистое содержимое, ну он так сделан. В HTML-файлах тоже "без BOM".

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 22:33 13-03-2016
    Daniyar91

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Но другие символы кидал куда угодно.  
    Хотя у всех народов есть алфавит. Так расположи его до конца таблицы.  
    В середине напихай еще символов, которые собственно и будут отличать твою кодировку от других.
    Нет. Во всех кодировках номера символов у букв разные. Хотя буквы те же самые - Алфавит.  
    Надо быть полным идиотом чтобы так сделать.
    Лучше не пиши про то, в чем не шариш. Ты возможно и решил что самый умный, но все-же были и есть кто поумней тебя.
     
    Как ты собрался в 1 байте закодировать больше чем 256 символов, притом что кроме родных символов еще нужно и латиницу туда записать... и если нам нужно больше байта, то как определить что один символ должен байт занимать, а другой два например...
     
     
    Наверное кто придумывал кодировки, все-же были не идиоты, да.
     
     
    UPD:
    Цитата:
    Хотя у всех народов есть алфавит. Так расположи его до конца таблицы
    Давай представим, что гдето-там существуют два народа - Матобо и Ктулху, у них в алфавитах одинаковое кол-во букв, и как твой универсальный метод тут поможет?..

    Всего записей: 425 | Зарегистр. 30-08-2011 | Отправлено: 23:44 13-03-2016 | Исправлено: Daniyar91, 00:15 14-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Valery_Sh

    Цитата:
    И даже оччень большие

    Вот именно Npp Может. А один чудак говорит что редактору это не надо.  
    Я считаю что надо. На кой ляд мне несколько редакторов.
    Цитата:
    лучше б объясняли для тех кто не сильно шарит, как "делать правильно"
    Не могу назвать себя очень знающим - пока правильно делать так как нарисовано в шапке: есть проблемы с распознаванием - сними галку (если я правильно понял вопрос).
     
     
    AZJIO2
    Цитата:
    Посмотри в википедии, Scintilla тоже кроссплатформенный
    Я это знаю. Тоже автора спросил об этом, но хозяин-барин, он посчитал что ему нужен другой движок.  
    ---
    Про порчу я посоветовал не говорить потому что цель другая: получить результат, а так это вызовет "спор" и толку не будет.
    ---
    Реальных файлов с кодировкой MAC в винде не может быть. Ты их можешь конечно скопировать, но их в ней быть не может. А вот кодировка 1251 может быть в Маке. Она повсюду. В инете, везде.  

    Цитата:
    Вот поэтому я и говорю пиши сам чтобы я потом не выглядел... Доказательства нет, что автор применяет кодировку макинтош как наиболее вероятную, потому что N++ работает и в макинтош.
    Ну знаешь. Я не вызывался. Мне это не настолько мешает. А то что я написал про макинтош это не доказательство. Это объяснение. То что на Маке Npp работает известно всем.

    Цитата:
    не уверен строка "ANSII как UTF-8" отображается для кодировки UTF-8 без BOM
    Ну конечно когда заголовка нет - не грех и подсказать что речь идет о кодировке в которой точь такие же как в ANSII. Это речь о подсказке Npp.
    О том в каком случае нужна запись BOM в каком нет - не берусь сказать. Твоя логика вроде вполне нормальна.  
     
    Добавлено:
    Daniyar91
    Мда. С тобой сложный случай. Ты хоть сам понял о чем написал? Ругнись уж лучше чем так отвечать. Мы все поймем.

    Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 00:33 14-03-2016 | Исправлено: DmitryFedorov, 00:48 14-03-2016
    Gideon Vi

    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Думаю, что можно обойтись простым патчем. Протестируйте, кому интересно.

    Цитата:
    Видимо стоит уточнить - DmitryFedorov != ру-борд

    Как минимум, начиная с 13-10-2015 руборду насрать на его программу. Даже тебе.

    Всего записей: 8084 | Зарегистр. 02-02-2004 | Отправлено: 02:17 14-03-2016 | Исправлено: Gideon Vi, 02:21 14-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Реальных файлов с кодировкой MAC в винде не может быть. Ты их можешь конечно скопировать, но их в ней быть не может. А вот кодировка 1251 может быть в Маке. Она повсюду. В инете, везде.
    У MAC-овцев нет интернета и они не выкладывают своих файлов? Почему то я в линуксе активно использую интернет и ось на это не влияет. Только в линуксе по умолчанию кодировка UTF-8, поэтому ты ни как не создашь проблем для других осей.

    Цитата:
    это не доказательство. Это объяснение
    это не доказательство. Это предположение

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 03:00 14-03-2016
    Daniyar91

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Мда. С тобой сложный случай. Ты хоть сам понял о чем написал? Ругнись уж лучше чем так отвечать. Мы все поймем.
    Ты начинаешь что-то путать, мой ответ никак не был связан с твоими предыдущими сообщениями про CudaText, NPP, или еще что-то там. Я писал про то что ни надо считать что вокруг одни дибилы, а ты самый умный, ведь это не так.
     
    Давай я объясню, раз ты не понял.
     
    Та херня что ты написал про юникод, UTF, и однобайтовые кодировки -- не более чем херня.
     
    Поверь мне наслово, что в одном байте можно закодировать только 256 значений. И если каждую букву сопоставить этим значениям, то выходит, что однобайтовая кодировка может уместить в себе алфавит максимум из 256 символов.
     
    И что же делать если у нас есть много народов, и у всех своя письменность, очевидно же что мы не можем в однобайтовой кодировке уместить все алфавиты разом.
     
    И вот, если в россии в основном пишут на русском, то почему бы не сделать кодировку, в которой будут только русские и латинские буквы... и так будем делать для каждой письменности. Т.е. в итоге получаем много разных кодировок.
     
    И если взять два файла с разными кодировками, то мы едвали сможем опридильть что там на самом деле.
     
    Доходит дело до азиатский языков, и оказывается, что там больше чем 256 символов, т.е. если мы выкинем даже латинские буквы, то все равно не сможем уместить в такой кодировке все нужные символы, а значит нам надо больше байт, и вот уже получились многобайтовые кодировки.
     
    И ты открываешь файл на каком-нибудь китайском, и что, как ты предлагаешь понять что эта многобайтовая кодировка, а не однобайтовая. Если прочитать первый байт, то можно предположить что там какая-то буква, а если прочитать два байта, то так-же можно предположить что это одна буква.
     
     
    Вот теперь, иди и перечитай свой пост про кодировки, и мой ответ на него, а потом подумай, стоит ли впредь писать про то, о чем ты даже не догадываешься, хотя и считаешь что знаешь как оно будет лучше.

    Всего записей: 425 | Зарегистр. 30-08-2011 | Отправлено: 04:29 14-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Daniyar91
    Слушай. Неужели ты так безнадежен? Я тебе разжую.
     
    С помощью 7бит можно задать 128 символов.  
    С помощью 8 бит можно задать 256 символов.
    То что задается с помощью 7 бит всегда на одном и том же месте.  
    Это логично и правильно - это символы в таблице от 0 до 127.
    Остается еще 128 символов.  
    В них описывается наш алфавит. Всего 66 символов.
    Вопрос куда их запихнуть и в каком порядке.  
    После этого останутся еще 62 символа, которые можно варьировать.
     
    Надо быть очень не логичным чтобы символы нашей азбуки все время размещать в разных местах. Этт надо постараться. И я описал как постарались.
     
    Мелкософт разместил наш алфавит по порядку сначала Верхний регистр, потом Нижний и заканчивает ими таблицу.  
    В середине таблицы - "прочие символы и буквы ёЁ"
    Этот порядок после этого повторяется в UTF8.
    Т.е. сначала верхний, затем нижний регистр и не перемешивая и по порядку.
    Вот это логично и правильно.
     
    Если бы остальные кодировки сделали то же самое проблем с распознаванием кодировок бы не было. Особенно гавнистым оказался порядок размещения символов в кодировке MAC.
     
    Между тем кодировки были бы разными, потому что предлагали бы разные "прочие символы", те же самые что предлагают и сейчас.
    Теперь тебе понятно?
    -------------
    Я только вот не пойму, зачем ты на ровном месте устраиваешь "бурю в унитазе"? Исторически все понятно: IBM делала кодировку под себя, MAC под себя. Борьба за место под солнцем.  
     

    Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 05:27 14-03-2016
    thejustsoul



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У кого там нет никаких проблем с автодетектом кодировок в NPP? Откройте эти файлы (кодировки Win 1251 и 866) в последней версии NPP.
     
    Добавлено:

    Цитата:
    Думаю, что можно обойтись простым патчем. Протестируйте, кому интересно.  

    Что делает ваш патч? Никакой разницы не вижу.

    Всего записей: 1789 | Зарегистр. 30-03-2014 | Отправлено: 11:35 14-03-2016 | Исправлено: thejustsoul, 11:40 14-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Этот порядок после этого повторяется в UTF8.

    Прочти тут, порядок не совсем одно и тоже при учёте "Ёё", а порядок А-Я. а-я одинаков.
    И ещё комментарий типа юникод является продолжением ANSI,  он не является продолжением. Если ты применил ANSI, то ко всему документу применяется только ANSI, а если юникод, то ко всему документу применяется юникод, и ANSI там вообще не участвует, если у них совпадает начало 0-127 это понятно, но 128-255 у них не совпадает ни с русской кодировкой не ещё с какой либо, там просто набор всех языков и русский там не идёт первым после английского, с чего бы. юникод и так вмещает в себя все символы, и он не является продолжением какой то из кодировок ANSI

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 12:01 14-03-2016 | Исправлено: AZJIO2, 12:04 14-03-2016
    Bannan



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    У кого там нет никаких проблем с автодетектом кодировок в NPP?

    Во, спасибо. Посмотрел теперь и я на эту бодягу. Прикольно! Правда, кодировки редактор определяет не как МАС, а, например, для файла 1251.txt как ISO 8859-8. Такой гемморой сразу видно и понятно, что нужно выбрать другую кодировку. А здесь, как я понял, проблема в том, что кодировка 1251 определятся как МасCyr: буквы вроде как русские, но есть небольшие отличия, которые не сразу легко заметить особенно, если документ большой. Но честно, с таким поведением Notepad++ в своей работе c txt документами ещё не сталкивался.

    Всего записей: 507 | Зарегистр. 30-07-2011 | Отправлено: 12:22 14-03-2016
    thejustsoul



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Bannan

    Цитата:
    определяет не как МАС

    Видимо там что-то еще доломали и теперь определяется так =)

    Всего записей: 1789 | Зарегистр. 30-03-2014 | Отправлено: 12:32 14-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Фирма Мелкософт оказалась единственной, кто сделал что-то логически.
    он воткнул ёЁ в случайном порядке, не считая их буквами алфавита. И тебе не всё ли равно кто сделал логичнее, ты же печатая не чувствуешь проблем в том, что таблица символов не по-порядку.

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 12:34 14-03-2016 | Исправлено: AZJIO2, 12:35 14-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AZJIO2

    Цитата:
    И тебе не всё ли равно кто сделал логичнее, ты же печатая не чувствуешь проблем в том, что таблица символов не по-порядку.  

    Речь об опознавании. Когда ты печатаешь - кодировка известна. Когда опознаешь кодировка неизвестна. Для опознавания нужна логика.
    А отдельная MAC кодировка есть только в русском насколько я понял и именно она гадит.
    Буква Ё долгое время действительно не была в машинном алфавите. Даже орфография идет в двух вариантах - с Ё и без Ё.
     
     
    Добавлено:

    Цитата:
    Прочти тут, порядок не совсем одно и тоже при учёте "Ёё", а порядок А-Я. а-я одинаков

    У тебя что тоже сыр-бор в голове? Чего ты меня отсылаешь здесь к регулярным выражениям? когда речь совсем о другом.
    В общем порядок в таблице UTF-8 (ты должен открыть именно эту таблицу) такой же.
    Т.е. символы просто смещены.  
    Главное что нехорошо в разных кодировках - это одни и те же символы в ANSII таблицах имеют разный номер.  
    Но вот 1251 имеет для основного набора кириллицы такой же номер как в UTF8 только со смещением.
    Если бы другие кодировки имели такую же логику - т.е. размещали основной набор символов кирилицы в конце ANSI таблицы, то проблем с опознаванием не было бы никогда. Опознавание было таким же жестким как опознавание основной латиницы, размещенной в первых 128 символах ANSI таблицы.
     
    Добавлено:
    thejustsoul
    Твои примеры не предназначены для демонстрации проблем обнаружения кодировки.
    В этих примерах практически нет текста и потому изначально известно что проблемы с обнаружением кодировки будут.
    Слов "Проба пера" или "Гыгыгы" недостаточно. Некорректно на их основании говорить что, что-то не так.
     
    Нужен текст (раньше были где-то такие примеры).
    И вот тогда на примере реального текста видно что для русских текстов не всегда, но довольно часто кодировка определяется как MAC.

    Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 14:17 14-03-2016 | Исправлено: DmitryFedorov, 15:08 14-03-2016
    ItsJustMe

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    thejustsoul

    Цитата:
    У кого там нет никаких проблем с автодетектом кодировок в NPP? Откройте эти файлы (кодировки Win 1251 и 866) в последней версии NPP.

    Посмотрел я еще раз этот "детектор" с помощью твоих файлов. М-дя...
    У тебя 1251 как определилась? Хочу сравнить с тем, что получилось у меня.
     
    PS: А все вижу. У меня то же, что и у банана. В общем, такой детектор, по-моему, можно просто выкинуть. Отключить то есть. Бесполезен он.
     

    Цитата:
    Видимо там что-то еще доломали и теперь определяется так =)

    Нет, в детекторе ничего не менялось. Он с древнейших времен так работает, как только появился в npp. Уж фик знает, сколько лет.

    Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 16:14 14-03-2016 | Исправлено: ItsJustMe, 16:44 14-03-2016
    Daniyar91

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Если бы другие кодировки имели такую же логику - т.е. размещали основной набор символов кирилицы в конце ANSI таблицы, то проблем с опознаванием не было бы никогда. Опознавание было таким же жестким как опознавание основной латиницы, размещенной в первых 128 символах ANSI таблицы.
    Зачем херню пишешь?
     
    Если бы кодировки были похоже, то зачем они вообще нужны с разными названиями...
     
    А если они все-же чем-то да отличались, то тогда, такое "размещение" символов, наоборот бы значительно затруднило распознавание кодировок, т.к. они отличались бы незначительно. Т.е. было-бы примерно так как сейчас в NPP.
     
     
    Видимо писать проще чем думать.

    Всего записей: 425 | Зарегистр. 30-08-2011 | Отправлено: 16:33 14-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Daniyar91
    Горбатого могила исправит.  
     
    Ты кстати когда на русском пишешь думай. Хер - это в германии уважаемый человек. А по-русски это та фигня что у тебя меж ногами болтается.
    И пиши немного грамотней. Глаза режет. (я не имею ввиду описки).
     
    Разные кодировки были сделаны только для того чтобы иметь разным набор дополнительных символов. (это их единственное отличие и причина по которой они были сделаны разными. О чем тебе скажет любая википедия). А делали их разные фирмы. Но вот  логика размещения символов в таблице у фирм была разная, а не единая.
     
    Всем
    Вспомнил что есть вполне приемлемое решение для этого обнаружения кодировок, когда речь идет о русских буквах.
    Это Штирлиц. Зашел к автору. Порылся - висит. Вот вам Ссылка
    Вытаскиваете содержимое Зипа в папку plugins. Перезагружаете Npp. В меню Плагины будет пункт Shtirlitz.  
    В случае чего он преобразует. Отмена преобразования возможна.

    Всего записей: 1962 | Зарегистр. 19-03-2006 | Отправлено: 16:51 14-03-2016 | Исправлено: DmitryFedorov, 16:53 14-03-2016
    thejustsoul



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Твои примеры не предназначены для демонстрации проблем обнаружения кодировки.  

    Приведи свои.  
    Bred3 открыл оба файла правильно, ему значит достаточно, а NPP недостаточно. ОК.

    Всего записей: 1789 | Зарегистр. 30-03-2014 | Отправлено: 17:29 14-03-2016
    Bannan



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Вот попробуйте такой вариант: скачать
     
    Включите опцию автоопределения кодировки в настройках и проверьте работу на ваших файлах. По крайней мере теперь случай с файлом 1251.txt из сообщения thejustsoul открывается корректно. Еще раз повторю, что я ни разу не сталкивался со случаем, когда текстовик в кодировке windows-1251 открывался в кодировке Macintosh. Если такой вариант вам подходит, то возьмите его на вооружение.

    Всего записей: 507 | Зарегистр. 30-07-2011 | Отправлено: 17:49 14-03-2016
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176

    Компьютерный форум Ru.Board » Компьютеры » Программы » Notepad++ (часть 2)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru