Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Notepad++ (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177

Открыть новую тему     Написать ответ в эту тему

DmitryFedorov

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущая часть темы: часть 1
 

 
Notepad++ — это бесплатный редактор текстовых файлов (замена стандартного Блокнота) с поддержкой синтаксиса большого количества языков программирования, ориентирован для работы в операционной системе MS Windows. Этот проект базируется на компоненте Scintilla (очень мощном компоненте для редактирования) написанном на C++ с использованием только Win32 API и STL (что гарантирует максимальную скорость выполнения при минимальном размере программы), распространяется под лицензией GPL.  
 

Переводы на русский
 
  • (полный перевод!) Npp_exe_7.9.5_Ru + Плагины_RU от Dm.Fedorov
  • Русификатор 7.8.9 без сКаКаНиЯ текста от wvxwxvw
  • Notepad++Portable 7.9.1 AkulaBig от 21.11.2020 г.  
  • Как в Notepad++ включить проверку орфографии
     

    ! Проблема с "макинтош"-распознаванием кириллицы в кодировке 1251 (и другим неверным авто-распознаванием, где часть символов отображается кракозябрами) решается снятием галки "Autodetect character encoding" в Preferences|Misc.
    - Если в NP++ до v7.32 ссылка не подчеркивается, нужно применить плагин ScrollPastEOF


    ! Все вопросы и обсуждения по поводу поиска/замены текста задавайте пожалуйста в теме Регулярные выражения
     
    Системные требования, совместимость с Win2K,WinXP
     
    Любое упоминание политических аспектов, не касающихся непосредственного функционирования ПО, в данной теме будет заканчиваться запретом на пост.


  • Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 01:23 02-12-2015 | Исправлено: MAX63ru, 08:03 30-03-2024
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    regist123

    Цитата:
    Цитата:
     Я за это время нашел ссылку на плагин Штирлица, он вполне решает задачу

    Беру слова обратно. Штирлиц не решает задачу, потому что схема WIN->MAC не работает автоматически и соответственно не срабатывает в плагине.
    Твой пример не обрабатывается
     
    Добавлено:
    Gideon Vi
    Попробовал выложенный тобой патч на своей русской экзешке.  
    (не написано что надо положить патч в директорию с экзешкой
    В сведениях о патче написано создан DUP2 http://diablo2oo2.cjb.net)
    Вроде работает в отношении MAC
    Потом сравнил экзешки, чего делает:
     
    ISO_8859-8 ISO-8859-8
    заменено на пропуски NUL
     
    x-mac-cyrillic xmaccyrillic
    первая часть x-mac-cyrillic заменено на пропуски NUL
     
    Ну и еще захватил какой-то один символ в начале файла.  
    --------
    В принципе эти 2 замены легко сделать вручную с помощью того же Npp

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 15:48 15-03-2016 | Исправлено: DmitryFedorov, 16:55 15-03-2016
    ItsJustMe

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подкину-ка я еще живительной субстанции на лопасти этого вентилятора.
     
    Откройте этот файл в сабже. Добейтесь того, чтобы файл отображался нормально. Кто добьется - просьба поделиться способом.
     
    http://rghost.net/8GJ76sxMG
     
    Update
    В архиве 3 файла. UTF16LE, UTF16LE with BOM, pic.jpg.
     
    Задача срачующимся участникам интеллигентной дискуссии...
    Нет, господ срачующихся лучше не надо. Пусть они и дальше варятся в своем болоте дискутируют.  А обычным гражданам, не лишенным чувства любопытства, задача следующая: открыть файл chineseUTF16LE.txt (без BOM) в сабже, чтобы сабж показал текст файла так как на картинке.
     
    Да, файл специально содержит некорректные символы. Так задумано.

    Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 16:30 15-03-2016 | Исправлено: ItsJustMe, 06:49 16-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ItsJustMe

    Цитата:
    Добейтесь того, чтобы файл отображался нормально.

    Ты имеешь ввиду чтобы отображалось как в блокноте?
    Не получается.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 16:50 15-03-2016 | Исправлено: DmitryFedorov, 18:36 15-03-2016
    ItsJustMe

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Ты имеешь ввиду чтобы отображалось как в блокноте?

    Да.

    Цитата:
    Блокнот вырезает "Нуль"-символы

    Некорректные символы блокнот не вырезает, а заменяет на маааленькие прямоугольнички.
     

    Цитата:
    Этого не получится.

    И я о том же. Блокнот может открыть этот файл, а сабж никак.
     
    Предыдущий пост обновлен.
     
    Добавлено:
    Я таки провел то исследование "детектора", о котором говорил ранее. По результатам этого исследования и родился этот эксперимент с файлом UTF-16LE.

    Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 18:38 15-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Задача срачующимся  ..: открыть файл.. Так задумано.

    Хочешь доказать степень невменяемости?! Жене сталь такое задание.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 18:54 15-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Не буду все обсасывать но все что ты говорил до этого, мало того что само по себе не имеет логики, все это противоречит твоему новому аргументу.
    И в итоге ты не доказываешь, не проясняешь свою позицию, а все время увиливаешь пытаясь оказаться правым.  
    Это не первый раз. Я усё помню.  
    Кратко о том коде: Он проверяет каждую букву текста на совпадение с несколькими символами на наличие некоторых. Кстати в той статье было описано хотя бы 500 символов, а в этом коде нет ограничения, наверно это неправильно файлы то могут быть большими. Я думаю эти символы часто-встречающиеся, как я и говорил. И когда символ совпадает то на счётчик кодировки добавляется очко (+1), итак, какая кодировка наберёт больше всего очков. Далее проверка какая набрала больше всех и она назначается как угаданная.

    Цитата:
     а по оставшимся "прочим символам" ты без труда найдешь кодировку, которую и создали ради того, чтобы эти прочие символы были разными.
    Допустим ты исключил 0-127, это не даёт преимущества в определении кодировки. Если бы кодировки были одинаковы в русском алфавите, то ты с большей вероятностью не определил бы кодировку по прочим символам, так как эти прочие символы отсутствовали бы в тексте. По поводу картинки - ты видел как выглядят другие кодировки в кодировке 1251, поэтому ты легко определяешь кодировку, иногда, особенно ту что с большинством PPP, ты визуально вместо частых гласных видишь частые заглавные буквы PPP, так что даже визуально тот же принцип.

    Цитата:
    ты без труда найдешь кодировку
    там нет отсчета, нет координат. кодировка это таблица символов. Представь, что я загадал что 1=А, 5=В, 9=Г, потом даю тебе цифры 951 и говорю, что здесь написано? Потом я даю тебе расшифровку и ты понимаешь что понимается под этими цифрами. Проще пареной репы? А теперь посложнее, я даю тебе десяток разных расшифровок, какой ты воспользуешься? Каждая таблица вернёт тебе некое содержимое, какое будет очевидным? Да никакое, они имеют равную ценность. Предположим ты подставляешь разные расшифровки и какая то одна даёт тебе вменяемый текст. Вот момент где ты ошибся, потому что комп не может определить где вменяемый текст в отличии от тебя. Да можно было бы прогнать тексты по словарю, присутствует ли эта последовательность чтобы определить вменяемость текста. И опять же алгоритм определения кодировки содержащий словарь просто увеличил бы код N++ на несколько мегабайт. А учитывая все языки - несколько сотен мегабайт.

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 20:18 15-03-2016 | Исправлено: AZJIO2, 20:28 15-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Жуть. После того как я проверил обнаружение кодировки Npp через XYplorer (там ну очень быстро можно просмотреть файл в любой кодировке и задать любую кодировку) я убедился что Npp вааще не фурычит для USC-2.
    --------
    Кроме того при просмотре в какой-то кодировке Npp, не всегда, но меняет файл (иконка становится красной) и требует сохранения.
    -------
    В общем теперь никакого доверия.
     
    AZJIO2 Пойми - это просто мое мнение.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 21:06 15-03-2016 | Исправлено: DmitryFedorov, 21:31 15-03-2016
    regist123



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov 16:48 15-03-2016
    Цитата:
    Беру слова обратно. Штирлиц не решает задачу, потому что схема WIN->MAC не работает автоматически и соответственно не срабатывает в плагине.  Твой пример не обрабатывается [?]

    DmitryFedorov 16:48 15-03-2016
    Цитата:
    также не обрабатывается и текст этого сообщения, если нажать редактировать и скопировать до конца твоего примера

    Вообще-то в таком виде обрабатывается. Например выделить все текст, потом выбрать режим Turbo 5 - весь текст корректно исправило. Но это всё равно костыль.
    Главная ведь проблема, когда начинаешь текст и не замечаешь, что он открыт в неправильной кодировке.
     
    Добавлено:
    ItsJustMe 17:30 15-03-2016
    Цитата:
    участникам интеллигентной дискуссии следующая: открыть файл chineseUTF16LE.txt (без BOM) в сабже, чтобы сабж показал текст файла так как на картинке.

    Хоть и не участник спора, но ... не совсем как на картинке, но так не сойдёт?
    http://i75.fastpic.ru/big/2016/0315/19/c9682e4b5fd8405cc27ea963ecba0119.png

    ----------
    Раздачи и акции

    Всего записей: 7189 | Зарегистр. 20-03-2009 | Отправлено: 21:54 15-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    regist123
    В принципе я могу (что касается автообнаружения MAC-кирилицы) вырезать ее из русской экзешки, чтобы не было раздражения от этого. Как это делает патч от Gideon Vi.  
     
    Тогда при открытии нельзя будет сделать эту ремарку
    Цитата:
    Главная ведь проблема, когда начинаешь текст и не замечаешь, что он открыт в неправильной кодировке.  

     
    Только если убрать как в патче еще и автообнаружение ISO 8859-5, то что останется?  
    OEM 866 - не работает
    Koi8-R - автообнаружение не работает, только вот проверил.
    Не лучше ли пока снять галку. Ведь толку все равно нет. По крайней мере в локали, поддерживающей русский.
     
    Может это только у нас так?  
    Надо ж столько лет делать и на тебе, всё хреново. Даже китайский, который ему как родной.
     
    Добавлено:

    Цитата:
    Вообще-то в таком виде обрабатывается.

    неа, неправильно обрабатывается.  
    Идет вместо цитата:
    читата:

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 23:52 15-03-2016
    Daniyar91

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Из-за этого тупого решения у нас не работают всякие вещи типа сортировки без учета регистра.
    Сложно опровергнуть это утверждение, ведь не ясно, у кого это "у нас", например у меня работает сортировка без учета регистра.
     
    Есть один вопрос к тебе - как размещение символов в кодовой таблице, мешает выполнять сортировку без учета регистра?
     
    Если маленькие буквы идут последовательно, и заглавные в том же порядке и тоже последовательно, то такую сортировку можно выполнять быстро, но и медленнее она тоже работает...
     
     

    Цитата:
    Надо ж столько лет делать и на тебе, всё хреново. Даже китайский, который ему как родной
    Одному такое делать нереально сложно (как бы он собирал статистику для тех языков которые даже не знает), скорее всего он просто взял уже готовую реализацию.

    Всего записей: 425 | Зарегистр. 30-08-2011 | Отправлено: 00:46 16-03-2016 | Исправлено: Daniyar91, 00:49 16-03-2016
    ItsJustMe

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    regist123

    Цитата:
    Хоть и не участник спора

    Полагаю, именно это обстоятельство и позволило тебе провести этот эксперимент. Участники, как видишь, слишком заняты участием.
     

    Цитата:
    не совсем как на картинке, но так не сойдёт?

    Думаю, ты и сам видишь, что npp файл открыл некорректно. То, что видно на твоем скрине, это npp открыл UTF-16 как ANSI. Попробуй открыть файл UTF16 with BOM - их npp умеет открывать. А вот без BOM, если в файле есть некорректные символы, не умеет. А тот же Notepad их открывает без проблем.
    Да, и проблема не в том, что npp не может своим мега-детектором определить кодировку файла при открытии, а в том, что такие файлы (UTF16 w/o BOM with incorrect chars) он не может открыть в принципе, что бы пользователь ни пытался сделать. Я, к примеру, пытался играться с меню Encoding, но так и не смог добиться, чтобы npp отобразил файл правильно. Поэтому и прошу свободных от дискуссии граждан тоже принять участие в эксперименте. Может, кто сможет открыть этот файл в сабже?
     
    А вообще, ради чего мы тут над сабжем пыхтим? Им вообще кто-нибудь пользуется? И если пользуется, то почему? Я, например, им вообще не пользуюсь, ковыряю только из любопытства.

    Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 06:42 16-03-2016 | Исправлено: ItsJustMe, 07:04 16-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Daniyar91
    Охота тебе каждый раз по носу получать?

    Цитата:
    например у меня работает сортировка без учета регистра.  

    Сортировка для русских символов в Npp не работает. Не работает она также и в плагине TextFX
    Вот тебе пример сортировки на букву Д. Она учитывает регистр.
    Дурак
    Дурнее
    Дурноватый
    дурак
    дурнее
    дурноватый
    Чтобы сортировка заработала, нужно специально прописать учет локали. Это возможно. Но автор об этом не знает. (Но например в УльтраЭдит это применяется: там так и пишется, что будет медленней. Я переводил эту прогу для себя и при случае могу и показать где.)

    Цитата:
    как размещение символов в кодовой таблице, мешает выполнять сортировку без учета регистра
    Очень просто мешает. Таблиц много. Сложностей много. Не до жиру быть бы живу. Не прописано глобально что буква "е" это то же что и "Е" но в другом регистре.
    Эти буквы все время находятся в разных местах таблицы. А был бы один вариант автор к примеру взял бы да и прописал, (чтоб не искать) зарытое в дербрях нюансов Мелкософта решение для этого.

    Цитата:
    Одному такое делать нереально сложно  

    Если бы автор использовал стандартное решение он бы имел результат как в XYplorer или как "Блокноте". Автор об этом писал и написал что он применил свое "эвристическое" решение и извинялся заранее за то что оно не может дать 100 процентного результата. Справку надо читать. Языков автор знает несколько. Один из них китайский. И тем более странно что с ним неувязки.
    -----------
    Это ведь твои слова:

    Цитата:
    Все, это уже начинает походить на личную переписку, так-что если тебе еще есть что сказать по этому поводу, то не пиши здесь, и вличку тоже не надо, т.к. мне не интересно.
    Может перестанешь меня терроризировать? Мне действительно не интересно твое мнение: еще ни разу оно не было конструктивным, подчерпнуть нечего. Ты меня что? как бесплатный источник информации используешь?
    Пойми я ведь могу и не так мягко отвечать.
     
     
    Добавлено:
    ItsJustMe

    Цитата:
    И если пользуется, то почему? Я, например, им вообще не пользуюсь, ковыряю только из любопытства.

    Я пользуюсь потому что привык и потому что когда пробовал другое мне не нравилось. Пытался заменить например УльтраЭдитом но не перешел.  
    Причины тяжело сформулировать.
    Ну наверное главное потому что прога делает авто-резервирование. Мне не надо заботиться о том что файлы не сохранены.
    Потому что открывает относительно большие файлы.
    Потому что открывает их так что показывает символы 0-31, которые все остальные проги прячут. (хотя мне конечно не нравится жуткий мешающий чтению черный цвет)
    Потом при случае есть плагины.
    Поиск и замена очень удобны.
    В итоге в этом редакторе я работаю быстрее и могу сделать то что в другом редакторе как-то не получается.
     
    Добавлено:

    Цитата:
    Я, к примеру, пытался играться с меню Encoding, но так и не смог добиться, чтобы npp отобразил файл правильно.  

    Я вот не пойму почему ты считаешь что отображение в Блокноте абсолютно правильное?
    Я конечно понимаю что там стоят иероглифы и ты хочешь их увидеть как и в блокноте.
    Но это официальный, не специальный метод отображения.  
     
    А с позиции Npp надо показывать символы 0-31 когда они внутри есть.
    Ну например ты открываешь какую-то экзешку. Там внутри куча Nul-символов, есть и иероглифы и что? Ты же не требуешь чтобы все эти 0-31 символы не учитывались при показе? Другое дело метка BOM - тут типа спец задание: давай отобрази меня плевать как получится, но так как написано в метке BOM, литералы не отображаются а иероглифы показываются.
     
    Для достижения своей цели попробуй удалить вручную (по другому вроде никак) все эти промежуточные литерал-символы. Может тогда файл откроется как надо с иероглифами. Автоматически это наверное можно сделать в каком-то Hex-редакторе.
     
    Кстати UltraEdit тоже этот файл не открывает. Там даже нет возможности принудительно указать что это мол файл UTF16LE. Есть только возможность задать ANSI кодировку.
    С другой стороны если открыть этот же файл с меткой BOM - то файл откроется как надо, с иероглифами. Все как в Npp. Так что если Монстр делает как Npp, то это уже скорей не ошибка, а какое-то правило о котором мы не знаем.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 10:01 16-03-2016 | Исправлено: DmitryFedorov, 11:11 16-03-2016
    regist123



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ItsJustMe 07:42 16-03-2016
    Цитата:
    Думаю, ты и сам видишь, что npp файл открыл некорректно. То, что видно на твоем скрине, это npp открыл UTF-16 как ANSI. Попробуй открыть файл UTF16 with BOM - их npp умеет открывать. А вот без BOM, если в файле есть некорректные символы, не умеет. А тот же Notepad их открывает без проблем.  Да, и проблема не в том, что npp не может своим мега-детектором определить кодировку файла при открытии, а в том, что такие файлы (UTF16 w/o BOM with incorrect chars) он не может открыть в принципе, что бы пользователь ни пытался сделать. Я, к примеру, пытался играться с меню Encoding, но так и не смог добиться, чтобы npp отобразил файл правильно. Поэтому и прошу свободных от дискуссии граждан тоже принять участие в эксперименте. Может, кто сможет открыть этот файл в сабже?

    Не совсем понял, что нужно.
     
    1) Npp не всегда правильно опознает кодировку - это факт с которым вроде все согласны.
    2) В UTF8 with BOM в начале файла есть три байта, в UTF16 with BOM - два байта (этот самый БУМ) который указывает в какой кодировке файл, что позволяет правильно его открывать. С этим тоже вроде ни у кого возражений нет.
    ____________
     
    3) На моём скрине указана не та кодировка, в которой он должен был открыть, но текст при этом вроде правильный. Разве не это была цель эксперимента?
    4) Для восстановления текста воспользовался плагином  Штирлица, который
    а) Похоже заменил символы 0x00 (NUL) пробелами.
    б) Попытался подобрать и исправить кодировку, то есть перекодировал текст в ANSI за счёт чего не смотря на то что он был открыт не в той кодировке текст вроде правильный. А также то что убрали NUL символы он стал более читабельный.
     
    5) Сабжем пользуюсь, а для избежания указанных проблем постарался по возможности все текстовые файлы с которыми работаю перекодировать в UTF-8 с BOM

    ----------
    Раздачи и акции

    Всего записей: 7189 | Зарегистр. 20-03-2009 | Отправлено: 11:21 16-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ItsJustMe
    regist123
    Я вроде нашел причину почему иероглифы не показываются без метки BOM.
    В общем это правило такое, которое в Npp если и регулируется то через файл настроек вручную.  
    В UltraEdit оно сформулировано в галке настроек которую нужно включить. Звучит так:
     
    Разрешить правку файлов в текстовом режиме с Hex Nul-символами без преобразования этих символов в пробелы.
    Т.е. в Npp это правило просто всегда работает. Nul символы показываются и мы можем не только править файл не уродуя его путем преобразования, а даже править Nul-символы с помощью меню Правка - спец-Вставка.
     
     
    Добавлено:
    И это правило, кстати, одна из причин по которой я использую Npp.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 11:41 16-03-2016 | Исправлено: DmitryFedorov, 11:43 16-03-2016
    Daniyar91

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Все, я понял что ты не способен услышать то, очем тебе говарят дгуие, в следующие разы, если ты будеш что-то неправильно писать, возможно, я тебя поправлю и скажу что ты не прав, но не буду тебе что-то пытаться объяснить или доказать.
     
    И да, размещение символов в кодовой таблице, никак не мешате реализации не мение быстрого алгоритма сортировки без учета регистра. Мы всегда, за время O(1) можем определить что символ является буквой, какая буква сопостовляется этой (маленькой -> заглавная, и на оборот).

    Всего записей: 425 | Зарегистр. 30-08-2011 | Отправлено: 11:51 16-03-2016
    DmitryFedorov

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Напиши об этом автору Npp, а то он бедный и тупой никак не может сообразить что все так просто.  
    Твой любимый CudaText может сортировать только благодаря тому что его автор нашел в свое время решение, но ты ведь не спросишь его чего ему это стоило.

    Всего записей: 1968 | Зарегистр. 19-03-2006 | Отправлено: 12:26 16-03-2016 | Исправлено: DmitryFedorov, 12:31 16-03-2016
    ItsJustMe

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    regist123

    Цитата:
    Не совсем понял, что нужно.

    Попробую разъяснить.

    Цитата:
    Npp не всегда правильно опознает кодировку - это факт с которым вроде все согласны.

    И я с этим согласен. Но я затевал эксперимент не для того, чтобы что-то доказать или опровергнуть. Не хочу участвовать в интеллигентной дискуссии.

    Цитата:
    В UTF8 with BOM в начале файла есть три байта, в UTF16 with BOM - два байта (этот самый БУМ) который указывает в какой кодировке файл, что позволяет правильно его открывать. С этим тоже вроде ни у кого возражений нет.

    Нет возражений.

    Цитата:
    но текст при этом вроде правильный

    В том-то и дело, что текст неправильный. Я специально приложил картинку с правильным.

    Цитата:
    Разве не это была цель эксперимента?

    Нет, цель эксперимента - заставить сабж открыть этот файл в UTF-16LE.
     
    Посмотри на это вот с какой стороны:
    1. Открываем некоторый файл в сабже. Ну, например, тот же тестовый 1251.
    2. Сабж определил кодировку неправильно, и мы это видим по неправильному тексту. Например, он определил ее как 1255, то есть иврит. Или как MAC. Ты и сам такое наблюдал.
    3. Что мы делаем в таком случае? Меняем кодировку. Поменяли, и voila - файл отображается правильно. И да, если даже в нашем 1251 есть какие-то левые символы, то мы все равно сможем в сабже открыть его как 1251: в результате левые символы так и останутся левыми, а остальной текст отобразиться правильно.
     
    То же самое я хочу проделать и с тестовым файлом в UTF-16LE. Ну, открыл сабж его неправильно - не велика беда. Переключаем кодировку и все. Но в том-то и дело, что я не смог этого сделать. Я не смог переключить кодировку на UTF-16LE.
     
    И да, насчет левых символов в тестовом файле. Другие редакторы это не смущает, как видишь. Даже Notepad не смущает.
     
    Отсюда цель эксперимента можно сформулировать примерно так:
    Как для файла в UTF-16LE без BOM, открытого с неправильно определенной кодировкой, поменять кодировку на UTF-16LE. Мне интересно, можно ли это сделать (что, надо сказать, умеет большинство текстовых редакторов - подумаешь задача - переключить кодировку), или же сабж, как это ни удивительно, этого не умеет.
     
    Или же можно сформулировать так: может ли сабж работать с файлами UTF-16LE, содержащими некорректные символы. Ну хорошо, если сабж такой пурист, что отказывается работать с такими файлами, то тоже не велика беда. Есть другие редакторы, не такие привередливые.
     
    Но, так как я не уверен, что сабж *действительно* всего этого не может, я и спрашиваю коллективный разум. Может, сабж таки может открыть этот файл, только я не смог найти правильную комбинацию нажатий пунктов меню. Вдруг, кто ее знает или найдет, и тем самым покажет, что сабж умеет работать с такими файлами.
     
    Отсюда, кстати, и вопрос про использование сабжа. Учитывая, что есть другие, более удобные (ИМХО!!!!) редакторы, пользуется ли кто сабжем.
     
    Как это ни удивительно, один ответ уже есть. Жизнь полна сюрпризов.
    Ой, два ответа. Ответ из одной строчки я сослепу сначала не заметил.
     
    Update:
    Млиииин! Я понял, в чем моя ошибка! Вас всех (а главное, тебя, как единственного, помогающего мне в этом эксперименте), смущают иероглифы в тестовом файле. Ну, согласен, неудачно я выбрал файл для данной аудитории.
    Исправляюсь:
    http://rghost.net/67JwKLG9P
     
    Условия и цели эксперимента те же.
     
    Да, и вот еще что. Нажатие на пункты меню Encoding\Convert... крашит сабж. Предположительно Convert to ANSI.

    Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 13:18 16-03-2016 | Исправлено: ItsJustMe, 13:54 16-03-2016
    AZJIO2

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    DmitryFedorov

    Цитата:
    Чтобы сортировка заработала, нужно специально прописать учет локали.
    то есть создать алгоритм? а то если прописать куда-то что у меня русский было бы просто чтобы этим не воспользовался бы автор.
     

    Цитата:
    Напиши об этом автору Npp, а то он бедный и тупой никак не может сообразить что все так просто.  
    Твой любимый CudaText может сортировать только благодаря тому что его автор нашел в свое время решение, но ты ведь не спросишь его чего ему это стоило.  
    Алгоритм прост. Итак:
    1. Таблица не по-порядку, значит надо для диапазона 128-255 сделать порядок сортировки, например:
    1=а
    2=А
    3=б
    4=Б
    и т.д.
    2. Нужно перекодировать текст в цифру, то есть заменить А на 1, и т.д.
    3. Создать таблицу строка|числовой эквивалент
    4. Сортировать таблицу по числовому эквиваленту перемещая строки в те же позиции.
    5. В цикле сортированную колонку соединить в строку с разделителем "перенос строки" и выложить это в окно редактора.
    Всё.
     
    Замучился я тебя уже учить бесплатно
     
    ItsJustMe
    1. Если что мы не срачуемся, не мешай людям общаться и искать истину. Просто некоторым такая форма общения нравится по другому никак.
    2. Твой файл я хотел потестить, но "rghost.net" у меня выдаёт "Error 451. Доступ запрещен." сначала спутал с "rghost.ru" работало же, а тут ".net", ладно полез в статьи обхода защиты, которую нонейм уже пол года предлагает, скачал "Tor Browser", не запустился, попробовал ещё пару вариантов, дистрибутивы нестандартные, не люблю не deb или rpm, а tar.xz, которые вручную пихать в "/opt" не доверенные проги. Да и время добивать у меня нет, и так на DmitryFedorov убил час, придётся в следующий выходной свои задумки осуществлять по работе.
    .
    Да N++ работает с бинарными файлами и можно их править, тот же блокнот сохранит без 0-31 символов и файл можно сразу на помойку, в общем смотреть можно сохранять нельзя. Сразу при открытии видно что файл содержит бинарные символы и знаешь что многие редакторы просто поломают этот файл, а программисты может специально, может не специально напихают  эти символы 0-31 например для разделения блоков текста.
    Так же под N++ у меня написано много скриптов и они работают и  есть библиотека для непосредственного взаимодействия со scintilla. Создание собственного синтаксиса подсветки. В общем как я не пытался другие редакторы настроить стиль опробовать внешние скрипты, ни один даже рядом не валялся.

    Всего записей: 85 | Зарегистр. 27-01-2016 | Отправлено: 15:50 16-03-2016 | Исправлено: AZJIO2, 15:54 16-03-2016
    evgenium82

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите в Notepad++ есть такая же плюшка как и в AkelPad - CodeFold, а именно просмотр и переключение между функциями, в отдельном окне. Удобно для кодинга

    Всего записей: 65 | Зарегистр. 30-07-2009 | Отправлено: 16:05 16-03-2016
    regist123



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AZJIO2 16:50 16-03-2016
    Цитата:
     хотел потестить, но "rghost.net" у меня выдаёт "Error 451. Доступ запрещен."  

    http://www58.zippyshare.com/v/7zqIyK36/file.html
    14:18 16-03-2016
    Цитата:
    Нажатие на пункты меню Encoding\Convert... крашит сабж. Предположительно Convert to ANSI.

    У меня не крешит. Версия сабжа 6.9. В какой последовательности на кнопки жать?
     
    А по кодировке действительно немного странно. Моя гипотеза: на каком-то спец. символе спотыкается и не может дальше корректно обработать документ (в данном случае сменить кодировку).

    ----------
    Раздачи и акции

    Всего записей: 7189 | Зарегистр. 20-03-2009 | Отправлено: 16:26 16-03-2016
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177

    Компьютерный форум Ru.Board » Компьютеры » Программы » Notepad++ (часть 2)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru