Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Регулярные выражения

Модерирует : ShIvADeSt

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97

Открыть новую тему     Написать ответ в эту тему

leftMIND

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
   Регулярные выражения
Обучающий материал
  • Книги    
  • Шпаргалки: от AZJIO (AutoIt3, PCRE) от Dave Child
  • wikipedia.org - Регулярные выражения на wiki  
  • edlinsoft.blogspot.com - Регулярные выражения в .NET Framework  
  • php.ru - Синтаксис регулярных выражений  
  • php.net - Синтаксис регулярных выражений  
  • regexpstudio.com - Регулярные выражения для Delphi  
    Официальные источники:
  • docs.notepad-plus-plus.org - Официальный источник Notepad++ (англ. яз.)  
  • pcre.org - Официальный справочник движка PCRE (англ. яз.)  

  •    Тестирование регулярных выражений
    Программы
    Онлайн сервисы
  • RegexBuddy - крутая и платная  
  • RegExp - бесплатно, AZJIO, PCRE, AutoIt3  
  • Expresso  
  • The Regex Coach  
  • RegExstar, Github (AutoHotKey, PCRE)
  • Обзор программ от ManHunter    
  • regexr.com здесь в Community множество готовых регулярных выражений  
  • pagecolumn.com - для javascript  
  • pagecolumn.com - для php  
  • cuneytyilmaz.com - для javascript  
  • php-include.ru - на флеш-плеере  
  • regex101.com  
  • easyregexp.ru  
  • debuggex.com - показывает структурно  

  •    Схожие темы
  • javascript регулярные выражения
  • PHP: Регулярные выражения (RegExp, Regular, eregi, preg)
  • Игра - Регулярно выражайтесь!
     
    первое сообщение темы...
    Обсуждение шапки данной темы ведётся в этой теме
    Рекомендации по составлению вопросов в данной теме:

  • Всего записей: 33 | Зарегистр. 07-04-2002 | Отправлено: 23:55 15-10-2002 | Исправлено: AZJIO, 15:18 12-02-2021
    regist123



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    B2269 написал(а)
    Цитата:
    не отработало с расширением состоящим из двух букв.

    забыл, что бывают и из двух буквы, учитывало только из 3-х и 4-х.

    Код:
    .*\.(\w{2,4})$


    Цитата:
    Спасибо, кстати, похоже, можно просто средствами Notepad++ "преобразовать в ANSI", не знаю есть ли подводные, но "ö" становится "o"

    Если это просто другая кодировка, то никаких проблем, оно собственно для этого и предназначено. Проблема может быть только если у вас есть не латинские буквы в другой кодировке (они тогда у вас и так должны там не корректно отображаться) и вы с этой "некорректной" перекодируете их в другую.
    Правда я не понимаю, вы вроде там писали русские буквы надо удалить, а сейчас получается что зацепило и удалило русскую букву в другой кодировке это ошибка?


    ----------
    Раздачи и акции

    Всего записей: 7198 | Зарегистр. 20-03-2009 | Отправлено: 13:19 03-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    B2269

    Цитата:
    Спасибо, кстати, похоже, можно просто средствами Notepad++ "преобразовать в ANSI", не знаю есть ли подводные, но "ö" становится "o".

    https://sourceforge.net/projects/npp-plugins/files/HTMLTag/
     

    Цитата:
    Пробую способ с исключением нужного справа до первой точки, [^\..*$], но не получается

    ^.*\.([^\.]+)$ замена на $1

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 22:49 03-10-2022
    regist123



    Gold Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    https://sourceforge.net/projects/npp-plugins/files/HTMLTag/

    насколько понимаю в html коды это конвертировал форум.

    ----------
    Раздачи и акции

    Всего записей: 7198 | Зарегистр. 20-03-2009 | Отправлено: 22:58 03-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    regist123

    Цитата:
    насколько понимаю в html коды это конвертировал форум.

    а, ну тогда да, преобразвание из уникода в ANSI поможет.

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 23:10 03-10-2022
    annatut

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подскажите, пожалуйста, новичку-любителю, есть ли в природе регулярки или макросы для чистки html, полученного из Word. Важно, чтобы после чистки сохранялись рисунки, таблицы, выделение жирным и курсивом, индексы (верхние, нижние), заголовки (h1 - h4). А как автоматически убрать остальной мусор?  
    Заранее благодарю за информацию!

    Всего записей: 70 | Зарегистр. 20-05-2019 | Отправлено: 20:11 05-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    annatut
    вам для этого нужны регулярки? это плохая идея обрабатывать html регуляркой.
    есть онлайн сервисы, приложения.. где и как хотите использовать?

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 21:55 05-10-2022
    AZJIO



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    annatut
    Это наверно сможет только сам MS, так как только они знают какой мусор они могут встроить. Я лишь могу сказать что под каждый файл надо подстраиваться и рег.выр-ами можно только упростить рутинную работу, т.е. выделить мусор преобразовать его в регулярку и удалить 1000 кусков мусора за один проход. Старая моя попытка не работала на новом доке и к тому же надо постоянно смотреть чтобы ничего не поломалось.
     
    вот скрипт попытай. Хотя там движок сайта поломал код, лучше бери тут

    Всего записей: 4540 | Зарегистр. 03-05-2006 | Отправлено: 22:52 05-10-2022 | Исправлено: AZJIO, 23:00 05-10-2022
    annatut

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    AZJIO
     
    Спасибо! Попробую. Перепробовал некоторые онлайн сервисы, но не то. Пока для моих нужд самым лучшим оказалась программа Doc Converter Pro, но лицензия стоит дорого, да и после ее чистки нужно кое-что доделывать. Просто я думал, может, есть более совершенный инструмент... Еще раз спасибо!

    Всего записей: 70 | Зарегистр. 20-05-2019 | Отправлено: 17:53 06-10-2022
    AZJIO



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    annatut
    для интереса попробуй использовать какой нибудь другой офис (их много), который поддерживает docx и в нём сделать сохранение в html. Может они изначально не будут встраивать мусор.

    Всего записей: 4540 | Зарегистр. 03-05-2006 | Отправлено: 22:23 06-10-2022
    andrejka_k

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Добрый вечер всем. А помогите, пожалуйста, разобраться в таком выражении:
    ^[\.A-Z\:/a-z0-9_-]{1,36}$
    Как его интерпретировать на человеческом языке? Может есть какой-то онлайн-ресурс, который переводит регэкспы в понятное человеку описание?
    Дополнено:
    В шапке нашел ресурс, который показал следующее:
    . A-Z : / z-z 0-9 _ -

    Всего записей: 1232 | Зарегистр. 13-05-2003 | Отправлено: 23:26 09-10-2022 | Исправлено: andrejka_k, 23:30 09-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    andrejka_k

    Цитата:
    ^[\.A-Z\:/a-z0-9_-]{1,36}$


    Цитата:
    В шапке нашел ресурс, который показал следующее:

    строка, с этим символами, то 1 до 36 штук

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 23:43 09-10-2022 | Исправлено: Mavrikii, 23:44 09-10-2022
    andrejka_k

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Mavrikii
    Спасибо. А есть конструкторы регулярных выражений для чайников, где можно запрос сформировать на привычном для человеке языке и получить готовую регулярку? Точнее, згаю, что такое точно есть и в шапке наверняка тоже приведено. Но что можно посоветовать из наиболее интуитивно понятных софта/онлайн-ресурсов? Для чайников

    Всего записей: 1232 | Зарегистр. 13-05-2003 | Отправлено: 00:04 10-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    andrejka_k
    лучше просто изучить материал. ничего особого сложного там нет.
    с конструктором не так все просто.. ну есть что то такое https://regex-generator.olafneumann.org/
    но в основном это просто помощь подсветкой и быстрым отображением результатов.

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 00:10 10-10-2022
    AZJIO



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    andrejka_k

    Цитата:
    что можно посоветовать из наиболе

    в шапке моя шпаргалка
    Также в шапке моя прога RegExp, там есть библиотека примеров (example) для теста всех метасимволов на реальном тексте.

    Всего записей: 4540 | Зарегистр. 03-05-2006 | Отправлено: 18:28 10-10-2022 | Исправлено: AZJIO, 18:30 10-10-2022
    Celsus



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Как можно исключить из результатов поиска слова, в которых есть круглые скобки?  
    Все, придумал: (.+[^)(])

    Всего записей: 384 | Зарегистр. 02-04-2011 | Отправлено: 09:49 14-10-2022 | Исправлено: Celsus, 09:57 14-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Celsus
    из результатов какого поиска?

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 09:59 14-10-2022
    Celsus



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Mavrikii
    В Double Commander, Multi commander по файлам в папках, странно, что в проводнике windows до сих пор нет поддержки regex

    Всего записей: 384 | Зарегистр. 02-04-2011 | Отправлено: 01:06 15-10-2022 | Исправлено: Celsus, 01:07 15-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Celsus

    Цитата:
    Все, придумал: (.+[^)(])

    ([^)(]+)

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 01:45 15-10-2022
    annatut

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Люди добрые, помогите решить такую головоломку!
    В исходнике htm есть много нумерованных списков, но в них сбита нумерация. Нужно исправить так, чтобы в каждом фрагменте текста между тегами <h4> была последовательная нумерация строк, начиная с цифры 1. Такое можно сделать регулярками или я обречен на титаническую ручную работу?
    Вот пример.
     
    Исходник:
     
    <h4>3</h4>
    <p>1. произвольный текст...
    <p>23. произвольный текст...
    <p>24. произвольный текст...
    и т. д. ...
    <h4>4</h4>
    <p>1. произвольный текст...
    <p>207. произвольный текст...
    <p>208. произвольный текст...
    и т. д. ...
     
    Нужно сделать так:
     
    <h4>3</h4>
    <p>1. произвольный текст...
    <p>2. произвольный текст...
    <p>3. произвольный текст...
    и т. д. ...
    <h4>4</h4>
    <p>1. произвольный текст...
    <p>2. произвольный текст...
    <p>3. произвольный текст...
    и т. д. ...
     
    Заранее благодарю за подсказки!

    Всего записей: 70 | Зарегистр. 20-05-2019 | Отправлено: 10:08 15-10-2022
    Mavrikii

    Platinum Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    annatut
    это не для чистых регулярок.
    в комбинации с языком, чтобы менял нумерацию.
    <p> закрыты?

    Всего записей: 15430 | Зарегистр. 20-09-2014 | Отправлено: 10:42 15-10-2022
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97

    Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Регулярные выражения


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru