Jonmey
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору gerxer Цитата: Потому что я вам выше сказал довольно понятно: Цитата: (поиск должен быть регистрозависимым: для DOS/Windows окончаний строк) | а потом добавил Цитата: вы как всегда что-то делаете не так, приблизительно, "на глазок". А регэкспы такого не прощают. | но на вас это не подействовало, потому что вы пытаетесь "универсиализировать" регэксп на все случаи жизни нисколько не заботясь о том, чтобы создать одинаковые первичные условия для их применения. А к таковым относятся многие вещи, например, кодировки обрабатываемых файлов, формат окончаний строк (а их три - DOS. NIX, MAC) и др. В данном случае первый файл у вас имеет DOS окончания строк и соответствует условиям для которых он написан. А во втором случае файл имеет NIX окончания строк и соответственно регэксп не работает (и не должен). Приведите наконец все свои словари к однообразному представлению (поскольку вы на винде, то - к формату DOS) и будет вам счастье. Цитата: Задача убрать все названия, имена, аббревиатуры и тп из словарей. | Мне это ничего не говорит, поскольку dsl словарями интересовался лет 15 назад и к настоящему моменту абсолютно ничего не помню. Записывайте в общем виде. [hhh]kkkk[/jhh] - аббревиатуры и тд. Цитата: А из MW еще и такие строки(все кроме под номером один): [c] darkslategray]II. [/c]export06.wav [com]\\ˈek-ˌspɒːrt\\[/com] [com]noun[/com] [c darkslategray]III. [/c]export06.wav [com]\\ˈek-ˌ\\[/com] [com]adjective[/com] | Эти две строки удалить или что, Общий вид строк требуется (потому что непонятно, что может меняться, а что нет). Цитата: Я пытаюсь просто пытаюсь еще хоть что то понять из этих выражений регулярных, но нехрена не понимаю. Книжки скачал, но они дурацкие. Даже тут: ^[\t ]*[A-ZА-Я][^\n\r]*\r\n | Они не дурацкие, а самые примитивные. Специально пишу такие, чтобы было проще понять и изменять. Данное выражение означает (словами): ищем строки начинающиеся (^) возможно, но необязательно (*) с пробелов ( ) и/или табуляций (\t) в любом количестве и в любых сочетаниях ([\t ]*), после чего должна следовать одна из заглавных букв русского или английского языков ([A-ZА-Я]), после которой могут следовать, но необязательно (* - 0 или более совпадений) любые символы кроме (^) символов перевода каретки 0A и 0D (\n и \r) - кусок [^\n\r]* - и при этом вся строка имеет DOS окончание строки - \r\n Что тут непонятного? Цитата: Каким боком так получается что оно строки начинает удалять?) | Регэкспы ничего не удяляют сами по себе. Регэкспы - это средства поиска, выбора, селекции, отбора, выявления, определения и т.д. Удаляет/заменяет/извлекает/вставляет/и проч. - всегда юзер, когда выбирает, что с найденным регэкспом нужно делать. | Всего записей: 1365 | Зарегистр. 17-01-2011 | Отправлено: 22:01 01-10-2019 | Исправлено: Jonmey, 22:08 01-10-2019 |
|