Romul81
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору IvanStepanov Мы уже пришли к выводу, что ваша задача не имеет решения в контексте только регулярных выражений. Но это не значит, что он нерешаема в принципе. Тут нужны программы типа TextPipe и PowerGREP. Но самое главное, вам нужно, в первую очередь определиться с границами текстовых блоков. Иначе, если искать от любой позиции, то это миллионы итераций даже на небольшом тексте. А если ещё принять во внимание ваше пожелание по поводу "в произвольном порядке", либо "без учёта пробелов", то это ещё на порядки больше. Взгляните на проблему с другой стороны. Вы же сохраняете текст из интернета, так? Значит, скорее всего в качестве исходников у вас файлы HTML, вероятно. Если вам нужно идентифицировать и удалить эти самые "сниппеты яндекса", то почти наверняка, у них должен быть какой-либо идентификатор. Это может быть тег, его атрибут, класс, специфическая структура тегов, либо что-то другое. Но, уверен, что что-то должно быть, за что можно зацепиться. С помощью TextPipe, к примеру, вы находите и удаляете такие блоки текста (там можно писать свою программную логику на JS или VBScript, но можно попробовать обойтись и встроенными фильтрами). В общем, думаю, это единственное адекватное решение для вашей ситуации. Искать повторяющийся текст регулярками, да ещё учитывая ваши специфические требования - это тупиковый путь. |