Hjkma
Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Т.е. это выглядит примерно так: слова могут присутствовать в любом порядке, в любом количестве, кроме того, присутствуют не только слова, но и фразы из нескольких слов (два, три, четыре и т.д.), при этом, если присутствуют отдельные слова из фраз, их необходимо удалять. Никаких специальных разделителей фраз, либо слов, нет абсолютно. Да, можно было бы принять за разделитель пробел, но это противоречит условию о наличии фраз с пробелами... в общем, пойди туда - не знаю куда, найди то - не знаю что... | То есть если к примеру есть заданные слова и фразы "word|count of lines|phrases" и есть строка: Цитата: Free word count software counting words, lines, pages, phrases, characters. | то нельзя преобразовать в строку: Цитата: ? Добавлено: Цитата: Никаких специальных разделителей фраз, либо слов, нет абсолютно. Да, можно было бы принять за разделитель пробел, но это противоречит условию о наличии фраз с пробелами... | А возможно ли составить отдельно регэкспы, один для одиночных слов и другой для фраз? Тогда можно сперва вычистить другим рэгекспом для фраз, потом найти поиском строки, в которых есть заданные фразы, вырезать их в отдельный документ, а потом уже обработать оставшийся текст первым регэкспом для слов. |