Регулярные выражения - [703] :: Прикладное программирование

YuS_2
Цитата:

это, как раз, далеко не простая задача...

Могу ошибаться, но лет 7 назад пользовался уже не помню какой программой для поиска и замены.
Так вот там вроде было такое понятие как "условный поиск вперёд"
Тогда пишешь что-то типа(блаблабла).*?(!?=\1) и вуаля.
Т.е. в условие
Код:

(!?=\1)

записываем саму искомую строку с помощью обратной ссылки
Код:

.
Могу ошибаться, в деталях, но что-то подобное точно есть в REGEX.

Jonmey

Цитата:

Вы же опрерируете лишь общими, абстрактными условиями

О Боги!
Кажется уже всё разжевал, а все равно не понятно.

Давайте по пунктам.
Вы сталкивались с проблемой, что в файле много похожих или даже повторящихся кусков текста?

Вам хотелось убрать лишние дубли?
Вот и мне хочется.

Что здесь непонятно?

Все остальные требования проистекают из этого желания убрать повторы в тексте.

Расскажу ещё подробней.
У меня есть куча скачанных документов самого разного формата.
Есть программа поиска по содержимому называемая архивариус 3000

Когда я ищу в ней с помощью запросов в строке поиска она находит СОТНИ фрагментов.
Среди них есть повторяющиеся.

В архивариусе нет возможности как-то пометить кусок текста, что я его уже читал (или что он не содержит нужной мне инфы) и что при следующих поисках В НЁМ НЕ НАДО ИСКАТЬ.

Т.е. отфильтровать КУСОК файла в архивариусе нельзя. Можно отфильтровать только файл целиком.

Отсюда все дальнейшие извращения.

Я экпортирую все найденные файлы как текст в виде TXT-файлов.

А затем ВРУЧНУЮ выкусываю ненужные (или уже прочитанные) куски.

Но так как эти куски часто повторяются - хотелось бы АВТОМАТИЗИРОВАТЬ этот процесс.
Автоматом удалить все повторы.

Что здесь не ясно?

Модерирует : ShIvADeSt
Версия для печати • Подписаться • Добавить в закладки
На первую страницу • к этому сообщению • к последнему сообщению