IvanStepanov
BANNED | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору YuS_2 Цитата: это, как раз, далеко не простая задача... | Могу ошибаться, но лет 7 назад пользовался уже не помню какой программой для поиска и замены. Так вот там вроде было такое понятие как "условный поиск вперёд" Тогда пишешь что-то типа(блаблабла).*?(!?=\1) и вуаля. Т.е. в условие Код: записываем саму искомую строку с помощью обратной ссылки Код:. Могу ошибаться, в деталях, но что-то подобное точно есть в REGEX. Jonmey Цитата: Вы же опрерируете лишь общими, абстрактными условиями | О Боги! Кажется уже всё разжевал, а все равно не понятно. Давайте по пунктам. Вы сталкивались с проблемой, что в файле много похожих или даже повторящихся кусков текста? Вам хотелось убрать лишние дубли? Вот и мне хочется. Что здесь непонятно? Все остальные требования проистекают из этого желания убрать повторы в тексте. Расскажу ещё подробней. У меня есть куча скачанных документов самого разного формата. Есть программа поиска по содержимому называемая архивариус 3000 Когда я ищу в ней с помощью запросов в строке поиска она находит СОТНИ фрагментов. Среди них есть повторяющиеся. В архивариусе нет возможности как-то пометить кусок текста, что я его уже читал (или что он не содержит нужной мне инфы) и что при следующих поисках В НЁМ НЕ НАДО ИСКАТЬ. Т.е. отфильтровать КУСОК файла в архивариусе нельзя. Можно отфильтровать только файл целиком. Отсюда все дальнейшие извращения. Я экпортирую все найденные файлы как текст в виде TXT-файлов. А затем ВРУЧНУЮ выкусываю ненужные (или уже прочитанные) куски. Но так как эти куски часто повторяются - хотелось бы АВТОМАТИЗИРОВАТЬ этот процесс. Автоматом удалить все повторы. Что здесь не ясно? | Всего записей: 136 | Зарегистр. 11-05-2019 | Отправлено: 20:55 19-05-2019 | Исправлено: IvanStepanov, 21:22 19-05-2019 |
|