Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Регулярные выражения

Модерирует : ShIvADeSt

 Версия для печати • ПодписатьсяДобавить в закладки
На первую страницук этому сообщениюк последнему сообщению

Открыть новую тему     Написать ответ в эту тему

IvanStepanov

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
YuS_2
Цитата:
это, как раз, далеко не простая задача...  

Могу ошибаться, но лет 7 назад пользовался уже не помню какой программой для поиска и замены.
Так вот там вроде было такое понятие как "условный поиск вперёд"
Тогда пишешь что-то типа(блаблабла).*?(!?=\1) и вуаля.
Т.е. в условие
Код:
 (!?=\1)
записываем саму искомую строку с помощью обратной ссылки
Код:
\1
.
Могу ошибаться, в деталях, но что-то подобное точно есть в REGEX.
 
Jonmey

Цитата:
Вы же опрерируете лишь общими, абстрактными условиями

О Боги!  
Кажется уже всё разжевал, а все равно не понятно.
Давайте по пунктам.
Вы сталкивались с проблемой, что в файле много похожих или даже повторящихся кусков текста?
 
Вам хотелось убрать лишние дубли?
Вот и мне хочется.
 
Что здесь непонятно?
 
Все остальные требования проистекают из этого желания убрать повторы в тексте.
 
Расскажу ещё подробней.
У меня есть куча скачанных документов самого разного формата.
Есть программа поиска по содержимому называемая архивариус 3000
 
Когда я ищу в ней с помощью запросов в строке поиска она находит СОТНИ фрагментов.
Среди них есть повторяющиеся.  
 
В архивариусе нет возможности как-то пометить кусок текста, что я его уже читал (или что он не содержит нужной мне инфы) и что при следующих поисках В НЁМ НЕ НАДО ИСКАТЬ.
 
Т.е. отфильтровать КУСОК файла в архивариусе нельзя. Можно отфильтровать только файл целиком.
 
Отсюда все дальнейшие извращения.
 
Я экпортирую все найденные файлы как текст в виде TXT-файлов.
 
А затем ВРУЧНУЮ выкусываю ненужные (или уже прочитанные) куски.
 
Но так как эти куски часто повторяются - хотелось бы АВТОМАТИЗИРОВАТЬ этот процесс.
Автоматом удалить все повторы.
 
Что здесь не ясно?  

Всего записей: 136 | Зарегистр. 11-05-2019 | Отправлено: 20:55 19-05-2019 | Исправлено: IvanStepanov, 21:22 19-05-2019
Открыть новую тему     Написать ответ в эту тему

На первую страницук этому сообщениюк последнему сообщению

Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Регулярные выражения


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru