annatut
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Mavrikii В файлах html могут попадаться одинаковые строки. Хотел бы быстро проверить все файлы и найти в них повторяющиеся строки, например: <h4>ЛИВАН</h4> <p> (Исх 30:34) - чистое, душистое вещество с желтоватым оттенком, острое и горькое на вкус, но с приятным запахом. Дерево, из которого оно добывается, растет в Аравии. Чтобы получить его на дереве, делают надрезы, и оно свободно вытекает из них. В русской Библии - ладан.</p> <h4>ЛИВАН</h4> <p><img src="img/11-03.jpg" align="left" style="margin-right: 10px;"> <i>Вид Ливанских гор</i> <p>- возвышенная цепь гор в северной части Палестины, на границе между Иудеей и Сирией, тянущаяся на восток от Акко (Суд 3:3) <i>«до входа в Емаф»</i> (Ам 6:14). Называется так, вероятно, от снега, постоянно лежащего на вершинах Ливанских гор.</p> Повторяются заголовки <h4>ЛИВАН</h4> Можно ли придумать такую регулярку, которая может быстро находить в файле htm все подобные пары или тройки дубликатов? |