Celsus
Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Пытаюсь очистить HtML и оставить только название и адрес определенных ссылок, чтобы потом придумать, как с помощью AHK, Regex или AWK или чегото еще автоматически копировать адреса ссылок в другой документ в соответствующие места [url=]. Есть однотипные блоки <li>........</li> с одинаковой структурой, но с разными значениями (названия ссылок, адреса ссылок, даты и пр). Я подобрал код regmatch чтобы оставить только название и адрес ссылки, но если обрабатывать два таких однотипных блока <li>........</li> , то обрабатывается только последний, а в первом группы не работают. По ссылке должна быть выделена часть 3 строки (Forgiven Not Forgotten) и 15 строки (forgiven-not-forgotten/3882443) https://regex101.com/r/akdoAI/1 Нужно, чтобы эти названия и адреса ссылок шли столбиком. Там правда еще один момент, в блоке <li>...</li> одинаковых записи со словом href="/release две, но с этим разберусь позже. Оказывается, через поиск в notepad++ ссылки ищутся и выдаются списком. Правда, Тогда вопрос не актуален, но все еще интересен. пишут, что с помощью regex находится только последняя группа с точным совпадением Добавлено: Вот, я подобрал код, выделяется то, что мне нужно. https://regex101.com/r/VRw8SN/1 (Group 2 и Group 4) или так https://regex101.com/r/fY29Jo/1 (Group 3 и Group 5) Как теперь удалить все остальное? Чтобы остались строки: 1 + 2 и 3 + 4 Perfect Storm + /perfect-storm/3265557 Glasshouse + /glasshouse/3265543 (перед первыми слэшами еще нужно будет добавить начало адреса, оно общее у всех ссылок) | Всего записей: 384 | Зарегистр. 02-04-2011 | Отправлено: 10:09 28-09-2022 | Исправлено: Celsus, 12:50 28-09-2022 |
|