Показать сообщение отдельно
Старый 25.07.2012, 01:15   #42
Randomize
[object Object]
 
Аватар для Randomize
 
Регистрация: 01.08.2008
Адрес: В России
Сообщений: 4,358
Написано 2,472 полезных сообщений
(для 6,854 пользователей)
Ответ: URL в теле страницы

Сообщение от impersonalis Посмотреть сообщение
Если я применю этот регэксп целиком к телу, то получу просто false, не так ли? На что опираться выбирая разделители для нарезки тела на потенциальные ссылки?
#<a\s[^>]*href=\"([^\"]*)\"[^>]*>(.*)<\/a>#siU
Нет ^ и $ то есть нет чёткого ограничения для регулярки. Она гуляет по всему тексту с рекурсией. (см мой мини учебник)
Обрати внимание на круглые скобки. Всё что в них выплюнется в результат.

Тобеж для каждого найденного будет:
0) полная строка по шаблону. Например: <a href="http://popka/">ссылка</a>
1)<a href="{текст отсюда}"></a>
2)<a href="">{и текст отсюда}</a>

Сообщение от jimon Посмотреть сообщение
impersonalis
будь уверен - внутри <a ... href - ссылка, но ! а что вместо ссылки там javascript ?! (это тот который в адресной строке выполнится) Where is Your God Now ?
Будь уверен что после получения html кода и запуска JS DOM уже не будет прежним. Чёрт побери, да современная веб страница перестраивает себя зачастую чуть ли не на 50% в процессе работы.
__________________
Retry, Abort, Ignore? █
Intel Core i7-9700 4.70 Ghz; 64Gb; Nvidia RTX 3070
AMD Ryzen 7 3800X 4.3Ghz; 64Gb; Nvidia 1070Ti
AMD Ryzen 7 1700X 3.4Ghz; 8Gb; AMD RX 570
AMD Athlon II 2.6Ghz; 8Gb; Nvidia GTX 750 Ti
(Offline)
 
Ответить с цитированием
Сообщение было полезно следующим пользователям:
impersonalis (25.07.2012)