Сообщение от impersonalis
Если я применю этот регэксп целиком к телу, то получу просто false, не так ли? На что опираться выбирая разделители для нарезки тела на потенциальные ссылки?
|
#<a\s[^>]*href=\"([^\"]*)\"[^>]*>(.*)<\/a>#siU
|
Нет ^ и $ то есть нет чёткого ограничения для регулярки. Она гуляет по всему тексту с рекурсией. (см
мой мини учебник)
Обрати внимание на круглые скобки. Всё что в них выплюнется в результат.
Тобеж для каждого найденного будет:
0) полная строка по шаблону. Например: <a href="http://popka/">ссылка</a>
1)<a href="
{текст отсюда}"></a>
2)<a href="">
{и текст отсюда}</a>
Сообщение от jimon
impersonalis
будь уверен - внутри <a ... href - ссылка, но ! а что вместо ссылки там javascript ?! (это тот который в адресной строке выполнится) Where is Your God Now ?
|
Будь уверен что после получения html кода и запуска JS DOM уже не будет прежним. Чёрт побери, да современная веб страница перестраивает себя зачастую чуть ли не на 50% в процессе работы.