Ver Mensaje Individual
  #10 (permalink)  
Antiguo 23/05/2012, 15:39
manuel__7
 
Fecha de Ingreso: abril-2012
Mensajes: 88
Antigüedad: 12 años, 1 mes
Puntos: 1
Respuesta: eliminar enlaces offline

He avanzado mucho, pero aun no consigo lograrlo

1.- Este código obtiene los enlaces de www.ejemplo.com de acuerdo a la etiqueta <a href=""></a>:

Código PHP:
<?php
$html 
file_get_contents('www.ejemplo.com');
function 
extract_links($html) {
    
$links = array();
    
preg_match_all('/<a\s+.*?href=[\"\']?([^\"\' >]*)[\"\']?[^>]*>(.*?)<\/a>/i'$html,$matches,PREG_SET_ORDER);
    foreach(
$matches as $match) {
        
$links[] = array($match[1],$match[2]);
    }
    return 
$links;
}
$links extract_links($html);
foreach (
$links as $link) {
    echo 
$link[0] . PHP_EOL;
}
?>
,pero como hago para obtener otro tipo de etiquetas como input, img, etc?


2.- Esto me mostrara todos los <a href=""></a> existentes dicha página, pero cuando la página (www.ejemplo.com) tiene un iframe que llama a otra página que le provee enlaces aleatorios, como hago para obtener tambien esos enlaces (<a href=""></a>) desde www.ejemplo.com?


Sabiendo esto podría estoy muy cerca de lo que desearía hacer!