He avanzado mucho, pero aun no consigo lograrlo
1.- Este código obtiene los enlaces de www.ejemplo.com de acuerdo a la etiqueta <a href=""></a>:
Código PHP:
<?php
$html = file_get_contents('www.ejemplo.com');
function extract_links($html) {
$links = array();
preg_match_all('/<a\s+.*?href=[\"\']?([^\"\' >]*)[\"\']?[^>]*>(.*?)<\/a>/i', $html,$matches,PREG_SET_ORDER);
foreach($matches as $match) {
$links[] = array($match[1],$match[2]);
}
return $links;
}
$links = extract_links($html);
foreach ($links as $link) {
echo $link[0] . PHP_EOL;
}
?>
,pero como hago para obtener otro tipo de etiquetas como input, img, etc?
2.- Esto me mostrara todos los <a href=""></a> existentes dicha página, pero cuando la página (www.ejemplo.com) tiene un iframe que llama a otra página que le provee enlaces aleatorios, como hago para obtener tambien esos enlaces (<a href=""></a>) desde www.ejemplo.com?
Sabiendo esto podría estoy muy cerca de lo que desearía hacer!