Foros del Web » Programando para Internet » PHP »

Saber cuantos enlaces tiene una pagina web

Estas en el tema de Saber cuantos enlaces tiene una pagina web en el foro de PHP en Foros del Web. hola, me gustaria saber como puedo scannear paginas webs por ejemplo: tengo un sitio web: "http://la-web.com" con entonces desde mi sitio web, que aya un ...
  #1 (permalink)  
Antiguo 10/12/2008, 07:25
Avatar de Fierce  
Fecha de Ingreso: marzo-2008
Mensajes: 216
Antigüedad: 11 años, 10 meses
Puntos: 3
Saber cuantos enlaces tiene una pagina web

hola, me gustaria saber como puedo scannear paginas webs

por ejemplo:

tengo un sitio web: "http://la-web.com" con

entonces desde mi sitio web, que aya un codigo php el cual me muestre todos los enlaces que tiene dicha web.


y si es posible tambien que muestre el nombre de la etiqueta del enlace

o sea si hay un link asi:
<a herf="http://la-web.com/canciones/shakira.html">Canciones</a>

entonces que los muestre asi:
link: http://la-web.com/canciones/shakira.html - Etiqueta: Canciones
  #2 (permalink)  
Antiguo 10/12/2008, 07:36
 
Fecha de Ingreso: septiembre-2008
Mensajes: 29
Antigüedad: 11 años, 4 meses
Puntos: 0
Respuesta: Saber cuantos enlaces tiene una pagina web

En el otro post te he comentado como obtener el código html de una página en concreto.
Ahora seria cuestión de ir parseando el código html como si fuese un string cualquiera.
Supongo que con indexof no debería darte problemas, en plan:
Código PHP:
$pos indexOf($cadena"<a herf=\", $pos2);
while($pos != -1) {
$pos = indexOf($cadena, "
<a herf=", $pos2);
$pos2 = indexOf($cadena, "
>", $pos);
$enlace = substr($cadena, $pos, $pos2-$pos);
echo $enlace;

No estoy muy seguro de si el orden de los parámetros era así y tendrás que perfilar un poco el substr para que salga exactamente lo que quieres pero supongo que te podrás hacer una idea del sistema.
Ya después sería cuestión de ir parseando todos los datos que necesites.

Última edición por elchicosinhada; 10/12/2008 a las 07:36 Razón: Añadir etiqueta PHP
  #3 (permalink)  
Antiguo 10/12/2008, 16:11
Avatar de Fierce  
Fecha de Ingreso: marzo-2008
Mensajes: 216
Antigüedad: 11 años, 10 meses
Puntos: 3
De acuerdo Respuesta: Saber cuantos enlaces tiene una pagina web

elchicosinhada... eres un TESO!
  #4 (permalink)  
Antiguo 15/12/2008, 01:16
Avatar de Fierce  
Fecha de Ingreso: marzo-2008
Mensajes: 216
Antigüedad: 11 años, 10 meses
Puntos: 3
Respuesta: Saber cuantos enlaces tiene una pagina web

bah, eso no funciono, el indexof al parecer no funciona en PHP mas diria que es un codigo de Java, Pascal o Delphi
  #5 (permalink)  
Antiguo 15/12/2008, 01:43
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 11 años, 9 meses
Puntos: 2534
Respuesta: Saber cuantos enlaces tiene una pagina web

mm.... has investigado en la manual alguna función similar ???

te recomiendo substr ... suerte!
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.
  #6 (permalink)  
Antiguo 15/12/2008, 03:02
 
Fecha de Ingreso: septiembre-2008
Mensajes: 350
Antigüedad: 11 años, 4 meses
Puntos: 31
Respuesta: Saber cuantos enlaces tiene una pagina web

Hola quizás esto te sirva
lo puedes modificar a tu gusto

Código PHP:
<?php
$pagina 
0;
$URL "http://www.univision.com/";
$pagina = @fopen($URL"r");
echo(
"Enlaces en: $URL<br>\n");
echo(
"<ol>\n");
while(!
feof($pagina)) {
$linea fgets($pagina255);
while(
eregi("HREF=\"[^\"]*\""$linea$encontrados)) {
echo(
"<LI>");
echo(
$encontrados[0]);
echo(
"<br>\n");
$reemplaza ereg_replace("\?""\?"$encontrados[0]);
$linea ereg_replace($reemplaza""$linea);
}
}
echo(
"</ol>\n");
fclose($pagina);
?>
  #7 (permalink)  
Antiguo 15/12/2008, 03:25
 
Fecha de Ingreso: noviembre-2008
Mensajes: 85
Antigüedad: 11 años, 1 mes
Puntos: 2
Respuesta: Saber cuantos enlaces tiene una pagina web

Espero que te sirva este código.
http://www.rincondelcodigo.com/ver.php?var=55&num=18
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 11:10.