Foros del Web » Programando para Internet » PHP »

Extraer links de una URL

Estas en el tema de Extraer links de una URL en el foro de PHP en Foros del Web. Hola, despues de buscar un rato largo en internet decidi prguntar en forosdelweb. Lo que necesito hacer es buscar links en el codigo fuente de ...
  #1 (permalink)  
Antiguo 26/12/2007, 01:05
 
Fecha de Ingreso: diciembre-2007
Mensajes: 17
Antigüedad: 16 años, 4 meses
Puntos: 0
Extraer links de una URL

Hola, despues de buscar un rato largo en internet decidi prguntar en forosdelweb. Lo que necesito hacer es buscar links en el codigo fuente de X url. A esto se lo conoce como link extractor. Hasta acá todo bien. Ahora mi duda viene a rais de que de esta forma solo consigo los links que figuran en <a href= pero yo necesito trambien extraer aquellos que estan escritos pero sin un link. Es decir extraer aquellas palabras que comienzan con "http://". Una vez obtenido esto tambien quiero filtrar los resultados, es decir que de los links extraidos solo liste los de determinados host.
Se que estoy pidiendo mucho, pero con solo una orientacion me las rebuscaré. Es que estoy muy perdido y de esta forma no puedo usar google.

Desde ya muchas gracias.
  #2 (permalink)  
Antiguo 26/12/2007, 02:24
 
Fecha de Ingreso: noviembre-2002
Mensajes: 1.341
Antigüedad: 21 años, 5 meses
Puntos: 17
Re: Extraer links de una URL

Así a bote pronto, diría que con expresiones regulares. Tienes que sacar la lógica de la cadena que quieres sacar y luego aplicarlo con expresiones regulares.
  #3 (permalink)  
Antiguo 26/12/2007, 08:18
 
Fecha de Ingreso: diciembre-2007
Mensajes: 17
Antigüedad: 16 años, 4 meses
Puntos: 0
Re: Extraer links de una URL

Y eso traducido a un PHP mas básico....
Por ejemplo tengo la siguiente variable:

$texto = "Hola uno de los links es http://www.forosdelweb.com pero tambien podes visitar este otro <a href=\"/fhttp://www.forosdelweb.com/f18/extraer-links-url-543409/\" alt=\"Mi post\"> POST</a>"

¿Como extraería de $texto el link dentro de a href y el que esta escrito en texto plano?
  #4 (permalink)  
Antiguo 26/12/2007, 08:42
 
Fecha de Ingreso: noviembre-2002
Mensajes: 1.341
Antigüedad: 21 años, 5 meses
Puntos: 17
Re: Extraer links de una URL

Si no has trabajado nunca con expresiones regulares puede que te cueste un poco seguir su lógica, echale un vistazo a algún manual al respecto.

En PHP hay funciones que trabajan con expresiones regulares, ereg, eregi, ereg_replace y alguna más, miralas en el manual de PHP.

Podrías hacer dos búsquedas, una buscando http:// y lo que sea hasta que haya un espacio, y otras con el <a href= y lo que esté entre comillas.

Luego puedes validarlas (debe de haber cientos de funciones en PHP para validad urls).

Pero vamos, mira lo de las expresiones regulares.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 09:17.