Foros del Web » Programación para mayores de 30 ;) » .NET »

Extraer las url de un sitio web completo c#

Estas en el tema de Extraer las url de un sitio web completo c# en el foro de .NET en Foros del Web. Hola, me gustaria saber como puedo extraer todos los enlaces que de un sitio web, he visto algunos articulos en los que muestran como hacerlo ...
  #1 (permalink)  
Antiguo 28/09/2008, 10:32
 
Fecha de Ingreso: octubre-2004
Mensajes: 38
Antigüedad: 19 años, 6 meses
Puntos: 0
Extraer las url de un sitio web completo c#

Hola,

me gustaria saber como puedo extraer todos los enlaces que de un sitio web, he visto algunos articulos en los que muestran como hacerlo de una sola pagina, pero quisiera saber si hay alguna libreria o algo para hacerlo de todo un sitio web en C#.

Gracias y un saludo.
  #2 (permalink)  
Antiguo 28/09/2008, 12:59
Avatar de Peterpay
Colaborador
 
Fecha de Ingreso: septiembre-2007
Ubicación: San Francisco, United States
Mensajes: 3.858
Antigüedad: 16 años, 8 meses
Puntos: 87
Respuesta: Extraer las url de un sitio web completo c#

Necesitaras usar regex para sacar los url's pero el detalle esta en definir las reglas que hagan el parado de tu busqueda, usar algun arbol para no recorrer 2 veces la misma rama del arbol de links y ya.

hace tiempo encontre un articulo que hablaba de como hacer un buen robot extractor optimizando todos esos aspectos para poder mantener la aplicacion lo mas eficiente y funcional posible, lo busco y con gusto lo publico en el faq.
__________________
Curso WF4
http://cursos.gurudotnet.com/ DF
Aprende HTML5
  #3 (permalink)  
Antiguo 28/09/2008, 13:51
 
Fecha de Ingreso: octubre-2004
Mensajes: 38
Antigüedad: 19 años, 6 meses
Puntos: 0
Respuesta: Extraer las url de un sitio web completo c#

Hola,

Gracias por la respuesta, si encuentras el articulo por favor avisame para que pueda cogerlo que me hace falta.
Escribe otra repuesta o un mensaje privado si quieres para avisarme, ok??

Muchisimas gracias
  #4 (permalink)  
Antiguo 28/09/2008, 18:51
 
Fecha de Ingreso: octubre-2000
Mensajes: 1.692
Antigüedad: 23 años, 6 meses
Puntos: 19
Respuesta: Extraer las url de un sitio web completo c#

Holas
Yo tambien me uno para que avises Peterpay cuando encuentres el articulo, asi espero me avises

Casualmente ando buscando tambien como obtener el texto que se encuentra en un html, por ejemplo si tengo:

<td id="contenido">
<td> TITULO<|td>
<td><strong>Parrafo principal<|td>
<|td>


Como podria hacer para obtener lo que esta en <td id="principal">
Yo pensaba posicionarme en <td id="principal"> y guardo todo el contenido hasta encontrar el cierre de la etiqueta, hasta ahi era mas o menos facil, el tema esta que como vez hay varias etiquetas que de cierre de td, no se como hacer esto.
__________________
PD: Con amor, fe, amor a Dios y amistad podemos hacer un mundo mejor!!!!
  #5 (permalink)  
Antiguo 29/09/2008, 07:32
Avatar de Peterpay
Colaborador
 
Fecha de Ingreso: septiembre-2007
Ubicación: San Francisco, United States
Mensajes: 3.858
Antigüedad: 16 años, 8 meses
Puntos: 87
Respuesta: Extraer las url de un sitio web completo c#

Trulala revisa esto http://www.regular-expressions.info/examples.html

hoy checo mi dd y les cuelgo el articulo en rapidshare.
__________________
Curso WF4
http://cursos.gurudotnet.com/ DF
Aprende HTML5
  #6 (permalink)  
Antiguo 29/09/2008, 09:26
 
Fecha de Ingreso: octubre-2000
Mensajes: 1.692
Antigüedad: 23 años, 6 meses
Puntos: 19
Respuesta: Extraer las url de un sitio web completo c#

Hola Peterpay
Muchas gracias por la pagina, veo que se puede hacer con expresiones regulares, ya lo voy a probar. Gracias!!!!!!
__________________
PD: Con amor, fe, amor a Dios y amistad podemos hacer un mundo mejor!!!!
  #7 (permalink)  
Antiguo 29/09/2008, 09:44
Avatar de Peterpay
Colaborador
 
Fecha de Ingreso: septiembre-2007
Ubicación: San Francisco, United States
Mensajes: 3.858
Antigüedad: 16 años, 8 meses
Puntos: 87
Respuesta: Extraer las url de un sitio web completo c#

miren aqui les dejo el link

Articulo sobre la implementacion un web crawler distribuido de alto rendimiento

ojo es solo teorico pero muchas de las ideas pueden implementarlas con .net o perl( mejor para eso a mi parecer) de forma rapida y muy efiiciente siguiendo esos consejos.
__________________
Curso WF4
http://cursos.gurudotnet.com/ DF
Aprende HTML5
  #8 (permalink)  
Antiguo 29/09/2008, 11:09
 
Fecha de Ingreso: octubre-2000
Mensajes: 1.692
Antigüedad: 23 años, 6 meses
Puntos: 19
Respuesta: Extraer las url de un sitio web completo c#

Buenisimo, muchas gracias!!!!!!!
__________________
PD: Con amor, fe, amor a Dios y amistad podemos hacer un mundo mejor!!!!
  #9 (permalink)  
Antiguo 29/09/2008, 15:09
 
Fecha de Ingreso: octubre-2004
Mensajes: 38
Antigüedad: 19 años, 6 meses
Puntos: 0
Respuesta: Extraer las url de un sitio web completo c#

Muchisimas gracias por articulo, espero poder ponerlo en practica y si lo consigo os avisare. Gracias de nuevo

Un saludo.
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta

SíEste tema le ha gustado a 2 personas




La zona horaria es GMT -6. Ahora son las 03:13.