Ver Mensaje Individual
  #3 (permalink)  
Antiguo 08/05/2009, 17:15
DKain
 
Fecha de Ingreso: junio-2008
Mensajes: 61
Antigüedad: 15 años, 11 meses
Puntos: 0
Respuesta: Capturar texto de otra web?

Si se puede realizar con cierto grado de alcance, de forma sesgada y no en su totalidad, ademas es algo complejo de usar ya que necesitas:

1.- Validar la URL, existe o no existente
2.- Usar el metodo HttpWebRequest para configurar el uso de la pagina, checa otros foros, sobre todo en ingles, hay mucho del manejo de esta clase, aqui tambien configuras el navegador
3.- Limpiar con Regex tus nodos, en el paso 5 te explicare para que es esto
4.- Usar XmlTextReader (aun cuando sea http, etc) y XmlNodeType para poder manejar la pagina, con esto ignoras las etiquetas que no vayas a usar
5.- Este es el paso mas importante, ya que se van a leer las etiquetas, busca las genericas que sean comunes como title, description, link, etc.

Evalua que tan necesario es el hecho de sacar la información de una pagina por que de entrada es muy extenso de limpiar, por no decir que es casi imposible debido a las diferencias de practicamente TODAS las paginas y que puedas evaluar algo asi. Si algo de lo que te comento te puede servir, utilizalo, ya que es un tema muy extenso y si necesitas acotar este requerimiento, seria mejor, saludos!