Tema: parsear HTML
Ver Mensaje Individual
  #4 (permalink)  
Antiguo 11/02/2013, 11:47
Avatar de jonni09lo
jonni09lo
Colaborador
 
Fecha de Ingreso: septiembre-2011
Ubicación: Estigia
Mensajes: 1.471
Antigüedad: 12 años, 8 meses
Puntos: 397
Respuesta: parsear HTML

pero no entodas las pag web es lo mismo ....

Ese si es un problema, porque si el contenido es de un solo sitio web o el contenido son etiquetas especificas (og tags, meta tags, etc.) no seria tan complejo, ya que con expresiones regulares se soluciona fácilmente eso.

El asunto es que deben haber parámetros fijos que TODAS las paginas deberían tener, parámetros que debes de definir en base a lo que quieres lograr, no se, etiquetas especificas, estructuras definidas etc.

Obtendrías el contenido del documento, y bajo esos parámetros y expresiones regulares obtendrías lo que deseas, esa seria la idea base

Saludos
__________________
Haz preguntas inteligentes-Como ser Hacker
No hacer preguntas por mensaje privado. No sólo no es inteligente sino que es egoísta.