Foros del Web » Programando para Internet » PHP »

Extraer HTML de página web

Estas en el tema de Extraer HTML de página web en el foro de PHP en Foros del Web. Holas a todos, me gustaría saber si existe manera alguna de extraer el HTML de una página web; Tengo un programa en Visual Basic que ...
  #1 (permalink)  
Antiguo 08/05/2006, 16:24
Avatar de jcxnet  
Fecha de Ingreso: octubre-2005
Ubicación: Perú
Mensajes: 784
Antigüedad: 12 años, 2 meses
Puntos: 56
Extraer HTML de página web

Holas a todos, me gustaría saber si existe manera alguna de extraer el HTML de una página web; Tengo un programa en Visual Basic que quisiera pasarlo a PHP, estuve buscando un poco en la web pero no encontré mucho (casi nada ).
Si alguno tiene o sabe de algún script para hacer esto se lo agradecería .
__________________
►I'm a devil on the run ♂
Jcxnet.com
*Keep It Simple **
  #2 (permalink)  
Antiguo 08/05/2006, 16:34
Avatar de mauled  
Fecha de Ingreso: marzo-2005
Ubicación: Cd. de México.
Mensajes: 3.001
Antigüedad: 12 años, 9 meses
Puntos: 33
Si pudieras explicar cual es la finalidad de extraer html de tu pagina. Se entenderia mas tu problema.

Gracias
  #3 (permalink)  
Antiguo 08/05/2006, 16:44
 
Fecha de Ingreso: abril-2006
Mensajes: 27
Antigüedad: 11 años, 7 meses
Puntos: 0
Igualmente no esta muy claro el por que de extraer html de una pagina...siempre para comentar o pedir ayuda sobre estos temas tienes que ser mas explicito.

saludos
  #4 (permalink)  
Antiguo 08/05/2006, 16:47
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 15 años, 11 meses
Puntos: 126
En PHP eliminar todo lo que quede bajo <....> (que serían "tag's" HTML) lo puedes hacer con la función:

strip_tags()
http://www.php.net/manual/es/function.strip-tags.php

Y como eso te dará problemas con CSS y por ejemplo .. ahí debes usar expresiones regulares. Revisa los mensajes de los usuarios de esa función . .hay ejemplos más complejos para sustituir a esa función.

Un saludo,
__________________
Por motivos personales ya no puedo estar con Uds. Fue grato haber compartido todos estos años. Igualmente los seguiré leyendo.
  #5 (permalink)  
Antiguo 08/05/2006, 18:45
Avatar de jcxnet  
Fecha de Ingreso: octubre-2005
Ubicación: Perú
Mensajes: 784
Antigüedad: 12 años, 2 meses
Puntos: 56
Lamento mucho no haber sido tan claro, pero lo que necesito es extraer información de ciertas páginas, específicamente son patentes, el extractor lo tengo realizado en visual basic; y deseo pasarlo a php. Básicamente lo que necesito es extraer ciertas partes del contenido de una página; por ejemplo en este link:
http://patft.uspto.gov/netacgi/nph-P...y=PN%2F4419203
Lo que necesito extraer es:
- Abstract
- Inventors
- Assignee
- Filed
- Claims
y luego genero un resumen con todos los datos extraídos.
Espero haber sido claro.
__________________
►I'm a devil on the run ♂
Jcxnet.com
*Keep It Simple **
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 12:42.