Tema: Crawler
Ver Mensaje Individual
  #3 (permalink)  
Antiguo 14/02/2011, 05:30
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Crawler

+1 a BeautifulSoup. Una vez que tengas el HTML en una variable, digamos que se llama "html", podés hacer esto:

Código Python:
Ver original
  1. bs = BeautifulSoup(html)
  2. bs.img
donde bs.img es una lista de todas las imágenes del documento. Fijate en la documentación:
http://www.crummy.com/software/Beaut...ing%20HTML


Saludos.