Tema: Crawler
Ver Mensaje Individual
  #18 (permalink)  
Antiguo 17/02/2011, 07:41
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Crawler

no tengo un intérprete de Python acá, así que lo siguiente puede tener errores.

bs.img es un atajo para bs.findall("img").
La representación de la etiqueta sea la etiqueta misma, pero el objeto también posee algunos atributos, en especial el valor de los atributos en el HTML. Por lo tanto, podés obtener la ruta de la imagen como

Código Python:
Ver original
  1. for imagen in bs.img:
  2.     ruta = imagen.src
  3.     nombre_archivo = os.path.basename(ruta)

Lo que te comentaba es que crees el archivo local con el nombre que obtengas de nombre_archivo. si estás en windows, asegurate de usar un modo de apertura binario para el archivo, o de lo contrario no quedará bien guardado (usa, por ejemplo el modo 'wb' para crear el archivo nuevo)


Saludos.