Ver Mensaje Individual
  #4 (permalink)  
Antiguo 10/02/2014, 14:14
Lokitozzz
 
Fecha de Ingreso: junio-2009
Mensajes: 138
Antigüedad: 14 años, 10 meses
Puntos: 4
Respuesta: Problema con for y Xpath

Probé pero sin éxito. Por eso decidí hacerlo así.

Cita:
Iniciado por carbon Ver Mensaje
Para parsear HTML por qué no probas con BeautifulSoup o HTMLParser (que viene con python)?

Perfecto aunque tengo otro problema.
Uso SublimeText y me arroja un error de codificación, mas bien el siguiente:

Código:
racktime.cl
angoleduca.cl
Traceback (most recent call last):
  File "C:\Users\Wolf\Documents\Python\index.py", line 20, in <module>
    print dom
UnicodeEncodeError: 'ascii' codec can't encode character u'\xfc' in position 1: ordinal not in range(128)
[Finished in 0.8s with exit code 1]
Como puedo solucionar eso? Gracias nuevamente.

Cita:
Iniciado por razpeitia Ver Mensaje
Código Python:
Ver original
  1. #!/usr/bin/python
  2.  
  3. import re
  4.  
  5. from lxml import html
  6. from mechanize import Browser
  7. br = Browser()
  8.  
  9.  
  10. br.set_handle_robots(False)
  11. br.addheaders = [('User-agent', 'Firefox')]
  12.  
  13. site = br.open('http://www.nic.cl/registry/Ultimos.do?t=1d')
  14.  
  15. if site.code == 200:
  16.   code = html.fromstring(site.read())
  17.   doms = code.xpath('//*[@id="box-tablaresultados"]/table/tr')
  18.   for dom in doms:
  19.     dom = ''.join(dom.xpath('./td/div[1]/a/text()'))
  20.     print dom

Solo es cuestión de conocer xpath, no realmente de python.