Ver Mensaje Individual
  #1 (permalink)  
Antiguo 03/10/2011, 19:39
sam90
 
Fecha de Ingreso: abril-2010
Ubicación: Rosario
Mensajes: 1.850
Antigüedad: 14 años
Puntos: 228
Problema con codificacion de caracteres.

Estoy usando urllib2 y minidom de xml para leer y pasear partes de una pagina. Pero me tope que cierta parte de una pagina tiene el siguiente caracter: ° y entonces el minidom falla al parsear la pagina.

Mi pregunta es como hago para eliminar ese caracter, y algun otro caracter que se puede interponer??

Se que es problema del Unicode y del ASCII, probe un par de metodos casetos que encontre por otros lados pero no logre dar en la tecla.

Saludos