Ver Mensaje Individual
  #6 (permalink)  
Antiguo 24/04/2011, 11:45
javie_85
 
Fecha de Ingreso: enero-2011
Mensajes: 23
Antigüedad: 13 años, 3 meses
Puntos: 0
Respuesta: duda sobre caracteres \x93 \x94

A ver si me explico mejor pues. por ejemplo esto es un fragmento del texto que quiero procesar:

“¡Oh tío mío! ¡No hay inconveniente; podemos entrar sin peligro!”

De este texto quiero obtener los caracteres ", ahora bien, los caracteres " NO existen, porque por algun motivo que desconozco aparecen dos tipos de caracteres que lo sustituyen:

y

Mi dudas son varias, porque aparecen esos caracteres y no el caracter " ?, como hago para cambiar la codificación y que no aparezcan esos caracteres sino el mencionado y asi poder buscarlo?, si esto no es posible, como hago para obtener encontrar esos nuevos caracteres en el texto?. Todo esto lo quiero hacer con ER.

Espero haberme explicado mejor. Gracias por tu ayuda razpeitia


si a la cadena que he puesto de ejemplo le hago :

Código Python:
Ver original
  1. print repr(cadena)

me da:

Código Python:
Ver original
  1. u'\u201c\xa1Oh t\xedo m\xedo! \xa1No hay inconveniente; podemos entrar sin peligro!\u201d\n'

y originalmente estoy usando para buscar el caracter ":

Código Python:
Ver original
  1. craro = re.compile(r"""
  2. #Para explicar grupo
  3. (
  4. (\")
  5. )
  6. """, re.VERBOSE|re.U|re.I)

pero obviamente no funciona porque ese no es (") el caracter que aparece en el texto como he dicho

Última edición por javie_85; 24/04/2011 a las 11:58 Razón: ampliar información