Ver Mensaje Individual
  #1 (permalink)  
Antiguo 09/02/2010, 09:58
Avatar de huesos52
huesos52
Colaborador
 
Fecha de Ingreso: febrero-2009
Ubicación: Manizales - Colombia
Mensajes: 5.980
Antigüedad: 15 años, 3 meses
Puntos: 360
Codificación de archivo

Buen día foro

Me ha llegado un archivo en formato txt con poco mas de 3 millones de registros para ser cargado a una tabla en postgresql. El archivo se encuentra delimitado por comas para la separación de los campos y enter para terminación de lineas.

Algunos campos son nombres de estaciones climáticas y traen consigo tildes y Ñs.

La base de datos está en latin1 y si ingreso manualmente tildes y Ñs no tengo problema. Sin embargo, al cargar el archivo con la sentencia copy estos caracteres no son reconocidos.

Haciendo uso del gedit de opensuse, he guardado el archivo y aplicado la codificación western ISO-8859-1 (que corresponde a latin1) sin tener resultados satisfactorios.

He probado guardar el archivo como UTF8, windows-1252 sin éxito.

Posteo acá en el foro de base de datos en general, por que he hecho la prueba en una tabla mysql y se me presenta exactamente el mismo problema.

De no dar con una solución, supongo que tendré que tendré que hacer actualizaciones masivas de caracteres extraños con su correspondiente significado.

saludos y gracias
__________________
Without data, You are another person with an opinion.
W. Edwads Deming