Foros del Web » Administración de Sistemas » Unix / Linux »

Prblemas con la codificación de caracteres archivos .txt

Estas en el tema de Prblemas con la codificación de caracteres archivos .txt en el foro de Unix / Linux en Foros del Web. Si creo en linux un archivo.txt , para poder leerlo correctamente en windows aplico el siguiente comando @import url("http://static.forosdelweb.com/clientscript/vbulletin_css/geshi.css"); Código BASH: Ver original recode UTF- ...
  #1 (permalink)  
Antiguo 17/02/2014, 23:38
 
Fecha de Ingreso: octubre-2011
Mensajes: 166
Antigüedad: 12 años, 6 meses
Puntos: 31
Prblemas con la codificación de caracteres archivos .txt

Si creo en linux un archivo.txt , para poder leerlo correctamente en windows aplico el siguiente comando
Código BASH:
Ver original
  1. recode UTF-8..ISO-8859-1 archivo.txt && unix2dos archivo.txt
Ei problema lo tengo al convertir archivos .pdf a .txt , esta conversión la hago aplicando el siguiente comando
Código BASH:
Ver original
  1. pdftotext archivo.pdf
se creará archivo.txt , pero no puedo leerlo correctamente en windows ya que los caracteres españoles como ser ñ y acentos no los reconoce, tampoco lo hace aplicando el comando
recode UTF-8..ISO-8859-1 archivo.txt && unix2dos archivo.txt

Esto me hace pensar que se trata de un problema de codificación de caracteres que no llego a comprender.

Última edición por EnriqueK; 17/02/2014 a las 23:47
  #2 (permalink)  
Antiguo 21/02/2014, 22:30
Avatar de webosiris
Moderador egiptólogo
 
Fecha de Ingreso: febrero-2002
Ubicación: Luxor, Egipto
Mensajes: 10.725
Antigüedad: 22 años, 2 meses
Puntos: 998
Respuesta: Prblemas con la codificación de caracteres archivos .txt

windows debería leer sin problemas archivos utf-8, para mi que tu problema está en windows...

no debería de ser necesario cambiar de utf a iso, yo tengo ambos so instalados y nunca he tenido problemas para sin hacer nada extra leer desde windows archivos de texto creados en linux
__________________
Pasamos tus PSD a HTML

Pobre del que lo sabe todo, porque no tiene nada más que aprender ni razón para vivir. -
  #3 (permalink)  
Antiguo 22/02/2014, 17:35
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: Prblemas con la codificación de caracteres archivos .txt

Cualquier editor de texto decente debería saber leer el archivo apropiadamente, en Linux o en Windows.
En cualquier caso, podés convertir a iso8859-1 fácilmente usando el programa iconv.
  #4 (permalink)  
Antiguo 23/02/2014, 19:12
 
Fecha de Ingreso: octubre-2011
Mensajes: 166
Antigüedad: 12 años, 6 meses
Puntos: 31
Respuesta: Prblemas con la codificación de caracteres archivos .txt

Estuve probando y puedo decir que en la mayoría de los archivos convertidos a .txt de linux, puedo leerlos bien en windows aplicando el comando antes indicado o sea
recode UTF-8..ISO-8859-1 archivo.txt && unix2dos archivo.txt
Poro no siempre, hay archivos a los que ese comando no les surte efecto
respeto a iconv , si aplico este comando
unix2dos < in.txt | iconv -f UTF-8 -t ISO8859-1 > out.txt
me da error
Este problema lo soluciono abriendo el txt con libreoffice y lo guardo como .odt, a ese .odt lo abro en windows con libreoffice y lo guardo como .txt de windows , o sea el uso de libreoffice en ambos SSOO soluciona el tema, pero es algo enrevesado
  #5 (permalink)  
Antiguo 24/02/2014, 08:51
Avatar de enlinea777  
Fecha de Ingreso: mayo-2008
Ubicación: frente al pc
Mensajes: 1.830
Antigüedad: 15 años, 11 meses
Puntos: 127
Respuesta: Prblemas con la codificación de caracteres archivos .txt

lo que te recomiendo es crear una rutina en bash, perl, php, etc
que te haga un reemplazo de los caracteres a caracteres legibles asi te evitas el recorrido por open ofice.
  #6 (permalink)  
Antiguo 26/02/2014, 08:59
Avatar de webosiris
Moderador egiptólogo
 
Fecha de Ingreso: febrero-2002
Ubicación: Luxor, Egipto
Mensajes: 10.725
Antigüedad: 22 años, 2 meses
Puntos: 998
Respuesta: Prblemas con la codificación de caracteres archivos .txt

más que crear rutinas, remplazar caracteres y demás yo intentaría atacar el problema de raíz: para empezar no deberías de necesitar nada de eso porque no debería de haber ningún problema.

Yo acabo de hacer la prueba, creé un archivo (cuyo contenido era "á é í ó ú ñ") utf-8 en linux (con el programa Kate en Kubuntu 13.10) y sin necesidad de hacer nada lo puedo abrir sin ningún problema con el Notepad del Windows 7.

Así que si tienes problemas eso se puede deber a:
- algún problema de tu windows
- la forma en como creas los .txt
__________________
Pasamos tus PSD a HTML

Pobre del que lo sabe todo, porque no tiene nada más que aprender ni razón para vivir. -

Etiquetas: caracteres, linux, txt
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 09:00.