Foros del Web » Programación para mayores de 30 ;) » Bases de Datos General » Mysql »

Caracteres utf8

Estas en el tema de Caracteres utf8 en el foro de Mysql en Foros del Web. ¿Cuantos bytes maximo ocupa un caracter codificado en utf8? Saludos...
  #1 (permalink)  
Antiguo 20/04/2008, 12:54
 
Fecha de Ingreso: octubre-2007
Mensajes: 394
Antigüedad: 16 años, 5 meses
Puntos: 2
Caracteres utf8

¿Cuantos bytes maximo ocupa un caracter codificado en utf8?


Saludos
  #2 (permalink)  
Antiguo 20/04/2008, 13:45
 
Fecha de Ingreso: diciembre-2005
Ubicación: Redondela (Galicia)
Mensajes: 368
Antigüedad: 18 años, 4 meses
Puntos: 1
Re: Caracteres utf8

Tiene narices que utilices un foro para preguntar eso... ¿Has probado a buscar UTF-8 en la Wikipedia, por ejemplo?
  #3 (permalink)  
Antiguo 20/04/2008, 15:58
 
Fecha de Ingreso: octubre-2007
Mensajes: 394
Antigüedad: 16 años, 5 meses
Puntos: 2
Re: Caracteres utf8

La verdad que en todos los foros tiene que haber alguien como tu ........ xo bueno.....

Aber parece raro .......fui yo el que hice la pregunta y sere yo quien te tenga que responder............ utf-8 se claramente que usa de 1 a 4 bytes por caracter...... como bien dice tu amiga la wikipedia

pero si consultas esta pagina: http://dev.mysql.com/doc/refman/5.0/...code-sets.html

veras como dice: 'utf8, a UTF-8 encoding of the Unicode character set using one to three bytes per character'

Ahí esta mi duda..........generalmente antes de preguntar aqui suelo echar un ojo por internet.......y si he preguntado es porque he encontrado cosas diferentes en varios siitios y puede que algo no este entendiendo bien.........

pero bueno..........

Como se ve que tu lo sabes todo.......pues supongo que me podras explicar un poco este tema...

Un saludo
  #4 (permalink)  
Antiguo 21/04/2008, 03:17
 
Fecha de Ingreso: diciembre-2005
Ubicación: Redondela (Galicia)
Mensajes: 368
Antigüedad: 18 años, 4 meses
Puntos: 1
Re: Caracteres utf8

Cita:
La verdad que en todos los foros tiene que haber alguien como tu ........ xo bueno.....
Aún por encima, insolente.

Mira, si has buscado información lo primero que debes hacer es compartirla, antes de formular tu pregunta. Eres tú el que falla, y no lo serías si tu primer post fuese el segundo, y habrías obtenido posiblemente una contestación a tu pregunta, o al menos ayuda. A parte de eso, te sugiero que utilices títulos claros para los hilos que abras, tendrás una mayor probabilidad de éxito y contribuirás a que el foro tenga una mayor calidad.

Cita:
Como se ve que tu lo sabes todo...
Eso es una estupidez. Eso sí, yo estoy contento de una virtud que tengo: Acepto las críticas y las normas cuando tienen sentido.

En fin, no estoy muy seguro de porqué difiere la documentación de MySQL con la de la Wikipedia, pero se me ocurre que podría ser que MySQL no implemente la última parte de UTF-8, que es la que utiliza 4 bytes por carácter:

Cita:
1. One byte is needed to encode the 128 US-ASCII characters (Unicode range U+0000 to U+007F).
2. Two bytes are needed for Latin letters with diacritics and for characters from Greek, Cyrillic, Armenian, Hebrew, Arabic, Syriac and Thaana alphabets (Unicode range U+0080 to U+07FF).
3. Three bytes are needed for the rest of the Basic Multilingual Plane (which contains virtually all characters in common use).
4. Four bytes are needed for characters in the other planes of Unicode, which are rarely used in practice.
O eso, o utiliza una versión modificada de UTF-8 para guardar la información, al estilo de Java u Oracle (pero no es más que pura especulación, no tengo ni idea): http://en.wikipedia.org/wiki/UTF-8#UTF-8_derivations.
  #5 (permalink)  
Antiguo 21/04/2008, 03:22
 
Fecha de Ingreso: diciembre-2005
Ubicación: Redondela (Galicia)
Mensajes: 368
Antigüedad: 18 años, 4 meses
Puntos: 1
Re: Caracteres utf8

Vale, creo que son las dos cosas... creo entender que usa una versión modificada de UTF-8, la cual precisamente no cuenta con la última parte, la de 32 bits, por considerarla innecesaria: http://dev.mysql.com/doc/refman/5.0/...t-unicode.html.

Más información: http://en.wikipedia.org/wiki/Basic_Multilingual_Plane.
  #6 (permalink)  
Antiguo 21/04/2008, 04:15
 
Fecha de Ingreso: octubre-2007
Mensajes: 394
Antigüedad: 16 años, 5 meses
Puntos: 2
Re: Caracteres utf8

Vale, aun asi lo mas seguro es que la tome como si fueran 4 bytes... porque ya me conozco estas cosas........ lo preparo todo teniendo en cuenta que van a ser 3 bytes por caracter y dentro de dos meses sacan una nueva version de mysql diciendo que ahora van a ocupar 4 bytes....

Un saludo, gracias
  #7 (permalink)  
Antiguo 21/04/2008, 07:43
Avatar de gnzsoloyo
Moderador criollo
 
Fecha de Ingreso: noviembre-2007
Ubicación: Actualmente en Buenos Aires (el enemigo ancestral)
Mensajes: 23.324
Antigüedad: 16 años, 4 meses
Puntos: 2658
Re: Caracteres utf8

Blade_Stom:
1. Antes de ahogarte en explicaciones de UTF8, tal vez sería bueno, como ya te dijeron, consultar a Wiki por la respuesta. Tal vez usando la versión en castellano (español, como han inventado decirle desde hace algunos años): http://es.wikipedia.org/wiki/UTF-8.
El problema central, que se te está escapando, es que no es cuestión de almacenamiento, sino de transmisión. Como MySQL está orientado a la web, tiene que considerar los requerimientos de los sistemas de transmisión por los que va a pasar (muchas veces obsoletos), y de esta forma debe tratar de lograr que la información que llegue a destino sea consistente. Nada más.
2. El fastidio que expresó Sanva por tu post inicial, y que muchas veces nos afecta a quienes participamos asiduamente del foro, es porque a veces hay foristas begginers que dan la impresión de jamás haberse puesto a aprender lo mínimo fundamental de bases de datos o MySQL antes de hacer las preguntas; y las mismas resultan tan básicas que uno se pregunta a veces "¿Se meten en el foro a preguntar esto?". Uno espera que para hacer consultas, al menos sepan algunas cosas mínimas. Por momentos da la impresión que ni lo mínimo conocen. Nos recuerdan a las preguntas infantiles como por ejemplo (como de dice en Argentina): "¿De qué color era el caballo blanco de San Martín?".
No es pretensión de esta nota el ofender, sino tratar de hacer compender por qué a veces las respuestas son como son...
... suerte y continúa por acá.
  #8 (permalink)  
Antiguo 21/04/2008, 14:56
 
Fecha de Ingreso: octubre-2007
Mensajes: 394
Antigüedad: 16 años, 5 meses
Puntos: 2
Re: Caracteres utf8

ya bueno...me lo imagine...por eso en mi ultimo post deje totalmente ese tema.......
gracias por la informacion........


(aqui se dice "De qué color era el caballo blanco de SANTIAGO?" .............no de debe ser una pregunta tan facil cuando uno de mi clase respondió: "MMMM.....nose...." pero bueno.....ese es caso aparte xD

Un saludo
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 21:18.