¿Cuantos bytes maximo ocupa un caracter codificado en utf8?
Saludos
| |||
Re: Caracteres utf8 La verdad que en todos los foros tiene que haber alguien como tu ........ xo bueno..... Aber parece raro .......fui yo el que hice la pregunta y sere yo quien te tenga que responder............ utf-8 se claramente que usa de 1 a 4 bytes por caracter...... como bien dice tu amiga la wikipedia pero si consultas esta pagina: http://dev.mysql.com/doc/refman/5.0/...code-sets.html veras como dice: 'utf8, a UTF-8 encoding of the Unicode character set using one to three bytes per character' Ahí esta mi duda..........generalmente antes de preguntar aqui suelo echar un ojo por internet.......y si he preguntado es porque he encontrado cosas diferentes en varios siitios y puede que algo no este entendiendo bien......... pero bueno.......... Como se ve que tu lo sabes todo.......pues supongo que me podras explicar un poco este tema... Un saludo |
| |||
Re: Caracteres utf8 Cita: Aún por encima, insolente. La verdad que en todos los foros tiene que haber alguien como tu ........ xo bueno..... Mira, si has buscado información lo primero que debes hacer es compartirla, antes de formular tu pregunta. Eres tú el que falla, y no lo serías si tu primer post fuese el segundo, y habrías obtenido posiblemente una contestación a tu pregunta, o al menos ayuda. A parte de eso, te sugiero que utilices títulos claros para los hilos que abras, tendrás una mayor probabilidad de éxito y contribuirás a que el foro tenga una mayor calidad. Cita: Eso es una estupidez. Eso sí, yo estoy contento de una virtud que tengo: Acepto las críticas y las normas cuando tienen sentido.Como se ve que tu lo sabes todo... En fin, no estoy muy seguro de porqué difiere la documentación de MySQL con la de la Wikipedia, pero se me ocurre que podría ser que MySQL no implemente la última parte de UTF-8, que es la que utiliza 4 bytes por carácter: Cita: O eso, o utiliza una versión modificada de UTF-8 para guardar la información, al estilo de Java u Oracle (pero no es más que pura especulación, no tengo ni idea): http://en.wikipedia.org/wiki/UTF-8#UTF-8_derivations. 1. One byte is needed to encode the 128 US-ASCII characters (Unicode range U+0000 to U+007F). 2. Two bytes are needed for Latin letters with diacritics and for characters from Greek, Cyrillic, Armenian, Hebrew, Arabic, Syriac and Thaana alphabets (Unicode range U+0080 to U+07FF). 3. Three bytes are needed for the rest of the Basic Multilingual Plane (which contains virtually all characters in common use). 4. Four bytes are needed for characters in the other planes of Unicode, which are rarely used in practice. |
| |||
Re: Caracteres utf8 Vale, creo que son las dos cosas... creo entender que usa una versión modificada de UTF-8, la cual precisamente no cuenta con la última parte, la de 32 bits, por considerarla innecesaria: http://dev.mysql.com/doc/refman/5.0/...t-unicode.html. Más información: http://en.wikipedia.org/wiki/Basic_Multilingual_Plane. |
| |||
Re: Caracteres utf8 Vale, aun asi lo mas seguro es que la tome como si fueran 4 bytes... porque ya me conozco estas cosas........ lo preparo todo teniendo en cuenta que van a ser 3 bytes por caracter y dentro de dos meses sacan una nueva version de mysql diciendo que ahora van a ocupar 4 bytes.... Un saludo, gracias |
| ||||
Re: Caracteres utf8 Blade_Stom: 1. Antes de ahogarte en explicaciones de UTF8, tal vez sería bueno, como ya te dijeron, consultar a Wiki por la respuesta. Tal vez usando la versión en castellano (español, como han inventado decirle desde hace algunos años): http://es.wikipedia.org/wiki/UTF-8. El problema central, que se te está escapando, es que no es cuestión de almacenamiento, sino de transmisión. Como MySQL está orientado a la web, tiene que considerar los requerimientos de los sistemas de transmisión por los que va a pasar (muchas veces obsoletos), y de esta forma debe tratar de lograr que la información que llegue a destino sea consistente. Nada más. 2. El fastidio que expresó Sanva por tu post inicial, y que muchas veces nos afecta a quienes participamos asiduamente del foro, es porque a veces hay foristas begginers que dan la impresión de jamás haberse puesto a aprender lo mínimo fundamental de bases de datos o MySQL antes de hacer las preguntas; y las mismas resultan tan básicas que uno se pregunta a veces "¿Se meten en el foro a preguntar esto?". Uno espera que para hacer consultas, al menos sepan algunas cosas mínimas. Por momentos da la impresión que ni lo mínimo conocen. Nos recuerdan a las preguntas infantiles como por ejemplo (como de dice en Argentina): "¿De qué color era el caballo blanco de San Martín?". No es pretensión de esta nota el ofender, sino tratar de hacer compender por qué a veces las respuestas son como son... ... suerte y continúa por acá. |
| |||
Re: Caracteres utf8 ya bueno...me lo imagine...por eso en mi ultimo post deje totalmente ese tema....... gracias por la informacion........ (aqui se dice "De qué color era el caballo blanco de SANTIAGO?" .............no de debe ser una pregunta tan facil cuando uno de mi clase respondió: "MMMM.....nose...." pero bueno.....ese es caso aparte xD Un saludo |