Foros del Web » Programación para mayores de 30 ;) » Bases de Datos General » Mysql »

Busqueda en campos fulltext de caracteres japoneses

Estas en el tema de Busqueda en campos fulltext de caracteres japoneses en el foro de Mysql en Foros del Web. Hola gente, Tengo un problema interesante, necesito hacer una busqueda sobre terminos que tengo almacenados en una base de datos mysql bajo un campo con ...
  #1 (permalink)  
Antiguo 14/10/2008, 13:56
Avatar de DjFaramir  
Fecha de Ingreso: febrero-2003
Ubicación: La Plata, Buenos Aires, Argentina
Mensajes: 131
Antigüedad: 21 años, 2 meses
Puntos: 0
Busqueda en campos fulltext de caracteres japoneses

Hola gente,

Tengo un problema interesante, necesito hacer una busqueda sobre terminos que tengo almacenados en una base de datos mysql bajo un campo con index fulltext...
El asunto es que los fulltext no funcionan con textos en japones ya que no tienen espacios y hacer una busqueda con LIKE resulta bastante incomodo y lento ya que solo se puede hacer (o eso tengo entendido) con "termino%" y no con "%termino%" ya que este ultimo romperia el index y buscaria en toda la tabla sin respetar el indice...

Esa es al menos la informacion que tengo de parte del administrador de la base de datos cuando le pregunte al respecto.

Alguna sugerencia? algun dato nuevo que hayan publicado la gente de mysql que yo no haya visto? alternativas?

Desde ya muchas gracias
__________________
See you... y Tolkien... mucho Tolkien...
  #2 (permalink)  
Antiguo 14/10/2008, 14:17
Colaborador
 
Fecha de Ingreso: marzo-2008
Ubicación: Cáceres
Mensajes: 3.735
Antigüedad: 16 años, 1 mes
Puntos: 300
Respuesta: Busqueda en campos fulltext de caracteres japoneses

Cita:
El parser FULLTEXT determina dónde empiezan y acaban las palabras buscando algunos delimitadores, por ejemplo ' ' (el espacio), , (coma), y . (punto). Si las palabras no se separan por delmitadores como, por ejemplo, en chino, el parser FULLTEXT no puede determinar dónde empieza y acaba una palabra. Para ser capaz de añadir palabras o índices indexados en tales idiomas en un índice FULLTEXT, debe preprocesarlos para que se eliminen mediante algún delimitador arbitrario tal como "
Esto lo he sacado del manual de MySQL.

Añades los espacios o separaciones (coma o punto) y buscas sobre ese campo indexado... Si usas siempre el mismo delimitador te resultará muy fácil mostrar el texto sin separaciones mediante un replace. No tendrás que escribir el texto nada más que una vez, eso sí con delimitador entre palabras.

No sé nada de japonés, pero es lo que se me ocurre si es que quieres usar un fulltext
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 21:18.