Foros del Web - Ver Mensaje Individual

chuidiang · #3 (**permalink**) 21/04/2006, 15:39

Hola:

Un posible algoritmo consiste en ver la probabilidad de que una letra siga a una pareja de letras. Me explico:

El articulo en ingles es "the" y se usa bastante. La probabilidad de que en un texto en inglés una "e" vaya detás de una "th" es alta.

En español esa probabilidad es casi nula. No conozco ninguna palabra en español que tenga "the" en ningún sitio.

El algoritmo consiste entonces en coger un texto largo en un idioma de interés y analizarlo, anotando en alguna estructura para cada dos letras cual es la tercera, ver cuantas veces aparece y obtener así una especie de tabla de probabilidades.

Luego, para reconocer el idioma de otro texto, hay que hacer el mismo cálculo y ver a cual se parece más de los que tienes almacenados.

Bueno, es sólo la idea.

Se bueno.