Foros del Web » Programando para Internet » PHP »

como detectar el idioma de una cadena/sitio web? como hace google?

Estas en el tema de como detectar el idioma de una cadena/sitio web? como hace google? en el foro de PHP en Foros del Web. como seria la logica para detectar el idioma que esta una cadena o un sitio web entero? como podria hacerse con php? necesitaria una base ...
  #1 (permalink)  
Antiguo 26/01/2006, 03:49
 
Fecha de Ingreso: enero-2003
Mensajes: 122
Antigüedad: 14 años, 11 meses
Puntos: 1
como detectar el idioma de una cadena/sitio web? como hace google?

como seria la logica para detectar el idioma que esta una cadena o un sitio web entero?

como podria hacerse con php?

necesitaria una base de datos de palabras de cada pais? pues nose como se haria alguna idea?
  #2 (permalink)  
Antiguo 26/01/2006, 06:37
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
Hmmm pues algunas webs en su cabecera html especifican el idioma aca te pongo el ejemplo de varias webs que abri que tengo de varios idiomas :

[code]
<HTML lang="ja"> JAPONES
<html lang="en-AU"> INGLES
<html dir="ltr" lang="es"> ESPAÑOL (FOROSDELWEB)
[CODE]

ABRI UNA PAGINA RUSA, UNA ALEMANA Y UNA CHINA y lastimosamente no traen esa cabecera :( , no se lo de las palabras me parece mas lento tratare de ayudarte buscando
  #3 (permalink)  
Antiguo 26/01/2006, 07:06
Avatar de Acadio  
Fecha de Ingreso: octubre-2005
Mensajes: 48
Antigüedad: 12 años, 1 mes
Puntos: 0
Con variabes de sesión?¿
  #4 (permalink)  
Antiguo 26/01/2006, 07:52
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
Mira, yo lo hice una vez, mas no recuerdo donde esta el script por que perdi mucha data en un disco duro, pero lo que hice fue detectar el IP claro está que toda esa info debe estar en una base de datos, hay un script en una pagina de venzuela que se llama php.com.ve el cual es este

http://php.com.ve/download.php?view.23

el lo que hace es detectar el IP y muestra una banderita al usuario indicandole de que pais es, lo bueno es que ya en este script tiens toda la info de las ips a nivel mundial, y lo que tendrias que hacer es que depende el IP que tenga, lo lea en la base de datos y que te muestre la web en el idioma.

Leete el script que te dije que hay esta bien explicado lo de detectar el IP asi que bueno SUERTE y cualquier cosa avisas.
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #5 (permalink)  
Antiguo 26/01/2006, 08:00
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
Hmm yo ya habia pensado en eso pero lastimosamente la ubicacion del servidor no implica el idioma d ela pagina son cosas totalmente distintas ya que si asi fuera la mayoria de webs fuesen de habla inglesa ;) una de mis paginas esta en español y esta alojada en un servidor cuyo datacenter esta en los estados unidos. y no soy gringo ¡¡
una ves vi un traductor en el cual si no sabias el idioma de procedencia simplemente dabas la url y al idioma a traducir y el detectaba el idioma. creo que para eso necesitan una gran DB de palabras en dicersos idiomas imaginoq ue las mas comunes como articulos sujetos preposiciones y jerga informatica

te doy una idea que podria hacer que el script corra mas rapido. como habras visto las webs por idioma raro que tengan por lo general sus vinculos la direccion expresan el contenido pero en ingles

en una pagina rusa hay un enlace con el texto Фото знаменитостей -> el cual enlaza a celebrities-gallery.html me imagino que esa palabra en ruso sera celebridades me imagino que es mas facil comprara o enviar la cadena a un traductor, no se es un poco complejo, pensandolo bien creo que lo de un listado d epalabras iria mejor :P
  #6 (permalink)  
Antiguo 26/01/2006, 08:15
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
Ok, creo que no me entendiste la idea que te di, el script LEE el IP del Visitante y muestra el idioma el pais del visitante, lo que tienes que añadir es que cuando sea en china muestre la pagina en chino, si esta en europa que lo muestre en ingles o en portugues o en frances, ya eso son declaraciones de idiomas que lo harias o por base de datos o por archivos.php..
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #7 (permalink)  
Antiguo 26/01/2006, 08:17
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
Ahh es que tu diste la solucion a otra cosa :P , lo que el pide es la forma de por ejemplo sber cual es el idioma de paginawebextraña.td.up y no del visitante ;) si lo que deseas saber es el idioma del visitante puedes ver el idioma del navegador del visitante que siempre es una variable que esta presente en la imformacion del navegador
  #8 (permalink)  
Antiguo 26/01/2006, 08:27
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
ummmmmmm creo que el lo que quiere es hacer que si alguien entra en USA su web se muestre en ingles, si alguien entra en china su web se muestre en chino, please clara eso Ramos
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #9 (permalink)  
Antiguo 26/01/2006, 08:35
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
pues yo entendi que el desea con un script en php saber X.x pagina en que idioma esta.

si es para saber el lenguaje del visitante este articulo te servira de mucho
http://alexsancho.name/archives/2005...uaje-con-php/#
  #10 (permalink)  
Antiguo 26/01/2006, 09:55
Avatar de forecast  
Fecha de Ingreso: octubre-2004
Mensajes: 259
Antigüedad: 13 años, 2 meses
Puntos: 4
Miren, este tema me interesa a mi también. Yo creo que lo que quiere saber es la web a la que entra, no el idioma del visitante (y eso me interesa a mi también ; ) ).

<HTML lang="lo que sea"> se ajusta a lo que necesitamos... pero muy pocas páginas lo incorporan.

Yo pregunté un tema parecido y no obtuve respuesta. A lo mejor no hay manera de hacerlo...

Saludos.
  #11 (permalink)  
Antiguo 26/01/2006, 10:09
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
yava yava yava yava definamos bien el objetivo del tema por favor, que es muy interesante, lo que yo entendi es que lo que se requiere es que como hace google, que si me conecte en china me aparece google en chino, si estoy en venezuela, me aparece google en español no es eso? osea que el sistema o la pagina detecte el idioma y muestre de una vez la pagina en el idioma indicado?
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #12 (permalink)  
Antiguo 26/01/2006, 12:56
Avatar de Acadio  
Fecha de Ingreso: octubre-2005
Mensajes: 48
Antigüedad: 12 años, 1 mes
Puntos: 0
Vaya, yo tb entendi mal la pregunta...

La cuestion es que si se coje el idioma del navegador, la información no es exacta del todo, ya que puede que yo tenga el Firefox en ingles siendo Español.

Esto creo que tb se utiliza para las tipicas estadisticas de una web para saber cuanta gente de un pais entra, el caso es que para salvar este problema, tb miran la hora en que se ha realizado la conexión y se hace un promedio.
  #13 (permalink)  
Antiguo 26/01/2006, 13:51
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
por eso es que es mejor mostrar dependiendo la direccion IP, no creen????????
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #14 (permalink)  
Antiguo 26/01/2006, 21:34
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
Yo coincido con forecast , amigo es posible , es dificil pero no hay cosas imposibles ;) lo que hay es que saber bien como optimizar la busqueda de palabras "clave" y asi saber con mayor fidelidad y exactitud el idioma de una web, el escritor del tema nunco menciono visitante ;)

las palabras clave hay que saber conseguirlas y realmente conseguir palabras de verdad claves
  #15 (permalink)  
Antiguo 27/01/2006, 03:50
Avatar de forecast  
Fecha de Ingreso: octubre-2004
Mensajes: 259
Antigüedad: 13 años, 2 meses
Puntos: 4
Yo propongo lo siguiente (creo que estamos discutiendo demasiado cual es el tema de este tema del foro).

Yo quiero saber en que idioma está hecha una web (y no el del cliente). Hablábamos de la etiqueta lang en el html.

dopon habla de palabras clave... y no se me antoja buena solución. ¿Como vas a hacerlo? ¿Vas a buscar una palabra en un idioma concreto y si la encuentra decir que ese es el idioma?¿Y si la web tiene citas en otros idiomas?... Yo creo que hasta que la etiqueta <HTML lang="lo que sea"> no sea obligatoria no tendremos un método fiable de saberlo.... y si me equivoco, que me corrijan y nos lo cuenten por favor!!!!
  #16 (permalink)  
Antiguo 27/01/2006, 08:23
Avatar de carlosfocus  
Fecha de Ingreso: enero-2006
Ubicación: Venezuela
Mensajes: 823
Antigüedad: 11 años, 11 meses
Puntos: 0
Wow yo creo que con lo de lang como dice forecast, en verdad esta interesante la pregunta, pero bueno me enrede diciendo lo de la ip del visitante, ahora, recordemos que google.com es Python

("Python has been an important part of Google since the beginning, and remains so as the system grows and evolves. Today dozens of Google engineers use Python, and we're looking for more people with skills in this language." said Peter Norvig, director of search quality at Google, Inc. )

La programacion es diferente y mo tediosa...

Voyh a buscar esa solucion ya que es importante y en verdad no me habia pasado por la mente.

Saludos.
__________________
Carlos Herrera
Web Developer
www.carlos.com.ve
Para descargar archivos propios a su Teléfono Mobil? www.carlosfocus.com
  #17 (permalink)  
Antiguo 27/01/2006, 10:12
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 12 años, 5 meses
Puntos: 1
forecast mira eso que tu propones existe no existe como un proyecto de codigo abierto hasta donde conozca, pero que existe existe , algunos traductores que una ves use , tu le dabas la url y el idioma a traducir y el detectaba el idioma automaticamente
  #18 (permalink)  
Antiguo 27/01/2006, 20:54
 
Fecha de Ingreso: enero-2003
Mensajes: 122
Antigüedad: 14 años, 11 meses
Puntos: 1
perdon por no alarar bien algunos me entendieron y otros no lo que pretendo hacer.

no es detectar el lenguaje del visitante ni pais de procedencia.

a lo que voy a detectar el idioma en que esta escrito X web, por ejemplo foros del web.

yo creo que el tema pasa por tener alguna base de datos de cada idioma y desglosar todas las palabras que se encuentren en X web y hacer comparaciones, y el idioma que mayor porcentaje de coincidencia con las palabras de la X web pues asignara ese idioma.

pues que piensan? no se me ocurre otra cosa.

saludos
  #19 (permalink)  
Antiguo 28/01/2006, 17:15
 
Fecha de Ingreso: enero-2003
Mensajes: 122
Antigüedad: 14 años, 11 meses
Puntos: 1
parece ser un tema complejo, alguien tiene idea de donde sacar una bd de palabras de cada pais, seria extremadamente tedioso tener que ponerlas manualmente, ;-(
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 04:24.