Foros del Web » Estrategias Digitales y Negocios Online » Negocios »

Solo para enterados

Estas en el tema de Solo para enterados en el foro de Negocios en Foros del Web. No sabía donde poner esto, espero que sea el sitio indicado. En las stats de mi sitio encontré que el robot de Alexa (ia_archiver) y ...
  #1 (permalink)  
Antiguo 28/11/2003, 04:40
Avatar de Yorch  
Fecha de Ingreso: noviembre-2002
Ubicación: Ciudad de la eterna Promavera
Mensajes: 107
Antigüedad: 21 años, 6 meses
Puntos: 0
Solo para enterados

No sabía donde poner esto, espero que sea el sitio indicado.

En las stats de mi sitio encontré que el robot de Alexa (ia_archiver) y otros (como Altavista y Goggle) buscan un archivo "robots.txt" en la raiz del sitio, ¿alguien sabe que se supone que espera encontrar en él?, supongo que se usa para informarle al robot la estructura del sitio, actualizaciones y cosas así, pero son solo conjeturas.

Supongo que con ello se podría mantener el sitio en cuestión actualizado en buscadores como el propio alexa, google, y otros, pero lo bueno sería saber qué poner y como ponerlo ¿no?. Aunque supongo que esa información no está a libre acceso de todos y es muy especializada.

Bueno ojalá alguien sepa, seguro eso nos serviría mucho a los que buscamos hacer bien las cosas.

Suerte y saludos a todos.
__________________
Saludos y muchas gracias, chaw.
http://www.dig-medios.com
  #2 (permalink)  
Antiguo 28/11/2003, 04:54
Ex Colaborador
 
Fecha de Ingreso: junio-2002
Mensajes: 9.091
Antigüedad: 21 años, 10 meses
Puntos: 16
Hola,

El robots.txt es para indicar a los robots que partes de la web NO PUEDE visitar. Sirve para que no indexen por ejemplo ciertos tipos de ficheros, ciertos directorios, etc. Mas info http://www.robotstxt.org/

Por cierto, los robots "malignos" (los que recogen direcciones de email de las paginas, por ejemplo), no obedecen normalmente estas restricciones.

Saludos.
__________________
Josemi

Aprendiz de mucho, maestro de poco.
  #3 (permalink)  
Antiguo 28/11/2003, 13:11
 
Fecha de Ingreso: septiembre-2003
Ubicación: España
Mensajes: 76
Antigüedad: 20 años, 7 meses
Puntos: 0
Una vez que te hayas mirado la pagina que te manda josemi y tengas el robots.txt a tu gusto puedes comprobar su sintaxis y que todo esta bien con esta utilidad :

http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

Si tienes una web en html o asi no muy compleja lo mejor es no tener robots.txt para que los spiders entren cuando quieran y cacheen todo lo visble al publico.

Un saludo
  #4 (permalink)  
Antiguo 28/11/2003, 14:17
ivanff
Invitado
 
Mensajes: n/a
Puntos:
Pero el robots.txt lo deben tener todos los websites o simplemente los servidores, creía haber leido en otros post que el .txt se colocaba en el servidor.
  #5 (permalink)  
Antiguo 28/11/2003, 14:48
Ex Colaborador
 
Fecha de Ingreso: junio-2002
Mensajes: 9.091
Antigüedad: 21 años, 10 meses
Puntos: 16
Es por website, bueno, por dominio y creo que por subdominio, y debe estar en el directorio raiz del dominio/subdoinio: dominio.com/robots.txt

Saludos.
__________________
Josemi

Aprendiz de mucho, maestro de poco.
  #6 (permalink)  
Antiguo 29/11/2003, 17:00
Avatar de Yorch  
Fecha de Ingreso: noviembre-2002
Ubicación: Ciudad de la eterna Promavera
Mensajes: 107
Antigüedad: 21 años, 6 meses
Puntos: 0
Pues tal vez no está disponible por http porque pedi la dirección y me regresa error 404, y por ejemplo en Alexa, Inktomi, Google y otros si esta disponible por http.


Gracias a todos, sabía que aquí sabrían.
__________________
Saludos y muchas gracias, chaw.
http://www.dig-medios.com
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 12:50.