Foros del Web » Estrategias Digitales y Negocios Online » SEO »

googlebot.com es un lector tremendo...

Estas en el tema de googlebot.com es un lector tremendo... en el foro de SEO en Foros del Web. me está haciendo polvo él solito se ha chupao +500Mb de la transferencia de mi host ... msnbot.msn.com 123Mb... qué puedo hacer para que no ...
  #1 (permalink)  
Antiguo 23/02/2005, 02:49
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
googlebot.com es un lector tremendo...

me está haciendo polvo él solito se ha chupao +500Mb de la transferencia de mi host ... msnbot.msn.com 123Mb... qué puedo hacer para que no se recorran toooooooodo el host y lo indexen??

El dominio lo tengo desde enero... se imagina que ahora la búsqueda de estos bots es mayor por la "novedad"?? puedo cortarles el paso de alguna forma una vez que hayan superado unos Mb de transferencia??

Otra cosa que quería preguntar aprovachando el post... mi host me crea estos archivos: access_log, access_log.processed, error_log, xferlog_regular y xferlog_regular.processed se puede usar algún sistema de estadístcas que recoja esta info?? el del host no me parece muy buen...

bueno, gracias y un saludo!!!!
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #2 (permalink)  
Antiguo 23/02/2005, 04:11
 
Fecha de Ingreso: diciembre-2004
Mensajes: 165
Antigüedad: 19 años, 4 meses
Puntos: 1
revisit

Dile que te visite cada X dias:


<META NAME="REVISIT-AFTER" CONTENT="2 Days">
<META NAME="REVISIT" CONTENT="2 days">
  #3 (permalink)  
Antiguo 23/02/2005, 04:14
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
gracias combinaciçon ;) añadiré la 2º línea a los que ya tenía para los bots... esto e slo que tenía...

<META NAME="Revisit-after" CONTENT="5 days">
<META NAME="robots" content="INDEX,FOLLOW">

a ver si así...
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #4 (permalink)  
Antiguo 23/02/2005, 09:32
Avatar de +oront0  
Fecha de Ingreso: febrero-2005
Ubicación: Por ahora en Madrid. Luego Granada o Moscu, no sé aún.
Mensajes: 34
Antigüedad: 19 años, 2 meses
Puntos: 0
Pregunta Eso funciona casi siempre.

¿Y todos los Bots hacen caso a esa etiqueta? Porque el de Google parece que lo hace cuando le da la bendita gana.

__________________
Mi Web personal: revista de diseño gráfico Maravilhion :Zzz:
Siempre recuerda: quod me nutrit me destruit
Mi última página: El sitio de los peces venenosos - www.pezmalo.com :neurotico
  #5 (permalink)  
Antiguo 23/02/2005, 09:36
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
yo aparte tengo el robots.txt con:

User-Agent: *
Allow: /
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #6 (permalink)  
Antiguo 24/02/2005, 02:16
Ex Colaborador
 
Fecha de Ingreso: junio-2002
Mensajes: 9.091
Antigüedad: 21 años, 10 meses
Puntos: 16
Hola,
Cita:
Iniciado por +oront0
¿Y todos los Bots hacen caso a esa etiqueta? Porque el de Google parece que lo hace cuando le da la bendita gana.

Ese meta es orientativo/informativo, los robots lo pueden tener en cuenta o no. Normalmente son ellos mismos los que deciden la frecuencia de visita.

saludos.
__________________
Josemi

Aprendiz de mucho, maestro de poco.
  #7 (permalink)  
Antiguo 24/02/2005, 13:41
 
Fecha de Ingreso: octubre-2004
Mensajes: 877
Antigüedad: 19 años, 6 meses
Puntos: 2
El robots.txt SI es utilizado y respetado por todos los buscadores.

Lo que te pregunto es: en verdad deseas que Google no visite tu sitio??
  #8 (permalink)  
Antiguo 25/02/2005, 02:10
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
a ver... yo quiero que me visite.. pero esque se ha chupado este mes 500Mb de transferencia y el del msn casi 200Mb... eso qiere decir que he tenido que bloquear mi dominio para que no me cobren el exceso de transferencia.... me he pasao ya 32Mb espero que lo dejen pasar

Estoy pensando hen hacer una tabla donde almacenar todos los días la tranferencia de las direcciones host que me visitan... y poner un máximo de 6Mb diarios... y cuando se pasen pues mostrarles una pantalla ponga que se han pasado del límite diario...

Alguien me puede ayudar?? por cierto, mi panel de control es "Plesk" y en la primera página muestra la transferencia usadas hasta el momento... puedo consultar ese dato desde fuera del panel de control??? lo digo porque así al llegar por ejemplo a los 950 transferidos redirigir la página al servidor de mi@... que es lo que he tenido qu ehacer manualmente...

Gracias!!!
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #9 (permalink)  
Antiguo 25/02/2005, 06:58
Avatar de walo  
Fecha de Ingreso: mayo-2004
Mensajes: 310
Antigüedad: 20 años
Puntos: 0
La unica forma de hacer eso seria usando APIs del panel de control, pero seria una locura pensar en eso, ya que te hace totalmente vulnerable.

Conclucion, no podes obtener el valor de la transferencia consumida.
Aparte de eso, los valores de consumo, generalmente se actualizan un vez al dia.
Por ejemplo, si a la mañana tenes 999Mb consumidos, va a llegar la noche y podrias estar arriba de los 1000Mb
  #10 (permalink)  
Antiguo 25/02/2005, 07:15
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
ya... esoty haciendo un sistema para ir almacenando la info de cada IP que se pasa par el portal y guardar las páginas vistas, sus vitidas (+10mins) y los Kb transferidos... a ver que tal me sale ;)...
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #11 (permalink)  
Antiguo 25/02/2005, 07:16
Ex Colaborador
 
Fecha de Ingreso: junio-2002
Mensajes: 9.091
Antigüedad: 21 años, 10 meses
Puntos: 16
Cita:
esque se ha chupado este mes 500Mb de transferencia y el del msn casi 200Mb
¿Solo de contenido HTML? ¿O te estan leyendo las imagenes? Porque con paginas de 50kb esos 500mb equivalen a 10.000 paginas/accesos. En problemas de transferencia, lo primero que yo haria seria prohibir a los robots acceder a las imagenes. Lo segundo a bloquear a los robots son los directorios de ficheros js y css. Y si usas un CMS (prefabricado o hecho por ti), bloquear las paginas que no tienen contenido util. Basicamente dejarle solo leer los HTML de contenido. Tambien miraria las urls que intenta indexar, sobre todo si contienen el parametro de id de sesion. Ahora mismo no se si googlebot sigue tomando como paginas distintas las URLs cuya unica diferencia es el valor del id de sesion presente como parametro en la URL.

Saludos.
__________________
Josemi

Aprendiz de mucho, maestro de poco.
  #12 (permalink)  
Antiguo 25/02/2005, 07:31
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
mmmmmmm, y cómo le indico que no accedan a las imágenes?? el portal es mudular, sólo se carga el index y coge los includes de las carpetas "principal" y "web", cómo los bloqueo la carpeta "lib" ahí es donde tengo la conf. de la BD, sistema de estadísticas, de encuestas, el editor de HTML, los estilos, etc... y ya por último... qué es CMS???

Gracias!!!
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
  #13 (permalink)  
Antiguo 28/02/2005, 04:16
Avatar de X3mdesign  
Fecha de Ingreso: octubre-2003
Ubicación: Madrid
Mensajes: 649
Antigüedad: 20 años, 6 meses
Puntos: 2
he estado investigando... y he añadido esto a mi metaTag "NOIMAGEINDEX" quedándose:

<META NAME="robots" content="INDEX,FOLLOW,NOIMAGEINDEX">

y al robot.txt le he añadido Disallow: /imagenes quedándose:

User-Agent: *
Allow: /
Disallow: /imagenes

no se si ésta es la estructura correcta de indicar que indexe todo menos el directorio /imagenes.... supongo que los subdirectorios tampoco los indexa... no??

Saludos y gracias a todos!!!!
__________________
Nippon-Tour, tu portal sobre Japón
¿Te gusta el manga, haces tus propios dibujos? Visita FanArt de Nippon-Tour
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 06:09.