Foros del Web » Estrategias Digitales y Negocios Online » SEO »

problemas con robots.txt quien lo entiende?

Estas en el tema de problemas con robots.txt quien lo entiende? en el foro de SEO en Foros del Web. Estoy añadiendo datos en google merchant y me da este error en robots.txt Imágenes bloqueadas por robots.txt (20 elementos) Parece que el archivo robots.txt bloquea ...
  #1 (permalink)  
Antiguo 09/02/2012, 11:18
Avatar de Scape  
Fecha de Ingreso: octubre-2006
Mensajes: 626
Antigüedad: 17 años, 6 meses
Puntos: 7
problemas con robots.txt quien lo entiende?

Estoy añadiendo datos en google merchant y me da este error en robots.txt


Imágenes bloqueadas por robots.txt (20 elementos)
Parece que el archivo robots.txt bloquea la URL de la imagen enviada. Google no podrá mostrar estas imágenes junto con los productos. Modifica el archivo robots.txt para permitir que Google descargue la imagen.

Que tengo hacer para permitir entrar entrar a las imagenes de mi web?

Gracias.
  #2 (permalink)  
Antiguo 09/02/2012, 11:25
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Respuesta: problemas con robots.txt quien lo entiende?

Cita:
Iniciado por Scape Ver Mensaje

Que tengo hacer para permitir entrar entrar a las imagenes de mi web?
No comprendo la parte que no entendés

Cita:
Iniciado por Scape Ver Mensaje
Modifica el archivo robots.txt para permitir que Google descargue la imagen.

Tenés que detectar la carpeta donde se alojan tus imágenes
Editar tu archivo robots.txt y eliminar la línea de referencia
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #3 (permalink)  
Antiguo 09/02/2012, 12:51
Avatar de Scape  
Fecha de Ingreso: octubre-2006
Mensajes: 626
Antigüedad: 17 años, 6 meses
Puntos: 7
Respuesta: problemas con robots.txt quien lo entiende?

Cita:
Iniciado por Daniel Ulczyk Ver Mensaje
No comprendo la parte que no entendés



Tenés que detectar la carpeta donde se alojan tus imágenes
Editar tu archivo robots.txt y eliminar la línea de referencia
si mis imagen están por ejemplo en la carpeta llama media y tengo que esta linea en robots.txt

Disallow: /media/

Que hago, la elimino? Pongo Allow en vez de Disallow?

Si hago esto no será malo para otra cosa?

Gracias, perdona
  #4 (permalink)  
Antiguo 09/02/2012, 12:59
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: problemas con robots.txt quien lo entiende?

Cita:
Iniciado por Scape Ver Mensaje
si mis imagen están por ejemplo en la carpeta llama media y tengo que esta linea en robots.txt

Disallow: /media/

Que hago, la elimino? Pongo Allow en vez de Disallow?
Tal y como bien te dice el compañero, debes eliminar esa línea del robots.txt para que se solucione el problema.

Cita:
Iniciado por Scape Ver Mensaje
Si hago esto no será malo para otra cosa?
Para nada, otra cosa es que no quieras que Google te indexe las fotos en su sección de imagenes, pero para eso ya deberías utilizar la protección hotlink.

Última edición por Usuarios466; 22/02/2012 a las 04:23
  #5 (permalink)  
Antiguo 09/02/2012, 13:05
 
Fecha de Ingreso: octubre-2011
Mensajes: 56
Antigüedad: 12 años, 5 meses
Puntos: 5
Respuesta: problemas con robots.txt quien lo entiende?

Buenas con el Disallow lo que estas haciendo es evitar la entrada al directorio media, en todo caso deberas ponerle un Allow quedando asi:

Allow: /media/

O simplemente quitar la linea, ya que en teoria tu robots.txt debe de empezar asi:

User-agent: *
Allow: /

Con lo cual haces Allow a todo menos cuando se diga lo contrario con un Disallow...

Saludos
  #6 (permalink)  
Antiguo 09/02/2012, 13:06
Avatar de Scape  
Fecha de Ingreso: octubre-2006
Mensajes: 626
Antigüedad: 17 años, 6 meses
Puntos: 7
Respuesta: problemas con robots.txt quien lo entiende?

Muchas gracias, voy a probar ahora a ver si quiere tirar, :)
  #7 (permalink)  
Antiguo 09/02/2012, 13:13
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: problemas con robots.txt quien lo entiende?

Mejor quitar la línea, así haces más ligero el robots.txt, porque total, si no pones nada, ya das por entendido que todo es "Allow", no hace falta especificarlo.

Última edición por Usuarios466; 22/02/2012 a las 04:23
  #8 (permalink)  
Antiguo 09/02/2012, 16:13
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Respuesta: problemas con robots.txt quien lo entiende?

Cita:
Iniciado por Erneston Ver Mensaje
ya que en teoria tu robots.txt debe de empezar asi:
No hay teorías aquí. Para eso están las especificaciones y los protocolos de robots.txt la declaración allow, no existe
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #9 (permalink)  
Antiguo 12/02/2012, 08:54
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: problemas con robots.txt quien lo entiende?

Cita:
Iniciado por Daniel Ulczyk Ver Mensaje
No hay teorías aquí. Para eso están las especificaciones y los protocolos de robots.txt la declaración allow, no existe
Así es, he vuelto a leerme las especificaciones y los protocoles de robots.txt y en ningún caso especifica que existe la declaración "Allow".

Pero de todas formas, he visitado el archivo robots de algunas webs, y sí que lo ponen (y no son pocos). ¿Entonces quiere decir que todos lo hacen mal? ¿Por qué se ha extendido pues esa mala práctica?

Entiendo que si hay una declaración "Disallow" para que X robot no indexe un determinado contenido, también debería de haber una declaración que diga que queremos que indexe determinado contenido.

Llegados a este punto, podemos decir que lo correcto sería:

Código HTML:
User-Agent: *
Pero, como decía, hay muchos que ponen:

Código HTML:
User-Agent: *
Allow: /
Se entiende que poniendo el "User-Agent" con el asterisco para que pasen todos los robots y spiders dices que son a todos, sin restricciones, pero me gustaría saber si es perjudicial, penalizable, o qué ocurre si ponemos el "Allow" o si no lo ponemos.

¿También se puede linkar el Sitemap desde el robots de esta forma, o mejor sólo enlazarlo desde las HPW y ya está?

Código HTML:
User-Agent: *
Allow: /

Sitemap: http://web.com/sitemap.xml
¿O mejor así?

Código HTML:
User-Agent: *

Sitemap: http://web.com/sitemap.xml

Última edición por Usuarios466; 22/02/2012 a las 04:24
  #10 (permalink)  
Antiguo 12/02/2012, 15:31
Avatar de charlyalegret  
Fecha de Ingreso: septiembre-2011
Ubicación: Barcelona
Mensajes: 705
Antigüedad: 12 años, 6 meses
Puntos: 140
Respuesta: problemas con robots.txt quien lo entiende?

Personalmente, no tengo ni idea si sireve de algo el allow o no, pero penalizable, no creo... alguien se ha fijado en http://www.google.es/robots.txt ??

Parece ser que usa el allow para hacer excepciones a un disallow anterior más general. Interpreto, entonces, que almenos google lo interpreta de esa manera, esté o no especificado en los protocolos...

Saludos

Edito: google lo explica en su soporte, el uso de Allow... http://support.google.com/webmasters...&answer=156449
  #11 (permalink)  
Antiguo 13/02/2012, 03:43
Usuarios466
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: problemas con robots.txt quien lo entiende?

Muy interesante, nunca había visto el robots.txt de Google.
  #12 (permalink)  
Antiguo 27/12/2012, 06:07
 
Fecha de Ingreso: julio-2004
Mensajes: 20
Antigüedad: 19 años, 9 meses
Puntos: 0
Respuesta: problemas con robots.txt quien lo entiende?

Hola,

Tengo el mismo problema en google merchand y el archivo robots lo tengo bien, permite las imagenes.

¿Puede ser que el problema se debe que tengo activada la protección hotlink para las iágenes en mi servidor?
Si es así ¿Como puedo permitir a google que acceda a mis imágenes?

Gracias.

Saludos
  #13 (permalink)  
Antiguo 28/12/2012, 11:04
Avatar de Tedel  
Fecha de Ingreso: enero-2011
Ubicación: Lima
Mensajes: 2.744
Antigüedad: 13 años, 3 meses
Puntos: 444
Respuesta: problemas con robots.txt quien lo entiende?

Esto es un error:

Código HTML:
User-Agent: *
Allow: /
Esto estaría mejor

Código HTML:
Sitemap: http://web.com/sitemap.xml
Respondiendo a la pregunta original, no necesitas retirar el bloqueo. Si no quieres que Google vea esas imágenes no quites el bloqueo en robots.txt; pero si lo estás bloqueando, no te quejes de que Google te diga que no lo encuentra.
__________________
Soy el autor de Heptagrama y tengo un servicio "todo incluido" de marketing web.

Etiquetas: google, url
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 14:28.