Ver Mensaje Individual
  #4 (permalink)  
Antiguo 17/06/2009, 08:21
Avatar de PosicionamientoSeo
PosicionamientoSeo
 
Fecha de Ingreso: julio-2008
Ubicación: Argentina
Mensajes: 858
Antigüedad: 15 años, 10 meses
Puntos: 64
Respuesta: Al parecer he bloqueado que Googlebot indexe mi sitio

Cita:
Iniciado por thebestboy2671 Ver Mensaje
Cómo debería quedar si sólo quiero que me indexe las entradas del blog, más no los archivos administrativos (wp-admin, wp-includes). ¿Debería bloquear algo más? Por ahora el archivo me quedo así:

Código:
User-Agent: *
Allow: /

# disallow all files with ? in url
Disallow: /*?*

User-Agent: Googlebot-Image
Disallow: /
 
# disable duggmirror
User-agent: duggmirror
Disallow: /

# allow adsense bot on entire site
User-agent: Mediapartners-Google
Allow: /

# BEGIN XML-SITEMAP-PLUGIN, busquedas no
Sitemap: http://tusitio.com/sitemap.xml.gz
Disallow: /?s=
Disallow: /search
# END XML-SITEMAP-PLUGIN

#
# Permitimos el feed general para Google Blogsearch.
#
# Impedimos que permalink/feed/ sea indexado ya que el
# feed con los comentarios suele posicionarse en lugar de
# la entrada y desorienta a los usuarios.
#
# Lo mismo con URLs terminadas en /trackback/ que sólo
# sirven como Trackback URI (y son contenido duplicado).
#

Allow: /feed/$
Disallow: /feed
Disallow: /comments/feed
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$

#
# A partir de aquí es opcional pero recomendado.
#

# Lista de bots que suelen respetar el robots.txt pero rara
# vez hacen un buen uso del sitio y abusan bastante...
# Añadir al gusto del consumidor...

User-agent: MSIECrawler
Disallow: /

User-agent: WebCopier
Disallow: /

User-agent: HTTrack
Disallow: /

User-agent: Microsoft.URL.Control
Disallow: /

User-agent: libwww
Disallow: /

#
# Slurp (Yahoo!), Noxtrum y el bot de MSN a veces tienen
# idas de pinza, toca decirles que reduzcan la marcha.
# El valor es en segundos y podéis dejarlo bajo e ir 
# subiendo hasta el punto óptimo.
#

User-agent: noxtrumbot
Crawl-delay: 50

User-agent: msnbot
Crawl-delay: 30

User-agent: Slurp
Crawl-delay: 10

Te encuentras en lo correcto, lo mejor es testear el archivo para comprobar que lo habías bloqueado se desbloquee y vuelva a aparecer indexado.
El archivo robots.txt debe ser simple y bloquear sólo lo que consideres necesario, por éste motivo debes probarlo y en el caso de que funcione correctamente, dejarlo fijo.

Saludos
__________________
¡Feliz año 2011 para todos!