Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Desindexar paginas desde robots.txt

Estas en el tema de Desindexar paginas desde robots.txt en el foro de SEO en Foros del Web. Hola, Me da algunos problemas mi web en herramientas google, algunos enlaces 404 que produce la plantilla de mi foro entre otras urls, como puedo ...
  #1 (permalink)  
Antiguo 13/10/2008, 16:26
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Desindexar paginas desde robots.txt

Hola,

Me da algunos problemas mi web en herramientas google, algunos enlaces 404 que produce la plantilla de mi foro entre otras urls, como puedo decirle a los robots que miren en todo mi sitio excepto en unas determinadas urls (no directorios, solo urls concretas), y asi indicarle una por una las urls que no quiero que encuentre?

Yo no he subido mi pagina a google ni a ningun buscador sin embargo me sale en las busquedas y no la tengo acabada, esto puede perjudicarme?

Saludos y muchas gracias.
  #2 (permalink)  
Antiguo 16/10/2008, 06:47
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Nadie puede echarme una mano? :(

Gracias
  #3 (permalink)  
Antiguo 16/10/2008, 08:48
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 6 meses
Puntos: 37
Respuesta: Desindexar paginas desde robots.txt

hola, te pongo un ejemplo

User-Agent: *
Disallow: /motor/*


Esto le dice a los bots que no indexen todas las webs del dominio en cuestion que esten dentro de directorio motor/
__________________
Anuncioneon.es - Modelofactura.es
  #4 (permalink)  
Antiguo 16/10/2008, 09:15
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Gracias, pero el caso es que esas urls están en el mismo directorio del foro osea en .../foro/ si le capo el rastreo me quedo sin paginas del foro en los buscadores :(

De todos modos gracias Santiagoanuncios :)
  #5 (permalink)  
Antiguo 16/10/2008, 09:20
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 6 meses
Puntos: 37
Respuesta: Desindexar paginas desde robots.txt

Hola, pues ponle la direccion que no queires que rastree.

User-Agent: *
Disallow: /motor/lawebquesea.html
__________________
Anuncioneon.es - Modelofactura.es
  #6 (permalink)  
Antiguo 16/10/2008, 09:23
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Asi por ejemplo?


User-Agent: *
Disallow: /foro/berenjenas-cosmicas.html;msg%msg_id%
/foro/berberechos-condensados.html;msg%msg_id%
etc,etc....

Asi estaria bien?

Saludos
  #7 (permalink)  
Antiguo 16/10/2008, 09:55
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 6 meses
Puntos: 37
Respuesta: Desindexar paginas desde robots.txt

User-Agent: *
Disallow: /foro/berenjenas-cosmicas.html
Disallow:/foro/berberechos-condensados.html
etc,etc....
__________________
Anuncioneon.es - Modelofactura.es
  #8 (permalink)  
Antiguo 16/10/2008, 10:55
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Hola gracias de nuevo,

El caso es que no se porque, pero se genera ese tipo de urls en mi foro, y son las que me están amargando con este tema, y el archivo original se llama berberechos-condensados.html osea que tampoco me encontraria la fuente del enlace, y este si quiero que se vea porque no me da problemas y puede traerme alguna visita...entonces poner el ;msg%msg_id% no sirve para nada?

Sabeis a que puede deberse esto?

Saludos y gracias
  #9 (permalink)  
Antiguo 17/10/2008, 09:32
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 6 meses
Puntos: 37
Respuesta: Desindexar paginas desde robots.txt

Hola si el msg_id es un parámetro que le pasas con un get y no queires que se indexen las urls con ese parametro ponle algo asi.

User-Agent: *
Disallow: /*msg_id*

Pero toda url que contenga esa palabra ( msg_id ) no la indexara el bot del buscador que sea.


Un saludo
__________________
Anuncioneon.es - Modelofactura.es
  #10 (permalink)  
Antiguo 17/10/2008, 09:46
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Puedo probarlo entonces, por lo visto son paginas diferentes, y seguro que las toma como copia, mientras no afecte a los enlaces que no tienen ese indicador,..entonces con ese simple codigo en mi robots.txt, google indexará cualquier enlace que encuentre salvo los que tengan ese termino, no?

Gracias de nuevo y saludos :)
  #11 (permalink)  
Antiguo 17/10/2008, 09:52
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 6 meses
Puntos: 37
Respuesta: Desindexar paginas desde robots.txt

Asi es, google y los demas buscaodres.
__________________
Anuncioneon.es - Modelofactura.es
  #12 (permalink)  
Antiguo 17/10/2008, 09:56
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Muchas gracias Santiago, te tendré informado pues :)

Saludos !!
  #13 (permalink)  
Antiguo 17/10/2008, 19:30
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Ya está hecho, tambien le añadí un sitemap.xml(generado online), lo edité a mano para sacar las url's repetidas que genera el foro, pero si tengo que hacer siempre lo mismo lo tengo claro, asi que esperaré a ver si funciona la solución que me has dado y hago lo mismo este tipo de urls sort=views,sort=replies‎‎, es que me salen muchos errores en herramientas de webmaster:

Errores de HTTP 18

No se ha encontrado 14

Metadescripciones duplicadas 7

Metadescripciones cortas 22 ( no se donde añadirle las metadescripciones al foro smf)

Etiquetas de titulo duplicadas 8

Con lo bien que me iba, que recien iniciar la web salia entre los 4 primeros resultados, y fué instalar el foro y salir del ranking para mis keywords fuertes :/, en fin... muchas gracias de nuevo ;)

Saludos
  #14 (permalink)  
Antiguo 23/10/2008, 16:34
Avatar de dforo  
Fecha de Ingreso: septiembre-2008
Ubicación: Barcino
Mensajes: 525
Antigüedad: 15 años, 7 meses
Puntos: 18
Respuesta: Desindexar paginas desde robots.txt

Holas,

Parece que funciona :), he tenido que agregar unos cuantos disallow mas porque habian otras finalizaciones que clonaban las paginas, ahora en errores me salen "URL's restringidas por Robots.txt", es normal que avise de eso,no? osea que aunque salga en la pagina que muestra los errores (vision general de herramientas de webmaster google) no es un error, si no un error subsanado, verdad? :)

Muchas gracias por la ayuda como siempre ;)
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 12:08.