Ver Mensaje Individual
  #1 (permalink)  
Antiguo 16/12/2008, 10:12
Avatar de dacho
dacho
 
Fecha de Ingreso: junio-2008
Ubicación: Argentina
Mensajes: 374
Antigüedad: 15 años, 9 meses
Puntos: 21
Como Sacar una Pagina de los Indices de Buscadores

Hola gente, la verdad es que me a tocado reformar una pagina web y la cosa es que lso nombres de las urls son malisimo del estilo misitio.com/nu_empr.htm, por eso decidi quitar los enlaces de los buscadores porque obviamente sale error 404 (en realidad los cambie por un error personalizado para que lso visitantes los vean).

La cosa es que estuve leyendo y seguramente al igual que yo mucha gente no debe saber como sacar su pagina o alguna pagina de su pagina de los indicies de buscadores, por ello queria compartirlo, probablemente ya debe estar en el foro pero lo escribo de nuevo.

Las formas de indicarles a los bots que no queremos que indexen una pagina es:

1) el archivo robots.txt es una de las opciones, para leer un poco mas (http://www.google.com/support/webmas...y?answer=35303)

2) utilizar esta etiqueta en nuestro head <meta name="robots" content="noindex">

Como dije antes esta es la forma de decirle a los robots que no indexen nuestra pagina, google dice esto al respecto:

Cita:
Si bien Google no rastreará ni indexará el contenido de las páginas bloqueadas por robots.txt, sí que indexará las URL que encuentre en otras páginas de la Web. En consecuencia, la URL de la página y otros datos que puedan estar disponibles públicamente, como el texto de anclaje de enlaces que dirijan al sitio o el título de Open Directory Project (www.dmoz.org), podrían aparecer en los resultados de búsqueda de Google. Sin embargo, no se rastreará, indexará ni publicará el contenido de sus páginas.
Ademas aclara que el proceso puede llevar bastante tiempo eliminarla en caso de que la web ya este indexada, para ello se puede eliminar de forma mas rapida desde las herramientas para webmasters de google (http://www.google.com/webmasters).

Y dentro de la seccion eliminacion de URL nos dicen esto

Cita:
Antes de empezar, debe asegurarse de que Google y otros motores de búsqueda no rastreen el contenido que desea eliminar de nuestros resultados de búsqueda.

Para hacerlo, asegúrese de que cada página devuelva un código de estado HTTP de 404 o 410 o utilice un archivo robots.txt o metaetiqueta noindex para bloquear el acceso de los rastreadores a su contenido.

Si solicita que se elimine un sitio o directorio completo, debe utilizar un archivo robots.txt para bloquear el acceso de los rastreadores a este contenido.

Más información sobre la eliminación de contenido del índice de Google

Intentaremos finalizar este proceso en un plazo de 3 a 5 días laborables, aunque las solicitudes de eliminación de URL a gran escala requieren más tiempo.
Hoy utilice esta herramienta, por lo que les comentare en los próximos días si estas cosas dan resultado o si es puro verso....

Por supuesto se aceptan y agradecen experiencias, correcciones y soluciones a este problema. Es algo raro tratar de sacar una pagina del indice, uno no lo piensa hasta que lo necesita.
__________________
Curso de SEO y HTML.
Diprox.com.ar // Diseño Web.
Mi twitter: @soydacho