Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Analytics e Indexación (¿entorno de test?)

Estas en el tema de Analytics e Indexación (¿entorno de test?) en el foro de SEO en Foros del Web. Buenos días. Pregunto desde el más puro desconocimiento, a ver si alguna alma caritativa puede ayudarme. Tengo intenciones de empezar a trabajar con Google Analytics ...
  #1 (permalink)  
Antiguo 15/10/2015, 01:28
 
Fecha de Ingreso: marzo-2007
Mensajes: 59
Antigüedad: 17 años, 1 mes
Puntos: 0
Pregunta Analytics e Indexación (¿entorno de test?)

Buenos días.

Pregunto desde el más puro desconocimiento, a ver si alguna alma caritativa puede ayudarme.

Tengo intenciones de empezar a trabajar con Google Analytics para Comercio Electrónico según me han pedido en la empresa y estoy empezando a buscar tutoriales y leer la documentación oficial.

Y tengo una seria duda. Obviamente tenemos una web para el entorno de test y otra para el entorno de producción. Me había planteado crear una cuenta de Gmail y configurar Analytics para que en Test cargue una 'UA-XXXX-Y' diferente del entorno de Producción y así poder hacer pruebas en Test y si todo va bien pasarlo a Producción.

Pero la persona que se encarga de el tema del SEO en la empresa me ha comentado que si hago eso empezarán a indexar el entorno de Test (cosa que no queremos) pero también me ha admitido que no lo sabe seguro. ¿Es eso correcto?

Yo lo desconozco y he estado leyendo la documentación pero no he visto nada al respecto.

Resumiendo: ¿Hay alguna manera de poder trabajar en entorno de Test con los scripts de Analytics sin que indexe la página?

Muchas gracias.
  #2 (permalink)  
Antiguo 15/10/2015, 10:35
 
Fecha de Ingreso: octubre-2010
Ubicación: Zaragoza
Mensajes: 289
Antigüedad: 13 años, 6 meses
Puntos: 76
Respuesta: Analytics e Indexación (¿entorno de test?)

No lo he probado, pero para evitar problemas, mi recomendación sería dejarle muy claro a Google que no quiere que me indexen el contenido. Usaría lo siguiente:
  • robots.txt
  • <meta name="robots" content="noindex, nofollow">
  • He incluir en cada página una etiqueta canonical a mis páginas reales en producción. Si está empeñado en indexar que indexe lo bueno.

Aun así, nunca tienes garantías.
  #3 (permalink)  
Antiguo 15/10/2015, 11:14
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

Lo mejor es que uses la solución propuesta por andresjp, hay muchas formas de atraer al buscador, insertar anuncios de Adsense, visitarla desde Chrome... Eso sí, no es necesario que uses una cuenta distinta de gmail.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #4 (permalink)  
Antiguo 15/10/2015, 16:09
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 1 mes
Puntos: 2114
Respuesta: Analytics e Indexación (¿entorno de test?)

Tanto robots.txt como las declaraciones META no evitan que Google rastree las páginas.

No las indexará pero puede que incluya esas URLs en la clasificaciones y hasta las incluya en cache.

Si el sitio de pruebas es exclusivamente privado el mejor escenario es permitir sólo el acceso mediante autentificación. Ver Apache → Autentificación, Autorización y Control de Acceso

Luego de esto las métricas recogidas por Google Analytics son completamente transparentes; excepto, claro está la procedencia del tráfico. Ya que sólo tendrás métricas de tráfico directo.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #5 (permalink)  
Antiguo 16/10/2015, 08:37
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Hola,

Google no indexa una página por que tenga analytics, tiene que encontrarla enlazada o referenciada ( sitemap, rss etc ).

Por si acaso le puedes poner poner el el meta robots = noindex, que no la indexa seguro, ni url ni nada, si la encuentra enlazada por ahí la rastrea pero no la indexa.

si le metes un disvow en el robots.txt tampoco la rastreará

Si eres un paranoico pues haz que la pagina o páginas devuelvan un status 404 ( de que no existe ) y listo

un saludo
  #6 (permalink)  
Antiguo 16/10/2015, 08:51
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 1 mes
Puntos: 2114
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
Iniciado por santiagoanuncios Ver Mensaje

si le metes un disvow en el robots.txt tampoco la rastreará

No es cierto eso que Google no rastrea las restricciones en robots.txt



Hay sobrados ejemplos en los resultados de búsquedas con la info arriba compartida
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #7 (permalink)  
Antiguo 17/10/2015, 06:57
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Hola jeje Daniel Ulczyk tienes un lío importante, pero no te preocupes que yo te lo explico

como tu mismo en el ejemplo, google no puede rastrear la página por las restricciones en el robots.txt ( la tenía indexada, pero ahora no la puede rastrear )

Lo que te confunde es que la ponga en los resultados de búsqueda, y eso sucede porque la página ya la tenía indexada anteriormente, pero como ahora no la puede rastrear, en las serp pone ese mensaje, que es muy claro, no sabe el contenido que tiene actualmente esa página.

Si le pones un meta noindex la rastrea ( lógico, sino no veria el noindex ), pero no la indexará.
Si le pones un disavow en el robots, simplemente no la rastrea ( si la tenía indexada de antes, te saldrá ese mensaje, y aunque le hayas puesto un meta noindex no lo podrá leer ojo con esto )

Te dejo un vídeo donde jhon Muller habla de esto https://www.youtube.com/watch?v=yIIRyBMSPUk

Para probar el funcionamiento del disavow en el robots.txt, puedes ir a herraminetas para webmasters y en la opción "Rastreo" vete a "Probador de Robots.txt" ahií puedes poner una url y te dirá si las puede rastrear o no en función del robots.txt que tengas.


un saludo
__________________
Anuncioneon.es - Modelofactura.es
  #8 (permalink)  
Antiguo 17/10/2015, 12:29
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 1 mes
Puntos: 2114
Respuesta: Analytics e Indexación (¿entorno de test?)

Tu comportamiento es bastante irreverente *santiagoanuncios*

Google aclara, adecuadamente, que robots.txt contiene declaraciones que no resultan restrictivas; además, la recomendación para evitar cualquier tipo de rastreo es proteger los archivos privados mediante contraseña.


—Vía Información sobre los archivos robots.txt

Cita:
Lo que te confunde es que la ponga en los resultados de búsqueda, y eso sucede porque la página ya la tenía indexada anteriormente, pero como ahora no la puede rastrear, en las serp pone ese mensaje, que es muy claro, no sabe el contenido que tiene actualmente esa página.
A mí este tipo de casos no me confunde; el ejemplo que he presentado las URLs nunca han estado indexadas. Se trata de un sitio de mi propiedad, que recientemente ha salido de la etapa de pruebas y ahora está publicado. No comprendo como estás asumiendo que en algún momento esas URLs han estado indexadas.

Finalmente, te recomiendo llames a las cosas por su nombre; desde mayo pasado la herramienta ha dejado de llamarse Webmaster Tools en favor de Search Console


__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #9 (permalink)  
Antiguo 18/10/2015, 06:41
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Hola

Cita:
A mí este tipo de casos no me confunde; el ejemplo que he presentado las URLs nunca han estado indexadas. Se trata de un sitio de mi propiedad, que recientemente ha salido de la etapa de pruebas y ahora está publicado. No comprendo como estás asumiendo que en algún momento esas URLs han estado indexadas.
Cómo que nunca han estado indexadas, si las pones como ejemplo de lo contrario??
En los resultados de búsqueda te dice que no tiene un descripción para mostrar porque no le permites que la rastree por las restricciones del robots.txt.

Las restricciones del robots.txt claro que son una indicación, un rastreador puede ignorarlas como los metas del head, pero también te dice claramente que GOOGLEBOT los rastreadores serios SI LOS SIGUEN.





Por tus comentarios se ve que no tienes claro lo que es indexación ni lo que es rastreo, y mi actitud mas bien pedagógica mas que irreverente no crees?

Un saludo
  #10 (permalink)  
Antiguo 18/10/2015, 14:59
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

santiagoanuncios para no crear una polémica sin necesidad, compruébalo por tí mismo. Crea una url nueva, bloquéala desde robots.txt y enlázala desde algún sitio (por ejemplo la firma del foro). En poco tiempo aparecerá indexada (sí, indexada no rastreada) de la misma forma que muestra Daniel Ulczyk en su captura de pantalla.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #11 (permalink)  
Antiguo 19/10/2015, 02:31
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Hola RBZ, efectivamente

Cita:
Crea una url nueva, bloquéala desde robots.txt y enlázala desde algún sitio (por ejemplo la firma del foro). En poco tiempo aparecerá indexada (sí, indexada no rastreada) de la misma forma que muestra Daniel Ulczyk en su captura de pantalla.


Pero Daniel dice:
Cita:
No es cierto eso que Google no rastrea las restricciones en robots.txt





Por si no me he expresado bien lo que estoy diciendo yo es que el robots.txt afecta al rastreo ( se le puede indicar que sitios de tu web no quieres que sean rastreados y por quien no quieres que sean rastreados, por defecto si se rastrea ).



Creo que hay que decir que google si sigue las indicaciones del robots.txt, y si le pones un disavow a una página googlebot no la rastrea desde ese momento.


http://www.robotstxt.org/robotstxt.html
https://support.google.com/webmaster.../6062608?hl=es

No pretendo crear ninguna polémica, quizá la confusión entre lo que es rastreo y lo que es indexación



Modifico mi respuesta porque se puede interpretar que estoy siendo grosero y no lo pretendo.




Un saludo

Última edición por santiagoanuncios; 19/10/2015 a las 03:20
  #12 (permalink)  
Antiguo 19/10/2015, 10:08
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
Iniciado por santiagoanuncios Ver Mensaje
(...)

No pretendo crear ninguna polémica, quizá la confusión entre lo que es rastreo y lo que es indexación

(...)
Se entiende la diferencia entre rastreo e indexación pero si Google indexa una web de varias páginas, bloqueada desde robots.txt, es evidente que ha rastreado el sitio. Esa es mi opinión.

En cualquier caso el tema iba de evitar la indexación y Daniel resaltaba que tal vez no la indexe, que para eso tendría que rastrearla, pero las añadiría a las listas de resultado.

Cita:
Iniciado por Daniel Ulczyk
No las indexará pero puede que incluya esas URLs en la clasificaciones y hasta las incluya en cache.
Y añado yo, si las acaban incluyendo en el caché, es señal de que las rastreó.

Cita:
Iniciado por santiagoanuncios Ver Mensaje
(...)
Modifico mi respuesta porque se puede interpretar que estoy siendo grosero y no lo pretendo.
Sigo la conversación porque sé que eres un usuario con el que se puede debatir, que no busca enfrentamiento. No te preocupes por cómo lo dices que no voy a buscarle los tres pies al mensaje.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #13 (permalink)  
Antiguo 20/10/2015, 04:23
 
Fecha de Ingreso: marzo-2007
Mensajes: 59
Antigüedad: 17 años, 1 mes
Puntos: 0
Respuesta: Analytics e Indexación (¿entorno de test?)

Buf, cuanta información para un neófito como yo.

Primero de todo muchas gracias a todos, ahora mismo he tenido que dejar el tema aparcado por otras prioridades, pero me leeré con calma vuestras aportaciones.

Un cordial saludo.
  #14 (permalink)  
Antiguo 20/10/2015, 13:37
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

RBZ Si crees que google rastrea las urls restringidas entonces debo suponer que no usas un robots.txt?


Cita:
Se entiende la diferencia entre rastreo e indexación pero si Google indexa una web de varias páginas, bloqueada desde robots.txt, es evidente que ha rastreado el sitio. Esa es mi opinión.

No, si encuentra un enlace ( o una referencia ) se queda con esa url pero no la rastrea si en el robots.txt le tienes un disavow, por eso te pone ese mensaje en los resultados de búsqueda,

mira rastrear es hacer una petición de esa página y leer el html que le llega ( y a partir de ahí en función de lo que le llegue la indexará o no, depende del meta robots etc.. )

Si encuentra un enlace de una url que está restringida en el robots.txt se queda con esa url, y con el texto ancla ( anchor text ) pero no con el contenido de esa url.


google dice: https://support.google.com/webmaster.../6062608?hl=es

Cita:
Las indicaciones de robots.txt no pueden impedir las referencias a las URL que provienen de otros sitios
Mientras que Google no rastreará ni indexará el contenido bloqueado por robots.txt, es posible que encontremos e indexemos una URL no autorizada de otras partes de la Web. Por lo tanto, es posible que la dirección URL y otra información de disponibilidad pública, como el texto del enlace que lleva al sitio, todavía puedan aparecer en los resultados de las búsquedas de Google. Puedes impedir que la URL se muestre en los resultados de la Búsqueda de Google completamente utilizando una combinación de robots.txt y otros métodos de bloqueo de las URL, como proteger con contraseña los archivos del servidor, o bien insertar metaetiquetas para las indicaciones de indexación en el HTML.
Esto es lo que dice google que hace, y yo sé que lo hace porque yo audito mis logs y se lo que visita googlebot y lo que no.

Google es muy escrupuloso con las indicaciones del robots.txt y los metas ( salvo el canonical, que es una recomendación ).

La confusión la tenéis en lo que es indexación y lo que es rastreo

Indexación es cuando googlebot encuentra una url que no tiene y que puede añadir a su índice bien sea sólo la referencia y el anchor text, o bien todo el contenido, rastreo es cuando googlebot puede leer ese contenido.



Mira una url que tengas restringinda en el robots.txt que nunca halla sido indexada si la enlazas te pondrá ese mensaje en los resultados de búsqueda que decía Daniel, pero si le haces una búsqueda con un trozo de contenido de esa url ( que no esté en la propia url como es lógico ) no te pondrá nada en los resultados de búsqueda

Yo utilizo esto mucho esto porque las páginas que mas rastrea googlebot son las que mas tráfico traen ( eso te lo digo yo ) y si consigues que no pierda tiempo en las urls que no posicionan nada, rastreará otras urls de tu web que si te pueden traer tráfico y ganas muchas visitas.


Y hasta aquí, si continúa la discusión yo ya me rindo XD no puedo más


Un saludo
__________________
Anuncioneon.es - Modelofactura.es
  #15 (permalink)  
Antiguo 20/10/2015, 14:14
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
Iniciado por santiagoanuncios Ver Mensaje
(...)


Y hasta aquí, si continúa la discusión yo ya me rindo XD no puedo más

(...)
Tranquilo, si claro me queda desde el primer momento pero desde hace años cuando una url no quiero que se indexe no me fío de robots.txt y uso otras medidas. En su momento comprobé que incumplía las indicaciones y no me volví a fiar. Quien sabe, tal vez sólo lo incumplía antes o fue otra cosa.

Me creo lo que dices, si tengo tiempo volveré a comprobarlo.

__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #16 (permalink)  
Antiguo 20/10/2015, 14:41
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

JAJAJA bueno va una mas

Cita:
pero desde hace años cuando una url no quiero que se indexe no me fío de robots.txt y uso otras medidas
Cuando dices que se indexe te refieres a que esté esa url en el indice, y eso no tiene nada que ver con el robots.txt para eso esta el meta noindex


Es que en robots.txt indicas que páginas debe rastrear ( o indexar su contenido)

GOOGLE dice:
Cita:
no rastreará ni indexará el contenido bloqueado por robots.txt,
habla de que no indexará el contenido pero no tiene nada que ver con que tenga en su indice esa url.

Aunque le pongas un disavow a una url, si está indexada no la elimina, sólo elimina el contenido

El robots.txt no elimina ni agrega urls al indice, solo le indicas de que urls debe o no debe leer el contenido ( rastrear ).
  #17 (permalink)  
Antiguo 20/10/2015, 14:44
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
Iniciado por santiagoanuncios Ver Mensaje
(...)
Cuando dices que se indexe te refieres a que esté esa url en el indice, y eso no tiene nada que ver con el robots.txt para eso esta el meta noindex
No, no, todo el contenido. Si hacías búsquedas con trozos del texto de la página, mostraba la url como resultado. Así que de ser un buscador respetable nada.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #18 (permalink)  
Antiguo 20/10/2015, 15:04
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
No, no, todo el contenido. Si hacías búsquedas con trozos del texto de la página, mostraba la url como resultado. Así que de ser un buscador respetable nada.
Enséñame una
__________________
Anuncioneon.es - Modelofactura.es
  #19 (permalink)  
Antiguo 21/10/2015, 15:06
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
Iniciado por santiagoanuncios Ver Mensaje
Enséñame una
Cita:
Iniciado por RBZ Ver Mensaje
Tranquilo, si claro me queda desde el primer momento pero desde hace años cuando una url no quiero que se indexe no me fío de robots.txt y uso otras medidas. En su momento comprobé que incumplía las indicaciones y no me volví a fiar. Quien sabe, tal vez sólo lo incumplía antes o fue otra cosa.

Me creo lo que dices, si tengo tiempo volveré a comprobarlo.

Cita:
Iniciado por santiagoanuncios Ver Mensaje
Enséñame una
Como digo, si tengo tiempo para experimentos y vuelvo a comprobarlo te lo mostraré.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #20 (permalink)  
Antiguo 21/10/2015, 15:34
 
Fecha de Ingreso: noviembre-2007
Ubicación: Santiago de Compostela
Mensajes: 419
Antigüedad: 16 años, 5 meses
Puntos: 37
Respuesta: Analytics e Indexación (¿entorno de test?)

Cita:
No, no, todo el contenido. Si hacías búsquedas con trozos del texto de la página, mostraba la url como resultado. Así que de ser un buscador respetable nada.
Cita:
Como digo, si tengo tiempo para experimentos y vuelvo a comprobarlo te lo mostraré.

Te lo hago yo con una de mis webs

como muestra google una url bloqueada en robots.txt
https://www.google.es/search?q=site:...digo%3D3359276

hago una búsqueda con el contenido de esa url y:
https://www.google.es/search?q=site%...rera+de+jueces



Un saludo

Etiquetas: analytics, google, indexacion
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 16:44.