Foros del Web » Estrategias Digitales y Negocios Online » SEO »

Problema con sitemaps

Estas en el tema de Problema con sitemaps en el foro de SEO en Foros del Web. Hola tengo en mi web varios sitemaps, y google me da error de acceso a red o que no puede acceder a robots.txt (y no ...
  #1 (permalink)  
Antiguo 03/04/2008, 16:37
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Problema con sitemaps

Hola

tengo en mi web varios sitemaps, y google me da error de acceso a red o que no puede acceder a robots.txt (y no uso robots.txt). Sabéis si tiene algo que ver con que haya contruido mal los ficheros xml?

o paso un ejemplo


<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.basketpedya.com/Acc002InfEq.php?ideq=1</loc>
<changefreq>yearly</changefreq>
</url>
<url>
<loc>http://www.basketpedya.com/Acc002InfEq.php?ideq=6</loc>
<changefreq>yearly</changefreq>
</url>
....
</urlset>
  #2 (permalink)  
Antiguo 03/04/2008, 17:58
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Podés llevar a cabo una validación mediante la herramienta Google XML Sitemap Validator y ver que resultados obtenés.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #3 (permalink)  
Antiguo 04/04/2008, 09:58
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Re: Problema con sitemaps

Hola

he probado un ejemplo y me devuelve esto

Schema validating with XSV 3.1-1 of 2007/12/11 16:20:05
Target: http://www.basketpedya.com/sitemap2.xml
(Real name: http://www.basketpedya.com/sitemap2.xml
Length: 569859 bytes
Last Modified: Fri, 04 Apr 2008 15:52:36 GMT
Server: Apache)
docElt: {http://www.sitemaps.org/schemas/sitemap/0.9}urlset
No declaration for document root found, validation was lax
The schema(s) used for schema-validation had no errors
No schema-validity problems were found in the target

--------------------------------------------------------------------------------

Low-level XML well-formedness and/or validity processing output

Error: Expected whitespace after public id
in unnamed entity at line 1 char 55 of http://www.sitemaps.org/schemas/sitemap/0.9/
http://www.sitemaps.org/schemas/sitemap/0.9/ has no elements???



--------------------------------------------------------------------------------

Schema resources involved
Attempt to load a schema document from http://www.sitemaps.org/schemas/sitemap/0.9 (source: docElt) for http://www.sitemaps.org/schemas/sitemap/0.9, failed


no comprendo bien el error del Low-Level, alguien me lo podría explicar? gracias!
  #4 (permalink)  
Antiguo 04/04/2008, 12:18
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

En tu caso, no estás haciendo mención al protocolo correspondiente:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>


Podés consultar Sitemaps XML format
Por cierto, además, en tu lugar haría las URLs más amigables (podés encontrar en el foro, varios ejemplos al respecto).
Suerte!
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #5 (permalink)  
Antiguo 04/04/2008, 16:43
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Re: Problema con sitemaps

Ahora me sale el mensaje "No se puede acceder a robots.txt", lo cual es lógico porque no lo uso. Pero, es obligatorio poner un fichero robots?

Si no es obligatorio, pq sale este error?

esto de los sitemaps es un pequeño infierno
  #6 (permalink)  
Antiguo 04/04/2008, 16:55
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Veo ahora que has modificado el encabezamiento de su sitemap pero de ninguna manera has seguido el estándar que te sugerí.
Cita:

<urlset xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

<url>
<loc>http://www.basketpedya.com/Acc002InfEq.php?ideq=1</loc>
Este nuevo encabezamiento ¿de dónde lo sacaste?
Por cierto. robots.txt no es obligatorio: sólo tiene por función dar directivas a los bots para que no rastreen parte de tu sitio.
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #7 (permalink)  
Antiguo 05/04/2008, 03:58
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Re: Problema con sitemaps

Hola Daniel

en la primera versión ya tenía

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
...

, cuando lo comparé con el que sugeriste en tu mensaje anterior no fui capaz de ver ninguna cosa diferente.

Donde es exactamente el punto donde ves mi error?.

Gracias!
  #8 (permalink)  
Antiguo 05/04/2008, 06:09
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Cuando descargué oportunamente el archivo, no vi tal encabezado; por eso te sugerí el enlace para que constates el protocolo.
En mi anterior post, muestro un encabezado de tu sitemap, un poco reñido con lo sugerido. El que me mostrás ahora, es el que está en forma definitiva? (hoy no he descargado tu sitemap. ¿Pasa el test de validación?
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #9 (permalink)  
Antiguo 05/04/2008, 07:19
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Re: Problema con sitemaps

Hola Daniel

actualmente el fichero http://www.basketpedya.com/sitemap2.xml, es de la forma:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.basketpedya.com/Acc002InfEq.php?ideq=1</loc>
<changefreq>yearly</changefreq>
</url>
<url>
<loc>http://www.basketpedya.com/Acc002InfEq.php?ideq=6</loc>
<changefreq>yearly</changefreq>
</url>
...........
</urlset>

y en el validador me sale

Schema validating with XSV 3.1-1 of 2007/12/11 16:20:05
Target: http://www.basketpedya.com/sitemap2.xml
(Real name: http://www.basketpedya.com/sitemap2.xml
Length: 569860 bytes
Last Modified: Sat, 05 Apr 2008 10:01:48 GMT
Server: Apache)
docElt: {http://www.sitemaps.org/schemas/sitemap/0.9}urlset
No declaration for document root found, validation was lax
The schema(s) used for schema-validation had no errors
No schema-validity problems were found in the target

--------------------------------------------------------------------------------

Low-level XML well-formedness and/or validity processing output

Error: Expected whitespace after public id
in unnamed entity at line 1 char 55 of http://www.sitemaps.org/schemas/sitemap/0.9/
http://www.sitemaps.org/schemas/sitemap/0.9/ has no elements???



--------------------------------------------------------------------------------

Schema resources involved
Attempt to load a schema document from http://www.sitemaps.org/schemas/sitemap/0.9 (source: docElt) for http://www.sitemaps.org/schemas/sitemap/0.9, failed:


creo, si no me he pasado algo por alto, que el encabezado está tal como me indicaste.
  #10 (permalink)  
Antiguo 06/04/2008, 07:18
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Te sugiero lo siguiente:
Descargar Gsitemap, que es freeware.
Por cuestiones operativas y de tiempo yo cancelé el proceso de genera el sitemap de tu sitio cuando conseguí indexar poco menos de 1500 URLs y aún quedaban en cola, algunas miles más.
Al momento 23 de ellas no consiguieron indexarse, pero si terminás proceso podrás ver como agregarlas en forma manula o, por otro lado ver que es lo que ocurre.
El sitemap que genera esta aplicación tiene un schema distinto al sugerido por mí, pero de igual manera válido.
Espero te sea útil.
Saludos!
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #11 (permalink)  
Antiguo 07/04/2008, 11:28
 
Fecha de Ingreso: abril-2008
Mensajes: 8
Antigüedad: 16 años
Puntos: 0
Re: Problema con sitemaps

Hola Daniel
lo primero, gracias por toda la ayuda que me estás dispensando.

Te cuento mis últimas novedades. He generado un sitemap de ejemplo con esta herramienta y he hecho 2 cosas:

* Primero, pulsé el botón "notificar a google" y veo que de 300 y pico url's por indexar, a día de hoy en google me aparecen 127, esperaré a ver si en los próximos días aumenta. De todas formas, tengo más de 150000 urls por indexar, ya que esto era una pequeña prueba, no sé si lo podré hacer con esta herramienta pues parece pensada para volumenes menores. Cuando abro un ejemplo con más de 5000 urls, me da un error.

* Segundo, el sitemap generado, que efectivamente es un poco diferente al tuyo, lo incluí en mi directorio raiz de la web, y lo puse en la herramienta de sitemaps, sin embargo me indica de nuevo que no puede acceder al robot.txt. En estos casos,¿ debo esperar a que lo intente de nuevo dentro de un tiempo? yo no utilizo el fichero robots.txt.

Gracias!
  #12 (permalink)  
Antiguo 07/04/2008, 11:58
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Para el conteo de URLs indexadas; primero hay que esperar que Google descargue el sitemap apropiadamente. Mientras no recibas el mensaje de OK, seguiremos estando en problemas.
Luego, la cantidad se irá incrementando paulatinamente.
De todas maneras, tenés que tener presente no vulnerar ninguna de ambas restricciones en cuanto a los límites del archivo sitemap.xml
  • 50.000 URLs
  • 10 Mb de tamaño de archivo
Google Webmasters Tools
Si ello ocurre, lo debés tener presente, hay que generar varios sitemaps y un índice de los mismos.

Finalmente, se me ocurre, el intento por localizar el robots.txt (que sabemos no utilizás y no existe) deber ser, al intentar seguir una URL y, por no encontrarla, intentar ver si robots.txt la está restringiendo. No se me ocurre otra cosa.
Pregunto ¿utilizaste alguna herramienta de test de enlaces rotos (broken-links) antes de construir el sitemap?
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
  #13 (permalink)  
Antiguo 08/04/2008, 14:12
Avatar de RBZ
RBZ
Moderador
 
Fecha de Ingreso: noviembre-2005
Ubicación: Sevilla España
Mensajes: 11.559
Antigüedad: 18 años, 5 meses
Puntos: 2053
Re: Problema con sitemaps

Cita:
Iniciado por Daniel Ulczyk Ver Mensaje
Finalmente, se me ocurre, el intento por localizar el robots.txt (que sabemos no utilizás y no existe) deber ser, al intentar seguir una URL y, por no encontrarla, intentar ver si robots.txt la está restringiendo. No se me ocurre otra cosa.
Pregunto ¿utilizaste alguna herramienta de test de enlaces rotos (broken-links) antes de construir el sitemap?
Creo que no, las herramientas para webmaster de Google siempre buscan el archivo robots.txt, simplemente con que pongas un archivo vacio con ese nombre es suficiente.
__________________
Sevilla monumentos de Sevilla Fotos de la ciudad
ViajeV
  #14 (permalink)  
Antiguo 08/04/2008, 14:42
Avatar de Daniel Ulczyk
Super Moderador
 
Fecha de Ingreso: febrero-2005
Ubicación: Buenos Aires
Mensajes: 9.263
Antigüedad: 19 años, 2 meses
Puntos: 2114
Re: Problema con sitemaps

Cita:
Iniciado por RBZ Ver Mensaje
Creo que no, las herramientas para webmaster de Google siempre buscan el archivo robots.txt, simplemente con que pongas un archivo vacio con ese nombre es suficiente.
Yo he publicado algún sitio web donde no he incluído restricciones, o sea, no he subido un archivo robots.txt para tal efecto y sí he subido un sitemap.xml.
Y en ningún momento obtuve errores subir el sitemap...
__________________
—Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto sino un hábito. (Aristóteles dixit)
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 21:13.