Ver Mensaje Individual
  #16 (permalink)  
Antiguo 25/11/2008, 14:51
chancha
 
Fecha de Ingreso: diciembre-2005
Mensajes: 354
Antigüedad: 18 años, 4 meses
Puntos: 0
Respuesta: Organizar sitemaps para sitio web muy muy grande

Cita:
Iniciado por popobcn Ver Mensaje
Si te fijas en las WebMastertools observarás que aparece la última fecha en la cual Google reviso el contenido del mismo. Es por este motivo que el mantenimiento y gestión de los sitemaps dinámicos es GENIAL para casos como el tuyo.
Googlebot visita mi site TODOS los días sin falta. Siempre. En octube, googlebot consumió 40GB de transferencia él solo.

Por que dices que es genial en mi caso?.

Cita:
Iniciado por popobcn Ver Mensaje
2.- Si generas un archivo por editorial, puuuuffff... francamente? NO SE. Estamos hablando de más de 1000 archivos en frente a los 24 que te ofrece el abecedario .oO(Eran 24 ¿no? xD)
No tanto. Pensá que en muchísimas letras, voy a necesitar generar mas de un sitemap por letra, por superar el límite de tamaño de archivo o urls. Así que tendré sitemap_a1.xml, sitemap_a2.xml, sitemap_a3.xml, sitemap_b1.xml, sitemap_b2.xml, etc .
Esto gnerará bastaaaaaaante mas que 24 archivos.

Respecto a las editoriales, mi idea en realidad es generar un archivo por editorial siempre y cuando ésta tenga mas de 200 libros. Esto me generará 20 xml, 20 editoriales con su xml exclusivo.
Las editoriales que tengan menos de 200 libros, si agruparlas en xml "masivos".
El límite de libros por editorial para tener o no un xml individual, podría aumentarlo desde ya.

Esto me sirve por que, generalmente, se actualizan los libros por editorial. Es decir, hoy se carga el listado completo de libros de editorial A, B y C. Entonces, a la noche cuando se ejecute el script de los sitemap, sólo modificará los archivos de dichas editoriales (si es que tienen archivo indiviudal), y no tendré que modificar tantos archivos sueltos como si tuviera los XML por orden alfabético.

Con esto, estaré optimizando la tarea de escritura de los xml en muchísimos menos archivos, pero tampoco me cierra del todo.


Cita:
Iniciado por popobcn Ver Mensaje
Por otro lado, quizás TODO ESTO SEA INNECESARIO. Me explico, si existe el acceso a la bbdd, si existe la posibilidad de efectuar una categorización de la misma y se puede linkar desde el home de la página, Google indexará todo el contenido páginado o no.
Justamente esto no ocurre y por eso creo que el sitemap en mi caso sería de gran ayuda.

Solamente son accesibles desde links del site, aquellos libros que tienen uno o mas temas. Es decir, navegando por el índice temático, googlebot puede llegar a esos libros.

Pero la inmensa mayoría de libros no tienen un tema asignado, y por eso son sólo accesibles desde el buscador. Es humanamente imposible para nosotros poder asignar temas a la mayoría de libros, salen mas libros nuevos que aquellos que podemos tematizar.

Última edición por chancha; 25/11/2008 a las 14:56