Ver Mensaje Individual
  #4 (permalink)  
Antiguo 13/07/2015, 11:23
Avatar de gnzsoloyo
gnzsoloyo
Moderador criollo
 
Fecha de Ingreso: noviembre-2007
Ubicación: Actualmente en Buenos Aires (el enemigo ancestral)
Mensajes: 23.324
Antigüedad: 16 años, 5 meses
Puntos: 2658
Respuesta: Query que cuelga el ordenador (para Búsqueda Avanzada)

Cita:
A ver, ea query es solo un ejemplo que recoge campos para ver qué hay en base de datos. Ya sé que no está bien, pero era solo demostrar que una consulta así no puede hacer que se vuelgue el ordenador (que tarde sí, que casque el ordenador no).
En primer lugar, eso no es cierto. Una consulta mal optimizada puede hacer caer en error el servidor de la base de datos, por abuso de recursos, o se abortada sin mensaje de error, con lo que la aplicación no se entera del fallo y se queda "colgada" hasta salir por timeout.
Si las cosas no se optmizan, y no se evalúan los limites del sistema, los fallos no de administran correctamente, y todo parece haberse vuelto loco.

Ahora bien, vayamos al segundo término de tu consulta:Aunque puedan parecer consultas simples en cada uno de los casos, hay tres cosas que debes tener en cuenta cuando trabajas con bases de datos:
1) No todos los DBMS implementaron las mismas cláusulas de la misma forma, por lo que hay diferencia de comportamientos entre ellos. Eso se puede apreciar en el uso de los JOIN implícitos, ya que Oracle, por ejemplo, los asume como INNER JOIN, y espera a ver la definición en la relación del WHERE antes de generar el matching entre registros. Pero no es el caso de MySQL.
MySQL no tiene buena optimización en el WHERE, por lo que en realidad hace el matchig primero y filtrá después. En ese contexto, hace un producto cartesiano y a ese producto le aplica la condición. El problema es que eso genera una tabla de 800.000 registros en memoria swap, que luego filtra (el proceso de filtrado también se hace swapeando a disco). Como es demasiado overhead, el proceso acumulativo de los UNION puede ser calamitoso.
2) MySQL optimiza correctamente el from, por lo que es mucho mejor trabajar con JOIN explícitos y no implícitos (la coma) .Así le indicas que lea sólo lo que necesitas y luego filtre.
Finalmente, el UNION contiene un DISTINCT implícito, por lo que hay un subproceso no visible que realiza cada UNION y luego los discrimina. Eso puede generar muchos errores, y además baja de performance.

¿Como sería una solución aproximada?
Bueno, por lo pronto, elimina los JOIN implícitos, y veamos si mejora la performance, luego, no cuentes cada segmento por el item, sino por lo devuelto. Cuenta todo al final y veamos si mejora:

Código MySQL:
Ver original
  1. SELECT SUM(total) item_id
  2.     SELECT COUNT(1) total
  3.     FROM items i
  4.         INNER JOIN item_generos_asociados iga ON i.item_id = iga.item_id
  5.         INNER JOIN item_generos ig ON iga.genre_id = ig.genre_id
  6.     WHERE ig.genre_id = 3
  7.     UNION ALL
  8.     SELECT COUNT(1) total
  9.     FROM items i
  10.         INNER JOIN item_tipos_asociados ita ON i.item_id = ita.item_id
  11.         INNER JOIN item_tipos it ON ita.type_id = it.type_id
  12.     WHERE it.type_id = 3
  13.     UNION ALL
  14.     SELECT COUNT(1)
  15.     FROM items i
  16.         INNER JOIN items_categorias_asociados icd ON i.item_id = icd.item_id
  17.         INNER JOIN items_categorias ic ON icd.item_category_id = ic.item_category_id
  18.     WHERE
  19.         ic.item_category_id = 3
  20.     UNION ALL
  21.     SELECT COUNT(1) total
  22.     FROM items i
  23.         INNER JOIN item_publisher_asociados ipa ON i.item_id = ipa.item_id
  24.         INNER JOIN item_publishers ip ON ipa.publisher_id = ip.publisher_id
  25.     WHERE
  26.         ip.publisher_id = 3
  27.     UNION ALL
  28.     SELECT COUNT(1) total
  29.     FROM items i
  30.         INNER JOIN item_developer_asoc ida ON i.item_id = ida.item_id
  31.         INNER JOIN item_developers id ON ida.developer_id = id.developer_id
  32.     WHERE
  33.         id.developer_id = 3) tablaTemp;

Probemos así...

Finalmente, y no menos importante: En SQL el orden de los factores si altera el producto. Esto implica que el orden de las tablas debe seguir la lógica de la relación. No se ponen en cualquier posición, o el DBMS te puede generar resultados ineficientes.

En cuanto al EXPLAIN que te comenté antes, es una cláusula de análisis de performance que puedes ver en el manual de referencia y te permite ver anticipadamente cuán performante es la query que usas, y qué modificaciones podrían hacerse.

https://dev.mysql.com/doc/refman/5.6...g-explain.html
__________________
¿A quién le enseñan sus aciertos?, si yo aprendo de mis errores constantemente...
"El problema es la interfase silla-teclado." (Gillermo Luque)