Ver Mensaje Individual
  #1 (permalink)  
Antiguo 26/09/2014, 00:40
aragonexiste
 
Fecha de Ingreso: abril-2005
Mensajes: 16
Antigüedad: 19 años
Puntos: 0
Consulta para obtener el numero de registros coincidentes entre dos tablas

Buenos días,

Actualmente estoy trabajando como diseñador web y en la empresa donde curro en Holanda me han pasado un marrón relacionado con unas bases de datos, consistente en hacer una extracción con tablas de mas de dos millones de registros.

1 - Casuística

Dispongo de dos ficheros que incluyen los datos de la siguiente manera

1 - En el primero, incluye el número de registros totales (Mas de 2 millones de filas) y entre una multitud de campos, incluye los campos "area" y "subarea".

2 - Otro csv que incluye unos 14000 registros (Que también están incluidos en el archivo anterior) y que indica nuestros clientes mediante un campo "status".

La única forma de relacionar ambos ficheros es mediante la concatenación de tres campos que están presentes en ambos archivos "Código postal", "número" y "extra".

Por poneros un ejemplo de las lineas del fichero mas grande :

Area | Sub Area | CP | Número | Extra
Brabante | Nord Eindhoven | 1186VZ | 5 |
Brabante | Nord Eindhoven | 1186VZ | 7 |
Brabante | Nord Eindhoven | 1186VZ | 9 |
Brabante | Nord Eindhoven | 1186VZ | 9 | A
Brabante | Nord Eindhoven | 1186VZ | 11 |
Brabante | Zuid Eindhoven | 1195AS | 232 |

Mientras que un ejemplo de una linea del segundo fichero sería:

CP | Numero | Extra | Status
1186VZ | 5 | | Completed
5836AB | 12 | | Completed

2 - Consulta

Lo que yo precisaría hacer es una consulta que me dijese:

1 - El número total de registros presentes en el fichero 1 de cada "subarea".
2 - El número de registros presentes en el fichero 2 para cada "subarea".

Y el resultado final para el ejemplo que os había indicado seria:

Area | SubArea | total | clientes
Brabante | Nord Eindhoven | 5 | 1
Brabante | Zuid Eindhoven | 1 |

Muchas gracias de antemano por vuestra ayuda