# Consultas agregadas
Las consultas agregadas te permiten realizar cálculos en un conjunto de valores y devolver un único valor. SQL tiene varias funciones agregadas como SUM(), AVG(), MIN(), MAX(), COUNT(), etc.

In [1]:
SELECT SUM(monto) AS total_monto
FROM [dbo].[infonavit]
WHERE ano = 2019 AND mes = 7

total_monto
34712246187.31992


## Calcular el promedio de edad por entidad


In [2]:
SELECT entidad, AVG(edad_rango) as avg_edad
FROM [dbo].[infonavit]
GROUP BY entidad


entidad,avg_edad
Aguascalientes,1
Baja California,1
Baja California Sur,1
Campeche,1
Chiapas,1
Chihuahua,1
Ciudad de M?xico,1
Coahuila de Zaragoza,1
Colima,1
Durango,1


<span style="border: 0px solid rgb(217, 217, 227); box-sizing: border-box; --tw-border-spacing-x: 0; --tw-border-spacing-y: 0; --tw-translate-x: 0; --tw-translate-y: 0; --tw-rotate: 0; --tw-skew-x: 0; --tw-skew-y: 0; --tw-scale-x: 1; --tw-scale-y: 1; --tw-pan-x: ; --tw-pan-y: ; --tw-pinch-zoom: ; --tw-scroll-snap-strictness: proximity; --tw-gradient-from-position: ; --tw-gradient-via-position: ; --tw-gradient-to-position: ; --tw-ordinal: ; --tw-slashed-zero: ; --tw-numeric-figure: ; --tw-numeric-spacing: ; --tw-numeric-fraction: ; --tw-ring-inset: ; --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(69,89,164,.5); --tw-ring-offset-shadow: 0 0 transparent; --tw-ring-shadow: 0 0 transparent; --tw-shadow: 0 0 transparent; --tw-shadow-colored: 0 0 transparent; --tw-blur: ; --tw-brightness: ; --tw-contrast: ; --tw-grayscale: ; --tw-hue-rotate: ; --tw-invert: ; --tw-saturate: ; --tw-sepia: ; --tw-drop-shadow: ; --tw-backdrop-blur: ; --tw-backdrop-brightness: ; --tw-backdrop-contrast: ; --tw-backdrop-grayscale: ; --tw-backdrop-hue-rotate: ; --tw-backdrop-invert: ; --tw-backdrop-opacity: ; --tw-backdrop-saturate: ; --tw-backdrop-sepia: ; font-weight: 600; color: var(--tw-prose-bold);">Funciones de ventana</span>:

Las funciones de ventana permiten realizar cálculos sobre un conjunto de filas relacionadas a la fila actual. Esto es útil para cálculos como totales acumulativos, promedios móviles, rangos, etc

In [5]:
-- Calcular el total acumulativo del monto por mes en el año 2023
SELECT ano, mes, SUM(monto) OVER (PARTITION BY ano ORDER BY mes) AS monto_acumulado
FROM [dbo].[infonavit]
WHERE ano = 2019

ano,mes,monto_acumulado
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001
2019,1,20768357789.53001


- `SELECT`: Esta palabra clave se usa para especificar los campos que deseas seleccionar en tu consulta. En este caso, estás seleccionando `ano`, `mes` y una suma acumulativa de `monto`.
    
- `ano, mes`: Estos son los campos que se seleccionarán en tu consulta.
    
- `SUM(monto) OVER (PARTITION BY ano ORDER BY mes) AS monto_acumulado`: Aquí estás utilizando una función de ventana para calcular la suma acumulativa del campo `monto`. `PARTITION BY ano` divide los datos en "particiones" o grupos basados en el año. `ORDER BY mes` especifica el orden en el que los datos se acumularán dentro de cada grupo. `AS monto_acumulado` simplemente renombra el resultado de esta suma acumulativa para que se pueda referenciar más fácilmente en los resultados.
    
- `FROM [dbo].[infonavit]`: Aquí estás especificando la tabla de la que deseas seleccionar los datos. En este caso, estás seleccionando desde la tabla `infonavit` en la base de datos `dbo`.
    
- `WHERE ano = 2019`: Finalmente, estás utilizando una cláusula `WHERE` para filtrar los resultados. Solo quieres ver los datos donde `ano` es igual a 2019.
    

En resumen, esta consulta te dará una suma acumulativa de la columna `monto` para cada mes del año 2019. Esto te permite ver cómo el total del `monto` cambia de mes a mes a lo largo del año. Recuerda que la suma acumulativa se calcula de forma independiente para cada año debido a la cláusula `PARTITION BY ano`.

- `SELECT`: Esta palabra clave se usa para especificar los campos que deseas seleccionar en tu consulta. En este caso, estás seleccionando `ano`, `mes` y una suma acumulativa de `monto`.
    
- `ano, mes`: Estos son los campos que se seleccionarán en tu consulta.
    
- `SUM(monto) OVER (PARTITION BY ano ORDER BY mes) AS monto_acumulado`: Aquí estás utilizando una función de ventana para calcular la suma acumulativa del campo `monto`. `PARTITION BY ano` divide los datos en "particiones" o grupos basados en el año. `ORDER BY mes` especifica el orden en el que los datos se acumularán dentro de cada grupo. `AS monto_acumulado` simplemente renombra el resultado de esta suma acumulativa para que se pueda referenciar más fácilmente en los resultados.
    
- `FROM [dbo].[infonavit]`: Aquí estás especificando la tabla de la que deseas seleccionar los datos. En este caso, estás seleccionando desde la tabla `infonavit` en la base de datos `dbo`.
    
- `WHERE ano = 2019`: Finalmente, estás utilizando una cláusula `WHERE` para filtrar los resultados. Solo quieres ver los datos donde `ano` es igual a 2019.
    

En resumen, esta consulta te dará una suma acumulativa de la columna `monto` para cada mes del año 2019. Esto te permite ver cómo el total del `monto` cambia de mes a mes a lo largo del año. Recuerda que la suma acumulativa se calcula de forma independiente para cada año debido a la cláusula `PARTITION BY ano`.

1. # Subconsultas y CTEs:

Las subconsultas y las Expresiones de Tabla Comunes (CTEs) te permiten dividir tus consultas en partes más manejables y realizar cálculos más complejos.



In [7]:
-- Calcular el monto total por entidad y luego encontrar las entidades con un monto total mayor que el promedio
WITH total_por_entidad AS (
    SELECT entidad, SUM(monto) AS total_monto
    FROM [dbo].[infonavit]
    WHERE ano = 2019
    GROUP BY entidad
)
SELECT entidad, total_monto
FROM total_por_entidad
WHERE total_monto > (SELECT AVG(total_monto) FROM total_por_entidad) 

entidad,total_monto
Baja California,14126516284.979946
Chihuahua,16718656809.559992
Ciudad de M?xico,45980032022.44996
Coahuila de Zaragoza,15332562536.969992
Guanajuato,16602616867.489998
Jalisco,32009504982.61
M?xico,34559921661.60998
Nuevo Le?n,40778361668.38016
Puebla,12205732325.12988
Quer?taro,17014300948.319908


# Diccionarios
En este ejemplo, la declaración CASE revisa cada valor de edad_rango y lo reemplaza con la cadena correspondiente. Luego, el resultado de la consulta será un recuento de registros para cada rango de edad en lenguaje legible.

Aunque esto funciona, no es lo más eficiente, especialmente si tienes muchas columnas codificadas. En un escenario de producción, es posible que prefieras tener tablas de referencia separadas para cada conjunto de códigos y luego unir estas tablas a tu tabla principal utilizando JOIN.

In [8]:
SELECT 
    CASE 
        WHEN edad_rango = 1 THEN '29 o menos'
        WHEN edad_rango = 2 THEN '30 a 59'
        WHEN edad_rango = 3 THEN '60 o más'
        ELSE 'No especificado'
    END as edad,
    COUNT(*) as count
FROM [dbo].[infonavit]
GROUP BY edad_rango
ORDER BY edad_rango


edad,count
No especificado,10066
29 o menos,93419
30 a 59,260536
60 o más,19352


# Para hacer un JOIN en SQL, 
primero necesitarías tener una tabla de referencia que contenga tus rangos de edad y sus descripciones correspondientes. Supongamos que tienes una tabla llamada rangos_edad estructurada de la siguiente manera:

In [4]:
CREATE TABLE rangos_edad (
    edad_rango INT PRIMARY KEY,
    descripcion VARCHAR(50)
);
INSERT INTO rangos_edad (edad_rango, descripcion) 
VALUES 
    (1, '29 o menos'),
    (2, '30 a 59'),
    (3, '60 o más'),
    (4, 'No especificado');


In [7]:
SELECT e.descripcion as rango_edad, COUNT(*) as num_personas
FROM [dbo].[infonavit] i
JOIN rangos_edad e ON i.edad_rango = e.edad_rango
GROUP BY e.descripcion


rango_edad,num_personas
29 o menos,93419
30 a 59,260536
60 o más,19352


# Consultas de distribución: 
Estas consultas te permiten entender cómo se distribuyen tus datos. Por ejemplo, puedes querer saber cuántos préstamos se han otorgado en cada estado, o cuál es la distribución de edades de las personas que toman préstamos.

In [8]:
-- Este comando selecciona las entidades y el número de préstamos por entidad
SELECT entidad, COUNT(*) as num_prestamos
FROM [dbo].[infonavit] -- Desde la tabla infonavit
GROUP BY entidad -- Agrupa los resultados por entidad
ORDER BY num_prestamos DESC -- Ordena los resultados por el número de préstamos en orden descendente


entidad,num_prestamos
M?xico,39879
Nuevo Le?n,27476
Jalisco,25296
Veracruz de Ignacio de la Llave,21746
Ciudad de M?xico,20951
Coahuila de Zaragoza,17458
Guanajuato,16298
Puebla,14503
Sonora,14249
Chihuahua,13710


In [11]:

-- Este comando selecciona los rangos de edad y el número de personas en cada rango
SELECT e.descripcion as rango_edad, COUNT(*) as num_personas
FROM [dbo].[infonavit] i -- Desde la tabla infonavit, con alias "i"
JOIN rangos_edad e ON i.edad_rango = e.edad_rango -- Une con la tabla rangos_edad en el campo edad_rango, con alias "e"
GROUP BY e.descripcion -- Agrupa los resultados por la descripción del rango de edad
ORDER BY num_personas DESC -- Ordena los resultados por el número de personas en orden descendente


rango_edad,num_personas
30 a 59,260536
29 o menos,93419
60 o más,19352



# Consultas de tendencias a lo largo del tiempo
 Si tus datos tienen un componente de tiempo (como la fecha en que se otorgó el préstamo), puedes usar esto para analizar tendencias a lo largo del tiempo. Por ejemplo, podrías querer saber cómo ha cambiado el número total de préstamos otorgados o el monto total prestado a lo largo del tiempo

In [9]:
-- Este comando selecciona el año, mes, número de préstamos y monto total de préstamos por año y mes
SELECT ano, mes, COUNT(*) as num_prestamos, SUM(monto) as total_monto
FROM [dbo].[infonavit] -- Desde la tabla infonavit
GROUP BY ano, mes -- Agrupa los resultados por año y mes
ORDER BY ano, mes -- Ordena los resultados por año y mes
    

ano,mes,num_prestamos,total_monto
2019,1,23371,20768357789.53001
2019,2,29192,25252545545.86001
2019,3,34073,31832286276.83002
2019,4,30022,28435668973.610023
2019,5,33718,34584593091.26985
2019,6,33298,35669767236.61995
2019,7,32770,34712246187.31992
2019,8,32418,33948278151.55002
2019,9,31781,33160941481.649902
2019,10,32789,36638523826.25



# Consultas de estadísticas de resumen 
Estas consultas te permiten obtener estadísticas de resumen para tus datos. Por ejemplo, podrías querer saber el monto promedio de préstamo, el monto mínimo de préstamo, el monto máximo de préstamo, etc.



In [13]:
-- Este comando selecciona el monto promedio, mínimo y máximo de los préstamos
SELECT AVG(monto) as promedio_monto, MIN(monto) as min_monto, MAX(monto) as max_monto
FROM [dbo].[infonavit] -- Desde la tabla infonavit


promedio_monto,min_monto,max_monto
1026536.9239089572,0,784574000
