# 🏦 Práctica SQL Bancaria - Sesión de Trabajo

## 🎯 Objetivo: Practicar consultas SQL reales en datos bancarios

### 📋 Plan de la sesión:
1. **Conexión rápida** a la base de datos
2. **Ejercicios prácticos** de consultas SQL
3. **Corrección de errores** en tiempo real
4. **Tips y mejores prácticas** bancarias

---

## 🔗 Conexión Rápida

In [1]:
# Conexión rápida a la base de datos
import sqlite3
import pandas as pd

# Conectar a la base de datos bancaria
conn = sqlite3.connect('../data/banking_core.db')
print("✅ Conectado a la base de datos bancaria")

# Ver las tablas disponibles
tablas = pd.read_sql_query("""
    SELECT name FROM sqlite_master 
    WHERE type='table' AND name NOT LIKE 'sqlite_%'
""", conn)

print("🏦 Tablas disponibles:")
for tabla in tablas['name']:
    print(f"   📋 {tabla}")

✅ Conectado a la base de datos bancaria
🏦 Tablas disponibles:
   📋 clientes
   📋 productos_financieros
   📋 cuentas
   📋 prestamos
   📋 transacciones
   📋 sucursales
   📋 balance_general
   📋 estado_resultados


## 📊 Ejercicio 1: Consultas Básicas de Clientes

**Objetivo:** Practicar SELECT, WHERE, ORDER BY

### 🎯 Tu turno: Intenta escribir estas consultas

In [2]:
# 🧪 ÁREA DE PRÁCTICA LIBRE
# Escribe aquí tus consultas SQL y las revisamos juntos

# Primero, veamos la estructura de la tabla clientes
estructura = pd.read_sql_query("PRAGMA table_info(clientes)", conn)
print("📋 Estructura de la tabla clientes:")
print(estructura[['name', 'type']].to_string(index=False))

print("\n" + "="*50)
print("✏️  Ahora intenta tus consultas aquí abajo:")
print("="*50)

📋 Estructura de la tabla clientes:
              name          type
        cliente_id       INTEGER
    numero_cliente   VARCHAR(20)
           nombres  VARCHAR(100)
         apellidos  VARCHAR(100)
    tipo_documento   VARCHAR(10)
  numero_documento   VARCHAR(20)
  fecha_nacimiento          DATE
            genero    VARCHAR(1)
      estado_civil   VARCHAR(20)
          telefono   VARCHAR(20)
             email  VARCHAR(100)
         direccion          TEXT
            ciudad   VARCHAR(50)
      departamento   VARCHAR(50)
     codigo_postal   VARCHAR(10)
         ocupacion  VARCHAR(100)
ingresos_mensuales DECIMAL(15,2)
  segmento_cliente   VARCHAR(50)
 fecha_vinculacion          DATE
            estado   VARCHAR(20)
        created_at     TIMESTAMP
        updated_at     TIMESTAMP

✏️  Ahora intenta tus consultas aquí abajo:


In [6]:
# 🔧 ESCRIBE TU CONSULTA AQUÍ:
# Ejemplo: Mostrar los primeros 5 clientes activos

mi_consulta = """
-- Escribe tu consulta SQL aquí
-- Objetivo: MOSTRA LOS PRIMEROS TRES CLIENTES
    SELECT CONCAT(nombres, ' ', apellidos) AS nombre_completo
        FROM clientes
        WHERE estado = 'Activo';
"""

try:
    resultado = pd.read_sql_query(mi_consulta, conn)
    print("✅ Consulta ejecutada correctamente:")
    print(resultado)
except Exception as e:
    print(f"❌ Error en la consulta: {e}")
    print("💡 No te preocupes, revisemos el error juntos")

✅ Consulta ejecutada correctamente:
Empty DataFrame
Columns: [nombre_completo]
Index: []


## 💡 Tips SQL para Banca

### ✅ Buenas Prácticas:
1. **Siempre filtra por estado activo** cuando trabajas con clientes/cuentas
2. **Usa CASE WHEN** para clasificar montos (positivos/negativos)
3. **Maneja fechas cuidadosamente** - usa funciones como `date('now', '-30 days')`
4. **Agrega límites** a tus consultas para evitar resultados masivos
5. **Usa alias descriptivos** para las columnas calculadas

### ⚠️ Errores Comunes:
- Olvidar el `GROUP BY` cuando usas agregaciones
- No filtrar registros inactivos
- Confundir INNER JOIN con LEFT JOIN
- No manejar valores NULL correctamente

---

### 🎯 **¡Comparte tus consultas con errores y las revisamos juntos!**

## 📊 Ejercicio 1: Consultas Básicas de Clientes

**Objetivo:** Practicar SELECT, WHERE, ORDER BY

In [None]:
# EJERCICIO 1A: Mostrar los primeros 10 clientes activos
# TODO: Escribe tu consulta aquí

consulta_1a = """
-- Tu consulta aquí:
-- Selecciona cliente_id, nombre_completo, segmento_cliente, fecha_vinculacion
-- de la tabla clientes donde estado = 'ACTIVO'
-- Ordena por fecha_vinculacion más reciente primero
-- Limita a 10 resultados
"""

# Descomenta cuando tengas tu consulta:
# resultado_1a = pd.read_sql_query(consulta_1a, conn)
# print(resultado_1a)

In [None]:
# SOLUCIÓN EJERCICIO 1A (CORREGIDA):
consulta_1a_solucion = """
SELECT 
    cliente_id,
    CONCAT(nombres, ' ', apellidos) as nombre_completo,
    segmento_cliente,
    fecha_vinculacion
FROM clientes 
WHERE estado = 'ACTIVO'
ORDER BY fecha_vinculacion DESC
LIMIT 10;
"""

resultado_1a = pd.read_sql_query(consulta_1a_solucion, conn)
print("✅ Últimos 10 clientes vinculados:")
print(resultado_1a)

print("\n💡 Error corregido:")
print("✓ Usamos CONCAT(nombres, ' ', apellidos) en lugar de nombre_completo")
print("✓ La tabla tiene columnas separadas: 'nombres' y 'apellidos'")

## 💰 Ejercicio 2: Análisis de Cuentas y Saldos

**Objetivo:** Practicar agregaciones (SUM, AVG, COUNT)

In [None]:
# EJERCICIO 2A: Resumen por tipo de cuenta
# TODO: Crea una consulta que muestre:
# - tipo_cuenta
# - cantidad de cuentas
# - saldo total
# - saldo promedio
# Agrupa por tipo_cuenta y ordena por saldo total descendente

consulta_2a = """
-- Tu consulta aquí:

"""

# Descomenta cuando tengas tu consulta:
# resultado_2a = pd.read_sql_query(consulta_2a, conn)
# print(resultado_2a)

In [None]:
# SOLUCIÓN EJERCICIO 2A:
consulta_2a_solucion = """
SELECT 
    tipo_cuenta,
    COUNT(*) as cantidad_cuentas,
    SUM(saldo_actual) as saldo_total,
    AVG(saldo_actual) as saldo_promedio
FROM cuentas 
WHERE estado = 'ACTIVA'
GROUP BY tipo_cuenta
ORDER BY saldo_total DESC;
"""

resultado_2a = pd.read_sql_query(consulta_2a_solucion, conn)
print("✅ Resumen por tipo de cuenta:")
print(resultado_2a)

## 🔄 Ejercicio 3: Análisis de Transacciones

**Objetivo:** Practicar CASE WHEN, filtros de fecha

In [None]:
# EJERCICIO 3A: Transacciones por tipo en el último mes
# TODO: Crear consulta que muestre:
# - tipo_transaccion
# - cantidad de transacciones
# - total ingresos (montos positivos)
# - total egresos (montos negativos, convertir a positivo)
# Solo transacciones del último mes

consulta_3a = """
-- Tu consulta aquí:

"""

# Descomenta cuando tengas tu consulta:
# resultado_3a = pd.read_sql_query(consulta_3a, conn)
# print(resultado_3a)

In [None]:
# SOLUCIÓN EJERCICIO 3A:
consulta_3a_solucion = """
SELECT 
    tipo_transaccion,
    COUNT(*) as cantidad_transacciones,
    SUM(CASE WHEN monto > 0 THEN monto ELSE 0 END) as total_ingresos,
    SUM(CASE WHEN monto < 0 THEN ABS(monto) ELSE 0 END) as total_egresos
FROM transacciones 
WHERE fecha_transaccion >= date('now', '-30 days')
GROUP BY tipo_transaccion
ORDER BY cantidad_transacciones DESC;
"""

resultado_3a = pd.read_sql_query(consulta_3a_solucion, conn)
print("✅ Transacciones por tipo (último mes):")
print(resultado_3a)

## 🎯 Área de Práctica Libre

**Aquí puedes escribir y probar tus consultas. Si tienes errores, los revisamos juntos.**

In [None]:
# 🧪 ÁREA DE PRUEBAS - Escribe tus consultas aquí

# Ejemplo: Ver estructura de una tabla
estructura_clientes = pd.read_sql_query("PRAGMA table_info(clientes)", conn)
print("📋 Estructura de la tabla clientes:")
print(estructura_clientes[['name', 'type']].to_string(index=False))

In [None]:
# 🔧 TU CONSULTA AQUÍ:
# Escribe cualquier consulta que quieras probar

mi_consulta = """
-- Escribe tu consulta aquí
SELECT 'Hola SQL Bancario!' as mensaje;
"""

try:
    resultado = pd.read_sql_query(mi_consulta, conn)
    print("✅ Consulta ejecutada correctamente:")
    print(resultado)
except Exception as e:
    print(f"❌ Error en la consulta: {e}")
    print("💡 Revisemos el error juntos")

# 🏙️ PROBLEMA 2: Ranking de Ciudades por Ingresos
# OBJETIVO: Ranking de ciudades por promedio de ingresos anuales

# Instrucciones detalladas:
# 1. Agrupa por ciudad
# 2. Calcula el promedio de ingresos_anuales por ciudad  
# 3. Cuenta cuántos clientes hay por ciudad
# 4. Ordena de mayor a menor promedio de ingresos
# 5. Solo clientes activos

mi_consulta = """
-- 🎯 Tu consulta para el Problema 2:
-- Pistas: usa GROUP BY, AVG(), COUNT(), ORDER BY DESC
-- Columnas a mostrar: ciudad, promedio_ingresos, cantidad_clientes

SELECT 
    ciudad,
    AVG(ingresos_anuales) as promedio_ingresos,
    COUNT(*) as cantidad_clientes
FROM clientes
WHERE estado = 'ACTIVO'
GROUP BY ciudad
ORDER BY promedio_ingresos DESC;
"""

try:
    resultado = pd.read_sql_query(mi_consulta, conn)
    print("✅ Ranking de ciudades por ingresos:")
    print(resultado)
except Exception as e:
    print(f"❌ Error en la consulta: {e}")
    print("💡 Pistas para corregir:")
    print("  - ¿Usaste GROUP BY ciudad?")
    print("  - ¿Agregaste AVG(ingresos_anuales)?")
    print("  - ¿Ordenaste con ORDER BY promedio DESC?")

## 🚀 Desafíos SQL Bancarios

**Cuando estés listo, intenta estos desafíos más complejos:**

In [None]:
# DESAFÍO 1: Clientes con más de una cuenta
# TODO: Encuentra clientes que tengan más de una cuenta activa
# Muestra: cliente_id, nombre_completo, cantidad_cuentas, saldo_total

# Tu consulta aquí:

In [None]:
# DESAFÍO 2: TOP 5 clientes con más movimientos
# TODO: Encuentra los 5 clientes con más transacciones en el último mes
# Usa JOINs entre clientes, cuentas y transacciones

# Tu consulta aquí:

## 💡 Tips SQL para Banca

### ✅ Buenas Prácticas:
1. **Siempre filtra por estado activo** cuando trabajas con clientes/cuentas
2. **Usa CASE WHEN** para clasificar montos (positivos/negativos)
3. **Maneja fechas cuidadosamente** - usa funciones como `date('now', '-30 days')`
4. **Agrega límites** a tus consultas para evitar resultados masivos
5. **Usa alias descriptivos** para las columnas calculadas

### ⚠️ Errores Comunes:
- Olvidar el `GROUP BY` cuando usas agregaciones
- No filtrar registros inactivos
- Confundir INNER JOIN con LEFT JOIN
- No manejar valores NULL correctamente

In [None]:
# Cerrar conexión
conn.close()
print("🔌 Conexión cerrada")

In [None]:
# 🎯 CELDA SIMPLE - SOLO PARA TI
# Esta es la ÚNICA celda que necesitas ejecutar ahora

import sqlite3
import pandas as pd

# Conectar a la base de datos
conn = sqlite3.connect('../data/banking_core.db')

# Consulta simple: Ranking de ciudades por ingresos
consulta = """
SELECT 
    ciudad,
    AVG(ingresos_anuales) as promedio_ingresos,
    COUNT(*) as cantidad_clientes
FROM clientes
WHERE estado = 'ACTIVO'
GROUP BY ciudad
ORDER BY promedio_ingresos DESC;
"""

# Ejecutar y mostrar resultados
resultado = pd.read_sql_query(consulta, conn)
print("🏙️ RANKING DE CIUDADES POR INGRESOS:")
print("="*50)
print(resultado)

conn.close()