# Día 5 – Operaciones básicas en Pandas

#### Tema de hoy: Agregaciones (sum, mean, count)

## 1. Introducción

#### Imaginemos la siguiente situación: trabajamos en un banco o en una empresa y tenemos un archivo lleno de registros de operaciones. Cada fila representa un cliente con el monto de su préstamo o de su compra.
### El jefe se acerca y nos pide tres cosas:

- #### ¿Cuál fue el total de dinero prestado?

- #### ¿Cuál es el promedio de los préstamos?

- #### ¿Cuántos registros hay cargados?

#### Si lo hiciéramos a mano, tendríamos que revisar fila por fila, sumar montos, dividir para sacar el promedio y contar filas. Un trabajo lento, repetitivo y que puede traer errores.

#### Entonces aparece la necesidad: ¿cómo podemos obtener esas respuestas de forma inmediata y confiable?
---

## 2. La herramienta que vamos a usar

### Pandas nos da funciones muy simples para resolver esto en segundos:

- #### sum() → calcula la suma.

- #### mean() → calcula el promedio.

- #### count() → cuenta cuántos valores válidos existen en una columna.

#### Estas funciones son las que llamamos funciones de agregación, porque toman muchos valores y los convierten en un único valor que resume la información.
---

## 3. Concepto

#### sum(): recorre todos los números de una columna y los suma. 

#### sum() en NumPy

#### Imaginate que tenés una lista de números: 2, 4, 6, 8.

#### Si vos los querés juntar en un solo número, lo que hacés es sumarlos: 2 + 4 + 6 + 8 = 20.

#### Eso mismo hace sum(), pero en lugar de que vos los vayas sumando a mano, la función lo hace rapidísimo por vos.

#### `Analogía`
#### Pensá que tenés una alcancía. Cada día metés monedas: lunes 5, martes 3, miércoles 7.
#### Si querés saber cuánto juntaste en total, no vas contando una por una… tirás todas las monedas arriba de la mesa y las sumás.
#### Eso es lo que hace sum(): tira las monedas en la mesa y te dice el total.
---

#### mean(): toma todos los números, los suma y divide entre la cantidad → eso es el promedio. Nos da una idea del valor típico.

#### mean() en NumPy

#### Primero suma todos los números.

#### Después divide esa suma por la cantidad de números que había.

#### El resultado es el promedio: un número que representa “el valor típico” de la lista.

#### `Analogía`
#### Imaginate que comprás 3 helados: uno cuesta 10, otro 20 y otro 30.
#### Si querés saber cuánto cuesta “más o menos” un helado, no tiene sentido mirar solo el más caro o el más barato.
#### Lo que hacés es sumar (10 + 20 + 30 = 60) y después dividir entre 3 (porque fueron 3 helados).
#### 60 ÷ 3 = 20.
#### Ese 20 es el precio promedio: te da una idea de lo que vale un helado en general.

---

#### count(): no mira qué valor hay, simplemente cuenta cuántos registros están cargados. Importante: solo cuenta los que no son nulos.

#### count() en NumPy

#### No le interesa si los números son grandes, chicos o repetidos.

#### Lo único que hace es contar cuántos valores hay cargados.

#### Importante: si hay valores vacíos (NaN), esos no los cuenta.

#### `Analogía`
#### Imaginate que tenés una fila de sillas en un cine.
#### No importa si la persona es alta, baja, gorda o flaca.
#### Lo único que hacés es contar: “¿cuántos asientos están ocupados?”.
#### Eso es count(): se fija en cuántos datos hay, sin mirar qué valor tienen.

### En NumPy
#### Ojo: `en NumPy puro usamos len() para contar, pero si trabajamos con datos que pueden tener vacíos, lo más común es usar pandas con .count()`

#### Con estas tres funciones ya podemos responder preguntas básicas que siempre aparecen en un análisis.
---

## 4. Ejemplos en código

In [1]:
import pandas as pd

# Creamos un DataFrame de ejemplo
data = {
    "Cliente": ["Ana", "Luis", "Sofía", "Marta", "Juan"],
    "Monto":   [1000, 2000, 1500, 3000, 1200],
    "Plazo":   [12, 24, 18, 36, 12]  # en meses
}
df = pd.DataFrame(data)

# 1) Suma total de la columna "Monto"
print("Total prestado:", df["Monto"].sum())

# 2) Promedio de los montos
print("Promedio de préstamos:", df["Monto"].mean())

# 3) Cantidad de registros en la columna "Monto"
print("Cantidad de operaciones:", df["Monto"].count())


Total prestado: 8700
Promedio de préstamos: 1740.0
Cantidad de operaciones: 5


## 5. Otro ejemplo con varias columnas

In [2]:
# Promedio de Monto y Plazo al mismo tiempo
print(df[["Monto", "Plazo"]].mean())

# Cantidad de registros en todas las columnas
print(df.count())


Monto    1740.0
Plazo      20.4
dtype: float64
Cliente    5
Monto      5
Plazo      5
dtype: int64


## 6. Ejercicios 

#### Ejercicio 1 – Control de calidad de datos
#### Tienen un DataFrame con las columnas: Producto, Precio, Cantidad.

- #### Calcular el ingreso total multiplicando precio * cantidad y luego sumando todos los ingresos.

- #### Calcular el promedio de precio y el promedio de cantidad.

- #### Calcular la diferencia entre la cantidad de registros totales (len(df)) y la cantidad que devuelve count() en cada columna.

- #### Explicar qué significa esa diferencia en términos de datos faltantes.

### `explicar es parte fundamental del análisis de datos. No es opcional. Es lo que diferencia`
### `“ejecutar un comando” de “entender y comunicar lo que pasa con los datos”`

In [3]:
import pandas as pd
import numpy as np

# Creamos un DataFrame de ejemplo con un dato faltante (NaN)
data = {
    "Producto": ["Arroz", "Pan", "Leche", "Azúcar", "Yerba"],
    "Precio":   [1200, 1500, np.nan, 800, 950],
    "Cantidad": [10, 5, 8, np.nan, 12]
}
df = pd.DataFrame(data)

print("DataFrame original:")
print(df)

# 1) Calcular ingreso total = Precio * Cantidad, luego sumar todo
df["Ingreso"] = df["Precio"] * df["Cantidad"]
ingreso_total = df["Ingreso"].sum()
print("\nIngreso total:", ingreso_total)

# 2) Calcular promedio de precio y promedio de cantidad
promedio_precio = df["Precio"].mean()
promedio_cantidad = df["Cantidad"].mean()
print("\nPromedio de precio:", promedio_precio)
print("Promedio de cantidad:", promedio_cantidad)

# 3) Diferencia entre cantidad total de filas y el count() de cada columna
total_filas = len(df)
conteos = df.count()
print("\nCantidad total de filas:", total_filas)
print("Cantidad de registros válidos por columna:\n", conteos)

diferencias = total_filas - conteos
print("\nDiferencia (faltantes) por columna:\n", diferencias)


DataFrame original:
  Producto  Precio  Cantidad
0    Arroz  1200.0      10.0
1      Pan  1500.0       5.0
2    Leche     NaN       8.0
3   Azúcar   800.0       NaN
4    Yerba   950.0      12.0

Ingreso total: 30900.0

Promedio de precio: 1112.5
Promedio de cantidad: 8.75

Cantidad total de filas: 5
Cantidad de registros válidos por columna:
 Producto    5
Precio      4
Cantidad    4
Ingreso     3
dtype: int64

Diferencia (faltantes) por columna:
 Producto    0
Precio      1
Cantidad    1
Ingreso     2
dtype: int64


## Explicación

### `1. Ingreso total`

- #### Creamos una nueva columna Ingreso = Precio * Cantidad.

- #### Luego sumamos esa columna → esto nos da el dinero total generado por todas las ventas/productos.

### `2. Promedio de precio y cantidad`

- #### mean() calcula el promedio ignorando los valores faltantes (NaN).

- #### Así obtenemos el precio promedio de los productos y la cantidad promedio.

### `3. Diferencia entre len(df) y count()`

- #### len(df) cuenta todas las filas del DataFrame, sin importar si tienen datos faltantes.

- #### count() cuenta solo los valores que no son nulos en cada columna.

- #### Si hay una diferencia, significa que en esa columna hay datos faltantes.

#### *`Ejemplo con este DataFrame:`*

- #### Tenemos 5 filas en total.

- #### La columna Precio tiene 4 valores válidos → diferencia = 1 → un precio faltante.

- #### La columna Cantidad tiene 4 valores válidos → diferencia = 1 → una cantidad faltante.

- #### La columna Producto tiene 5 → diferencia = 0 → no faltan datos.

### Conclusión:
#### La diferencia entre len(df) y count() nos muestra cuántos datos faltan en cada columna. 
#### Esto es clave en control de calidad de datos porque nos permite detectar dónde hay información incompleta que puede afectar cálculos como el ingreso total o el promedio.
---

In [6]:
import pandas as pd

# Creamos un DataFrame de ejemplo
data = {
    "Cliente": ["Ana", "Luis", "Sofía", "Marta", "Juan", "Carla"],
    "Monto":   [1000, 2000, 1500, 3000, 1200, 2500],
    "Plazo":   [12, 24, 18, 36, 12, 24],  # en meses
    "Sucursal": ["Norte", "Sur", "Norte", "Oeste", "Norte", "Sur"]
}
df = pd.DataFrame(data)

print("DataFrame original:")
print(df)

# 1) Total de préstamos otorgados
total_prestamos = df["Monto"].sum()
print("\nTotal de préstamos:", total_prestamos)

# 2) Promedio del monto por operación
promedio_monto = df["Monto"].mean()
print("Promedio por operación:", promedio_monto)

# 3) Cantidad de operaciones (filas totales)
cantidad_operaciones = len(df)
print("Cantidad de operaciones:", cantidad_operaciones)

# 4) Filtrar solo la sucursal "Norte"
df_norte = df[df["Sucursal"] == "Norte"]

total_norte = df_norte["Monto"].sum()
promedio_norte = df_norte["Monto"].mean()
cantidad_norte = len(df_norte)

print("\nSucursal Norte - Total:", total_norte)
print("Sucursal Norte - Promedio:", promedio_norte)
print("Sucursal Norte - Cantidad:", cantidad_norte)


DataFrame original:
  Cliente  Monto  Plazo Sucursal
0     Ana   1000     12    Norte
1    Luis   2000     24      Sur
2   Sofía   1500     18    Norte
3   Marta   3000     36    Oeste
4    Juan   1200     12    Norte
5   Carla   2500     24      Sur

Total de préstamos: 11200
Promedio por operación: 1866.6666666666667
Cantidad de operaciones: 6

Sucursal Norte - Total: 3700
Sucursal Norte - Promedio: 1233.3333333333333
Sucursal Norte - Cantidad: 3


## Explicación

### `1. Total de préstamos otorgados`

- #### Con df["Monto"].sum() sumamos todos los montos → esto nos da el dinero total que la institución prestó.

### `2. Promedio por operación`

- #### Con df["Monto"].mean() sacamos el valor promedio de los préstamos. Nos sirve para saber el “tamaño típico” de las operaciones.

### `3. Cantidad de operaciones`

- #### Con len(df) contamos cuántas filas hay en total, que corresponde a la cantidad de operaciones registradas.

### `4. Sucursal Norte`

- #### Filtramos solo las filas donde Sucursal == "Norte".

#### *Sobre ese subconjunto, volvemos a calcular:*

- #### Total de préstamos de Norte.

- #### Promedio por operación en Norte.

- #### Cantidad de operaciones en Norte.

---

### Reflexión

#### ¿Por qué es útil calcular las métricas para todo el dataset y luego para una parte filtrada?

- #### Porque el análisis general nos da la foto completa de la empresa.

- #### Pero el análisis filtrado nos permite comparar entre sucursales, productos o segmentos de clientes.

#### *Esto es esencial para detectar patrones:*

- #### Quizás el promedio general es 2000, pero en “Norte” es 1200 → eso indica que en esa sucursal se otorgan préstamos más chicos.

- #### O tal vez la sucursal “Norte” tiene el mayor total prestado → entonces merece más atención.

### `En pocas palabras: los cálculos globales nos dicen “cómo está todo en general” y `
### `los cálculos filtrados nos ayudan a entender “cómo se comporta cada parte del todo”.`

# Crear columnas derivadas

## 1. Introducción

#### Hasta ahora trabajamos con los datos “tal cual vinieron” en el archivo: columnas de montos, plazos, productos, cantidades.
#### Pero muchas veces necesitamos nueva información que no está en los datos originales, sino que surge de un cálculo a partir de lo existente.

### Ejemplo real:

- #### En una planilla de ventas, no siempre tenemos directamente los ingresos. Tenemos precio y cantidad, pero para calcular ingresos necesitamos multiplicar esos dos valores.

- #### En un dataset de préstamos, podemos tener el monto y el plazo, pero quizás necesitamos calcular la cuota mensual.

### Entonces aparece la necesidad: `crear nuevas columnas a partir de operaciones sobre otras columnas.``
---

## 2. La herramienta que vamos a usar

#### En Pandas podemos crear una columna derivada de forma muy simple:

- ### `df["NuevaColumna"] = df["Columna1"] operación df["Columna2"]`


#### El nombre de la nueva columna lo inventamos nosotros.

#### Podemos usar operadores matemáticos (+, -, *, /) o funciones de Pandas/Numpy.

#### El resultado se guarda como una nueva columna del DataFrame, junto a las demás.
---

## 3. Concepto

#### Una columna derivada es una columna nueva que vos mismo creás dentro del DataFrame.
#### No viene en los datos originales, sino que aparece al hacer un cálculo o transformación con la información que ya existe.

### Ejemplo:
- #### Tenés Precio y Cantidad. Si los multiplicás, obtenés Ingresos. Esa nueva columna de Ingresos es derivada.

### ¿Para qué sirve?
- #### Para enriquecer los datos con información más útil.
#### Así podés responder preguntas que con las columnas originales no podrías.

### Ventaja:
- #### Los datos originales quedan intactos.
#### Simplemente agregás una capa extra de información que te da más valor para analizar.

### En la práctica:
- #### Te permite calcular métricas como descuentos, tasas de interés, cuotas, ingresos totales, promedios ajustados, etc.
#### Es como “sumar piezas nuevas al rompecabezas” para ver la foto más completa.
---

## 4. Ejemplos con código

In [None]:
import pandas as pd

# Dataset de ejemplo: productos vendidos
data = {
    "Producto": ["Notebook", "Auriculares", "Licuadora"],
    "Precio":   [3500, 1200, 1800],
    "Cantidad": [3, 5, 2]
}
df = pd.DataFrame(data)

print("DataFrame original:")
print(df)

# 1) Crear columna derivada: Ingreso = Precio * Cantidad
df["Ingreso"] = df["Precio"] * df["Cantidad"] # python respeta las posiciones fila por fila - pandas va tomando el valor de la misma fila de cada columna y los multiplica
print("\nCon columna Ingreso derivada:")
print(df)


DataFrame original:
      Producto  Precio  Cantidad
0     Notebook    3500         3
1  Auriculares    1200         5
2    Licuadora    1800         2

Con columna Ingreso derivada:
      Producto  Precio  Cantidad  Ingreso
0     Notebook    3500         3    10500
1  Auriculares    1200         5     6000
2    Licuadora    1800         2     3600


In [2]:
# Dataset de préstamos
data = {
    "Cliente": ["Ana", "Luis", "Sofía"],
    "Monto":   [1000, 2000, 1500],
    "Plazo":   [12, 24, 18]  # en meses
}
df = pd.DataFrame(data)

# 2) Crear columna derivada: Cuota mensual = Monto / Plazo
df["Cuota_Mensual"] = df["Monto"] / df["Plazo"]
print(df)


  Cliente  Monto  Plazo  Cuota_Mensual
0     Ana   1000     12      83.333333
1    Luis   2000     24      83.333333
2   Sofía   1500     18      83.333333


## 5. Ejercicios

## Ejercicio 1 – Ingresos y control de stock
#### Tienen un DataFrame con columnas: Producto, Precio, Cantidad, Costo.

- #### Crear una columna Ingreso = Precio * Cantidad.

- #### Crear una columna Ganancia = (Precio - Costo) * Cantidad.

- #### Calcular el ingreso total y la ganancia total.

- #### Reflexionar: ¿qué pasa si un producto tiene precio cargado pero no cantidad (NaN)?
---
### Si un producto tiene precio cargado pero no cantidad, entonces cuando calculamos el Ingreso = Precio * Cantidad, el resultado va a ser NaN.
### En la práctica, esto significa que no sabemos cuántas unidades se vendieron, por lo tanto no podemos calcular el ingreso de ese producto.
#### `Esto es un problema de calidad de datos: aunque tengamos parte de la información (precio), sin la otra parte (cantidad) el cálculo queda incompleto. El NaN nos está avisando que falta un dato clave y que los resultados no son totalmente confiables.`
---

In [11]:
data = {
    'Producto': ['TV', 'SONIDO', 'PROYECTOR'],
    'Precio': [50000, 30000, 100000],
    'Cantidad': [5, 5, 5],
    'Costo': [40000, 20000, 80000]
}

df = pd.DataFrame(data)
print(f'Columna completa\n{df}')

print('')

df['Ingreso'] = df['Precio'] * df['Cantidad']
print(df)

print('')

df['Ganancia'] = (df['Precio'] - df['Costo']) * df['Cantidad']

print(df)

print('')

ingreso_total = df['Ingreso'].sum()
print(f'El ingreso total es: {ingreso_total}')
ganancia_total = df['Ganancia'].sum()
print(f'La ganancia total es: {ganancia_total}')


Columna completa
    Producto  Precio  Cantidad  Costo
0         TV   50000         5  40000
1     SONIDO   30000         5  20000
2  PROYECTOR  100000         5  80000

    Producto  Precio  Cantidad  Costo  Ingreso
0         TV   50000         5  40000   250000
1     SONIDO   30000         5  20000   150000
2  PROYECTOR  100000         5  80000   500000

    Producto  Precio  Cantidad  Costo  Ingreso  Ganancia
0         TV   50000         5  40000   250000     50000
1     SONIDO   30000         5  20000   150000     50000
2  PROYECTOR  100000         5  80000   500000    100000

El ingreso total es: 900000
La ganancia total es: 200000


## Ejercicio 2 – Préstamos y cuotas
#### Tienen un DataFrame con: Cliente, Monto, Plazo, Sucursal.

- #### Crear una columna Cuota_Mensual = Monto / Plazo.

- #### Crear una columna Cuota_Doble = Cuota_Mensual * 2 (simulando pago doble).

- #### Filtrar solo la sucursal “Sur” y calcular el promedio de Cuota_Mensual.

- #### Reflexionar: ¿por qué podría ser importante guardar las cuotas calculadas como columna en lugar de calcularlas “a mano” cada vez?
---
#### Podríamos calcular la cuota mensual cada vez con Monto / Plazo, pero si lo hacemos siempre “a mano”:

#### Es más lento y repetitivo.

#### Hay más riesgo de cometer errores al escribir la operación.

#### Si después queremos usar esa cuota para otros cálculos (por ejemplo, intereses o pagos dobles), tenemos que repetir la fórmula cada vez.

#### En cambio, si guardamos la columna derivada Cuota_Mensual:

#### La información queda lista y accesible.

#### Podemos usarla en otros cálculos sin volver a escribir la fórmula.

#### Aporta claridad: cualquiera que mire el DataFrame entiende directamente cuál es la cuota de cada cliente.

#### En resumen: guardar la columna nos da eficiencia, reduce errores y hace más claro el análisis.
---

In [25]:
data = {
    'Cliente': ['Alejandro Arriola', 'Matias Samudio', 'Pablo Medina', 'Tiago Ramirez'],
    'Monto': [1000000, 2000000, 2500000, 1500000],
    'Plazo': [12, 10, 8, 18],
    'Sucursal': ['Villamorra', 'Centro', 'Carmelitas', 'Sur']
}

df = pd.DataFrame(data)
print(f'Todos los clientes con sus prestamos y sucursales\n {df}')

print('')

df['Cuota_Mensual'] = df['Monto'] / df['Plazo']
print(df)

print('')

df['Cuota_Doble'] = df['Cuota_Mensual'] * 2
print(df)

print('')

promedio_sur = df[df['Sucursal'] == 'Sur']['Cuota_Mensual'].mean()
print(f'El promedio de cuota mensual de la sucursal sur es: \n{promedio_sur}')



Todos los clientes con sus prestamos y sucursales
              Cliente    Monto  Plazo    Sucursal
0  Alejandro Arriola  1000000     12  Villamorra
1     Matias Samudio  2000000     10      Centro
2       Pablo Medina  2500000      8  Carmelitas
3      Tiago Ramirez  1500000     18         Sur

             Cliente    Monto  Plazo    Sucursal  Cuota_Mensual
0  Alejandro Arriola  1000000     12  Villamorra   83333.333333
1     Matias Samudio  2000000     10      Centro  200000.000000
2       Pablo Medina  2500000      8  Carmelitas  312500.000000
3      Tiago Ramirez  1500000     18         Sur   83333.333333

             Cliente    Monto  Plazo    Sucursal  Cuota_Mensual    Cuota_Doble
0  Alejandro Arriola  1000000     12  Villamorra   83333.333333  166666.666667
1     Matias Samudio  2000000     10      Centro  200000.000000  400000.000000
2       Pablo Medina  2500000      8  Carmelitas  312500.000000  625000.000000
3      Tiago Ramirez  1500000     18         Sur   83333.333333  1

## Caso práctico: Tasa de interés efectiva

## 1. Introducción

#### Hasta ahora aprendimos a resumir datos con sum, mean, count y también a crear columnas derivadas.
#### Ahora vamos a poner todo junto en un caso práctico del mundo financiero: calcular la tasa de interés efectiva de préstamos.
---

## 2. necesidad

#### En los bancos y financieras no siempre se habla de la tasa nominal anual (TNA), porque esa tasa no refleja el costo real del préstamo.
### Ejemplo:

- #### Un préstamo puede tener TNA del 24%, pero los pagos se hacen en cuotas mensuales.

- #### El efecto de los intereses compuestos (que se van aplicando mes a mes) hace que el cliente realmente pague más.

### El jefe del área financiera te pide:

- #### Calculemos la tasa efectiva anual (TEA) de cada préstamo.

- #### Necesito ver claramente cuánto representa esa diferencia entre lo nominal y lo real.
---

## 3. La herramienta que usaremos

### Matemáticamente, la tasa efectiva anual (TEA) se calcula con la fórmula:

- ## `TEA=(1+nTNA​)n−1`

### Donde:

- ### TNA = tasa nominal anual (ej. 0.24 para 24%).

- ### n = cantidad de períodos en un año (12 si es mensual, 4 si es trimestral).

### En Pandas:

- #### Guardamos la fórmula en una columna derivada.

- #### Aplicamos la operación a todo el DataFrame de una sola vez.
---

## 4. Ejemplo en código

In [27]:
import pandas as pd

# Dataset de préstamos con tasa nominal anual
# Creamos el DataFrame con columnas Cliente, Monto, TNA, PagosPorAño.
data = {
    "Cliente": ["Ana", "Luis", "Sofía", "Marta"],
    "Monto":   [1000, 2000, 1500, 3000],
    "TNA":     [0.24, 0.30, 0.18, 0.28],  # tasas nominales anuales - La columna TNA está en formato decimal (24% → 0.24).
    "PagosPorAño": [12, 12, 12, 12]       # mensualidad
}
df = pd.DataFrame(data)

print("Préstamos originales:")
print(df)

# Crear columna derivada: Tasa Efectiva Anual (TEA)
# Aplicamos la fórmula directamente a las columnas de Pandas.
df["TEA"] = (1 + df["TNA"] / df["PagosPorAño"]) ** df["PagosPorAño"] - 1

print("\nCon TEA calculada:")
print(df[["Cliente", "TNA", "TEA"]]) # Obtenemos una nueva columna TEA con el resultado del cálculo.


Préstamos originales:
  Cliente  Monto   TNA  PagosPorAño
0     Ana   1000  0.24           12
1    Luis   2000  0.30           12
2   Sofía   1500  0.18           12
3   Marta   3000  0.28           12

Con TEA calculada:
  Cliente   TNA       TEA
0     Ana  0.24  0.268242
1    Luis  0.30  0.344889
2   Sofía  0.18  0.195618
3   Marta  0.28  0.318881


## Otro ejemplo

#### Idea

#### Tenés una tasa nominal anual (TNA) pagada en períodos (mensual, trimestral, etc.). La tasa efectiva anual (TEA) muestra el rendimiento real con capitalización.

### Fórmula:
## `TEA = (1 + TNA / n) ^ n − 1`
#### n = períodos de capitalización por año.

## Ejemplo en codigo

In [28]:
import pandas as pd

# Inversiones/depósitos
data = {
    "Cuenta": ["Plazo Fijo A", "Plazo Fijo B", "Bonos C", "Fondo D"],
    "Capital_Inicial": [1_000_000, 1_000_000, 1_000_000, 1_000_000],
    "TNA": [0.28, 0.24, 0.20, 0.18],      # nominal anual
    "CompPorAño": [12, 4, 2, 1]           # mensual, trimestral, semestral, anual
}
df = pd.DataFrame(data)

# Tasa efectiva anual (rendimiento real)
df["TEA"] = (1 + df["TNA"]/df["CompPorAño"])**df["CompPorAño"] - 1

# Capital al final del año (aprox.)
df["Capital_Final"] = df["Capital_Inicial"] * (1 + df["TEA"])

print(df[["Cuenta", "TNA", "CompPorAño", "TEA", "Capital_Final"]])


         Cuenta   TNA  CompPorAño       TEA  Capital_Final
0  Plazo Fijo A  0.28          12  0.318881   1.318881e+06
1  Plazo Fijo B  0.24           4  0.262477   1.262477e+06
2       Bonos C  0.20           2  0.210000   1.210000e+06
3       Fondo D  0.18           1  0.180000   1.180000e+06


### Lectura rápida

### TEA > TNA cuando hay capitalización (más períodos → mayor TEA).

### Capital_Final muestra cuánto rinde el depósito en 1 año considerando la capitalización.
---

## 6. Ejercicios

### Ejercicio 1 – Comparación de tasas
#### Tienen un DataFrame con Cliente, Monto, TNA, PagosPorAño.

- #### Calcular la columna TEA.

- #### Mostrar solo Cliente, TNA y TEA.

#### Reflexionar: ¿por qué dos clientes con la misma TNA pueden tener diferente TEA si cambian los períodos de pago?

---
## Reflexión

#### Aunque todos tienen la misma TNA (12%), la TEA cambia porque depende de cuántas veces en el año se capitalizan los intereses:

- #### Si te cobran una vez al año, solo aplicás el 12% directo.

- #### Si te cobran dos veces (semestral), cada vez se aplica 6% y luego vuelve a sumar intereses → un poquito más del 12%.

- #### Si es mensual, se aplica 1% cada mes, y al acumularse los intereses, termina siendo 12,68%.

- #### Cuanto más frecuente son los pagos, más alta es la TEA aunque la TNA sea la misma.
---

In [38]:
prestamos = {
    'Cliente': ['Jorge', 'Carlos', 'Esteban', 'Luis'],
    'Monto': [500_000, 700_000, 900_000, 200_000],
    'TNA': [0.12, 0.18, 0.20, 0.24],
    'PagosPorAño': [12, 12, 12, 12]
}

df = pd.DataFrame(prestamos)
print(df)

print('')

df['TEA'] = (1 + df['TNA'] / df['PagosPorAño']) ** df['PagosPorAño'] - 1
print(df)

print('')

print(df[['Cliente', 'TNA', 'TEA']])


   Cliente   Monto   TNA  PagosPorAño
0    Jorge  500000  0.12           12
1   Carlos  700000  0.18           12
2  Esteban  900000  0.20           12
3     Luis  200000  0.24           12

   Cliente   Monto   TNA  PagosPorAño       TEA
0    Jorge  500000  0.12           12  0.126825
1   Carlos  700000  0.18           12  0.195618
2  Esteban  900000  0.20           12  0.219391
3     Luis  200000  0.24           12  0.268242

   Cliente   TNA       TEA
0    Jorge  0.12  0.126825
1   Carlos  0.18  0.195618
2  Esteban  0.20  0.219391
3     Luis  0.24  0.268242
