# Clase 3: Introducción a NumPy

<a href="https://colab.research.google.com/github/hizocar/python_andes_analytics/blob/main/docs/modulo_2/clase3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

NumPy, que significa "Numerical Python", es una de las bibliotecas más importantes en Python para el cálculo numérico. Su característica principal es la introducción de un potente objeto de arreglo multidimensional llamado ndarray. NumPy ofrece también diversas funciones para realizar operaciones matemáticas y lógicas, operaciones de álgebra lineal, transformadas de Fourier, y más, sobre estos arreglos.

Aquí hay algunos conceptos básicos de NumPy con ejemplos:

- Importación de NumPy: Para usar NumPy, primero necesitas importarlo, usualmente como np.

In [None]:
import numpy as np

- Creación de Arreglos: Puedes crear arreglos NumPy desde listas de Python.

In [None]:
arr = np.array([1, 2, 3, 4, 5])
print(arr)

- Arreglos Multidimensionales: NumPy puede manejar arreglos de múltiples dimensiones.

In [None]:
arr_2d = np.array([[1, 2, 3], [4, 5, 6]])
print(arr_2d)

- Tipos de Datos en NumPy: NumPy decide automáticamente el tipo de datos, pero también puedes especificarlo manualmente.

In [None]:
arr = np.array([1, 2, 3], dtype='float32')

- Acceso a Elementos y Rebanado: Accede a elementos específicos, filas, columnas y sub-arreglos como en listas Python.

In [None]:
print(arr[0])         # primer elemento
print(arr_2d[1, 2])   # tercer elemento de la segunda fila
print(arr_2d[:, 1])   # segunda columna

- Operaciones Matemáticas: Puedes realizar operaciones matemáticas elemento a elemento.

In [None]:
arr = np.array([1, 2, 3])
print(arr + 2)
print(arr * 3)

- Funciones de Agregación: NumPy proporciona funciones como sum, mean, max, etc.

In [None]:
print(np.sum(arr))
print(np.mean(arr))

- Cambio de Forma y Redimensionamiento: Cambia la forma de los arreglos sin cambiar sus datos.

In [None]:
arr = np.array([1, 2, 3, 4, 5, 6])
reshaped_arr = arr.reshape(2, 3)
print(reshaped_arr)

- Álgebra Lineal: NumPy tiene un submódulo linalg para operaciones de álgebra lineal.

In [None]:
print(np.linalg.inv(arr_2d))  # inversa de una matriz

- Funciones Matemáticas Universales (ufunc): Funciones que operan en ndarray de manera elemento a elemento.

In [None]:
print(np.sqrt(arr))

## Creación y Manejo de Arrays
### Creación de Arrays:

Desde Listas de Python: Como ya vimos, se pueden crear arrays desde listas.

In [None]:
arr = np.array([1, 2, 3])

Arrays de Ceros y Unos: Útiles para inicializaciones.

In [None]:
zeros = np.zeros((3, 3))  # matriz 3x3 de ceros
ones = np.ones((2, 2))    # matriz 2x2 de unos

Array de un Rango de Valores: Similar a la función range en Python.

In [None]:
range_array = np.arange(10)  # array de 0 a 9


Arrays de Valores Aleatorios: Crear arrays con valores aleatorios.


In [None]:
random_array = np.random.random((2, 2))  # array 2x2 de valores aleatorios


### Manejo de Arrays:

Cambiar Forma (reshape): Modifica la forma sin cambiar los datos

In [None]:
arr = np.arange(6)
reshaped = arr.reshape((2, 3))  # cambia a matriz 2x3

Transposición (transpose): Intercambia filas por columnas

In [None]:
transposed = reshaped.transpose()


Redimensionar (resize): Cambia la forma, rellenando con ceros si es necesario.


In [None]:
resized = np.resize(arr, (3, 3))  # redimensiona a 3x3


## Operaciones Básicas
### Índices y Slicing:

Acceso por Índice: Similar a las listas en Python

In [None]:
arr = np.array([10, 20, 30, 40, 50])
print(arr[0])  # 10
print(arr[-1]) # 50

Slicing: Seleccionar un rango de elementos

In [None]:
sliced = arr[1:4]  # elementos del índice 1 al 3


Slicing Multidimensional: Puedes hacer slicing en múltiples dimensiones.


In [None]:
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
sub_array = arr_2d[:2, 1:]  # primeras 2 filas, columnas desde la segunda


## Vectorización
La vectorización en NumPy se refiere al uso de operaciones que actúan en arrays enteros en lugar de sus elementos individuales. Este enfoque es mucho más eficiente que usar bucles for tradicionales en Python, especialmente para arrays grandes, debido a varias razones:

- Menos Código Escrito: Las operaciones vectorizadas reducen la cantidad de código necesario para realizar operaciones matemáticas complejas.

- Eficiencia: NumPy está implementado en C, lo que significa que las operaciones vectorizadas pueden aprovechar las optimizaciones de bajo nivel y la paralelización en el hardware.

- Legibilidad: El código vectorizado es a menudo más legible y conciso.

- Uso Eficiente de la Memoria: Las operaciones vectorizadas en NumPy utilizan menos memoria al evitar bucles temporales y otros constructos de alto nivel.

### Ejemplos de Vectorización en NumPy
Vamos a ver algunos ejemplos que ilustran cómo la vectorización puede hacer que las operaciones sean más eficientes y fáciles de entender.

- Ejemplo 1: Operaciones Aritméticas
Sin vectorización, si queremos sumar dos listas elemento por elemento, necesitamos un bucle:

In [None]:
a = [1, 2, 3, 4, 5]
b = [6, 7, 8, 9, 10]
suma = [a[i] + b[i] for i in range(len(a))]


Con NumPy, esto se simplifica enormemente:

In [None]:
a = np.array([1, 2, 3, 4, 5])
b = np.array([6, 7, 8, 9, 10])
suma = a + b

- Ejemplo 2: Aplicar una Función a Cada Elemento
Supongamos que queremos calcular el seno de una serie de valores. Sin NumPy, podríamos hacer:

In [None]:
import math
valores = [0, π/2, π]
seno_valores = [math.sin(val) for val in valores]

Con NumPy, podemos vectorizar esta operación:

In [None]:
valores = np.array([0, np.pi/2, np.pi])
seno_valores = np.sin(valores)

- Ejemplo 3: Operaciones Condicionales
Vectorizar operaciones que involucran condiciones también es posible con NumPy. Por ejemplo, reemplazar todos los elementos mayores que un umbral con un valor fijo:

In [None]:
arr = np.array([1, 5, 10, 15, 20])
arr[arr > 10] = 0  # Reemplaza elementos mayores a 10 con 0

- Ejemplo 4: Productos y Operaciones Matriciales
Las operaciones matriciales son naturalmente vectorizadas y eficientes en NumPy:

In [None]:
matriz1 = np.array([[1, 2], [3, 4]])
matriz2 = np.array([[5, 6], [7, 8]])

# Producto punto
producto = np.dot(matriz1, matriz2)

# Multiplicación elemento a elemento
elementwise = matriz1 * matriz2


- Ejemplo 5: Reducción y Estadísticas
Funciones de reducción como sum, mean, max, etc., son más eficientes y fáciles de usar:

In [None]:
arr = np.array([1, 2, 3, 4, 5])

# Suma de todos los elementos
total = np.sum(arr)

# Promedio
promedio = np.mean(arr)


## Ejercicio: Valor Presente de una Anualidad con Pagos Variables
### Problema: Supongamos que una anualidad realiza pagos anuales durante 10 años. Los pagos crecen linealmente cada año, comenzando en $100 el primer año y aumentando $50 cada año subsiguiente. Si la tasa de interés es del 5% anual, ¿cuál es el valor presente de esta anualidad?

### Solución:

- Definir los Pagos Anuales: Los pagos son una secuencia que comienza en $100 y aumenta $50 cada año. Podemos representar esto con un array en NumPy.

- Calcular el Factor de Descuento para Cada Año: El valor presente de cada pago se calcula como Pago / (1 + tasa) ** año. Necesitamos calcular este factor para cada año.

- Calcular el Valor Presente Total: Sumamos el valor presente de cada pago.

- Primero, definimos los pagos y luego realizamos los cálculos necesarios.

In [None]:
import numpy as np

# Definir los parámetros
tasa_interes = 0.05
num_años = 10
incremento_pago = 50

# Crear un array con los pagos anuales
pagos = np.arange(100, 100 + incremento_pago * num_años, incremento_pago)

# Crear un array con los factores de descuento para cada año
factores_descuento = (1 + tasa_interes) ** np.arange(1, num_años + 1)

# Calcular el valor presente de cada pago
valores_presentes = pagos / factores_descuento

# Sumar todos los valores presentes para obtener el valor presente total de la anualidad
valor_presente_total = np.sum(valores_presentes)

print(f"El valor presente de la anualidad es: ${valor_presente_total:.2f}")

## Ejercicio: Cálculo de Reserva de Seguros con el Método de Cadena de Reclamaciones
### Problema: Se nos proporciona un triángulo de datos de siniestralidad para un seguro de no vida a lo largo de 5 años. Necesitamos calcular las reservas futuras utilizando el método de cadena de reclamaciones.

El triángulo de siniestralidad proporcionado (en miles de dólares) es como sigue:



\begin{array}{|c|c|c|c|c|c|}
\hline
\text{Año de ocurrencia} \ \text{Año de desarrollo} & 1 & 2 & 3 & 4 & 5 \\
\hline
1 & 100 & 150 & 180 & 200 & 210 \\
2 & 120 & 180 & 210 & 230 & - \\
3 & 130 & 195 & 225 & - & - \\
4 & 140 & 210 & - & - & - \\
5 & 150 & - & - & - & - \\
\hline
\end{array}


### Solución:

- Crear una Función para Calcular Factores de Desarrollo: Calculamos los factores de desarrollo para cada año.

- Proyectar los Valores Futuros: Usamos los factores para estimar los valores futuros en el triángulo.

- Calcular la Reserva Total: La reserva es la suma de las proyecciones futuras.

Primero, definimos el triángulo de siniestralidad y luego implementamos los pasos necesarios.

In [None]:
import numpy as np

# Datos del triángulo de siniestralidad
siniestralidad = np.array([
    [100, 150, 180, 200, 210],
    [120, 180, 210, 230, np.nan],
    [130, 195, 225, np.nan, np.nan],
    [140, 210, np.nan, np.nan, np.nan],
    [150, np.nan, np.nan, np.nan, np.nan]
])

# Función para calcular los factores de desarrollo
def calcular_factores_desarrollo(triangulo):
    factores = []
    for i in range(triangulo.shape[1] - 1):
        pagos_previos = triangulo[:, i][~np.isnan(triangulo[:, i])]
        pagos_actuales = triangulo[:, i + 1][~np.isnan(triangulo[:, i + 1])]
        if len(pagos_previos) > 0:
            factor = np.sum(pagos_actuales) / np.sum(pagos_previos)
            factores.append(factor)
        else:
            factores.append(np.nan)
    return np.array(factores)

# Calcular los factores de desarrollo
factores = calcular_factores_desarrollo(siniestralidad)

# Función para proyectar los valores futuros
def proyectar_valores(triangulo, factores):
    proyecciones = np.copy(triangulo)
    for i in range(proyecciones.shape[0]):
        for j in range(proyecciones.shape[1]):
            if np.isnan(proyecciones[i, j]):
                proyecciones[i, j] = proyecciones[i, j - 1] * factores[j - 1]
    return proyecciones

# Proyectar los valores futuros
proyecciones = proyectar_valores(siniestralidad, factores)

# Calcular la reserva total
reserva_total = np.nansum(proyecciones) - np.nansum(siniestralidad)

print(f"La reserva total estimada es: ${reserva_total:.2f} miles")
