### Numpy

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt
import matplotlib as mpl
mpl.rcParams['image.interpolation']= 'nearest'

#### ndarray 


Un ndarray es un contenedor multidimensional (generalmente de tamaño fijo) de elementos del mismo tipo y tamaño. El número de dimensiones y elementos de una matriz se definen con `shape`, que es una tupla de N enteros positivos que especifican el tamaño de cada dimensión. El tipo de elementos de la matriz se especifica mediante  los  `data-type object  (dtype)`, cada uno de los cuales se asocia  con un ndarray.

Como con otros  contenedores de Python, el contenido de un ndarray se puede acceder y modificar a través de los métodos y atributos de la ndarray.

Diferentes ndarrays pueden compartir los mismos datos, por lo que los cambios realizados en un ndarray pueden ser visibles en otro. Es decir, un ndarray puede ser una `vista` de otro ndarray y los datos a los que se refiere son manejados  por el ndarray `base`.
     
El objeto `ndarray` permite diferentes puntos de vista (sub sections, reshaping, transposition, etc.) sin cambiar nada en memoria.

#### dtypes 

A diferencia de las listas de python, las matrices  de NumPy toman en cuenta el tipo de datos almacenados. La lista completa de los dtypes NumPy se puede encontrar en la [documentación de Numpy](https://docs.scipy.org/doc/numpy/user/basics.types.html).

Por conveniencia de trataremos de mezclar bools, ints o floats dentro de una matriz para un rendimiento  mejor. Las cosas más importantes para recordar son:

* Los valores (NaN) llevan  matrices enteras o booleanas a flotantes
* Los matrices NumPy sólo tienen un dtype único para cada elemento .
* El objeto `dtype` es la última opción


#### Ejemplo

In [None]:
import numpy as np
import timeit

# =============================================================================
# Creación de arreglos a partir de listas de Python
# =============================================================================
def ejemplo_array_desde_lista():
    """
    Crea un array de NumPy a partir de una lista de Python.
    Se muestran los tipos de datos y la impresión del array.
    """
    lista = [1, 2, 3, 4, 5]
    array_desde_lista = np.array(lista)
    print("Array creado a partir de una lista:", array_desde_lista)
    print("Tipo de datos del array:", array_desde_lista.dtype)
    print("Lista original:", lista)
    print("Multiplicación del array por 2 (vectorizada):", array_desde_lista * 2)
    print("-" * 80)

# =============================================================================
# Creación de arrays con np.arange
# =============================================================================
def ejemplo_arange():
    """
    Utiliza np.arange para crear arrays con secuencias aritméticas.
    """
    print("np.arange(10):", np.arange(10))
    print("np.arange(0, 20, 2):", np.arange(0, 20, 2))
    print("np.arange(0, 5, 0.5):", np.arange(0, 5, 0.5))
    print("-" * 80)

# =============================================================================
# Creación de arrays con np.linspace
# =============================================================================
def ejemplo_linspace():
    """
    Emplea np.linspace para generar arrays con valores espaciados uniformemente.
    """
    print("np.linspace(0, 1, 5):", np.linspace(0, 1, 5))
    print("np.linspace(-1, 1, 10):", np.linspace(-1, 1, 10))
    print("-" * 80)

# =============================================================================
# Diferencias entre arrays y listas en python
# =============================================================================
def comparar_arrays_y_listas():
    """
    Compara las operaciones realizadas sobre arrays de NumPy y listas de Python.
    """
    lista = [1, 2, 3, 4, 5]
    array = np.array(lista)
    lista_mult = [x * 2 for x in lista]
    array_mult = array * 2
    
    print("Lista original:", lista)
    print("Lista multiplicada:", lista_mult)
    print("Array original:", array)
    print("Array multiplicado:", array_mult)
    print("Suma de lista consigo misma:", [a + a for a in lista])
    print("Suma de array consigo mismo:", array + array)
    print("Nota: Las operaciones en arrays de NumPy son generalmente más eficientes que en listas.")
    
    # Medición del tiempo de ejecución con timeit
    tiempo_lista = timeit.timeit(lambda: [x * 2 for x in lista], number=100000)
    tiempo_array = timeit.timeit(lambda: array * 2, number=100000)
    print(f"Tiempo de ejecución (Lista): {tiempo_lista:.6f} segundos")
    print(f"Tiempo de ejecución (Array de NumPy): {tiempo_array:.6f} segundos")
    print("-" * 80)

# =============================================================================
#  Ejemplos adicionales
# =============================================================================
def ejemplos_adicionales():
    """
    Incluye ejemplos adicionales de manipulación de arrays.
    """
    matriz_lista = [
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]
    ]
    array_matriz = np.array(matriz_lista)
    print("Array multidimensional:")
    print(array_matriz)
    print("Número de dimensiones:", array_matriz.ndim)
    print("Forma del array:", array_matriz.shape)
    print("Número total de elementos:", array_matriz.size)
    print("Array convertido a float:", np.array([1, 2, 3, 4, 5], dtype=float))
    print("Elemento en la posición [1, 2]:", array_matriz[1, 2])
    print("Subarray (slicing):")
    print(array_matriz[0:2, 1:3])
    print("-" * 80)

# =============================================================================
# Función principal para ejecutar todos los ejemplos
# =============================================================================
def main():
    print("\n================================================================================")
    print("Ejemplo: creación y manipulación de arrays con NumPy")
    print("================================================================================\n")
    
    ejemplo_array_desde_lista()
    ejemplo_arange()
    ejemplo_linspace()
    comparar_arrays_y_listas()
    ejemplos_adicionales()

# Ejecutar la función principal
task_output = main()


##### Funciones para crear matrices

In [None]:
np.identity(4)

In [None]:
np.eye(3, k=1)

In [None]:
np.eye(3, k=-1)

In [None]:
np.diag(np.arange(0, 20, 5))

In [None]:
#  np.random.random, retorna floats de manera aleatoria en [0.0, 1.0)

A = np.random.random((10,10))
plt.imshow(A)
plt.colorbar()
A[0,0]

### Indexación, slicing y máscaras Booleanas

In [None]:
import numpy as np

# =============================================================================
# Indexación de arrays
# =============================================================================
def ejemplo_indexacion():
    """
    Demuestra cómo acceder a elementos específicos en un array utilizando 
    indexación básica y avanzada.
    """
    arr = np.array([10, 20, 30, 40, 50])
    print("Array original:", arr)
    print("Elemento en la posición 2:", arr[2])
    
    matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
    print("\nMatriz original:")
    print(matriz)
    print("Elemento en la posición [1,2]:", matriz[1, 2])
    print("Segunda fila de la matriz:", matriz[1])
    print("Primera columna de la matriz:", matriz[:, 0])
    print("-" * 80)

# =============================================================================
# Slicing de Arrays
# =============================================================================
def ejemplo_slicing():
    """
    Ilustra cómo extraer subconjuntos de arrays utilizando slicing.
    """
    arr = np.arange(10)
    print("Array unidimensional:", arr)
    print("Slicing arr[2:5]:", arr[2:5])
    print("Slicing con step arr[0:9:2]:", arr[0:9:2])
    
    matriz = np.array([[10, 20, 30, 40],
                        [50, 60, 70, 80],
                        [90, 100, 110, 120],
                        [130, 140, 150, 160]])
    print("\nMatriz original:")
    print(matriz)
    print("Submatriz (slicing matriz[0:2, 1:3]):")
    print(matriz[0:2, 1:3])
    print("Submatriz (slicing matriz[:, 1:]):")
    print(matriz[:, 1:])
    print("-" * 80)

# =============================================================================
# Máscaras booleanas
# =============================================================================
def ejemplo_mascaras_booleanas():
    """
    Muestra cómo aplicar máscaras booleanas para filtrar datos en un array.
    """
    arr = np.array([5, 10, 15, 20, 25, 30, 35, 40])
    print("Array original para aplicar máscaras booleanas:", arr)
    print("Máscara booleana (arr > 20):", arr > 20)
    print("Elementos mayores que 20:", arr[arr > 20])
    print("Máscara booleana (múltiplos de 10):", arr % 10 == 0)
    print("Elementos múltiplos de 10:", arr[arr % 10 == 0])
    
    matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
    print("\nMatriz original:")
    print(matriz)
    print("Máscara booleana en matriz (>=5):")
    print(matriz >= 5)
    print("Elementos de la matriz que cumplen la condición:")
    print(matriz[matriz >= 5])
    print("-" * 80)

# =============================================================================
# Función principal para ejecutar todos los ejemplos de esta parte
# =============================================================================
def main():
    print("\n================================================================================")
    print("Indexación, slicing y máscaras Booleanas en NumPy")
    print("================================================================================\n")
    
    ejemplo_indexacion()
    ejemplo_slicing()
    ejemplo_mascaras_booleanas()
    
# Ejecutar la función principal
task_output = main()


### Operaciones vectorizadas y Broadcasting

In [None]:
import numpy as np

# =============================================================================
# Operaciones vectorizadas en NumPy
# =============================================================================
def ejemplo_operaciones_vectorizadas():
    """
    Demuestra cómo realizar operaciones aritméticas y lógicas en arrays de forma
    vectorizada, eliminando la necesidad de usar bucles explícitos.
    """
    a = np.array([1, 2, 3, 4, 5])
    b = np.array([10, 20, 30, 40, 50])
    
    print("Array a:", a)
    print("Array b:", b)
    print("Suma vectorizada (a + b):", a + b)
    print("Multiplicación vectorizada (a * b):", a * b)
    print("Comparación vectorizada (a < b):", a < b)
    print("Raíz cuadrada vectorizada de 'a':", np.sqrt(a))
    print("-" * 80)

# =============================================================================
# Broadcasting en NumPy
# =============================================================================
def ejemplo_broadcasting():
    """
    Ilustra el uso del broadcasting para realizar operaciones entre arrays de diferentes
    formas y tamaños.
    """
    matriz = np.array([[1, 2, 3],
                       [4, 5, 6],
                       [7, 8, 9]])
    vector = np.array([10, 20, 30])
    
    print("Matriz original:")
    print(matriz)
    print("Vector para broadcasting:", vector)
    print("Resultado del broadcasting (matriz + vector):")
    print(matriz + vector)
    print("Resultado del broadcasting (vector - matriz):")
    print(vector - matriz)
    print("Multiplicación de la matriz por un escalar (2):")
    print(matriz * 2)
    print("-" * 80)

# =============================================================================
# Ejemplos adicionales sobre vectorización y Broadcasting
# =============================================================================
def ejemplos_adicionales_vectorizacion():
    """
    Incluye ejemplos adicionales para profundizar en el uso de operaciones vectorizadas
    y broadcasting.
    """
    arr = np.arange(1, 11)
    print("Array original para operación condicional:", arr)
    print("Resultado de la operación condicional vectorizada:", np.where(arr % 2 == 0, arr * 2, arr + 3))
    
    matriz2 = np.array([[1], [2], [3]])
    vector2 = np.array([10, 20, 30, 40])
    
    print("Matriz2 (forma 3x1):")
    print(matriz2)
    print("Vector2 (forma 1x4):", vector2)
    print("Resultado del broadcasting (matriz2 + vector2):")
    print(matriz2 + vector2)
    print("-" * 80)

# =============================================================================
# Función principal para ejecutar todos los ejemplos de esta parte
# =============================================================================
def main():
    print("\n================================================================================")
    print("Operaciones vectorizadas y Broadcasting en NumPy")
    print("================================================================================\n")
    
    ejemplo_operaciones_vectorizadas()
    ejemplo_broadcasting()
    ejemplos_adicionales_vectorizacion()
    
# Ejecutar la función principal
task_output = main()


#### Funciones elementales en Numpy

Cada una de estas funciones tiene como  entrada una matriz de dimensión arbitraria  y devuelve una nueva matriz de la misma forma o orden, donde a  cada elemento de la matriz de entrada se le ha  aplicado la función.

- `np.cos, np.sin, np.tan`
- `np.arccos, np.arcsin. np.arctan`
- `np.log, np.log2, np.log10`
- `np.sqrt`
- `np.exp`

In [None]:
x = np.linspace(-1, 1, 10)
y = np.sin(np.pi * x)
np.round(y, decimals=4)

Más operaciones con funciones elementales proporcionadas por Numpy son:

- `np.add, np.subtract`
- `np.multiply, np.divide`
- `np.power`
- `np.floor, np.ceil, np.rint`
- `np.real, np.imag, np.conj`
- `np.round`

In [None]:
z = np.arange(10)
z
np.log(z)


In [None]:
np.power(z, 2) 
np.exp(z+1)

In [None]:
# Otros ejemplos

x = np.linspace(-1, 1, 11)
np.add(np.sin(x) ** 2, np.cos(x) ** 2)

In [None]:
def h(x):
    return 1 if x >0 else 0

h(-1)

In [None]:
h(1)

In [None]:
# Esta funciones no funciona para matrices de Numpy

x = np.linspace(-5, 5, 11)
h(x)

Usamos la función `np.vectorize` que trabaja con matrices, para vectorizar una función  que trabaje con Numpy:

In [None]:
fh = np.vectorize(h)
fh(x)

Otros tipos de funciones soportadas por Numpy, que retorna un escalar como salida son:

- `np.mean`
- `np.std`
- `np.var`
- `np.sum`
- `np.prod`
- `np.cumsum`
- `np.cumprod`
- `np.min, np.max`
- `np.argmin, np.argmax`
- `np.all, np.any`
    
    

Una de las principales aplicaciones de numpy es la representación de  los conceptos matemáticos de vectores, matrices y tensores, de uso frecuente en el cálculo de operaciones vectoriales y matriciales tales como el producto interno, matricial y el tensorial. Algunas de las funciones que realizan estas operaciones son:

- np.dot
- np.inner
- np.cross
- np.tensordot
- np.outer
- np.kron

In [None]:
import numpy as np

# =============================================================================
# Operaciones matemáticas básicas con ufuncs
# =============================================================================
def ejemplo_ufuncs_basicas():
    """
    Demuestra el uso de ufuncs para realizar operaciones matemáticas básicas
    de forma elementwise en arrays.
    """
    arr = np.array([1, 2, 3, 4, 5])
    print("Array original:", arr)
    print("np.add(arr, 10):", np.add(arr, 10))
    print("np.subtract(arr, 1):", np.subtract(arr, 1))
    print("np.multiply(arr, 3):", np.multiply(arr, 3))
    print("np.divide(arr, 2):", np.divide(arr, 2))
    print("-" * 80)

# =============================================================================
# Funciones trigonométricas y exponenciales
# =============================================================================
def ejemplo_ufuncs_trigonometria():
    """
    Muestra cómo utilizar funciones trigonométricas y exponenciales sobre arrays.
    """
    angulos = np.array([0, np.pi/4, np.pi/2, np.pi])
    print("Array de ángulos (radianes):", angulos)
    print("np.sin(angulos):", np.sin(angulos))
    print("np.cos(angulos):", np.cos(angulos))
    arr = np.array([0, 1, 2, 3])
    print("np.exp(arr):", np.exp(arr))
    print("-" * 80)

# =============================================================================
# Funciones estadísticas con ufuncs
# =============================================================================
def ejemplo_ufuncs_estadisticas():
    """
    Ilustra el uso de funciones estadísticas elementwise en arrays.
    """
    datos = np.array([2, 4, 6, 8, 10])
    print("Array de datos:", datos)
    print("Media del array:", np.mean(datos))
    print("np.log(datos):", np.log(datos))
    print("np.sqrt(datos):", np.sqrt(datos))
    print("-" * 80)

# =============================================================================
# Operaciones de álgebra lineal con NumPy
# =============================================================================
def ejemplo_algebra_lineal():
    """
    Demuestra operaciones matemáticas avanzadas en álgebra lineal.
    """
    A = np.array([[1, 2], [3, 4]])
    B = np.array([[5, 6], [7, 8]])
    v = np.array([1, 2])
    print("Matrices A y B:")
    print(A)
    print(B)
    print("Vector v:", v)
    print("np.dot(A, B):", np.dot(A, B))
    print("np.inner(A, B):", np.inner(A, B))
    print("np.cross(A, B):", np.cross(A, B))
    print("np.tensordot(A, B):", np.tensordot(A, B))
    print("np.outer(v, v):", np.outer(v, v))
    print("np.kron(A, B):", np.kron(A, B))
    print("-" * 80)

# =============================================================================
# Función principal para ejecutar todos los ejemplos
# =============================================================================
def main():
    print("\n================================================================================")
    print("Funciones Universales (ufuncs) en NumPy")
    print("================================================================================\n")
    
    ejemplo_ufuncs_basicas()
    ejemplo_ufuncs_trigonometria()
    ejemplo_ufuncs_estadisticas()
    ejemplo_algebra_lineal()
    
# Ejecutar la función principal
task_output = main()


##### Numpy.random

In [None]:
# Numeros entre 0 y 1, desde una distribucion uniforme en [0,1>

np.random.rand(3,2)  

In [None]:
# Retorna elementos aleatorios entre [0, 1>

e = np.random.random((100,100,100)) * np.arange(100)
figure()
subplot(1,3,1)
imshow(e[:,:,0], vmax=100)
subplot(1,3,2)
imshow(e[:,:,50], vmax=100)
subplot(1,3,3)
imshow(e[:,:,99], vmax=100)

index = np.zeros((100,100), dtype=bool)
index[50:65,50:60] = True
print (e[index,:].shape)


figure()
imshow(index)
figure()
plot(e[index,:].mean(axis=0))


Considerar una función que simula a  `N` caminantes al azar cada uno tomando  M pasos y que calcula la distancia más alejada del punto de partida obtenido por cualquiera de los caminantes aleatorios:

In [None]:
import numpy as np

def caminante_aleatorio_max_distancia(M,N):
    
    """
    Simula N caminantes, tomando n pasos y que devuelve la
    distancia mas alejada tomada desde el punto de partida
    de un caminante aleatorio
    """
    
    # random.randn devuelve numeros desde una distribucion normal
    camino = [np.random.randn(M).cumsum() for _ in range(N)]
    return np.max(np.abs(camino))

In [None]:
%prun caminante_aleatorio_max_distancia(400, 10000)

 Dibujemos un histograma de 10.000 números aleatorios producidos por cada función:

In [None]:
fig, axes = plt.subplots(1, 3, figsize=(12, 3))
axes[0].hist(np.random.rand(10000))
axes[0].set_title("rand")
axes[1].hist(np.random.randn(10000))
axes[1].set_title("randn")
axes[2].hist(np.random.randint(low=1, high=10, size=10000), bins=9, align='left')
axes[2].set_title("randint(bajo=1, alto=10)")

`np.random.choice` genera una muestra desde una matriz de una dimensión.

In [None]:
np.random.choice(7, 4)

In [None]:
# Generamos una muestra sin reemplazamiento

np.random.choice(5, 3, replace=False)

Cuando se trabaja con generación de números aleatorios, puede ser útil el `seed` del generador de números aleatorios.
`seed` es un número que inicializa el generador de números aleatorios para un estado específico, de manera que una vez que ha sido usado  con un número específico siempre genera la misma secuencia de números aleatorios.

In [None]:
np.random.seed(12345)
np.random.rand()

In [None]:
# Otra vez aparece el mismo valor

np.random.seed(12345); np.random.rand()

Un mayor nivel de el control del estado del generador de números aleatorios se puede lograr mediante el uso de la clase `RandomState`. El objeto `RandomState` hace un seguimiento del estado del generador de números aleatorios, y permite mantener varios generadores de números aleatorios independientes en el mismo programa  Una vez que el objeto `RandomState` ha sido creado, podemos utilizar métodos de este objeto para generar números aleatorios. 

La clase `RandomState` tiene métodos que corresponden a las funciones que están disponibles en el módulo `np.random`,  por
ejemplo, podemos utilizar el método  `randn` de la clase  `RandomState` para generar números aleatorios distribuidos por la normal estándar:

In [None]:
prng = np.random.RandomState(12345)
prng.rand(2, 4)

#### Manipulación de dimensiones

In [None]:
import numpy as np
import pandas as pd

# =============================================================================
# Reshaping de arrays
# =============================================================================
def ejemplo_reshaping():
    """
    Demuestra cómo cambiar la forma de un array utilizando reshape y otras técnicas.
    """
    arr = np.arange(12)
    print("Array original 1D:", arr)
    print("Array reestructurado a 3x4:")
    print(arr.reshape((3, 4)))
    print("Array reestructurado a 4x3 (con -1):")
    print(arr.reshape((4, -1)))
    print("Array convertido en vector columna:")
    print(arr[:, np.newaxis])
    print("Array aplanado (flatten):", arr.reshape((3, 4)).flatten())
    print("-" * 80)

# =============================================================================
# Transposición y reordenamiento de ejes
# =============================================================================
def ejemplo_transposicion():
    """
    Ilustra cómo transponer arrays y reordenar sus ejes para cambiar la orientación.
    """
    arr_2d = np.array([[1, 2, 3], [4, 5, 6]])
    print("Array 2D original:")
    print(arr_2d)
    print("Array transpuesto:")
    print(arr_2d.T)
    arr_3d = np.arange(24).reshape((2, 3, 4))
    print("Array 3D con ejes reordenados a (3, 4, 2):")
    print(np.transpose(arr_3d, (1, 2, 0)))
    print("Array 3D con ejes 0 y 2 intercambiados (swapaxes):")
    print(np.swapaxes(arr_3d, 0, 2))
    print("-" * 80)

# =============================================================================
# Concatenación de arrays
# =============================================================================
def ejemplo_concatenacion():
    """
    Muestra cómo concatenar arrays a lo largo de diferentes ejes.
    """
    arr1 = np.array([[1, 2], [3, 4]])
    arr2 = np.array([[5, 6], [7, 8]])
    print("Concatenación a lo largo de filas (axis=0):")
    print(np.concatenate((arr1, arr2), axis=0))
    print("Concatenación a lo largo de columnas (axis=1):")
    print(np.concatenate((arr1, arr2), axis=1))
    print("-" * 80)

# =============================================================================
# División de arrays
# =============================================================================
def ejemplo_division():
    """
    Demuestra cómo dividir un array en varios subarrays utilizando split.
    """
    arr = np.arange(12)
    print("Array dividido en 3 partes iguales:")
    for subarr in np.split(arr, 3):
        print(subarr)
    print("-" * 80)

# =============================================================================
# Integración con pandas para manipulación avanzada
# =============================================================================
def ejemplo_integracion_pandas():
    """
    Muestra ejemplos de cómo convertir arrays manipulados en DataFrames de pandas.
    """
    arr = np.arange(20).reshape((4, 5))
    df = pd.DataFrame(arr, columns=[f"Col_{i+1}" for i in range(arr.shape[1])])
    print("DataFrame creado a partir de un array 2D:")
    print(df)
    print("-" * 80)

# =============================================================================
# Ejemplos adicionales
# =============================================================================
def ejemplos_adicionales_manipulacion_dimensiones():
    """
    Incluye ejemplos avanzados, documentación extensa y simulaciones para alcanzar
    la extensión requerida.
    """
    arr_3d = np.arange(3*4*5).reshape((3, 4, 5))
    print("Bloque extraído del array 3D:")
    print(arr_3d[0:2, 0:3, 0:3])
    
    a = np.arange(12).reshape((3, 4))
    b = np.arange(12, 24).reshape((3, 4))
    concatenado = np.stack((a, b), axis=0)
    print("Arrays concatenados con np.stack para formar un array 3D:")
    print(concatenado)
    
    print("-" * 80)

# =============================================================================
# Función principal para ejecutar todos los ejemplos
# =============================================================================
def main():
    print("\n================================================================================")
    print("Manipulación de Dimensiones en NumPy (Parte Avanzada)")
    print("================================================================================\n")
    
    ejemplo_reshaping()
    ejemplo_transposicion()
    ejemplo_concatenacion()
    ejemplo_division()
    ejemplo_integracion_pandas()
    ejemplos_adicionales_manipulacion_dimensiones()

# Ejecutar la función principal
task_output = main()


#### Ejercicios


##### 1. Creación y manipulación de arrays

**Objetivo:**  
Crear arrays utilizando listas de Python y funciones de NumPy (`np.arange`, `np.linspace`) y comparar operaciones elementwise en arrays y listas.

**Descripción del ejercicio:**  
- **Paso 1:** Crear un array a partir de una lista de Python. Por ejemplo, usar una lista de números enteros.
- **Paso 2:** Crear arrays utilizando `np.arange` (para generar secuencias con un paso definido) y `np.linspace` (para obtener una cantidad fija de puntos equidistantes entre dos valores).
- **Paso 3:** Realizar operaciones aritméticas elementwise (suma, multiplicación, etc.) entre los arrays creados.
- **Paso 4:** Intentar realizar la misma operación con listas de Python y observar la diferencia en sintaxis y rendimiento (por ejemplo, usando list comprehensions vs. operaciones vectorizadas).

**Código de ejemplo:**

```python
import numpy as np
import time

# Creación a partir de lista de Python
lista = [1, 2, 3, 4, 5]
array_lista = np.array(lista)

# Uso de np.arange y np.linspace
array_arange = np.arange(0, 10, 2)  # [0, 2, 4, 6, 8]
array_linspace = np.linspace(0, 1, 5)  # 5 números equidistantes entre 0 y 1

# Operación elementwise: suma
suma_arrays = array_lista + np.array([10, 10, 10, 10, 10])

# Comparación con listas de Python (uso de list comprehension)
inicio = time.time()
resultado_lista = [x + 10 for x in lista]
fin = time.time()

print("Array resultante:", suma_arrays)
print("Resultado lista:", resultado_lista)
print("Tiempo de ejecución (lista):", fin - inicio)
```

**Puntos a destacar:**
- **Sintaxis:** Las operaciones vectorizadas en NumPy son más directas y legibles.
- **Rendimiento:** Las operaciones elementwise en arrays son más rápidas y eficientes que iterar manualmente sobre listas.


#### 2. Indexación y slicing avanzado

**Objetivo:**  
Manipular arrays multidimensionales utilizando indexación avanzada y slicing para extraer subarrays específicos.

**Descripción del ejercicio:**  
- **Paso 1:** Crear un array 3D (por ejemplo, una matriz de dimensiones 3x4x5) con datos secuenciales o aleatorios.
- **Paso 2:** Utilizar indexación simple para extraer una "capa" (por ejemplo, todos los datos del índice 1 en la primera dimensión).
- **Paso 3:** Aplicar slicing avanzado, combinando índices enteros y slices con pasos definidos para extraer, por ejemplo, las columnas impares de cada fila de una capa específica.
- **Paso 4:** Discutir cómo la indexación devuelve vistas vs. copias y las implicaciones en la manipulación de datos.

**Código de ejemplo:**

```python
# Creación de un array 3D
array_3d = np.arange(60).reshape(3, 4, 5)

# Extracción de la segunda "capa" (índice 1 de la primera dimensión)
capa = array_3d[1, :, :]

# Slicing: seleccionar filas 1 a 3 y columnas impares (empezando en 0, columnas 1 y 3)
subarray = capa[1:4, 1:5:2]

print("Array original 3D:\n", array_3d)
print("Capa extraída:\n", capa)
print("Subarray con slicing avanzado:\n", subarray)
```

**Aspectos a discutir:**
- La diferencia entre vistas y copias: modificar una vista puede afectar al array original.
- La sintaxis compacta y poderosa de NumPy para acceder a datos multidimensionales.


#### 3. Máscaras booleanas para filtrado

**Objetivo:**  
Generar un array de datos aleatorios, aplicar condiciones lógicas para crear una máscara booleana y calcular estadísticas básicas sobre los elementos filtrados.

**Descripción del ejercicio:**  
- **Paso 1:** Crear un array 1D o 2D de datos aleatorios (por ejemplo, números flotantes entre 0 y 100).
- **Paso 2:** Definir una condición (por ejemplo, valores mayores a 50) y generar una máscara booleana.
- **Paso 3:** Usar la máscara para filtrar el array y obtener solo los elementos que cumplan la condición.
- **Paso 4:** Calcular la media y la mediana del subconjunto filtrado usando funciones de NumPy.

**Código de ejemplo:**

```python
# Array aleatorio de números flotantes
datos = np.random.uniform(0, 100, size=100)

# Crear máscara booleana: seleccionar valores mayores a 50
mascara = datos > 50
datos_filtrados = datos[mascara]

# Calcular estadísticas
media_filtrada = np.mean(datos_filtrados)
mediana_filtrada = np.median(datos_filtrados)

print("Datos filtrados (valores > 50):\n", datos_filtrados)
print("Media de datos filtrados:", media_filtrada)
print("Mediana de datos filtrados:", mediana_filtrada)
```

**Puntos clave:**
- Las máscaras booleanas permiten un filtrado muy conciso y expresivo.
- Uso de funciones estadísticas de NumPy para análisis rápido sin bucles explícitos.

##### 4. Operaciones vectorizadas y broadcasting

**Objetivo:**  
Realizar operaciones aritméticas entre arrays de distintas formas utilizando el broadcasting para evitar bucles.

**Descripción del ejercicio:**  
- **Paso 1:** Crear dos arrays con formas compatibles para broadcasting, por ejemplo, uno 1D y otro 2D.
- **Paso 2:** Aplicar operaciones como suma, multiplicación o comparación.  
- **Paso 3:** Analizar cómo NumPy expande el array de menor dimensión para realizar operaciones con el otro array.

**Código de ejemplo:**

```python
# Crear un array 2D y un array 1D
array_2d = np.array([[1, 2, 3], [4, 5, 6]])
vector = np.array([10, 20, 30])

# Operación de suma utilizando broadcasting
resultado = array_2d + vector

print("Array 2D:\n", array_2d)
print("Vector:\n", vector)
print("Resultado de la suma con broadcasting:\n", resultado)
```

**Conceptos a resaltar:**
- El broadcasting permite realizar operaciones entre arrays de diferentes formas sin necesidad de replicar datos.
- La eficiencia y claridad del código aumentan al evitar bucles explícitos.


##### 5. Funciones universales (ufuncs) en acción

**Objetivo:**  
Aplicar diversas ufuncs de NumPy (`np.sin`, `np.exp`, `np.log`) sobre un array y comparar su eficiencia con iteraciones tradicionales.

**Descripción del ejercicio:**  
- **Paso 1:** Crear un array de valores (por ejemplo, un rango de ángulos en radianes).
- **Paso 2:** Aplicar ufuncs como `np.sin`, `np.exp` y `np.log` sobre el array.
- **Paso 3:** Comparar los tiempos de ejecución y la claridad del código respecto a realizar el mismo proceso con bucles for.
- **Paso 4:** Interpretar los resultados y discutir cuándo es preferible utilizar ufuncs.

**Código de ejemplo:**

```python
import math

# Array de ángulos
angulos = np.linspace(0, 2 * np.pi, 1000)

# Aplicar ufuncs
seno = np.sin(angulos)
exponencial = np.exp(angulos)
logaritmo = np.log(angulos + 1)  # Se suma 1 para evitar log(0)

# Comparación con bucles tradicionales
resultado_manual = [math.sin(a) for a in angulos]

print("Resultados usando np.sin:", seno[:5])
print("Resultados manuales:", resultado_manual[:5])
```

**Puntos importantes:**
- Las ufuncs son altamente optimizadas y se ejecutan en C, ofreciendo mejor rendimiento.
- El código resulta más limpio y fácil de mantener.


##### 6. Manipulación de dimensiones

**Objetivo:**  
Transformar un array de tres dimensiones mediante operaciones de reshaping, transposición y concatenación para reestructurar los datos.

**Descripción del ejercicio:**  
- **Paso 1:** Crear un array 3D, por ejemplo, de forma (3, 4, 5).
- **Paso 2:** Aplicar `reshape` para modificar su forma sin cambiar los datos (por ejemplo, a (6, 10)).
- **Paso 3:** Utilizar `transpose` para intercambiar ejes.
- **Paso 4:** Concatenar arrays resultantes para formar una estructura de datos consolidada.

**Código de ejemplo:**

```python
# Array 3D original
array_3d = np.arange(60).reshape(3, 4, 5)

# Reshape a 2D (6, 10)
array_reshaped = array_3d.reshape(6, 10)

# Transponer el array reshaped
array_transpuesto = array_reshaped.transpose()

# Concatenar: por ejemplo, duplicar el array original a lo largo de un eje
array_concatenado = np.concatenate((array_3d, array_3d), axis=0)

print("Array original 3D:\n", array_3d)
print("Reshape a 2D (6,10):\n", array_reshaped)
print("Transpuesto:\n", array_transpuesto)
print("Concatenado a lo largo del eje 0:\n", array_concatenado.shape)
```

**Aspectos a explicar:**
- Cómo cada transformación (reshape, transposición, concatenación) permite preparar los datos para análisis posteriores.
- La importancia de entender la estructura de datos para evitar errores en la manipulación.

##### 7. Álgebra lineal: multiplicación y determinantes

**Objetivo:**  
Crear matrices compatibles, realizar la multiplicación matricial y calcular determinantes e inversas para comprender su relevancia en análisis de datos.

**Descripción del ejercicio:**  
- **Paso 1:** Crear dos matrices usando `np.array` o funciones como `np.eye` o `np.random.rand` para generar matrices de dimensiones compatibles.
- **Paso 2:** Realizar la multiplicación matricial utilizando `np.dot` o el operador `@`.
- **Paso 3:** Calcular el determinante de una de las matrices con `np.linalg.det`.
- **Paso 4:** Si la matriz es invertible, calcular su inversa con `np.linalg.inv` y verificar la propiedad \( A \times A^{-1} = I \).

**Código de ejemplo:**

```python
# Crear dos matrices (por ejemplo, 3x3)
A = np.array([[2, 1, 3],
              [1, 0, 2],
              [4, 1, 8]])
B = np.random.rand(3, 3)

# Multiplicación matricial
producto = A @ B

# Cálculo del determinante de A
det_A = np.linalg.det(A)

# Cálculo de la inversa de A (si es invertible)
if det_A != 0:
    inv_A = np.linalg.inv(A)
    # Verificar que A * inv_A es la matriz identidad
    identidad = A @ inv_A
    print("A * A^-1:\n", identidad)
else:
    print("La matriz A no es invertible.")

print("Producto A @ B:\n", producto)
print("Determinante de A:", det_A)
```

**Conceptos clave:**
- La multiplicación de matrices es fundamental para transformaciones lineales.
- Determinantes e inversas son esenciales en la solución de sistemas de ecuaciones y en la comprensión de la estabilidad de modelos.


##### 8. Integración de indexación y broadcasting

**Objetivo:**  
Combinar indexación avanzada, manipulación de dimensiones y operaciones vectorizadas para simular un dataset, filtrar datos y normalizarlos mediante broadcasting.

**Descripción del ejercicio:**  
- **Paso 1:** Simular un dataset como un array 2D, donde cada fila representa una muestra y cada columna una característica.
- **Paso 2:** Utilizar máscaras booleanas para filtrar filas que cumplan ciertos criterios (por ejemplo, valores superiores a un umbral en una columna específica).
- **Paso 3:** Normalizar (por ejemplo, escalar a un rango de 0 a 1) los datos filtrados utilizando operaciones de broadcasting.
- **Paso 4:** Documentar cómo se integran las técnicas vistas anteriormente en un flujo de trabajo real de preprocesamiento de datos.

**Código de ejemplo:**

```python
# Simulación de un dataset: 100 muestras y 5 características
dataset = np.random.rand(100, 5) * 100

# Filtrar las muestras donde la primera característica es mayor a 50
mascara = dataset[:, 0] > 50
dataset_filtrado = dataset[mascara]

# Normalización: escala cada característica del subconjunto filtrado a [0, 1]
minimos = dataset_filtrado.min(axis=0)
maximos = dataset_filtrado.max(axis=0)
dataset_normalizado = (dataset_filtrado - minimos) / (maximos - minimos)

print("Dataset original:\n", dataset[:5])
print("Dataset filtrado:\n", dataset_filtrado[:5])
print("Dataset normalizado:\n", dataset_normalizado[:5])
```

**Puntos a discutir:**
- La integración de diferentes técnicas permite construir pipelines de procesamiento de datos robustos.
- Cómo el broadcasting facilita operaciones en arrays sin necesidad de iteraciones explícitas.


##### 9. Estadísticas avanzadas con ufuncs y operaciones vectorizadas

**Objetivo:**  
Calcular parámetros estadísticos (desviación estándar, varianza, etc.) de un conjunto de datos multidimensional empleando ufuncs y operaciones vectorizadas.

**Descripción del ejercicio:**  
- **Paso 1:** Generar un array multidimensional que simule un conjunto de datos, por ejemplo, 50 muestras con 10 características.
- **Paso 2:** Calcular la media, mediana, desviación estándar y varianza tanto globalmente como por cada columna.
- **Paso 3:** Utilizar funciones de NumPy para obtener estos valores sin bucles.
- **Paso 4:** Comparar los resultados y comentar sobre la eficiencia de las operaciones vectorizadas.

**Código de ejemplo:**

```python
# Dataset: 50 muestras y 10 características
datos = np.random.rand(50, 10) * 100

# Estadísticas globales
media_global = np.mean(datos)
mediana_global = np.median(datos)
std_global = np.std(datos)
varianza_global = np.var(datos)

# Estadísticas por columna (característica)
media_columnas = np.mean(datos, axis=0)
std_columnas = np.std(datos, axis=0)

print("Media global:", media_global)
print("Mediana global:", mediana_global)
print("Desviación estándar global:", std_global)
print("Varianza global:", varianza_global)
print("Media por columna:", media_columnas)
print("Desviación estándar por columna:", std_columnas)
```

**Aspectos a resaltar:**
- Uso de ufuncs y operaciones vectorizadas permite obtener estadísticas de manera rápida y con código conciso.
- Importancia de especificar el eje (`axis`) adecuado para análisis a nivel de características o muestras.



##### 10. Análisis de regresión lineal con álgebra lineal

**Objetivo:**  
Resolver una regresión lineal simple utilizando operaciones matriciales, lo que implica formar la matriz de diseño, calcular la inversa y resolver el sistema de ecuaciones.

**Descripción del ejercicio:**  
- **Paso 1:** Simular un conjunto de datos para regresión lineal, donde se tienen variables independientes \(X\) y dependientes \(y\). Por ejemplo, 100 puntos con una relación lineal \( y = mx + b + \epsilon \) (con algo de ruido).
- **Paso 2:** Formar la matriz de diseño \(X_{\text{design}}\) añadiendo una columna de 1's para el término independiente (intercepto).
- **Paso 3:** Resolver la ecuación normal \( \beta = (X^T X)^{-1} X^T y \) para obtener los parámetros de la regresión.
- **Paso 4:** Interpretar los coeficientes obtenidos y comentar sobre la importancia del enfoque algebraico para problemas de ajuste de modelos.

**Código de ejemplo:**

```python
# Simulación de datos
np.random.seed(0)
n = 100
X = np.linspace(0, 10, n)
m_real = 2.5
b_real = 5
ruido = np.random.normal(0, 1, n)
y = m_real * X + b_real + ruido

# Formar la matriz de diseño
X_design = np.column_stack((np.ones(n), X))

# Cálculo de parámetros usando la fórmula de la regresión lineal
beta = np.linalg.inv(X_design.T @ X_design) @ (X_design.T @ y)

print("Coeficientes estimados (intercepto, pendiente):", beta)
```

**Puntos clave a discutir:**
- El método de mínimos cuadrados resuelto mediante álgebra lineal es la base para muchos algoritmos en machine learning.
- La importancia de la matriz de diseño y la interpretación de los coeficientes en términos de la relación lineal entre las variables.


In [None]:
### Tus respuestas