NUMPY

## 1. Importacion y Configuracion Basica

In [None]:
import numpy as np

# Configuracion de precision de impresion
np.set_printoptions(precision=3, suppress=True)  # 3 decimales, sin notacion cientifica

# Ver version
print(np.__version__)

# Configurar semilla para reproducibilidad
np.random.seed(42)

## 2. Creacion de Arrays - Basico

In [None]:
# Desde listas
arr1d = np.array([1, 2, 3, 4, 5])              # 1D array
arr2d = np.array([[1, 2, 3], [4, 5, 6]])       # 2D array (matriz)
arr3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])  # 3D array

# Zeros y Ones
zeros = np.zeros(5)                            # [0, 0, 0, 0, 0]
zeros_2d = np.zeros((3, 4))                    # Matriz 3x4 de ceros
ones = np.ones(5)                              # [1, 1, 1, 1, 1]
ones_2d = np.ones((2, 3))                      # Matriz 2x3 de unos

# Full - Llenar con un valor especifico
full = np.full(5, 7)                           # [7, 7, 7, 7, 7]
full_2d = np.full((2, 3), 3.14)                # Matriz 2x3 llena de 3.14

# Empty - Array sin inicializar (valores aleatorios)
empty = np.empty(5)                            # Mas rapido que zeros
empty_2d = np.empty((2, 3))

# Identidad y Diagonal
identity = np.eye(3)                           # Matriz identidad 3x3
diagonal = np.diag([1, 2, 3, 4])               # Matriz diagonal

## 3. Creacion de Arrays - Rangos y Secuencias

In [None]:
# Arange - Similar a range() de Python
arr = np.arange(10)                            # [0, 1, 2, ..., 9]
arr = np.arange(5, 10)                         # [5, 6, 7, 8, 9]
arr = np.arange(0, 10, 2)                      # [0, 2, 4, 6, 8]
arr = np.arange(0, 1, 0.1)                     # [0, 0.1, 0.2, ..., 0.9]

# Linspace - N puntos uniformemente espaciados (TIPICO EXAMENES)
arr = np.linspace(0, 10, 5)                    # [0, 2.5, 5, 7.5, 10] - 5 puntos
arr = np.linspace(0, 1, 11)                    # 11 puntos entre 0 y 1
arr = np.linspace(0, 10, 100)                  # Para graficos suaves

# Logspace - Escala logaritmica
arr = np.logspace(0, 3, 4)                     # [10^0, 10^1, 10^2, 10^3]
arr = np.logspace(1, 5, 5)                     # [10, 100, 1000, 10000, 100000]

# Meshgrid - Para graficos 3D y superficies
x = np.linspace(0, 5, 3)                       # [0, 2.5, 5]
y = np.linspace(0, 2, 2)                       # [0, 2]
X, Y = np.meshgrid(x, y)                       # Grillas 2D
# X = [[0, 2.5, 5], [0, 2.5, 5]]
# Y = [[0, 0, 0], [2, 2, 2]]

## 4. Creacion de Arrays - Numeros Aleatorios (PATRON EXAMENES)

In [None]:
# Fijar semilla para reproducibilidad (IMPORTANTE)
np.random.seed(42)

# Random uniform [0, 1)
arr = np.random.random(5)                      # 5 numeros aleatorios
arr = np.random.rand(3, 4)                     # Matriz 3x4 de aleatorios

# Random integers
arr = np.random.randint(0, 10, 5)              # 5 enteros entre 0 y 9
arr = np.random.randint(1, 100, (3, 4))        # Matriz 3x4 de enteros

# Distribucion normal (Gaussiana) - TIPICO EXAMENES
arr = np.random.randn(100)                     # Media=0, std=1
arr = np.random.normal(50, 10, 100)            # Media=50, std=10, n=100
arr = np.random.normal(0, 1, (3, 4))           # Matriz 3x4 normal

# Otras distribuciones
arr = np.random.uniform(0, 10, 100)            # Uniforme entre 0 y 10
arr = np.random.exponential(2, 100)            # Exponencial
arr = np.random.poisson(5, 100)                # Poisson
arr = np.random.binomial(10, 0.5, 100)         # Binomial

# Muestreo
arr = np.random.choice([1, 2, 3, 4, 5], 10)    # 10 samples con reemplazo
arr = np.random.choice(100, 10, replace=False) # Sin reemplazo

# Permutaciones
arr = np.random.permutation(10)                # Shuffle de 0-9
arr = np.arange(10)
np.random.shuffle(arr)                         # Shuffle in-place

## 5. Propiedades de Arrays

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6]])

# Propiedades basicas (CLAVE EXAMENES)
arr.shape                                      # (2, 3) - forma/dimensiones
arr.ndim                                       # 2 - numero de dimensiones
arr.size                                       # 6 - total de elementos
arr.dtype                                      # int64 - tipo de datos
arr.itemsize                                   # 8 - bytes por elemento
arr.nbytes                                     # 48 - bytes totales

# Tipos de datos comunes
arr_int = np.array([1, 2, 3], dtype=np.int32)
arr_float = np.array([1, 2, 3], dtype=np.float64)
arr_bool = np.array([True, False, True], dtype=np.bool_)
arr_str = np.array(['a', 'b', 'c'], dtype=np.str_)

# Conversion de tipos (TIPICO EXAMENES)
arr_float = arr.astype(np.float64)
arr_int = arr.astype(np.int32)
arr_str = arr.astype(str)

## 6. Indexacion y Slicing 1D (BASICO)

In [None]:
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

# Indexacion basica
arr[0]                                         # 0 - primer elemento
arr[5]                                         # 5 - sexto elemento
arr[-1]                                        # 9 - ultimo elemento
arr[-2]                                        # 8 - penultimo elemento

# Slicing [inicio:fin:paso]
arr[2:5]                                       # [2, 3, 4]
arr[:5]                                        # [0, 1, 2, 3, 4] - primeros 5
arr[5:]                                        # [5, 6, 7, 8, 9] - desde 5 al final
arr[:]                                         # [0, 1, ..., 9] - todos
arr[::2]                                       # [0, 2, 4, 6, 8] - cada 2
arr[1::2]                                      # [1, 3, 5, 7, 9] - impares
arr[::-1]                                      # [9, 8, 7, ..., 0] - invertido

# Modificacion con indexacion
arr[0] = 10                                    # Cambiar primer elemento
arr[2:5] = [20, 30, 40]                        # Cambiar rango
arr[arr > 5] = 0                               # Poner ceros donde arr > 5

## 7. Indexacion y Slicing 2D (MATRICES - CLAVE EXAMENES)

In [None]:
arr = np.array([[1, 2, 3, 4],
                [5, 6, 7, 8],
                [9, 10, 11, 12]])

# Indexacion basica [fila, columna]
arr[0, 0]                                      # 1 - primera fila, primera columna
arr[1, 2]                                      # 7 - segunda fila, tercera columna
arr[-1, -1]                                    # 12 - ultima fila, ultima columna

# Filas completas
arr[0]                                         # [1, 2, 3, 4] - primera fila
arr[0, :]                                      # [1, 2, 3, 4] - primera fila (explicito)
arr[-1]                                        # [9, 10, 11, 12] - ultima fila

# Columnas completas
arr[:, 0]                                      # [1, 5, 9] - primera columna
arr[:, 2]                                      # [3, 7, 11] - tercera columna
arr[:, -1]                                     # [4, 8, 12] - ultima columna

# Slicing 2D (PATRON EXAMENES)
arr[0:2, 1:3]                                  # [[2, 3], [6, 7]] - submatriz
arr[:2, :2]                                    # [[1, 2], [5, 6]] - esquina sup izq
arr[1:, 2:]                                    # [[7, 8], [11, 12]] - esquina inf der

# Filas y columnas multiples
arr[[0, 2]]                                    # Filas 0 y 2
arr[:, [0, 2]]                                 # Columnas 0 y 2
arr[[0, 2], [1, 3]]                            # Elementos (0,1) y (2,3)

## 8. Indexacion Booleana (PATRON CLAVE EXAMENES)

In [None]:
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Mascara booleana
mask = arr > 5                                 # [False, False, ..., True, True, ...]
arr[mask]                                      # [6, 7, 8, 9, 10]

# Directo (sin variable intermedia)
arr[arr > 5]                                   # [6, 7, 8, 9, 10]
arr[arr < 5]                                   # [1, 2, 3, 4]
arr[arr == 5]                                  # [5]
arr[arr != 5]                                  # [1, 2, 3, 4, 6, 7, 8, 9, 10]

# Condiciones multiples (TIPICO EXAMENES)
arr[(arr > 3) & (arr < 8)]                     # [4, 5, 6, 7] - AND
arr[(arr < 3) | (arr > 8)]                     # [1, 2, 9, 10] - OR
arr[~(arr > 5)]                                # [1, 2, 3, 4, 5] - NOT

# Modificacion con booleanos
arr[arr > 5] = 0                               # Poner 0 donde arr > 5
arr[arr < 0] = 0                               # Clip negativo a 0
arr[(arr > 3) & (arr < 8)] = -1                # Multiples condiciones

# En matrices 2D
mat = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
mat[mat > 5]                                   # [6, 7, 8, 9] - array 1D
mat[mat > 5] = 0                               # Poner 0 donde > 5

## 9. Reshape y Transpose (IMPORTANTE)

In [None]:
# Reshape - Cambiar forma manteniendo datos
arr = np.arange(12)                            # [0, 1, 2, ..., 11]
arr_2d = arr.reshape(3, 4)                     # Matriz 3x4
arr_2d = arr.reshape(4, 3)                     # Matriz 4x3
arr_3d = arr.reshape(2, 2, 3)                  # Array 3D

# Reshape con -1 (inferir dimension) - TIPICO EXAMENES
arr_2d = arr.reshape(3, -1)                    # 3 filas, columnas automaticas
arr_2d = arr.reshape(-1, 4)                    # 4 columnas, filas automaticas
arr_1d = arr_2d.reshape(-1)                    # Aplanar a 1D

# Flatten y Ravel - Convertir a 1D
arr_flat = arr_2d.flatten()                    # Copia
arr_rav = arr_2d.ravel()                       # Vista (mas rapido)

# Transpose - Intercambiar filas por columnas
arr = np.array([[1, 2, 3], [4, 5, 6]])         # 2x3
arr_t = arr.T                                  # 3x2 transpuesta
arr_t = arr.transpose()                        # Alternativa

# Expandir dimensiones
arr = np.array([1, 2, 3])                      # (3,)
arr_col = arr[:, np.newaxis]                   # (3, 1) - vector columna
arr_row = arr[np.newaxis, :]                   # (1, 3) - vector fila
arr_col = np.expand_dims(arr, axis=1)          # Alternativa

## 10. Operaciones Aritmeticas (VECTORIZADAS)

In [None]:
arr = np.array([1, 2, 3, 4, 5])

# Operaciones con escalares (broadcasting)
arr + 10                                       # [11, 12, 13, 14, 15]
arr - 2                                        # [-1, 0, 1, 2, 3]
arr * 2                                        # [2, 4, 6, 8, 10]
arr / 2                                        # [0.5, 1, 1.5, 2, 2.5]
arr ** 2                                       # [1, 4, 9, 16, 25]
arr % 2                                        # [1, 0, 1, 0, 1]

# Operaciones entre arrays (element-wise)
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

arr1 + arr2                                    # [5, 7, 9]
arr1 * arr2                                    # [4, 10, 18]
arr1 / arr2                                    # [0.25, 0.4, 0.5]
arr1 ** arr2                                   # [1, 32, 729]

# Funciones matematicas universales (ufuncs)
np.sqrt(arr)                                   # Raiz cuadrada
np.exp(arr)                                    # Exponencial
np.log(arr)                                    # Logaritmo natural
np.log10(arr)                                  # Logaritmo base 10
np.sin(arr)                                    # Seno
np.cos(arr)                                    # Coseno
np.tan(arr)                                    # Tangente
np.abs(arr)                                    # Valor absoluto
np.round(arr, 2)                               # Redondear a 2 decimales
np.floor(arr)                                  # Redondear hacia abajo
np.ceil(arr)                                   # Redondear hacia arriba

## 11. Agregaciones y Estadisticas (CLAVE EXAMENES)

In [None]:
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Estadisticas basicas
arr.sum()                                      # 55 - suma
arr.mean()                                     # 5.5 - media
arr.std()                                      # 2.87 - desviacion estandar
arr.var()                                      # 8.25 - varianza
arr.min()                                      # 1 - minimo
arr.max()                                      # 10 - maximo
arr.argmin()                                   # 0 - indice del minimo
arr.argmax()                                   # 9 - indice del maximo

# Percentiles y cuantiles
np.median(arr)                                 # 5.5 - mediana
np.percentile(arr, 25)                         # 3.25 - percentil 25
np.percentile(arr, 75)                         # 7.75 - percentil 75
np.quantile(arr, 0.5)                          # 5.5 - cuantil 0.5 (mediana)

# En matrices 2D (PATRON EXAMENES)
mat = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

mat.sum()                                      # 45 - suma total
mat.sum(axis=0)                                # [12, 15, 18] - suma por columna
mat.sum(axis=1)                                # [6, 15, 24] - suma por fila

mat.mean()                                     # 5.0 - media total
mat.mean(axis=0)                               # [4, 5, 6] - media por columna
mat.mean(axis=1)                               # [2, 5, 8] - media por fila

mat.min(axis=0)                                # [1, 2, 3] - minimo por columna
mat.max(axis=1)                                # [3, 6, 9] - maximo por fila

# Otras operaciones utiles
arr.cumsum()                                   # [1, 3, 6, 10, ...] - suma acumulativa
arr.cumprod()                                  # [1, 2, 6, 24, ...] - producto acumulativo
arr.clip(3, 8)                                 # Limitar valores entre 3 y 8

## 12. Ordenamiento y Busqueda

In [None]:
arr = np.array([3, 1, 4, 1, 5, 9, 2, 6])

# Ordenar
np.sort(arr)                                   # [1, 1, 2, 3, 4, 5, 6, 9] - nueva copia
arr.sort()                                     # Ordenar in-place

# Indices de ordenamiento (PATRON EXAMENES)
indices = np.argsort(arr)                      # Indices que ordenarian el array
arr[indices]                                   # Array ordenado

# Ordenar en reversa
np.sort(arr)[::-1]                             # Orden descendente
arr[np.argsort(arr)[::-1]]                     # Con argsort

# Ordenar matrices 2D
mat = np.array([[3, 1, 4], [1, 5, 9], [2, 6, 5]])
np.sort(mat, axis=0)                           # Ordenar cada columna
np.sort(mat, axis=1)                           # Ordenar cada fila

# Busqueda
arr = np.array([1, 2, 3, 4, 5])
np.where(arr > 3)                              # (array([3, 4]),) - indices donde True
np.argwhere(arr > 3)                           # [[3], [4]] - indices en formato 2D

# Busqueda con condicion (TIPICO EXAMENES)
indices = np.where(arr > 3)[0]
valores = arr[indices]

# Unique - Valores unicos
arr = np.array([1, 2, 2, 3, 3, 3, 4])
np.unique(arr)                                 # [1, 2, 3, 4]
uniq, counts = np.unique(arr, return_counts=True)  # Valores y frecuencias

## 13. Concatenacion y Division de Arrays

In [None]:
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

# Concatenar 1D
np.concatenate([arr1, arr2])                   # [1, 2, 3, 4, 5, 6]
np.hstack([arr1, arr2])                        # Horizontal stack (igual)
np.vstack([arr1, arr2])                        # [[1, 2, 3], [4, 5, 6]]

# Concatenar 2D (PATRON EXAMENES)
mat1 = np.array([[1, 2], [3, 4]])
mat2 = np.array([[5, 6], [7, 8]])

np.concatenate([mat1, mat2], axis=0)           # Vertical (mas filas)
np.concatenate([mat1, mat2], axis=1)           # Horizontal (mas columnas)
np.vstack([mat1, mat2])                        # Vertical stack
np.hstack([mat1, mat2])                        # Horizontal stack

# Division de arrays
arr = np.arange(10)
np.split(arr, 2)                               # Dividir en 2 partes iguales
np.split(arr, [3, 7])                          # Dividir en indices 3 y 7

# Division 2D
mat = np.arange(16).reshape(4, 4)
np.vsplit(mat, 2)                              # Dividir vertical (filas)
np.hsplit(mat, 2)                              # Dividir horizontal (columnas)

# Apilar arrays
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
arr3 = np.array([7, 8, 9])
np.stack([arr1, arr2, arr3])                   # [[1,2,3], [4,5,6], [7,8,9]]
np.stack([arr1, arr2, arr3], axis=1)           # [[1,4,7], [2,5,8], [3,6,9]]

## 14. Broadcasting (CONCEPTO CLAVE)

In [None]:
# Broadcasting permite operaciones entre arrays de diferentes formas

# Escalar + Array
arr = np.array([1, 2, 3])
arr + 10                                       # [11, 12, 13]

# Array 1D + Array 2D (TIPICO EXAMENES)
mat = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
vec = np.array([10, 20, 30])

mat + vec                                      # Suma vec a cada fila
# [[11, 22, 33], [14, 25, 36], [17, 28, 39]]

# Para sumar a columnas, usar reshape
vec_col = np.array([10, 20, 30]).reshape(-1, 1)  # (3, 1)
mat + vec_col                                  # Suma a cada columna

# Ejemplos de broadcasting
a = np.array([[1, 2, 3]])                      # (1, 3)
b = np.array([[1], [2], [3]])                  # (3, 1)
a + b                                          # (3, 3) - todas las combinaciones

# Normalizacion por columnas (PATRON EXAMENES)
mat = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
media_col = mat.mean(axis=0)                   # [4, 5, 6]
std_col = mat.std(axis=0)                      # [2.45, 2.45, 2.45]
mat_norm = (mat - media_col) / std_col         # Normalizacion Z-score

# Normalizacion por filas
media_fila = mat.mean(axis=1, keepdims=True)   # (3, 1)
mat_norm = mat - media_fila

## 15. Algebra Lineal (MATRICES)

In [None]:
# Producto matricial (IMPORTANTE)
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

np.dot(A, B)                                   # Producto matricial
A @ B                                          # Operador @ (Python 3.5+)
A.dot(B)                                       # Metodo

# Producto elemento por elemento (NO es matricial)
A * B                                          # [[5, 12], [21, 32]]

# Transpuesta
A.T                                            # [[1, 3], [2, 4]]

# Inversa
np.linalg.inv(A)                               # Matriz inversa

# Determinante
np.linalg.det(A)                               # -2.0

# Rango
np.linalg.matrix_rank(A)                       # 2

# Traza (suma de diagonal)
np.trace(A)                                    # 5 (1+4)

# Autovalores y autovectores
eigenvalues, eigenvectors = np.linalg.eig(A)

# Resolver sistema de ecuaciones Ax = b
A = np.array([[3, 1], [1, 2]])
b = np.array([9, 8])
x = np.linalg.solve(A, b)                      # x = [2, 3]

# Normas
vec = np.array([3, 4])
np.linalg.norm(vec)                            # 5.0 - norma L2 (euclidiana)
np.linalg.norm(vec, ord=1)                     # 7.0 - norma L1
np.linalg.norm(vec, ord=np.inf)                # 4.0 - norma infinito

## 16. Operaciones Logicas y Comparaciones

In [None]:
arr = np.array([1, 2, 3, 4, 5])

# Comparaciones (retornan arrays booleanos)
arr > 3                                        # [False, False, False, True, True]
arr <= 3                                       # [True, True, True, False, False]
arr == 3                                       # [False, False, True, False, False]
arr != 3                                       # [True, True, False, True, True]

# Operaciones logicas
a = np.array([True, True, False, False])
b = np.array([True, False, True, False])

np.logical_and(a, b)                           # [True, False, False, False]
np.logical_or(a, b)                            # [True, True, True, False]
np.logical_not(a)                              # [False, False, True, True]
np.logical_xor(a, b)                           # [False, True, True, False]

# Con operadores (&, |, ~) - REQUIEREN parentesis
(arr > 2) & (arr < 5)                          # [False, False, True, True, False]
(arr < 2) | (arr > 4)                          # [True, False, False, False, True]
~(arr > 3)                                     # [True, True, True, False, False]

# Funciones de prueba
np.any(arr > 3)                                # True - alguno cumple
np.all(arr > 0)                                # True - todos cumplen
np.all(arr > 3)                                # False - no todos cumplen

# Contar valores que cumplen condicion
np.sum(arr > 3)                                # 2 - cuantos son > 3
np.count_nonzero(arr > 3)                      # 2 - alternativa

# isnan, isinf, isfinite
arr = np.array([1, 2, np.nan, np.inf, 5])
np.isnan(arr)                                  # [False, False, True, False, False]
np.isinf(arr)                                  # [False, False, False, True, False]
np.isfinite(arr)                               # [True, True, False, False, True]

## 17. Manejo de NaN e Inf (PATRON EXAMENES)

In [None]:
# Crear arrays con NaN
arr = np.array([1, 2, np.nan, 4, 5])

# Detectar NaN
np.isnan(arr)                                  # [False, False, True, False, False]
np.sum(np.isnan(arr))                          # 1 - contar NaN

# Operaciones que ignoran NaN (CLAVE EXAMENES)
np.nansum(arr)                                 # 12.0 - suma ignorando NaN
np.nanmean(arr)                                # 3.0 - media ignorando NaN
np.nanstd(arr)                                 # 1.58 - std ignorando NaN
np.nanmin(arr)                                 # 1.0 - minimo ignorando NaN
np.nanmax(arr)                                 # 5.0 - maximo ignorando NaN
np.nanmedian(arr)                              # 3.0 - mediana ignorando NaN

# Remover NaN
arr_clean = arr[~np.isnan(arr)]                # [1, 2, 4, 5]

# Reemplazar NaN
arr_filled = np.nan_to_num(arr, nan=0)         # Reemplazar NaN por 0
arr[np.isnan(arr)] = 0                         # Reemplazar NaN in-place
arr[np.isnan(arr)] = np.nanmean(arr)           # Reemplazar por media

# Infinitos
arr = np.array([1, 2, np.inf, -np.inf, 5])
np.isinf(arr)                                  # [False, False, True, True, False]
np.isfinite(arr)                               # [True, True, False, False, True]
arr[np.isinf(arr)] = 0                         # Reemplazar inf por 0

# Reemplazar NaN e Inf juntos
arr = np.array([1, np.nan, np.inf, -np.inf, 5])
arr = np.nan_to_num(arr, nan=0, posinf=999, neginf=-999)

## 18. Guardar y Cargar Arrays

In [None]:
arr = np.array([1, 2, 3, 4, 5])

# Guardar en formato binario .npy (RECOMENDADO)
np.save('array.npy', arr)
arr_loaded = np.load('array.npy')

# Guardar multiples arrays en .npz
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
np.savez('arrays.npz', a=arr1, b=arr2)
data = np.load('arrays.npz')
arr1_loaded = data['a']
arr2_loaded = data['b']

# Guardar comprimido
np.savez_compressed('arrays_compressed.npz', a=arr1, b=arr2)

# Guardar como texto (CSV-like)
np.savetxt('array.txt', arr)
arr_loaded = np.loadtxt('array.txt')

# Guardar matriz en CSV
mat = np.array([[1, 2, 3], [4, 5, 6]])
np.savetxt('matriz.csv', mat, delimiter=',', fmt='%d')
mat_loaded = np.loadtxt('matriz.csv', delimiter=',')

# Guardar con header
np.savetxt('data.csv', mat, delimiter=',', header='col1,col2,col3', 
           comments='', fmt='%.2f')

## 19. Funciones Avanzadas y Utiles

In [None]:
# Where - Condicional ternario (PATRON EXAMENES)
arr = np.array([1, 2, 3, 4, 5])
np.where(arr > 3, arr, 0)                      # [0, 0, 0, 4, 5] - si > 3 mantener, sino 0
np.where(arr > 3, 'Alto', 'Bajo')              # ['Bajo', 'Bajo', 'Bajo', 'Alto', 'Alto']

# Apply along axis - Aplicar funcion a filas/columnas
mat = np.array([[1, 2, 3], [4, 5, 6]])
np.apply_along_axis(np.mean, axis=0, arr=mat)  # [2.5, 3.5, 4.5] - media por columna
np.apply_along_axis(np.sum, axis=1, arr=mat)   # [6, 15] - suma por fila

# Repeat y Tile
arr = np.array([1, 2, 3])
np.repeat(arr, 3)                              # [1, 1, 1, 2, 2, 2, 3, 3, 3]
np.tile(arr, 3)                                # [1, 2, 3, 1, 2, 3, 1, 2, 3]

# Diff - Diferencias consecutivas
arr = np.array([1, 3, 6, 10])
np.diff(arr)                                   # [2, 3, 4]
np.diff(arr, n=2)                              # [1, 1] - segunda diferencia

# Gradient - Gradiente numerico
arr = np.array([1, 4, 9, 16])
np.gradient(arr)                               # [3, 4, 5, 7]

# Bincount - Contar ocurrencias (solo enteros)
arr = np.array([0, 1, 1, 2, 2, 2, 3])
np.bincount(arr)                               # [1, 2, 3, 1]

# Digitize - Asignar a bins
arr = np.array([0.2, 1.5, 2.3, 3.8, 4.1])
bins = [0, 2, 4, 6]
np.digitize(arr, bins)                         # [1, 1, 2, 2, 3]

# Histogram
arr = np.random.randn(1000)
counts, edges = np.histogram(arr, bins=10)

## 20. Trucos y Patrones Comunes (EXAMENES)

In [None]:
# Normalizar array entre 0 y 1
arr = np.array([1, 2, 3, 4, 5])
arr_norm = (arr - arr.min()) / (arr.max() - arr.min())

# Estandarizar (Z-score normalization)
arr_std = (arr - arr.mean()) / arr.std()

# Crear matriz de distancias (PATRON EXAMENES)
puntos = np.array([[0, 0], [1, 1], [2, 2]])
from scipy.spatial.distance import cdist
# distancias = cdist(puntos, puntos, 'euclidean')

# O manualmente con broadcasting
diff = puntos[:, np.newaxis, :] - puntos[np.newaxis, :, :]
distancias = np.sqrt((diff ** 2).sum(axis=2))

# One-hot encoding
categorias = np.array([0, 1, 2, 1, 0])
n_categorias = categorias.max() + 1
one_hot = np.eye(n_categorias)[categorias]

# Moving average (media movil)
def moving_average(arr, window):
    return np.convolve(arr, np.ones(window)/window, mode='valid')

arr = np.array([1, 2, 3, 4, 5, 6, 7, 8])
ma = moving_average(arr, 3)                    # [2, 3, 4, 5, 6, 7]

# Eliminar outliers (valores extremos)
arr = np.array([1, 2, 3, 100, 4, 5, -50, 6])
Q1 = np.percentile(arr, 25)
Q3 = np.percentile(arr, 75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
arr_clean = arr[(arr >= lower_bound) & (arr <= upper_bound)]

# Interpolacion lineal de NaN
arr = np.array([1, 2, np.nan, 4, 5])
mask = np.isnan(arr)
arr[mask] = np.interp(np.flatnonzero(mask), 
                      np.flatnonzero(~mask), 
                      arr[~mask])

# Matriz de correlacion (sin pandas)
mat = np.random.rand(100, 5)  # 100 muestras, 5 variables
corr_matrix = np.corrcoef(mat.T)  # Correlacion entre variables

# Contar elementos unicos por fila/columna
mat = np.array([[1, 2, 1], [3, 3, 4], [5, 5, 5]])
unicos_por_fila = [len(np.unique(fila)) for fila in mat]

# Operaciones vectorizadas rapidas (evitar loops)
# MAL: usar loops
result = []
for x in arr:
    result.append(x ** 2)

# BIEN: usar vectorizacion
result = arr ** 2

print('Cheat sheet de NumPy completa!')