NumPy est치 pensado para eficiencia y velocidad. Aprovecha implementaciones en C y Fortran para operar con arrays multidimensionales de manera 칩ptima. Veamos c칩mo sacarle el m치ximo provecho.

11.1 Ventajas de los arrays sobre listas en eficiencia
Las listas de Python son flexibles, pero no est치n optimizadas para c치lculos matem치ticos masivos.

a) Ejemplo con listas

In [2]:
# Sumar 2 a cada elemento de una lista
lista = [i for i in range(1_000_000)]
nueva_lista = [x + 2 for x in lista]

游녤 Python itera elemento por elemento: lento con millones de datos.

b) Ejemplo con arrays

In [3]:
import numpy as np

arr = np.arange(1_000_000)
nuevo_arr = arr + 2

游녤 Con NumPy no usamos bucles expl칤citos, la operaci칩n se ejecuta en c칩digo compilado y los arrays homog칠neos usan menos memoria. Resultado: decenas o cientos de veces m치s r치pido.

11.2 Vectorizaci칩n y evitar bucles
La vectorizaci칩n aplica operaciones sobre arrays completos, reemplazando bucles en Python.

a) Con bucle (ineficiente)

In [4]:
valores = [1, 2, 3, 4, 5]
cuadrados = []
for v in valores:
    cuadrados.append(v ** 2)
print(cuadrados)  # [1, 4, 9, 16, 25]

[1, 4, 9, 16, 25]


b) Vectorizado con NumPy (eficiente)

In [5]:
arr = np.array([1, 2, 3, 4, 5])
print(arr ** 2)  # [ 1  4  9 16 25]

[ 1  4  9 16 25]


游녤 El array entero se eleva al cuadrado en una sola operaci칩n.

c) Ejemplo: normalizar datos

In [6]:
# Lista en Python
lista = [10, 20, 30, 40, 50]
media = sum(lista) / len(lista)
desvio = (sum((x - media) ** 2 for x in lista) / len(lista)) ** 0.5
normalizada = [(x - media) / desvio for x in lista]
print(normalizada)

[-1.414213562373095, -0.7071067811865475, 0.0, 0.7071067811865475, 1.414213562373095]


Con NumPy:

In [7]:
arr = np.array([10, 20, 30, 40, 50])
normalizada = (arr - arr.mean()) / arr.std()
print(normalizada)

[-1.41421356 -0.70710678  0.          0.70710678  1.41421356]


游녤 M치s simple, legible y r치pido.

11.3 Uso de funciones universales (ufuncs)
Las ufuncs son funciones optimizadas que operan elemento a elemento: np.add, np.multiply, np.sqrt, np.exp, np.log, np.sin, np.cos, entre otras.

a) Ejemplo con suma y multiplicaci칩n

In [8]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(np.add(a, b))      # [5 7 9]
print(np.multiply(a, b)) # [ 4 10 18]

[5 7 9]
[ 4 10 18]


b) Funciones matem치ticas

In [9]:
arr = np.array([1, 2, 3, 4])

print("Ra칤z cuadrada:", np.sqrt(arr))  # [1.         1.41421356 1.73205081 2.        ]
print("Exponencial:", np.exp(arr))     # [ 2.71828183  7.3890561  20.08553692 54.59815003]
print("Logaritmo:", np.log(arr))       # [0.         0.69314718 1.09861229 1.38629436]

Ra칤z cuadrada: [1.         1.41421356 1.73205081 2.        ]
Exponencial: [ 2.71828183  7.3890561  20.08553692 54.59815003]
Logaritmo: [0.         0.69314718 1.09861229 1.38629436]


c) Ventaja frente a funciones est치ndar

In [10]:
import math

# Con math (lento, bucle expl칤cito)
lista = [1, 2, 3, 4]
raices = [math.sqrt(x) for x in lista]

# Con NumPy (r치pido, vectorizado)
arr = np.array([1, 2, 3, 4])
raices_np = np.sqrt(arr)

游녤 La versi칩n con NumPy es mucho m치s veloz y clara.

Resumen
- Los arrays de NumPy son m치s r치pidos y eficientes que las listas de Python.
- La vectorizaci칩n reemplaza bucles con operaciones directas sobre arrays.
- Las ufuncs operan elemento a elemento con alto rendimiento.
Nota: Dominar estas pr치cticas es clave para manejar grandes vol칰menes de datos en ciencia de datos y machine learning.