In [12]:
# Optimización y eficiencia
## Consejos para escribir código NumPy eficiente. Uso de operaciones in-place, evitar bucles cuando sea posible.

import numpy as np
import time

# Operaciones in-place
# Las operaciones in-place son aquellas que modifican directamente el contenido de un array, sin necesidad de crear un nuevo array.
# Esto puede ser más eficiente en términos de memoria y tiempo de ejecución.
# Por ejemplo, si queremos sumar 1 a todos los elementos de un array, podemos hacerlo de dos formas:


a = np.random.random(1000000)


In [13]:

# Forma 1: sin operación in-place
start = time.time()
a = a + 1
end = time.time()
print("Tiempo sin operación in-place:", end - start)


Tiempo sin operación in-place: 0.0069997310638427734


In [14]:
# Forma 2: con operación in-place
start = time.time()
a += 1
end = time.time()
print("Tiempo con operación in-place:", end - start)

# En este caso, la forma 2 es más eficiente en términos de tiempo de ejecución, ya que no necesita crear un nuevo array para almacenar el resultado de la operación.

Tiempo con operación in-place: 0.0030901432037353516


In [15]:
# Evitar bucles

# En general, es recomendable evitar bucles en Python cuando sea posible, ya que son menos eficientes que las operaciones vectorizadas de NumPy.
# Por ejemplo, si queremos calcular el cuadrado de todos los elementos de un array, podemos hacerlo de dos formas:

a = np.random.random(1000000)

In [16]:
# Forma 1: con bucle
start = time.time()
result = np.zeros_like(a)
for i in range(len(a)):
    result[i] = a[i] ** 2
end = time.time()
print("Tiempo con bucle:", end - start)

Tiempo con bucle: 0.3096749782562256


In [17]:
# Forma 2: sin bucle
start = time.time()
result = a ** 2
end = time.time()
print("Tiempo sin bucle:", end - start)

Tiempo sin bucle: 0.004007101058959961


In [24]:
# Perfiles y depuración 

## Herramientas para medir y mejorar el rendimiento del código NumPy.

# Perfiles de código

# Una forma de medir el rendimiento de un código NumPy es utilizando la función %timeit de IPython, que ejecuta una instrucción varias veces y calcula el tiempo promedio de ejecución.
# Por ejemplo, si queremos medir el tiempo de ejecución de la operación a = a + 1:

%timeit for _ in range(1000): True


12.4 µs ± 437 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [28]:
%%timeit

a = np.random.random(1000000)
a = a + 1


10.7 ms ± 893 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [29]:
%%timeit

a = np.random.random(1000000)
a += 1

8.36 ms ± 185 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [30]:
# Depuración

# Para depurar un código NumPy y encontrar posibles cuellos de botella, podemos utilizar herramientas como el módulo cProfile de Python, que nos permite analizar el tiempo de ejecución de cada función y línea de código.
# Por ejemplo, si queremos depurar el código anterior que calcula el cuadrado de todos los elementos de un array, podemos hacerlo de la siguiente forma:

import cProfile

def square_elements(a):
    result = np.zeros_like(a)
    for i in range(len(a)):
        result[i] = a[i] ** 2
    return result

a = np.random.random(1000000)
cProfile.run("square_elements(a)")

         10 function calls in 0.295 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.293    0.293    0.294    0.294 3274204399.py:8(square_elements)
        1    0.001    0.001    0.295    0.295 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 multiarray.py:1080(copyto)
        1    0.000    0.000    0.000    0.000 multiarray.py:85(empty_like)
        1    0.000    0.000    0.000    0.000 numeric.py:63(_zeros_like_dispatcher)
        1    0.001    0.001    0.001    0.001 numeric.py:67(zeros_like)
        1    0.000    0.000    0.295    0.295 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {built-in method builtins.len}
        1    0.000    0.000    0.000    0.000 {built-in method numpy.zeros}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [None]:
# Con esta información, podemos identificar las partes del código que consumen más tiempo de ejecución y optimizarlas para mejorar el rendimiento general del código NumPy.
