# **Memoria e iteraciones**
La implementación estándar de Python está escrita en C. Esto significa que cada objeto de Python es simplemente una estructura de C, que contiene no solo su valor, sino también otra información. Podríamos resumir que la memoria en C (que no es tema referente a este curso) hae que las variables funcionen como casilleros en los cuales guardamos valores.

![variables in C](https://i.imgur.com/0RQOTQ0.png)

En ese sentido, el casillero es reconocido por la memoria RAM del dispositivo como `0x7f1`, en dicho casillero se almacena el valor `2337` y además a este casillero se le permite tener un alias que es el nombre de la variable, en este caso `X`.

En python es un poco más complejo, pues las variables en python son punteros, que pueden ser pensadas como carteles. Por decirlo de alguna forma, todos los objetos básicos de python tales y como lo son los `int`, `str`, `bool` y en principio los `float` ya están "pre-guardados" en memoria, y al asignar una variable `X`, que almacenará el número `2337`, lo que sucede es que en memoria, el cartel pre-guardado con dicho número, y además su tipo, ahora tendrá una referencia de conteo.

![](https://i.imgur.com/F3IQqwE.png)

Lo anterior tiene un gran número de consecuencias en cómo funcionan las variables y muy especialmente las estructuras tales como las listas en python. Una de dichas consecuencias, de la que queremos hablar en esta ocasión es la forma en la que itera python.

Las estructuras en python pueden ser heterogeneas. Esto quiere decir que las estructuras, pueden almacenar diferentes tipos de variables en ellas.

En esta iteración se puede ver casi de manera plausible qué es lo que pasa con a iteración sobre este tipo de estructuras. Cuando Python itera a través de ellas, tiene que comprobar qué tipo de objeto es, y cuáles son sus posibilidades en términos de métodos y atributos. Lo cual hace que la iteración sea altamente costosa.

Una solución ampliamente usada por la comunidad es el uso de un módulo llamado `Numpy`. Aunque existen alternativas con mejor manejo de memoria a Numpy como `Pandas`, `Awkward` o `ROOT` (que más que ser un módulo es un ecosistema completo) la mayoría son generalizaciones de `Numpy` y tienen de fondo mucho de la filosofía de numpy trás de si. El truco con `Numpy` es el generar un tipo de estructuras homogeneas, las cuales facilitan la iteración.

<p><img alt="Colaboratory logo" height="350px" src="https://i.imgur.com/8EbyB0c.png" align="left" hspace="10px" vspace="0px"></p>

# **Numpy y ndarrays**

Al nivel de implementación, un arreglo de numpy contiene esencialmente un puntero único a un bloque contiguo de datos. La lista de Python, por otro lado, contiene un puntero a un bloque de punteros, cada uno de los cuales a su vez apunta a un objeto completo de Python como el entero de Python que vimos anteriormente.

En resumen, estas son las diferencias más importantes entre los arreglos de NumPy y las secuencias estándar de Python:

* Todos los elementos en un arreglo de NumPy deben ser del mismo tipo de dato y, por lo tanto, tendrán el mismo tamaño en memoria.
* Los arreglos de NumPy tienen un tamaño fijo en la creación, a diferencia de las listas de Python (que pueden crecer dinámicamente). Cambiar el tamaño de un `ndarray` creará un nuevo arreglo y eliminará el original.
* Los arreglos de NumPy facilitan operaciones avanzadas matemáticas y de otro tipo en grandes cantidades de datos. Típicamente, tales operaciones se ejecutan de manera más eficiente que usando las secuencias integradas de Python.

Veamos cómo definir arreglos de numpy

In [None]:
import numpy as np

#En el caso que solo se desdee traer array el comando sería from numpy import array
#JAMÁS USAR from numpy import *

## **dtype**:
A primera vista, no existe mucha diferencia entre una lista nativa de Python y un arreglo de Numpy. Pero podemos empezar a explorar las diferencias a partir de uno de los atributos de los arreglos.


Se puede ver que los arreglos poseen un atributo que caracteriza las variables que contiene dentro de él. Aunque no se hubiese establecido este atributo en la declaración, los arreglos asumen que como todas las entradas son enteros, el arreglo debe tener entradas en general de enteros de 64 bits. Si alguna de las entradas fuera un número de coma flotante, entonces el arreglo sería un arreglo de flotantes de 64 bits.

Sin embargo el tipo puede ser definido desde la declaración.

Los principales tipos son:

<p><img alt="Colaboratory logo" height="400px" src="https://i.imgur.com/2RpU9w1.png" align="left" hspace="10px" vspace="0px"></p>

## **shape:**

Atributo que devuelve una tupla de enteros que representa el rango a lo largo de cada dimensión de los arreglos n-dimensionales.

La forma `(4,)`, nos dice que `l` es un arreglo unidimensional, donde la dimensión tiene un rango 4. La dimensión y el número de elementos del arreglo se pueden obtener mediante los atributos `ndim` y `size`, respectivamente:

Podemos modificar la forma del arreglo modificando el atributo shape:

Alternativamente, NumPy proporciona el método `reshape`, con el cual podemos cambiar la forma de un arreglo. Este toma como argumento el arreglo a modificar y un entero o tupla que represente la nueva forma.

Esta nueva forma debe ser compatible con el número de elementos que tenga el arreglo. Cambiemos la forma de `l` para tener un vector fila:

NumPy nos permite pasar una de las dimensiones como `-1`. De esta manera, Numpy se encargará de que el rango en esa dimensión sea compatible con el arreglo original y con el rango de la dimensión que se fijó:

## **Formas alternativas de construir arreglos:**

NumPy proporciona formas alternativas de crear arreglos. Las funciones más comunes son `arange`, `linspace` `zeros`, `ones`, `full` y `empty`.

####**Tarea**

Consultar cómo construir arreglos con números aleatorios. ¿Se puede construir un arreglo con números aleatorios que sigan una distribución normal, exponencial?

* La función `arange()` toma un inicio, final y un paso como la función `range()` de Python, excepto que devuelve un `ndarray` y que el paso puede ser un número real.

- La función `linspace` crea una serie de puntos uniformemente entre un límite inferior y superior que incluye ambos extremos. Su sintáxis es de la forma:

>
    linspace(inicio, final, numero de puntos)

- Las funciones `zeros()` y `ones()` toman un entero o una tupla de enteros como argumento y devuelven un `ndarray` cuya forma coincide con la de la tupla y cuyos elementos son cero o uno:

- La función `full()` funciona de manera similar a `zeros()` y `ones()`, solo que podemos llenar el arreglo con cualquier valor:

- La función `empty()`, por otro lado, asignará memoria sin asignarle ningún valor. Esto significa que el contenido de un arreglo vacío será lo que esté en la memoria en ese momento. Esto es particularmente útil cuando creamos un arreglo cuyos valores serán modificados posteriormente.

<p><a name="ope"></a></p>

# **Operaciones sobre los arreglos**

Ahora que hemos visto cómo definir arreglos de NumPy, podemos discutir cómo realizar operaciones sobre los arreglos. La clave para hacer estas operaciones de una forma rápida y eficiente es usar operaciones **vectorizadas**, implementadas a través de las funciones universales de NumPy (ufuncs).

Recordemos que la operación de sumar dos listas de Python resulta en la concatenación de dichas listas:



Si quisieramos sumar elemento a elemento, debemos hacer explícito un ciclo `for` con la función `zip()` para dos variables de la siguiente manera (ver **Apéndice A**):

Si realizamos esta misma operación con arreglos de Numpy, obtendremos otra salida:

Como los arreglos son de NumPy, se está realizando lo que se conoce como una operación **vectorizada**, la cual es una operación sobre los arreglos que se realiza **elemento a elemento**, mediante lo que conocemos como funciones universales (ufuncs) de Numpy.

Las ufuncs de NumPy se sienten muy naturales de usar porque hacen uso de los operadores aritméticos nativos de Python.

La siguiente tabla nos muestra algunas de las funciones universales disponibles en Numpy (ver [documentación](https://numpy.org/doc/stable/reference/ufuncs.html#ufunc))







![picture](https://i.imgur.com/8HaZzxg.png)

Note que estas se muestran en dos versiones: mediante un operador y su correspondiente función universal. Por ejemplo `+` y `np.add`. Como en el ejemplo anterior, si los arreglos son de NumPy, el operador que utilicemos para realizar las operaciones representará la función universal. Si el arreglo no se define como uno de NumPy, y si queremos aplicar una función universal, debemos utilizar la forma explícita de la función universal

En el caso de la multiplicacion en Python, la multiplicación de un número entero $n$ por una lista $l$, nos arroja una lista que contiene los elementos de $l$ $n$ veces:



Si quisieramos multiplicar el entero por cada uno de los elementos de la lista $l$ debemos incluir un ciclo for:

Además, la operación de multiplicación entre listas no está definida:

En NumPy, ambas operaciones se hacen de forma vectorizada:

Note que ambas operaciones se hacen elemento a elemento, caracteriztica de las operaciones vectorizadas implementadas a través de ufuncs. Note además, que en el caso de la multiplicación de arreglos, la salida no corresponde a lo que conocemos como producto punto. Para realizar esta operación, tanto en arreglos unidimensionales como n-dimensionales, podemos utilizar la función universal `np.dot` o su operador asociado `@`:

Es importante mencionar que el uso de operaciones vectorizadas no solo significa la utilización de funciones universales para la realización de las operaciones elemento a elemento.

En el contexto de lenguajes de alto nivel como Python, el término **vectorización** representa el uso de código optimizado y precompilado escrito en lenguajes de bajo nivel (por ejemplo C) para realizar operaciones matemáticas en una secuencia de datos. Esto se realiza en lugar de una iteración explicita escrita en código nativo, como ya vimos en el ejemplo de la multiplicacion, que hace que las operaciones sean más eficientes.

**Ejercicio**

Veamos un ejemplo con el cual se ilustra la eficiencia computacional que se alcanza con las operaciones vectorizadas de NumPy: Construyamos una función que calcule el recíproco de una lista

In [None]:
def Lista_Reciprocos(lista):
  """
  Esta función calcula una lista con los recíprocos
  de los elemntos de la lista que acepta por entrada
  """
  salida = []
  for elemento in lista:
    salida.append(1/elemento)

  return salida

Lista_Reciprocos([1, 2, 3])

In [None]:
a = list(range(1,100000))

In [None]:
%timeit Lista_Reciprocos(a)

La operación equivalente en NumPy, utilizando ufuncs, será:

In [None]:
R = np.arange(1,100000)

In [None]:
%timeit 1/R

Note que hay tres ordenes de magnitud de diferencia en el tiempo de computo en ambas versiones.

Resulta que el cuello de botella aquí no son las operaciones en sí mismas, sino la verificación de tipos y demás que Python debe hacer en cada ciclo. Cada vez que se calcula el recíproco, Python primero examina el tipo de objeto y realiza una búsqueda dinámica de la función correcta que se utilizará para ese tipo. Si estuviéramos trabajando en código compilado, esta especificación de tipo se conocería antes de que se ejecute el código y el resultado podría calcularse de manera mucho más eficiente.

Los cálculos que usan vectorización a través de ufuncs son casi siempre más eficientes que su contraparte implementada a través de ciclos, especialmente a medida que los arreglos crecen en tamaño. Cada vez que se vea un ciclo de este tipo en Python, debe considerarse si este puede reemplazarse con una expresión vectorizada.

**Ejercicio:**  La serie de Leibniz  $$\frac{\pi}{4}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7} -\frac{1}{9}+ \cdot \cdot \cdot=\sum_{n=0}^{\infty} \frac{(-1)^n}{2n+1}$$ La serie de Leibniz permite obtener un valor aproximado para el número $\pi$. Escriba un programa en el que dado el número de términos de la sumatoria, se calcule y muestre el valor aproximado de $\pi$.

 $$\pi=4\sum_{n=0}^{\infty} \frac{(-1)^n}{2n+1}$$

Veamos un ejemplo simplificado de cómo hacer la suma de los 100 primeros naturales:

$$\sum_{n = 1}^{i} n$$

In [None]:
def suma(n):
  return sum(i for i in range(1,n+1))

suma(100)