# [<font size="10">NumPy<font>](http://www.numpy.org) $:=$ `Numerical Python` 

<img src="../images/NumPy_logo.svg" />

Según la [página](http://www.numpy.org) oficial (traducción): **NumPy** es el paquete fundamental para la computación científica con Python. Contiene entre otras cosas:

* Un poderoso objeto de matriz N-dimensional.
* Funciones sofisticadas.
* Herramientas para la integración de código C/C++ y Fortran.
* Álgebra lineal útil, transformada de Fourier y capacidades de números aleatorios.

Además de sus obvios usos científicos, NumPy también se puede usar como un eficiente contenedor multidimensional de datos genéricos. Se pueden definir tipos de datos arbitrarios. Esto permite que NumPy se integre a la perfección con una amplia variedad de bases de datos.

La versiones de desarrollo más recientes están disponibles a través de los repositorios oficiales alojados en [Github](https://github.com/numpy/numpy).

En definitiva, [NumPy](https://numpy.org/) es una librería de Python especializada en el **cálculo numérico** y el **análisis de datos**, especialmente para un **gran volumen de datos**.

Incorpora una nueva clase de objetos llamados **arrays** que permite representar **colecciones de datos de un mismo tipo** en varias dimensiones, y funciones muy eficientes para su manipulación.

La ventaja de Numpy frente a las listas predefinidas en Python es que el procesamiento de los arrays se realiza mucho más rápido (hasta 50 veces más) que las listas, lo cual la hace ideal para el procesamiento de vectores y matrices de grandes dimensiones.

# ¿Cómo instalar NumPy?

Puede instalarse tipeando en la terminal:

* `conda install numpy`
* `git clone https://github.com/numpy/numpy.git`

# ¿Cómo utilizar NumPy?

La manera recomendada es cargar **NumPy** como se hace a continuación: 

In [1]:
import numpy as np

In [2]:
np

<module 'numpy' from 'C:\\ProgramData\\Anaconda3\\lib\\site-packages\\numpy\\__init__.py'>

Teniendo Numpy cargado, averiguemos el número de versión instalada.

In [4]:
np.__version__

'1.18.5'

# ¿Qué nos provee Numpy?

La documentación oficial se encuentra [aquí](https://numpy.org/doc/1.23/).

# Números populares

#### Número [$\pi$](https://es.wikipedia.org/wiki/Número_π)

<img src="../images/NUMERO_PI.jpg" />

In [6]:
np.pi

3.141592653589793

In [7]:
#Averiguamos el tipo de variable
type(np.pi)

float

#### Número [$e$](https://es.wikipedia.org/wiki/Número_e)

<img src="../images/napier_10000.svg" />

In [8]:
np.e

2.718281828459045

In [9]:
#Averiguamos el tipo de variable
type(np.e)

float

# La clase **array** 
Un array es una estructura de datos de un mismo tipo organizada en forma de tabla o cuadrícula de distintas dimensiones.

Las dimensiones de un array también se conocen como ejes.
![arrays](../images/arrays.png)

## Creación de arrays
Para crear un array se utiliza la siguiente función de NumPy

* `np.array(lista)` : Crea un array a partir de la **lista o tupla** en formato lista, devuelviendo una referencia a él. El **número de dimensiones** del array dependerá de las listas o tuplas anidadas en lista:

* Para una lista de valores se crea un array de una dimensión, también conocido como **vector**.

* Para una lista de listas de valores se crea un array de dos dimensiones, también conocido como **matriz**.

* Para una lista de listas de listas de valores se crea un array de tres dimensiones, también conocido como **cubo**.

Y así sucesivamente. No hay límite en el número de dimensiones del array más allá de la memoria disponible en el sistema.

 **Los elementos de la lista o tupla deben ser del mismo tipo**.

In [43]:
# Ejemplos:
# Array de una dimensión
a1 = np.array([1, 2, 3])
print(a1)
print("-"*10)
print(a1.shape)

[1 2 3]
----------
(3,)


In [42]:
# Array de dos dimensiones
a2 = np.array([[1, 2, 3], [4, 5, 6]])
print(a2)
print("-"*10)
print(a2.shape)

[[1 2 3]
 [4 5 6]]
----------
(2, 3)


In [32]:
# Array de tres dimensiones
a3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(a3)
print("-"*10)
print(a3.shape)

[[[ 1  2  3]
  [ 4  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
----------
(2, 2, 3)


# Arrays o Arreglos. Definiciones.

En el paquete `NumPy` la terminología usada para vectores, matrices y conjuntos de datos de dimensión mayor es la de un  `array` (arreglo). 

<img src='../images/1_O2_46c16UdgmXzen4VktMg.png' title= https://towardsdatascience.com/two-cool-features-of-python-numpy-mutating-by-slicing-and-broadcasting-3b0b86e8b4c7 />

## Creando arrays de `NumPy`

Existen varias formas para inicializar nuevos arrays de `NumPy`, por ejemplo desde

* Listas o tuplas Python.
* Usando funciones dedicadas a generar arreglos `NumPy`, como `np.arange`, `np.linspace`, etc.
* Leyendo datos desde archivos.

### Creación de un vector (arreglo 1D)

Por ejemplo, para crear nuevos arreglos de matrices y vectores desde listas Python podemos usar la función `numpy.array`.

In [44]:
#creando una lista
lista = [1, 2, 3, 4]

In [45]:
type(lista)

list

In [46]:
# un vector: el argumento de la función array es una lista de Python
array1d = np.array(lista)
array1d

array([1, 2, 3, 4])

In [47]:
# Ver el tipo de dato y su estructura o forma.
print(type(array1d))
print(array1d.shape)

<class 'numpy.ndarray'>
(4,)


## Indexado de vector

Acceso a los distintos elementos o componentes de la lista creada.

In [48]:
lista[0]

1

In [49]:
lista[1]

2

In [50]:
array1d[0]

1

In [51]:
array1d[4]

IndexError: index 4 is out of bounds for axis 0 with size 4

Hasta el momento el arreglo `np.ndarray` se parece a una lista Python (anidada). Entonces, **¿por qué simplemente no usar listas para hacer cálculos en lugar de crear un tipo nuevo de array? **

Existen varias razones:

* Las listas Python son muy generales. Ellas pueden contener cualquier tipo de objeto. Sus tipos son asignados dinámicamente. Ellas no permiten usar funciones matemáticas tales como la multiplicación de matrices, el producto escalar, etc. El implementar tales funciones para las listas Python no sería muy eficiente debido a la asignación dinámica de su tipo.
* Los arreglos Numpy tienen tipo **estático** y **homogéneo**. El tipo de elementos es determinado cuando se crea el arreglo.
* Los arreglos Numpy son eficientes en el uso de memoria.
* Debido a su tipo estático, se pueden desarrollar implementaciones rápidas de funciones matemáticas tales como la multiplicación y la suma de arreglos `NumPy` usando lenguajes compilados (se usan C y Fortran).

## ¿Un vector es igual a una lista?

**No**. Las operaciones permitidas para las listas son diferentes a las que poseen los vectores. Justifiquemos...

In [54]:
#Comprobacion del mismo tipo de dato?
array1d is lista

False

In [55]:
lista == array1d

array([ True,  True,  True,  True])

In [58]:
# Operaciones sobre la lista
3*lista

[1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4]

In [59]:
# Operaciones sobre el array
3*array1d

array([ 3,  6,  9, 12])

In [61]:
#Definimos tres listas
l01 = [1, 2, 3]
l02 = [4, 5, 6]
l03 = [7, 8, 9, 10, 11]

In [62]:
#Suma de listas
l01 + l02

[1, 2, 3, 4, 5, 6]

In [63]:
#Suma de listas
l01 + l03

[1, 2, 3, 7, 8, 9, 10, 11]

In [64]:
#Suma de listas
l01 + l02 + l03

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

ahora definimos las mismas operaciones pero sobre arrays de numpy. Utilizamos las listas generadas.

In [65]:
#Definimos tres vectores
v01 = np.array(l01)
v02 = np.array(l02)
v03 = np.array(l03)

In [66]:
v01

array([1, 2, 3])

In [67]:
v02

array([4, 5, 6])

In [68]:
v03

array([ 7,  8,  9, 10, 11])

In [69]:
#Suma de vectores
v01 + v02

array([5, 7, 9])

In [71]:
#Suma de vectores. Importante observacion:
v01 + v03

ValueError: operands could not be broadcast together with shapes (3,) (5,) 

In [73]:
#Suma de vectores. Volvemos al error.
v01 + v02 + v03

ValueError: operands could not be broadcast together with shapes (3,) (5,) 

## Atributos de un array
Existen varios atributos y funciones que describen las características de un array.

* `a.ndim` : Devuelve el número de dimensiones del array a.

* `a.shape` : Devuelve una tupla con las dimensiones del array a.

* `a.size` : Devuelve el número de elementos del array a.

* `a.dtype`: Devuelve el tipo de datos de los elementos del array a.


In [74]:
# Utilizamos la funcion np.shape()
np.shape(v01)

(3,)

In [78]:
# Utilizamos el método del objeto array. (objeto.shape)
v01.shape

(3,)

In [76]:
v02.shape

(3,)

In [77]:
v03.shape

(5,)

**Los vectores** sólo se pueden sumar si tienen la misma forma.

El **número de elementos** de un arreglo puede obtenerse usando la propiedad `ndarray.size`:

In [79]:
np.size(v01)

3

O equivalentemente.

In [80]:
v01.size

3

In [81]:
v02.size

3

In [82]:
v03.size

5

**Otras operaciones:**

In [83]:
# Multiplicando listas
l01*l02

TypeError: can't multiply sequence by non-int of type 'list'

In [84]:
#Multiplicando vectores
v01*v02

array([ 4, 10, 18])

In [85]:
#Multiplicando vectores
v01*v03

ValueError: operands could not be broadcast together with shapes (3,) (5,) 

Las listas no se pueden multiplicar, mientras que los vectores sí. La multiplicación se realiza elemento a elemento y sólo si poseen la misma forma.

In [86]:
# Dividiendo listas
l01/l02

TypeError: unsupported operand type(s) for /: 'list' and 'list'

In [87]:
#Dividiendo vectores
v01/v02

array([0.25, 0.4 , 0.5 ])

In [88]:
#Dividiendo vectores
v01/v03

ValueError: operands could not be broadcast together with shapes (3,) (5,) 

Las listas no se pueden dividir, mientras que los vectores sí. La división se realiza elemento a elemento y sólo si poseen la misma forma.

### Operaciones escalar-arreglo

Podemos usar los operadores aritméticos usuales para multiplicar, sumar, restar, y dividir arreglos por números (escalares).

In [89]:
escalar = 3
#escalar = 3.
escalar*array1d

array([ 3,  6,  9, 12])

In [90]:
array1d+escalar

array([4, 5, 6, 7])

### Operaciones elemento a elemento entre arreglos

Cuando sumamos, sustraemos, multiplicamos y dividimos dos arreglos, el comportamiento por defecto es operar *elemento a elemento*:

In [91]:
# elevar al cuadrado
array1d**2

array([ 1,  4,  9, 16], dtype=int32)

Ejemplos aplicación distintas **funciones al vector**:

In [92]:
# tangente Equivalent to np.sin(x)/np.cos(x)
np.tan(array1d)

array([ 1.55740772, -2.18503986, -0.14254654,  1.15782128])

In [94]:
# exponencial
np.exp(array1d)

array([ 2.71828183,  7.3890561 , 20.08553692, 54.59815003])

In [95]:
# coseno
np.cos(array1d)

array([ 0.54030231, -0.41614684, -0.9899925 , -0.65364362])

In [96]:
# raíz cuadrada
array1d**0.5

array([1.        , 1.41421356, 1.73205081, 2.        ])

In [97]:
# raíz cuadrada
np.sqrt(array1d)

array([1.        , 1.41421356, 1.73205081, 2.        ])

# Creando un arreglo 2D

In [122]:
#Creando lista anidada
lista_anidada = [l01, l02]
#lista_anidada = [l01, [4., 5., 6.]]
lista_anidada

[[1, 2, 3], [4, 5, 6]]

In [123]:
#Creando un arreglo 2D: el argumento de la función np.array es una lista anidada de Python
array2d = np.array(lista_anidada)
array2d

array([[1, 2, 3],
       [4, 5, 6]])

Usando la propiedad `dtype` (tipo de dato) de un `ndarray`, podemos ver qué tipo de dato contiene un arreglo:

In [124]:
array1d.dtype, array2d.dtype
#Volver a definir matriz

(dtype('int32'), dtype('int32'))

In [125]:
#Tipo de array1d y array2d
type(array1d), type(array2d)

(numpy.ndarray, numpy.ndarray)

Los objetos `array1d` y `array2d` son ambos del tipo `ndarray` que provee el módulo `NumPy`.

In [126]:
#Forma de array1d y array2d
array1d.shape, array2d.shape

((4,), (2, 3))

In [127]:
#Tamaño de array1d y array2d
array1d.size, array2d.size

(4, 6)

# Indexado y visualización de arreglos multidimensionales

<img src='../images/1_Ikn1J6siiiCSk4ivYUhdgw.png' title= https://medium.com/datadriveninvestor/artificial-intelligence-series-part-2-numpy-walkthrough-64461f26af4f />

In [128]:
%matplotlib notebook
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D 
plt.rcParams['font.family'] = 'serif'

#### 1D array

In [129]:
array1d = np.array([7, 2, 9, 10])
array1d

array([ 7,  2,  9, 10])

In [130]:
array1d.ndim

1

In [131]:
array1d.shape

(4,)

`array1d` es un vector, tiene por lo tanto sólo una dimensión, y requiere un índice.

In [132]:
plt.figure(figsize=(6,6))
plt.plot(array1d,'o')
plt.grid()
plt.xlabel(r'Indice $i$',fontsize=18)
plt.ylabel(r'Elemts  en arreglo 1D',fontsize=18)

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Elemts  en arreglo 1D')

In [133]:
array1d[0]

7

In [134]:
array1d[0], array1d[1], array1d[2], array1d[3] #,array1d[4]

(7, 2, 9, 10)

In [135]:
for i in range(4):
    print(i, array1d[i])
#    print('array1d[%s] = %2.1f'%(i, array1d[i]))

0 7
1 2
2 9
3 10


Se pueden sumar los elementos de un arreglo 1D así:

In [136]:
sum(array1d)

28

In [137]:
np.sum(array1d)

28

In [138]:
array1d.sum()

28

Se pueden multiplicar los elementos de un arreglo 1D así:

In [139]:
np.prod(array1d)

1260

In [140]:
#suma acumulada
np.cumsum(array1d)

array([ 7,  9, 18, 28], dtype=int32)

In [141]:
#producto acumulado
np.cumproduct(array1d)

array([   7,   14,  126, 1260], dtype=int32)

#### 2D array

In [142]:
array2d = np.array([[5.2, 3.0, 4.5],
                   [9.1, 0.1, 0.3]])
array2d

array([[5.2, 3. , 4.5],
       [9.1, 0.1, 0.3]])

In [143]:
array2d.ndim

2

In [144]:
array2d.shape

(2, 3)

`array2d` es una matriz, es decir un arreglo bidimensional, requiere dos índices.

In [145]:
i,j = np.arange(2),np.arange(3)
I, J = np.meshgrid(i,j)
I, J

(array([[0, 1],
        [0, 1],
        [0, 1]]),
 array([[0, 0],
        [1, 1],
        [2, 2]]))

Visualizar los resultados 

In [146]:
fig = plt.figure(figsize=(8,8))
plt.scatter(I,J,s=1000*array2d)
plt.title(r'Elemts  en arreglo 2D', fontsize=18)
plt.xlabel(r'Indice $i$', fontsize=18)
plt.ylabel(r'Indice $j$', fontsize=18)

<IPython.core.display.Javascript object>

Text(0, 0.5, 'Indice $j$')

In [147]:
#Imprime elementos de fila = 0 contada desde arriba hacia abajo
array2d[0,0], array2d[0,1], array2d[0,2]

(5.2, 3.0, 4.5)

In [148]:
#Imprime elementos de fila = 1 contada desde arriba hacia abajo
array2d[1,0], array2d[1,1], array2d[1,2]

(9.1, 0.1, 0.3)

In [149]:
#La fila = 2 no está definida
array2d[2,0]

IndexError: index 2 is out of bounds for axis 0 with size 2

In [150]:
for i in range(2):
    for j in range(3):
        print(i,j,array2d[i,j])
#        print('array2d[%s,%s] = %2.1f'%(i, j, array2d[i, j]))

0 0 5.2
0 1 3.0
0 2 4.5
1 0 9.1
1 1 0.1
1 2 0.3


Se pueden sumar los elementos de un arreglo 2D así:

In [151]:
array2d.sum()

22.2

Se pueden sumar los elementos del `axis=0` de un arreglo 2D así:

In [152]:
#Suma elementos sobre axis=0
array2d.sum(axis=0)

array([14.3,  3.1,  4.8])

Se pueden sumar los elementos del `axis=1` de un arreglo 2D así:

In [153]:
#Suma elementos sobre axis=1
array2d.sum(axis=1)

array([12.7,  9.5])

Note que:

In [154]:
array2d.sum(axis=0).sum(), array2d.sum(axis=1).sum() #Es la suma de todos los elementos del arreglo

(22.200000000000003, 22.2)

Similarmente:

In [155]:
np.prod(array2d,axis=0), np.prod(array2d,axis=1)

(array([47.32,  0.3 ,  1.35]), array([70.2  ,  0.273]))

#### 3D array

In [156]:
array3d = np.array([[[1,2], [4,3], [7,4]],
                   [[2,3], [9,8], [7,5]],
                   [[1,2], [3,2], [0,2]],
                   [[9,10], [6,5], [9,8]]])
array3d

array([[[ 1,  2],
        [ 4,  3],
        [ 7,  4]],

       [[ 2,  3],
        [ 9,  8],
        [ 7,  5]],

       [[ 1,  2],
        [ 3,  2],
        [ 0,  2]],

       [[ 9, 10],
        [ 6,  5],
        [ 9,  8]]])

In [157]:
array3d.shape

(4, 3, 2)

`array3d` es una "paralelepípedo rectangular", es decir un arreglo tridimensional, requiere tres índices.

In [158]:
x, y, z = np.arange(4), np.arange(3), np.arange(2)
X, Y, Z = np.meshgrid(x, y, z)
X,Y,Z

(array([[[0, 0],
         [1, 1],
         [2, 2],
         [3, 3]],
 
        [[0, 0],
         [1, 1],
         [2, 2],
         [3, 3]],
 
        [[0, 0],
         [1, 1],
         [2, 2],
         [3, 3]]]),
 array([[[0, 0],
         [0, 0],
         [0, 0],
         [0, 0]],
 
        [[1, 1],
         [1, 1],
         [1, 1],
         [1, 1]],
 
        [[2, 2],
         [2, 2],
         [2, 2],
         [2, 2]]]),
 array([[[0, 1],
         [0, 1],
         [0, 1],
         [0, 1]],
 
        [[0, 1],
         [0, 1],
         [0, 1],
         [0, 1]],
 
        [[0, 1],
         [0, 1],
         [0, 1],
         [0, 1]]]))

In [None]:
#ax.scatter3D?

In [159]:
fig = plt.figure(figsize=(8,6))
ax = fig.gca(projection='3d')
ax.scatter3D(X, Y, Z, s=100*array3d)
ax.set_label(r'Elemts  en arreglo 3D')
ax.set_xlabel(r'Indice $i$', fontsize=18)
ax.set_ylabel(r'Indice $j$', fontsize=18)
ax.set_zlabel(r'Indice $k$', fontsize=18)
ax.set_title('Elems de arreglo 3D',fontsize=18)

<IPython.core.display.Javascript object>

Text(0.5, 0.92, 'Elems de arreglo 3D')

In [160]:
array3d[1,1,0]

9

In [161]:
# Se varía axis=0
j = 0 
k = 0
array3d[0,j,k], array3d[1,j,k], array3d[2,j,k], array3d[3,j,k]

(1, 2, 1, 9)

In [162]:
# Se varía axis=0
j = 0 
k = 1
array3d[0,j,k], array3d[1,j,k], array3d[2,j,k], array3d[3,j,k]

(2, 3, 2, 10)

In [163]:
# Se varía axis=0 y se saca de rango
j = 0 
k = 2
array3d[0,j,k], array3d[1,j,k], array3d[2,j,k], array3d[3,j,k]

IndexError: index 2 is out of bounds for axis 2 with size 2

In [164]:
# Se varía axis=1
i = 0
k = 0
array3d[i,0,k], array3d[i,1,k], array3d[i,2,k]

(1, 4, 7)

In [165]:
# Se varía axis=1
i = 1
k = 0
array3d[i,0,k], array3d[i,1,k], array3d[i,2,k]

(2, 9, 7)

In [166]:
# Se varía axis=1
i = 2
k = 0
array3d[i,0,k], array3d[i,1,k], array3d[i,2,k]

(1, 3, 0)

In [167]:
# Se varía axis=1
i = 3
k = 0
array3d[i,0,k], array3d[i,1,k], array3d[i,2,k]

(9, 6, 9)

In [168]:
for i in range(4):
    for j in range(3):
        for k in range(2):
            print(i, j, k, array3d[i, j, k])
#            print('array3d[%s,%s,%s] = %d'%(i, j, k, array3d[i, j, k]))

0 0 0 1
0 0 1 2
0 1 0 4
0 1 1 3
0 2 0 7
0 2 1 4
1 0 0 2
1 0 1 3
1 1 0 9
1 1 1 8
1 2 0 7
1 2 1 5
2 0 0 1
2 0 1 2
2 1 0 3
2 1 1 2
2 2 0 0
2 2 1 2
3 0 0 9
3 0 1 10
3 1 0 6
3 1 1 5
3 2 0 9
3 2 1 8


In [None]:
#Comparando los 3 arreglos multidimensionales.

In [169]:
array1d.itemsize, array2d.itemsize, array3d.itemsize # los bits de cada elemento

(4, 8, 4)

In [170]:
array1d.nbytes, array2d.nbytes, array3d.nbytes # número de bytes

(16, 48, 96)

In [171]:
array1d.ndim, array2d.ndim, array3d.ndim # número de dimensiones

(1, 2, 3)

## Reasignando elementos de arreglo

In [172]:
array1d

array([ 7,  2,  9, 10])

In [173]:
array1d[1] = 30.

In [174]:
array1d

array([ 7, 30,  9, 10])

Se obtiene un error si intentamos asignar un valor de un tipo equivocado a un elemento de un arreglo numpy:

In [175]:
array2d

array([[5.2, 3. , 4.5],
       [9.1, 0.1, 0.3]])

In [176]:
#Intentando reasignar valor
array2d[0,0] = "Hola Mundo"

ValueError: could not convert string to float: 'Hola Mundo'

In [None]:
#Intentando reasignar valor
array2d[0,0] = [3, 5, 7]

In [None]:
#Intentando reasignar valor
array2d[0,0] = (3, 5, 7)

Si lo deseamos, podemos definir explícitamente el tipo de datos de un arreglo cuando lo creamos, usando el argumento `dtype`: 

In [177]:
array2d = np.array([[1, 2], [3, 4]], dtype=complex)
array2d

array([[1.+0.j, 2.+0.j],
       [3.+0.j, 4.+0.j]])

Algunos tipos comunes que pueden ser usados con `dtype` son: `int`, `float`, `complex`, `bool`, `object`, etc.

Podemos también definir explícitamente el número de bit de los tipos de datos, por ejemplo: `int64`, `int16`, `float64`, `complex64`.

In [178]:
array2d = np.array([[1, 2], [3, 4]], dtype=np.complex64)
array2d

array([[1.+0.j, 2.+0.j],
       [3.+0.j, 4.+0.j]], dtype=complex64)

In [179]:
array2d = np.array([['a', 'b'], ['c', 'd']])
array2d

array([['a', 'b'],
       ['c', 'd']], dtype='<U1')

In [180]:
array2d = np.array([[1, 'a b c'], [3, 4]])
array2d

array([['1', 'a b c'],
       ['3', '4']], dtype='<U11')

In [181]:
array2d = np.array([[1, 'a b c'], [3, array1d]])
array2d

array([[1, 'a b c'],
       [3, array([ 7, 30,  9, 10])]], dtype=object)

In [182]:
array2d = np.array([[1, 'a b c'], [[7,5], 4]])
array2d

array([[1, 'a b c'],
       [list([7, 5]), 4]], dtype=object)

## Corte de índices, Seleccion Rangos

Corte (slicing) de índices es el nombre para la sintaxis `M[desde:hasta:paso]` para extraer una parte de un arreglo:

#### 1D

In [183]:
array1d = np.array([1,2,3,4,5])
array1d

array([1, 2, 3, 4, 5])

In [184]:
#recordemos
inicio = 1
final = 3 # end NO es incluido
paso = 1 # 1por defecto
#paso = 2 
array1d[inicio:final:paso]

array([2, 3])

Los cortes de índices son *mutables*: si se les asigna un nuevo valor el arreglo original es modificado:

In [185]:
array1d[1:3] = [-2,-3]
array1d

array([ 1, -2, -3,  4,  5])

Podemos omitir cualquiera de los tres parámetros en  `M[desde:hasta:paso]`:

In [186]:
array1d[::] # desde, hasta y paso asumen los valores por defecto

array([ 1, -2, -3,  4,  5])

In [187]:
array1d[::2] # el paso es 2, desde y hasta se asumen desde el comienzo hasta el fin del arreglo

array([ 1, -3,  5])

In [188]:
array1d[:3] # primeros tres elementos

array([ 1, -2, -3])

In [189]:
array1d[3:] # elementos desde el índice 3

array([4, 5])

Los índices negativos se cuentan desde el fin del arreglo (los índices positivos desde el comienzo):

In [190]:
array1d = np.array([1, 2, 3, 4, 5])

In [191]:
array1d[-1] # el último elemento del arreglo

5

In [192]:
array1d[-3:] # los últimos 3 elementos

array([3, 4, 5])

#### 2D

El corte de índices funciona exactamente del mismo modo para arreglos multidimensionales:

In [193]:
#selecciona fila=0
i = 0
array2d[i,:]

array([1, 'a b c'], dtype=object)

In [194]:
#selecciona fila=1
i = 1
array2d[i,:]

array([list([7, 5]), 4], dtype=object)

In [195]:
#selecciona col=0
j = 0
array2d[:,j]

array([1, list([7, 5])], dtype=object)

In [196]:
#selecciona col=1
j = 1
array2d[:,j]

array(['a b c', 4], dtype=object)

In [197]:
#selecciona col=2
j = 2
array2d[:,j]

IndexError: index 2 is out of bounds for axis 1 with size 2

In [198]:
# Se define matriz con una lista comprimida
array2d = np.array([[n+m*10 for n in range(5)] for m in range(5)])
array2d

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [199]:
# un bloque parte del arreglo original
array2d[1:4, 1:4]

array([[11, 12, 13],
       [21, 22, 23],
       [31, 32, 33]])

In [200]:
# elemento por medio
array2d[::2, ::2]

array([[ 0,  2,  4],
       [20, 22, 24],
       [40, 42, 44]])

#### 3D

In [201]:
#selecciona fila=0
i = 0
array3d[i,:,:]

array([[1, 2],
       [4, 3],
       [7, 4]])

In [202]:
#selecciona col=0
j = 0
array3d[:,j,:]

array([[ 1,  2],
       [ 2,  3],
       [ 1,  2],
       [ 9, 10]])

In [203]:
#selecciona anch=0
k = 0
array3d[:,:,k]

array([[1, 4, 7],
       [2, 9, 7],
       [1, 3, 0],
       [9, 6, 9]])

### Indexado Fancy

Se llama indexado fancy cuando una arreglo o una lista es usado en lugar de un índice: 

In [204]:
indices_fila = [1, 2, 3]

In [205]:
array1d[indices_fila]

array([2, 3, 4])

In [206]:
array2d[indices_fila]

array([[10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34]])

In [207]:
indices_col = [1, 2, -1] # recuerde que el índice -1 corresponde al último elemento

In [208]:
array1d[indices_col]

array([2, 3, 5])

In [209]:
array2d[indices_col]

array([[10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [40, 41, 42, 43, 44]])

## Filtrado de elementos de un array
Una característica muy útil de los arrays es que es muy fácil obtener otro array con los elementos que cumplen una condición.

* `a[condicion]` : Devuelve una lista con los elementos del array a que cumplen la condición condicion.

In [228]:
a = np.array([[1, 2, 3], [4, 5, 6]])

# Obtener todos los numeros pares de la matriz
print(a[(a % 2 == 0)])

[2 4 6]


In [229]:
print(a[(a % 2 == 0) &  (a > 2)])

[4 6]


### **Otro tipo de filtrado con mascaras:**

Podemos también usar **máscaras de índices**: Si la máscara de índice es un arreglo `NumPy` con tipo de dato booleano (`bool`), entonces un elemento es seleccionado (True) o no (False) dependiendo del valor de la máscara de índice en la posición de cada elemento: 

In [210]:
array1d = np.array([n for n in range(5)])
array1d

array([0, 1, 2, 3, 4])

In [211]:
masc_filas00 = [0,2]
array1d[masc_filas00]

array([0, 2])

In [212]:
# lo mismo
masc_fila01 = np.array([True, False, True, False, False])
array1d[masc_fila01]

array([0, 2])

In [213]:
# lo mismo
masc_fila02 = np.array([1,0,1,0,0], dtype=bool)
array1d[masc_fila02]

array([0, 2])

Esta característica es muy útil para seleccionar en forma condicional elementos de un arreglo, usando por ejemplo los operadores de comparación:

In [214]:
array1d = np.arange(0, 10, 0.5)
array1d

array([0. , 0.5, 1. , 1.5, 2. , 2.5, 3. , 3.5, 4. , 4.5, 5. , 5.5, 6. ,
       6.5, 7. , 7.5, 8. , 8.5, 9. , 9.5])

In [215]:
#masc = (array1d==1)
#masc = (5 < array1d)
#masc = (array1d < 1)
masc = (5 < array1d) * (array1d < 7.5) #ambas condiciones juntas
masc

array([False, False, False, False, False, False, False, False, False,
       False, False,  True,  True,  True,  True, False, False, False,
       False, False])

In [216]:
array1d[masc]

array([5.5, 6. , 6.5, 7. ])

## Funciones para extraer información desde arreglos y para crear nuevos arreglos

#### np.min y np.max

In [219]:
np.min(array1d), np.min(array2d), np.min(array3d)

(0.0, 0, 0)

In [220]:
#otra forma de hacer lo mismo
array1d.min(),array2d.min(),array3d.min()

(0.0, 0, 0)

In [221]:
np.max(array1d), np.max(array2d), np.max(array3d)

(9.5, 44, 10)

In [222]:
#otra forma de hacer lo mismo
array1d.max(),array2d.max(),array3d.max()

(9.5, 44, 10)

#### mean

In [223]:
np.mean(array1d), np.mean(array2d), np.mean(array3d)

(4.75, 22.0, 4.666666666666667)

In [224]:
#otra forma de hacer lo mismo
array1d.mean(),array2d.mean(),array3d.mean()

(4.75, 22.0, 4.666666666666667)

#### Desviación estándar y varianza

In [225]:
np.std(array1d), np.std(array2d), np.std(array3d)

(2.883140648667699, 14.212670403551895, 2.9814239699997196)

In [226]:
np.var(array1d), np.var(array2d), np.var(array3d)

(8.3125, 202.0, 8.88888888888889)

#### np.where

Las máscaras de índices pueden ser convertidas en posiciones de índices usando la función `np.where` (dónde):

In [231]:
print(masc)
print(indices)

indices = np.where(masc)
indices

[False False False False False False False False False False False  True
  True  True  True False False False False False]
(array([11, 12, 13, 14], dtype=int64),)


(array([11, 12, 13, 14], dtype=int64),)

In [232]:
array1d[indices] # este indexado es equivalente al indexado fancy x[masc]

array([5.5, 6. , 6.5, 7. ])

#### np.diag

Con la función `np.diag` podemos extraer la diagonal y las subdiagonales de un arreglo:

In [233]:
array2d

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [234]:
np.diag(array2d)

array([ 0, 11, 22, 33, 44])

In [235]:
# Desplazamiento de la diagonal:
np.diag(array2d, -1)

array([10, 21, 32, 43])

In [236]:
np.diag(array2d, -2)

array([20, 31, 42])

#### np.take

La función `np.take` es similar al indexado fancy descrito anteriormente:

In [237]:
array1d = np.arange(-3,3)
array1d

array([-3, -2, -1,  0,  1,  2])

In [None]:
#np.take?

In [238]:
indices_fila = [1, 3, 5]
array1d[indices_fila] # indexado fancy

array([-2,  0,  2])

In [239]:
array1d.take(indices_fila)

array([-2,  0,  2])

Pero la función `np.take` también funciona sobre listas y otros objetos:

In [240]:
np.take([-3, -2, -1,  0,  1,  2], indices_fila)

array([-2,  0,  2])

También funciona sobre los ejes de un arreglo multidimensional.

In [241]:
array2d

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14],
       [20, 21, 22, 23, 24],
       [30, 31, 32, 33, 34],
       [40, 41, 42, 43, 44]])

In [242]:
np.take(array2d,[1,3],axis=0)

array([[10, 11, 12, 13, 14],
       [30, 31, 32, 33, 34]])

In [243]:
np.take(array2d,[0,2],axis=1)

array([[ 0,  2],
       [10, 12],
       [20, 22],
       [30, 32],
       [40, 42]])

In [244]:
np.take(array2d, [1,4,7,9]) #Es como si hubiera aplanado el arreglo

array([ 1,  4, 12, 14])

In [245]:
array2d_aplanado = array2d.flatten()
array2d_aplanado

array([ 0,  1,  2,  3,  4, 10, 11, 12, 13, 14, 20, 21, 22, 23, 24, 30, 31,
       32, 33, 34, 40, 41, 42, 43, 44])

In [246]:
array2d_aplanado[[1,4,7,9]]

array([ 1,  4, 12, 14])

## Más propiedades de los arreglos NumPy

#### Usando funciones que generan arreglos

En el caso de arreglos más grandes no es práctico inicializar los datos manualmente, usando listas Python explícitas. En su lugar, podemos usar una de las muchas funciones en `numpy` que generan arreglos de diferentes formas. Algunas de los más comunes son:

#### np.arange

In [247]:
# Se crea un arreglo con valores en un rango
x = np.arange(0, 10, 1) # argumentos: desde, hasta (no se incluye!), paso
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
#np.arange?

In [248]:
x = np.arange(-1,1,0.1)
x

array([-1.00000000e+00, -9.00000000e-01, -8.00000000e-01, -7.00000000e-01,
       -6.00000000e-01, -5.00000000e-01, -4.00000000e-01, -3.00000000e-01,
       -2.00000000e-01, -1.00000000e-01, -2.22044605e-16,  1.00000000e-01,
        2.00000000e-01,  3.00000000e-01,  4.00000000e-01,  5.00000000e-01,
        6.00000000e-01,  7.00000000e-01,  8.00000000e-01,  9.00000000e-01])

#### np.linspace y np.logspace

In [249]:
# Usando np.linspace, ambos elementos de los extremos SON incluidos. Formato: (desde, hasta, número de elementos)
x = np.linspace(0, 10, 11) 
x

array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

In [250]:
# np.logspace también incluye el punto final. Por defecto base=10
x = np.logspace(0, 10, 11, base=np.e) 
#produce np.e elevado a cada valor en np.linspace(0, 10, 11), e.d. np.arra([np.e**0, np.e**1, ..., np.e**10])
x

array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03, 2.20264658e+04])

#### np.mgrid

In [251]:
x, y = np.mgrid[0:5, 0:5] #similar a meshgrid en MATLAB

In [252]:
x

array([[0, 0, 0, 0, 0],
       [1, 1, 1, 1, 1],
       [2, 2, 2, 2, 2],
       [3, 3, 3, 3, 3],
       [4, 4, 4, 4, 4]])

In [253]:
y

array([[0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4]])

In [None]:
#np.mgrid?

#### Datos aleatorios

In [None]:
#np.random?

In [254]:
# números aleatorios con distribución de probabilidad uniforme en [0,1]
x = np.random.rand(10)
x

array([0.90667144, 0.30570824, 0.0586999 , 0.94519259, 0.81778898,
       0.01166435, 0.84566021, 0.44894786, 0.37854799, 0.45207711])

In [255]:
# números aleatorios con distribución normal (gaussiana de media 0 y varianza 1).
x = np.random.randn(3,4)
x

array([[-1.90892209, -2.13923175,  0.40155054, -0.54988415],
       [ 0.24131312,  0.86246792, -0.6873267 ,  0.06490331],
       [ 0.92720401, -0.34020852, -0.45130125,  1.5395802 ]])

#### np.diag

In [256]:
# una matriz diagonal
m = np.diag([1,2,3])
m

array([[1, 0, 0],
       [0, 2, 0],
       [0, 0, 3]])

In [None]:
#np.diag?

In [257]:
# diagonal desplazada desde la diagonal principal
m = np.diag([1, 2, 3], k=1) 
m

array([[0, 1, 0, 0],
       [0, 0, 2, 0],
       [0, 0, 0, 3],
       [0, 0, 0, 0]])

In [258]:
# diagonal desplazada desde la diagonal principal
m = np.diag([1, 2, 3], k=-1) 
m

array([[0, 0, 0, 0],
       [1, 0, 0, 0],
       [0, 2, 0, 0],
       [0, 0, 3, 0]])

#### np.zeros, np.ones y np.empty

In [259]:
#Se crea una matriz de forma (4, 5) con todos los elementos nulos 
m = np.zeros((4, 5))
m

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [260]:
#np.zeros?

In [261]:
#Se crea una matriz de forma (4, 3) con todos los elementos iguales a 1
m = np.ones((4, 3))
m

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [262]:
#np.ones?

In [263]:
#Se crea una matriz de forma (4, 5) con todos los elementos vacíos
m = np.empty((4, 5))
m

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [264]:
#np.empty?
# Comprobacion del tiempo de ejecución:

In [265]:
%timeit m = np.zeros((4, 5))

323 ns ± 2.62 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [266]:
%timeit m = np.empty((4, 5))

305 ns ± 1.44 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [267]:
%timeit m = np.ones((4, 5))

1.65 µs ± 21.2 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


## Álgebra matricial
Numpy incorpora funciones para realizar las principales operaciones **algebraicas con vectores y matrices**. La mayoría de los métodos algebráicos se agrupan en el **submódulo linalg**.

### Producto escalar de dos vectores
Para realizar el producto escalar de dos vectores se utiliza el operador **@** o el siguiente método:

* `u.dot(v)`: Devuelve el producto escalar de los vectores u y v.

In [101]:
import numpy as np
a = np.array([1, 2, 3])
b = np.array([1, 0, 1])
print(a @ b)

4


In [102]:
print(a.dot(b))

4


### Módulo de un vector
Para calcular el módulo de un vector se utiliza el siguiente método:

* `norm(v)`: Devuelve el módulo del vector v.

In [103]:
a = np.array([3, 4])
print(np.linalg.norm(a))

5.0


### Producto de dos matrices
Para realizar el producto matricial se utiliza el mismo operador @ y método que para el producto escalar de vectores:

* `a.dot(b)` : Devuelve el producto matricial de las matrices a y b siempre y cuando sus dimensiones sean compatibles.

In [104]:
a = np.array([[1, 2, 3], [4, 5, 6]])
b = np.array([[1, 1], [2, 2], [3, 3]])
print(a @ b)

[[14 14]
 [32 32]]


In [105]:
print(a.dot(b))

[[14 14]
 [32 32]]


### Matriz traspuesta
Para trasponer una matriz se utiliza el método

* `a.T` : Devuelve la matriz traspuesta de la matriz a.

In [106]:
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a.T)

[[1 4]
 [2 5]
 [3 6]]


### Traza de una matriz
La traza de una matriz cuadrada se calcula con el siguiente método:

* `a.trace()` : Devuelve la traza (suma de la diagonal principal) de la matriz cuadrada a.

In [107]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(a)
print(a.trace())

[[1 2 3]
 [4 5 6]
 [7 8 9]]
15


### Determinante de una matriz
El determinante de una matriz cuadrada se calcula con la siguiente función:

* `det(a)` : Devuelve el determinante de la matriz cuadrada a.

In [108]:
a = np.array([[1, 2], [3, 4]])
print(np.linalg.det(a))

-2.0000000000000004


### Matriz inversa
La inversa de una matriz se calcula con la siguiente función:

* `inv(a)` : Devuelve la matriz inversa de la matriz cuadrada a.

In [109]:
a = np.array([[1, 2], [3, 4]])
print(np.linalg.inv(a))

[[-2.   1. ]
 [ 1.5 -0.5]]


### Autovalores de una matriz
Los autovalores de una matriz cuadrada se calculan con la siguiente función:

* `eigvals(a)` : Devuelve los autovalores de la matriz cuadrada a.

In [111]:
a = np.array([[1, 1, 0], [1, 2, 1], [0, 1, 1]])
print(np.linalg.eigvals(a))

[ 3.00000000e+00  1.00000000e+00 -3.36770206e-17]


### Autovectores de una matriz
Los autovectores de una matriz cuadrada se calculan con la siguiente función:

* `eig(a)` : Devuelve los autovalores y los autovectores asociados de la matriz cuadrada a.

In [112]:
a = np.array([[1, 1, 0], [1, 2, 1], [0, 1, 1]])
print(np.linalg.eig(a))

(array([ 3.00000000e+00,  1.00000000e+00, -3.36770206e-17]), array([[-4.08248290e-01,  7.07106781e-01,  5.77350269e-01],
       [-8.16496581e-01,  2.61239546e-16, -5.77350269e-01],
       [-4.08248290e-01, -7.07106781e-01,  5.77350269e-01]]))


### Solución de un sistema de ecuaciones
Para resolver un sistema de ecuaciones lineales se utiliza la función siguiente:

* `solve(a, b)` : Devuelve la solución del sistema de ecuaciones lineales con los **coeficientes de la matriz** **a** y los **términos independientes** de la **matriz b**.

In [113]:
# Sistema de dos ecuaciones y dos incógnitas
# x + 2y = 1
# 3x + 5y = 2 
# Representaion del sistema de ecuaciones:

a = np.array([[1, 2], [3, 5]])
b = np.array([1, 2])

print(np.linalg.solve(a, b))

[-1.  1.]


## Entrada/Salida desde/hasta archivos


### Valores separados por coma (Comma-separated values, CSV)

Un formato muy común para archivos de datos es el de valores separados por comas, o formatos relacionados, como por ejemplo TSV (tab-separated values, valores separados por tabs). Para leer datos desde tales archivos a un arreglo `NumPy` podemos usar la función `numpy.genfromtxt`. Por ejemplo, 

In [None]:
# Solo en linux
!head '../data/stockholm_td_adj.dat' # despliega las primeras líneas del archivo stockholm_td_adj.dat.
#Se puede hacer lo mismo con la terminal

In [115]:
path_data = '../data/stockholm_td_adj.dat'
path_data

'../data/stockholm_td_adj.dat'

#### np.genfromtxt

In [117]:
data = np.genfromtxt(path_data)  # asigna los datos del archivo al arreglo data
data

array([[ 1.800e+03,  1.000e+00,  1.000e+00, ..., -6.100e+00, -6.100e+00,
         1.000e+00],
       [ 1.800e+03,  1.000e+00,  2.000e+00, ..., -1.540e+01, -1.540e+01,
         1.000e+00],
       [ 1.800e+03,  1.000e+00,  3.000e+00, ..., -1.500e+01, -1.500e+01,
         1.000e+00],
       ...,
       [ 2.011e+03,  1.200e+01,  2.900e+01, ...,  4.200e+00,  4.200e+00,
         1.000e+00],
       [ 2.011e+03,  1.200e+01,  3.000e+01, ..., -1.000e-01, -1.000e-01,
         1.000e+00],
       [ 2.011e+03,  1.200e+01,  3.100e+01, ..., -3.300e+00, -3.300e+00,
         1.000e+00]])

In [118]:
data[:,0] #año

array([1800., 1800., 1800., ..., 2011., 2011., 2011.])

In [119]:
data[:,1] #mes

array([ 1.,  1.,  1., ..., 12., 12., 12.])

In [120]:
data[:,2] #día

array([ 1.,  2.,  3., ..., 29., 30., 31.])

In [268]:
fig, ax = plt.subplots(figsize=(14,4))
ax.plot(data[:,0]+data[:,1]/12.0+data[:,2]/365, data[:,3])
#ax.plot(data[:,0]+data[:,1]/12.0+data[:,2]/365, data[:,4])
#ax.plot(data[:,0]+data[:,1]/12.0+data[:,2]/365, data[:,5])
ax.axis('tight')
ax.set_title('Temperaturas en Estocolmo')
ax.set_xlabel(u'Año')
ax.set_ylabel(u'Temperatura (°C)');

<IPython.core.display.Javascript object>

### np.savetxt

Generamos una matriz con valores aleatorios.

In [269]:
array2d = np.random.rand(4,3)
array2d

array([[0.34130459, 0.94453734, 0.01477356],
       [0.56113922, 0.59834164, 0.55510243],
       [0.15229841, 0.12094968, 0.83434458],
       [0.03237555, 0.1429294 , 0.04068295]])

In [270]:
np.savetxt("../data/array2d_random00.txt", array2d)

In [None]:
#np.savetxt?

In [271]:
np.savetxt(fname="../data/array2d_random01.txt", X=array2d)

In [None]:
!head "../data/array2d_random00.txt"

In [None]:
!head "../data/array2d_random01.txt"

#### Cabecera de archivo

In [272]:
np.savetxt("../data/array2d_random_with_header.txt", array2d, header ='Cabecera :D')

In [273]:
!head "../data/array2d_random_with_header.txt"

"head" no se reconoce como un comando interno o externo,
programa o archivo por lotes ejecutable.


#### Pie de página de archivo

In [274]:
np.savetxt("../data/array2d_random_with_footer.txt", array2d, footer ='Pie de página :D')

In [None]:
!head "../data/array2d_random_with_footer.txt"

#### Delimitadores

In [None]:
np.savetxt("../data/array2d_random_with_delimiter_comma.cvs", array2d, delimiter =',')

In [None]:
!head "../data/array2d_random_with_delimiter_comma.cvs"

In [None]:
np.savetxt("../data/array2d_random_with_delimiter_pointcomma.txt", array2d, delimiter =';')

In [None]:
!head "../data/array2d_random_with_delimiter_pointcomma.txt"

#### Formateo de datos

In [None]:
np.savetxt("../data/array2d_random_with_fmt_2.2float.txt", array2d, fmt ='%2.2f')

In [None]:
!head "../data/array2d_random_with_fmt_2.2float.txt"

In [None]:
np.savetxt("../data/array2d_random_with_fmt_3.5float.txt", array2d, fmt ='%3.5f')

In [None]:
!head "../data/array2d_random_with_fmt_3.5float.txt"

In [None]:
np.savetxt("../data/array2d_random_with_fmt_int.txt", array2d, fmt ='%d')

In [None]:
!head "../data/array2d_random_with_fmt_int.txt"

Para mayor info sobre los formateadores de strings puede consultar [aquí](https://pyformat.info).

In [None]:
np.savetxt("../data/array3d.txt", array3d)

### El formato de archivo nativo de Numpy

Es útil cuando se almacenan arreglos de datos y luego se leen nuevamente con numpy. Use las funciones `numpy.save` y `numpy.load`:

In [None]:
np.save("../data/array2d_random.npy", array2d)

In [None]:
#!file "./data/array2d_random.npy"

In [None]:
np.load("../data/array2d_random.npy")

In [None]:
np.save("../data/array3d.npy", array3d)

In [None]:
np.load("../data/array3d.npy")

In [None]:
!ls -l "../data/array2d_random"*

Para mayor info sobre la conveniencia del uso de este formato de archivos puede consultar [aquí](https://towardsdatascience.com/why-you-should-start-using-npy-file-more-often-df2a13cc0161).

## Vectorizando funciones

Como se ha mencionado en varias ocasiones, para obtener un buen rendimiento deberíamos tratar de evitar realizar bucles sobre los elementos de nuestros vectores y matrices, y en su lugar usar algoritmos vectorizados. El primer paso para convertir un algoritmo escalar a uno vectorizado es asegurarnos de que las funciones que escribamos funcionen con argumentos vectoriales.

In [275]:
def Theta(x):
    """
    Implementación escalar de la función escalón de Heaviside.
    """
    if x >= 0:
        return 1
    else:
        return 0

In [276]:
Theta(-3),Theta(0),Theta(6)

(0, 1, 1)

In [277]:
x = np.array([-3,-2,-1,0,1,2,3])

In [280]:
Theta(x)

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

Ok, eso no funcionó porque no definimos la función `Theta` de modo que pueda manejar argumentos vectoriales. Para obtener una *versión vectorizada* de Theta podemos usar la función `np.vectorize`. En muchos casos, puede vectorizar automáticamente una función:

In [281]:
Theta_vec = np.vectorize(Theta)

In [282]:
Theta_vec(x)

array([0, 0, 0, 1, 1, 1, 1])

Podemos también implementar la función de modo que desde el comienzo acepte un argumento vectorial (esto requiere más esfuerzo, para mejorar el rendimiento):

In [283]:
def Theta2(x):
    """
    Implementación preparada para vectores de la función escalón de Heaviside.
    """
    return 1 * (x >= 0)

In [284]:
Theta2(-3),Theta2(0),Theta2(6)

(0, 1, 1)

In [285]:
Theta2(x)

array([0, 0, 0, 1, 1, 1, 1])

## Copy y "deep copy"

Para alcanzar un alto desempeño, las asignaciones en Python usualmente no copian los objetos involucrados. Esto es importante cuando se pasan objetos a funciones, para así evitar uso excesivo de memoria copiando cuando no es necesario (término técnico: paso por referencia)

In [286]:
array2d_original = np.array([[1, 2], [3, 4]])
array2d_original

array([[1, 2],
       [3, 4]])

In [287]:
# ahora array2d_original apunta al mismo arreglo que array2d_original
array2d_copiado = array2d_original 

In [288]:
# Posicion Memoria del Id del objeto
id(array2d_original),id(array2d_copiado)

(171242160, 171242160)

In [289]:
# cambiar array2d_copiado afecta a array2d_original
array2d_copiado[0,0] = 10

In [290]:
array2d_copiado

array([[10,  2],
       [ 3,  4]])

In [291]:
array2d_original

array([[10,  2],
       [ 3,  4]])

Si queremos evitar este comportamiento, para así obtener un nuevo objecto `array2d_copiado` copiado desde `array2d_original`, pero totalmente independiente de `array2d_original`, necesitamos realizar una "copia profunda" ("deep copy") usando la función `copy`:

In [292]:
array2d_copiado2 = np.copy(array2d_original)

In [293]:
id(array2d_original),id(array2d_copiado2)

(171242160, 171363744)

In [294]:
# cambiar array2d_copiado2 no afecta a array2d_original
array2d_copiado2[0,0] = -5

In [295]:
array2d_copiado2

array([[-5,  2],
       [ 3,  4]])

In [296]:
array2d_original

array([[10,  2],
       [ 3,  4]])

## Usando arreglos en sentencias condicionales

Cuando se usan arreglos en sentencias condicionales, por ejemplo en sentencias `if` y otras expresiones booleanas, necesitamos usar `np.any` o bien `np.all`, que requiere que todos los elementos de un arreglo se evalúen con `True`:

In [297]:
array2d = np.array([[1,4], [9,16]])

In [298]:
if np.any(array2d > 5): # equivalente a (array2d > 5).any():
    print("Al menos un elemento del arreglo es mayor que 5")
else:
    print("Ningún elemento del arreglo es mayor que 5")

Al menos un elemento del arreglo es mayor que 5


In [299]:
if np.all(array2d > 5): # equivalente a (array2d > 5).all():
    print("Todos los elementos del arreglo son mayores que 5")
else:
    print("No todos los elementos del arreglo son mayores que 5")

No todos los elementos del arreglo son mayores que 5


**Nota Autor Notebook Original:**
> Versión original en inglés de [J.R. Johansson](http://jrjohansson.github.io/) (robert@riken.jp).
Traducido/Adaptado por [G.F. Rubilar](http://google.com/+GuillermoRubilar).
La última versión de estos [Notebooks](http://ipython.org/notebook.html) está disponible en [https://github.com/PythonUdeC/CPC19](https://github.com/PythonUdeC/CPC19).
La última versión del original (en inglés) está disponible en [http://github.com/jrjohansson/scientific-python-lectures](http://github.com/jrjohansson/scientific-python-lectures).
Los otros notebooks de esta serie están listados en [http://jrjohansson.github.com](http://jrjohansson.github.com).

## Lectura adicional

* [Numpy](http://numpy.scipy.org)
* http://scipy.org/Tentative_NumPy_Tutorial
* http://scipy.org/NumPy_for_Matlab_Users - Una guía de Numpy para usuario de MATLAB.

## Fin de la sección **"02-NumPy"**:
--------------------------
* **Validado por el Alumno:** 
* **Fecha:**