# Numpy

Numpy es un paquete que provee capacidades de cómputo cientifico para Python. Los componentes principales de Numpy son:

* Un objeto para representar arreglos N-dimensionales.
* Funcionalidades de _broadcasting_.
* Herramientas para integrar código C/C++ y Fortran.
* Funciones de algebra lineal, transformadas de Fourier y creación de números aleatorios.


Puedes importar Numpy en tus programas de Python de la siguiente manera:

In [1]:
#el alias comun de numpy es np
import numpy as np

A diferencia de los objetos de Python para almacenar secuencias, Numpy utiliza _vectorización_ (está optimizado para ser eficiente y utilizar la arquitectura de los procesadores modernos). Además el código generado usando Numpy es más limpio, ya que se aproxima a utilizar un lenguaje matemático.

# Numpy arrays (Arreglos)

Los Numpy ndarrays o arreglos múlti-dimensionales son el principal objeto para el cómputo cientifico. Un arreglo multi-dimensional es una "tabla" (normalmente de números) que almacena datos del mismo tipo. Los arreglos de Numpy están indexados por tuplas de enteros no negativos. Las dimensiones de los arreglos son conocidos como _axes_ o axis.


---

Para ejemplificar, utilicemos el siguiente arreglo que representa un punto en un espacio 3D $(x, y, z)$:

[1, 2, 1] 

Este arreglo tiene un solo axis y una longitud de 3, ya que contiene tres elementos.


---


Un segundo ejemplo, usemos el siguiente arreglo que representa a una matriz:


[[1, 0, 0],

[0, 1, 2]]


Este es un arreglo con dos axis, el primer axis con logitud 2 y el segundo axis con longitud 3 (dos filas y tres columnas).


In [2]:
#creando un arreglo con una funcion de numpy
a = np.arange(15)
print(a)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]


## Atributos principales de arreglos

* [```ndarray.shape```](https://numpy.org/doc/1.17/reference/generated/numpy.ndarray.shape.html#numpy.ndarray.shape) La longitud de las dimensiones del arreglo representadas como una tupla de enteros. Cada elemento de la tupla es el entero que representa el tamaño del arreglo en el respectivo axis. Para una matriz con $n$ filas y $m$ columnas, el atributo shape retornará la tupla $(n, m)$, dos dimensiones con $n$ y $m$ elementos respectivamente.

* [```ndarray.ndim```](https://numpy.org/doc/1.17/reference/generated/numpy.ndarray.ndim.html#numpy.ndarray.ndim) El número de axis (o dimensiones) en el arreglo.

* [```ndarray.size```](https://numpy.org/doc/1.17/reference/generated/numpy.ndarray.size.html#numpy.ndarray.size)
    El número total de elementos en el arreglo.
    
* [```ndarray.dtype```](https://numpy.org/doc/1.17/reference/generated/numpy.ndarray.dtype.html#numpy.ndarray.dtype)
    Un objeto que representa el tipo de datos usado en el arreglo.
    
* [```ndarray.itemsize```](https://numpy.org/doc/1.17/reference/generated/numpy.ndarray.itemsize.html#numpy.ndarray.itemsize) El número de bytes que utiliza cada elemento en el arreglo.

In [3]:
#creando un arreglo con una funcion de numpy y cambiando su "forma"
a = np.arange(15).reshape(3, 5)

#Esto crea una matriz de 3 filas y 5 columnas
print("ndarray a:")
print(a)

#El tipo de dato de a es un arreglo de numpy
print("type(a)", type(a))

#tupla de la longitud de las dimensiones
print("a.shape", a.shape)

#numero de dimensiones en el arreglo
print("a.ndim", a.ndim)

#numero de elementos en el arreglo
print("a.size", a.size)

#tipo de dato de los elementos del arreglo
print("a.dtype", a.dtype)

#numero de bytes del tipo de dato del arreglo
print("a.itemsize", a.itemsize)

ndarray a:
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
type(a) <class 'numpy.ndarray'>
a.shape (3, 5)
a.ndim 2
a.size 15
a.dtype int32
a.itemsize 4


## Creación de arreglos desde estructuras de Python

Las estructura de Python (ej, listas y tuplas) que contienen elementos numéricos estructurados como un arreglo pueden ser transformadas a arreglos de Numpy mediante la función ```array()```.

In [4]:
#una lista tradicional de python
numbers_list = [1, 2, 3, 4]
print(numbers_list)
print(type(numbers_list))

#Transformando la lista a un array de numpy
x = np.array(numbers_list)
print(x)
print(type(x))

[1, 2, 3, 4]
<class 'list'>
[1 2 3 4]
<class 'numpy.ndarray'>


In [5]:
#una tupla tradicional de python
numbers_tuple = (1, 2, 3, 4)
print(numbers_tuple)
print(type(numbers_tuple))

#Transformando la tupla a un array de numpy
x = np.array(numbers_tuple)
print(x)
print(type(x))

(1, 2, 3, 4)
<class 'tuple'>
[1 2 3 4]
<class 'numpy.ndarray'>


In [6]:
#una lista de listas de python
numbers_list_list = [[1, 2, 3, 4], [5, 6, 7, 8]]
print(numbers_list_list)
print(type(numbers_list_list))

#Transformando la lista a un array de numpy
x = np.array(numbers_list_list)
print(x)
print(type(x))

[[1, 2, 3, 4], [5, 6, 7, 8]]
<class 'list'>
[[1 2 3 4]
 [5 6 7 8]]
<class 'numpy.ndarray'>


## Creación de arreglos con funciones de Numpy

Numpy provee algunas funciones para crear arreglos comunmente utilizados:

* [```empty(shape)```](https://numpy.org/doc/1.17/reference/generated/numpy.empty.html#numpy.empty) Retorna un arreglo vacio, (sin elementos) con el shape (tupla de enteros) recibido.

* [```empty_like(a)```](https://numpy.org/doc/1.17/reference/generated/numpy.empty_like.html#numpy.empty_like) Retorna un arreglo sin elementos inicializados con el mismo shape y type del arreglo recibido.

* [```eye(N)```](https://numpy.org/doc/1.17/reference/generated/numpy.eye.html#numpy.eye) Retorna un arreglo 2D con unos en la diagonal y ceros en las demás entradas (identidad).

* [```identity(n[, dtype])```](https://numpy.org/doc/1.17/reference/generated/numpy.identity.html#numpy.identity) Retorna el arreglo identidad.

* [```ones(shape)```](https://numpy.org/doc/1.17/reference/generated/numpy.ones.html#numpy.ones) Retorna un arreglo con sus elementos inicializados con unos.

* [```ones_like(a)```](https://numpy.org/doc/1.17/reference/generated/numpy.ones_like.html#numpy.ones_like) Retorna un arreglo con sus elementos inicializados con unos con el mismo shape y type del arreglo recibido.

* [```zeros(shape)```](https://numpy.org/doc/1.17/reference/generated/numpy.zeros.html#numpy.zeros) Retorna un arreglo con sus elementos inicializados con ceros.

* [```zeros_like(a[, dtype, order, subok, shape])```](https://numpy.org/doc/1.17/reference/generated/numpy.zeros_like.html#numpy.zeros_like) Retorna un arreglo con sus elementos inicializados con ceros con el mismo shape y type del arreglo recibido.

* [```full(shape, fill_value)```](https://numpy.org/doc/1.17/reference/generated/numpy.full.html#numpy.full) Retorna un arreglo con todos sus elementos inicializados con el valor ```fill_value```.

* [```full_like(a, fill_value)```](https://numpy.org/doc/1.17/reference/generated/numpy.full_like.html#numpy.full_like) Retorna un arreglo con todos sus elementos inicializados con el valor ```fill_value``` y el mismo shape del arreglo recibido.

_shape siempre es una tupla que indica el número de elemento en cada dimensión._

### empty

In [7]:
#empty regresa un arreglo sin inicializar
e = np.empty((3, 3))

#el arreglo puede contener valores "basura"
print(e)

[[0.00000000e+000 0.00000000e+000 0.00000000e+000]
 [0.00000000e+000 0.00000000e+000 7.50979782e-321]
 [1.17518743e+180 5.98189404e-154 4.47593816e-091]]


### empty_like

In [8]:
#un arreglo numpy
a = np.array([[1,2,3],[4,5,6]])

#empty like copia el shape y type de a
e_l = np.empty_like(a)
print(e_l)

[[1124073472 1929379840         14]
 [  10485884   23331196   27328535]]


### eye

Una [matriz identidad](https://es.wikipedia.org/wiki/Matriz_identidad) es una matriz que cumple la propiedad de ser el elemento neutro del producto de matrices. Esto quiere decir que el producto de cualquier matriz por la matriz identidad (donde dicho producto esté definido) no tiene ningún efecto. Una matriz identidad contiene unos en su diagonal.

In [9]:
#matriz identidad 3x3
idtt = np.eye(3)

print(idtt)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


### identity

La función ```identity``` es similar a la función ```eye``` para generar una matriz identidad.





In [10]:
#matriz identidad 3x3
idtt = np.identity(3)
print(idtt)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


### ones

In [11]:
#arreglo con unos
o = np.ones((3, 3))

print(o)

[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]


### ones_like

In [12]:
#un arreglo numpy
a = np.array([[1,2,3],[4,5,6]])

#arreglo con unos
o_l = np.ones_like(a)

print(o_l)

[[1 1 1]
 [1 1 1]]


### zeros

In [13]:
#arreglo con ceros
z = np.zeros((3, 3))

print(z)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


### zeros_like

In [14]:
#un arreglo numpy desde una lista de listas
a = np.array([[1,2,3],[4,5,6]])

#arreglo con ceros
z_l = np.zeros_like(a)
print(z_l)

[[0 0 0]
 [0 0 0]]


### full

In [15]:
#un arreglo 3x3 inicializado con 5 en todos sus elementos
f = np.full((3, 3), 5)

print(f)

[[5 5 5]
 [5 5 5]
 [5 5 5]]


### full_like

In [16]:
#un arreglo numpy
a = np.array([[1,2,3],[4,5,6]])

#un arreglo con la misma dimension que a pero inicializado con valores 5
f_l = np.full_like(a, 5)

print(f_l)

[[5 5 5]
 [5 5 5]]


### arange

In [17]:
#arange 0-9
ar = np.arange(10)

print(ar)

[0 1 2 3 4 5 6 7 8 9]


**Rangos numéricos**

Tambien puedes crear arreglos con rangos numéricos usando las siguientes funciones:

* [```arange([start,] stop)```](https://numpy.org/doc/1.17/reference/generated/numpy.arange.html#numpy.arange) Retorna un arreglo con una sucesión artimética (cada elemento está separado por la misma distancia), similar a la función range de Python.

* [```linspace(start, stop, num)```](https://numpy.org/doc/1.17/reference/generated/numpy.linspace.html#numpy.linspace) Retorna un arreglo con una progresión artimética en el intervalo recibido.

* [```logspace(start, stop, num)```](https://numpy.org/doc/1.17/reference/generated/numpy.logspace.html#numpy.logspace) Retorna números separados igualmente en una escala logaritmica.

* [```geomspace(start, stop, num)```](https://numpy.org/doc/1.17/reference/generated/numpy.geomspace.html#numpy.geomspace) Retorna números en una progresión geométrica.

### linspace

La función linspace retorna una progresión aritmetica de acuerdo a los parémtros de entrada. Una [progresión aritmética](https://es.wikipedia.org/wiki/Progresi%C3%B3n_aritm%C3%A9tica) es una sucesión de números tales que la diferencia de cualquier par de términos sucesivos de la secuencia es constante. En una progresión aritmética, si se toman dos términos consecutivos de cualquiera de esta, la diferencia entre ambos es una constante, denominada diferencia. Esto se puede expresar como una relación de recurrencia de la siguiente manera: 

$d = a_{n+1}-a{n}$

Conociendo el primer término $a_1$ y la diferencia $d$, podemos utilizar la siguiente fórmula para calcular el enésimo término de la progresión:

$a_n = a_1 + (n-1)d$





Una visualización de los arreglos generados por la función linspace:

![linspace](https://docs.scipy.org/doc/numpy/_images/numpy-linspace-1.png)

In [18]:
#Una progresion aritmetica, 6 muestras espacios iguales
ls = np.linspace(1., 4., num = 6)

print(ls)

[1.  1.6 2.2 2.8 3.4 4. ]


### logspace

La función logspace retorna un arreglo con números separados por espacios iguales en una escala logarítmica.

El primer número en el arreglo está definido por el parámetro ```start```:

start    : [float] start(base ** start) of interval range.

El último número en el arreglo está definido por el parámetro ```end```:

stop     : [float] end(base ** stop) of interval range

Logspace es igual al siguiente código:

```
y = np.linspace(start, stop, num=num, endpoint=endpoint)
power(base, y).astype(dtype)
```

Una visualización de los arreglos generados por la función:

![logspace](https://docs.scipy.org/doc/numpy/_images/numpy-logspace-1.png)

In [19]:
#logarithmic space, 5 muestras
log_s = np.logspace(0.1, 1, num = 5)

print(log_s)

[ 1.25892541  2.11348904  3.54813389  5.95662144 10.        ]


### geomspace
Una [progresión geométrica](https://es.wikipedia.org/wiki/Progresi%C3%B3n_geom%C3%A9trica) es una sucesión de números reales en la que el elemento siguiente se obtiene multiplicando el elemento anterior por una constante denominada razón o factor de la progresión. Se puede obtener el valor de un elemento arbitrario de la secuencia mediante la expresión del término general, siendo $a_{n}$, el término en cuestión, $a_{1}$ el primer término y  $r$, la razón:

$a_n = a_1 * r^{n-1}$



In [20]:
#progresion geometrica, 4 muestras
geo_s = np.geomspace(1, 1000, num = 4)

print(geo_s)

[   1.   10.  100. 1000.]


## Creación arreglos desde archivos en disco

Normalmente los arreglos de gran tamaño son creados desde archivos en disco. Numpy provee estas funciones para crear arreglos desde archivos:

* [```loadtxt(fname[, dtype, comments, delimiter, …])```](https://docs.scipy.org/doc/numpy/reference/generated/numpy.loadtxt.html#numpy.loadtxt) Carga datos desde un archivo de texto.
* [```genfromtxt(fname[, dtype, comments, …])```](https://docs.scipy.org/doc/numpy/reference/generated/numpy.genfromtxt.html#numpy.genfromtxt) Carga datos desde un archivo de texto, permite el manejo de datos faltantes.

Un archivo pre-cargado en colab.

In [21]:
!head -n 3 sample_data/mnist_test.csv

head: cannot open 'sample_data/mnist_test.csv' for reading: No such file or directory


In [99]:
#Cargando el archivo a un arreglo de numpy usando coma como delimitador
dataset = np.loadtxt("/content/sample_data/mnist_test.csv", delimiter=",")
print(dataset)

OSError: /content/sample_data/mnist_test.csv not found.

## Creación arreglos aleatorios

El módulo random de Numpy provee capacidades para generar arreglos de números pseudo-aleatorios con las siguientes funciones:

**Aleatorios simples**

* [integers](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.integers.html#numpy.random.Generator.integers)
* [random](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.random.html#numpy.random.Generator.random)
* [choice](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.choice.html#numpy.random.Generator.choice)


**Permutaciones**

* [shuffle](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.shuffle.html#numpy.random.Generator.shuffle)
* [permutation](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.permutation.html#numpy.random.Generator.permutation)


**[Aleatorios de distribuciones](https://numpy.org/doc/stable/reference/random/generator.html#distributions)**

* [normal](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.normal.html#numpy.random.Generator.normal)
* [uniform](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.uniform.html#numpy.random.Generator.uniform)
* [binomial](https://numpy.org/doc/stable/reference/random/generated/numpy.random.Generator.binomial.html#numpy.random.Generator.binomial)


### integers

In [23]:
#generar 10 numeros aleatorios de un rango de 0 a 100
r_ints = np.random.randint(0, 100, size = 10)

print(r_ints)

[76 60 66 85 29  3 21 16 22 53]


### random

In [24]:
#Generar  un arreglo con 10 numeros aleatorios flotantes de 0 a 1
r_floats = np.random.random(size=10)

print(r_floats)

[0.35342499 0.05771568 0.91864347 0.44055669 0.23378783 0.11204584
 0.83772521 0.74287203 0.29177654 0.02642797]


### choice

In [25]:
#un arreglo del 0 a 99
a = np.arange(100)

#10 elementos aleatorios de a
r_choice = np.random.choice(a, size = 10)
print(r_choice)

[97 98 80  3 80 57  8 97 18 14]


### shuffle

In [26]:
#un arreglo del 0 a 99
a = np.arange(100)
print(a)

#mezclar los elementos de a, afecta al arreglo directamente
np.random.shuffle(a)
print(a)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95
 96 97 98 99]
[97 53 91 36 61  6 40 74 66 32 48 18 73 46 86 39 90 93  4  5 50 21 57 27
 81 51 52 49 75 13  1 45 35 15 14 70 63 22 24 16 65 82 80 47 38 31 17 37
  3 20 41 76 55 94 68 58 33 44 59 26 96 67 34  8 64  9 99 72 77 60 92 54
 43 98 25 87 29 88 78 10 89 62  0 79 95  2 42 30 12 71 19 28  7 23 85 56
 83 11 84 69]


### permutation

In [27]:
#un arreglo del 0 a 99
a = np.arange(100)
print(a)

#mezclar los elementos de una copia de a, regresa un nuevo arreglo
r_permu = np.random.permutation(a)
print(r_permu)
print(a)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95
 96 97 98 99]
[92 22 98  3 26 88 61 91  2 47 58 31 45 89 52 50 63 76  1 13 96 20 86 99
 65 19 49 23 39  7 73 97 53 56 94 90 16 80 72 69 78 79 44 59 66 40 54 57
 83 84 62 75 55 41 14 68 24 29 34 33 35  9 25 77 32 60 93 15 70 81 17 18
 36 42 85 74 71 67  4 21  0 10 64 27 12 95 11 38 30 87 46  6  8 82 48 43
 51 28  5 37]
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95
 96 97 98 99]


### normal

Genera un arreglo con numeros aleatorios de una distribución normal parametizada por su media (loc) y desviación estándar (scale), con una función de densidad:

$$
N(x; \mu, \sigma^2) = \dfrac{1}{\sqrt{2\pi \sigma}}\exp({-\dfrac{(x-\mu)^2}{2\sigma^2}})
$$

In [28]:
#generar 10 numeros aleatorios de una distribucion normal con media 0 y desviacion estandar 1
r_normal = np.random.normal(loc = 0, scale = 1, size=10)

print(r_normal)

[-0.27907713 -2.6310533   0.57307378  0.27053302 -0.21794975  1.05067044
 -0.78870643 -0.2260865  -1.16961359  0.71988059]


### uniform
Genera un arreglo con numeros aleatorios de una distribución uniforme en un rango $A$ (low), $B$ (high), con una función de densidad:

$$
U(x; A, B) = \begin{cases}
\dfrac{1}{B-A} & A \leq x \leq B\\
0 & \text{cualquier otro caso.}\\
\end{cases}
$$

In [29]:
#generar 10 numeros aleatorios en el rango 0 10 con la misma probabilidad de ser elegidos (uniforme)
r_uniform = np.random.uniform(low = 0, high = 10, size=10)

print(r_uniform)

[8.96017504 4.90868451 0.62375139 1.82206498 3.57504159 4.69595626
 8.13088129 7.79261987 8.98541553 5.51166202]


### binomial

Genera un arreglo con numeros aleatorios de una distribución binomial, con una función de masa de probabilidad:

$$
B(x; n, p) = \binom{n}{x}p^x (1-p)^{n-x}
$$

$n$ - número de experimentos.


$p$ - probabilidad de experimento exitoso.

In [30]:
#generar 10 numeros aleatorios con distribucion binomial
r_binomial = np.random.binomial(n = 10, p = 0.5, size=10)

print(r_binomial)

[4 4 7 7 3 4 4 3 3 5]


# Indexación de arreglos Numpy

De manera similar a Python, puedes utilizar inidices para seleccionar elementos en los arreglos de numpy, por ejemplo puedes usar la siguiente notación para arreglos 1D:



```
a[n]
```

O las siguientes para arreglos con 2 o más dimensiones:



```
a[n1, n2, ..., nn]
```

O


```
a[n1][n2]...[nn]
```


In [31]:
#1d
a = np.arange(10)

print(a[2])

2


In [32]:
#2d
A = np.arange(9).reshape((3, 3))
print("A:")
print(A)

#dos tipos de indexacion
print("2,1:", A[2, 1])
print("0,2:", A[0][2])

A:
[[0 1 2]
 [3 4 5]
 [6 7 8]]
2,1: 7
0,2: 2


## Slicing

Al igual que objetos de Python, los arreglos en Numpy pueden utilizar slicing para obtener _vistas_ de los elmentos en los arreglos.

In [33]:
#en 1D
a = np.arange(10)

print(a[5:])

[5 6 7 8 9]


In [34]:
#en 2D
A = np.arange(9).reshape((3, 3))
print("A:")
print(A)

#slice de todos los elementos de la columna en el indice 2
print("A[:, 2]:", A[:,2])

A:
[[0 1 2]
 [3 4 5]
 [6 7 8]]
A[:, 2]: [2 5 8]


## Indexación Booleana

También puedes utilizar expresiones booleanas para seleccionar a elementos de arreglos en numpy.

In [35]:
a = np.arange(10)
print(a)

print(a[a>6])

[0 1 2 3 4 5 6 7 8 9]
[7 8 9]


# Constantes

Numpy contiene como atributos a algunas variables matemáticas comunmente utilizadas:

* np.pi
* np.e
* np.Infinity
* np.NINF
* np.NaN

In [36]:
print(np.pi)
print(np.e)

3.141592653589793
2.718281828459045


# Manipulación de arreglos

## Reshape

El método y función ```reshape()``` permite cambiar la "forma" de arreglos. Por ejemplo, para convertir un arreglo 1D a uno 2D. Reshape crea nuevos axis donde apareceran en orden original los elementos del arreglo.

In [37]:
#un arreglo 1d con nueve elementos
a = np.arange(9)
print(a)
print(a.shape)

#cambiar la forma del arreglo a uno con dos dimentiones (una matriz 3x3) con reshape
A = np.copy(a.reshape((3, 3)))
print(A)
print(A.shape)

[0 1 2 3 4 5 6 7 8]
(9,)
[[0 1 2]
 [3 4 5]
 [6 7 8]]
(3, 3)


## Ravel

El método ravel te permite transformar arreglos con más de una dimensión a arreglos "planos" con una sola dimensión.

In [38]:
A = np.array([[1, 2, 3], [4, 5, 6]])
print(A)
print(A.shape)

a = np.copy(A.ravel())
print(a)
print(a.shape)

[[1 2 3]
 [4 5 6]]
(2, 3)
[1 2 3 4 5 6]
(6,)


## Unión de arreglos

Numpy provee las siguientes funciones para concatenar arreglos de diferentes maneras:

* [```concatenate((a1, a2, ...), [axis]```)](https://numpy.org/doc/stable/reference/generated/numpy.concatenate.html#numpy.concatenate) Concatenar los elementos de los arreglos usando el axis determinado.

* [```vstack((a1, a2))```](https://numpy.org/doc/stable/reference/generated/numpy.vstack.html#numpy.vstack) Concatenar verticalmente (por filas) los elementos de los arreglos.
  
* [```hstack((a1, a2))```](https://numpy.org/doc/stable/reference/generated/numpy.hstack.html#numpy.hstack) Concatenar horizontalmente (por columnas) los elementos de los arreglos.

In [39]:
a = np.arange(5)
print(a)
b = np.arange(6, 10)
print(b)

ab = np.concatenate((a, b), axis = 0)
print(ab)

[0 1 2 3 4]
[6 7 8 9]
[0 1 2 3 4 6 7 8 9]


In [40]:
A = np.arange(9).reshape(3, 3)
B = np.arange(9, 18).reshape(3, 3)
print(A)
print(A.shape)
print(B)
print(B.shape)

print()

AB = np.vstack((A, B))
print(AB)
print(AB.shape)

[[0 1 2]
 [3 4 5]
 [6 7 8]]
(3, 3)
[[ 9 10 11]
 [12 13 14]
 [15 16 17]]
(3, 3)

[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]
 [12 13 14]
 [15 16 17]]
(6, 3)


In [41]:
A = np.arange(9).reshape(3, 3)
ones = np.ones(3).reshape(3, 1)
print(A)
print(A.shape)
print(ones)
print(ones.shape)

print()

A = np.hstack((ones, A))
print(A)
print(A.shape)

[[0 1 2]
 [3 4 5]
 [6 7 8]]
(3, 3)
[[1.]
 [1.]
 [1.]]
(3, 1)

[[1. 0. 1. 2.]
 [1. 3. 4. 5.]
 [1. 6. 7. 8.]]
(3, 4)


## Splits

* [```split()```](https://numpy.org/doc/stable/reference/generated/numpy.split.html#numpy.split) Divide un arreglo en múltiples arreglos.

* [```vsplit()```](https://numpy.org/doc/stable/reference/generated/numpy.vsplit.html#numpy.vsplit) Divide un arreglo por filas.

* [```hsplit()```](https://numpy.org/doc/stable/reference/generated/numpy.hsplit.html#numpy.hsplit) Divide un arreglo por columnas.

In [42]:
a = np.arange(10)

#divide en 5 partes iguales
print(np.split(a, 5))

#divide usando indices
print(np.split(a, [3, 6]))

[array([0, 1]), array([2, 3]), array([4, 5]), array([6, 7]), array([8, 9])]
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8, 9])]


In [43]:
A = np.arange(9).reshape(3, 3)
print("A:", A)

print()

#dividir por filas a dos arreglos usando un indice
A1, A2 = np.vsplit(A, [1])
print(A1)
print()
print(A2)

A: [[0 1 2]
 [3 4 5]
 [6 7 8]]

[[0 1 2]]

[[3 4 5]
 [6 7 8]]


In [44]:
A = np.arange(9).reshape(3, 3)
print("A:", A)

print()

#dividir por columnas a dos arreglos usando un indice
A1, A2 = np.hsplit(A, [1])
print(A1)
print()
print(A2)

A: [[0 1 2]
 [3 4 5]
 [6 7 8]]

[[0]
 [3]
 [6]]

[[1 2]
 [4 5]
 [7 8]]


# Salida a archivos

Numpy provee algunas funciones para la persistencia en disco de los arreglos de numpy, en particular, las siguientes funciones están disponibles:

* [```save(file, arr)```](https://numpy.org/doc/stable/reference/generated/numpy.save.html#numpy.save) Guarda el arreglo de Numpy en disco usando el formato binario de Numpy _.npy_.

* [```savetxt(file, arr)```](https://numpy.org/doc/stable/reference/generated/numpy.savetxt.html#numpy.savetxt) Guarda el arreglo de Numpy en disco usando un formato de texto plano.

In [45]:
a = np.arange(20).reshape(5, 4)

#guardar el arreglo en formato binario
np.save("bina", a)

#guardar en formato de texto
np.savetxt("texta", a)

Usemos la línea de comando de linux para ver los archivos almacenados.

In [46]:
!ls

Las_bases_para_usar_Python.ipynb
Modulos_y_Programacion_Orientada_a_Objetos.ipynb
Numpy.ipynb
Pandas.ipynb
Plots.ipynb
__pycache__
bina.npy
exercises
fibo.py
sample_data
texta


Podemos ver directamente el archivo guardado en formato de texto.

In [47]:
!cat texta

0.000000000000000000e+00 1.000000000000000000e+00 2.000000000000000000e+00 3.000000000000000000e+00
4.000000000000000000e+00 5.000000000000000000e+00 6.000000000000000000e+00 7.000000000000000000e+00
8.000000000000000000e+00 9.000000000000000000e+00 1.000000000000000000e+01 1.100000000000000000e+01
1.200000000000000000e+01 1.300000000000000000e+01 1.400000000000000000e+01 1.500000000000000000e+01
1.600000000000000000e+01 1.700000000000000000e+01 1.800000000000000000e+01 1.900000000000000000e+01


# Funciones

## Aritméticas

Numpy permite aplicar [operadores aritméticos](https://numpy.org/doc/stable/reference/routines.math.html#arithmetic-operations) a los arreglos numéricos. Puedes utilizar los siguientes operadores en arreglos múlti-dimensionales:

* [```add(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.add.html#numpy.add) y ```+``` suma los elementos de dos arreglos.
  
* [```subtract(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.subtract.html#numpy.subtract) y ```-```  resta los elementos de dos arreglos.
  
* [```divide(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.subtract.html#numpy.divide) y ```/``` divide los elementos de dos arreglos.
  

* [```multiply(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.multiply.html#numpy.multiply) y ```*``` multiplica los elementos de dos arreglos.
  
* [```power(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.power.html#numpy.power) eleva a la potencia del segundo arreglo los elementos del primero.
  
* [```mod(x1, x2)```](https://numpy.org/doc/stable/reference/generated/numpy.mod.html#numpy.mod) calcula el módulo de un arreglo usando el segundo.


*Nota: Los operadores son aplicados elemento por elemento en los arreglos Numpy, éstos pueden tener múltiples dimensiones. En otra sección verás **broadcasting** para aplicar operaciones en arreglos con dimensiones diferentes.*

### add() y $+$

In [48]:
#puedes sumar dos arreglos elemento por elemento usando la funcion add o +
a = np.arange(5)
print("a", a)

b = np.arange(6, 11)
print("b", b)

print("add(a, b)")
print(np.add(a, b))

#usando + directamente
print("a + b")
print(a + b)

a [0 1 2 3 4]
b [ 6  7  8  9 10]
add(a, b)
[ 6  8 10 12 14]
a + b
[ 6  8 10 12 14]


In [49]:
#las funciones tambien funcionan en arrelgos multidimensionales
a = np.ones((3, 3))
print("a", a)

b = np.full((3, 3), 6)
print("b", b)

print("add(a, b)")
print(np.add(a, b))

#usando + directamente
print("a + b")
print(a + b)

a [[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
b [[6 6 6]
 [6 6 6]
 [6 6 6]]
add(a, b)
[[7. 7. 7.]
 [7. 7. 7.]
 [7. 7. 7.]]
a + b
[[7. 7. 7.]
 [7. 7. 7.]
 [7. 7. 7.]]


### subtract() y $-$

In [50]:
#puedes restar dos arreglos elemento por elemento usando la funcion subtract o -
a = np.arange(5)
print("a", a)

b = np.ones(5)
print("b", b)

print("subtract(a, b)")
print(np.subtract(a, b))

#usando - directamente
print("a - b")
print(a - b)

a [0 1 2 3 4]
b [1. 1. 1. 1. 1.]
subtract(a, b)
[-1.  0.  1.  2.  3.]
a - b
[-1.  0.  1.  2.  3.]


### divide() y $/$

In [51]:
#puedes dividir dos arreglos elemento por elemento usando /
a = np.arange(10)
print("a", a)

b = np.full(10, 2)
print("b", b)


#dividir a / b
print("a / b")
print(a / b)

a [0 1 2 3 4 5 6 7 8 9]
b [2 2 2 2 2 2 2 2 2 2]
a / b
[0.  0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5]


### multiply y $*$

In [52]:
#puedes multuplicar dos arreglos elemento por elemento usando *
a = np.arange(10)
print("a", a)

b = np.full(10, 3)
print("b", b)


#dividir a * b
print("a * b")
print(a * b)

a [0 1 2 3 4 5 6 7 8 9]
b [3 3 3 3 3 3 3 3 3 3]
a * b
[ 0  3  6  9 12 15 18 21 24 27]


### power()

In [53]:
#puedes elevar los elementos de un arreglo a la potencia de los elementos de otro usando power
a = np.full(10, 2)
print("a", a)

b = np.arange(10)
print("b", b)


#dividir np.power(a, b)
print("np.power(a, b)")
print(np.power(a, b))

a [2 2 2 2 2 2 2 2 2 2]
b [0 1 2 3 4 5 6 7 8 9]
np.power(a, b)
[  1   2   4   8  16  32  64 128 256 512]


### mod()

## Comparación

Puedes utilizar los operadores de comparación en arreglos de Numpy:

* $==$
* $<$
* $<=$
* $>$
* $>=$

In [54]:
a = np.array([1, 2, 3, 4, 5])
b = np.array([5, 4, 3, 2, 1])
print("a:", a)
print("b:", b)

print()

print("a == b", a == b)
print("a > b", a > b)
print("a >= b", a >= b)
print("a < b", a < b)
print("a <= b", a <= b)

a: [1 2 3 4 5]
b: [5 4 3 2 1]

a == b [False False  True False False]
a > b [False False False  True  True]
a >= b [False False  True  True  True]
a < b [ True  True False False False]
a <= b [ True  True  True False False]


In [55]:
#puedes aplicar la operacion modulo a los elementos de un arreglo con los de otro
a = np.arange(3, 10)
print("a", a)

b = np.full_like(a, 3)
print("b", b)


#dividir np.mod(a, b)
print("np.mod(a, b)")
print(np.mod(a, b))

a [3 4 5 6 7 8 9]
b [3 3 3 3 3 3 3]
np.mod(a, b)
[0 1 2 0 1 2 0]


## Trigonométricas

Numpy provee [funciones trigonométricas](https://numpy.org/doc/stable/reference/routines.math.html#trigonometric-functions) que puedes aplicar a los elementos de los arreglos. Algunas de las más comúnes:


* [```sin(x)```](https://numpy.org/doc/stable/reference/generated/numpy.sin.html#numpy.sin) función seno aplicada elemento por elemento.

* [```cos(x)```](https://numpy.org/doc/stable/reference/generated/numpy.cos.html#numpy.cos) función coseno aplicada elemento por elemento.

* [```tan(x)```](https://numpy.org/doc/stable/reference/generated/numpy.tan.html#numpy.tan) función tangente aplicada elemento por elemento.

### sin()

In [56]:
a = np.arange(0, 10) * np.pi/2
print("a", a)

print("sin(a)")
print(np.sin(a))

a [ 0.          1.57079633  3.14159265  4.71238898  6.28318531  7.85398163
  9.42477796 10.99557429 12.56637061 14.13716694]
sin(a)
[ 0.0000000e+00  1.0000000e+00  1.2246468e-16 -1.0000000e+00
 -2.4492936e-16  1.0000000e+00  3.6739404e-16 -1.0000000e+00
 -4.8985872e-16  1.0000000e+00]


### cos()

In [57]:
a = np.arange(0, 10) * np.pi
print("a", a)

print("cos(a)")
print(np.cos(a))

a [ 0.          3.14159265  6.28318531  9.42477796 12.56637061 15.70796327
 18.84955592 21.99114858 25.13274123 28.27433388]
cos(a)
[ 1. -1.  1. -1.  1. -1.  1. -1.  1. -1.]


### tan()

In [58]:
a = np.arange(0, 10)
print("a", a)

print("tan(a)")
print(np.tan(a))

a [0 1 2 3 4 5 6 7 8 9]
tan(a)
[ 0.          1.55740772 -2.18503986 -0.14254654  1.15782128 -3.38051501
 -0.29100619  0.87144798 -6.79971146 -0.45231566]


## Estadísticas

Algunas de las [funciones estadísticas](https://numpy.org/doc/stable/reference/routines.statistics.html#statistics) que puedes utilizar con arreglos de Numpy:

* [```amin(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.amin.html#numpy.amin) encuentra el elemento mínimo en un arreglo.
  
* [```amax(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.amax.html#numpy.amax) encuentra el elemento máximo en un arreglo.
  
* [```mean(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.mean.html#numpy.mean) calcula la media del arreglo.
  
* [```median(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.median.html#numpy.median) encuentra la mediana del arreglo.


* [```std(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.std.html#numpy.std) calcula la desviación estándar del arreglo.

* [```var(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.var.html#numpy.var) calcula la varianza del arreglo.

La siguiente imágen muestra el sentido de la operación al especificar ```axis```:

![Numpy axes](https://raw.githubusercontent.com/jhermosillo/DIPLOMADO_CDP/main/01%20Programaci%C3%B3n%20en%20Python/images/axes.png)

Puedes especificar el axis en el que quieres calcular la función si tienes arreglos con más de una dimensión. Por defecto, si no se especifica el axis, entonces el cálculo de las funciones estadísticas se hace para todos los elementos del arreglo, como si fuera un arreglo 1D.

### amin()

In [59]:
a =  np.arange(10)
print(a)

print("np.amin(a)", np.amin(a))

[0 1 2 3 4 5 6 7 8 9]
np.amin(a) 0


In [60]:
#funciones especificando axis para una matriz
a =  np.arange(10).reshape(2, 5)
print(a)
print(a.shape)

#axis = 0, calcula el minimo de cada columna
print("np.amin(a, axis = 0)", np.amin(a, axis = 0))

#axis = 1, calcula el minimo de cada fila
print("np.amin(a, axis = 1)", np.amin(a, axis = 1))

#si no especificas axis entonces regresa el elemento minimo de todo el arreglo 2d
print("np.amin(a)", np.amin(a))

[[0 1 2 3 4]
 [5 6 7 8 9]]
(2, 5)
np.amin(a, axis = 0) [0 1 2 3 4]
np.amin(a, axis = 1) [0 5]
np.amin(a) 0


### amax()

In [61]:
a =  np.arange(10)

print(np.amax(a))

9


### mean()

La media aritmética de un arreglo.

Sin especificar axis:
$$
	np.mean(x) = \dfrac{np.sum(x)}{n}
$$

axis = 0, la media de todas las filas (fila promedio):

$$
	np.mean(X, axis = 0) = \dfrac{np.sum(X[:, j])}{n}
$$

axis = 1, la media de todas las columnas (columna promedio):

$$
	np.mean(X, axis = 1) = \dfrac{np.sum(X[i, :])}{n}
$$

In [62]:
#sin especificar axis (la media de todo el arreglo)
a =  np.random.normal(0, 1, 100)

print(np.mean(a))

-0.009612558031796652


In [63]:
#2d, axis = 0
A = np.array([[1, 2], [3, 4]])

# fila promedio
print(np.mean(A, axis=0))

[2. 3.]


In [64]:
#2d, axis = 1
A = np.array([[1, 2], [3, 4]])

# columna promedio
np.mean(A, axis=1)

array([1.5, 3.5])

### median()

Sin especificar axis, la mediana de todo el arreglo:

$$
	\begin{matrix}
	np.median(x) = x[(n+1)/2] \quad \text{ si $n$ impar}, \qquad & \dfrac{(x[(n+1)/2] + x[n/2])}{2} \quad \text{si $n$ par}
	\end{matrix}
	$$

axis = 0:

$$
np.median(X[:, j])
$$

axis = 1:

$$
np.median(X[i, :])
$$

In [65]:
a =  np.random.normal(0, 1, 100)

print(np.median(a))

0.051598573686196095


In [66]:
#2d, axis = 0
A = np.array([[1, 2], [3, 4], [5, 6]])

print(np.median(A, axis=0))

[3. 4.]


In [67]:
#2d, axis = 1
A = np.array([[1, 2, 3], [4, 5, 6]])

np.median(A, axis=1)

array([2., 5.])

### std()

Sin especificar axis, la desviación estándar de todo el arreglo:
$$
	np.std(A) = \sqrt{\frac{np.sum(np.pow(x - np.mean(x), 2))}{n}}
$$

axis = 0:

$$
	np.std(X, axis = 0) = \sqrt{\frac{np.sum(np.pow(X[i, :] - np.mean(X[i, :]), 2))}{X.shape[0]}}
$$

axis = 1:

$$
	np.std(X, axis = 1) = \sqrt{\frac{np.sum(np.pow(X[:, j] - np.mean(X[:, j]), 2))}{X.shape[1]}}
$$

In [68]:
a =  np.random.normal(0, 1, 100)

print(np.std(a))

0.9590616335780738


In [69]:
#2d, axis = 0
A = np.array([[1, 2], [3, 4]])

print(np.std(A, axis=0))

[1. 1.]


In [70]:
#2d, axis = 1
A = np.array([[1, 2], [3, 4]])

np.std(A, axis=1)

array([0.5, 0.5])

### var()

Sin especificar axis, la varianza de todo el arreglo:
$$
	np.var(x) = \frac{np.sum(np.pow(x - np.mean(x), 2))}{n}
$$

axis = 0:

$$
	np.var(X, axis = 0) = \frac{np.sum(np.pow(X[i, :] - np.mean(X[i, :]), 2))}{X.shape[0]}
$$

axis = 1:

$$
	np.var(X, axis = 1) = \frac{np.sum(np.pow(X[:, j] - np.mean(X[:, j]), 2))}{X.shape[1]}
$$

In [71]:
a =  np.random.normal(0, 1, 100)

print(np.var(a))

1.1667150854858193


In [72]:
#2d, axis = 0
A = np.array([[1, 2], [3, 4]])

print(np.var(A, axis=0))

[1. 1.]


In [73]:
#2d, axis = 1
A = np.array([[1, 2], [3, 4]])

np.var(A, axis=1)

array([0.25, 0.25])

## Álgebra lineal

Algunas de las [funciones de álgebra lineal](https://numpy.org/doc/stable/reference/routines.linalg.html#linear-algebra-numpy-linalg) que puedes utilizar en arreglos de Numpy:

* [```dot(a, b)```](https://numpy.org/doc/stable/reference/generated/numpy.dot.html#numpy.dot) genera el producto punto de dos arreglos, el tipo de operación (multiplicación de matrices o producto punto) depende de la entrada (2D o 1D).
  
* [```vdot(a, b)```](https://numpy.org/doc/stable/reference/generated/numpy.vdot.html#numpy.vdot) genera el producto punto de dos vectores (1D). _vdot() permite computar vectores con números complejos._

* [```matmul(x1, x2) o @```](https://numpy.org/doc/stable/reference/generated/numpy.matmul.html#numpy.matmul) para la multiplicación de matrices (generalmente 2D).

* [```inner(a, b)```](https://numpy.org/doc/stable/reference/generated/numpy.inner.html#numpy.inner) genera el producto interno o producto escalar de dos arreglos.
  
* [```outer(a, b)```](https://numpy.org/doc/stable/reference/generated/numpy.outer.html#numpy.outer) genera el producto externo (tensorial) de dos arreglos.

* [```trace(a)```](https://numpy.org/doc/stable/reference/generated/numpy.trace.html#numpy.trace) genera la traza (suma de los elementos en la diagnonal) del arreglo.

### dot()

Para dos vectores (1D), es el producto punto:
$$u = [u_1, \dots, u_n]$$
$$v = [v_1, \dots, v_n]$$
$$
	np.dot(u, v) = u_1 v_1 + u_2 v_2 + \dots + u_n v_n
$$

In [74]:
#cuando recibe dos vectores dot() produce el producto punto
a = np.array([2, 3])
b = np.array([3, 4])
print("a:\n", a)
print("b:\n", b)

print("dot(a, b): ", np.dot(a ,b))

a:
 [2 3]
b:
 [3 4]
dot(a, b):  18


Para matrices (2D), el producto de matrices:

$$
	C = np.dot(A, B) \Leftrightarrow C[i,j] = np.sum(a[i,:]*b[:,j])
$$

_Las dimensiones de ambos arreglos deben cumplir los requisitos del producto de matrices, esto es,  el número de columnas en el primero debe ser igual al número de filas en el segundo._

In [75]:
#cuando recibe dos arreglos 2d dot() produce la multiplicacion de matrices
A = np.array([[2, 0], [0, 2]])
B = np.array([[4, 1], [2, 1]])
print("A:\n", A)
print("B:\n", B)

print("dot(A, B):\n", np.dot(A, B))

A:
 [[2 0]
 [0 2]]
B:
 [[4 1]
 [2 1]]
dot(A, B):
 [[8 2]
 [4 2]]


### matmul() o @
Para matrices (2D), el producto de matrices:

$$
	C = np.matmul(A, B) = A @ B \Leftrightarrow C[i,j] = np.sum(A[i,:]*B[:,j])
$$

_Las dimensiones de ambos arreglos deben cumplir los requisitos del producto de matrices, esto es,  el número de columnas en el primero debe ser igual al número de filas en el segundo._

In [76]:
#matmul para el producto de matrices
#Las dimensiones deben cumplir los requisitos del producto de matrices
A = np.array([[2, 0], [0, 2]])
B = np.array([[4, 1], [2, 1]])
print("A:\n", A)
print("B:\n", B)

print("matmul(A, B):\n", np.matmul(A, B))
print("igual a")
print("A @ B:\n", A @ B)

A:
 [[2 0]
 [0 2]]
B:
 [[4 1]
 [2 1]]
matmul(A, B):
 [[8 2]
 [4 2]]
igual a
A @ B:
 [[8 2]
 [4 2]]


### vdot()

Para la multipliación exclusiva de vectores (1D), producto punto:

$$u = [u_1, \dots, u_n]$$
$$v = [v_1, \dots, v_n]$$
$$
	np.vdot(u, v) = u_1 v_1 + u_2 v_2 + \dots + u_n v_n
$$

In [77]:
a = np.array([2, 3])
b = np.array([3, 4])
print("a:\n", a)
print("b:\n", b)

print("vdot(a, b): ", np.vdot(a ,b))

a:
 [2 3]
b:
 [3 4]
vdot(a, b):  18


### inner()

Producto punto de vectores (1D):

$$u = [u_1, \dots, u_n]$$
$$v = [v_1, \dots, v_n]$$
$$
	np.inner(u, v) = u_1 v_1 + u_2 v_2 + \dots + u_n v_n
$$

In [78]:
a = np.array([1,2,3])
b = np.array([0,1,0])
print("a:\n", a)
print("b:\n", b)

print("inner(a, b): ", np.inner(a ,b))

a:
 [1 2 3]
b:
 [0 1 0]
inner(a, b):  2


### outer()

El producto tensorial de dos vectores (1D), genera una matriz:
$$u = [u_1, \dots, u_n]$$
$$v = [v_1, \dots, v_m]$$
$$
	np.outer(u, v) = \begin{bmatrix}
	u_{1} v_{1} & u_{1} v_{2} & \dots & u_{1} v_{m}  \\
	u_{2} v_{1} & u_{2} v_{2} & \dots & u_{2} v_{m}  \\
  \vdots & \vdots  & \dots & \vdots \\
	u_{n} v_{1} & u_{n} v_{2} & \dots & u_{n} v_{m}  \\
	\end{bmatrix}
	$$

In [79]:
#el producto tensorial de dos vectores produce una matriz
a = np.array([1,2,3])
b = np.array([1,1,1])
print("a:\n", a)
print("b:\n", b)

print("outer(a, b): ", np.outer(a ,b))

a:
 [1 2 3]
b:
 [1 1 1]
outer(a, b):  [[1 1 1]
 [2 2 2]
 [3 3 3]]


### trace()

Calcula la traza de un arreglo (2D):

$$
	trace(A) = np.sum(A[i,i])
$$

In [80]:
#para calcular la traza de un arreglo 2d (matriz)
#La traza es la suma de los elementos en la diagonal
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("A:\n", A)

print("trace(A):", np.trace(A))

A:
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
trace(A): 15


## Métodos de arreglos

Además de las funciones que se encuentran disponibles en los módulos de Numpy, los [ndarrays tienen disponibles métodos](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray) para calcular diferentes estadísticas (funciones de agregación), entre éstas se encuentran:

* [```sum(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.sum.html#numpy.ndarray.sum) retorna la suma de todos los elementos del arreglo o la suma por axis si es especificado.
  
* [```min(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.min.html#numpy.ndarray.min) retorna el elemento mínimo del arreglo o de cada axis si especificado.
  
* [```max(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.max.html#numpy.ndarray.max) retorna el elemento máximo del arreglo o de cada axis si especificado

* [```mean(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.mean.html#numpy.ndarray.mean) retorna la media del arreglo, puede recibir el axis.

* [```std(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.std.html#numpy.ndarray.std) retorna la desviación estándar del arreglo, puede recibir el axis.

* [```var(axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.var.html#numpy.ndarray.var) retorna la varianza del arreglo, puede recibir el axis.

### sum(), min() y max()

In [81]:
#metodos para arreglos 1D
a = np.arange(10)
print("a:", a)

print("sum(a):", a.sum())
print("min(a):", a.min())
print("max(a):", a.max())

a: [0 1 2 3 4 5 6 7 8 9]
sum(a): 45
min(a): 0
max(a): 9


In [82]:
#metodos para arreglos 2d especificando axis
a = np.arange(10).reshape(2, 5)
print("a:", a)


print("axis = 0")
print("a.sum(axis = 0):", a.sum(axis = 0))
print("a.min(axis = 0):", a.min(axis = 0))
print("a.max(axis = 0):", a.max(axis = 0))

print("axis = 1")
print("a.sum(axis = 1):", a.sum(axis = 1))
print("a.min(axis = 1):", a.min(axis = 1))
print("a.max(axis = 1):", a.max(axis = 1))

a: [[0 1 2 3 4]
 [5 6 7 8 9]]
axis = 0
a.sum(axis = 0): [ 5  7  9 11 13]
a.min(axis = 0): [0 1 2 3 4]
a.max(axis = 0): [5 6 7 8 9]
axis = 1
a.sum(axis = 1): [10 35]
a.min(axis = 1): [0 5]
a.max(axis = 1): [4 9]


### mean(), std() y var()

In [83]:
a = np.random.normal(0, 1, 100)
#1d
print(a.shape)

print("a.mean():", a.mean())
print("a.std():", a.std())
print("a.var():", a.var())

print()

B = np.vstack((np.random.normal(0, 1, 50), np.random.normal(10, 5, 50)))
#2d
print(B.shape)

print("axis = 1")
print("B.mean(axis = 1):", B.mean(axis = 1))
print("B.std():", B.std(axis = 1))
print("B.var():", B.var(axis = 1))

(100,)
a.mean(): -0.04576546940803833
a.std(): 0.9754873907044379
a.var(): 0.9515756494233527

(2, 50)
axis = 1
B.mean(axis = 1): [ 0.05611943 10.39259479]
B.std(): [0.98586926 4.90079057]
B.var(): [ 0.97193819 24.01774818]


## Otras funciones matemáticas

Otras [funciones importantes que están disponibles en Numpy](https://numpy.org/doc/stable/reference/routines.math.html):

* [```exp(x)```](https://numpy.org/doc/stable/reference/generated/numpy.exp.html#numpy.exp) calcula la función $e^x$ para todos los elementos del arreglo.

* [```log(x)```](https://numpy.org/doc/stable/reference/generated/numpy.log.html#numpy.log) calcula el logaritmo natural de todos los elementos del arreglo.
 
* [```sqrt(x)```](https://numpy.org/doc/stable/reference/generated/numpy.sqrt.html#numpy.sqrt) calcula la raíz cuadrada de los elementos del arreglo.

In [84]:
a = np.arange(1, 10)
print("a:", a)

print("exp(a):", np.exp(a))
print("log(a):", np.log(a))
print("sqrt(a):", np.sqrt(a))

a: [1 2 3 4 5 6 7 8 9]
exp(a): [2.71828183e+00 7.38905610e+00 2.00855369e+01 5.45981500e+01
 1.48413159e+02 4.03428793e+02 1.09663316e+03 2.98095799e+03
 8.10308393e+03]
log(a): [0.         0.69314718 1.09861229 1.38629436 1.60943791 1.79175947
 1.94591015 2.07944154 2.19722458]
sqrt(a): [1.         1.41421356 1.73205081 2.         2.23606798 2.44948974
 2.64575131 2.82842712 3.        ]


## Ordenamiento

La función [```sort(a)```](https://numpy.org/doc/stable/reference/generated/numpy.sort.html#numpy.sort) de Numpy puede ser utilizada para ordenar los elementos de un arreglo.

In [85]:
a = np.random.permutation(np.arange(10))
print("a:", a)

#ordernar el arreglo con sort
print("sort(a):", np.sort(a))

a: [1 6 8 3 2 4 9 0 7 5]
sort(a): [0 1 2 3 4 5 6 7 8 9]


## Búsqueda

Algunas funciones útiles para encontrar elementos en arreglos de Numpy:

* [```argmax(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.argmax.html#numpy.argmax) regresa el o los índices del elemento con el valor máximo.
  
* [```argmin(a, axis=None)```](https://numpy.org/doc/stable/reference/generated/numpy.argmin.html#numpy.argmin) regresa el o los índices del elemento con el valor mínimo.

* [```where(condition, x, y)```](https://numpy.org/doc/stable/reference/generated/numpy.where.html#numpy.where) regresa los elementos de $x$ o $y$ dependiendo de la condición.



In [86]:
a = np.arange(10)
print(a)

#argmax
print("Indice del elemento maximo:", np.argmax(a))

[0 1 2 3 4 5 6 7 8 9]
Indice del elemento maximo: 9


In [87]:
a = np.arange(10)
print(a)

#argmin
print("Indice del elemento minimo:", np.argmin(a))

[0 1 2 3 4 5 6 7 8 9]
Indice del elemento minimo: 0


In [88]:
#where para seleccionar los elementos de un arreglo basado en una condicion
x = np.arange(10)
print("x:", x)

#where
print("x>3:")
print(np.where(x > 3))

x: [0 1 2 3 4 5 6 7 8 9]
x>3:
(array([4, 5, 6, 7, 8, 9], dtype=int64),)


In [89]:
#where para seleccionar los elementos de un arreglo o el otro de acuerdo a una condicion
x = np.arange(10)
print("x:", x)
y = np.zeros_like(x)
print("y:", y)

#where
print("x<5:")
print(np.where(x < 5, x, y))

x: [0 1 2 3 4 5 6 7 8 9]
y: [0 0 0 0 0 0 0 0 0 0]
x<5:
[0 1 2 3 4 0 0 0 0 0]


# Broadcasting

Numpy permite realizar operaciones aritméticas en arreglos de diferentes tamaños mediante broadcasting. El arreglo de menor tamaño es "transmitido" (broadcasted) para que ambos tengan el mismo tamaño y la operación sea válida. 
Broadcasting permite que este tipo de operaciones entre arreglos sean vectorizadas, lo cual optimiza la ejecución y uso de memoria.

El ejemplo más básico de broadcasting es las operaciones escalar con arreglo, por ejemplo:


```
a = np.array([1.0, 2.0, 3.0])
b = 2.0
a * b
array([ 2.,  4.,  6.])
```

Es equivalente, pero más eficiente que utilizar:

```
a = np.array([1.0, 2.0, 3.0])
b = np.array([2.0, 2.0, 2.0])
a * b
array([ 2.,  4.,  6.])
```



In [90]:
#sumar un escalar a un arreglo usando broadcasting (evita ciclos de python y optimiza el uso de memoria)
a = np.array([1.0, 2.0, 3.0])
b = 4.0

#equivalente a [1.0, 2.0, 3.0] + [4.0, 4.0, 4.0]
print(a+b)

[5. 6. 7.]


Podemos pensar que el escalar $b$ está siendo estirado a un arreglo con las mismas dimensiones que $a$ durante la operación aritmética. Los elementos del "nuevo" $b$ son simples copias del escalar original. Esta analogía es solo conceptual, ya que NumPy usa el valor original sin realizar copias físicas de éste. Esto permite que las operaciones sean eficientes en el uso de memoria y computacionalmente.

Más ejemplos:

In [91]:
#broadcasting un arreglo (vector fila) a una matriz
A = np.arange(9).reshape(3, 3)
b = np.array([1, 2, 3])
print("A", A)
print("b", b)

print(b*A)

A [[0 1 2]
 [3 4 5]
 [6 7 8]]
b [1 2 3]
[[ 0  2  6]
 [ 3  8 15]
 [ 6 14 24]]


In [92]:
#broadcasting un arreglo (vector columna) a una matriz
A = np.arange(9).reshape(3, 3)
b = np.array([1, 2, 3]).reshape(3, 1)
print("A", A)
print("b", b)

print(b*A)

A [[0 1 2]
 [3 4 5]
 [6 7 8]]
b [[1]
 [2]
 [3]]
[[ 0  1  2]
 [ 6  8 10]
 [18 21 24]]


# Más sobre vectorización

La vectorización, es el proceso de convertir un algoritmo que opera en un solo valor a la vez, a un algoritmo que opera en un conjunto de valores a la vez. Los CPUs modernos proveen instrucciones para llevar a cabo operaciones vectorizadas que permiten aplicar una misma instrucción a múltiples datos ([SIMD: Single instruction, multiple data](https://es.wikipedia.org/wiki/SIMD)).


En general utilizar vectorización permite:

- Aprovechar las arquitecturas múlti-núcleo de los CPUs/GPUs.
- Aprovechar la arquitectura optimizada para la vectorización del hardware (SIMD).
- Obtener código más conciso.


In [93]:
import time

## Primer ejemplo, sumando un escalar a un arreglo grande

In [94]:
print("Sumando un escalar a todos los elementos de un arreglo")

a = np.random.rand(1000)
b = 4.0

tic = time.time()
a = a + b
toc = time.time()

print("\nResultado:")
print(a[:10], ",...")
print("Tiempo solucion vectorizada: " + str(1000*(toc-tic)) + "ms")

tic = time.time()
for i in range(1000):
  a[i] += b
toc = time.time()

print("\nResultado:")
print(a[:10], ",...")
print("Tiempo en ciclo for: " + str(1000*(toc-tic))+"ms")

Sumando un escalar a todos los elementos de un arreglo

Resultado:
[4.15626946 4.92879485 4.83079181 4.44542519 4.01632158 4.2068257
 4.34670003 4.33523805 4.61948835 4.67638008] ,...
Tiempo solucion vectorizada: 0.9975433349609375ms

Resultado:
[8.15626946 8.92879485 8.83079181 8.44542519 8.01632158 8.2068257
 8.34670003 8.33523805 8.61948835 8.67638008] ,...
Tiempo en ciclo for: 0.0ms


### Un ejemplo, multiplicando dos vectores con una gran cantidad de datos.

In [95]:
print("Producto punto de dos vectores")

a = np.random.rand(1000)
b = np.random.rand(1000)

print("a.shape:")
print(a.shape)
print("b.shape")
print(b.shape)


tic = time.time()
c = np.dot(a,b)
toc = time.time()

print("\nResultado:")
print(c)
print("Tiempo solucion vectorizada: " + str(1000*(toc-tic)) + "ms")

tic = time.time()
c = 0
for i in range(1000):
    c += a[i]*b[i]
toc = time.time()

print("\nResultado:")
print(c)
print("Tiempo en ciclo for: " + str(1000*(toc-tic))+"ms")

Producto punto de dos vectores
a.shape:
(1000,)
b.shape
(1000,)

Resultado:
246.15256530548942
Tiempo solucion vectorizada: 0.0ms

Resultado:
246.15256530548933
Tiempo en ciclo for: 0.9984970092773438ms


## Comparemos código tradicional con ciclos `for` vs vectorización con `np.dot` para la multiplicación de matrices

In [96]:
A = np.random.rand(100000, 10)
B = np.random.rand(10, 1)

print("Dimensiones de las matrices A, B")
print("A.shape:")
print(A.shape)
print("B.shape")
print(B.shape)

Dimensiones de las matrices A, B
A.shape:
(100000, 10)
B.shape
(10, 1)


In [97]:
#Solucion no vectorizada
tic = time.time()
C = [[0 for j in range(B.shape[1])] for i in range(A.shape[0])]
for i in range(A.shape[0]):#numero de filas en A
    for j in range(B.shape[1]):#numero de columnas en B
        for k in range(B.shape[0]):#numero de filas en B == numero de columnas en A
            #fila i en A por columna j en B (vectores)
            C[i][j] += A[i][k] * B[k][j]
toc = time.time()

print("\nResultado:")
for el in C[:3]:
    print(el)
print("...")
for el in C[-3:]:
    print(el)

print("Tiempo en ciclo for: " + str(1000*(toc-tic))+"ms")


Resultado:
[2.672756698050834]
[2.2784049336086794]
[2.4754926498225274]
...
[3.2330447897684023]
[2.740720532736427]
[2.3000275789162608]
Tiempo en ciclo for: 1048.6359596252441ms


In [98]:
#vectorizado usando numpy
tic = time.time()
C = np.dot(A, B)
toc = time.time()

print("\nResultado:")
print(C)
print("Tiempo solucion vectorizada: " + str(1000*(toc-tic)) + "ms")


Resultado:
[[2.6727567 ]
 [2.27840493]
 [2.47549265]
 ...
 [3.23304479]
 [2.74072053]
 [2.30002758]]
Tiempo solucion vectorizada: 9.04083251953125ms
