<p><img alt="banner" height="252px" width="1080px" src="https://docs.google.com/uc?export=download&id=1YJrz-tzQUkofEE37sRUdlCbnXf10gJlF"  align="center" hspace="10px" vspace="0px"></p>

`NumPy` (**Numerical Python**) es una libreria Python de código abierto  trabajar con datos numéricos. Es el núcleo de librerias para análisis científico como `Pandas`

`NumPy` contiene matrices multidimensionales y estructuras de datos matriciales con métodos para operar de manera eficiente en él. NumPy se puede utilizar para realizar una amplia variedad de operaciones matemáticas en matrices. Agrega poderosas estructuras de datos a Python que garantizan cálculos eficientes con arreglos y matrices y proporciona una enorme biblioteca de funciones matemáticas de alto nivel que operan en estos arreglos y matrices.

La ventaja de `Numpy` frente a las estructuras predefinidas en Python es la eficiencia y velocidad, lo cual la hace ideal para el procesamiento de vectores y matrices de grandes dimensiones.

# <font color='157699'> **Instalación** </font>

`Numpy` puede instalarse a través de `conda` o `pip` mediante el comando

>`pip install numpy`
> `conda install numpy`

Sin embargo, en el entorno de colab la libreria ya se encentra preinstalada, por lo que basta con importarla, lo que usualmente se hace con el `alias` `np` para abreviar la forma de llamarlo 


In [None]:
import numpy as np

# <font color='157699'> **Arreglos (`array`) en numpy** </font>

Un `array` es una estructura de datos de **un mismo tipo** organizada en forma de vector o lista. Los arreglos NumPy son  similares a las listas  en Python, pero  son específicamene diseñados para operar más rápido y tienen una mayor cantidad de métodos integrados.

La clase `numpy.ndarray` representa un arreglo multidimensional, de componetes homogeneos y de tamaño fijo. 



Los arreglos de NumPy se crean mediante el método `array()` que usualmente recibe una lista como argumento.

In [None]:
print([1, 2, 3])
arreglo = np.array([1, 2, 3])
arreglo
print(arreglo)

Los arreglos pueden ser unidimensionales (ej. vectores) o multidimensionales (ej. matrices).

Anteriomente se creo un arreglo unidimensional con tres elementos. A continuación creamos una matriz de dimensión `2X3`

In [None]:
matriz = np.array([[1, 2, 3], [4, 5, 6]])
matriz

Existe una amplia gama de rutinas para crear arreglos descritas en la [documentación](https://numpy.org/devdocs/user/basics.creation.html). Algunas de las más usadas son:
 

| Función| resultado 	| 
|:---|:---|
| `empty(d)` | arreglo vacio de dimensión `d `	| 
| `zeros(d)` | arreglo de zeros de dimensión `d `	| 
| `ones(d)` | arreglo de unos de dimensión `d `	| 
| `linspace(a, b, n)` | arreglo de una dimensión cuyos elementos son la secuencia de `n` valores equidistantes desde `a` hasta `b`.	|
| `arange(a, b, s)` | arreglo de una dimensión cuyos elementos son la secuencia desde `a` hasta `b` tomando valores cada `s`.	|
| `random.random(d)` | arreglo de elementos aleatorios de dimensión  `d`.	|



## <font color='46B8A9'> **Ejercicio 1** </font>

Cree una matriz de tamaño `3x3` que incluya los números del 1 al 9

In [None]:
# inserte aquí su respuesta


## <font color='46B8A9'> **Ejercicio 2** </font>
Cree un arreglo bidimensional de tamaño `2X3` en el que todos los elementos sean unos

In [None]:
# inserte aquí su respuesta


## <font color='46B8A9'> **Ejercicio 3** </font>

Cree un arreglo de de 3x3 con numeros aleatorios

In [None]:
# Inserte aquí su respuesta


## <font color='46B8A9'> **Arreglos ordenados en un rango** </font>

Este tipo de arreglos se necesitan frecuentemente para cálculos numéricos (distancia, tiempo, variables termodinámicas, etc.).

Se usa la función `arange` (combinación de `array` y `range`).

In [None]:
a = np.arange(1,11)
a

In [None]:
a = np.arange(2,20,3)
a

Como se observa, funciona similar a la función `range`, en el sentido de que no se incluye el valor final.

En este caso es posible usar **incrementos con valor decimal**, lo cual no se permite con la función `range`.

In [None]:
a = np.arange(0,1.1,0.1)
a

# <font color='157699'> **Atributos de los array** </font>

El siguiente conjunto de funciones permite conocer algunos de los atributos de un array en Numpy

| Función| resultado 	| 
|:---|:---|
| `a.ndim ` |  Devuelve el número de dimensiones del array a	| 
| `a.shape` |  Devuelve una tupla con las dimensiones del array a	| 
| `a.size` |  Devuelve el número de elementos del array a	| 
| `a.dtype` | Devuelve el tipo de datos de los elementos del array a.	|

In [None]:
arreglo = np.random.random((3,3))
print(arreglo)
print(arreglo.ndim)
print(arreglo.shape)
print(arreglo.size)
print(arreglo.dtype)

In [None]:
a = np.arange(0,10)
# retorna el tamaño del arreglo 
print(a)
a.size

#<font color='157699'> **Acceso a los elementos de un array**</font>

Los elementos de un array se acceden usando sus indices como en la estructura de listas. 

Generamos un vector aleatorio de tamaño 10, y accedamos a su 5 elemento (posición 4):




## <font color='46B8A9'> **Indexación** </font>

In [None]:
aleatorio = np.random.random(10)
print(aleatorio)
#aleatorio[4]
print(type(aleatorio))

ahora reformateamos el arreglo en una matriz de tamaño `5x2` haciendo uso de la dunción `reshape()`

In [None]:
aleatorio = aleatorio.reshape(5,2)
print(aleatorio)
print(aleatorio.shape)

y seleccionamos la segunda componente de la tercera fila 

In [None]:
aleatorio[2,1]

In [None]:
print(aleatorio[3])

Note que al referirse con un solo índice a un arreglo multidimensional, retorna el subarray asociado a las dimensiones restantes

In [None]:
aleatorio[0]

## <font color='46B8A9'> **Slicing** </font>

Se obtienen subarrays con el operador  `:`. Para ello se indica  el índice inicial y  final para cada dimensión separados por comas.

In [None]:
print(aleatorio)

In [None]:
aleatorio[2:4,:]


Esto puede ser de utilidad para signar valores o hacer operaciones con los elementos seleccionados. Por ejemplo, es posible sumar 1 a los elementos seleccionados

In [None]:
aleatorio[2:4,:] +=1
aleatorio

También es posible hacer la selección mediante condiciones booleanas. Por ejemplo, seleccionar los elementos que son mayores que 1

In [None]:
aleatorio[aleatorio > 1]

#<font color='157699'> **Operaciones con arrays**</font>

Una limitación de Python a la hora de manejar grandes volúmenes de datos es su carácter interpretado. El acceso secuencial vía ciclos a todos los elementos de una matriz de gran tamaño por parte del intérprete es considerablemente lenta. Numpy permite realizar operaciones entre escalares y arreglos o entre arreglos de manera eficiente. Para lograrlo,  NumPy permite invocar los métodos de forma **vectorizada**, es decir, pasando como argumento directamente la variable que representa a la matriz.

Con la **vectorización** Numpy  permitee implementar funciones cuyos argumentos son matrices u operadores cuyos operandos son matrices. Numpy, por detras, hace uso de una implementación eficiente en un lenguaje compilado.

## <font color='46B8A9'> **Operaciones básicas** </font>
Las operaciones aritméticas sobre los arreglos aplican a nivel de elementos. Un nuevo arreglo se genera con el resultado de la operación.

Note por ejemplo el resultado de la suma de dos arreglos de la misma dimensión.

In [None]:
arreglo1 = np.array([3, 5, 6])
arreglo2 = np.array([2, 4, 1])
resultado = arreglo1 +arreglo2
resultado

In [None]:
def sumarListas(l1, l2):
  i = 0
  listaResultado = []
  while i < len(l1):
    suma = l1[i] + l2[i]
    listaResultado.append(suma)
    i += 1
  return listaResultado

lista1 = [22, 33, 55, 77]
lista2 = [28, 13, 35, 87]

lista3 = sumarListas(lista1, lista2)

print(lista1)
print(lista2)
print(lista3)

En caso de que los arreglos sean de dimensiones diferentes y la operación nos sea conformable se generará un error. Sin embargo, numpy usa el concepto de `broadcasting` para efectuar operaciones entre elementos de distinta dimensión. El caso más sencillo de ellos sería la suma de un escalar `e` a un vector, en el que el valor de `e` se adiciona a todos los elementos del arreglo.

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
resultado = 10 + matriz
resultado

Por ejemplo, si sumamos un vector `1x3` a la matriz` 3x3`, se sumará el vector a cada fila elemento por elemento

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
vector = np.array([6, 7, 8])
resultado = vector + matriz
resultado

Existen un portafolio amplio de funciones que pueden usarse directamente sobre un arreglo. 

| Función | Descripción |
| ------- | ----------- |
| `np.sum()` | Calcula la suma de todos los elementos del arreglo |
| `np.mean()` | Calcula el promedio de todos los elementos del arreglo |
| `np.std()` | Calcula la desviación estándar de los elementos del arreglo |
| `np.min()` | Encuentra el valor mínimo en el arreglo |
| `np.max()` | Encuentra el valor máximo en el arreglo |
| `np.sort()` | Ordena los elementos del arreglo |
| `np.reshape()` | Cambia la forma del arreglo |
| `np.concatenate()` | Une dos o más arreglos |
| `np.split()` | Divide un arreglo en subarreglos |


Ejemplos de ellas son calcular la suma de los elementos `sum()` o hallar el máximo de ellos `max()`

In [None]:
matriz = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
matriz.max()

Adicionalmente, existe una amplia gama de operaciones matriciales predefinidas

| Función| resultado 	| 
|:---|:---|
| `dot()` | Calcula el producto punto de dos arreglos	| 
| `matmul()` | Calcula la multiplicación de dos matrices	| 
| `det()` | Calcula el determinante de una matriz	| 
| `inv()` | Calcula la matriz inversa	| 
| `trace()` | Calcula la traza de una matriz.	|
| `rank()` | Calcula el rango de una matriz.	|
| `transpose()` | Transpone el arreglo |



Producto punto de dos vectores

In [None]:
vector1 = np.array([3, 5, 6])
vector2 = np.array([2, 1, 2])
resultado = np.dot(vector1, vector2)
resultado

Producto de dos matrices

In [None]:
matriz1 = np.array([[2, 1, 2], [2, 0, 2]])
matriz2 = np.array([[3, 5, 6], [2, 4, 1], [1, 7, 9]])
resultado = np.matmul(matriz1, matriz2)
resultado

## <font color='46B8A9'> **Operaciones con fórmulas matemáticas** </font>


Las propiedades descritas de numpy permite trabajar facilmente con operaciones matemáticas, lo cual lo hace ampliamente usado en la comunidad científica.

Por ejemplo, el error cuadrático medio se calcula mediante la siguiente ecuación:

$SSE = \dfrac{\sum_{i=1}^n (\hat{y}_i - y_i)^2}{n}$

Su implementación en numpy, basado en la vectorización es tan simple como se presenta a continuación

In [None]:
y_hat = np.array([1, 2, 1, 4, 6, 8, 8])
y_real= np.array([2, 1, 3, 2, 3, 5, 6])
n = y_hat.size

SSE = 1/n*(np.sum(np.square(y_hat - y_real)))
SSE

## <font color='46B8A9'> **Ejercicio 4** </font>

Dados los datos de y_hat y y_real, calcule el error absoluto medio

$SSE = \dfrac{\sum_{i=1}^n |\hat{y}_i - y_i|}{n}$

In [None]:
# Inserte aquí su respuesta
