<img src="https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/numpy_logo.png?raw=true" alt="logo" width="400"/>

## Introducción a Numpy

NumPy siginifica 'Numerical Python' (Python Numérico). Es una librería Python de código abierto que se utiliza para realizar diversas tareas matemáticas y científicas. Contiene arreglos y matrices multidimensionales, junto con muchas funciones matemáticas de alto nivel que operan en ellos. Entre otras cosas posee:

→ un poderoso objeto de array (arreglo) N-dimensional.

→ funciones sofisticadas de 'broadcasting'.

→ herramientas para integrar códigos C/C++ y Fortran. 

→ útiles capacidades de álgebra lineal, transformada de Fourier y números aleatorios.

## Instalando NumPy
Cuando quieres trabajar con numpy localmente, debes correr los sigiuientes comandos:

Puedes instalar a Numpy con:\
`pip install numpy`\
or\
`conda install numpy`

En nuestro caso, 4Geeks ha preparado todo el entorno de manera que puedas trabajar cómodamente.

## ¿Por qué deberíamos usar Numpy?

Numpy es una librería que nos permite realizar cálculos numéricos en python. Lo usaremos principalmente porque nos permite crear y modificar 'arrays' (arreglos), como también hacer operaciones sobre ellos con facilidad.

Numpy es como Pandas, Matplotlib o Scikit-Learn, uno de los paquetes que no puedes omitir cuando estás aprendiendo Machine Learning. Principalmente porque esta librería proporciona una estructura de datos de matriz que tiene algunos beneficios sobre las listas regulares de Python. Algunos de estos beneficios son: ser más compacto, acceso más rápido a la lectura y redacción de artículos, de forma más conveniente y eficiente.

Por ejemplo, vamos a ver depués en el campo de entrenamiento que trabajar con imágenes significa lidiar con matrices tridimensionales tan grandes como 3840 x 2160, lo que significa que vamos a tener 3×3840×2160 = 24883200 entradas!!! 😱😱😱.

Trabajar con matrices de esa magnitud es prácticamente imposible de realizar con listas y diccionarios si se quiere tener una programación eficiente y rápida.

#### Ejercicio: Importa el paquete de numpy bajo el nombre `np` (★☆☆).

`numpy` es importado comunmente como `np`, por lo tanto, nosotros recomendamos ampliamente poner este alias.

In [None]:
import (importa) numpy as (como) np

## ¿Que es un array y por qué es importante para Machine Learning?

Un array (arreglo) es una estructura de datos que consiste en una colección de elementos (valores o variales), cada uno identificado por al menos un índice o clave. 

![alt text](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/1D.png?raw=true "1D")

Un array es conocido como la estructura de datos central de la librería Numpy; a su vez, este puede ser de varias dimensiones. Por ejemplo, las redes neuronales a veces lidian con arrays 4D.

Luego, vamos a utilizar otro tipo de ellos llamados: Tensors (tensores).

![alt text](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/3D.png?raw=true "3D")

#### Ejercicio: Imprime la versión y configuración de Numpy (★☆☆)

Puedes imprimir la versión de cualquier paquete de Python utilizando `name_of_package.__version__`

In [5]:
import numpy as np
print(np.__version__)

1.21.3


#### Ejercicio:  Crea un 'null vector' (vector nulo) de tamaño 10 (★☆☆)

Un `null vector` es un array de ceros (`0`), también llamado `initialization vector` (vector de inicialización).

>Chequea la función `np.zeros` (https://numpy.org/doc/stable/reference/generated/numpy.zeros.html)

In [9]:
np.zeros(0)

array([], dtype=float64)

#### Ejercicio: Crea un vector de `ones` con tamaño de 10 (★☆☆)

> Chequea la función `np.ones` (https://numpy.org/doc/stable/reference/generated/numpy.ones.html)

In [10]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

#### Ejercicio: Crea un array en 1D con valor inicial específico, valor final y número de valores (★☆☆)

>Chequea la función `np.linspace` (https://numpy.org/doc/stable/reference/generated/numpy.linspace.html)

In [11]:
np.linspace(1,2,10)

array([1.        , 1.11111111, 1.22222222, 1.33333333, 1.44444444,
       1.55555556, 1.66666667, 1.77777778, 1.88888889, 2.        ])

#### Corre: crea un vector (array 1D) con enteros aleatorios del 10 al 49 y dimensión 1x35 (★☆☆)

Cuando la `dimensión` es expresada `1x35` significa: array de una dimensión con 35 elementos (longitud = 35).

>Chequea la función `np.random` que te permite crear arrays aleatorios (https://numpy.org/doc/1.16/reference/routines.random.html)

In [12]:
import numpy as np

## 10 números aleatorios entre (0, 1)
print(np.random.random(10)) 

[0.95625101 0.46980614 0.80157953 0.79762784 0.67327667 0.42400419
 0.40437389 0.58845834 0.58894057 0.40771583]


In [13]:
## Dos formas de crear números con distribución normal
print(np.random.rand(10)) # 10 valores aleatorios con distribución N(0,1)
print(np.random.normal(loc = 0, scale = 1, size = 10)) # 10 valores aleatorios con distribución N(0,1)

[0.56168108 0.24748839 0.53761307 0.97091848 0.79245561 0.22161239
 0.69350801 0.48000351 0.18968002 0.32187232]
[ 0.94209455 -1.64272316  0.56620792  2.10585027 -0.90969019  0.15682171
 -0.58121318  0.13185223  1.72316188 -0.35960136]


In [None]:
## ¿Notaste la diferencia entre ambas funciones?
print(np.random.normal(loc = -5, scale = 33, size = 10)) # 10 valores aleatorios con distribución N(-5,33)

In [None]:
## 10 valores aleatorios con distribución uniforme. Es decir, todos los valores tienen la misma probabilidad
print(np.random.uniform(-30,100,10)) # Todos los valores están entre -30 y 100.

In [None]:
# 10 valores enteros entre 0 y 100.
print(np.random.randint(0, 100, 10))

In [None]:
# 10 valores aleatorios con distribución Chi con 5 grados de libertad
print(np.random.chisquare(5,10))

Los ejemplos anteriores son la distribución más común y los valores aleatorios que aprenderás a lo largo del bootcamp. Ahora, tratemos con esos arrays.

#### Ejercicio: Invierte uno de los últimos vectores que creamos antes (el primer elemento se convierte en el último) (★☆☆)

Intenta con `[::-1]`

#### Ejercicio: Crear una matriz de identidad de 5x5 (★☆☆)

>Chequea la función `np.eye`(https://numpy.org/devdocs/reference/generated/numpy.eye.html)

### Ejercicio: Encuentre los índices de los elementos distintos a cero de [1,2,0,0,4,0] (★☆☆)

>Chequea la función `where`(https://numpy.org/devdocs/reference/generated/numpy.where.html)

#### Ejercicio: Crea un array de 10x10 con valores aleatorios y encuentra los valores mínimo y máximo (★☆☆)

>Chequea la función `min` (https://numpy.org/devdocs/reference/generated/numpy.where.html) and `max` (https://numpy.org/devdocs/reference/generated/numpy.max.html)

#### Ejercicio: Crea un vector aleatorio de tamaño 30 y encuentra el valor medio (★☆☆)

#### Ejercicio: Define una función con tu fecha de nacimiento (aaaa/mm/dd) como dato de entrada, que devuelva un array aleatorio con las siguientes dimensiones: (★★☆)

$$yyyy-1900 \times |mm - dd|$$

## ¿Cuál es la diferencia entre Python List y Numpy Array?

- Python list puede contener elementos con diferentes tipos de datos, mientas que los elementos de Numpy Array son siempre homogéneos (mismo tipo de datos).

- Los arrays de Numpy son más rápidos y compactos que las listas de Python.

## ¿Por qué los arrays de Numpy son más rápidos que las listas?

- Los Numpy Array usan un tamaño fijo de memoria para almacenar datos y menos memoria que las listas de Python.

- Asignación de memoria contigua en Numpy Arrays.

#### Ejercicio: Convierte la lista `my_list = [1, 2, 3]` a un array de Numpy (★☆☆)

#### Ejercicio: Conviente una tupla `my_list = (1, 2, 3)` a un array de Numpy (★☆☆)

#### Ejercicio: Convierte la lista de tuplas `my_list = [(1,2,3), (4,5)]` a un array de Numpy (★☆☆)

#### Ejercicio: Cambia el tamaño de un array aleatorio de dimensiones 5x12 en 12x5 (★☆☆)

>Chequea `reshape` de `numpy` (https://numpy.org/doc/stable/reference/generated/numpy.reshape.html)

#### Ejercicio: Crea una función que normalice una matriz aleatoria de 5x5 (★☆☆)

>Recuerda por probabilidad (https://en.wikipedia.org/wiki/Normalization_(statistics)) que:
$$ x_{norm} = \frac{x - \bar{x}}{\sigma}$$


## Stacking (apilando) arrays de Numpy

Stacking se utiliza para unir una secuencia de arrays de igual dimensión a lo largo de un nuevo axis (eje).

`numpy.stack(arrays,axis)` : Devuelve un array apilado que tiene una dimensión más que los arrays de entrada.

### Tienes dos maneras de hacerlo:


![alt text](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/stack.jpeg?raw=true "stack")


### o


![alt text](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/stack2.jpeg?raw=true "stack")

#### Ejercicio: Genera dos arrays aleatorios con enteros y aplica el stacking (apilamiento) usando `stack` (★★☆)

#### Ejercicio: Genera dos arrays aleatorios con enteros y aplica stacking  utilizando `hstack` y `vstack` (★★☆)

## Matemática básica en Numpy

Puedes hacer típicas operaciones matemáticas como:

- Suma, resta, multiplicación y división entre dos arrays usando Numpy.
- Operación en arrays usando la función sum() y cumsum().
- Valor mínimo y máximo de un array.
- exponente/potencia, raíz cuadrada y raíz cúbica

o incluso aplicar funciones trigonométricas comunes:

- `numpy.sin()`: Función Seno(x)
- `numpy.cos()`: Función Coseno(x) 
- `numpy.tan()`: Función Tangente(x)
- `numpy.sinh()`: Función Seno Hiperbólico(x) 
- `numpy.cosh()`:  Función Coseno Hiperbólico(x) 
- `numpy.tanh()`: Función Tangente Hiperbolica(x) 
- `numpy.arcsin()`: Función inversa del Seno(x)
- `numpy.arccos()`: Función Inversa del coseno(x)
- `numpy.arctan()`: Función inversa de la Tangente(x)
- `numpy.pi`: Valor de pi π
- `numpy.hypot(w,h)`: Para calcular la Hipotenusa $c = \sqrt{(w^2 + h^2)}$
- `numpy.rad2deg()`: Radianes a Grados
- `numpy.deg2rad()`: Grados a Radianes

#### Ejercicio: Genera dos vectores aleatorios de 8 dimensiones y aplica la operación más común entre vectores: suma, resta, multiplicación, división (★☆☆)

>Consulta aquí las funciones matemáticas: https://numpy.org/doc/stable/reference/routines.math.html

#### Ejercicio: Genera dos matrices aleatorias con dimensiones entre 5 y 10. Por ejemplo, prueba 5x7 contra 8x9. ¿Pudiste hacer la multiplicación de matrices? ¿por qué? (★★☆) 

#### Ejercicio: Dados 2 Numpy arrays como matrices, genera el resultado de multiplicar las 2 matrices (como un array de Numpy) ¿Pudiste hacer la multiplicación de matrices? (★★☆) 

$$ a = \left(\begin{matrix}
0 & 1 & 2\\ 
3 & 4 & 5\\ 
6 & 7 & 8
\end{matrix}\right)$$

$$ b = \left(\begin{matrix}
2 & 3 & 4\\ 
5 & 6 & 7\\ 
8 & 9 & 10
\end{matrix}\right)$$


#### Ejercicio: Multiplica una matriz de 5x3 por una de 3x2 (producto real de matrices) (★★☆)

## Tipos de datos

¿Crees que la siguiente preposición es verdadera?

`8==8`

Seguramente dirás que si, lo cual es verdad matemáticamente, pero computacionalmente no siempre es lo mismo, al menos en términos de memoria. Por ejemplo, corre la siguiente celda:

In [None]:
import sys

# int64
x = np.array(123)
print("int64: " + str(sys.getsizeof(x)))

# int8
x = np.array(123,dtype=np.int8)
print("int8: " + str(sys.getsizeof(x)))

# float32
x = np.array(123,dtype=np.float32)
print("float32: " + str(sys.getsizeof(x)))

#### Resulta que hay muchas representaciones computacionales del mismo número y tu puedes crear arrays de diferentes tipos de datos (dtypes) dependiendo de lo que necesites:

- Boolean : `np.bool_`
- Char : `np.byte`
- Short : `np.short`
- Integer : `np.short`
- Long : `np.int_`
- Float : `np.single`&np.float32`
- Double :`np.double`&`np.float64`
- `np.int8`: integer (-128 to 127)
- `np.int16`:integer( -32768 to 32767)
- `np.int32`: integer(-2147483648 to 2147483647)
- `np.int64`:integer( -9223372036854775808 to 9223372036854775807)
 
Algunas veces, vas a tener que cargar, crear o exportar arrays de diferentes tipos de datos.


## Ejercicios más complicados

Los siguienes ejercicios están relacionados con situaciones reales que podrías enfrentar mientras estés trabajando en ciencia de datos (data science) y Machine Learning. También vamos a estar hablando fecuentemente de matrices y arrays bidimensionales.

#### Ejercicio: Resta la media de cada fila de una matriz (★★☆)

#### Ejercicio: ¿Cómo obtener las fechas de ayer, hoy y mañana? (★★☆)

>Chequea `np.datetime64`, `np.timedelta64` in numpy (https://numpy.org/doc/stable/reference/arrays.datetime.html)

#### Ejercicio: ¿Cómo obtener todas las fechas correspondientes al mes de diciembre de 2022? (★★☆)

Combina `arange`con `datetime`


#### Ejercicio: Extrae la parte entera de un array aleatorio de números positivos usando 2 métodos diferentes (★★☆)

#### Ejercicio: Crea una matriz de 5x5 con valores de fila que van de 0 a 4 (★★☆)

#### Ejercicio: Considera una función generadora que genere 10 enteros y utilízala para construir un array (★★☆)

#### Ejercicio: Crea un vector de tamaño 10 con valores que van de 0 a 1, ambos excluidos (★★☆)

#### Ejercicio: Crea un vector aleatorio de tamaño 10 y ordénalo (★★☆)

#### Ejercicio: Considera dos arrays aleatorios A y B, verifica si son iguales (★★☆)

#### Ejercicios: Considera una matriz aleatoria de 10x2 que representa coordenadas cartesianas, y conviértelas en coordenadas polares(★★★)

> Sugerencia: comprueba cómo calcular el "cuadrado de una matriz"

#### Ejercicio: Crea un vector aleatorio de tamaño 10 y reemplaza el valor máximo por 0 (★★☆)

#### Ejercicio: ¿Cómo imprimir todos los valores de un array? (★★☆)

#### Ejercicio: ¿Cómo convertir un array flotante (32 bits) en uno entero (32 bits) en su lugar?

>Chequea: https://stackoverflow.com/a/4396247/5989906

#### Ejercicio: Resta la media de cada fila de una matriz (★★☆)

#### Ejercicio: ¿Cómo ordenar un array por la enésima columna? (★★☆)

#### Ejercicio: ¿Encuentra la posición del mínimo de una matriz 2D (★★☆)

#### Ejercicio: Lee una imagen usando openCV, verifica sus dimensiones, normaliza los números y muestra la imagen (★★★)

>Chequea: https://www.geeksforgeeks.org/python-opencv-cv2-imread-method/

#### Ejercicio: Tomando en cuenta un array de cuatro dimensiones, ¿cómo obtener la suma de los dos últimos ejes a la vez? (★★★)

#### Ejercicio: ¿Cómo obtener la diagonal de un producto escalar? (★★★)

#### Ejercicio: Considera un array de dimensión (5,5,3), ¿cómo multiplicarlo por un array con dimensiones (5,5)?(★★★)

#### Ejercicio: ¿Cómo intercambiar dos filas de un array? (★★★)

#### Ejercicio: Lee una imagen usando openCV y transpóngala. ¿Qué obtuviste exactamente? ¿Rotó la imagen? ¿Se Movió? ¿Se reflejó con respecto a un eje? (★★★)

#### Ejercicio: Considera un array Z = [1,2,3,4,5,6,7,8,9,10,11,12,13,14], cómo generar un array R = [[1,2,3,4], [2,3,4,5], [3,4,5,6], ..., [11,12,13,14]]? (★★★)

#### Ejercicio: ¿Cómo encontrar el valor más frecuente en un array? (★★★)

#### Ejercicio: ¿Cómo obtener los n valores mas grandes de un array? (★★★)

#### Ejercicio: Considera un gran vector Z, calcula Z elevada a la potencia de 3 usando 3 métodos diferentes (★★★)

#### Ejercicio: Dado un array bidimensional, ¿cómo extraer filas únicas?(★★★)

#### Ejercicio: ¿Puedes tener un array de strings (cadenas)? ¿Puedes mezclar diferentes tipos de datos en el mismo array? ¿Puedes operar (sumar, restar, multiplicar) arrays con diferentes tipos de datos? (★★★)