![Logo de NumPy](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/numpy_logo.png?raw=true)

## Introducción a NumPy

`NumPy` es un juego de palabras que significa **Python numérico** (*Numerical Python*). Es una librería de código abierto que se utiliza para llevar a cabo tareas matemáticas con altísima eficiencia. Además, introduce estructuras de datos como los arrays multidimensionales, que se pueden operar entre ellos a alto nivel, sin meterse mucho en el detalle.

En concreto, las claves de esta librería son:

- **Array multidimensionales**: Esta librería proporciona un objeto llamado `ndarray`, que permite almacenar y manipular grandes conjuntos de datos de forma eficiente. Los arrays pueden tener cualquier número de dimensiones.
- **Operaciones Vectorizadas**: NumPy permite realizar operaciones matemáticas en arrays completos sin la necesidad de bucles explícitos en el código, lo que lo hace muy rápido y eficiente.
- **Funciones matemáticas**: NumPy proporciona una amplia gama de funciones matemáticas para trabajar con arrays, incluyendo funciones trigonométricas, estadísticas, álgebra lineal, entre otras.
- **Eficiencia**: Es mucho más rápido que la misma funcionalidad implementada directamente sobre Python nativo. Además, es muy flexible en términos de acceso y manipulación de elementos individuales o subconjuntos de arrays.

NumPy es una biblioteca fundamental para el Machine Learning y la ciencia de los datos en Python. Proporciona una amplia gama de herramientas y funciones para trabajar eficientemente con datos numéricos en forma de arrays y matrices.

### Arrays

Un **array** de NumPy es una estructura de datos que permite almacenar una colección de elementos, generalmente números, en una o más dimensiones.

#### Array unidimensional

Un array unidimensional (1D) de NumPy es una estructura de datos que contiene una secuencia de elementos en una única dimensión. Es similar a una lista en Python, pero con las ventajas de rendimiento y funcionalidad que ofrece NumPy.

![Array de una dimensión](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/1D.png?raw=true "1D")

Un array 1D puede ser creado usando la función `array` de la librería con una lista de elementos como argumento. Por ejemplo:

In [None]:
import numpy as np

array = np.array([1, 2, 3, 4, 5])
array

array([1, 2, 3, 4, 5])

Esto creará un array 1D con los elementos 1, 2, 3, 4 y 5. Los elementos del array deben ser del mismo tipo de datos. Si los elementos son de diferentes tipos, NumPy intentará convertirlos al mismo tipo si es posible.

En un array 1D, podemos acceder a los elementos usando **índices** (*indexes*), modificarlos y realizar operaciones matemáticas en el array completo de forma eficiente. A continuación se muestran algunas operaciones que se pueden realizar utilizando el array anterior:

In [None]:
# Acceder al tercer elemento
print(array[2])

# Cambiar el valor del segundo elemento
array[1] = 7
print(array)

# Sumar 10 a todos los elementos
array += 10
print(array)

# Calcular la suma de los elementos
sum_all = np.sum(array)
print(sum_all)

3
[1 7 3 4 5]
[11 17 13 14 15]
70


#### Array N-dimensional

Un array multidimensional o n-dimensional en NumPy es una estructura de datos que organiza elementos en múltiples dimensiones (ejes). Estos arrays permiten representar estructuras de datos más complejas, como matrices (array 2D, 2 ejes), tensores (array 3D, 3 ejes) y estructuras de mayor dimensión.

![Arrays de diferentes dimensiones](https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/assets/3D.png?raw=true "3D")

Un array N-dimensional puede ser creado también usando la función `array` de la librería. Por ejemplo, si queremos crear un array 2D:

In [None]:
array_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
array_2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

Si ahora quisiéramos crear un array 3D, tendríamos que pensar en él como una lista de matrices:

In [None]:
array_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
array_3d

array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

Al igual que sucedía con los arrays 1D, los elementos en un array multidimensional son accesibles mediante índices, se pueden realizar operaciones con ellos, etcétera.

A medida que agregamos más dimensiones, el principio básico sigue siendo el mismo: cada dimensión adicional puede considerarse como un nivel adicional de anidamiento. Sin embargo, a nivel práctico, trabajar con arrays de más de 3 o 4 dimensiones puede volverse más complejo y menos intuitivo.

Los arrays n-dimensionales en NumPy permiten una gran flexibilidad y potencia para representar y manipular datos en formas más complejas, especialmente útiles en campos como la ciencia de los datos, procesamiento de imágenes y aprendizaje profundo.

### Funciones

NumPy proporciona una gran cantidad de funciones predefinidas y que se pueden aplicar directamente sobre las estructuras de datos vistas anteriormente o las propias de Python (listas, matrices, etcétera). Algunas de las más utilizadas en el análisis de datos son:

In [None]:
import numpy as np

# Crear un array para el ejemplo
arr = np.array([1, 2, 3, 4, 5])

# Operaciones Aritméticas
print("Suma:", np.add(arr, 5))
print("Producto:", np.multiply(arr, 3))

# Logarítmicas y Exponenciales
print("Logaritmo natural:", np.log(arr))
print("Exponencial:", np.exp(arr))

# Funciones Estadísticas
print("Media:", np.mean(arr))
print("Mediana:", np.median(arr))
print("Desviación estándar:", np.std(arr))
print("Varianza:", np.var(arr))
print("Máximo valor:", np.max(arr))
print("Índice del máximo valor:", np.argmax(arr))
print("Mínimo valor:", np.min(arr))
print("Índice del mínimo valor:", np.argmin(arr))
print("Suma de todos los elementos:", np.sum(arr))

# Funciones de Redondeo
arr_decimal = np.array([1.23, 2.47, 3.56, 4.89])
print("Redondeo:", np.around(arr_decimal))
print("Entero menor (floor):", np.floor(arr_decimal))
print("Entero mayor (ceil):", np.ceil(arr_decimal))

Suma: [ 6  7  8  9 10]
Producto: [ 3  6  9 12 15]
Logaritmo natural: [0.         0.69314718 1.09861229 1.38629436 1.60943791]
Exponencial: [  2.71828183   7.3890561   20.08553692  54.59815003 148.4131591 ]
Media: 3.0
Mediana: 3.0
Desviación estándar: 1.4142135623730951
Varianza: 2.0
Máximo valor: 5
Índice del máximo valor: 4
Mínimo valor: 1
Índice del mínimo valor: 0
Suma de todos los elementos: 15
Redondeo: [1. 2. 4. 5.]
Entero menor (floor): [1. 2. 3. 4.]
Entero mayor (ceil): [2. 3. 4. 5.]


## Ejercicios: Haz clic en "open in colab" para realizarlos

> Solución: https://github.com/4GeeksAcademy/machine-learning-prework/blob/main/02-numpy/02.1-Intro-to-Numpy_solutions.ipynb

### Creación de arrays

#### Ejercicio 01:  Crea un **vector nulo** (*null vector*) que tenga 10 elementos (★☆☆)

Un vector nulo es un array de una dimensión compuesto por ceros (`0`).

> NOTA: Revisa la función `np.zeros` (https://numpy.org/doc/stable/reference/generated/numpy.zeros.html)

In [7]:
import pandas  as pd
import numpy as np
np.zeros((10,), dtype=int)



array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

#### Ejercicio 02: Crea un vector de unos que tenga 10 elementos (★☆☆)

> NOTA: Revisa la función `np.ones` (https://numpy.org/doc/stable/reference/generated/numpy.ones.html)

In [8]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

#### Ejercicio 03: Investiga la función `linspace` de NumPy y crea un array que contenga 10 elementos (★☆☆)

> NOTA: Revisa la función `np.linspace` (https://numpy.org/doc/stable/reference/generated/numpy.linspace.html)

In [11]:
np.linspace(20, 200, num=50, endpoint=True, retstep=False, dtype=None, axis=0)

array([ 20.        ,  23.67346939,  27.34693878,  31.02040816,
        34.69387755,  38.36734694,  42.04081633,  45.71428571,
        49.3877551 ,  53.06122449,  56.73469388,  60.40816327,
        64.08163265,  67.75510204,  71.42857143,  75.10204082,
        78.7755102 ,  82.44897959,  86.12244898,  89.79591837,
        93.46938776,  97.14285714, 100.81632653, 104.48979592,
       108.16326531, 111.83673469, 115.51020408, 119.18367347,
       122.85714286, 126.53061224, 130.20408163, 133.87755102,
       137.55102041, 141.2244898 , 144.89795918, 148.57142857,
       152.24489796, 155.91836735, 159.59183673, 163.26530612,
       166.93877551, 170.6122449 , 174.28571429, 177.95918367,
       181.63265306, 185.30612245, 188.97959184, 192.65306122,
       196.32653061, 200.        ])

#### Ejercicio 04: Busca varias formas de generar un array con números aleatorios y crea un array 1D y dos arrays 2D (★★☆)

> NOTA: Revisa las funciones `np.random.rand` (https://numpy.org/doc/stable/reference/random/generated/numpy.random.rand.html), `np.random.randint` (https://numpy.org/doc/stable/reference/random/generated/numpy.random.randint.html) y `np.random.randn` (https://numpy.org/doc/stable/reference/random/generated/numpy.random.randn.html)

In [15]:
np.random.rand(5)

array([0.39568967, 0.23459326, 0.52123445, 0.9811016 , 0.21153924])

In [12]:
np.random.rand(3,2)

array([[0.70755735, 0.15914156],
       [0.75500422, 0.03576953],
       [0.65188245, 0.64404032]])

In [16]:
np.random.randint(-5, 6, size=(5, 3))

array([[ 4,  1,  0],
       [ 3,  4,  0],
       [ 3, -4,  3],
       [ 2,  0, -2],
       [-3, -2, -3]])

#### Ejercicio 05: Crea una matriz (array 2D) identidad de 5x5 (★☆☆)


> NOTA: Revisa la función `np.eye`(https://numpy.org/devdocs/reference/generated/numpy.eye.html)

In [17]:
np.eye(5, dtype=int)

array([[1, 0, 0, 0, 0],
       [0, 1, 0, 0, 0],
       [0, 0, 1, 0, 0],
       [0, 0, 0, 1, 0],
       [0, 0, 0, 0, 1]])

#### Ejercicio 06: Crea una matriz con números aleatorios de 3x2 y calcula el valor mínimo y máximo (★☆☆)

> NOTA: Revisa la función `np.min` (https://numpy.org/devdocs/reference/generated/numpy.min.html) y `np.max` (https://numpy.org/devdocs/reference/generated/numpy.max.html)

In [20]:
x= np.random.rand(3,2)
x

array([[0.77964559, 0.46873188],
       [0.16072678, 0.16635032],
       [0.64879545, 0.28517077]])

In [21]:
np.min(x)

np.float64(0.1607267822111973)

#### Ejercicio 07: Crea un vector con números aleatorios de 30 elementos y calcula la media (★☆☆)

> NOTA: Revisa la función `np.mean` (https://numpy.org/doc/stable/reference/generated/numpy.mean.html)

In [26]:
a= np.random.rand(30)
a

array([0.88674139, 0.82273835, 0.3690654 , 0.97655768, 0.41063179,
       0.03258144, 0.55309926, 0.46594742, 0.46463846, 0.85477559,
       0.19653111, 0.43471346, 0.72818499, 0.99571827, 0.42811178,
       0.53799241, 0.49463383, 0.5419114 , 0.10674844, 0.32245456,
       0.0231242 , 0.80348998, 0.0318803 , 0.61319425, 0.21284042,
       0.21785514, 0.96179774, 0.80766389, 0.57767915, 0.89006638])

In [29]:
np.mean(a)

np.float64(0.5254456160902629)

#### Ejercicio 08: Convierte la lista `[1, 2, 3]` y la tupla `(1, 2, 3)` en arrays (★☆☆)

In [30]:
arr_l = np.array([1, 2, 3])
arr_t=np.array([1,2,3])
print(arr_l)
print(arr_t)

[1 2 3]
[1 2 3]


### Operaciones entre arrays

#### Ejercicio 09: Invierte el vector del ejercicio anterior (★☆☆)

> NOTA: Revisa la función `np.flip` (https://numpy.org/doc/stable/reference/generated/numpy.flip.html)

In [31]:
np.flip(arr_l)


array([3, 2, 1])

#### Ejercicio 10: Cambia el tamaño de un array aleatorio de dimensiones 5x12 en 12x5 (★☆☆)

> NOTA: Revisa la función `np.reshape` (https://numpy.org/doc/stable/reference/generated/numpy.reshape.html)

In [32]:
b=np.random.rand(5,12)
b

array([[0.29043954, 0.36281943, 0.32594391, 0.0089757 , 0.67087007,
        0.69389133, 0.74607771, 0.48644179, 0.20727208, 0.03275342,
        0.98981422, 0.45284878],
       [0.78804974, 0.27795869, 0.94766446, 0.38264012, 0.6470895 ,
        0.85080486, 0.9087261 , 0.36589515, 0.78044897, 0.84104235,
        0.95712305, 0.21624327],
       [0.41637742, 0.56896219, 0.87232142, 0.75356429, 0.48929982,
        0.98084206, 0.15341531, 0.23921695, 0.81754586, 0.67708471,
        0.57363168, 0.97104261],
       [0.51897506, 0.51085051, 0.56905243, 0.8812912 , 0.88938574,
        0.81581114, 0.73162833, 0.97820342, 0.9711106 , 0.86121953,
        0.08443311, 0.76877533],
       [0.51154636, 0.22189924, 0.51108194, 0.78495985, 0.12591706,
        0.75718362, 0.45431778, 0.96155919, 0.83959529, 0.34676291,
        0.9101252 , 0.53614151]])

In [33]:
np.reshape(b, (12, 5))

array([[0.29043954, 0.36281943, 0.32594391, 0.0089757 , 0.67087007],
       [0.69389133, 0.74607771, 0.48644179, 0.20727208, 0.03275342],
       [0.98981422, 0.45284878, 0.78804974, 0.27795869, 0.94766446],
       [0.38264012, 0.6470895 , 0.85080486, 0.9087261 , 0.36589515],
       [0.78044897, 0.84104235, 0.95712305, 0.21624327, 0.41637742],
       [0.56896219, 0.87232142, 0.75356429, 0.48929982, 0.98084206],
       [0.15341531, 0.23921695, 0.81754586, 0.67708471, 0.57363168],
       [0.97104261, 0.51897506, 0.51085051, 0.56905243, 0.8812912 ],
       [0.88938574, 0.81581114, 0.73162833, 0.97820342, 0.9711106 ],
       [0.86121953, 0.08443311, 0.76877533, 0.51154636, 0.22189924],
       [0.51108194, 0.78495985, 0.12591706, 0.75718362, 0.45431778],
       [0.96155919, 0.83959529, 0.34676291, 0.9101252 , 0.53614151]])

#### Ejercicio 11: Convierte la lista `[1, 2, 0, 0, 4, 0]` en un array y obtén el índice de los elementos que no son cero (★★☆)

> NOTA: Revisa la función `np.where` (https://numpy.org/devdocs/reference/generated/numpy.where.html)

In [34]:
c=np.array([1, 2, 0, 0, 4, 0])
c

array([1, 2, 0, 0, 4, 0])

In [37]:
np.where(c != 0)

(array([0, 1, 4]),)

#### Ejercicio 12: Convierte la lista `[0, 5, -1, 3, 15]` en un array, multiplica sus valores por `-2` y obtén los elementos pares (★★☆)

In [38]:
d=np.array([0, 5, -1, 3, 15])
d

array([ 0,  5, -1,  3, 15])

In [43]:
d_x= np.multiply(d, -2)
d_x

d_pares = d_x[d_x % 2 == 0]
d_pares

array([  0, -10,   2,  -6, -30])

#### Ejercicio 13: Crea un vector aleatorio de 10 elementos y ordénalo de menor a mayor (★★☆)

> NOTA: Revisa la función `np.sort` (https://numpy.org/doc/stable/reference/generated/numpy.sort.html)

In [45]:
z=np.random.rand(5)
z

np.sort(z)

array([0.12536706, 0.15674945, 0.62104245, 0.74834477, 0.88022901])

#### Ejercicio 14: Genera dos vectores aleatorios de 8 elementos y aplica las operaciones de suma, resta y multiplicación entre ellos (★★☆)

> NOTA: Revisa las funciones matemáticas: https://numpy.org/doc/stable/reference/routines.math.html

In [48]:
vector_a = np.random.randint(0, 10, 8)
vector_b = np.random.randint(0, 10, 8)

suma = vector_a + vector_b
resta = vector_a - vector_b
multiplicacion = vector_a * vector_b

print(suma,resta,multiplicacion)


[ 4 10 10 12 13  6 14  9] [ 0  6  8  0  5 -6  0  5] [ 4 16  9 36 36  0 49 14]


#### Ejercicio 15: Convierte la lista `[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]` en un array y transfórmalo en una matriz con filas de 3 columnas (★★★)

In [49]:
l=np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
l

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

In [50]:
np.reshape(l, (4, 3))

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])