# Librerías importantes para el análisis de datos en Python

------------------------------------------------------


### Data Science and Machine Learning

#### Febrero 2023

**Aurora Cobo Aguilera**

**The Valley**

------------------------------------------------------




En este notebook, introduciremos una librería que usaremos en el resto del módulo y muy útil para realizar cálculo científico y opraciones con vectores y matrices.

El comienzo habitual de cualquier scrip de python es la importación de librerías a usar.


In [1]:
import numpy as np

## 1. Uso de la librería Numpy y matrices

El módulo _numpy_ es muy útil para cálculo científico en python.

La principal estructura de datos en _numpy_ es el array con N dimensiones. 

### 1.1. Matrices con Numpy

En Numpy una matriz se representa a través de un array de 2 dimensiones.

Puedes definir un _numpy_ _array_ a partir de una lista o una lista de listas. Python intentará construirlo con las dimensiones apropiadas. Puedes consultar las dimensiones con _shape()_


In [2]:
my_array = np.array([[1, 2], [3, 4]])
print(my_array)
print(np.shape(my_array)) #checking the dimensions

[[1 2]
 [3 4]]
(2, 2)


> **Ejercicio**: Define un nuevo array de 2x3 llamado *my_array2* con  [1, 2, 3] en la primera fila y [4,5,6] en la segunda.
Consulta las dimensiones del array.


In [12]:
my_array2 = np.array([[1, 2, 3], [4, 5, 6]])
print(my_array2)
print(np.shape(my_array2))

[[1 2 3]
 [4 5 6]]
(2, 3)


In [7]:
#<SOL>

#</SOL>

Hay un número de operaciones que puedes hacer con arrays numpy. Una de las más importantes es **slicing**, que consiste en extraer un subarray de un array.

In [19]:
my_array3 = my_array[:, 1] #de todas las filas coge la columna numero 1
print(my_array3)
#print(my_array[1, 0:2]) #de la fila 1 printea las columnas de la 0 a la 2 (no incluida la dos)

[2 4]


Algo importante a considerar cuando haces slicing son las dimensiones del array de salida. 

>**Ejercicio**: Consulta las dimensiones de *my_array3*. Consulta tambien sus dimensiones con la función _ndim_:





In [20]:
print(np.shape(my_array3))
print(my_array3.ndim)

(2,)
1


In [22]:
#help(np.ndarray.ndim) dimensiones
#<SOL>

#</SOL>


Si lo has calculado correctamente, verás que *my_array3* es de 1 dimensión. Esto puede ser un problema cuando trabajas con matrices de 2 dimensiones (y con vectores que se consideran de 2D con uno de los tamaños igual a 1). Para resolver esto, _numpy_ proporciona la constante _newaxis_.




In [24]:
my_array3 = my_array3[:, np.newaxis] #hace de un vector de numeros, una matrix nx1

>**Ejercicio**: Consulta de nuevo la dimensión de *my_array3*.


In [25]:
print(np.shape(my_array3))
print(my_array3.ndim)

(2, 1)
2


In [8]:
#<SOL>

#<SOL>

Otro método importante de manipulación de array es _concatenation_ o _stacking_. Es útil para siempre declarar en qué dirección queremos apilar arrays. Por ejemplo, en la siguiente celda apilamos verticalmente. 

In [26]:
print(np.concatenate( (my_array, my_array2) , axis=1)) # columnwise concatenation

[[1 2 1 2 3]
 [3 4 4 5 6]]


> **Ejercicio**: *Concatena* la primera columna de *my_array* y la segunda columna de *my_array2*

In [27]:
print(np.concatenate( (my_array[:, 0], my_array2[:, 1]), axis=0))

[1 3 2 5]


In [11]:
#<SOL>

#help(np.concatenate)
#<SOL>

Puedes crear _numpy_ arrays de diferentes formas, no sólo a partir de listas. Por ejemplo _numpy_ proporciona un número de funciones para crear tipos especiales de matrices.

> **Ejercicio**: Crea 3 arrays usando _ones_, _zeros_ and _eye_. Si tienes alguna duda sobre los parámetros de las funciones, mira en la ayuda con la función _help( )_.

In [28]:
print(np.ones(2))
print(np.zeros((3, 2)))
print(np.eye(3))

[1. 1.]
[[0. 0.]
 [0. 0.]
 [0. 0.]]
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [None]:
#<SOL>
#help(np.ones)
#help(np.zeros)
#help(np.eye)


#<SOL>

Además _numpy_ ofrece todas las operaciones básicas con matrices: multiplicaciones, producto escalar, ...
Puedes encontrar información sobre ellas en [Numpy manual](https://numpy.org/doc/stable/user/) 



#### 1.1.1. Suma de matrices

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])
print(A)
B = np.array([[1, 2, 3], [4, 5, 6]])
print(B)
C = A + B
print(C)

#### 1.1.2. Resta de matrices

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])
print(A)
B = np.array([[0.5, 0.5, 0.5], [0.5, 0.5, 0.5]])
print(B)
C = A - B
print(C)

#### 1.1.3. Multiplicación de matrices (element-wise)

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])
print(A)
B = np.array([[1, 2, 3], [4, 5, 6]])
print(B)
C = A * B
print(C)

#### 1.1.4. División de matrices

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])
print(A)
B = np.array([[1, 2, 3], [4, 5, 6]])
print(B)
C = A / B
print(C)

#### 1.1.5. Producto escalar de matrices

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
print(A)
B = np.array([[1, 2], [3, 4]])
print(B)
C = A.dot(B)
print(C)

#### 1.1.6. Producto de matrices y vectores

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
print(A)
B = np.array([0.5, 0.5])
print(B)
C = A.dot(B)
print(C)
D = A @ B
print(D)

#### 1.1.7. Producto de matrices y escalares

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
print(A)
b = 0.5
print(b)
C = A * b
print(C)

#### 1.1.8. Matriz transpuesta

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
print(A)
C = A.T
print(C)

#### 1.1.9. Matriz inversa

In [None]:
from numpy.linalg import inv
# define matrix
A = np.array([[1.0, 2.0], [3.0, 4.0]])
print(A)
# invert matrix
B = inv(A)
print(B)
# multiply A and B
I = A.dot(B)
print(I)

Además de _numpy_ hay librerías más avanzadas para cálculos científicos, _scipy_. [Scipy](https://docs.scipy.org/doc/scipy/) incluye módulos para álgebra lineal, procesado de la señal, transformadas de Fourier, ...

## Definiciones de vectores con un rango de valores

Por último fíjate en las siguientes definiciones de vectores. Son muy útiles en ML o cualquier problema en el que queramos explorar un conjunto de valores equiespaciados o según escala logarítmica.

In [29]:
print(np.logspace(-6, 6, 13))

[1.e-06 1.e-05 1.e-04 1.e-03 1.e-02 1.e-01 1.e+00 1.e+01 1.e+02 1.e+03
 1.e+04 1.e+05 1.e+06]


In [30]:
print(np.arange(0, 100, 2))

[ 0  2  4  6  8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46
 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94
 96 98]


> **Ejercicio**: Define un vector con puntos desde el -100 hasta el 200 y saltos de 3 en 3.

In [32]:
print(np.arange(-100, 200, 3))

[-100  -97  -94  -91  -88  -85  -82  -79  -76  -73  -70  -67  -64  -61
  -58  -55  -52  -49  -46  -43  -40  -37  -34  -31  -28  -25  -22  -19
  -16  -13  -10   -7   -4   -1    2    5    8   11   14   17   20   23
   26   29   32   35   38   41   44   47   50   53   56   59   62   65
   68   71   74   77   80   83   86   89   92   95   98  101  104  107
  110  113  116  119  122  125  128  131  134  137  140  143  146  149
  152  155  158  161  164  167  170  173  176  179  182  185  188  191
  194  197]


In [None]:
#<SOL>

#</SOL>