<a href="https://colab.research.google.com/github/financieras/pyCourse/blob/main/jupyter/calisto3/calisto3_0030.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# NumPy [1] Diferencia entre lista y dnarray
Paquete para cómputo científico: NumPy o Numeric Python.
Permite:
- trabajar con vectores o matrices denominadas **ndarray** (similar a una lista, pero mejor) ndarray significa n-dimensional array
- hacer cálculos matemáticos y estadísticos

NumPy ya está instalado en Anaconda, pero si trabaja fuera de este entorno es posible que necesite instalarlo así:  
pip3 install numpy    # pip3 es la versión del instalador pip para Python 3

## Diferencia entre lista y dnarray 
* Las listas pueden estar compuestas de datos de tipos diferentes, por el contrario, los ndarrays deben ser de uniformes 
* Los ndarrays son más adecuados para trabajar en álgebra, son más flexibles

In [None]:
import numpy as np             # importamos la librería NumPy como np
vector = np.array([2, 4, 6])   # ndarray
lista = [1, 3, 5]              # lista
print(vector)                  # pares
print(lista)                   # impares

In [None]:
                               # añadiendo un valor a una lista con append
lista.append(7)
print(lista)
                               # añadiendo un nuevo elemento a un array --> ¡Sorpresa!
print(vector + np.array(8))    # no añade 8 al array de los pares, lo que hace es sumarlo a todos
vector+np.array(8)             # si no ponemos print aparece como: array([10, 12, 14])

In [None]:
np.append(vector, 8)           # para hacer un append con un ndarray

In [None]:
                               # sumando listas
a = [1, 2, 3]
b = [4, 5, 6]
print(a + b)                   # la suma de listas es una concatenación

                               # sumando arrays
x = np.array(a)
y = np.array(b)
print(x + y)                   # la suma de arrays si suma los valores como en álgebra

## ¿Por qué un ndarray es más flexible que una lista?
Supongamos que tenemos dos listas una con la altura de 11 personas y otra con su peso.  
Deseamos poder calcular el IMC (Índice de Masa Corporal) ratio que es peso / altura\*\*2.

In [None]:
altura=[1.6, 1.71, 1.82, 1.52, 1.59, 1.95, 1.71, 1.75, 1.66, 1.56, 1.99]
peso=[48.8, 57.4, 87.2, 39.5, 51.5, 97.4, 55.2, 52.2, 52.7, 50.6, 76.1]
type(peso)

list

Veamos que al calcular el IMC con listas obtenemos un error.

In [None]:
#IMC = peso / altura**2        # TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

Vamos ahora a ver que los ndarray son mucho más flexibles.

Primero los creamos.

In [None]:
import numpy as np               # Importamos la librería NumPy
np_peso = np.array(peso)         # creamos el array para el peso
np_altura = np.array(altura)     # creamos el array para la altura
print(type(np_peso))             # veamos el tipo de un ndarray
np_altura                        # mostramos el array para la altura, así se ve un ndarray

<class 'numpy.ndarray'>


array([1.6 , 1.71, 1.82, 1.52, 1.59, 1.95, 1.71, 1.75, 1.66, 1.56, 1.99])

Finalmente calculamos el IMC de forma sencilla y elegante.

In [None]:
IMC = np_peso / np_altura**2
IMC

array([19.0625    , 19.62997162, 26.32532303, 17.09660665, 20.37102963,
       25.61472715, 18.87760337, 17.04489796, 19.12469154, 20.79224195,
       19.21668645])

In [None]:
# Funciona el referirnos a los elementos del vector por el índice
IMC[2]                   # muestra el tercer elemento del array

In [None]:
IMC > 23                 # obtenemos un vector con verdaderos y falsos

In [None]:
# muestra los elementos con sobrepeso
IMC[IMC > 23]            # muestra solo los valores de IMC que son True en el vector

Vamos a realizar un gráfico con la nube de puntos entre peso (x) y altura (y).  
También necesitamos importar la librería matplotlib para la representación gráfica.

In [None]:
import matplotlib.pyplot as plt
x = np_peso
y = np_altura
plt.scatter(x, y)               # scatter para nube de puntos y plot para líneas
plt.xlabel("Peso (Kg)")
plt.ylabel("Altura (m)")
#plt.show()                     # muestra el gráfico
plt.grid()                      # muestra el gráfico con rejilla

## Creamos un ndarray

In [None]:
import numpy as np
numeros_primos=[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]  # esto es una lista normal
numeros_primos

### Caso 1  
Creando un array en numpy a partir de una lista.

In [None]:
array_primos = np.array(numeros_primos)
array_primos                               # se parece a una lista normal, pero es un objeto llamado ndarray

### Caso 2  
Inicializando un array con ceros en numpy.

In [None]:
array_zeros=np.zeros(10)
array_zeros

### Caso 3  
Crear arrays con números.

In [None]:
array_numeros = np.arange(10)
array_numeros

### Caso 4  
Creando arrays de series de números con un cierto paso.

In [None]:
array_pares = np.arange(0, 20, 2)
array_pares

### Caso 5  
Haciendo un reshape para dos dimensiones

In [None]:
array_pares.reshape(2, 5)      # obtenemos una matriz de 2 filas y 5 columnas

### Caso 6  
La forma habitual de obtener una matriz de dos dimensiones.  
Partimos de una lista de listas que vamos a llamar lista2d.  
Tiene 3 filas y 4 columnas. Es de dimensión 3×4.

In [None]:
lista2d = [[11,12,13,14], [21,22,23,24], [31,32,33,34]]
lista2d

Convertimos la lista de listas en un ndarray.

In [None]:
matriz2d = np.array(lista2d) # al ndarray le llamamos matriz2d
matriz2d

### Caso 7  
Veamos otro caso con reshape de dimensión 3×5.  
Observe que 3×5=15.

In [None]:
m = np.arange(15).reshape(3, 5)
m

#### Ejercicio
Cree una matriz de 20 elementos de números aleatorios entre 10 y 99, con 4 filas.

In [None]:
from random import sample
lista = sample(range(10, 100), 20)
array=np.array(lista)
m = array.reshape(4, 5)
m