<img src="images/logo_verde_horz.png" width="600">

In [3]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

## Broadcasting

Las operaciones básicas (suma, resta, etc.) se hacen elemento por elemento y funciona en arrays de diferente tamaño.

La imagen siguiente da un ejemplo de **broadcasting**

<img src="images/broadcasting.png">

In [None]:
a = np.array([[0], [10], [20], [30]])
a

In [None]:
b = np.array([0, 1, 2])
b

In [None]:
a + b

## Manipulación de formas

### Colapsar

Reducir una matriz de múltiples dimensiones y la colapsa a una dimensión.

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a.ravel()

In [None]:
a.T

In [None]:
a.T.ravel()

### Reformar

La operación inversa a colapsar.

In [None]:
b = a.ravel()
b

In [None]:
b.reshape((2,3))

In [None]:
b.reshape((3,2))

## Manejo de Archivos

### Tablas
Demos una mirada al archivo `/data/populations.txt`

|year|hare|lynx|carrot|
|----|----|----|------|
|1900|30000|    4000|     48300|
|1901|47200|  6100|   48200|
|1902|70200|  9800|   41500|
|1903|77400|  35200|  38200|

In [None]:
# Leer datos desde archivo
data = np.loadtxt('data/populations.txt')
data

## Ejercicio:
Genere un gráfico para observar el cambio en la población de liebres y de linces a lo largo de los años

In [18]:
# Almacenar datos en formato texto

# Suponga que se ha cometido un error, y los datos de población de linces,
# reportados en miles, se trataba en realidad de centenares. Corrija la
# columna respectiva y almacene la tabla con un nuevo nombre utilizando:

np.savetxt('data/pop2.txt', data, fmt='%5.i',  delimiter='\t')

### Formato Numpy

Numpy tiene su propio formato binario.

In [None]:
data = np.ones((3,3))
data

In [11]:
np.save('data/ones.npy', data)

In [None]:
data3 = np.load('data/ones.npy')
data3

## Resumen

- Sabe crear arrays: `array`, `arange`, `ones`, `zeros`, `rand`
- Conoce la forma de un array `shape` y los diferentes métodos de indexado para obtener diferente secciones del array `array[::2]`, etc.
- Ajustar la forma de un array usando `reshape` o aplanarla con `ravel`
- Obtener un subconjunto de elementos de un array y modificar sus valores usando mascaras `a[a < 0] = 0`
- Conocer operaciones miscelanes con arrays, encontrar el máximo `array.max()` o la media `array.mean()`, entre otras.
- Tiene una idea básica del **broadcasting** y sus reglas.


## Análisis de Vinos

Usando los resultados de un análisis químico de vinos obtenidos de la misma región en Italia pero de tres diferentes cultivos. Examine el archivo `data/wine.csv`.

Los atributos del dataset son:

0. Wine (Class)
1. Alcohol 
2. Malic acid 
3. Ash 
4. Alcalinity of ash 
5. Magnesium 
6. Total phenols 
7. Flavanoids 
8. Nonflavanoid phenols 
9. Proanthocyanins 
10. Color intensity 
11. Hue 
12. OD280/OD315 of diluted wines 
13. Proline 

---
#### Truco:
Use `np.set_printoptions(suppress=True, precision=3)` para imprimer los datos de una manera mas legible.


### Ejercicios

1. Lea los datos desde la ruta `data/wine.csv`, use el parámetro `delimiter=','` para valores separados por coma.
2. Determine entre las 3 clases de vinos, cual tiene el mayor promedio de Alcohol.
3. Un vino con concentración de ácido málico mayor a `3.5` se considera demasiado maduro, cuántos vinos tienen una concentración mayor?
4. Usando el comando `plt.hist(array)` cree un histograma de ácido málico.
5. Normalice entre [0,1] los datos de Alcohol e Intensidad de Color
6. Usando el comando `plt.scatter(array1, array2)` cree un gráfico de dispersión de las dos columnas normalizadas.

In [17]:
np.set_printoptions(suppress=True, precision=3)


array([[   1.  ,   14.23,    1.71, ...,    1.04,    3.92, 1065.  ],
       [   1.  ,   13.2 ,    1.78, ...,    1.05,    3.4 , 1050.  ],
       [   1.  ,   13.16,    2.36, ...,    1.03,    3.17, 1185.  ],
       ...,
       [   3.  ,   13.27,    4.28, ...,    0.59,    1.56,  835.  ],
       [   3.  ,   13.17,    2.59, ...,    0.6 ,    1.62,  840.  ],
       [   3.  ,   14.13,    4.1 , ...,    0.61,    1.6 ,  560.  ]])