# Representación gráfica: ```Matplotlib```
En muchos casos es necesaria la representación de datos obtenidos con nuestros programas. Para ello Python dispone de ```Matplotlib```, una biblioteca que permite la generación de gráficos a partir de datos, que generalmente se encuentran contenidos en listas.<br>
```Matplotlib``` usa una interfaz de programación de aplicaciones (abreviada como API en inglés), denominada ```pyplot```,
que permite realizar representaciones gráficas similares a las del lenguaje de programación Matlab.<br>
Ilustramos con un ejemplo la representación de  las funciones $sin(x)$ y $cos(x)$ en el intervalo $x\in[0 , 4\pi]$:
```python
%matplotlib inline

from math       import sin, cos, pi
from matplotlib import pyplot
valores_x   = [] # inicializar lista valores de x
valores_sin = [] # inicializar lista valores de sin(x)
valores_cos = [] # inicializar lista valores de cos(x)
for i in range(101): # de i=0 a i=100
    x = 4 * pi / 100.0 * i        # i=0-->x=0; i=100-->x=4pi
    sinx = sin(x)
    cosx = cos(x)
    valores_x.append(x)
    valores_cos.append(cosx)
    valores_sin.append(sinx)
pyplot.plot(valores_x,valores_sin,'o-',label="sin(x)")
pyplot.plot(valores_x,valores_cos,'x' ,label="cos(x)")
pyplot.legend()
pyplot.xlabel("Eje x")
pyplot.ylabel("Eje y")
pyplot.title("Seno vs Coseno")
pyplot.show() # mostrar grafico
```

En las líneas 3 a 12 creamos tres listas, en las que guardamos los valores de $x$, $sin(x)$ y $cos(x)$, generados en cada iteración.<br>
En las líneas 13 y 14 ```pyplot``` usa la función ```plot()```, que genera un gráfico (o plot en inglés) con los datos de las listas.<br>
En la función ```plot()```, el primer argumento se corresponde con la lista de valores del eje de abscisas $x$, el segundo con la lista de valores de la variable dependiente o eje de ordenadas ($sin$ o $cos$), el tercer argumento indica el estilo de la representación de la función (en concreto, ```'o-'``` para círculos unidos por una línea contínua; ```'x'``` para cruces sin unir), y el argumento ```label``` permite etiquetar cada representación en la leyenda, la cual se genera en la línea 15. 
Para terminar, las últimas líneas definen el texto de los ejes, el título, y ```show()``` muestra la gráfica.

Como segundo ejemplo, podemos representar la temperatura media por mes en Santiago de Compostela a lo largo del año, al igual que las mínimas y las máximas:
```python
%matplotlib inline

from matplotlib import pyplot
meses_numero = range(12)
meses_texto = ["Ene","Feb","Mar","Abr",\
             "May","Jun","Jul","Ago",\
             "Sep","Oct","Nov","Dic"]
tmin  = [ 5.4, 5.7, 7.4, 8.4,10.4,13.1,\
         14.9,16.3,13.9,11.0, 7.9, 5.8]
tmed  = [ 8.7, 9.1,10.9,12.0,14.1,16.9,\
         18.7,20.3,17.6,14.6,11.2, 9.1]
tmax  = [12.0,12.5,14.4,15.7,17.9,20.7,\
         22.5,24.3,21.4,18.2,14.5,12.5]
pyplot.plot(meses_numero,tmin,'--bx',label='min'  )
pyplot.plot(meses_numero,tmed, '-ko',label='media')
pyplot.plot(meses_numero,tmax,'--rx',label='max'  )
pyplot.legend()
pyplot.xlabel("Mes")
pyplot.ylabel("Temperatura [Grados Celsius]")
pyplot.xticks(meses_numero,meses_texto)
pyplot.show()
```

Como novedad con respecto al ejemplo anterior, podemos destacar que:

1. La cadena ```'--bx'``` indica que se debe utilizar el color azul (```'b'``` de __b__lue), con cruces (```x```) unidas por líneas discontinuas ```'--'```.
2. La cadena  ```'-kx'``` indica que se debe utilizar el color negro (```'k'``` de blac __k__), con círculos ```'o'``` unidos por líneas continuas ```'-'```.
3. La cadena ```'--rx'``` indica lo mismo que la cadena ```'--bx'```, pero empleando el color rojo (```'r'``` de __r__ed).
4. Con ```pyplot.xticks``` podemos poner cadenas (definidas en ```meses_texto``` en las posiciones deseadas del eje x (las definidas por ```meses_numero```)


## Tratamiento de datos
El siguiente programa hace un ajuste de mínimos cuadrados lineales. Se trata de determinar los coeficientes $a$ y $b$ de la ecuación lineal $ax+b$, que se ajusta a $n$ puntos $(x_{i}, y_{i})$. El programa incluye el cálculo del coeficiente de correlación de Pearson. Estas son las ecuaciones:<br>

\begin{equation}
a=\frac{n\sum x_{i}y_{i}-\sum x_{i}\sum y_{i}}{n\sum x_i^{2}- \left( \sum x_{i}\right)^{2}} 
\end{equation}

\begin{equation}
b=\frac{\sum y_{i}-a\sum x_{i}}{n} 
\end{equation}

\begin{equation}
r=\frac{n \sum x_{i}y_{i}-\sum x_{i}\sum y_{i}}{\sqrt{ \left( n \sum x_{i}^{2}- \left( \sum x_{i}\right)^{2} \right) \left(n \sum y_{i}^2- \left( \sum y_{i}\right)^{2} \right) }}
\end{equation}

La función de Python que implementa estas ecuaciones es la siguiente:
```python
def ajuste(x,y):
    '''
    Función que hace un ajuste de minimos cuadrados lineales de 
    acuerdo a las ecuaciones de arriba
    x e y son los datos de entrada (arrays de numpy)
    El ajuste es a una ecuación lineal: a * x + b
    '''
    sumx  = sum(x)     ; sumy  = sum(y)
    sumx2 = sum(x * x) ; sumy2 = sum(y * y)
    sumxy = sum(x * y) ; xave  = sumx / len(x)
    a = (len(x) * sumxy - sumx * sumy) / (len(x) * sumx2 - sumx ** 2)
    b = (sumy - a * sumx) / len(x)
    r = (len(x) * sumxy - sumx * sumy) / ((len(x) * sumx2 - sumx ** 2) * (len(x) * sumy2 - sumy ** 2)) ** 0.5
    return a , b , r
```
Fíjate que los arrays de numpy (x e y) son mucho más potentes que las listas y nos permiten hacer operaciones que en las listas no es posible hacer.

Con la función de arriba podríamos resolver el siguiente problema:<br>
La viscosidad reducida $\eta$ (en unidades arbitrarias) a 25ºC de una muestra de polibencil-L-glutamato (PG) (en unidades arbitrarias) disuelta en ácido dicloacético varía con la concentración de la disolución de la siguiente manera:


| $[PG]$    &nbsp;&nbsp;         | $\eta$   |
|-------------------|----------|
|  1.04     &nbsp;&nbsp;         | 0.0942   |
|  1.40     &nbsp;&nbsp;         | 0.0950   |
|  2.08     &nbsp;&nbsp;         | 0.0962   |
|  2.60     &nbsp;&nbsp;         | 0.0973   |
|  3.10     &nbsp;&nbsp;         | 0.0981   |
|  3.68     &nbsp;&nbsp;         | 0.0992   |


Usando el mismo programa que en los ejercicios anteriores, se puede determinar la viscosidad intrínseca del PG, sabiendo que se puede calcular como el valor de $\eta$ para $[PG]=0$. También podríamos hacer una representación gráfica. Para ejecutar este programa primero necesitamos subir el fichero ```viscosidad.csv```.
```python
%matplotlib inline
import numpy as np
from matplotlib import pyplot

#cargamos los datos de viscosidad
file = 'viscosidad.csv'
x, y = np.loadtxt(file , delimiter = ',',skiprows = 1, unpack = True)
a, b , r = ajuste(x,y)

#Imprimimos los resultados
print("Ajuste    : ",round(a,4),"* x +",round(b,4))
print("Valor de r: ",round(r,5))

#Hacemos la gráfica
fit = a * x + b
pyplot.plot(x,y,'o',label="data")
pyplot.plot(x,fit,'-',label="fit")
pyplot.xlim(0,4)
pyplot.legend()
pyplot.show()
```

Los datos que se recogen en la siguiente tabla corresponden a la reacción de formación de urea a partir de cianato amónico (CA): 

|  $t$   &nbsp;&nbsp;   | $[CA]^{-1}$  |
|----------|----------------|
|    0   &nbsp;&nbsp;   | 2.620   &nbsp;&nbsp;   |
|   20   &nbsp;&nbsp;   | 3.774   &nbsp;&nbsp;   |
|	50   &nbsp;&nbsp;   | 5.556   &nbsp;&nbsp;   |
|	65   &nbsp;&nbsp;   | 6.593   &nbsp;&nbsp;   |
|	150  &nbsp;&nbsp;   | 11.538  &nbsp;&nbsp;   |

La reacción es de orden dos y por tanto la ecuación de velocidad es la siguiente:
\begin{equation}
\frac{1}{[CA]_{t}}-\frac{1}{[CA]_0}=kt
\end{equation}

donde $t$ es el tiempo en minutos, $[CA]$ es la concentración de A en M, y $k$ es la constante de velocidad.

__Usando el mismo programa que en el ejercicio anterior, determina el valor de la constante de velocidad.__