<a href="https://colab.research.google.com/github/molecular-mar/ws_python_quimica/blob/main/PythonQuimiK2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python para Química, Parte 2

![](https://upload.wikimedia.org/wikipedia/commons/c/c3/Python-logo-notext.svg)


**45 Aniversario del Departamento de Química, UAM-Iztapalapa**

![](https://drive.google.com/uc?id=1plp-jwWtq6rOMZDBVonAsO3fraqJeZDJ)


### **En esta parte, exploraremos el uso de algunas de las bibliotecas más utilizadas en Python.**

# NumPy

Ofrece varias herramientas para el uso de arreglos de varias dimensiones (vectores, matrices).

Algunas características de NumPy

* NumPy propaga operaciones a todos los valores de un arreglo/lista, sin necesidad de ciclos for.

* Tiene un agran cantidad de funciones para trabajar con datos numéricos

* Muchas de sus funciones son *envoltorios* de código en  C, lo que lo hace muy rápido.

* Pandas usa NumPy para realizar la propagación de operaciones.


In [None]:
import numpy as np

## Arreglos

In [None]:
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
print(2 * arr) # ¿Cómo haríamos esto usando listas?

In [None]:
# Para crear un arreglo de numpy
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]  # list
arr = np.array(a)
arr

### Arreglos usando secuencias

In [None]:
# Con arange generamos secuencias como al usar range
# arange(inicio, fin(no inclusivo), paso)
arr = np.arange(0, 10, 0.5)
arr

In [None]:
# Con linspace debemos indicar el número de divisiones
# linspace(inicio,fin(inclusivo),divisiones)
arr = np.linspace(0,10, 20)
arr

In [None]:
# Arreglos de ceros
np.zeros((2,4))

In [None]:
# Arreglos de unos
np.ones(10)

In [None]:
# Un arreglo con 3s
arr = np.zeros((2,4))
arr += 3
print(arr)

In [None]:
# También podemos generar arreglos usando funciones
def prod(x, y):
    return x * y

In [None]:
np.fromfunction(prod, (3,3))

### Cambiando la forma del arreglo


In [None]:
# Para determinar la forma del arreglo, podemos usar shape y size
matriz1 = np.ones((4,5))

In [None]:
print(matriz1.size)
print(matriz1.shape)

In [None]:
# Podemos cambiar la forma del arreglo
array_1D = np.linspace(0, 9.5, 20)
array_2D = np.reshape(array_1D, (4, 5))
array_2D

In [None]:
# Si solo sabemos una de las dimensiones esperadas,
# podemos usar -1 en la otra dimensión.
array_2D2 = np.reshape(array_1D, (5, -1))
array_2D2

In [None]:
# Para volverlo unidimensional (aplanarlo)
array_2D.flatten()

In [None]:
# Podemos generar la transpuesta
array_2D.T # Compara con array_2D2

In [None]:
# Vamos a unir dos arreglos
a = np.arange(0, 5)
b = np.arange(5, 10)

Hay varias formas de unir  arreglos:
![](https://github.com/weisscharlesj/SciCompforChemists/raw/master/notebooks/chapter_04/img/stack.png)

Para ello usaremos `np.vstack()`, `np.column_stack()`, `np.dstack()`, y `np.hstack()`.

In [None]:
np.vstack((a, b))

In [None]:
np.hstack((a, b))

In [None]:
np.dstack((a, b))

In [None]:
np.column_stack((a,b))

In [None]:
# ¿Cuál es la diferencia entre dstack y column_stack?

In [None]:
# ¿Otra forma de generar el resultado de column_stack?

### Índices en Numpy



In [None]:
# Para un arreglo de una dimensión, es igual que con listas
array_1D[5]

In [None]:
# Para un arreglo multidimensional, podemos hacer varias cosas
array_2D[1] # Una fila completa

In [None]:
array_2D[1][0] # Un solo elemento

In [None]:
array_2D[1,0] # Equivalente

In [None]:
array_2D[:,1] # Una columna

In [None]:
# ¿Cómo accedemos al último elemento?

### Operaciones vectorizadas


In [None]:
#Numpy incluye funciones que actúan sobre todos los elementos de los arreglos
cuadrados = np.array([1, 4, 9, 16, 25])
np.sqrt(cuadrados) # Esto no es posible con sqrt del paquete math

In [None]:
# Operaciones con escalares y arreglos
3 * np.array([[5, 6], [7, 8]])

In [None]:
# Entre arreglos del mismo tamaño
a = np.array([[1,2], [3,4]]) 
b = np.array([[5,6], [7,8]]) 
a + b # Prueba con otras operaciones

### Transmisión o Broadcasting

Para lidiar con dimensiones distintas, NumPy 'clona' el arreglo de menor dimensión para igualar al de mayor dimensión.

In [None]:
a = np.array([[1,2], [3,4]])
b = np.array([2,2])
a + b

In [None]:
# ¿Tiene sentido con la operación con el escalar?

In [None]:
# No siempre es posible
a = np.array([[1,2], [3,4]])
b = np.array([[1,1,1], [2,2,2], [3,3,3]]) 
a + b

### Vectorizando otras funciones

In [None]:
def velocidad(k, conc):
    '''
    Calcula la velocidad de una reacción de primer orden
    '''
    return k * conc

In [None]:
concentraciones = [0.1, 0.5, 1.0, 1.5, 2.0]

In [None]:
vvelocidad = np.vectorize(velocidad)
vvelocidad(1.2, concentraciones)

### Números aleatorios

Dependiendo de nuestras necesidades, podemos generar números aleatorios de igual probabilidad o que sigan alguna distribución.

In [None]:
# Para generar números de una distribución uniforme
# igualmente probables
np.random.rand(10) # Genera floats en [0,1)

In [None]:
#Genera enteros en un rango
np.random.randint(0, high=10, size=10)

In [None]:
# De una distribución binomial (piensa en volados)
# binomial(número_de_monedas, probabilidad_de_obtener_1, números_a_generar)
np.random.binomial(2, p=0.5, size=100)

In [None]:
# Distribución de Poisson
# poisson(promedio_estadístico,n)
np.random.poisson(lam=3.6, size=30)

In [None]:
# Distibución normal (estándar, centrada en 0)
np.random.randn(10)

---
# Manejo de datos con Pandas

La biblioteca pandas nos ofrece herramientas para trabajar con datos en forma de tablas. Puede usarse como sustituto de Excel.

In [None]:
import pandas as pd

## Objetos básicos

Podemos definir *series*, similares a las listas.


In [None]:
masas = pd.Series([1.01,4.00,6.94,9.01,10.81])
masas # ¿Qué diferencias notas con una lista?

In [None]:
# Podemos acceder a los elementos usando índices
masas[0]

A diferencia de las listas, podemos modificar los índices.

In [None]:
indices=('H', 'He', 'Li', 'Be', 'B')
masas2 = pd.Series([1.01,4.00,6.94,9.01,10.81], indices)
masas2

In [None]:
masas2['H']

In [None]:
# Para acceder a los indices
masas2.index

In [None]:
# Para modifical indices de series ya definidad
masas.index=['H', 'He', 'Li', 'Be', 'B']
masas

In [None]:
# Podemos acceder aún así usando índice de posición usando iloc
masas2.iloc[2] 

El otro objeto básico en pandas son los *DataFrames*. Estos incluyen columnas, formando tablas. Puede pensarse como un conjunto de Series del mismo tamaño.

In [None]:
# Datos de los primeros 5 elementos
name = ['hidrogeno', 'helio', 'litio', 'berilio','boro']
numero_z = [1,2,3,4,5]
masa = [1.01,4.00,6.94,9.01,10.81]
EI = [13.6, 24.6, 5.4, 9.3, 8.3] # energia de ionización

In [None]:
columnas = ['H', 'He', 'Li', 'Be','B'] 
indices = ['nombre', 'Z', 'masa', 'EI']
elementos = pd.DataFrame([name, numero_z, masa, EI], 
                        columns=columnas, index=indices)
elementos

Podemos acceder a los datos de un DataFrame de distintas formas.

In [None]:
# Por nombre de la columna
elementos['Li'] 

In [None]:
# Para acceder por columna
elementos.loc['EI']

In [None]:
# Ambas formas nos regresaron una Serie
numero_atomico = elementos.loc['Z']
numero_atomico['Li']

In [None]:
# Para acceder a un elemento de la tabla
elementos.loc['EI', 'Li'] # Damos columna y fila 

In [None]:
# Usando indices de posición (podemos usar slicing)
elementos.iloc[2:, 2]

In [None]:
#Podemos usar listas para especificar varios indices/columnas
elementos.loc[['EI','masa'],'H']

## Lectura y escritura de datos

Es posible leer y escribir distintos formatos de datos:

* CSV (Comma Separated Values)
* Excel (.xls, .xlsx)
* HTML
* JSON

Estos datos pueden ser leidos desde un archivo o una dirección web.

`pd.read_table()` es una función general para importar archivos de texto donde cada linea es una fila y los datos en cada fila están separados por caracteres o espacios. Para especificar el separador pueden usarse los argumentos `delimiter` o `sep` (son equivalentes), o definir `delim_whitespaces = True`.

Leamos un archivo .pdb para benceno: https://github.com/weisscharlesj/SciCompforChemists/blob/master/notebooks/chapter_05/data/benzene.pdb

In [None]:
benz_url = 'https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_05/data/benzene.pdb'
benz = pd.read_table(benz_url, delim_whitespace=True, 
                     skiprows=2, skipfooter=13, header=None)

In [None]:
benz

## Reto

A partir de la tabla anterior crea una nueva tabla que solo contenga los símbolos de los átomos y sus coordenadas xyz. Ajusta los nombres de columnas para que sean adecuados.

In [None]:
# Pon aquí tu respuesta

## Lectura y escritura (cont.)

También podemos utilizar `read_csv()` para leer archivos, con la diferencia de que el separador default es la coma (pero aún podemos modificar eso). Intenta cambiar arriba la función y ve que ocurre.

Para escribir un archivo csv, podemos utilizar `to_csv()`, el cuál nos genera un archivo separado por comas.

In [None]:
elementos.to_csv('elementos.csv') #Verifica el archivo generado

In [None]:
#Podemos leer de vuelta el archivo
leer_elementos = pd.read_csv('elementos.csv')
leer_elementos

También podemos trabajar con archivos de Excel. Puedes descargar este ejemplo: https://docs.google.com/spreadsheets/d/164mNRnl1mDSGxHQOIvb959xmOR4ZQFokkVYPXwMol9w/edit?usp=sharing



In [None]:
import openpyxl
import pandas as pd
titulacion = pd.read_excel('datospex1lqa.xlsx', skiprows=1, skipfooter=15, sheet_name='Hoja1')
titulacion

## Explorando los datos

In [None]:
# Puedes ver una parte del inicio (head)
titulacion.head()

In [None]:
# Y del final
titulacion.tail()

In [None]:
# Para obtener una descripción de los datos
titulacion.describe()

In [None]:
#Conteo de apariciones de cada valor
titulacion['pH'].value_counts()

In [None]:
# Podemos realizar algunas operaciones
titulacion.mean()

In [None]:
titulacion['V'].sum()

## Modificando DataFrames

Podemos agregar columnas.

In [None]:
# Podemos insertar columnas
elementos

In [None]:
elementos['C'] = ['carbono', 6, 12.01, 11.3]
elementos

In [None]:
# Podemos crear una serie para nitrogeno. Si especificamos los indices el orden
# no importa
nitrogeno = pd.Series([7, 14.01, 'nitrogeno', 14.5], 
                     index=['Z', 'masa', 'nombre', 'EI'])
nitrogeno


In [None]:
elementos['N'] = nitrogeno
elementos

También podemos eliminar filas y columnas

In [None]:
elementos.drop('H', axis=1)

In [None]:
# ¿Qué significa axis 0 o 1?
elementos.drop('EI', axis=0)

Unir DataFrames:

In [None]:
datos_quim1 = [['MM', 58.08, 32.04], ['dipolo', 2.91, 1.69], 
             ['formula', 'C3H6O', 'CH3OH']] 
columnas=['propiedad','acetona', 'metanol']
df_quim1 = pd.DataFrame(datos_quim1, columns=columnas)
df_quim1

In [None]:
datos_quim2 = [['formula', 'C6H6', 'H2O'], ['dipolo', 0.00, 1.85], 
            ['MM', 78.11, 18.02]]
df_quim2 = pd.DataFrame(datos_quim2 , columns=['propiedad', 'benceno', 'agua'])
df_quim2

In [None]:
#Usamos merge para unir ambos df
df_quim1.merge(df_quim2)

In [None]:
# Dos df con columnas distintas
tabla1 = pd.DataFrame({'elemento':['Co', 'Fe', 'Cr','Ni'], 
                       'protones': [27, 26, 24, 28]})
tabla2 = pd.DataFrame({'metal':['Fe', 'Co', 'Cr', 'Ni'], 
                       'EI': [7.90, 7.88, 6.79, 7.64]})

In [None]:
# Indicamos que columnas usar para alinear
tabla1.merge(tabla2, left_on='elemento',right_on='metal')

Podemos también concatenar. ¿En qué difiere de unir?

In [None]:
groupo1 = pd.DataFrame({'metal':['Mg', 'Al', 'Ti', 'Fe'], 
                       'densidad': [1.77, 2.73, 4.55, 7.88]})
groupo2 = pd.DataFrame({'metal':['Al', 'Mg', 'Ti', 'Fe'], 
                       'densidad': [2.90, 1.54, 4.12, 8.10]})

In [None]:
pd.concat((groupo1, groupo2))

In [None]:
# Especificando el eje

In [None]:
# ¿Y si usamos merge?

# Gráficas con matplotlib

Esta biblioteca es una de las más utilizadas para realizar gráficas. Forma parte del compendio SciPy.

In [None]:
# Para comenzar, debemos importar la biblioteca
import matplotlib.pyplot as plt #Solamente importamos el modulo pyplot, una parte de todo el paquete

## Funcionamiento básico

Comencemos generando algunos datos para graficar. Por ejemplo, usando la función de onda ($\psi$) del orbital atómico 3s de hidrógeno ($r$ en Bohrs).

$$ \psi_{3s} = \frac{2}{27}\sqrt{3}(2r^{2/9} - 2r + 3)e^{-r/3} $$

![Densidad electrónica de orbitales s hidrogenoides](https://cdn.kastatic.org/ka-perseus-images/867daad52b2895a83b5f3723828dfd0403e78f53.jpg)

In [None]:
#Definimos una funcion que evalue esta expresion
import math

def orbital_3S(r):
    wf = (2/27)*math.sqrt(3)*(2*r**2/9 - 2*r + 3)* math.exp(-
         r/3) #Podemos romper algunas expresiones
              #para que sean más faciles de leer
    return wf

In [None]:
# Generemos algunos valores. Intentemos entender las siguientes expresiones:
r = [num / 4 for num in range(1, 150, 3)]
psi_3s = [orbital_3S(num) for num in r]

In [None]:
# Lo anterior es un ejemplo de formas pythonicas de hacer una tarea. No siempre
# son muy intuitivas, pero suelen ser muy practicas.

In [None]:
# Usamos la función plot de plt
plt.plot(r,psi_3s,'o') #Argumentos: x, y, marcador

Hay varios parámetros que podemos ajustar:

* Marcadores:  o , * , ^ , s , p
* Linea: - , -- , -. , :
* Colores: r, b, g, k, m, c, y

Los keywords correspondientes son **marker**, **linestyle** y **color**. Todos estos keywords deben ser 'cadenas'.





In [None]:
#Repite el gráfico modificando los parámetros anteriores.
plt.plot(r,psi_3s)

Muchos parámetros de matplotlib tienen formas abreviadas:

* linestyle -> ls
* linewidth -> lw
* color -> s
* markersize -> ms

Además, puedes usar un par de color + linea o marcador: 'ro' , 'k-'

In [None]:
# Prueba con estas otras instrucciones

In [None]:
# ¿Qué le falta a nuestro gráfico?
plt.plot(r, psi_3s, 'go-')
plt.xlabel('r (Bohrs)')
plt.ylabel('$\Psi$') # Notación de LaTeX
plt.title('Función de onda radial 3s de hidrógeno')

In [None]:
# Podemos cambiar el tamaño del gráfico
plt.figure(figsize=(8,4))
plt.xlabel('r (Bohrs)')
plt.ylabel('$\Psi$') # Notación de LaTeX
plt.title('Función de onda radial 3s de hidrógeno')
plt.plot(r, psi_3s, 'go-')


In [None]:
#También podemos guardar la imagen
plt.plot(r, psi_3s, 'go-')
plt.savefig('H3s.png', format='PNG', dpi=600)


## Tipos de gráficos

### Gráfico de barras

Grafiquemos las masas atómicas de los primeros 10 átomos de la tabla periódica.

In [None]:
numero_Z = [x + 1 for x in range(10)]
masa_atomica = [1.01, 4.04, 6.94, 9.01, 10.81, 12.01, 14.01, 16.00, 19.00, 20.18]

In [None]:
plt.bar(numero_Z, masa_atomica) #Para generar gráficos de barras
plt.xlabel('Número atómico')
plt.ylabel('Masa molar, g/mol')

### Gráfico de dispersión

Además de usar plt.plot(), podemos usar plt.scatter().

Usaremos un conjunto de datos famoso sobre vinos 🍷.

In [None]:
# Estamos usando la biblioteca scikit-learn para obtener los datos.
# Esta biblioteca se utiliza para machine learning
from sklearn.datasets import load_wine
wine = load_wine()
wine = wine.data

In [None]:
# Wine es una practicamente una tabla, formada de listas de listas
wine

In [None]:
plt.scatter(wine[:,0], wine[:,5], c=wine[:,12]) # Analiza los indices usados
plt.xlabel('Contenido de alcohol') # columna 0
plt.ylabel('Alcalinidad de la ceniza') # columna 5
cbar = plt.colorbar()
cbar.set_label('Contenido de prolina') #columna 12

### Histogramas

Tenemos una lista de calores específicos $Cp$ para varios metales. Queremos ver como se distribuyen estos valores.

In [None]:
Cp = [0.897, 0.207, 0.231, 0.231, 0.449, 0.385, 0.129, 
      0.412, 0.128, 1.02, 0.140, 0.233, 0.227, 0.523,
      0.134, 0.387]

plt.hist(Cp, bins=10, edgecolor='k') #Para generar el histograma
plt.xlabel('Calor específico, J/gC')
plt.ylabel('Número de metales')

In [None]:
#En lugar de dar el número de bins, damos los intervalos
plt.hist(Cp, bins=[0, 0.2, 0.4, 0.6, 0.8, 1.0], edgecolor='k')
plt.xlabel('Calor específico, J/gC')
plt.ylabel('Numero de metales')


In [None]:
# Hay muchos otros tipos de gráficos
import numpy as np
theta = np.arange(0, 360,0.1)
r = [abs(0.5 * (3 * math.cos(num)**2 - 1)) for num in theta]
plt.figure(figsize=(8,8))
plt.polar(theta, r)
plt.title('Orbital ' + '$d_{z^2}$')

## Varios gráficos en uno

In [None]:
def orbital_3P(r):
    wf = (math.sqrt(6)*r*(4-(2/3)*r)*math.e**(-r/3))/81
    return wf

In [None]:
r = [num / 4 for num in range(1, 150, 3)]
psi_3p = [orbital_3P(num) for num in r]

In [None]:
# Para tener multiples gráficas
plt.plot(r, psi_3s)
plt.plot(r, psi_3p)
plt.xlabel('Radio, Bohrs')
plt.ylabel('Función de onda')


In [None]:
# O también:
plt.plot(r, psi_3s, 'bo', r, psi_3p,'r^')
plt.xlabel('Radio, Bohrs')
plt.ylabel('Función de onda')

In [None]:
#Agregamos leyendas
plt.plot(r, psi_3s, label='Orbital 3s')
plt.plot(r, psi_3p, label='Orbital 3p')
plt.xlabel('Radio, Bohrs')
plt.ylabel('Función de onda')
plt.legend()

## Gráficos múltiples

In [None]:
plt.figure(figsize=(12,4)) 

plt.subplot(1,2,1) # primer subgráfico
plt.plot(r, psi_3s)
plt.hlines(0, 0, 35, linestyle='dashed', color='C1')
plt.xlabel('Radio, Bohrs')
plt.title('Orbital 3s')

plt.subplot(1,2,2) # segundo subgráfico
plt.plot(r, psi_3p)
plt.hlines(0, 0, 35, linestyle='dashed', color='C1')
plt.xlabel('Radio, Bohrs')
plt.title('Orbital 3p')


In [None]:
# Otra forma
fig = plt.figure(figsize=(8,6))

ax1 = fig.add_subplot(2,1,1)
ax1.plot(r, psi_3s)
ax1.hlines(0, 0, 35, linestyle='dashed', color='C1')
ax1.set_title('Orbital 3s')
ax1.set_xlabel('Radio, $a_u$')


ax2 = fig.add_subplot(2,1,2)
ax2.plot(r, psi_3p)
ax2.hlines(0, 0, 35, linestyle='dashed', color='C1')
ax2.set_title('Orbital 3p')
ax2.set_xlabel('Radio, $a_u$')

plt.tight_layout()

Gráfico de Ramachandran -> [Nat. Chem. Biol. 2016, 12, 46-50](https://doi.org/10.1038/nchembio.1976)

In [None]:
rama = np.genfromtxt('https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_03/data/hydrogenase_5a4m_phipsi.csv', 
                     delimiter=',', skip_header=1)

psi = rama[:,0]
phi = rama[:,1]


In [None]:
plt.figure(figsize=(10,6))

plt.subplot(2,1,1)
plt.plot(phi, psi, '.', markersize=8)
plt.xlim(-180, 180)
plt.ylim(-180, 180)
plt.xlabel('$\phi, grados$', fontsize=15)
plt.ylabel('$\psi, grados$', fontsize=15)
plt.title('Gráfica de Ramachandran')

plt.subplot(2,2,3)
plt.hist(phi[1:], edgecolor='k')
plt.xlabel('$\phi, grados$')
plt.ylabel('Conteo')
plt.title('$\phi \, ángulos$')

plt.subplot(2,2,4)
plt.hist(psi[:-1], edgecolor='k')
plt.xlabel('$\psi, grados$')
plt.ylabel('Conteo')
plt.title('$\psi \, ángulos$')

plt.tight_layout()

## Gráficos de 3D 

In [None]:
from mpl_toolkits.mplot3d import Axes3D 
import matplotlib.pyplot as plt
import pandas as pd

In [None]:
#Fulereno
C60 = pd.read_csv('https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_03/data/C60.csv', delimiter=',')
C60
x, y, z = C60.iloc[:,0], C60.iloc[:,1], C60.iloc[:,2]

In [None]:
#OPCIONAL, USAR AL FINAL
#!pip install ipympl
#%matplotlib widget
#from google.colab import output
#output.enable_custom_widget_manager()

In [None]:

fig = plt.figure(figsize = (10,6))

ax = fig.add_subplot(1,1,1, projection='3d')
#ax = Axes3D(fig)
ax.plot(x, y, z, 'o')

ax.set_xlabel('X axis')
ax.set_ylabel('Y axis')
ax.set_zlabel('Z axis')

In [None]:
import numpy as np

x = np.arange(-10, 10)
y = np.arange(-10, 10)
X, Y = np.meshgrid(x, y)
Z = 1 - X**2 - Y**2

In [None]:
from mpl_toolkits.mplot3d import Axes3D
 
fig = plt.figure(figsize=(10,6))

ax = fig.add_subplot(1,1,1, projection='3d')
ax.plot_surface(X, Y, Z, cmap='viridis')

ax.set_xlabel('X axis')
ax.set_ylabel('Y axis')
ax.set_zlabel('Z axis')


## Reto
Visualiza un archivo de espectrometría de masas de bromobenceno.

In [None]:
# Aquí se guarda el espectro. La primer columna tiene el valor de m/z (masa/carga) y la segunda la intensidad
espectro = np.genfromtxt('https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_03/data/ms_bromobenzene.csv', delimiter=',', skip_header=1)


In [None]:
#Consejo: utiliza plt.stem()

## Reto

Importa los siguientes cuatro archivos:

* https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_05/data/blue1.csv
* https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_05/data/green3.csv
* https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_05/data/red40.csv
* https://raw.githubusercontent.com/weisscharlesj/SciCompforChemists/master/notebooks/chapter_05/data/yellow6.csv

Cada archivo tiene datos de espectro UV-vis para cuatro colorantes de comida, con la primer columna las longitudes de onda (nm) y la segunda las absorbancias. Los datos están en el intervalo 400-850 nm , con incrementos de  1 nm.

a) Concatena los archivos en un solo DataFrame, con la primer columna la longitud de onda (nm) y otras cuatro columnas de absorbancia de cada colorante.


b) Usa titulos de columna adecuados.

# Matemáticas con SymPy

Podemos hacer matemáticas simbólicas usando SymPy, tal como en Mathematica o MathLab.

In [None]:
import sympy

In [None]:
# Obtenemos una expresión simbólica en lugar de un resultado numérico
sympy.sqrt(2)

In [None]:
# Podemos evaluar
sympy.sqrt(2).evalf()

In [None]:
# Cambiamos el número de cifras significativas
sympy.sqrt(2).evalf(20)

## Uso de simbolos

In [None]:
# Primero debemos definir objetos que serán interpretados como símbolos
# y no como valores
x, c, m = sympy.symbols('x c m')
x

In [None]:
# Ahora podemos usarlos en expresiones
E = m*c**2
E

In [None]:
E**2

## Métodos algebráicos

Hay algunos métodos que podemos usar para realizar operaciones
algebráicas:

* `sympy.expand()` para expandir polinomios 
* `sympy.factor()` factorizar polinomios
* `sympy.simplify()` para simplificar
* `sympy.solve()` para una expresión igual a 0, resuelve para una variable

In [None]:
# Ejemplo de expansión
expr = (x - 1)*(3*x + 2)
expr.expand()

In [None]:
# Factorizando 
sympy.factor(3*x**2 - x - 2)

In [None]:
# Simplificando (Tiene sus complicaciones)
expr2 = 3*x**2 - 4*x - 15 / (x - 3)
expr2

In [None]:
expr2.simplify()

In [None]:
sympy.simplify((3*x**2 - 4*x - 15) / (x - 3))

In [None]:
# Resolver ecuaciones
sympy.solve(x**2 + 1.4*x - 5.76)

## Un ejemplo: Equilibrio de una ecuación

Vamos a resolver un problema de equilibrio usando el método de inicio, cambio y equilibrio (ICE). Uno de los últimos pasos consiste en resolver una ecuación polinomial.Veamos un ejemplo:


|     | 2 NH3 | $\rightleftharpoons$ | 3 H2 (g) | + | N2 (g) | 
|:--: | :--:  |:-:|:-------: |:--:|:-----|
| Inicio | 0.60 M |  | 0.60 M |  | 0.80 M |
| Cambio, $\Delta$| -2x |  |  +3x   |  |  +x    |
| Equilibrio | 0.60 - 2x | | 0.60 + 3x |  | 0.80 + x |



$$ K_c = 3.44 = \frac{[N_2][H_2]^3}{[NH_3]^2} = \frac{(0.80 + x)(0.60 + 3x)^3}{(0.60 - 2x)^2}  $$


In [None]:
# Primero, expandimos el lado derecho de la ecuación:
expr = (0.80 + x) * (0.60 + 3*x)**3 / (0.60 - 2*x)**2

In [None]:
sympy.expand(expr)

In [None]:
# Simplificamos
sympy.simplify(sympy.expand(expr))

In [None]:
# Resolvemos (Hay que igualar a 0)
sympy.solve(expr - 3.44)

Solo una solución tiene sentido.