# **Herramientas**

![](https://qph.fs.quoracdn.net/main-qimg-f50d6b72bfe979076718cc0e60304587)
## **1. Google Colab**
Es una interfaz o entorno interactivo, basada en el proyecto [jupyter notebook](https://jupyter.org/) e implementada por Google en su interfaz de desarrollo colaborativo ejecutado con la tecnolog칤a de Google Cloud, tiene una limitante de tiempo de 12 horas continuas de ejecuci칩n.

Le permite a los usuarios dos aspectos fundamentales:
* Escribir notas
* Escribir c칩digo (mayormente python)

Se ejecuta de manera jer치rquica en orden descendente y permite activar **entornos de ejecuci칩n** que soportan aceleraci칩n por hardware (GPU y TPU). Adicionalmente, se ancla directamente a Google Drive para aumentar el acceso a la informaci칩n.

Las celdas de texto se compilan autom치ticamente bajo el est치ndar [Markdown](https://www.markdownguide.org/) y permite insertar texto formateado, im치genes, emoticones 游븸, e incluso LaTeX.

Las celdas de c칩digo (code) son ejecutadas de manera secuencial en instancias de Google Cloud, se diferencian de las celdas de texto porque a la izquierda aparece el boton ejecutar (tambi칠n funciona la combinaci칩n de teclas Crtl + Enter)

![code-cell](https://www.tutorialspoint.com/google_colab/images/executing_code.jpg)

## **2. Python**
Lenguaje de programaci칩n interpretado, de alto nivel orientado a la legibilidad del c칩digo, de sint치xis simple y vers치til. Permite la invocaci칩n de librer칤as, a continuaci칩n algunas m치s 칰tiles. Las listas y arreglos en python se identifican con 칤ndices, y el primer 칤ndice es el cero.
![zi-pyhton](https://miro.medium.com/max/574/1*i9kXrwc5SqFryJJGn6CVhg.png)

### 2.1 **Numpy** (numerical python)
Viene instalada dentro de la interfaz que monta Google Colab, y se importa al entorno bajo el siguiente comando
``` python
import numpy as np
```
```np``` es un alias o nombre corto para numpy, la mayor칤a de programadores utilizan esta abreviaci칩n


In [None]:
import numpy as np

#### Creando arreglos con numpy
Digamos que quiere crear un arreglo (vector fila) de 10 elementos y llenarlo con ceros

In [None]:
arreglo = np.zeros(10)
print(arreglo.shape)
arreglo

Ahora queremos convertir la fila en columnas

In [None]:
arreglo.shape = (10,1)
arreglo

#### Linspace
Crea un arreglo lineal (vector fila), recibe tres argumentos: valor incial, valor final y n칰mero de elementos entre los valores anteriores: la siguiente lista inicia en 2 y finaliza en 10, con 5 elementos (incluyendo el 2 y 10)


```python
lista = np.linspace(2, 10, 5)
```


In [None]:
lista = np.linspace(2, 10, 5)
lista

#### Matrices
Son arreglos 2-D, cada vector fila debe estar separado por coma y enmarcado con par칠ntesis cuadrados



```python
matrix = np.array([1,2,3],[4,5,6])
```



In [None]:
matrix = np.array([[1,2,3],[4,5,6]])
print(matrix.shape)
matrix

Se pueden aplicar esquemas condicionales a los arreglos n-dimensionales

In [None]:
matrix > 3

Las condiciones, tambi칠n se pueden enmascarar dentro los arreglos 

In [None]:
matrix[matrix<5] 

#### Im치genes
Se pueden manipular im치genes en python


In [None]:
from skimage import io
photo = io.imread('https://marketing4ecommerce.net/wp-content/uploads/2018/01/Depositphotos_3667865_m-2015-compressor.jpg')
photo.shape

In [None]:
import matplotlib.pyplot as plt
plt.imshow(photo)

In [None]:
plt.imshow(photo[350:550, 400:600])

In [None]:
mascara = np.where(photo > 150, 255, 0)
plt.imshow(mascara)

### 2.2 **Pandas** (Panel Data)
Librer칤a especializada para la manipulaci칩n y an치lisis de datos, es considerada una de las librer칤as m치s importantes en ```python``` para la ciencia de datos. Se importa bajo el siguiente comando

```python
import pandas as pd
```
Los objetos creados con pandas heredan una estrutura de datos en dos dimensioes, son denominados ```dataframes``` y son el equivalente a una hoja de c치lculo almacenada en memoria

![pandas](https://media.geeksforgeeks.org/wp-content/uploads/finallpandas.png)


In [None]:
import pandas as pd

Crearemos un arreglo de python

In [None]:
datos = np.array([[0,3], [10,7] , [20,9], [30,14], [40,15]])
print(type(datos))
nombres = ['temperatura','actividad']
print(type(nombres))

In [None]:
dataframe = pd.DataFrame(data=datos, columns=nombres)
sum(dataframe.actividad)

Agregar una columna nueva a el dataframe

In [None]:
dataframe['procentaje'] = dataframe['actividad']/48.0
dataframe

Para acceder a las primeras n filas de datos, utilizamos head

In [None]:
dataframe.head(2)

para acceder a una fila en espe칤fico, utilizamos iloc

In [None]:
dataframe.iloc[[3]]

<span style='color:red'> **Tarea**  </span>
1. Del recurso web https://sci-hub.se/10.1016/j.envpol.2015.12.004, extraiga informaci칩n y cree un pandas dataframe de 4x7, con la siguiente informaci칩n por columnas: Peso Molecular, Solubilidad en agua, Absorbancia m치xima y Constante de disociaci칩n, llame a las columnas pesomolecular, solubilidad, lambdamax, pKa, para los siguientes compuestos: 
* anilina 
* 2-cloro anilina 
* 2-nitro anilina 
* Fenol 
* 2-cloro fenol 
* 2-nitrofenol 
* Nitrobenceno

In [None]:
# Escriba su c칩digo aqu칤.

### 2.3 **Seaborn** Visualizaci칩n de datos estad칤sticos
Seaborn es una librer칤a de visualizaci칩n de python, basada en matplotlib. Proporciona una interfaz interactiva de visualizci칩n de datos estad칤sticos.

```python
import seaborn as sns
```

In [None]:
import seaborn as sns

In [None]:
url="https://raw.githubusercontent.com/ValdisW/datasets/master/video-game-sales.csv"

videogames=pd.read_csv(url)

In [None]:
videogames.head(5)

In [None]:
inforvideogames = videogames[['Genre', 'Global_Sales','JP_Sales','EU_Sales']]
inforvideogames

In [None]:
grafico = sns.pairplot(inforvideogames,hue='Genre', palette='coolwarm') 

https://seaborn.pydata.org/tutorial/color_palettes.html

In [None]:
sns.catplot(x='Platform', y='Global_Sales', data=videogames, ci=None )
plt.xticks(rotation=90)

In [None]:
sns.lineplot(data = videogames, x="Genre", y="EU_Sales")
plt.xticks(rotation=90)

Ahora intente realizar algunos gr치ficos con esta base de datos
https://gist.githubusercontent.com/armgilles/194bcff35001e7eb53a2a8b441e8b2c6/raw/92200bc0a673d5ce2110aaad4544ed6c4010f687/pokemon.csv

### 2.3 **DataWarrior** Visualizaci칩n y an치lisis Chemoinformatics
Herramienta desarrollada por la Universidad de Cambridge y la empresa OSIRIS, se distribuye de manera gratuita bajo la licencia GPL 3.0 (https://openmolecules.org/datawarrior/)

**CCR5 o CD195** Es la prote칤na de superficie receptora, utilizada por pat칩genos virales como el VIH para ingresar a las c칠lulas de gl칩bulos blancos. En humanos es codificado por el cromosoma 3, la mutaci칩 delta 32 resulta en la resistencia a infecci칩n por VIH.

Una de las terapias terap칠uticas desarrolladas para esta enfermedad, tiene como blanco esta prote칤na, farmac칠uticas han venido publicando sus estudios

| Farmac칠utica | Referencia | PubMedID |
| ------------ | ---------- | -------- |
| AstraZeneca  | Cumming 2006 |16631366 |
| Merck  | Kim 2011 |15808483 |
| Pfizer  | Price 2007 |16782336 |
| GlaxoSmithKline  | Duan 2009 |19233649 |
