# **Herramientas**

![](https://qph.fs.quoracdn.net/main-qimg-f50d6b72bfe979076718cc0e60304587)
## **1. Google Colab**
Es una interfaz o entorno interactivo, basada en el proyecto [jupyter notebook](https://jupyter.org/) e implementada por Google en su interfaz de desarrollo colaborativo ejecutado con la tecnología de Google Cloud, tiene una limitante de tiempo de 12 horas continuas de ejecución.

Le permite a los usuarios dos aspectos fundamentales:
* Escribir notas
* Escribir código (mayormente python)

Se ejecuta de manera jerárquica en orden descendente y permite activar **entornos de ejecución** que soportan aceleración por hardware (GPU y TPU). Adicionalmente, se ancla directamente a Google Drive para aumentar el acceso a la información.

Las celdas de texto se compilan automáticamente bajo el estándar [Markdown](https://www.markdownguide.org/) y permite insertar texto formateado, imágenes, emoticones 🧑, e incluso LaTeX.

Las celdas de código (code) son ejecutadas de manera secuencial en instancias de Google Cloud, se diferencian de las celdas de texto porque a la izquierda aparece el boton ejecutar (también funciona la combinación de teclas Crtl + Enter)

![code-cell](https://www.tutorialspoint.com/google_colab/images/executing_code.jpg)

## **2. Python**
Lenguaje de programación interpretado, de alto nivel orientado a la legibilidad del código, de sintáxis simple y versátil. Permite la invocación de librerías, a continuación algunas más útiles. Las listas y arreglos en python se identifican con índices, y el primer índice es el cero.
![zi-pyhton](https://miro.medium.com/max/574/1*i9kXrwc5SqFryJJGn6CVhg.png)

### 2.1 **Numpy** (numerical python)
Viene instalada dentro de la interfaz que monta Google Colab, y se importa al entorno bajo el siguiente comando
``` python
import numpy as np
```
```np``` es un alias o nombre corto para numpy, la mayoría de programadores utilizan esta abreviación


In [None]:
import numpy as np

#### Creando arreglos con numpy
Digamos que quiere crear un arreglo (vector fila) de 10 elementos y llenarlo con ceros

In [None]:
arreglo = np.zeros(10)
print(arreglo.shape)
arreglo

Ahora queremos convertir la fila en columnas

In [None]:
arreglo.shape = (10,1)
arreglo

#### Linspace
Crea un arreglo lineal (vector fila), recibe tres argumentos: valor incial, valor final y número de elementos entre los valores anteriores: la siguiente lista inicia en 2 y finaliza en 10, con 5 elementos (incluyendo el 2 y 10)


```python
lista = np.linspace(2, 10, 5)
```


In [None]:
lista = np.linspace(2, 10, 5)
lista

#### Matrices
Son arreglos 2-D, cada vector fila debe estar separado por coma y enmarcado con paréntesis cuadrados



```python
matrix = np.array([1,2,3],[4,5,6])
```



In [None]:
matrix = np.array([[1,2,3],[4,5,6]])
print(matrix.shape)
matrix

Se pueden aplicar esquemas condicionales a los arreglos n-dimensionales

In [None]:
matrix > 3

Las condiciones, también se pueden enmascarar dentro los arreglos 

In [None]:
matrix[matrix<5] 

#### Imágenes
Se pueden manipular imágenes en python


In [None]:
from skimage import io
photo = io.imread('https://marketing4ecommerce.net/wp-content/uploads/2018/01/Depositphotos_3667865_m-2015-compressor.jpg')
photo.shape

In [None]:
import matplotlib.pyplot as plt
plt.imshow(photo)

In [None]:
plt.imshow(photo[350:550, 400:600])

In [None]:
mascara = np.where(photo > 150, 255, 0)
plt.imshow(mascara)

### 2.2 **Pandas** (Panel Data)
Librería especializada para la manipulación y análisis de datos, es considerada una de las librerías más importantes en ```python``` para la ciencia de datos. Se importa bajo el siguiente comando

```python
import pandas as pd
```
Los objetos creados con pandas heredan una estrutura de datos en dos dimensioes, son denominados ```dataframes``` y son el equivalente a una hoja de cálculo almacenada en memoria

![pandas](https://media.geeksforgeeks.org/wp-content/uploads/finallpandas.png)


In [None]:
import pandas as pd

Crearemos un arreglo de python

In [None]:
datos = np.array([[0,3], [10,7] , [20,9], [30,14], [40,15]])
print(type(datos))
nombres = ['temperatura','actividad']
print(type(nombres))

In [None]:
dataframe = pd.DataFrame(data=datos, columns=nombres)
sum(dataframe.actividad)

Agregar una columna nueva a el dataframe

In [None]:
dataframe['procentaje'] = dataframe['actividad']/48.0
dataframe

Para acceder a las primeras n filas de datos, utilizamos head

In [None]:
dataframe.head(2)

para acceder a una fila en espeífico, utilizamos iloc

In [None]:
dataframe.iloc[[3]]

<span style='color:red'> **Tarea**  </span>
1. Del recurso web https://sci-hub.se/10.1016/j.envpol.2015.12.004, extraiga información y cree un pandas dataframe de 4x7, con la siguiente información por columnas: Peso Molecular, Solubilidad en agua, Absorbancia máxima y Constante de disociación, llame a las columnas pesomolecular, solubilidad, lambdamax, pKa, para los siguientes compuestos: 
* anilina 
* 2-cloro anilina 
* 2-nitro anilina 
* Fenol 
* 2-cloro fenol 
* 2-nitrofenol 
* Nitrobenceno

In [None]:
# Escriba su código aquí.

### 2.3 **Seaborn** Visualización de datos estadísticos
Seaborn es una librería de visualización de python, basada en matplotlib. Proporciona una interfaz interactiva de visualizción de datos estadísticos.

```python
import seaborn as sns
```

In [None]:
import seaborn as sns

In [None]:
url="https://raw.githubusercontent.com/ValdisW/datasets/master/video-game-sales.csv"

videogames=pd.read_csv(url)

In [None]:
videogames.head(5)

In [None]:
inforvideogames = videogames[['Genre', 'Global_Sales','JP_Sales','EU_Sales']]
inforvideogames

In [None]:
grafico = sns.pairplot(inforvideogames,hue='Genre', palette='coolwarm') 

https://seaborn.pydata.org/tutorial/color_palettes.html

In [None]:
sns.catplot(x='Platform', y='Global_Sales', data=videogames, ci=None )
plt.xticks(rotation=90)

In [None]:
sns.lineplot(data = videogames, x="Genre", y="EU_Sales")
plt.xticks(rotation=90)

Ahora intente realizar algunos gráficos con esta base de datos
https://gist.githubusercontent.com/armgilles/194bcff35001e7eb53a2a8b441e8b2c6/raw/92200bc0a673d5ce2110aaad4544ed6c4010f687/pokemon.csv

### 2.3 **DataWarrior** Visualización y análisis Chemoinformatics
Herramienta desarrollada por la Universidad de Cambridge y la empresa OSIRIS, se distribuye de manera gratuita bajo la licencia GPL 3.0 (https://openmolecules.org/datawarrior/)

**CCR5 o CD195** Es la proteína de superficie receptora, utilizada por patógenos virales como el VIH para ingresar a las células de glóbulos blancos. En humanos es codificado por el cromosoma 3, la mutació delta 32 resulta en la resistencia a infección por VIH.

Una de las terapias terapéuticas desarrolladas para esta enfermedad, tiene como blanco esta proteína, farmacéuticas han venido publicando sus estudios

| Farmacéutica | Referencia | PubMedID |
| ------------ | ---------- | -------- |
| AstraZeneca  | Cumming 2006 |16631366 |
| Merck  | Kim 2011 |15808483 |
| Pfizer  | Price 2007 |16782336 |
| GlaxoSmithKline  | Duan 2009 |19233649 |
