In [None]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:85% !important; } </style>"))

## <font color = limegreen>Dataframes</font>

### Una de las mejores opciones para trabajar con datos tabulares en Python es usar la Python Data Analysis Library (alias `Pandas`).

## Pandas
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html
- ### se utiliza para <font color = limegreen>manipulaciones de datos estructurados</font> y <font color = limegreen>estadística</font>
- ### Es muy habitual usarlo en la fase de depuración y preparación de los datos.
- ### Es un módulo que se ha añadido recientemente, pero <font color = limegreen>su gran utilidad ha impulsado el uso de Python en la comunidad científica</font> 
- ### Permite crear DataFrames, <font color = limegreen>que son tablas de datos ordenadas por filas y columnas</font>

<img src="https://www.janbasktraining.com/blog/uploads/images/image_750x_5d660cd67d0a0.jpg" width = 60%>

- ###  <font color = darkorange>Un DataFrame es la estructura de datos más importante y ampliamente usada, y es una manera estándar de almacenar datos</font>

### Importar pandas

In [None]:
# si no está instalado pandas instalar con el siguiente comando
# python -mpip install --force-reinstall --no-color pandas==1.0.4


import pandas as pd
from pandas import DataFrame
import os

#### creación de un dataframe

##### <font color = orange>método 1: a partir de una lista de listas</font>

In [None]:
data = [[23, 64, 14, 0, 0, 3, 1],
        [0, 3, 35, 42, 0, 12, 1],
        [0, 5, 5, 0, 40, 40, 0],
        [44, 35, 9, 0, 1, 0, 0],
        [0, 2, 8, 0, 35, 45, 1],
        [0, 0, 25, 35, 0, 19, 0]]

In [None]:
# cómo se visualiza la lista de listas
data

In [None]:
ids = list('ABCDEFG')
ids

In [None]:
df = DataFrame(data, columns = ids)

In [None]:
df

##### <font color = orange>método 2: a partir de un diccionario</font>

In [None]:
# cómo hacer un df de 4 columna
frame = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15], 'D': [16, 17, 18, 19, 20]}

In [None]:
frame

In [None]:
pd.DataFrame(data = frame)

In [None]:
indice = ['A', 'B', 'C', 'D', 'E']

In [None]:
# asignación de un índice al df frame
pd.DataFrame(data = frame, index = indice)

#### crear dataframe con índice

In [None]:
df2 = DataFrame(data, columns = ids, index = list('ABCDEF'))

In [None]:
df2

#### recetear el índice

In [None]:
df2 = df2.reset_index(drop = True)

In [None]:
df2

#### ordenar una columna en particular en orden ascendente o descendente

In [None]:
df.sort_values(by ='D',ascending=True).reset_index(drop=True)

#### definir un índice específico

In [None]:
df.set_index(list('ABCDEF'))

In [None]:
df

#### agregar una columna

In [None]:
df['H'] = [1, 4, 23, 45, 55, 90]

In [None]:
df

#### agregar una columna en una posición específica dentro del df

In [None]:
df.insert(loc = 1, column='A1', value= [34, 88, 1, 34, 21, 76])

In [None]:
df

#### obtener la media por filas

In [None]:
df.mean(axis = 1)

#### obtener la media por columnas

In [None]:
df.mean(axis = 0)

#### obtener la desviación estándar por filas 

In [None]:
df.std(axis = 1)

#### obtener la desviación estándar por columnas 

In [None]:
df.std(axis = 0)

#### exportar dataframe como archivo `.txt`, `.csv`, `.tsv`

##### <font color = orange>con índice</font>

In [None]:
df2.to_csv('../salidas/dataframe_txt_ci.txt', sep = '\t')

In [None]:
df2.to_csv('../salidas/dataframe_csv_ci.csv', sep = ',')

In [None]:
df2.to_csv('../salidas/dataframe_tsv_ci.tsv', sep = '\t')

##### <font color = orange>sin índice</font>

In [None]:
df.to_csv('../salidas/dataframe_txt_si.txt', sep = '\t', index = None)

In [None]:
df.to_csv('../salidas/dataframe_csv_si.csv', sep = ',', index = None)

In [None]:
df.to_csv('../salidas/dataframe_tsv_si.tsv', sep = '\t', index = None)

In [None]:
# una manera de ver que se crearon las tablas
os.listdir('../salidas/')

#### exportar dataframe como excel

In [None]:
w = pd.ExcelWriter('../salidas/nombre_archivo.xlsx')

In [None]:
df.to_excel(w, 'hoja 1',index=False) # nombre de la hoja dentro del archivo excel

In [None]:
w.save()

##### cómo abrir un archivo excel

In [None]:
excel = pd.read_excel('../salidas/nombre_archivo.xlsx')

In [None]:
excel

#### cómo abrir tablas con índices

In [None]:
df_in = pd.read_csv('../salidas/dataframe_txt_ci.txt', sep = '\t', index_col = 0)

In [None]:
df_in

In [None]:
pd.read_csv('../salidas/dataframe_csv_ci.csv', sep = ',', index_col = 0)

In [None]:
pd.read_csv('../salidas/dataframe_tsv_ci.tsv', sep = '\t', index_col = 0)

#### cómo abrir tablas sin índices

In [None]:
df_in = pd.read_csv('../salidas/dataframe_txt_si.txt', sep = '\t')

In [None]:
df_in

In [None]:
pd.read_csv('../salidas/dataframe_csv_si.csv', sep = ',')

In [None]:
pd.read_csv('../salidas/dataframe_tsv_si.tsv', sep = '\t')

### tabla dinámica:
#### Esta función es extremadamente útil para resumir conjuntos de datos de una forma rápida y eficaz.

In [None]:
# suponiendo que se tienen datos categóricos
df['cat'] = ['a', 'a', 'a', 'a', 'b', 'b']

In [None]:
df

In [None]:
# la función `aggfunc` permite realizar algunas operationes aritméticas
df.pivot_table(values = list('ABCDEF'), index = ['cat'], aggfunc = sum).reset_index()

In [None]:
# longitud de elementos dentro de grupos
df.pivot_table(values = list('ABCDEF'), index = ['cat'], aggfunc = len).reset_index()

In [None]:
# media de un grupo
cat_b = df.pivot_table(values = list('ABCDEF'), index = ['cat'], aggfunc = np.mean).reset_index()
cat_b

In [None]:
cat_b2 = cat_b.set_index(['cat'])

In [None]:
cat_b2

In [None]:
# desviación estándar de un grupo
df.pivot_table(values = list('ABCDEF'), index = ['cat'], aggfunc = np.std).reset_index()

#### Visualizaciones con dataframes
https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html

#### Bar plots

In [None]:
df2 = pd.DataFrame(np.random.rand(10, 4), columns=["a", "b", "c", "d"])

In [21]: df2.plot.bar();

In [None]:
df.plot.bar();

In [None]:
 df.plot.bar(stacked=True);

In [None]:
df.plot.barh(stacked=True);

#### Box plots

In [None]:
df.plot.box();

#### Pie plot

In [None]:
cat_b3 = pd.Series(cat_b2[cat_b2.index == 'b'].values[0], index=cat_b2[cat_b2.index == 'b'].columns.tolist(), name="Columnas")

In [None]:
cat_b3

In [None]:
cat_b3.plot.pie(figsize=(6, 6));

# Programación estructurada

## <font color = blue>Estructuras de control de flujo condicionales</font>
- ### <font color = limegreen>if</font>, significa "si" (condición).
- ### <font color = limegreen>elif</font>, es una segunda condición y se evalúa si `if` es `False`
- ### <font color = limegreen>else</font>, significa "si no".
### <font color = magenta>Los condicionales son las estructuras de control más importantes en toda la programación</font>
<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/if_else.jpg" width = 50%>

<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/if_elif_else.jpg" width = 30%>

---
Puedes ingresar a este sitio, hay varios ejemplos de condicionales  
https://www.mclibre.org/consultar/python/lecciones/python-if-else.html

## <font color = blue>Estructuras de control iterativas</font>
---
## <font color = deeppink>En informática iteración significa que se van a usar bucles</font>
## <font color = deeppink>Un bucle es una parte de código que se repite una y otra vez</font>
---
- ### <font color = red>for</font>
<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/for_loop.jpg" width = 50%> <br>

#### Iteración <img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/ezgif.com-crop.gif" width = 40%> <br>

### <font color = limegreen>Un ejemplo bastante sencillo</font>

In [None]:
for i in range(10):
    print(i)

#### cómo aplicas los condicionales `if` o  `else` en el bucle

In [None]:
for i in range(10):
    print(i)

### <font color = black>cómo iterar una cadena de caracteres usando el bucle `for`</font>

### <font color = black>cómo iterar una lista usando el bucle `for`</font>

### <font color = black>cómo iterar un diccionario usando el bucle `for`</font>

### <font color = black>cómo iterar un diccionario usando el bucle `for`</font>

### <font color = green>Cómo guardar en una lista un elemento que sale de un bucle `for`</font>
### Usando la función `append()`