### <center><h2> INGENIERÍA EN BIOTECNOLOGÍA</h2></center>
# <center><h1 style="color:red">GBI6 - BIOINFORMÁTICA</h1></center>


<img src="https://www.ikiam.edu.ec/img/logo-ikiam-grey.png" width=400 height=300 />

# INTRODUCCIÓN A LA PROGRAMACIÓN EN PYTHON

## ¿Por qué programar?

Se tiene muchos programas disponibles que se pueden usar para hacer procesamiento directo. Sin embargo, casi ningún software dsiponible tiene todo lo requerido para realizar exactamente los análisis que se requiere en los proyectos de ciencias, en nuestro caso en `Bioinformática`. 

Saber programar permite escribir las instrucciones que son necesarios para solucionar algún requerimiento de procesamiento (**software propio**). Escribir un programa prpio también facilita la reproducibilidad, comprensión y extensión; especialmente si se compara con lo que se puede hacer con programas con interfaz gráfica, donde solo se hace clicks en formularios y ventanas para obtener el resultado deseado. Escribir el programa permite automatizar los procesos. 

Si el programa está acompañado de instrucciones adecuadas `ManPage`, `README`), entonces cualquiera y en cualquier lugar del mundo podrá reproducir sus hallazgos con exactitud, porque podrá organizar sus datos y código correctamente.

## Elección del lenguaje de programación
Actualmente hay cientos de lenguajes de programación disponibles. ¿Cuáles debería elegir un biólogo? 

Al igual que en idiomas, conocer más de un idioma trae grandes ventajas. Asimismo, en Bioinformática se debe buscar la pluralidad de lenguajes; porque cada lenguaje de programación se ha desarrollado teniendo en cuenta una audiencia determinada y problemas particulares, lo que da como resultado ciertas fortalezas y debilidades.

<img src="https://itsvenu.github.io/post/bioinformatics-biostars/Biostars_perYear_languageQuestions.png" width=800 height=600 />

Algunos autores sugieren que Python y R hacen una excelente combinación: 

<img src="https://2.bp.blogspot.com/-h7og3j6JSRc/WYZVo5FqvzI/AAAAAAAAFJE/-21__pSTiL4p5nDVof7ClzVkvSgjo_b7ACLcBGAs/s1600/indeed%2Btrends.png" width=600 height=450 />
<img src="https://rstudio.github.io/reticulate/images/reticulated_python.png" width=300 height=250 />


Adquirir un conocimiento básico de varios lenguajes permite identificar y elegir el que es más apropiado para una tarea. No es necesario aprender todos los lenguajes de programación y lograr un dominio bajo en todos, tampoco es recomendable utilizar un solo lenguaje de programación para cada una de las tareas, porque cada lenguaje tiene sus fortalezas y debilidades.

- Costanza P. *et al*. 2019: <a href="https://doi.org/10.1186/s12859-019-2903-5">A comparison of three programming languages for a full-fledged next-generation sequencing tool</a>

## Lenguajes de programación

<img src="https://www.mycplus.com/mycplus/wp-content/uploads/2009/02/programming-languages.jpg" width=800 height=550 />

Tres combinanciones de carcaterísticas se requieren de los lenguajes de programación: 

- Lenguaje moderno y fácil de escribir para la manipulación de datos, creación de prototipos y tareas de programación que no implican varios millones de operaciones (**Python**, Perl y Ruby). En el caso de Python busca la legibilidad, flexibilidad y popularidad; a costa de la velocidad de ejecución. 

- Lenguaje para operaciones estadísticas / matemáticas que permitan programar (**R**, Mathematica, MATLAB, Julia). 

- Un lenguaje para trabajo pesado (millones o miles de millones de operaciones, como simulaciones). Estos lenguajes se basan en un compilador (traduce el código fuente en un programa binario ejecutable). Suelen ser muy rápidas (**C**, FORTRAN, Go, Java Swift, C++). 

# Introducción a Python

## ¿Qué es Python?

* Creado en 1991 por Guido Van Rossum.
* Lenguaje de programación de propósito general, multiparadigma (programación imperativa, orientada a objectos, funcional).
* Lenguaje de programación interpretado, con tipado dinámico y fuertemente tipado.
* [_Batteries Included_](https://docs.python.org/3/tutorial/stdlib.html#batteries-included): tiene una gran cantidad de módulos disponibles en la librería estándar.
* Hace énfasis en facilitar la legibilidad y transparencia del código.

```python
>>> import this
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
```

## Versiones de Python

Hay dos versiones estables de Python, incompatibles entre si: Python 2 (Python 2.7 es la actual versión) y Python 3. La mayor diferencia para un principiante es que en Python 3 `print` pasa a ser una functión y no una sentencia.

* Python 2
```python
>>> print "Hola GBI6!"
Hola GBI6!
```

* Python 3
```python
>>> print "Hola GBI6!"
  File "<stdin>", line 1
    print "Hola GBI6!"
                       ^
SyntaxError: Missing parentheses in call to 'print'. Did you mean print("Hola GBI6!")?
>>> print("Hola GBI6!")
Hola GBI6!
```

## El intérprete de Python

Cuando se ejecuta en modo *interactivo*, el **interprete** evalua las entradas que se le introducen a través de un prompt (`>>>`):

```python
$ python3
Python 3.8.5 (default, Sep  3 2020, 21:29:08) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32
Type "help", "copyright", "credits" or "license" for more information.

>>> 1 + 2
3
>>> a = 1
>>> a + 2
3
>>> b = a + 2
>>> b
3
>>> 
```

Para ejecutar un programa desde la consola:

```bash
$ python3 hello_world.py
Hola GBI6!
```

En el caso de los _Notebooks_ de Jupyter, el código se agrupa en celdas, que se pueden ejecutar independientemente (ojo a la ejecución fuera de orden). Al ejecutar una celda esta nos devolvera el resultado de la evaluación de la última sentencia ejecutada.

---

## Un primer programa en Python

### crear celdas 

Las celdas pueden ser de tipo *texto plano* (Markdown) o de tipo **código** (Code). 
- Listado item1 <br>
- Listado item2 <br>

Parrafo1
Parrafoo2 <br><br><br>
Parrafo 3 <br> Parrafo 4

In [22]:
print("Hola Mundo")
x = 3
y = 2
z = 2*x -3*y
print("z es: ", z) 



Hola Mundo
z es:  0


In [14]:
# Esto es un comentario
x = 3 # asignar valor de x
y = 5 # asignar valor de y
t = 6
z =  t + 3*x - y # caluclar la diferencia de sus productos

# Impresión de texto
print("aqui estamos")

# Operaciones elementales 

# Guardar tablas 

# Modelamiento de expresión de gen X


aqui estamos


In [18]:
print(x)
print(y)
print(t)
print(z)

3
5
6
10


In [None]:
# medidas de ala en cm 
ancho_ala = 5
rate_expr = 30  # copies/ml


---

## Sintaxis

* Sintaxis sencilla, parecida al inglés.
* Énfasis en facilitar la lectura del código.
* Todas las líneas terminan on un salto de línea (no hace falta `;`).
  * Para continuar una línea se utiliza `\`.
* Los comentarios comienzan por un `#`.


* Un programa en Python se compone de _módulos_.
* Los módulos están compuestos por _sentencias_.
  * Las sentencias, en algunos casos, se deben agrupar por bloques.
* Las sentencias contienen _expresiones_.
  * Crean objetos.
  * Procesan objetos.
* Los espacios en blanco en Python son muy importantes.
  * `El indentado delimita bloques de código` (funciones, bucles, condicionales, contextos, etc.)
  * Normalmente se utilizan 4 espacios en lugar de tabuladores.
  * Importante no mezclar espacios y tabuladores!!
  * Código en C
```c
void foo(int x) {
        if (x == 0) {
            bar();
            baz();
        } else {
            qux(x);
            foo(x - 1);
        }
}
```
  * Equivalente en Python (correcto)
```python
    def foo(x):
        if x == 0:
            bar()
            baz()
        else:
            qux(x)
            foo(x - 1)
```
  * Código erróneo en Python
```python
    def foo(x):
        if x == 0:
            bar()
            baz()
        else:
            qux(x)
        foo(x - 1)
```
  * Código erróneo en Python (fallo de sintaxis)
  ```python
    def foo(x):
        if x == 0:
            bar()
            baz()
        else:
            qux(x)
           foo(x - 1)
```

**Ejemplo (ejecutar la siguiente celda con Ctrl + Enter)**

In [9]:
a = 2
b = 4 ** 2
mensaje = "Si se suman los valores a y b, "

# Esto es un comentario
if b >= 10 or a == 1:
    c = a + b
    print(mensaje)
else:
    c = b - a

print("el resultado es", c)

Si se suman los valores a y b, 
el resultado es 18


# Cálculos básicos

Se puede utilizar Python como una calculadora, donde tenemos los operadores: 

- **Aritmética**, *de Baldor*

`+` Suma

`-` Diferencia

`*` Multiplicación

`/` División

`**`Exponenciación

`//` Division entera

`%` Modulo (restante de la division entera)

`sqrt` Raíz cuadrada

- **Comparación**

`==` Igual igual

`!=` Diferente o no igual 

`>` Mayor que 

`>=` Mayor o igual que 

`<` Menor que 

`<=` Menor o igual que 

- **Lógica**

`&` "y" AND

`|` "o" OR

`!` "no" NOT

In [19]:
# Aritmética
a = 11
b = 5

print("a+b=", a+b)
print("a-b=", a-b)
print("a*b=", a*b)

print("a^b=", a**b)


import math as mt
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

print("log(a)=", mt.log(a, 10))



a+b= 16
a-b= 6
a*b= 55
a^b= 161051
log(a)= 1.041392685158225


In [20]:
# Comparación, el resultado es un booleano: VERDAD  o FALSO 
print (a > b)
print (a < b)
print (a >= b)
print (a <= b)
print (a == b)
print (a != b)

c = 1
print (a == c)



True
False
True
False
False
True
False


In [21]:
# Lógica
print((a > b) & (c < b) | (c==b))

True


Para hacer operaciones complejas se debe utilizar agrupadores `()`. 

- $a*b**4 = a \cdot b^4$

- $a*(b**4) = a \cdot (b^4)$

- $(a*b)**4 = (a \cdot b)^4$

- $a+b/4 = a + \frac{b}{4}$

- $(a+b)/4 = \frac{a+b}{4}$

- $sqrt(a +1 )-1 = \sqrt{a+1}-1$

In [8]:
# Aritmética compuesta


---


# Variables y tipos de datos básicos

## Variables

* Todo en Python es un objeto (numeros, funciones, cadenas de caracteres, clases, objetos, modulos, paquetes, etc.).
* Las variables se asignan con el operador `=`, sean del tipo que sean.
* Se puede asignar cualquier objeto a una variable.
* Tipado dinámico, fuertemente tipado.

In [9]:
# Asignación 
gen1 = "hemoglobina"
# Despliegue
print(gen1)

hemoglobina


In [24]:
a = "1"
#a = 1  # Tipado dinámico
print(type(a))
print(2*a)
b = "2.5"

a = int(a) 
print(type(a))
b = float(b)  # Fuertemente tipado
print(2*a)
a + b

<class 'str'>
11
<class 'int'>
2


3.5

* Una variable **tiene que existir** para poder referenciarla.

In [11]:
z = ""  # 'z' no está definida, obtendremos un error

* Los nombres de variables comienzan por un caracter alfabético siempre.

In [12]:
5cosas = "hola"  # Las variables no pueden comenzar por un número

SyntaxError: invalid syntax (<ipython-input-12-a3f5a1ab37af>, line 1)

## Números

* Dos tipos numéricos básicos.
  * enteros, con tipo `int`.
  * flotante, con tipo `float`.
  * complejo, con tipo `complex`.

In [None]:
a = 1+3
b = 7
c = 13
d = a + b**2 + (c / a)
c + d

import cmath
e = complex(3, 2)
f = b + e

print(e)
print(f)
type(f)

In [None]:
13 / 3  # La división siempre devuelve un flotante

In [None]:
13 // 3  # Floor division (redondea al entero más próximo)

In [None]:
13 % 3  # Resto

Revisar todas las variables guardadas en la memoria

In [None]:
who

In [None]:
x=4 
seq_dendro1= ""

## Cadenas de caracteres

* Python puede manipular cadenas de caracteres, las cadenas se pueden definir:
  * Entre comillas dobles (`"...")`.
  * Entre comillas simples (`'...'`).
  * Entre tres comillas dobles (`"""..."""`) o tres comillas simples (`'''...'''`) para ocupar varias líneas.
  * Para escapar un tipo de comilla dentro de comillas del mismo tipo se utiliza `\`.
  * Dos cadenas adyacentes, separadas por un espacio, son automáticamente añadidas.
  * Las cadenas de caracteres se pueden sumar (concatenación)
  * Se puede comprobar si una cadena está contenida en otra cadena con el operador "in"

In [2]:
neuron1 = "Las células del sistema nervioso, las \"neuronas\" son numerosas."

neuron2 = 'Las células del sistema nervioso, las "neuronas" son numerosas.'

neuron3 = "Las células del sistema nervioso, las 'neuronas' son numerosas."

neuron4 = """\nLas células del sistema nervioso, 
"neuronas" son numerosas.
Forman el sistema nervioso.\n 
Otra línea
"""

print(neuron1)
print(neuron2)
print(neuron3)
print("\n"  +  neuron2  +  neuron3)
print(neuron4)


Las células del sistema nervioso, las "neuronas" son numerosas.
Las células del sistema nervioso, las "neuronas" son numerosas.
Las células del sistema nervioso, las 'neuronas' son numerosas.

Las células del sistema nervioso, las "neuronas" son numerosas.Las células del sistema nervioso, las 'neuronas' son numerosas.

Las células del sistema nervioso, 
"neuronas" son numerosas.
Forman el sistema nervioso.
 
Otra línea



In [3]:
print("Esto son", "varios textos \t separados que se van " "a juntar al final")

Esto son varios textos 	 separados que se van a juntar al final


In [None]:
print("puede parecer no demasiado útil\n"
      "pero es util para romper una cadena\n"
      "\n\nen varias líneas. \n")

In [None]:
cadena5 = neuron1 + " " + neuron2
print(cadena5)

In [None]:
"sistema" in neuron3

In [None]:
"neuronas" in neuron3

# <center><h1 style="background-color:lightblue"><font color='red'>EJERCICIO</font></h1></center>

1. Crear un archivo **texto.py** que imprima el siguiente texto:

<span style="background-color:lightgreen">Al finalizar dijo: "Estaremos calculando el área' de las células".</span>

2. Subir el archivo **texto.py** al GitHub, utilizando la linea de comandos. 

In [25]:
print("Texto 1")
print("Esto es un texto 1 'especial'")
print('Esto es un texto 1 "especial"')

Texto 1
Esto es un texto 1 'especial'
Esto es un texto 1 "especial"


In [None]:
from jupyterthemes import jtplot
jtplot.style(theme='onedork')
jtplot.style(context='talk', fscale=1.4, spines=False, gridlines='--')
# Escribe aquí tu código





## Funciones precargadas

In [6]:
# valor absoluto
abs(-1)
# Potencia
pow(2,3) 
# Imprimir 
print("algo")
# redondear
print(round(2.121442435, 1))
# Ayuda, detalles de funciones, objetos
help(round)
help(pow)

algo
2.1
Help on built-in function round in module builtins:

round(number, ndigits=None)
    Round a number to a given precision in decimal digits.
    
    The return value is an integer if ndigits is omitted or None.  Otherwise
    the return value has the same type as the number.  ndigits may be negative.

Help on built-in function pow in module builtins:

pow(base, exp, mod=None)
    Equivalent to base**exp with 2 arguments or base**exp % mod with 3 arguments
    
    Some types, such as ints, are able to use a more efficient algorithm when
    invoked using the three argument form.



In [34]:
x = 5
# escribir variable. + TAB
texto = "Un texto cuALQquiera"
texto.lower()

'un texto cualqquiera'

In [None]:
texto.

In [9]:
# Longitud de un texto (número de caracteres)
celula = "Unidad anatómica fundamental de todos los organismos vivos"
print(len(celula))

pow(2, pow(2, pow(2,3)))


58


115792089237316195423570985008687907853269984665640564039457584007913129639936

### Funciones precargadas para textos

Revisar funciones aplicables al dato

In [11]:
seq_corta = 'ATCGCGCGCTAGACATGATACGA'

In [12]:
g = seq_corta.count('G')
c = seq_corta.count('C')
total = len(seq_corta)

gc_percent = round(100*(g + c)/ total, 2)

print("Porcentaje de GC es: ", gc_percent, "%")

Porcentaje de GC es:  52.17 %


In [14]:
seq_corta.split("G") # split salta la opcion que escogimos


['ATC', 'C', 'C', 'CTA', 'ACAT', 'ATAC', 'A']

In [None]:
help(

In [43]:
help(seq_corta)

No Python documentation found for 'ATCGCGGA'.
Use help() to get the interactive help utility.
Use help(str) for help on the str class.



In [18]:
# reemplazar characters
texto_corto = "La traduccion permite transformar el ARN a aminoacidos "
texto2= texto_corto.replace("permite", "es el proceso")
texto2 

'La traduccion es el proceso transformar el ARN a aminoacidos '

In [19]:
# índice (posición) de la primera ocureencia
seq_corta.find("T")

1

In [25]:
# contar ocurrencias
seq_corta = 'ATAACGCGCGCTAGACATGATACGA' 

start= seq_corta.find("ATG")
end= seq_corta.find("TAA")
print(start, end, seq_corta)


16 1 ATAACGCGCGCTAGACATGATACGA


In [26]:
start= seq_corta.count("ATG")
end= seq_corta.count("TAA")
print(start, end, seq_corta)

1 1 ATAACGCGCGCTAGACATGATACGA


In [27]:
especie = " Mus musculus "
# separar texto con separador predefinido
especie.split()



['Mus', 'musculus']

In [28]:
# escpecicando el separador  
especie.split("s")



[' Mu', ' mu', 'culu', ' ']

In [29]:
# remueve espacios adicionales al inicio y al final del texto
especie.strip() # quita espacios que no son necesarios 


'Mus musculus'

In [30]:
# convertir a mayúsculas
seq2 = "atcgatgatcgatca"
seq2.upper()


'ATCGATGATCGATCA'

In [31]:
# convertir a mayúsculas
seq2 = "ATatGCTAGCGACCCa"
seq2.lower()

'atatgctagcgaccca'

In [None]:
# Concatenar textos
seq3= "ATGCCGTSNNCGTAGCGTAGCGTNNAGCTGACGTGACGTNNGACGTRGTGCNNATGCACATTACTACNNTCATGATNNATATACTACTNNACCGATCGGT"
exon= seq3.split("NN")
print(exon)


['ATGCCGTS', 'CGTAGCGTAGCGT', 'AGCTGACGTGACGT', 'GACGTRGTGC', 'ATGCACATTACTAC', 'TCATGAT', 'ATATACTACT', 'ACCGATCGGT']


In [49]:
print(len(exon))
exon[0:1+1]
exon[3:-5]

8


[]

In [37]:
start= 3
end= 8
gene_fun= "@".join(exon[start: end+1]) # END+1 PARA QUE TOME AL DEL FINAL 
gene_fun


'GACGTRGTGC@ATGCACATTACTAC@TCATGAT@ATATACTACT@ACCGATCGGT'

In [42]:
gen2= "".join([exon[0],exon[7],exon[4]])
gen2

'ATGCCGTSACCGATCGGTATGCACATTACTAC'

In [56]:
genero = "Zea"
especie = "mays"
# concatenar 
concat1 = genero + especie

# Concatenar con separador
concat2 = genero + " " + especie
concat3 = genero + ", " + especie

print(concat1)
print(concat2)
print(concat3)

Zeamays
Zea mays
Zea, mays


Concatenar utilizando `join()`, para un listado de textos "string"

In [62]:
human = ["Homo", "sapiens", "sapiens"]
" ".join(human)


'Homo sapiens sapiens'

In [38]:
# juntar con delimitador 
texto1 = ["problema", "objetivo", "diseño experimental", "análisis exploratorio", "validación"]
" --> ".join(texto1)


'problema --> objetivo --> diseño experimental --> análisis exploratorio --> validación'

# <center><h1 style="background-color:lightblue"><font color='red'>EJERCICIO</font></h1></center>

Calcular los porcentajes de contenido de A, T, C, G, CG, a partir de la secuencia

`tacctggttg atcctgccag tagtcatatg cttgtctcaa agatgaagcc`

Asegúrese de quitar los espacios vacíos intermedios.


# Estructura de datos

Al programar, debe **organizar sus datos** para que pueda acceder y manipularlo fácilmente. Python tiene estructuras de datos incorporadas. Dependiendo del tipo de objeto, los datos se organizan de diferente manera. Aquí se revisan: 

- `listas: list(), []`
- `diccionarios: dictionary {}`
- `tupla: tuple, ()`
- `conjuntos: set(), {}`

## Listas

* Una lista es una secuencia de objetos, separados por comas, entre corchetes `()`.
* Una lista está ordenada mediante un índice numérico, que comienza en 0.
* Puede contener cualquier objeto en Python, se pueden **mezclar objetos de diferente tipo**.

In [40]:
lista_vacia = []
type(lista_vacia)

list

In [55]:
lista1 = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
lista2 = [2, lista1, 13.5]
lista3 = [3, lista2, "dna", "proteina", True]
#print(len(lista1))
#print(len(lista2))
#print(len(lista3))
lista1[0:4]

['a', 'b', 'c', 'd']

In [56]:
print(lista3)

[3, [2, ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i'], 13.5], 'dna', 'proteina', True]


In [59]:
lista3[0]

3

In [None]:
lista5=list(["a", "b", "2", 2, "ATGGGTTCA"])

In [54]:
genes= [["gen1",2.3, "higado"], "gen1", 1.3, "riñon"], ["mapk3", 2.5,"higado"]
item= genes[1]
item[1]

2.5

* A los elementos de una lista se accede mediante su índice.

<img src="https://media.geeksforgeeks.org/wp-content/uploads/List-Slicing.jpg" width=800 height=250 />

  * El índice comienza en 0
  * El último índice es -1
* Una lista (y cualquier otra secuencia) se puede _rebanar_ (slice) para obtener una sublista, utilizando `[M:N]` (`M` y `N` son los índices a utilizar.
  * Devuelve una sublista desde la posición `M` (incluida) hasta `N` (no incluida).
  * Si se omite `M`, el índice es `0`
  * Si se omite `N`, el índice es el tamaño de la lista.

In [42]:
lista1[0]

'a'

In [61]:
lista1 = ["a", "b", "c", "d", "e", "f", "g", "h", "i"]
print(lista1[1])

lista1[1]= "sd"

b


In [43]:
lista1[-1]

'i'

In [44]:
# Secuencia de la lista
lista1[2:4]

['c', 'd']

In [45]:
# todos los elementos
lista1[:]

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']

In [48]:
# todos los elementos a la izquierda de
lista1[:5]

['a', 'b', 'c', 'd', 'e']

In [49]:
# todos los elementos a la derecha de
lista1[5:]

['f', 'g', 'h', 'i']

In [50]:
# Indice de objeto inexistente
lista1[20]

IndexError: list index out of range

In [17]:
# Se puede actualizar el contenido de una lista utilizando el índice
lista1[1] = "sd"
lista1

['a', 'sd', 'c', 'd', 'e', 'f', 'g', 'h', 'i']

* Al igual que con las cadenas de caracteres, se puede comprobar si un elemento está en una lista con el operador `in`

In [18]:
"a" in lista1

True

In [19]:
"b" in lista1

False

In [22]:
lista1.sort()
lista1.reverse()
lista1

['sd', 'i', 'h', 'g', 'f', 'e', 'd', 'c', 'a']

### Añadiendo, reemplazando

* A una lista se pueden añadir elementos de varias maneras.
  * Mediante el método `append`.
  * Mediante el método `insert`.
  * Mediante el método `extend`.

In [62]:
lista = ["Reino", "Filum", "Orden", "Familia"]
print(lista)
lista.append(["Genero", "Especie", "Variedad"])
print("Después de append:", lista)

lista.insert(3, "a")
print("Después de insert:", lista)

lista.extend(["Supespecie", "Variedad", "Tipo"])
print("Después de extend:", lista)

['Reino', 'Filum', 'Orden', 'Familia']
Después de append: ['Reino', 'Filum', 'Orden', 'Familia', ['Genero', 'Especie', 'Variedad']]
Después de insert: ['Reino', 'Filum', 'Orden', 'a', 'Familia', ['Genero', 'Especie', 'Variedad']]
Después de extend: ['Reino', 'Filum', 'Orden', 'a', 'Familia', ['Genero', 'Especie', 'Variedad'], 'Supespecie', 'Variedad', 'Tipo']


In [66]:
mosquitos= []
mosquitos.append(["parensis","Ecuador", "BTV", "ABC", 23])
mosquitos.append(["pLUTZY","Ecuador, Colombia", "OROV", "DFG",24])

* Se pueden cambiar elementos de una lista, a través del índice que se quiera cambiar

In [67]:
numeros =[1,2,3,4]
list_cu= []
for  i in numeros:
    list_cu.append([i, i**2,i**3,i**4])
list_cu

[[1, 1, 1, 1], [2, 4, 8, 16], [3, 9, 27, 81], [4, 16, 64, 256]]

In [27]:
lista[3] = "Suborden"
print(lista)

['Reino', 'Filum', 'Orden', 'Suborden', 'Familia', 'Genero', 'Especie', 'Variedad', 'Supespecie', 'Variedad', 'Tipo']


In [31]:
list_genes = [("p53", 0.123), ("hg21", 0.321)]
print(list_genes)
list_genes.append(("st32", 0.345))

list_genes

[('p53', 0.123), ('hg21', 0.321)]


[('p53', 0.123), ('hg21', 0.321), ('st32', 0.345)]

### Eliminando datos
* Del mismo modo, se puede eliminar elementos de varias maneras.
  * Mediante el método `remove`.
  * Mediante el método `pop`.
  * Mediante la function `del`.
  * Mediante la function `clear`.

In [68]:
lista1 = ["Hola", "GBI6", "estamos", "mes 2", "python", "listas"] 

print('Lista original:', lista1)

lista1.remove("estamos")
print('Elimino "Hola":', lista1)

lista1.pop()
print('Elimino el último elemento:', lista1)

del lista1[3]
print("Elimino el elemento del índice 3:", lista1)

lista1.clear()
print("Elimino todo:", lista1)

Lista original: ['Hola', 'GBI6', 'estamos', 'mes 2', 'python', 'listas']
Elimino "Hola": ['Hola', 'GBI6', 'mes 2', 'python', 'listas']
Elimino el último elemento: ['Hola', 'GBI6', 'mes 2', 'python']
Elimino el elemento del índice 3: ['Hola', 'GBI6', 'mes 2']
Elimino todo: []


### Ordenamiento en listas

Se puede ordernar listado de números o textos, pero **un solo tipo de dato**.  Se utilizan las funciones: 

* Ordenamiento `sort()`

* Ordenamiento inverso, descendente `reverse()`

In [65]:
primers = [5, 7, 4, 2, 9, 6, 2]
print("Lista original:", primers)
primers.sort()
print("Lista ordenada:", primers)
primers.reverse()
print("Lista ordenada reversa:", primers)


Lista original: [5, 7, 4, 2, 9, 6, 2]
Lista ordenada: [2, 2, 4, 5, 6, 7, 9]
Lista ordenada reversa: [9, 7, 6, 5, 4, 2, 2]


### Operaciones sobre listas

* Una lista se puede sumar y multiplicar.

* Se puede contar el contenido de un listado

In [69]:
lista1 = [1, 2, 3]
lista2 = ["a", "b", "c"]
lista1 + lista2

[1, 2, 3, 'a', 'b', 'c']

In [70]:
lista3 = lista2 * 2 + lista1
lista3

['a', 'b', 'c', 'a', 'b', 'c', 1, 2, 3]

In [72]:
# conteo de elementos
lista3.count('a')


2

In [40]:
lista4 = lista3.copy()
lista4[0] = "primero"
print(lista3)
print(lista4)

['a', 'b', 'c', 'a', 'b', 'c', 1, 2, 3]
['primero', 'b', 'c', 'a', 'b', 'c', 1, 2, 3]


In [41]:
# índice de texto
lista3.index("b")


1

## Diccionarios

* Conjunto de pares `key:value` o `clave:valor`, definidos entre llaves.
  * `{}` Define un diccionario vacío.
  * La función `dict()` pued recibir una secuencia de pares `key, value` para constuir un diccionario
  * La función `dict()` también puede recibir argumentos para crear el diccionario.
* Las claves son únicas en un diccionario.
* Se puede acceder a (y modificar) los elementos a través de su `key`.
* Pero no se puede acceder a las `key` a través de su valor.
* Un diccionario puede tener como elemento cualquier objeto en Python (incluidos otros diccionarios)
* Se puede comprobar si una llave está en un diccionario con el operador `in`.
* En el diccionario **no se tiene un orden**, el `key` es el identificador importante.
* El diccionario **no contiene índices** se accede a los valores por el `key`.

In [8]:
diccionario_vacio = {}
dic2 = dict()
print(diccionario_vacio )
print(dic2)

{}
{}


In [9]:
dict1 = {
    "nombre": "Luis",
    "apellido": "Sánchez",
    "carrera": "Biotecnología",
    "pref_topic": "NGS"
}

In [10]:
dict1

{'nombre': 'Luis',
 'apellido': 'Sánchez',
 'carrera': 'Biotecnología',
 'pref_topic': 'NGS'}

In [11]:
dict2 = dict([("nombre", "Luis"), ("apellido", "Sánchez"), ("carrera", "Biotecnología"), ("pref_topic", "NGS")])
dict2

{'nombre': 'Luis',
 'apellido': 'Sánchez',
 'carrera': 'Biotecnología',
 'pref_topic': 'NGS'}

In [12]:
dict3 = dict(nombre="Luis", apellido="Sánchez", carrera="Biotecnología", pref_topic = "NGS", edad = 31)

In [13]:
print(dict1)
print(dict2)
print(dict3)


{'nombre': 'Luis', 'apellido': 'Sánchez', 'carrera': 'Biotecnología', 'pref_topic': 'NGS'}
{'nombre': 'Luis', 'apellido': 'Sánchez', 'carrera': 'Biotecnología', 'pref_topic': 'NGS'}
{'nombre': 'Luis', 'apellido': 'Sánchez', 'carrera': 'Biotecnología', 'pref_topic': 'NGS', 'edad': 31}


In [14]:
# Nueva etiqueta en un diccionario existente
dict1["nombre"] = "Lizeth"

In [15]:
# Alimentar un diccionario vacío  
dict4= {}
dict4["genero"] = "Zea"  # Nuevo item

In [16]:
dict4["especie"] = "mays"

In [17]:
whos # identifica variables que cree

No variables match your requested type.


In [18]:
whos

Variable            Type    Data/Info
-------------------------------------
dic2                dict    n=0
diccionario_vacio   dict    n=0
dict1               dict    n=4
dict2               dict    n=4
dict3               dict    n=5
dict4               dict    n=2


In [20]:
size_genome = {"Homo sapiens": 3200.0, 
                 "Escherichia coli": 17.2, # tamaño real 4.6 Mbp
                 "Arabidopsis thaliana": 157.0, 
                 "Drosophila melanogaster": 80  # el tamaño real es de 130 Mbp
                }
size_genome

{'Homo sapiens': 3200.0,
 'Escherichia coli': 17.2,
 'Arabidopsis thaliana': 157.0,
 'Drosophila melanogaster': 80}

In [23]:
size_genome["Drosophila melanogaster"] *= 50  # actualizar valor / información con operación
size_genome["Escherichia coli"] = 4.6  # actualizar valor por cambio

size_genome

{'Homo sapiens': 3200.0,
 'Escherichia coli': 4.6,
 'Arabidopsis thaliana': 157.0,
 'Drosophila melanogaster': 6500}

In [24]:
# Cnsultas solo se hacen utilizando los KEY
"Homo sapiens" in size_genome

True

In [26]:
"Zea mays" in size_genome

False

In [27]:
# Complejo

d = {
    "personal": {
        "nombre": "Ashley",
        "apellido": "Genomeson",
    },
    "academico": {
        "carrera": "Biotecnología",
        "semestre": 6
    },
}
d

{'personal': {'nombre': 'Ashley', 'apellido': 'Genomeson'},
 'academico': {'carrera': 'Biotecnología', 'semestre': 6}}

In [29]:
print(d["personal"])
print(d["personal"]["nombre"])

{'nombre': 'Ashley', 'apellido': 'Genomeson'}
Ashley


In [97]:
print("Nombre:", d["personal"]["nombre"], "\nApellido:", d["personal"]["apellido"],
      "\nCarrera:", d["academico"]["carrera"], "\nSemestre:", d["academico"]["semestre"]
     )

Nombre: Ashley 
Apellido: Genomeson 
Carrera: Biotecnología 
Semestre: 6


In [42]:
# Más complejo

d2 = {
    "alumnos": [
        {"nombre": "Federico", "apellido": "Palma"},
        {"nombre": "Sebastian", "apellido": "Ruiz"},
    ],
    "carrera": [
        {"major": "Biotecnología", "minor":"Bioinformática"},
        {"major": "Biotecnología", "minor":"Microbiología"},
        
        {"MATERIAS":[ "GBI", "FIA", "FIV", "ENG6"]}
    ],
    "graduación": "2022I, 2021II",
}
d2

{'alumnos': [{'nombre': 'Federico', 'apellido': 'Palma'},
  {'nombre': 'Sebastian', 'apellido': 'Ruiz'}],
 'carrera': [{'major': 'Biotecnología', 'minor': 'Bioinformática'},
  {'major': 'Biotecnología', 'minor': 'Microbiología'},
  {'MATERIAS': ['GBI', 'FIA', 'FIV', 'ENG6']}],
 'graduación': '2022I, 2021II'}

### Otros tipos de manipulación de información

Se utilizan las funciones: 

* Para copiar `.copy()` 
* Para limpiar `.clear()` 
* Para obtener `.get()`, para obtener dato con el `key`, sino se devuelve un valor predefinido. 
* Para obtener todas las claves `.keys()`
* Para obtener todos los valores `.values()`
* Para obtener actualñizar con nuevas claves:valores `.update()`

In [44]:
print(d2["carrera"][1]["minor"])

Microbiología


In [45]:
GS = size_genome.copy()
GS

{'Homo sapiens': 3200.0,
 'Escherichia coli': 4.6,
 'Arabidopsis thaliana': 157.0,
 'Drosophila melanogaster': 6500}

In [47]:
size_genome.clear()
print(size_genome)
print(GS)


{}
{'Homo sapiens': 3200.0, 'Escherichia coli': 4.6, 'Arabidopsis thaliana': 157.0, 'Drosophila melanogaster': 6500}


In [49]:
GS.get("Arabidopsis thaliana", "NadA")

157.0

In [50]:
GS.get("Mus musculus", "NA")# 

'NA'

In [51]:
GS.keys() # claves 

dict_keys(['Homo sapiens', 'Escherichia coli', 'Arabidopsis thaliana', 'Drosophila melanogaster'])

In [52]:
GS.values()

dict_values([3200.0, 4.6, 157.0, 6500])

In [59]:
D1 = {"estud1": 7.5,"estud2": 9.5,"estud3": 6.3}
D2 = {"estud1": 6.2,"estud4": 6.4,"estud5": 7.5}
D1.update(D2) # promedio inser,change 
D1

{'estud1': 6.2, 'estud2': 9.5, 'estud3': 6.3, 'estud4': 6.4, 'estud5': 7.5}

* Otros métodos interesantes son:
  * `.pop(item)` Extrae el elemento con llave `item` del diccionario.

In [60]:
est1 = D1.pop("estud1")
print(D1)
print(est1)

{'estud2': 9.5, 'estud3': 6.3, 'estud4': 6.4, 'estud5': 7.5}
6.2


## Tuplas (tuple)

* Una tupla es una secuencia de objetos, separados por comas, entre paréntesis.
* Las tuplas, como las listas, están ordenadas.
* Una tupla es una secuencia **inmutable**, una vez creada no se puede modificar.
  * El resto de operaciones sobre secuencias si se pueden aplicar.
  * Una tupla NO tiene métodos (`append`, `extend`, etc.)

In [62]:
t = (1, 2, 3, "cuatro")
print(type(t))
t[0]

<class 'tuple'>


1

In [63]:
#t[0] = "uno"
t[3]



'cuatro'

In [64]:
nucleotidos = ("A", "T", "C", "G")

In [65]:
t + t

(1, 2, 3, 'cuatro', 1, 2, 3, 'cuatro')

In [66]:
t * 3

(1, 2, 3, 'cuatro', 1, 2, 3, 'cuatro', 1, 2, 3, 'cuatro')

* Una tupla vacía se define de la siguiente forma

In [67]:
t2 = ()
t2

()

* Pero una tupla de un elemento se define de la siguiente forma.

In [68]:
t = (1)  # Esto NO es una tupla
t

1

In [69]:
t = (1, )  # Una coma siempre al final
t

(1,)

### Operaciones en tuplas (tuple)

* Para contar `.count()`
* Para encontrar el índice del primer elemento `.index()`

In [6]:
tupla1 = ("A", "T", "C", "G", "AA", "A")
tupla1.count("a")

0

In [7]:
tupla1.index("AA")

4

In [71]:
tupla2= (2,3,["a","b",], 4)
elem2= tupla2[2]
elem2.append(3)
print(tupla2)
elem2

(2, 3, ['a', 'b', 3], 4)


['a', 'b', 3]

In [72]:
# Se puede utilizar una tupla como "key" de un diccionario

dict5 = {("Carlos", "Estrada", 17283274248): "Ecosistemas"}
dict5

{('Carlos', 'Estrada', 17283274248): 'Ecosistemas'}

## Secuencias

* Las listas, tuplas y *cadenas de caracteres* son secuencias.
* Muchas propiedades en común.
  * Indexado, slicing, etc.
* Operaciones en secuencias

| Operation | Result |
|-----------------------|-----------------------------------------------|
|`x in s`               |True if an item of s is equal to x, else False |
|`x not in s`           |False if an item of s is equal to x, else True |
|`s + t`                |the concatenation of s and t |
|`s * n or n * s`       |equivalent to adding s to itself n times 	|
|`s[i]`                 |ith item of s, origin 0 	|
|`s[i:j]`               |slice of s from i to j 	|
|`s[i:j:k]`             |slice of s from i to j with step k 	|
|`len(s)`               |length of s 	 |
|`min(s)`               |smallest item of s 	 |
|`max(s)`               |largest item of s 	 |
|`s.index(x[, i[, j]])` |index of the first occurrence of x in s (at or after index i and before index j) |
|`s.count(x)`           |total number of occurrences of x in s 	 |

In [14]:
cadena = "Hola a todos que tal estàn?"
cadena[1:11:2]

'oaatd'

In [123]:
cadena1 = cadena[7:12]
cadena1

'todos'

In [16]:
len(cadena)

sec2 = ("ave", "aves", "avestruz", "abeja")
max(sec2)

'avestruz'

## Conjuntos (set)

* Conjunto de valores **sin orden** y **sin duplicados**.
* Se definen entre llaves, separando los elementos por comas. 
* Se puede realizar operaciones de conjuntos
    * Intersección `&` o `.intersection()` 
    * Unión `|` o `.union()`
    * Diferencia simétrica `^` o `.symmetric.difference()` 
    * Diferencia `.difference()`
    * Subconjunto `.issubset()`
    * El elemento es parte del conjunto `in`
    
 <img src="https://conjuntosblogblog.files.wordpress.com/2016/07/operaciones-entre-conjuntos-3-728.jpg?w=440&h=330" width=800 height=550 />

In [73]:
a = {-1, 0, 1, 1, 2, 3, 4, 5, 5, 4, 3}
temp_list =  [4, 7, 6, 5, 2, 3, 1, 8,  8, 7]
b = set(temp_list)
print(a)

{0, 1, 2, 3, 4, 5, -1}


In [74]:
print(a)
print(b)

{0, 1, 2, 3, 4, 5, -1}
{1, 2, 3, 4, 5, 6, 7, 8}


In [75]:
# Intersección
a & b

{1, 2, 3, 4, 5}

In [76]:
# Unión 
a | b

{-1, 0, 1, 2, 3, 4, 5, 6, 7, 8}

In [77]:
# Diferencia simétrica
a ^ b

{-1, 0, 6, 7, 8}

In [78]:
b - a

{6, 7, 8}

In [79]:
# Diferencia
a.difference(b)

{-1, 0}

In [80]:
b.difference(a)

{6, 7, 8}

In [81]:
# Subconjunto
{1}.issubset(a)

True

In [82]:
a.issubset(b)

False

In [83]:
# Pertenencia de elemento
10 in a

False

## Tipos de datos

Para revisar el tipo de dato se utiliza la función `type()`

In [None]:
type(lista1)

In [None]:
type(tamano_genoma)

In [None]:
type((1,2,4))

In [None]:
type({"a","b","c"})

In [None]:
type("Genoma")

In [None]:
type({"nombre": "Luis"})

## Tipo booleano

* En Python, casi cualquier cosa es verdadero, excepto:
  * `[]` -> Lista vacía
  * `{}` -> Diccionario vacío
  * `""` -> Cadena vacía
  * `0`, `0.0`
  * `False` 
  * `None`
* Operadores: `not`, `and` y `or`.

In [None]:
True and False

In [None]:
False or True

In [None]:
True and not False

In [None]:
False and False

# <center><h1 style="background-color:lightblue"><font color='red'>EJERCICIO</font></h1></center>

* Dada la siguiente lista, eliminar las cadenas de caracteres presentes en ella y ordenarla.

In [None]:
lista = [9, 7, 14, 12, 10, 9, "Hola", 0, 23, 12, "Alvaro", 12]

# Escribe aquí tu código





* Dado el siguiente diccionario
  * Añadir el elemento "carrera" con el valor "Inmmunología".
  * Añadir a la lista de tesistas el nombre "Esteban".
  * Añadir el elemento "organismo" con el valor de los organismos modelo en forma de lista `["ratón", ]`

In [None]:
dict1 = {
    "tesistas": ["Juan", "Pedro", "Francisco", ],
    "tema": "Interactome, Genómica, PeptidosAntimicrobianos",
}

* Dados los siguientes dos diccionarios, actualizar con los datos del segundo diccionario el primero.

In [None]:
valores_por_defecto = {
    "nombre": None,
    "altura": 1000,
    "anchura": 1000,
    "localización": "Quito",
    "coordenadas": (78.4722475, -3.8199358),
}

valores_actualizar = {
    "altura": 100,
    "anchura": 200,
    "nombre": "Oso"
}