# Introducción a Python y Jupyter Notebooks para el análisis de datos 

## Introducción

Python es un lenguaje de programación poderoso, flexible y fácil de aprender que ha ganado popularidad en la biología debido a su amplia gama de aplicaciones, desde análisis de secuencias hasta modelado ecológico.

### ¿Por qué Python es útil para los biólogos?

Simplicidad: Su sintaxis es intuitiva y fácil de leer, incluso para quienes no tienen experiencia en programación.

Bibliotecas Especializadas: Python tiene bibliotecas específicas para bioinformática y análisis de datos, como:

`Biopython`: Herramientas para trabajar con secuencias, alineamientos y archivos de bases de datos biológicas.

`Pandas`: Manejo de grandes conjuntos de datos.

`NumPy`: Cálculo matemático y manejo eficiente de matrices.

`Matplotlib` y `Seaborn`: Generación de gráficos y visualización de datos.

Comunidad Activa: Una gran cantidad de recursos y foros donde se pueden encontrar soluciones a problemas comúnmente enfrentados.

In [None]:
print("Hola, mundo biológico!")

Es importante que practiques por tu cuenta para aprender mas sobre python y sus usos en biología

Este es uno de los recursos mas interesantes disponibles en la web: [Rosalind](https://rosalind.info/problems/locations/)

Una vez tengas los conceptos basicos podras explorar mas por tu cuenta y buscar solucion a los problemas propuestos en Rosalind.

### Conceptos Básicos de Python

#### Tipos de variables y operaciones

##### Variables

En Python, una variable es un contenedor que almacena un valor. Este valor puede cambiar durante la ejecución del programa. Las variables permiten referirse a datos de forma sencilla utilizando nombres, en lugar de los propios valores.

In [3]:
# Declarar una variable:
a = 4
a = 3 # Se sobreescribe

A = 0.1

# No se sobreescribe porque Python es Case Sensitive

In [7]:
dato = 5

In [None]:
print("dato")
print(dato)

In [None]:
print(a)
print(A)


Algunas reglas sobre el nombre de las variables:

- Un nombre de variable debe comenzar con una letra o el carácter de guion bajo (_).
- Un nombre de variable no puede comenzar con un número.
- Un nombre de variable solo puede contener caracteres alfanuméricos y guiones bajos (A-z, 0-9 y _).
- Los nombres de variables distinguen entre mayúsculas y minúsculas (por ejemplo, age, Age y AGE son tres variables diferentes).
- Un nombre de variable no puede ser ninguna de las palabras clave reservadas de Python.

In [None]:
_15 = 5
print(_15)

##### Tipos de variables

Python tiene los siguientes tipos de variables, en estas categorias:

- Numeric Types:	`int`, `float`, `complex`
- Text Type:	`str`
- Boolean Type:	`bool`
- Sequence Types:	`list`, `tuple`, `range`
- Set Types:	`set`, `frozenset`
- Mapping Type:	`dict`
- Binary Types:	`bytes`, `bytearray`, `memoryview`
- None Type:	`NoneType`

##### **1. Numéricas (Numerical)**: 

- int (entero / **integer**): Números enteros positivos o negativos, sin decimales.
- float (flotante / floating-point): Números reales con decimales.
- complex (complejo / complex): Números complejos con parte real e imaginaria.

In [12]:
x = 10  # int
"x = 1" # esto es un comentario
y = 3.14  # float

z = 1 + 2j  # complex


In [None]:
print(x)
print(y)
print(z)

In [None]:
print ("x")

In [None]:
print(type(x))

In [None]:
# Si quiero saber el tipo de una variable puedo usar la función type()

print(type(x))
print(type(y))
print(type(z))

In [None]:
# números en notacion cientifica tambien son floats:

x = 35e3
y = 12E4
z = -87.7e100

print(type(x))
print(type(y))
print(type(z))

#### Opedores aritméticos

los operadores son símbolos o palabras reservadas que se utilizan para realizar operaciones sobre valores o variables. Estos operadores se clasifican según el tipo de operación que realizan.

Operadores aritméticos (Arithmetic Operators): Se utilizan para realizar operaciones matemáticas básicas.


|Operador|	Descripción (Español)    | Descripción (Inglés)|  Ejemplo |
|--------|---------------------------|---------------------|----------|
| +      | Suma	                     | Addition	           |  x + y   |
| -      | Resta	                 | Subtraction	       |  x - y   |
| *	     | Multiplicación	         | Multiplication      |  x * y   |
| /	     | División	                 | Division	           |  x / y   |
| %	     | Módulo (resto de división)| Modulus	           |  x % y   |
| **     | Potenciación	             | Exponentiation      |  x ** y  |
| //     | División entera	         | Floor Division      |  x // y  |


In [24]:
x = 40
y = 3
z = 5

In [None]:
x % y

In [None]:
g = ((5+x) * 2)/3
print(type(g))
print(g)

g - 10

h = int(g)
print(h)
print(type(h))

In [None]:
# las variables se pueden reasignar
x = 40
x = x + 1
print(x)

In [None]:
# tambien puedes transformar un tipo de variable a otro

x = 1    # int
y = 2.8  # float
z = 1j   # complex

#convert from int to float:
a = float(x)

#convert from float to int:
b = int(y)

#convert from int to complex:
c = complex(x)

print(a)
print(b)
print(c)

print(type(a))
print(type(b))
print(type(c))

##### 2. Cadenas de texto (Strings):

- str (cadena / string): Secuencia de caracteres encerrada entre comillas simples (') o dobles (").

In [None]:
# Doble comilla
saludo = "Hola, mundo!"  # str
# Comilla simple
nombre = 'Juan'
# Comillas dentro de la variable
mensaje = "Juan dijo 'Hola'"

print(saludo)
print(nombre)
print(mensaje)

# tipo
print(type(saludo))
print(type(nombre))
print(type(mensaje))

In [None]:
# asignación múltiple

f, g, h = "La Paz", "Santa Cruz", "Oruro" # f = "La Paz", g = "Santa Cruz", h = "Oruro"

print(f)
print(g)
print(h)

In [None]:
# Asignar el mismo valor a multiples variables:
i = j = k = "Cochamamba"
print(i)
print(j)
print(k)

In [None]:
# Se puede asignar multiples strings a una variable
# se debe usar tres comillas dobles o simples

a = """Algo, que ciertamente no se nombra		
con la palabra azar, rige estas cosas:		
otro ya recibió en otras borrosas tardes,		
los muchos libros y las sombras."""
print(a)

In [None]:
# Corte (Slicing) en Python: Puedes devolver un rango de caracteres utilizando la sintaxis de slicing (corte).
# Debes especificar el índice de inicio y el índice de fin, separados por dos puntos (:), para obtener una parte de la cadena
# el indice comienza en 0

b = "Hello, World!"
print(b[1:5])

# Slice desde el inicio
b = "Hello, World!"
print(b[:5])

# Slice hasta el final
b = "Hello, World!"
print(b[5:])


In [None]:
b = "Hello, World!"
print(b[5:])

##### 3. Booleanos (Booleans):

- bool (booleano / boolean): Representa valores de verdad, True (verdadero) o False (falso).

In [83]:
Positivo = True  # bool

Negativo = False # bool

Operadores de comparación (Comparison Operators): Comparan dos valores y devuelven un resultado booleano (True o False).


|Operador |	Descripción (Español) |	Descripción (Inglés)     | Ejemplo |
|---------|-----------------------|--------------------------|---------|
|==	      | Igual a               |	Equal to                 |	x == y |
|!=	      | Distinto de           |	Not equal to             |	x != y |
|>	      | Mayor que             | Greater than	         | x > y   |
|<	      | Menor que	          | Less than	             | x < y   |
|>=	      | Mayor o igual que     | Greater than or equal to |	x >= y |
|<=       | Menor o igual que     | Less than or equal to    |	x <= y |

In [None]:
x =(10*3/5)
print(x)

print(x > 9)
print(x == 9)
print(x < 9)

In [None]:
# if and else

a = 200
b = 3

if b > a:
  print("b es mayor que a")
else:
  print("b es menor que a")

In [None]:
print(bool("Hello"))
print(bool(15))

In [None]:
x = "" # cualquier string es True a menos que este vacio ""
y = 0 # cualquier numero diferente de 0 es True

print(bool(x))
print(bool(y))

In [None]:
# if and elif
# elif es una abreviatura de else if
# "if the previous conditions were not true, then try this condition".
a = 33
b = 33
if b > a:
  print("b es mayor a a")
elif a == b:
  print("a y b son iguales")

In [None]:
# else captara cualquier cosa que no haya sido capturada por los if y elif anteriores
a = 200
b = 33
if b > a:
  print("b is greater than a")
elif a == b:
  print("a and b are equal")
else:
  print("a is greater than b")

In [None]:
# anidando if

x = 21

if x > 10:
  print("x es mayor a 10,")
  if x > 20:
    print("y tambien mayor a 20!")
  else:
    print("pero no mayor a 20.")

In [110]:
# cuando usas if no puedes dejar el bloque vacio, si no quieres hacer nada puedes usar pass

a = 33
b = 200

if b > a:
  pass

| Operator |	Description|	Example|
|--------|--------|--------|
| and |	Returns True if both statements are true |	x < 5 and  x < 10	|
| or |	Returns True if one of the statements is true |	x < 5 or x < 4	|
| not |	Reverse the result, returns False if the result is true |	not(x < 5 and x < 10)|

In [None]:
x = 10

print(x > 3 and x <= 10)

In [None]:
# and es un operador lógico que retorna True si ambos enunciados son verdaderos
a = 200
b = 33
c = 500
if a > b and c > a:
  print("Both conditions are True")

In [None]:
x = 5

print(x > 3 or x < 4)

In [None]:
# or es un operador lógico que devuelve True si cualquiera de las declaraciones es verdadera
a = 200
b = 33
c = 500
if a > b or a > c:
  print("al menos una de las condiciones es verdadera")
else:
  print("Ninguna de las condiciones es verdadera")

In [None]:
x = 5

print(not(x > 3 and x < 10))

In [None]:
# not revierte el resultado, si es True lo convierte en False y viceversa
a = 33
b = 200
if not a > b:
  print("a is NOT greater than b")

##### 4. Secuencias (Sequences):

- list (lista / list): Colección ordenada de elementos mutables (pueden cambiarse).
- tuple (tupla / tuple): Colección ordenada de elementos inmutables.
- range (rango / range): Representa un rango de números.

In [134]:
frutas = ["manzana", "banana", "cereza"]  # list

coordenadas = (10, 20)  # tuple

numeros = range(6)  # range 0, 1, 2, 3, 4

In [None]:
print(frutas)
print(coordenadas)
print(numeros)

In [None]:
print(type(frutas))
print(type(coordenadas))
print(type(numeros))

In [None]:
print(list(numeros))

In [None]:
# los tuples permiten valores duplicados
# a diferencia de las listas que no permiten valores duplicados
# los tuples son inmutables
# se usan () en lugar de []

thistuple = ("apple", "banana", "cherry", "apple", "cherry")
print(thistuple)
print(type(thistuple))

In [None]:
# el largo de una tupla:
thistuple = ("apple", "banana", "cherry")
print(len(thistuple))

In [None]:
# un string con una coma al final se convierte en un tuple
thistuple = ("apple",)
print(type(thistuple))

#NOT a tuple
thistuple = ("apple")
print(type(thistuple))

In [160]:
# los tuples pueden tener diferentes tipos de datos:
tuple1 = ("apple", "banana", "cherry")
tuple2 = (1, 5, 7, 9, 3)
tuple3 = (True, False, False)

In [161]:
tuple1 = ("abc", 34, True, 40, "male")

In [None]:
mytuple = ("apple", "banana", "cherry")
print(type(mytuple))

In [None]:
# Asignar una lista a multiples variables:

Ciudades_Bolivia = ["La Paz", "Cochabamba", "Santa_Cruz", "Oruro", "Potosi", "Tarija", "Sucre", "Beni", "Pando"]
l, m, n, o, p, q, r, s, t = Ciudades_Bolivia

print(l)
print(m)
print(n)
print(o)
print(p)
print(q)
print(r)
print(s)
print(t)

In [None]:
print(l, m, n, o, p, q, r, s, t)

"Is" e "is not"

| Operator |	Description |	Example |
|----------|----------------|-----------|
| is |	Returns True if both variables are the same object|	x is y	|
| is not|	Returns True if both variables are not the same| object	x is not y|

In [None]:
x = ["apple", "banana"]
print(type(x))

In [None]:
x = ["apple", "banana"]
y = ["apple", "banana"]
z = x

print(x is z)

# True z es el mismo objeto que x

print(x is y)

# False porque x no es el mismo objeto que y, incluso si tienen el mismo contenido

print(x == y)

# la difenrencia entre "is" y "!=": este ultimo compara el contenido de las variables

In [None]:
x = ["apple", "banana"]
y = ["apple", "banana"]
z = x

print(x is not z)

# False por que z es el mismo objeto que x

print(x is not y)

# True porque x no es el mismo objeto que y, incluso si tienen el mismo contenido

print(x != y)

# la difenrencia entre "is not" y "!=": este ultimo compara el contenido de las variables

##### While loop

In [None]:
# while loop: (mientras)
# Con el bucle while podemos ejecutar un conjunto de declaraciones siempre que una condición sea verdadera.

i = 1
while i <= 6:
  print(i)
  i += 1

In [None]:
# con "brake" se puede detener el bucle antes de que se cumpla la condición

i = 1
while i <= 6:
  print(i)
  if i == 3:
    break
  i += 1

In [None]:
# con #continue" se puede detener la iteración actual y continuar con la siguiente
i = 0
while i < 6:
  i += 1
  if i == 3:
    continue
  print(i)

In [None]:
# con "else" podemos ejecutar un bloque de código una vez que la condición ya no es verdadera
i = 1
while i < 6:
  print(i)
  i += 1
else:
  print("i is no longer less than 6")

##### for loop

In [None]:
# for loop: se utiliza para iterar sobre una secuencia (una lista, una tupla, un diccionario, un conjunto o una cadena).

# por ejemplo, para imprimir cada fruta en una lista de frutas
fruits = ["apple", "banana", "cherry"]
for x in fruits:
  print(x)
  
print(fruits)

In [None]:
# en un string se puede iterar letra por letra
for x in "banana":
  print(x)

In [None]:
# break se puede usar para detener el bucle antes de que haya recorrido todos los elementos
fruits = ["apple", "banana", "cherry"]
for x in fruits:
  print(x)
  if x == "banana":
    break

In [None]:
# detener antes de banana
fruits = ["apple", "orange", "banana", "cherry"]
for x in fruits:
  if x == "banana":
    break
  print(x)

In [None]:
# con "continue" se puede detener la iteración actual y continuar con la siguiente
fruits = ["apple", "banana", "cherry"]
for x in fruits:
  if x == "banana":
    continue
  print(x)

---

In [None]:
A1 = "Hello"
B1 = "World"
print(A1, B1)
print('Hello', 'World')
print(A1 + B1)
print(A1 + " " + B1 + "!")

# print(A1 + 1) # + no se puede usar con numeros o variables numericas

In [None]:
# las variables pueden ser globales o locales

# variable global
x = "awesome"

# variable local
# definida dentro de una función:

# Definir una funcion
def myfunc():
  x = "fantastic"          # nota que aqui hay identación, es decir, la variable x es local
  print("Python is " + x)

# Llamar a la función
myfunc()

# Esto esta fuera de la funcion, por lo que la variable x es global
print("Python is " + x)

In [None]:
# Si quieres que una variable creada dentro de una función sea global, puedes usar la palabra clave global.

x = "awesome"

def myfunc():
  global x
  x = "fantastic"

myfunc()

print("Python is " + x)

5. Conjuntos (Sets):

- set (conjunto / set): Colección de elementos únicos y no ordenados.
- frozenset (conjunto inmutable / frozenset): Similar a set, pero inmutable.

In [176]:
colores = {"rojo", "verde", "azul"}  # set

dias = frozenset(["lunes", "martes", "miércoles"])  # frozenset

6. Diccionarios (Dictionaries):

- dict (diccionario / dictionary): Colección no ordenada de pares clave-valor.

In [178]:
persona = {"nombre": "Ana", 
           "edad": 25}  

In [None]:
print(persona["nombre"])

print(persona["edad"])

print(type(persona))

print(persona)

7. Tipo especial (Special type):

- NoneType: Representa la ausencia de valor; su único valor es None.

In [None]:
resultado = None  # NoneType

print(type(resultado))
print(resultado)

In [184]:
# podemos especificar el tipo de una variable

x1 = str("Hello World")	# str
x2 = int(20)	# int	
x3 = float(20.5)	# float	
x4 = complex(1j)	# complex	
x5 = list(("apple", "banana", "cherry"))	# list	
x6 = tuple(("apple", "banana", "cherry"))	# tuple	
x7 = range(6)	# range	
x8 = dict(name="John", age=36)	# dict	
x9 = set(("apple", "banana", "cherry"))	# set	
x10 = frozenset(("apple", "banana", "cherry"))	# frozenset	
x11 = bool(5)	# bool	
x12 = bytes(5)	# bytes	
x13 = bytearray(5)	# bytearray	
x14 = memoryview(bytes(5)) # memoryview

In [None]:
print(type(x9))

Otros operadores:

| Operator |	Name |	Description	| Example |
|----------|---------|--------------|-------|
| & |	AND	| Sets each bit to 1 if both bits are 1 |	x & y	|
| \| |OR	| Sets each bit to 1 if one of two bits is 1 |	x  \| y	|
| ^	| XOR	|Sets each bit to 1 if only one of two bits is 1 |	x ^ y	|
| ~	| NOT	| Inverts all the bits	 | ~x	|
| <<	| Zero fill left shift |	Shift left by pushing zeros in from the right and let the leftmost bits fall off |	x << 2	|
| >>	| Signed right shift |	Shift right by pushing copies of the leftmost bit in from the left, and let the rightmost bits fall off |	x >> 2 |