# Clase 3

## Estructuras de datos en Python

La mayoría de datos en la vida real no vienen solos, la mayoría vienen de repeticiones de expermientos, de múltiples datos tomados en conjunto, etc.
Los tipos de dato que hemos visto hasta al momento no nos permiten trabajar con estos conjuntos de datos de forma sencilla, por lo que necesitamos una forma de organizarlos y esta es una de las razones por las que existen las estructuras de datos.

Existen múltiples tipos de estructuras en Python, por ejemplo:

- Tuplas
- Listas
- Diccionarios
- Strings
- Conjuntos

Todos estos ejemplos son lo que llamamaos colecciones de datos.

Adicionalmente existen otras estructuras muy utilizadas que se pueden trabajar por medio de bibliotecas externas a Python, por ejemplo:

- ndarrays (`numpy`)
- dataframes (`pandas` o `polars`)

En la próxima clase veremos cómo se pueden utilizar estas últimas y se verá su uso básico, y en el taller de Computación Científica con Python se verá su uso de forma más detallada.


### Tuplas

Es la colección más sencilla de datos, estas son

1. Ordenadas
1. Inmutables
1. Pueden tener duplicados

Su uso más común es para devolver múltiples valores de las funciones

In [None]:
frutas = "manzanas", "bananos", "peras", "uvas", "mangos"
print(type(frutas))
print(len(frutas))

In [None]:
verduras = "yuca", "camote", "papa"
frutas_y_verduras = frutas + verduras


for alimento in frutas_y_verduras:
    print(alimento)

In [None]:
print(frutas[3])
print(frutas[-1])

# print(frutas[5]) # Error! Sólo hay 5 elementos en la tupla
# print(frutas[-6])

# frutas[0] = "maracuyá" # Error! Las tuplas son inmutables


In [None]:
def division_simple(x, y):
  cociente = x // y
  residuo = x % y
  return residuo, cociente

res, coci = division_simple(14, 3)
print(res)
print(coci)

In [None]:
# A esto le llamamos "unpacking" o "destructuring"

numeros = 1, 2
x, y = numeros
print(x)
print(y)

In [None]:
a, b = 3, 4
print(a)
print(b)

In [None]:
def division_entera(dividendo, divisor):
    cociente = dividendo // divisor
    residuo = dividendo % divisor
    return cociente, residuo

co, re = division_entera(15, 7)
print(co, re)

### Listas

- Ordenadas
- Mutables
- Pueden tener duplicados

In [None]:
lista_de_compras = ["Arroz", "Frijoles", "Cereal", "Comida de gato", "Servilletas", "Salsa Lizano"]

print(type(lista_de_compras))
print(len(lista_de_compras))

In [None]:
for elemento in lista_de_compras:
    print(elemento)

# print(lista_de_compras[0])
# print(lista_de_compras[-1])

In [None]:
lista_de_compras[0:5:2]

In [None]:
for indice, elemento in enumerate(lista_de_compras):
    print(f"El elemento en la posición {indice} es: {elemento}")

In [None]:
"Desinfectante" in lista_de_compras

In [None]:
nuevo_elemento = "Desinfectante"
lista_de_compras.append(nuevo_elemento)

print(lista_de_compras)

In [None]:

nuevo_elemento = "Desinfectante"
if nuevo_elemento in lista_de_compras:
    print("Ya tenemos suficiente")
else:
    print(f"Nos hace falta {nuevo_elemento}")

In [None]:
print(lista_de_compras)

In [None]:
lista_de_compras.remove(nuevo_elemento)

In [None]:
elemento_comprado = lista_de_compras.pop()
print(elemento_comprado)

In [None]:
lista_de_compras.clear()
print(lista_de_compras)

In [None]:
numeros = [i for i in range(10)]
print(numeros)

In [None]:
numeros_pares = [i for i in numeros if i % 2 == 0]
print(numeros_pares)

In [None]:
resultados_experimento = [23.0, 23.1, 25.0, 34.0, 19.6]
print(max(resultados_experimento))
print(min(resultados_experimento))


In [None]:
estudiantes = ["Ana", "María", "Pedro", "María", "Juan", "Juan", "José", "Gabriela"]

print(estudiantes.count("María"))
print(estudiantes)
estudiantes.sort()
print(estudiantes)

In [None]:
estudiantes_fisica = ["Andrés", "Ana", "Sara", "Helena"]
estudiantes_mate = ["Emanuel", "Lucas", "Mariana", "Isabel"]

estudiantes_fm = []
print(estudiantes_fm)
estudiantes_fm.extend(estudiantes_fisica)
print(estudiantes_fm)
estudiantes_fm.extend(estudiantes_mate)
print(estudiantes_fm)


In [None]:
matriz = [
    [1, 2, 3], # 0
    [4, 5, 6], # 1
    [7, 8, 9]  # 2
    ]

# matriz = [[1, 2, 3],[4, 5, 6],[7, 8, 9]]

print(matriz)
print(matriz[0])
print(matriz[0][1])

In [None]:
for i in range(len(matriz)):
    for j in range(len(matriz[i])):
        print(matriz[i][j], end=" ")
    print("")

### Ejemplo:

Suponga que usted tiene la siguiente secuencia de ADN:

CAGACTAGCTTTTGCATTCTACGGTATGGCAGATGTGTTAATCTCGAGAGTGTTAAAAACTGATAGCAGC

Utilice una lista y un ciclo for para contar la cantidad de nucleótidos (A, C, G, T) que contiene la cadena anterior. Imprima al final cuántos hay de cada uno.


In [None]:
adn = list('CAGACTAGCTTTTGCATTCTACGGTATGGCAGATGTGTTAATCTCGAGAGTGTTAAAAACTGATAGCAGC')

numero_A = 0
numero_C = 0
numero_G = 0
numero_T = 0


for nucleotido in adn:
  if nucleotido == 'A':
    numero_A += 1 # numero_A = numero_A + 1
  elif nucleotido == 'C':
    numero_C += 1
  elif nucleotido == 'G':
    numero_G += 1
  elif nucleotido == 'T':
    numero_T += 1

print(f"Cantidad A: {numero_A}")
print(f"Cantidad C: {numero_C}")
print(f"Cantidad G: {numero_G}")
print(f"Cantidad T: {numero_T}")



### Diccionarios

- Ordenados (Desde Python 3.7 en adelante)
- Mutables
- No pueden haber duplicados


In [None]:
banda = {
    "nombre": "Paramore",
    "discos": ["All we know is falling", "Riot", "BNE", "Self titled", "After laughter", "This is why"],
    "cantidad_miembros": 3
}

print(type(banda))

In [None]:
# banda[0] # Error!
print(banda["nombre"])
print(banda["discos"][-1])

In [None]:
print(banda.keys())
print(banda.values())

In [None]:
for llave in banda:
    print(llave, banda[llave])

In [None]:
banda["disquera"] = "Independent band"
banda["genero_musical"] = "rock"

In [None]:
print(banda["vocalista"])

In [None]:
banda.get("vocalista", "NA")

In [None]:
sismos = {
    'sismo1':{'Epicentro':'Upala','Fecha':'28-Feb-2020', 'Magnitud': 3.4},
    'sismo2':{'Epicentro':'Guanacaste','Fecha':'01-Mar-2020', 'Magnitud': 3.8},
    'sismo3':{'Epicentro':'San Jose'}
}

sismos['sismo1']['Epicentro']

### Ejemplo

Suponga que usted quiere trabajar con datos sobre el acceso a recursos en distintos países. Por ejemplo, **por año** usted tiene la siguiente información:

|País | Agua  | Electricidad |
| :---: | :---: | :---: |
| Yemen | 54.5 | 61.75 |
| Suecia | 100 | 100 |
| Surinam | 93.5 | 91.26 |

Donde el agua y la electricidad están dados como porcentajes de la población de dicho país que tiene acceso al recurso ese año.

1- Cree una plantilla de cómo almacenaría esta información usando diccionarios y/o listas, considere que puede almacenar datos distintos para diferentes años. Guarde los datos dados en la tabla como ejemplo, estos datos son del año 2009. Su solución debe permitir que los datos se puedan identificar.

2- Suponga que usted prefiere trabajar con códigos en vez de nombres para los países, por ejemplo:

|País | Código  |
| :---: | :---: |
| Yemen | YEM |
| Suecia | SWE |
| Surinam | SUR |

 Cree otra plantilla para una función que reciba el diccionario del punto 1 y sustituya los nombres de los países por su respectivo código.


In [None]:
yemen = {
    'nombre': "Yemen",
    'acceso_agua': "54.5",
    'acceso_elec': "61.75",
}
suecia = {
    'nombre': "Suecia",
    'acceso_agua': "100",
    'acceso_elec': "100"
}
surinam = {
    'nombre': "Surinam",
    'acceso_agua': "93.5",
    'acceso_elec': "91.26"
}

paises = [yemen, suecia, surinam]

def resumir(pais):
  tabla = {
      "Yemen": "YEM",
      "Suecia": "SWE",
      "Surinam": "SUR"
  }
  nombre = pais['nombre']
  pais['nombre'] = tabla[nombre]

print(paises)

for pais in paises:
  resumir(pais)
print(paises)
