# Semana 4: Estructuras
(Lunes 6/3 - Miércoles 8/3)


## Tipos de datos primitivos

Python tiene pocos tipos primitivos de datos.

    * Números enteros
    * Números de punto flotante
    * Números complejos
    * Booleanos
    * Cadenas de texto

### Tipo None

En Python, hay un tipo de valor llamado `None` ("Ninguno", "Nada") que representa presisamente la ausencia de un valor. En otros lenguajes hay tipos equivalentes que suelen llamarse `nil`, `null`, `undefined`, etc. Suele utilizarse como un comodín para reservar el lugar para un valor opcional o faltante. En particular, las funciones que no retornan ningún valor, como el `print()` (sólo imprime en pantalla, la función en sí no nos devuelve nada), devuelven `None`:

In [None]:
variable = print('Hola')
print(variable)

En los condicionales, evalúa como `False`:

In [2]:
a = None
if not a:
  print('Se cumplió la condición')

Se cumplió la condición


## Contenedores

Los contenedores son un tipo de estructura de datos que contienen otros objetos adentro. Es decir, almacenan objetos de una manera organizada y con métodos de acceso que dependen del tipo de contenedor. En Python tenemos varios tipos básicos de contenedores: **Listas**, **tuplas**, **diccionarios**, y **conjuntos** (*sets*).

### Listas

Las listas las definimos entre corchetes `[]`. Pueden contener cualquier tipo de datos (¡incluso otras listas!) y pueden tener elementos repetidos. Los elementos están *indexados*, es decir, tienen un índice asociado (que, como siempre, comienza desde el 0). En general accedemos a los elementos especificando el índice del elemento entre corchetes:

In [None]:
# lista de alumnos
alumnos = [
    'Carlos Gómez',
    'Gabriela Torres',
    'Juan Pérez']

print(alumnos[0])
print(alumnos[1])

Típicamente, a las listas las construimos añadiendo elementos sucesivamente:

In [None]:
alumnos = [] # lista vacía

# Agrego los alumnos con el método append
alumnos.append('Carlos Gómez')
alumnos.append('Gabriela Torres')
alumnos.append('Juan Pérez')
# etc.

In [None]:
# Armado de lista de números del 1 al 10:
numeros = []

for i in range(10):
  numeros.append(i+1)

print(numeros)

Es importante notar que los elementos de una lista tienen un orden, son **secuenciales**. Otros tipos de contenedores pueden ser no ordenados. La otra característica de las listas es que son **mutables**, pueden ser modificadas sin definir una nueva lista.

### Tuplas

Son definidas entre paréntesis `()`. Las tuplas, al igual que las listas, contienen una serie de elementos ordenados (indexados), que pueden ser repetidos. Sin embargo, a diferencia de ellas, son **inmutables**, no están pensadas para ser modificadas:

In [None]:
# (Nombre, dni, nota)
alumno_1 = ('Carlos Gómez', 41008418, 5)
alumno_2 = ('Gabriela Torres', 45790918, 8)
alumno_3 = ('Juan Pérez', 48327044, 9)

# Se produce un ERROR al intentar modificarlas
alumno_1[0] = 'Alberto Gómez'

Las tuplas suelen usarse para representar registros o estructuras simples. Típicamente, una tupla representa un solo objeto con múltiples partes. Una analogía posible es la siguiente: *Una tupla es como una fila de una base de datos.*

Las tuplas suelen usarse para *empaquetar* información relacionada en una sola *entidad*. Así puede ser pasada de un lugar a otro de un programa como un solo objeto.

In [None]:
s = ('Manzanas', 100, 490.1)

Para usar una tupla en otro lado, debemos *desempaquetar* su contenido en diferentes variables.

In [None]:
fruta, cajones, precio = s
print('Costo:', cajones * precio)

Obviamente, el número de variables a la izquierda debe ser consistente con la estructura de la tupla.

In [None]:
nombre, cajones = s     # ERROR

Ahora podemos entender lo que hacemos cuando usamos la función `enumerate()`. Ésta nos va entregando tuplas, pares (índice, elemento), que en general desempaquetamos en la misma línea del `for` para trabajar más cómodamente:

In [1]:
lista = ['a', 20, 17.5, 'b']

for i, e in enumerate(lista):
  print('nº:', i, 'Elemento:', e)

nº: 0 Elemento: a
nº: 1 Elemento: 20
nº: 2 Elemento: 17.5
nº: 3 Elemento: b


In [2]:
lista = ['a', 20, 17.5, 'b']

for e in enumerate(lista):
  print('tupla:', e)

tupla: (0, 'a')
tupla: (1, 20)
tupla: (2, 17.5)
tupla: (3, 'b')


Esto es algo que usualmente se hace al iterar sobre elementos que son tuplas:

In [3]:
puntos = [
  (1, 4),(10, 40),(23, 14),(5, 6),(7, 8)
]

for x, y in puntos:
    print('x =', x, '\t y =', y)

x = 1 	 y = 4
x = 10 	 y = 40
x = 23 	 y = 14
x = 5 	 y = 6
x = 7 	 y = 8


### Tuplas vs. Listas

Las tuplas parecieran ser simplemente listas de solo-lectura. Sin embargo, las tuplas suelen usarse para un solo ítem que consiste de múltiples partes mientras que las listas suelen usarse para una colección de diferentes elementos, típicamente del mismo tipo.

In [None]:
producto = ('Manzanas', 100, 490.1)             # Una tupla representando un registro dentro de un pedido de frutas

frutas = [ 'Manzanas', 'Peras', 'Mandarinas' ]  # Una lista representando tres frutas diferentes.

Más allá de las similitudes y diferencias, es usual combinar tuplas y listas. Si usamos las tuplas para almacenar registros, la lista de tuplas puede hacer las veces de una pequeña base de datos. Vemos a continuación un ejemplo:

In [3]:
# usando una lista de tuplas para almacenar registros de frutas
frutas = [('Manzanas', 100, 490.1), ('Peras', 120, 582.5), ('Mandarinas',50,345.2)]

for tupla in frutas:
  fruta, cajones, precio = tupla
  print("Costo", fruta, "=", cajones * precio)

print(frutas[2][0])

Costo Manzanas = 49010.0
Costo Peras = 69900.0
Costo Mandarinas = 17260.0
Mandarinas


### Diccionarios

Los diccionarios se definen entre llaves `{}`, y  son usados para almacenar datos en pares *key*(clave):*value*(valor). No admite claves duplicadas. Si bien en las últimas versiones de Python los elementos tienen un orden, en general éste no es relevante. La manera de acceder a un elementos es especificando la clave entre corchetes: 

In [None]:
# Diccionarios

# diccionario de notas de alumnos
notas = {
   'Carlos Gómez': 5,
   'Gabriela Torres': 8,
   'Juan Pérez': 9}

# Imprimo la nota de de un alumno:
print(notas['Gabriela Torres'])

El acceso a los elementos es rápido (comparado con listas). La manera de construir diccionarios es asignando elementos con las claves:

In [3]:
dic_ivan = {}

# Agrego elemento
dic_ivan['Nombre'] = 'Iván'
dic_ivan['edad'] = 28
dic_ivan['altura'] = 1.80
dic_ivan['es_real'] = True

Para borrar un valor, usamos el comando `del`.

In [None]:
del dic_ivan['es_real']
print(dic_ivan)

Para interar sobre un diccionario, podemos hacerlo siguiendo las claves, los valores o directamente los elementos:

In [4]:
# iteramos sobre las claves
for clave in dic_ivan.keys():
  print(dic_ivan[clave])

# iteramos sobre los valores
for val in dic_ivan.values():
  print(val)

# los items son tuplas (clave, valor)
for item in dic_ivan.items():
  print(item)

Iván
28
1.8
True
Iván
28
1.8
True
('Nombre', 'Iván')
('edad', 28)
('altura', 1.8)
('es_real', True)


También podemos hacer otras operaciones, como por ejemplo puede probar pertenencia en claves, o pedir la longitud:

In [4]:
# Test de pertencia en diccionario
ej_clave = 'Nombre'

if ej_clave in dic_ivan:
    print('Si')
else:
    print('No')

# Longitud
print(len(dic_ivan))

NameError: name 'dic_ivan' is not defined

### Conjuntos

Los conjuntos almacenan múltiples elementos de manera no ordenada, sin admitir duplicados. Se definen como los diccionarios, con llaves `{}`, pero sin usar claves:

In [None]:
frutas = {'banana', 'naranja', 'manzana','pera'}

print('banana' in frutas)

Los conjuntos eliminan de manera automática duplicados:

In [None]:
lista_frutas = ['banana', 'naranja', 'manzana','pera', 'naranja']

set_frutas = set(lista_frutas)
print(set_frutas)
len(lista_frutas)

Las operaciones usuales son:

In [11]:
frutas = {'banana', 'naranja', 'manzana','pera'}
frutas.add('frutilla')        # Agregar un elemento
frutas.remove('pera')         # Quitar un elemento

# operaciones de conjuntos
s1 = { 'a', 'b', 'c'}
s2 = { 'c', 'd' }
s1 | s2                 # Unión de conjuntos { 'a', 'b', 'c', 'd' }
s1 & s2                 # Intersección de conjuntos { 'c' }
s1 - s2                 # Diferencia de conjuntos { 'a', 'b' }
print(s1 - s2)

{'b', 'a'}


## La función zip

A veces pasa que queremos, por ejemplo, trabajar sobre dos listas al mismo tiempo porque están relacionadas (pensemos el caso de una lista con los nombres y otra con los apellidos de las mismas personas). La función `zip()` toma múltiples secuencias (listas, tuplas, etc.) y las empaqueta en un iterador que las combina:

In [31]:
nombres = ['Juan', 'Elsa', 'Ingrid', 'Carlos', 'Federico']
apellidos = ['Pérez', 'Gómez', 'Muller', 'Tacha', 'Higgins']
pares = zip(nombres, apellidos)
print(pares)

for nombre, apellido in pares:
  print('Nombre:', nombre, ' Apellido:', apellido)

<zip object at 0x0000019A4BBDF440>
Nombre: Juan  Apellido: Pérez
Nombre: Elsa  Apellido: Gómez
Nombre: Ingrid  Apellido: Muller
Nombre: Carlos  Apellido: Tacha
Nombre: Federico  Apellido: Higgins


Podemos usar `zip()` para crear una lista de tuplas o para crear diccionarios a partir de ellas:

In [27]:
nombres = ['Juan', 'Elsa', 'Ingrid', 'Carlos', 'Federico']
apellidos = ['Pérez', 'Gómez', 'Muller', 'Tacha', 'Higgins']

# Creo lista de tuplas
lista_tup = list(zip(nombres, apellidos))
print(lista_tup)

# Creo un diccionario
dic = dict(zip(nombres, apellidos))
print(dic)

[('Juan', 'Pérez'), ('Elsa', 'Gómez'), ('Ingrid', 'Muller'), ('Carlos', 'Tacha'), ('Federico', 'Higgins')]
{'Juan': 'Pérez', 'Elsa': 'Gómez', 'Ingrid': 'Muller', 'Carlos': 'Tacha', 'Federico': 'Higgins'}


La función `zip()` también se puede usar de manera de inversa usando un `*` en el argumento. Mirá el siguiente ejemplo:

In [15]:
alumnos = [
    ('Carlos Gómez', 41008418, 5),
    ('Gabriela Torres', 45790918, 8),
    ('Juan Pérez', 48327044, 9),
    ('Éric Guay', 35360531, 7),
    ('Juana Monte', 31583398, 10),
    ('Carla Díaz', 43772387, 6)]

print(list(zip(*alumnos)))

[('Carlos Gómez', 'Gabriela Torres', 'Juan Pérez', 'Éric Guay', 'Juana Monte', 'Carla Díaz'), (41008418, 45790918, 48327044, 35360531, 31583398, 43772387), (5, 8, 9, 7, 10, 6)]


Teníamos una lista de tuplas (nombre, dni, nota), la cual convertimos en una lista de tres tuplas: una con los nombres, otra con los números de dni y otra con las notas. Si pensamos que lo que teníamos originalmente eran las filas de una base de datos, ahora tomamos las columnas de la misma. 

## Comprensión de listas y diccionarios

Una tarea que se realiza a menudo es procesar los elementos de una lista. La definición de listas por comprensión que es una herramienta potente hacer exactamente eso.

In [6]:
l1 = [x**2 for x in range(0,5)]

print(l1)


[0, 1, 4, 9, 16]


### Creación de listas

La comprensión de listas crea un una nueva lista aplicando una operación a cada elemento de una secuencia. Por ejemplo,

In [9]:
a = [1, 2, 3, 4, 5]
b = [2*x for x in a] # Creo una lista con el doble de los elementos de a
print(b) #[2, 4, 6, 8, 10]

# es una versión más cómoda y compacta de
b = []
for x in a:
  b.append(2*x)

[2, 4, 6, 8, 10]


In [None]:
nombres = ['Edmundo', 'Juana']
a = [nombre.lower() for nombre in nombres]
print(a) # ['edmundo', 'juana']

### Filtros

La comprensión de listas se puede usar para filtrar datos.

In [None]:
a = [1, -5, 4, 2, -2, 10]
b = [2*x for x in a if x > 0] # uso sólo los números positivos
print(b) # [2, 8, 4, 20]

### Sintaxis general

La sintaxis general es `[<expresión> for <variable> in <secuencia> if <condición>]`, lo cual significa, expresándolo cómo lo veníamos haciendo hasta ahora

In [None]:
resultado = []
for variable in secuencia:
    if condición:
        resultado.append(expresión)

### Comprensión de diccionarios

De la misma manera que con las listas, se pueden definir diccionarios por comprensión. Por ejemplo,

In [8]:
numeros = [i for i in range(10)]

# Defino un diccionario con los cuadrados de los números
dic2 = {n:n**2 for n in numeros}
print(dic2)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


### Ejercicio de ejemplo

**Un ejemplo básico de compresión.** Usá comprensión de listas para sumar solamente los números pares de la siguiente lista de números:

In [1]:
numeros = [1, 2, 4, 5, 8, 10, 13, 17]
suma_pares = sum( [x for x in numeros if x % 2 == 0] )
print(suma_pares) # 24

20


## Referencias, mutabilidad y sus peligros

Hasta ahora hablamos mucho de variables, pero no especificamos mucho cómo funciona Python internamente. Por ejemplo, hablamos de que las variables "guardan valores", pero en realidad esto no es cierto. Lo que ocurre es que el valor está guardado en algún lugar de la memoria de la computadora, y la variable es simplemente una *referencia* o *puntero* a ese valor, algo así como sus coordenadas en la memoria. Veamos un ejemplo:

In [None]:
a = 10
b = a
a = 11

print('a =', a)
print('b =', b)

Analicemos lo que ocurrió aquí: primero creamos el valor `10` en algún lugar de la memoria, y guardamos su dirección en `a`. Luego, en `b` no copiamos el valor de `a`, sino la misma dirección al valor que habíamos asignado en `a`. Al redefinir `a = 11`, creamos otro valor (`11`) en otro lugar de la memoria, y en `a` quedó guardada esa nueva dirección. Pero notemos que `b` sigue conservando la anterior. Esto es porque los números enteros en Python son **inmutables**, no pueden modificarse. Por eso al hacer `a = 11` no cambiamos el valor en la memoria donde estaba el `10`, sino que creamos uno nuevo en otro lado.

Pero, ¿qué pasa si ahora tenemos tipos de datos **mutables**, como las listas? Veamos un ejemplo como el anterior:

In [None]:
a = [1, 2]
b = a
a.append(3)

print('a =', a)
print('b =', b)

a = [1, 2, 3]
b = [1, 2, 3]


¡Ahora sí cambió `b` junto con `a`! En este caso al hacer `a[0] = 10` no creamos un valor nuevo en la memoria, sino que modificamos el que ya estaba. `a` y `b` siguen referenciando al mismo lugar en la memoria.

Si queremos evitar que pase esto, por ejemplo podemos usar el método `copy()`, que crea una copia del valor en la memoria:

In [None]:
a = [1, 2]
b = a.copy()
a.append(3)

print('a =', a)
print('b =', b)

a = [1, 2, 3]
b = [1, 2]


Para entender este tema mejor podemos usar la función `id()` de Python. En Python, todos los valores tienen un número único de identificación asignados. Así que usando esta función podemos saber si dos variables están refiriendo al mismo valor o no:

In [None]:
a = 10
print('a =', a, id(a))

b = a
print('b =', b, id(b))

a = 11
print('a =', a, id(a))
print('b =', b, id(b))

Y un caso más complejo:

In [None]:
a = [1, 2]
print('a =', a, id(a))
b = [a, 'hola']
print('b =', b, id(b))
print('b[0] =', b[0], id(b[0]))

a.append(3)
print('a =', a, id(a))
print('b =', b, id(b))

Para poder entender esto mucho mejor, les recondamos probar estos códigos (y otros más complicados que se les puedan ocurrir) con la herramienta [Python Tutor](https://pythontutor.com/), que les permite ir ejecutando paso a paso el código y ver lo que está ocurriendo en la memoria.

Como último ejemplo, hay que tener cuidado cuando tenemos variables mutables dentro de listas. Incluso copiando la lista, la variable de adentro va a seguir haciendo referencia al mismo objeto en la memoria:

In [None]:
lista_a = [1, "a"]
lista_b = [5.5, lista_a]
lista_c = lista_b.copy()

print(lista_c)
lista_a.append('esta cadena la agrego a lista_a')
lista_b.append('esta cadena la agrego a lista_b')
print(lista_c)

Confuso, ¿no? Hay módulos de Python que permiten hacer copias "profundas" de listas para que no ocurra esto, pero no vamos a adentrarnos en ello.
 
**La moraleja es que hay que tener cuidado a la hora de trabajar con valores mutables.** ¡A veces, al modificar un valor en una variable podemos estar cambiando el mismo valor en otras variables sin darnos cuenta! Este tipo de errores te van a ocurrir, lo importante es poder indentificar lo que está pasando para poder arreglarlo.

## Ejercicios

**Armando un diccionario de notas.** A continuación damos una lista de tuplas, donde cada tupla corresponde a un alumno de un curso, con `(nombre, dni, nota)`. Armá a partir de la lista un diccionario `dic_notas` que tenga como clave el nombre y como valor la nota de cada alumno.

In [None]:
alumnos = [
    ('Carlos Gómez', 41008418, 5),
    ('Gabriela Torres', 45790918, 8),
    ('Juan Pérez', 48327044, 9),
    ('Éric Guay', 35360531, 7),
    ('Juana Monte', 31583398, 10),
    ('Carla Díaz', 43772387, 6)]

# diccionario notas:


**Lista de diccionarios.** Usando la misma lista de antes, armá ahora una nueva *lista* en la que a cada alumno le corresponde un diccionario con las claves 'nombre', 'dni' y 'nota'. Por ejemplo, el primer elemento es `{'Nombre':'Carlos Gómez', 'dni':41008418, 'nota':5}`.

In [None]:
alumnos = [
    ('Carlos Gómez', 41008418, 5),
    ('Gabriela Torres', 45790918, 8),
    ('Juan Pérez', 48327044, 9),
    ('Éric Guay', 35360531, 7),
    ('Juana Monte', 31583398, 10),
    ('Carla Díaz', 43772387, 6)]

# lista diccionario:


**Usando comprensión.** Volvé a rehacer los dos ejercicios anteriores, pero esta vez usando comprensión.

In [None]:
alumnos = [
    ('Carlos Gómez', 41008418, 5),
    ('Gabriela Torres', 45790918, 8),
    ('Juan Pérez', 48327044, 9),
    ('Éric Guay', 35360531, 7),
    ('Juana Monte', 31583398, 10),
    ('Carla Díaz', 43772387, 6)]

# diccionario notas:

# lista diccionarios:

## **Extra**. Una nota sobre condicionales: evaluación perezosa (*lazy evaluation*)

La evaluación perezosa es una estrategia de evaluación que retrasa la evaluación de una expresión hasta que esta sea necesaria. Por ejemplo si tenemos dos condiciones en un `if`, primero verificará que se cumpla la primera, y sólo en caso de que sea verdadera mirará la segunda:

In [2]:
tupla = (0, 1, 2, 3, 4)
if (5 in tupla) and (tupla[5] == 5):
  print('¡Se cumplió la condición!')

En el ejemplo anterior, a pesar de que la condición `tupla[5] == 5` daría un IndexError porque no hay elemento `5`, este no se produjo porque al ser falsa la primera condición ya dejó de evaluar la expresión. Miremos qué ocurre si damos vuelta las condiciones:

In [6]:
tupla = (0, 1, 2, 3, 4)
if (tupla[5] == 5) and (5 in tupla):
  print('¡Se cumplió la condición!')

IndexError: tuple index out of range

¡Ahora sí se produjo el error! La evaluación perezosa nos permite abusarnos y usar expresiones que darían errores en algunos casos, pero que como no son posibles si alguna otra condición no se cumple, no llegan a evaluarse.