# Taller de Programación en Python: Complejidad Social y Modelos Computacionales
## Lección Py.3 Estructuras de datos simples
### Impartido por: Gonzalo Castañeda
Basado en: McKinney, Wes. 2018. “Python for Data Analysis. Data Wrangling with Pandas, NumPy, 
and IPython”, 2a edición, California USA: O’Reilly Media, Inc. Cap. 3. Section 3.1

## (1) Tuplas

In [None]:
# Objetos de tamaño fijo e inmutables
# La forma más sencilla de crearlos es especificando valores separados por comas
tup = 4, 5, 6      
tup    # También se puede establecer con un  paréntesis redondo tup = (4, 5, 6)

In [None]:
# Cualquier secuencia de un iterador (colección) puede convertirse en una tupla
tuple([4, 0, 2])   

In [None]:
# Como en otras colecciones de datos, los elementos particulares se pueden acceder con un []
tup = tuple('string')    # Transformamos una cadena en una tupla  
tup[0]   

In [None]:
# Una vez creada una tupla, los elementos no pueden modificarse  (es un objeto inmutable)
tup = tuple(['foo', [1, 2], True])   
tup[2] = False  # Marca: TypeError: 'tuple' object does not support item assignment

In [None]:
# Aunque si es posible cambiar un objeto mutable que se encuentra al interior de una tupla: [1, 2] 
# mediante el método append
# Notar que los objetos al interior de una tupla pueden ser de diferentes tipos
tup[1].append(3)  
tup   

In [None]:
# Concatenación de tuplas con   +  
(4, None, 'foo') + (6, 0) + ('bar' ,) 

In [None]:
# Concatenación de tuplas con   *
(4, None) * 3  

In [None]:
# Es possible desempacar (convertir) los elementos de las tuplas en variables:
tup = (4, 5, 6)  
a, b, c = tup   
b     

In [None]:
# Aplicación de desempacar: iteración sobre secuencias de tuplas o listas
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]   ; 
for a, b, c in seq:                                  # el for itera sobre las tuplas
   print('primero={0}, segundo={1}, tercero={2}'.format(a, b, c))   # letras corresponden a
                                                     # elementos de las tuplas
                                                     # toma los elementos de la tupla por separado

In [None]:
# Debido a que el tamaño de la tupla y los elementos de las tuplas no pueden modificarse, 
# existen pocos métodos para estas estructuras
# Count: calcula el número de ocurrencias en una tupla
a = (1, 2, 2, 2, 3, 4, 2)  
a.count(2)  

In [None]:
# Otro caso: Obtener la posición de un valor específico 
tupla = (0, 1, 4, 3, 2, 3, 1, 3, 2)   
tupla.index(4)
# si hay dos valores iguales el resultado muestra la posición del primero

## (2) Listas

In [None]:
# Las listas son de tamaño variable, además de ser mutables; se definen con [ ]
a_list = [2, 3, 7, None]  
tup = ('foo', 'bar', 'baz')
b_list = list(tup)              # convertmos una tupla en lista
b_list[1] = 'peekaboo'          # las listas si son mutables
print (a_list , b_list)

In [None]:
# Se usan con frecuencia para generar un iterador
gen = range(10)
print(gen)           # range es un comando de python que establece un rango de un iterador
list(gen)            # se construye una lista a partir de ese rango  

In [None]:
# También podemos generar listas con números aleatorios
import random    # se importa una librería de python para obener números al azar (random)
length = 10
randomlist = random.sample(range(-50, 50), length)
# al usar el método sample que está en la librería random se generan 10 números que oscilan entre
# -50 y 50
print(randomlist)

In [None]:
# Es possible agregar valores al final de una lista (append), en alguna posición (insert),
# o quitarlos (pop):
print(b_list)
b_list.append('dwarf')    # agrega
print (b_list) 
b_list.insert(1, 'red')   # inserta y sustituye 
print(b_list)
b_list.pop(2)             # elimina de una posición
print(b_list)

In [None]:
# También es possible eliminar el primer elemento X de un objeto en particular (remove)
b_list.remove('baz')
print(b_list)

In [None]:
# O checar si un elemento está (in)  o no  (not in) presente:  
'dwarf' in b_list   # o bien usar: 'dwarf' not in b_list   

In [None]:
# Para concatenar listas:
[4, None, 'foo'] + [7, 8, (2, 3)]   

In [None]:
# Agregar varios elementos a una lista existente (extend):
x = [4, None, 'foo']  
x.extend([7, 8, (2, 3)])    # Notar que la lista también puede contener objetos de distinto tipo
x    

In [None]:
# Ordenar una lista  (sort) –en orden ascendente o a partir de algún criterio (key):
a = [7, 2, 5, 1, 3]   
a.sort()   
a  

In [None]:
a.sort(reverse=True)  # en orden descendente
a

In [None]:
# Otra alternativa para ordenar sería:
sorted([7, 1, 2, 6, 0, 3, 2])  

In [None]:
# Y en un sentido inverso
list(reversed(range(10))) 

In [None]:
# Un ejemplo usando un criterio
b = ['saw', 'small', 'He', 'foxes', 'six']  
b.sort(key=len)     # a partir de la longitud de un str.
b 

In [None]:
# Pueden elegirse segmentos de una lista –slicing—  y hacerse asignaciones
seq = [7, 2, 3, 7, 5, 6, 0, 1]  
a = seq[1:5]                        # incluye de la posición 1 a la 4 
print(a)
seq[3:4] = [6, 3]               # se hace una asignación de dos valores entre posición 3 y 4  
print(seq)   

In [None]:
# Pueden omitirse los índices iniciales y finales:
seq[:5]               # de la posición 0 a la 4
print(seq[:5])
print(seq)            # notar que el objeto seq se mantiene inalterado
seq[3:]               # de la posición 3 al final        

In [None]:
# Se pueden omitir valores salteados  
seq[::2]            # se mantienen cada dos empezando en posición 0 

In [None]:
# Una aplicación de las listas es en la creación de iteradores
# En un for tradicional se van tomando elementos de una secuencia (lista) para hacer algo con ellos
coleccion = ['a', 'b', 'c', 'd', 'e', 'f']
i = 0
for valor in coleccion:
     print(i, valor)
     i += 1               # se crea un índice asociado a la lista

In [None]:
# Con enumerate también se resguarda el valor de un índice de la secuencia
for j, valor in enumerate(coleccion):    # j corresponde al valor del índice
    print (j , valor)                    # por lo tanto nos ahorramos construir el índice

### Para una explicación de los distintos métodos de listas en Python consultar:
https://docs.python.org/3/tutorial/datastructures.html

## (3) Diccionarios

La estructura más flexible de Python son los diccionarios, los que presentan una llave (key) 
y un valor –separados por dos puntos –; se crean utilizando paréntesis cursivos; 
pueden incluir todo tipo de objetos.

In [None]:
# veamos un ejemplo
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}
d1

In [None]:
# Se pueden agregar y cambiar elementos indicando  la llave correspondiente:
d1[7] = 'an integer'     # se agrega un tercer elemento cuya key es 7
d1 

In [None]:
# Pueden eliminarse elementos indicando la llave: 
del d1[7]
print(d1)
d1.popitem()     # elimina el último elemento
print(d1)
d1.pop('a')
print(d1)

In [None]:
# La llave o los valores pueden usarse como iteradores: dict.keys()  dict.values()
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}
print(list(d1.keys()))
print(list(d1.values()))

In [None]:
# Pueden actualizarse:     
d1.update({'b' : 'foo', 'c' : 12})
d1   # preserva las llaves que no cambian

In [None]:
# Pueden crearse diccionarios a partir de iteraciones:
mapping = {}
key_list = ('uno', 'dos')
value_list = (1 , 2) 
for key, value in zip(key_list, value_list):    # zip vincula dos lista en el iterador
     mapping[key] = value                       # el key lo toma de la primera lista
mapping

In [None]:
# Un procedimiento más compacto, mediante zip
mapping = dict(zip(range(5), reversed(range(5))))
mapping

In [None]:
# Ejercicio: Queremos clasificar los elementos de una lista por categorías:
words = ['apple', 'bat', 'bar', 'atom', 'book']     # en este caso a partir de la letra inicial
by_letter = {}                          # defino el diccionario
for word in words:
        letter = word[0]                #le asigna la primera letra de la palabra apple
        if letter not in by_letter:     # pregunta si la llave (letra) ya existe en diccionario
            by_letter[letter] = [word]  # establecemos la letra como key y hacemos primera asignación
        else:
          by_letter[letter].append(word) # de existr la key agregamos una palabra más
print (by_letter)

In [None]:
# Puede hacerse con un método del modulo de colecciones de python (defaultdict) 
from collections import defaultdict   # hay que importarlo
by_letter = defaultdict(list)         # creación del diccionario a partir de una lista
for word in words:
   by_letter[word[0]].append(word)     # aquí se sintetiza al omitir if
print(by_letter)

### Para mayores detalles sobre los diccionarios en Python consultar
https://realpython.com/python-dicts/

## (4)  Compresión de instrucciones con listas

La compresión de listas permite crear una lista a partir de filtros en una colección de datos.

Sintáxis: [expr for val in collection if condition]    # expr es la operación a aplicar

In [None]:
# Equivale al siguiente loop:
# result = []
# for val in collection:
#      if condition:                 la condición es el filtro
#         result.append(expr)

In [None]:
# Ejemplo:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']   # se crea una lista
[x.upper() for x in strings if len(x) > 2] # la operación consiste en poner mayúsculas en las 
                                           # palabras (expresión) de una colección
                                           # que tienen más de dos letras (condición)

In [None]:
# Puede aplicarse en otras estructuras de datos
# En ocasiones la operación puede darse sin condicionamiento alguno
loc_mapping = {index : val for index, val in enumerate(strings)}   # se usa un diccionario
loc_mapping
# los valores del diccionario se definen con los elementos de la lista de strings