In [11]:
import numpy as np
import pandas as pd
pd.options.display.max_columns = 20
pd.options.display.max_rows = 20
pd.options.display.max_colwidth = 80
np.set_printoptions(precision=4, suppress=True)

## Estructuras de datos y secuencias

### Tuplas

Una tupla es una secuencia de objetos de Python inmutable y de longitud fija. Se pueden crear así:

In [12]:
tup = (4, 5, 6)
tup

(4, 5, 6)

In [13]:
# Los paréntesis pueden ser omitidos

tup = 4, 5, 6
tup

(4, 5, 6)

In [14]:
# Se puede convertir una secuencia o un iterador a una tupla invocando una tupla

tuple([4, 0, 2])

(4, 0, 2)

In [15]:
tup = tuple('Cadena')
tup

('C', 'a', 'd', 'e', 'n', 'a')

In [16]:
# Se puede acceder a los elementos de la tupla con los corchetes []

tup[0]

'C'

In [17]:
# Tuplas con expresiones más complicadas deberían ser creadas con paréntesis 

tup_nested = (4, 5, 6), (7, 8)
tup_nested

((4, 5, 6), (7, 8))

In [18]:
tup_nested[0]

(4, 5, 6)

In [19]:
tup_nested[1]

(7, 8)

In [20]:
# Los objetos guardados en un tupla pueden ser mutables, pero una vez la tupla es creada no es posible modificar qué objeto es guardado en qué posición

tup = tuple(['foo', [1, 2], True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

In [21]:
# Si el objeto dentro la tupla es mutable, como una lista, se puede modificar

tup[1].append(3)
tup

('foo', [1, 2, 3], True)

In [22]:
# Se pueden concatenar tuplas usando el operador + 

(4, None, 'foo') + (6, 0) + ('bar', )

(4, None, 'foo', 6, 0, 'bar')

In [23]:
# Multiplicar una tupla por un entero, concatena tantas copias de la tupla

('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

#### Desempaquetar tuplas

Python desempaqueta el valor de una tupla en variables separadas por comas

In [24]:
tup = (4, 5, 6)
a, b, c = tup
b

5

In [25]:
# Las tuplas anidadas también pueden ser desempaquetadas

tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

7

In [26]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print(f'a = {a}, b = {b}, c = {c}')


a = 1, b = 2, c = 3
a = 4, b = 5, c = 6
a = 7, b = 8, c = 9


In [27]:
# También se pueden sacar algunos elementos del resto de la tupla con *

valores = 1, 2, 3, 4, 5

a, b, *_ = valores

a, b, _ # se usa _ para indicar valores no deseados

(1, 2, [3, 4, 5])

### Métodos de las tuplas

Ya que no se pueden modificar las tuplas no tienen muchos métodos. Uno de los métodos es count



In [28]:
a = (1, 2, 2, 2, 3, 4, 2)

a.count(2)

4

### Listas 

Las listas tienen una longitúd variable y su contenido puede ser modificado. Las listas son mutables y se pueden crear con corchetes [] o con la función list

In [29]:
a_list = [2, 3, 7, None]

tup = ('foo', 'bar', 'baz')

b_list = list(tup)

b_list[1] = 'hola'
b_list

['foo', 'hola', 'baz']

In [30]:
# se puede usar list

gen = range(10)

list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### Añadir y eliminar elementos

Se puede agregar elementos al final con el método append

In [31]:
b_list.append('enano')
b_list

['foo', 'hola', 'baz', 'enano']

In [32]:
# se puede usar insert para insertar en una ubicación específica

b_list.insert(1, 'rojo')
b_list

['foo', 'rojo', 'hola', 'baz', 'enano']

In [33]:
# el contrario de insert es pop, elimina y devuelve un elemento en un indice 

b_list.pop(2)

'hola'

In [34]:
b_list

['foo', 'rojo', 'baz', 'enano']

In [35]:
# se pueden eliminar elementos por su valor con remove, encuentra el primer elemento con el valor y lo elimina

b_list.append('foo')
b_list

['foo', 'rojo', 'baz', 'enano', 'foo']

In [36]:
b_list.remove('foo')
b_list

['rojo', 'baz', 'enano', 'foo']

In [37]:
# verificar si una lista contiene un valor 

'baz' in b_list

True

In [38]:
'baz' not in b_list

False

#### Concatenar y combinar listas

Igual que las tuplas, agregar dos listas con + las concatena


In [39]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [40]:
# si ya hay una lista definida , se pueden agregar multiples elementos usando el metodo extend

x = [4, 'None', 'foo']

x.extend([7, 8, (2, 3)])
x

[4, 'None', 'foo', 7, 8, (2, 3)]

La concatenación por adición es una operación costosa. Usando extend es más eficiente.

#### Ordenando

Se puede ordenar una lista en el lugar llamando la función `sort`

In [41]:
a = [7, 2, 5, 1, 3]
a.sort()
a

[1, 2, 3, 5, 7]

In [42]:
# sort tiene un argumento key, permite pasar una llave secundaria de ordenamiento

b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key = len)
b

['He', 'saw', 'six', 'small', 'foxes']

#### Slicing 

Se usa para seleccionar secciones de secuencias usando la notación **slice**, la cual consiste en su forma básica en **comienzo:final** 

In [43]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[1:5]

[2, 3, 7, 5]

In [45]:
# se pueden asignar con una secuencia

seq[3:5] = [6, 3]
seq

[7, 2, 3, 6, 3, 6, 0, 1]

El elemento inicial de un **slice** es incluido pero el elemento final no. El comienzo como el final pueden ser omitidos.

In [46]:
seq[:5]

[7, 2, 3, 6, 3]

In [47]:
seq[3:]

[6, 3, 6, 0, 1]

In [48]:
# un indice negativo desliza la secuencia desde el final

seq[-4:]

[3, 6, 0, 1]

In [49]:
seq[-6:-2]

[3, 6, 3, 6]

In [50]:
# se puede tomar otro paso luego del segundo dos puntos para tomar elementos con saltos

seq[::2]

[7, 3, 3, 0]

In [51]:
# poner -1 como paso, invierte la lista 

seq[::-1]

[1, 0, 6, 3, 6, 3, 2, 7]

### Diccionario

Un diccionario es una colección de pares llaves - valor donde ambos son objetos de python. Cada llave se asocia con un valor para que este se pueda recuperar, insertar, modificar o eliminar dada una llave particular. Se pueden crear con paréntesis {} o con `dict`.

In [52]:
dic_vacio = {}

In [53]:
d1 = {'a': 'algún valor', 'b': [1, 2, 3, 4]}
d1

{'a': 'algún valor', 'b': [1, 2, 3, 4]}

In [54]:
# se pueden acceder a los elementos usando la misma notación de una lista o tupla

d1[7] = 'un entero'
d1

{'a': 'algún valor', 'b': [1, 2, 3, 4], 7: 'un entero'}

In [55]:
d1['b']

[1, 2, 3, 4]

In [56]:
# se puede verificar si el diccionario contiene una llave usando `in`

'b' in d1

True

In [61]:
# se pueden eliminar valores usando `del` o el método `pop`

d1[5] = 'algun valor'
d1

{'a': 'algún valor',
 'b': [1, 2, 3, 4],
 7: 'un entero',
 'dummy': 'otro valor',
 5: 'algun valor'}

In [58]:
d1['dummy'] = 'otro valor'
d1

{'a': 'algún valor',
 'b': [1, 2, 3, 4],
 7: 'un entero',
 5: 'algun valor',
 'dummy': 'otro valor'}

In [62]:
del d1[5]
d1

{'a': 'algún valor', 'b': [1, 2, 3, 4], 7: 'un entero', 'dummy': 'otro valor'}

In [63]:
ret = d1.pop('dummy')
ret

'otro valor'

In [64]:
d1

{'a': 'algún valor', 'b': [1, 2, 3, 4], 7: 'un entero'}

Los métodos `keys`, `values` dan iteradores de las llaves y valores del diccionario.

In [65]:
list(d1.keys())

['a', 'b', 7]

In [66]:
list(d1.values())

['algún valor', [1, 2, 3, 4], 'un entero']

In [68]:
list(d1.items())

[('a', 'algún valor'), ('b', 'foo'), (7, 'un entero'), ('c', 12)]

In [67]:
# se pueden combinar diccionarios usando el método `update`

d1.update({'b': 'foo', 'c': 12})
d1

# reemplaza los valores de las llaves a actualizar

{'a': 'algún valor', 'b': 'foo', 7: 'un entero', 'c': 12}

#### Creando diccionarios desde secuencias

Se puede crear un diccionario desde dos secuencias usando `zip`

In [70]:
# un diccionario es una colección de 2 tuplas, dict acepta una lista de 2 tuplas

tuplas = zip(range(5), reversed(range(5)))
tuplas

<zip at 0x1d49b3cf180>

In [71]:
mapeado = dict(tuplas)
mapeado

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

#### Valores por defecto


In [72]:
palabras = ['apple', 'bat', 'bar', 'atom', 'book']

por_letra = {}

In [73]:
for palabra in palabras:
    letra = palabra[0]
    if letra not in por_letra:
        por_letra[letra] = [palabra]
    else:
        por_letra[letra].append(palabra)

In [74]:
por_letra

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

In [75]:
# se puede usar el método `setdefault` para simplificar 

por_letra = {}

for palabra in palabras:
    letra = palabra[0]
    por_letra.setdefault(letra, []).append(palabra)

por_letra

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

In [76]:
# se puede usar `defaultdict` del módulo `collections` para simplificar aún más

from collections import defaultdict

por_letra = defaultdict(list)

for palabra in palabras:
    por_letra[palabra[0]].append(palabra)
    
por_letra

defaultdict(list, {'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']})

#### Tipos validos de llaves de diccionario

Los valores de un diccionario pueden ser de cualquier clase, las llaves tienen que ser generalmente objetos inmutables como escalares, tuplas. Tienen que tener **Hashability**. Se puede ver si un obejto es **hashable** con la función `hash`

In [77]:
hash('string')

750235713355704883

In [79]:
hash((1, 2, (2, 3)))

-9209053662355515447

In [81]:
hash((1, 2, [2, 3]))

# Falla porque las listas son mutables.

TypeError: unhashable type: 'list'

In [82]:
# Para usar una lista como llave, se puede convertir a una tupla

d = {}

d[tuple([1, 2, 3])] = 5
d

{(1, 2, 3): 5}

### Conjuntos

Un conjunto es una colección no ordenada de elementos únicos. Se puede crear con `set` o con `{}`.

In [83]:
set([2, 2, 2, 1, 3, 3])

{1, 2, 3}

In [84]:
{2, 2, 2, 1, 3, 3}

{1, 2, 3}

Los conjuntos aceptan operaciones matemáticas como uniones, intersección, diferencia y diferencia simétricas, por ejemplo:

In [85]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [86]:
a | b

{1, 2, 3, 4, 5, 6, 7, 8}

In [87]:
a.intersection(b)

{3, 4, 5}

In [88]:
a & b

{3, 4, 5}

In [89]:
dir(set)

['__and__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

Todas las operaciones lógicas de conjuntos tiene una contraparte que reemplaza los contenidos en el conjunto izquierdo con el resultado de la operación. Por ejemplo:

In [90]:
c = a.copy()

c |= b
c

{1, 2, 3, 4, 5, 6, 7, 8}

In [91]:
d = a.copy()

d &= b
d

{3, 4, 5}

Como las llaves de diccionario, los elementos del conjunto deben ser inmutables y **hashables**. Para guardar objetos mutables como listas en un conjunto se pueden convertir a tuplas.

In [92]:
data = [1, 2, 3, 4]
conjunto = {tuple(data)}
conjunto

{(1, 2, 3, 4)}

In [93]:
# se puede verificar si un conjunto es subconjunto de otro

a_conjunto = {1, 2, 3, 4, 5}

{1, 2, 3}.issubset(a_conjunto)

True

In [94]:
a_conjunto.issuperset({1, 2, 3})

True

In [95]:
{1, 2, 3} == {3, 2, 1}

True

### Funciones de secuencias incluidas

#### Enumeración 
 
Cuando se quiere contar el índice de un elemento en una secuencia iterativa, se podría construir así:

 

In [125]:
# indice = 0
# for valor in coleccion:
    # hacer algo con el valor
    # indice += 1

In [ ]:
# Python tiene una función interna `enumerate` que devuelve una secuencia de tuplas (indice, valor)

# for indice, valor in enumerate(coleccion):
    # hacer algo con el valor

#### Ordenar

La función `sorted` devuelve una nueva lista ordenada 


In [98]:
sorted([7, 1, 2, 6, 0, 3, 2])

[0, 1, 2, 2, 3, 6, 7]

In [99]:
sorted('Mateo Vega')

[' ', 'M', 'V', 'a', 'a', 'e', 'e', 'g', 'o', 't']

#### Zip

Zip empareja elementos de un numero de listas, tuplas u otras secuencias para crear una lista de tuplas

In [100]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']

zipped = zip(seq1, seq2)
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

In [101]:
# zip puede tomar numero arbitrario de secuencias, y el numero de elementos
# producidos es determinado por la secuencia mas corta

seq3 = [False, True]

list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

In [102]:
# un uso común de zip es iterar sobre multiples secuencias 

for index, (a, b) in enumerate(zip(seq1, seq2)):
    print(f'{index}: {a}, {b}')

0: foo, one
1: bar, two
2: baz, three


#### Reversed

itera sobre los elementos de una secuencia en orden inverso

In [103]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

### Listas, conjuntos y diccionarios comprensión

Las comprensiones de listas permiten formar una nueva lista filtrando los elementos de una colección, transformando los elementos pasando el filtro en una expresión concisa tomando las forma:

[expr for value in collection if condition]

Pro ejemplo con una lista de cadenas podemos filtrar las cadenas con longitúd mayor a 2 y transformarlas a mayúsculas:

In [104]:
cadenas = ['a', 'as', 'bat', 'car', 'dove', 'python']

[x.upper() for x in cadenas if len(x) > 2]

['BAT', 'CAR', 'DOVE', 'PYTHON']

Una comprension de diccionario  se vería así:

dict_comp = {key-expr : value-expr for value in collection if condition}

Para un conjunto se vería así:

set_comp = {expr for value in collection if condition}

Supongamos que queremos un conjunto que contenga el tamaño de las cadenas

In [105]:
tamanos = {len(x) for x in cadenas}
tamanos

{1, 2, 3, 4, 6}

In [106]:
# Podemos crear un mapa de cadenas a sus ubicaciones en la lista

set(map(len, cadenas))

{1, 2, 3, 4, 6}

In [107]:
# Podemos crear un diccionario que mapee una cadena a su ubicación en la lista

loc = {valor: index for index, valor in enumerate(cadenas)}
loc

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

#### Anidamiento de comprensiones

Supongamos que tenemos una lista de listas conteniendo nombres en español e inglés

In [109]:
data = [['John', 'Emily', 'Michael', 'Mary', 'Steven'],
        ['Maria', 'Juan', 'Javier', 'Natalia', 'Pilar']]

In [111]:
# queremos un sola lista que contenga todos los nombres con dos o mas 'a' en ellos

resultado = [nombre for nombres in data for nombre in nombres
             if nombre.count('a') >= 2]
resultado

['Maria', 'Natalia']

In [112]:
tuplas = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

aplastada = [x for tup in tuplas for x in tup]
aplastada

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [114]:
# es equivalente a

aplastada = []

for tup in tuplas:
    for x in tup:
        aplastada.append(x)

aplastada

[1, 2, 3, 4, 5, 6, 7, 8, 9]

### Funciones

Las funciones se declaran con la palabra clave `def`

In [115]:
def mi_funcion(x, y):
    return x + y

In [116]:
mi_funcion(1, 2)

3

In [118]:
# No hay problema con multiples returns o ninguno. Si no hay ningún return Python devuelve None

def funcion_sin_return(x):
    print(x)

resultado = funcion_sin_return('hola')
print(resultado)

hola
None


In [119]:
# cada función puede tener argumentos posicionales y argumentos con nombre

def mi_funcion(x, y, z = 1.5):
    if z > 1: 
        return z * (x + y)
    else:
        return z / (x + y)

In [121]:
mi_funcion(5, 6, z = 0.7) # especificando el argumento con nombre

0.06363636363636363

In [122]:
mi_funcion(3.14, 7, 3.5) # sin especificar el argumento con nombre

35.49

In [123]:
mi_funcion(10, 20) # usando el valor por defecto

45.0

La principal restricción de argumentos de las funciones es que el argumento con nombre debe seguir los argumentos posicionales.

### Namespaces, scope y local functions

