# Estructuras de datos

<img src="https://www.python.org/static/img/python-logo.png" alt="yogen" style="width: 200px; float: right;"/>
<br>
<br>
<br>
<a href = "http://yogen.io"><img src="http://yogen.io/assets/logo.svg" alt="yogen" style="width: 200px; float: right;"/></a>

# Objetivos

- Conocer las estructuras de datos secuenciales: listas y tuplas.

- Conocer los conjuntos.

- Conocer la estructura asociativa: los diccionarios.

- Aprender los patrones típicos de iteración sobre estructuras de datos

# Secuencias: listas y tuplas

## Listas

Son una estructura de datos secuencial, mutable.

Ya conocemos un tipo secuencial, aunque inmutable: las strings.

In [5]:
a_string = 'por ejempli soy una string'
a_string[:11]

'por ejempli'

In [9]:
a_list = ['xyz', 2, 7, 'tocoto']
a_list[:2]

['xyz', 2]

## Slicing

Igual que en strings

Recordad:


![slicing](http://infohost.nmt.edu/tcc/help/pubs/python25/web/fig/slicing.png)

In [10]:
a_list = list('abcdef')
a_list

['a', 'b', 'c', 'd', 'e', 'f']

In [11]:
a_list[2:5]

['c', 'd', 'e']

In [12]:
a_list[:3] 

['a', 'b', 'c']

## Listas anidadas

In [14]:
a_list = [1, 'straight', ['x', 'y', 'z']]
a_list[-1][-1]

'z'

## Asignación en listas

Podemos pensar en las listas como en una colección de variables a las que en vez de por su nombre individual, nos referimos por el nombre de la lista y su posición.

Podemos reasignar valores y tipos.

In [17]:
a_list[0] = 'first element of the list'
a_list

['first element of the list', 'straight', ['x', 'y', 'z']]

## Operadores en listas



In [18]:
a_list + [1, 2] 

['first element of the list', 'straight', ['x', 'y', 'z'], 1, 2]

In [19]:
a_list + 1

TypeError: can only concatenate list (not "int") to list

In [20]:
a_list * 2 

['first element of the list',
 'straight',
 ['x', 'y', 'z'],
 'first element of the list',
 'straight',
 ['x', 'y', 'z']]

In [21]:
'straight' in a_list

True

In [23]:
'x' in a_list

False

In [24]:
['x', 'y', 'z'] in a_list

True

In [25]:
'x' in a_list[2]

True

## Métodos esenciales de las listas

`append(x)`

`remove(x)`

`pop()`

`index(x)`

`insert(n, x)`

In [56]:
a_list = [1, 'straight', ['x', 'y', 'z']]

a_list.append('last element')
a_list

[1, 'straight', ['x', 'y', 'z'], 'last element']

In [57]:
a_list + ['very last element', 'really last element']

[1,
 'straight',
 ['x', 'y', 'z'],
 'last element',
 'very last element',
 'really last element']

In [58]:
a_list

[1, 'straight', ['x', 'y', 'z'], 'last element']

Ojo! Append, al contrario que la concatenación de listas, modifica la lista original.

In [59]:
a_list.append(['very last element', 'really last element']) 
a_list

[1,
 'straight',
 ['x', 'y', 'z'],
 'last element',
 ['very last element', 'really last element']]

In [60]:
a_list

[1,
 'straight',
 ['x', 'y', 'z'],
 'last element',
 ['very last element', 'really last element']]

In [61]:
b_list = a_list + ['holi']
b_list

[1,
 'straight',
 ['x', 'y', 'z'],
 'last element',
 ['very last element', 'really last element'],
 'holi']

Hay otros métodos que modifican las listas _in place_, como .remove() y .sort().

In [62]:
a_list.remove('straight')
a_list

[1,
 ['x', 'y', 'z'],
 'last element',
 ['very last element', 'really last element']]

In [63]:
value = a_list.pop()
a_list

[1, ['x', 'y', 'z'], 'last element']

In [64]:
value

['very last element', 'really last element']

In [65]:
a_list.index(['x', 'y', 'z'])

1

In [67]:
a_list[1]

['x', 'y', 'z']

In [69]:
a_list.index('last element')

2

In [70]:
a_list.index('holi holi')

ValueError: 'holi holi' is not in list

In [71]:
if 'holi holi' in a_list:
    a_list.index('holi holi')

In [72]:
a_list.insert(0, 'Pushy string')
a_list

['Pushy string', 1, ['x', 'y', 'z'], 'last element']

In [73]:
a_list.insert(0, 'Pushy string')
a_list.insert(0, 'Pushy string')
a_list.insert(0, 'Pushy string')

a_list

['Pushy string',
 'Pushy string',
 'Pushy string',
 'Pushy string',
 1,
 ['x', 'y', 'z'],
 'last element']

### sort y sorted

La misma diferencia que entre .append() y la concatenación de listas.

In [76]:
another_list = [8, 3, 4, 9]
another_list

[8, 3, 4, 9]

In [77]:
sorted(another_list)

[3, 4, 8, 9]

In [79]:
sorted(another_list, reverse=True)

[9, 8, 4, 3]

In [80]:
another_list

[8, 3, 4, 9]

In [82]:
another_list.sort()
another_list

[3, 4, 8, 9]

#### Ejercicio

Dada la lista 
```python
a_list = [1, 'A new thing', 2.0, [2, 3], 42]
```
extrae el elemento "A new thing" usando .pop(). Intenta hacerlo sin escribir manualmente su posición.

In [86]:
a_list = [1, 'A new thing', 2.0, [2, 3], 42]

a_list.pop(1)
a_list

[1, 2.0, [2, 3], 42]

#### Ejercicio

Dada la lista 

```python
mistery_novel = ['the', 'most', 'unfortunate', 'of', 'the', 'witnesses', 'of', 'the', 'crime']

```

Calcula programáticamente la posición del tercer 'the'. Te vendrá bien consultar `help(mistery_novel.index`.


In [98]:
mistery_novel = ['the', 'most', 'unfortunate', 'of', 'the', 'witnesses', 'of', 'the', 'crime']

help(mistery_novel.index)

Help on built-in function index:

index(...) method of builtins.list instance
    L.index(value, [start, [stop]]) -> integer -- return first index of value.
    Raises ValueError if the value is not present.



In [106]:
mistery_novel.index('the', 
                    mistery_novel.index('the', 
                                        mistery_novel.index('the') + 1) + 1)

7

## Comprobar presencia en una lista

operador in

In [108]:
'The' in mistery_novel

False

In [109]:
'e' in mistery_novel

False

#### Ejercicio:

Escribe una función que tome una letra y devuelva un booleano indicando si es una vocal o no.

In [113]:
def vowel(letter):
    return letter in 'aeiou'

In [112]:
'ro' in 'aeroplane'

True

#### Ejercicio

Escribe una función para chequear si un término está en nuestra lista de palabras prohibidas en horario infantil:

```python
taboo_words = ['happy', 'bunny', 'sunshine', 'rainbow', 'friend', 'love']
```

In [117]:
def is_taboo(word):
    taboo_words = ['happy', 'bunny', 'sunshine', 'rainbow', 'friend', 'love']
    return word in taboo_words

is_taboo('fuck')

False

### all y any

In [123]:
print(all([True, True, True]))
print(all([False, False, True]))
print(all([123, 'asdfsadf', is_taboo]))

True
False
True


In [131]:
print(any([True, True, True]))
print(any([False, False, True]))
print(any([False, False, False]))

True
True
False


In [132]:
all([ len(word) > 5 for word in taboo_words ])

False

In [133]:
any([ len(word) > 5 for word in taboo_words ])

True

#### Ejercicio

Implementa `all` y `any` en términos de `reduce`

In [130]:
from functools import reduce

def my_all(boolean_list):
    return reduce(lambda x, y: x and y, boolean_list)


def my_any(boolean_list):
    return reduce(lambda x, y: x or y, boolean_list)


print(my_all([True, True, True]))
print(my_all([False, False, True]))

print(my_any([True, True, True]))
print(my_any([False, False, True]))
print(my_any([False, False, False]))

True
False
True
True
False


## Copiar listas y reasignar valores

In [135]:
a_list = ['x', 'y', 'z']
b_list = a_list

b_list

['x', 'y', 'z']

In [137]:
b_list[0] = 'w'
b_list

['w', 'y', 'z']

In [138]:
a_list

['w', 'y', 'z']

In [140]:
a_list = ['x', 'y', 'z']
b_list = a_list.copy()
b_list[0] = 'w'

print(a_list)
print(b_list)

['x', 'y', 'z']
['w', 'y', 'z']


In [140]:
a_list = ['x', 'y', 'z']
b_list = a_list[:]
b_list[0] = 'w'

print(a_list)
print(b_list)

['x', 'y', 'z']
['w', 'y', 'z']


## Tuplas

Son una estructura de datos secuencial, inmutable.

Tienen por tanto todas las habilidades de las listas _que no implican cambio de sus elementos_.

In [142]:
a_tuple = (12, 27, 69)

a_tuple.count(12)

1

In [144]:
a_tuple.index(12) 

0

In [145]:
a_tuple[0] = 'new element'

TypeError: 'tuple' object does not support item assignment

## Tuplas

Ojo! que una secuencia sea inmutable **no** significa que sus elementos lo sean!

In [146]:
taboo_words

['happy', 'bunny', 'sunshine', 'rainbow', 'friend', 'love']

In [147]:
b_tuple = (1000, 'fired!', taboo_words)
b_tuple

(1000, 'fired!', ['happy', 'bunny', 'sunshine', 'rainbow', 'friend', 'love'])

In [149]:
taboo_words.append('holi')
taboo_words.append('guapi')

In [150]:
b_tuple

(1000,
 'fired!',
 ['happy', 'bunny', 'sunshine', 'rainbow', 'friend', 'love', 'holi', 'guapi'])

## Iterar en secuencias

Podemos iterar sobre índices e ir extrayendo los elementos correspondientes.

Sin embargo, Python nos permite iterar directamente sobre los elementos de la secuencia.

Si la secuencia está compuesta a su vez de secuencias, podemos desempaquetar los componentes de esas secuencias **directamente** en la declaración del bucle.

In [155]:
for i in range(len(taboo_words)):
    print(i, taboo_words[i])

0 happy
1 bunny
2 sunshine
3 rainbow
4 friend
5 love
6 holi
7 guapi


In [156]:
for word in taboo_words:
    print(word)

happy
bunny
sunshine
rainbow
friend
love
holi
guapi


## Enumerate

Es una función muy útil que nos devuelve pares (índice, elemento). Será conveniente cuando queramos procesar un elemento _en función de su posición en la secuencia_.

In [158]:
list(enumerate(taboo_words))

[(0, 'happy'),
 (1, 'bunny'),
 (2, 'sunshine'),
 (3, 'rainbow'),
 (4, 'friend'),
 (5, 'love'),
 (6, 'holi'),
 (7, 'guapi')]

In [161]:
for pair in enumerate(taboo_words):
    index = pair[0] 
    element = pair[1] 
    
    print('%s is in position %d' % (element, index))

happy is in position 0
bunny is in position 1
sunshine is in position 2
rainbow is in position 3
friend is in position 4
love is in position 5
holi is in position 6
guapi is in position 7


Podemos desempaquetar las tuplas que `enumerate` nos devuelve, del mismo modo que desempaquetamos cualquier tupla para asignar sus elementos a varias variables:

In [162]:
for index, element in enumerate(taboo_words):    
    print('%s is in position %d' % (element, index))

happy is in position 0
bunny is in position 1
sunshine is in position 2
rainbow is in position 3
friend is in position 4
love is in position 5
holi is in position 6
guapi is in position 7


In [168]:
x, y, z = [42, 2018, 89]
x

42

In [165]:
i, word = pair

print(pair)
print(i)
print(word)

(7, 'guapi')
7
guapi


# Iterar sobre secuencias

## El patrón crea-prolonga

Es extremadamente común en Python crear una secuencia vacía antes de la entrada a un bucle e ir actualizándola con un elemento por cada ciclo del bucle.

#### Ejercicio

Escribe una función que tome una lista y devuelva sólo los elementos en posición par sin hacer una slice.


_Entrada de muestra_:
```python
['muchos',
 'años',
 'después,',
 'frente',
 'al',
 'pelotón',
 'de',
 'fusilamiento...']
```

_Salida de muestra_: 
```python
['años',
 'frente',
 'pelotón',
 'fusilamiento...']
```

In [181]:
solitude = ['muchos',
            'años',
            'después,',
            'frente',
            'al',
            'pelotón',
            'de',
            'fusilamiento...']

def odds(sequence):
    result = []
    for i, word in enumerate(sequence):
        if i % 2 == 1:
            result.append(word)

    return result

odds(solitude)

['años', 'frente', 'pelotón', 'fusilamiento...']

## List y tuple comprehensions

Recordad, es simplemente una manera más elegante de escribir un `map`, un `filter`, o una combinación de ambos. Es decir, de procesar los elementos de una secuencia uno a uno.

In [183]:
[ word for i, word in enumerate(solitude) if i % 2 == 1 ] 

['años', 'frente', 'pelotón', 'fusilamiento...']

In [186]:
[ word[0] for i, word in enumerate(solitude) if i % 2 == 1 ]  

['m', 'a', 'd', 'f', 'a', 'p', 'd', 'f']

### Sintaxis:

```python
[f(element) for element in sequence]
```

Esto nos devuelve:

```python
[f(sequence[0]), f(sequence[1]),...,f(sequence[n])]

```

Podemos añadir también cláusulas if/else:

In [188]:
[ word for word in solitude if len(word) > 3 ]

['muchos', 'años', 'después,', 'frente', 'pelotón', 'fusilamiento...']

La list comprehension anterior es exactamente equivalente a:

In [190]:
result = []
for word in solitude:
    if len(word) > 3:
        result.append(word)
        
result

['muchos', 'años', 'después,', 'frente', 'pelotón', 'fusilamiento...']

#### Ejercicio: 

Escribe una función que tome una lista de números y devuelva otra lista compuesta de sus cuadrados respectivos. Usa una list comprehension.

In [194]:
numbers = [ 7, 2, 4, 17, 22 ]

def square(seq): return [ x ** 2 for x in seq]

square(numbers)

[49, 4, 16, 289, 484]

# Conjuntos

Colección de elementos _no secuencial_.

No pueden tener elementos repetidos.

Tiene "habilidades" relacionadas con la teoria de conjuntos: comprobar membresia, union, interseccion, etc.

In [196]:
ages = {12, 13, 11, 10, 9, 10, 11, 12, 12, 13}

ages

{9, 10, 11, 12, 13}

In [199]:
years_since_blackouts = {10, 12, 12, 10, 15, 5}

years_since_blackouts

{5, 10, 12, 15}

In [200]:
5 in years_since_blackouts

True

In [201]:
ages.union(years_since_blackouts)

{5, 9, 10, 11, 12, 13, 15}

In [202]:
ages.intersection(years_since_blackouts)

{10, 12}

In [203]:
ages.difference(years_since_blackouts)

{9, 11, 13}

# Diccionarios

Colección asociativa con ordenamiento no garantizado.

Compuesta de _claves_ y _valores_

Las claves tienen que ser de cualquier tipo _hasheable_

In [209]:
capitals = { 'Spain' : 'Madrid', 'Morocco' : 'Rabat', 'Honduras' : 'Tegucigalpa' }

capitals['Spain']

'Madrid'

In [211]:
capitals['Canada'] = 'Ottawa'
capitals

{'Spain': 'Madrid',
 'Morocco': 'Rabat',
 'Honduras': 'Tegucigalpa',
 'Canada': 'Ottawa'}

In [212]:
capitals['Portugal']

KeyError: 'Portugal'

In [215]:
capitals['Spain'] = 'Palencia'
capitals

{'Spain': 'Palencia',
 'Morocco': 'Rabat',
 'Honduras': 'Tegucigalpa',
 'Canada': 'Ottawa'}

In [217]:
populations = {'Spain': 45e6, 'Morocco': 35e6 }
populations['Spain'] *= 1.02
populations['Morocco'] *= 1.05

populations

{'Spain': 45900000.0, 'Morocco': 36750000.0}

In [218]:
populations[['Spain', 1918]] = 25e6

TypeError: unhashable type: 'list'

In [219]:
populations[('Spain', 1918)] = 25e6

In [220]:
populations

{'Spain': 45900000.0, 'Morocco': 36750000.0, ('Spain', 1918): 25000000.0}

In [222]:
populations[('Spain', 'historical')] = [10e6, 12e6, 15e6, 45e6]
populations

{'Spain': 45900000.0,
 'Morocco': 36750000.0,
 ('Spain', 1918): 25000000.0,
 ('Spain', 'historical'): [10000000.0, 12000000.0, 15000000.0, 45000000.0]}

In [223]:
populations[('Spain', 'historical')]

[10000000.0, 12000000.0, 15000000.0, 45000000.0]

## Iterar sobre diccionarios

Cuando iteramos sobre un diccionario, por defecto iteramos sobre las claves. Si queremos iterar sobre los valores o sobre las tuplas (clave, valor) deberemos usar los métodos `.items()` y `.values()`

In [224]:
for k in populations:
    print(k)

Spain
Morocco
('Spain', 1918)
('Spain', 'historical')


In [225]:
for v in populations.values():
    print(v)

45900000.0
36750000.0
25000000.0
[10000000.0, 12000000.0, 15000000.0, 45000000.0]


In [228]:
for k, v in populations.items():
    print('The population of %s is %s' % (k, v))

The population of Spain is 45900000.0
The population of Morocco is 36750000.0
The population of ('Spain', 1918) is 25000000.0
The population of ('Spain', 'historical') is [10000000.0, 12000000.0, 15000000.0, 45000000.0]


Metodos notables: 

`.keys()`

`.values()`

`.items()`

`.get(k)`

`.get(k, default)`

In [231]:
populations['Russia']

KeyError: 'Russia'

In [233]:
print(populations.get('Russia'))

None


In [234]:
populations.get('Russia', 'unknown')

'unknown'

# Para llevar: resumen del tema

- Python tiene 4 estructuras de datos principales

- Las listas y las tuplas son secuencias. La diferencia enrte ambas es que las tuplas son inmutables.

- Los conjuntos son colecciones no ordenadas de elementos únicos. Sirven para hacer operaciones típicas de teoría de conjuntos.

- Los diccionarios son una estructura de datos asociativa que nos permite establecer enlaces entre datos del mismo o distinto tipo.

# Para llevar: resumen del tema

- Un patrón típico es crear una secuencia vacía antes de un bucle e ir añadiéndole elementos con cada iteración del bucle.

- Las list, tuple y dictionary comprehension nos permiten procesar colecciones de manera muy concisa, siempre que el proceso sea simple.

# Para saber más

https://www.python-course.eu/python3_dictionaries.php

https://www.python-course.eu/python3_list_comprehension.php