# Estructuras de datos

<img src="https://www.python.org/static/img/python-logo.png" alt="yogen" style="width: 200px; float: right;"/>
<br>
<br>
<br>
<a href = "http://yogen.io"><img src="http://yogen.io/assets/logo.svg" alt="yogen" style="width: 200px; float: right;"/></a>

# Objetivos

- Conocer las estructuras de datos secuenciales: listas y tuplas.

- Conocer los conjuntos.

- Conocer la estructura asociativa: los diccionarios.

- Aprender los patrones típicos de iteración sobre estructuras de datos

# Secuencias: listas y tuplas

## Listas

Son una estructura de datos secuencial, mutable.

Ya conocemos un tipo secuencial, aunque inmutable: las strings.

In [1]:
a_string = "This is a string"

a_string[0]
a_string[0:4]

'This'

## Slicing

Igual que en strings

Recordad:


<center>![slicing](http://infohost.nmt.edu/tcc/help/pubs/python25/web/fig/slicing.png)</center>

In [3]:
a_list = [123, 42, "x", 23.]
a_list

[123, 42, 'x', 23.0]

In [4]:
a_list[2:]

['x', 23.0]

## Listas anidadas

In [6]:
another_list = [42., "y", 12, [9, 8]]
another_list

[42.0, 'y', 12, [9, 8]]

In [7]:
another_list[3][1]

8

## Asignación en listas

Podemos pensar en las listas como en una colección de variables a las que en vez de por su nombre individual, nos referimos por el nombre de la lista y su posición.

Podemos reasignar valores y tipos.

In [8]:
a_list[3]

23.0

In [9]:
a_list[3] = "tocoto"

In [10]:
a_list

[123, 42, 'x', 'tocoto']

## Operadores en listas



In [11]:
[1, 3] + [2, 5]

[1, 3, 2, 5]

In [12]:
[1, 3] * 5

[1, 3, 1, 3, 1, 3, 1, 3, 1, 3]

## Métodos esenciales de las listas

`append(x)`

`remove(x)`

`pop()`

`index(x)`

`insert(n, x)`

In [13]:
a_list

[123, 42, 'x', 'tocoto']

In [14]:
a_list.append(5)

In [15]:
a_list

[123, 42, 'x', 'tocoto', 5]

In [18]:
a_list

[123, 42, 'tocoto', 5]

In [19]:
a_list.remove(5)
a_list

[123, 42, 'tocoto']

In [20]:
a_list.append("something")
a_list.append("something")
a_list.append("something")
a_list

[123, 42, 'tocoto', 'something', 'something', 'something']

In [22]:
a_list.insert(5, "another thing")
a_list

[123,
 42,
 'tocoto',
 'something',
 'something',
 'another thing',
 'another thing',
 'something']

In [23]:
a_list.insert(0, "a")
a_list

['a',
 123,
 42,
 'tocoto',
 'something',
 'something',
 'another thing',
 'another thing',
 'something']

In [25]:
a_list.extend([13, 14])
a_list

['a',
 123,
 42,
 'tocoto',
 'something',
 'something',
 'another thing',
 'another thing',
 'something',
 13,
 14]

In [26]:
a_list[-1]

14

In [27]:
a_list.index("something")

4

In [29]:
a_list.pop(2)

42

In [30]:
a_list

['a',
 123,
 'tocoto',
 'something',
 'something',
 'another thing',
 'another thing',
 'something',
 13,
 14]

### sort y sorted

In [32]:
sorted([2,4,6])

[2, 4, 6]

In [33]:
yet_another_list = [2, 12, 0, 4, 6]
yet_another_list

[2, 12, 0, 4, 6]

In [34]:
yet_another_list.sort()

In [35]:
yet_another_list

[0, 2, 4, 6, 12]

In [36]:
and_another = [9823, 0, 2]
sorted(and_another)

[0, 2, 9823]

In [37]:
and_another

[9823, 0, 2]

In [96]:
days_to_work = ["L", "V", "X", "J"]

sorted(days_to_work, reverse=True)

['X', 'V', 'L', 'J']

In [92]:
def position_in_week(day):
    
    if day == "L":
        position = 1
    elif day == "M":
        position = 2    
    elif day == "X":
        position = 3
    elif day == "J":
        position = 4
    elif day == "V":
        position = 5
    elif day == "S":
        position = 6
    elif day == "D":
        position = 7
    
    return position

position_in_week("S")
        

6

In [93]:
sorted(days_to_work, key=position_in_week)

['L', 'X', 'J', 'V']

#### Ejercicio

Dada la lista 
```python
a_list = [1, 'A new thing', 2.0, [2, 3], 42]
```
extrae el elemento "A new thing" usando pop() pero sin escribir manualmente su posición.

In [39]:
a_list = [1, 'A new thing', 2.0, [2, 3], 42]
x = a_list.pop(a_list.index("A new thing"))
print(x, a_list)

A new thing [1, 2.0, [2, 3], 42]


## Comprobar presencia en una lista

operador in

In [40]:
3 in [1, 2, 3]

True

In [42]:
"3" in "123"

True

In [45]:
3 in range(1, 4)

True

#### Ejercicio:

Escribe una función que tome una letra y devuelva un booleano indicando si es una vocal o no.

In [53]:
def isavowel(letter):
    return letter in "aeiou"

In [56]:
isavowel("o")

True

#### Ejercicio

Implementa `all` y `any` en términos de `reduce`

In [57]:
all([True, True])

True

In [58]:
all([True, False])

False

In [59]:
any([True, False])

True

In [60]:
any([False, False, False])

False

## Copiar listas y reasignar valores

In [61]:
a_list = [5, 3, "asdf"]
b_list = a_list

In [62]:
print(a_list)
print(b_list)

[5, 3, 'asdf']
[5, 3, 'asdf']


In [63]:
b_list[-1] = "the last element of b_list"

In [64]:
print(a_list)
print(b_list)

[5, 3, 'the last element of b_list']
[5, 3, 'the last element of b_list']


In [65]:
a_really_different_list = a_list.copy()

In [66]:
a_really_different_list

[5, 3, 'the last element of b_list']

In [67]:
a_really_different_list[-1] = "the last elemenf of a_really_different_list"

In [70]:
print(a_list)
print(b_list)
print(a_really_different_list)

[5, 3, 'the last element of b_list']
[5, 3, 'the last element of b_list']
[5, 3, 'the last elemenf of a_really_different_list']


In [71]:
a_really_different_list = a_list[:]

## Tuplas

Son una estructura de datos secuencial, inmutable.

Tienen por tanto todas las habilidades de las listas _que no implican cambio de sus elementos_.

In [72]:
a_tuple = (1,7,3)
a_tuple

(1, 7, 3)

In [73]:
a_tuple[2] = "x"

TypeError: 'tuple' object does not support item assignment

## Tuplas

Ojo! que una secuencia sea inmutable **no** significa que sus elementos lo sean!

In [74]:
another_tuple = ("tocoto", 42, [1, 2, 3])
another_tuple

('tocoto', 42, [1, 2, 3])

In [75]:
another_tuple[2] = "y"

TypeError: 'tuple' object does not support item assignment

In [76]:
another_tuple[2][0] = "y"
another_tuple

('tocoto', 42, ['y', 2, 3])

## Iterar en secuencias

Podemos iterar sobre índices e ir extrayendo los elementos correspondientes.

Sin embargo, Python nos permite iterar directamente sobre los elementos de la secuencia.

Si la secuencia está compuesta a su vez de secuencias, podemos desempaquetar los componentes de esas secuencias **directamente** en la declaración del bucle.

In [98]:
a_tuple = ("a", "b", "c")
a_tuple

('a', 'b', 'c')

In [99]:
for index, element in enumerate(a_tuple):
    print(index)
    print(element)
    

0
a
1
b
2
c


In [100]:
for element in a_tuple:
    print(element)

a
b
c


## Enumerate

Es una función muy útil que nos devuelve pares (índice, elemento). Será conveniente cuando queramos procesar un elemento _en función de su posición en la secuencia_.

In [101]:
list(enumerate(a_tuple))

[(0, 'a'), (1, 'b'), (2, 'c')]

Podemos desempaquetar las tuplas que `enumerate` nos devuelve, del mismo modo que desempaquetamos cualquier tupla para asignar sus elementos a varias variables:

In [102]:
for index, element in enumerate(a_tuple):
    print(index)
    print(element)

0
a
1
b
2
c


# Iterar sobre secuencias

## El patrón crea-prolonga

Es extremadamente común en Python crear una secuencia vacía antes de la entrada a un bucle e ir actualizándola con un elemento por cada ciclo del bucle.

#### Ejercicio

Escribe una función que tome una lista y devuelva sólo los elementos en posición par.


_Entrada de muestra_:
```python
[2,1,3,4,5,6,7,0]
```

_Salida de muestra_: 
```python
[1,4,6,0]
```

In [89]:
def even_coordinates_of(a_list):

    new_list = []
    
    for index, element in enumerate(a_list):
        if (index + 1) % 2 == 0:
            new_list.append(element)
    
    return new_list

In [90]:
even_coordinates_of([2,1,3,4,5,6,7,0])

[1, 4, 6, 0]

## List y tuple comprehensions

Recordad, es simplemente una manera más elegante de escribir un `map`, es decir, de procesar los elementos de una secuencia uno a uno.

### Sintaxis:

```python
[f(x) for x in xs]
```

Esto nos devuelve:

```python
[f(x[0]), f(x[1]),...,f(x[n])]

```

In [103]:
result = []

for number in range(10):
    result = result + [number ** 2]
    
result

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [153]:
[number ** 2 for number in range(10)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Podemos añadir también cláusulas if/else:

In [105]:
[number ** 2 for number in range(10) if number % 2 == 0]

[0, 4, 16, 36, 64]

In [109]:
[number**2 if number > 0 else -number**2 for number in range(-5, 6)]

[-25, -16, -9, -4, -1, 0, 1, 4, 9, 16, 25]

La list comprehension anterior es exactamente equivalente a:

#### Ejercicio: 

Escribe una función que tome una lista de números y devuelva otra lista compuesta de sus cuadrados respectivos. Usa una list comprehension.

# Conjuntos

Colección de elementos _no secuencial_.

No pueden tener elementos repetidos.

Tiene "habilidades" relacionadas con la teoria de conjuntos: comprobar membresia, union, interseccion, etc.

In [111]:
ages = [5, 2, 8, 8, 9, 10, 12, 13, 10, 2, 5, 6]

my_set = set(ages)
my_set

{2, 5, 6, 8, 9, 10, 12, 13}

In [113]:
another_set = {2, 5, 6, 8, 9, 10, 12, 13, 13, 13, 13}
another_set

{2, 5, 6, 8, 9, 10, 12, 13}

In [114]:
another_set[0]

TypeError: 'set' object does not support indexing

In [119]:
ages_set = {5, 2, 8, 8, 9, 10, 12, 13, 10, 2, 5, 6}
kindergarden = {1,2,3,4,5,6} 

ages_set.difference(kindergarden)

{8, 9, 10, 12, 13}

In [120]:
ages_set.isdisjoint(kindergarden)

False

In [121]:
ages_set.intersection(kindergarden)

{2, 5, 6}

In [122]:
ages_set.union(kindergarden)

{1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 13}

In [123]:
ages_set.union(kindergarden).union({21, 4, 5, 42})

{1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 13, 21, 42}

# Diccionarios

Colección asociativa con ordenamiento no garantizado.

Compuesta de _claves_ y _valores_

Las claves tienen que ser de cualquier tipo _hasheable_

In [124]:
english_words = {"casa": "house", "coche": "car", "oveja": "sheep"}
english_words["casa"]

'house'

In [127]:
english_words = {"casa": "house", "coche": "car", "oveja": "sheep", "carro": "car"}
english_words["coche"]

'car'

In [130]:
historic_populations = {("Spain", 1936) : 25e6, ("Spain", 2018) : 46e6}
historic_populations

{('Spain', 1936): 25000000.0, ('Spain', 2018): 46000000.0}

In [131]:
historic_populations[("Spain", 2018)]

46000000.0

In [133]:
position_dict = {"L":1, "M":2, "X":3, "J":4, "V":5, "S":6, "D":7}
position_dict

{'D': 7, 'J': 4, 'L': 1, 'M': 2, 'S': 6, 'V': 5, 'X': 3}

In [134]:
position_dict["X"]

3

In [136]:
sorted(days_to_work, key=lambda day: position_dict[day])

['L', 'X', 'J', 'V']

In [137]:
ages = {"Dani" : 33, "Isra" : "Timeless"}
ages["Dani"]

33

## Iterar sobre diccionarios

Cuando iteramos sobre un diccionario, por defecto iteramos sobre las claves. Si queremos iterar sobre los valores o sobre las tuplas (clave, valor) deberemos usar los métodos `.items()` y `.values()`

In [138]:
for key in position_dict:
    print(key)

L
M
X
J
V
S
D


In [139]:
for value in position_dict.values():
    print(value)

1
2
3
4
5
6
7


In [140]:
for key, value in position_dict.items():
    print(key, value)

L 1
M 2
X 3
J 4
V 5
S 6
D 7


Metodos notables: 

`.keys()`

`.values()`

`.items()`

`.get(k)`

`.get(k, default)`

In [142]:
ages.keys()

dict_keys(['Dani', 'Isra'])

In [143]:
ages.values()

dict_values([33, 'Timeless'])

In [144]:
ages.items()

dict_items([('Dani', 33), ('Isra', 'Timeless')])

In [145]:
ages.get("Dani")

33

In [146]:
ages["Elsa"]

KeyError: 'Elsa'

In [148]:
print(ages.get("Elsa"))

None


In [150]:
print(ages.get("Sebas", 29))

29


In [151]:
ages["Rajoy"] = 62
ages

{'Dani': 33, 'Isra': 'Timeless', 'Rajoy': 62}

In [1]:
position_dict = {"L":1, "M":2, "X":3, "J":4, "V":5, "S":6, "D":7}

In [2]:
position_dict

{'D': 7, 'J': 4, 'L': 1, 'M': 2, 'S': 6, 'V': 5, 'X': 3}

In [5]:
max(position_dict.values())

7

In [32]:
position_dict = {"L":1, "M":25.2, "X":3, "J":4, "V":5, "S":6, "D":7}

In [33]:
position_dict

{'D': 7, 'J': 4, 'L': 1, 'M': 25.2, 'S': 6, 'V': 5, 'X': 3}

In [34]:
dia = ""
valor = 0

for key, value in position_dict.items():
    if value > valor:
        valor = value
        dia = key
    
print(dia, valor)

M 25.2


In [35]:
data = {"CAC":10,"WIG":1.2,"ATX":390.2}

In [36]:
data

{'ATX': 390.2, 'CAC': 10, 'WIG': 1.2}

In [37]:
def best_stock(data):
    # your code here
    
    result = ""
    stock = 0
    
    for key, value in data():
        
        if value > stock:
            stock = value
            result = key
        
    return result


In [44]:
for values in data():
    print (values)

TypeError: 'dict' object is not callable

# Para llevar: resumen del tema

- Python tiene 4 estructuras de datos principales

- Las listas y las tuplas son secuencias. La diferencia enrte ambas es que las tuplas son inmutables.

- Los conjuntos son colecciones no ordenadas de elementos únicos. Sirven para hacer operaciones típicas de teoría de conjuntos.

- Los diccionarios son una estructura de datos asociativa que nos permite establecer enlaces entre datos del mismo o distinto tipo.

# Para llevar: resumen del tema

- Un patrón típico es crear una secuencia vacía antes de un bucle e ir añadiéndole elementos con cada iteración del bucle.

- Las list, tuple y dictionary comprehension nos permiten procesar colecciones de manera muy concisa, siempre que el proceso sea simple.

# Para saber más

https://www.python-course.eu/python3_dictionaries.php

https://www.python-course.eu/python3_list_comprehension.php