# 1. Estructuras de datos

<a id=’doc’></a>
### Documentación

***Documentación oficial de Python:*** https://www.python.org/doc/

***Objetos de la librería estándar de Python:*** https://docs.python.org/3/library/ 

### Contenido

* Colecciones indexadas
    * Listas
    * Tuplas
* Colecciones no indexadas
    * Sets
    * Diccionarios
* Ordenamiento vs indexación

### Recursos

***Style guide for Python Code:*** https://www.python.org/dev/peps/pep-0008/

***Funny (and useful) tutorials:*** https://realpython.com

## 1.1 Colecciones indexadas

### Listas

Las listas son colecciones de datos ordenadas (cero-indexadas) y mutables y se definen como se muestra a continuación

In [35]:
my_list = ["manzana", "banana", "cherry", "peach", "watermelon", "grape", "strawberry"]
print(my_list)

['manzana', 'banana', 'cherry', 'peach', 'watermelon', 'grape', 'strawberry']


In [37]:
type(my_list)

list

En el ejemplo anterior, creamos una lista cuyos elementos son objetos de tipo string. Nota que la función `print`que hemos usado para imprimir el contenido de una variable en el pasado, en este caso imprime todos los elementos de la lista, porque todos estan almacenados en la misma variable. Para acceder a un valor en específico de la lista lo hacemos a través de su índice:

In [38]:
print(my_list[0], type(my_list[0]))

manzana <class 'str'>


Las listas son estructuras muy felxibles, pueden almacenar elementos de distinta naturaleza, incluyendo otras listas:

In [6]:
party = [500, "cake", ["ballons", "Banner"]]

Cuando decimos que una lista es mutable, nos referimos a que los valores de sus elementos pueden ser reasignados, individual o colectivamente

In [28]:
numbers = [1, 2, 3, 4, 5,]
print(numbers)

[1, 2, 3, 4, 5]


#### Indexing

In [29]:
print(numbers)
numbers[2] = [6, 7, 8, 9, 10]
print(numbers)

[1, 2, 3, 4, 5]
[1, 2, [6, 7, 8, 9, 10], 4, 5]


#### Slicing

In [52]:
numbers[1:4] = [2, 3, 4, 5]

#### Longitud de una lista

Muchas veces es necesario conocer la longitud de una lista. Contar cada uno de los elementos que la conforman no es conveniente cundo trabajamos con estructuras que almacenan una gran cantidad de datos. Para ello podemos usar la función `len`, tal como en el ejemplo de algunas celdas arriba:

In [54]:
len(my_list)

0

In [55]:
# ¿Cuál es el error?
my_list[len(my_list)]

IndexError: list index out of range

#### Eliminar elementos de una lista 

La instrucción `del`sirve para eliminar elementos en una lista por su índice. 

In [56]:
del my_list[-1]  #Qué hace el índice negativo?

IndexError: list assignment index out of range

#### Copiando listas

Cuando es necesario crear copias de listas, es muy importante entender como es que Python realiza las asignaciones de listas a las variables, pues difiere un poco a la asignación de escalares. 

La asignación de listas a avariabes sigue realizando de derecha a izquierda, pero existe una diferecia crucial, el nombre de la lista se asocia a la locación de la memoria donde la lista es guardada, no al valor que tiene como es en el caso de los escalares

In [30]:
list_copy = my_list 
print(list_copy)

[1, 2, 3]


In [85]:
del my_list[5:]

In [86]:
print(list_copy)

[1, 0, 2, 3, 4]


Como puedes notar, cuando a una variable (en este caso `list_copy`) le asignamos otra previamente definida como una lista, no estamos asignado el contenido de la primera, si no su nombre. Esto quiere decir que `list_copy` es una _referencia_ del objeto `list` y por lo tanto cada vez que modifiquemos `list` podremos ver esos cambios cada vez que llamemos a `list_copy`

El método `copy` es usado para duplicar el contenido de una variable y asignarlo a otra.

In [91]:
list_copy = my_list.copy()
print(list_copy)

[1, 0, 2, 3, 4]


In [93]:
my_list.clear()
print(my_list, list_copy)

[] [1, 0, 2, 3, 4]


Otra forma de hacerlo es llamando a los valores indexados de la lista que queremos copiar. Esto funciona porque al llamar a los elementos previa a una asignación, lo que le decimos a la variables es que almacene objetos contenidos dentro de la lista, no el nombre de la lista.

In [101]:
my_list =[1, 2, 3, 4, 5]
list_copy = my_list[ 0 : len(my_list)]  # Prueba esto list_copy = my_list[:]
my_list.clear()
print(my_list, list_copy)

[] [1, 2, 3, 4, 5]


### Tuplas

Al igual que las listas, las tuplas son una colección de datos ordenada. Esto quiere decir que son estructuras de datos indexadas y que podemos consultar sus elementos a tráves de su índice de la misma forma que lo hacemos con las listas. La característica principal que diferencia una tupla de una lista, es que la tupla es inmutable, es decir, una vez que es definida sus elementos no pueden cambiar. 

In [13]:
my_tuple = ("apple", "banana", "cherry")

In [14]:
print(my_tuple[0])

apple


In [15]:
my_tuple[0] = "grape"

TypeError: 'tuple' object does not support item assignment

### Sets

Los sets son colecciones no indexadas, no ordenadas de datos. Por lo tanto no podemos llamar a sus elementos de la manera que lo hacíamos con las estructuras anteriores

In [22]:
my_set = {"a", 1, 2, 3, 4 , "b", 5}

In [23]:
my_set["a"]

TypeError: 'set' object is not subscriptable

In [None]:
print(my_set)

### Diccionarios

El diccionario otro tipo de colección no indexada que almacena objetos a través de un sistema llave-valor. Pero a diferencia de los sets, si son estructuras ordenadas. 

La llave es el identificador del que tiene asociado y por lo tanto, dicho objeto es accesible a través de su llave. Estas llaves deben ser únicas y pueden ser de cualquier tipo de dato. 

In [27]:
my_dictionary = {"cat" : "gato", "dog" : "perro", "horse" : "caballo"}

In [28]:
my_dictionary["cat"]

'gato'

In [29]:
my_dictionary["gato"]

KeyError: 'gato'

Como puedes darte cuenta, los diccionarios son uni-direccionados. Podemos encontrar un valor a partir de su llave, pero no viceversa. 

In [24]:
print(my_dictionary)

{'cat': 'gato', 'dog': 'perro', 'horse': 'caballo'}


Otros métodos muy utilizados en diccionarios son: `items` que devuelve una secuencia de tuplas donde cada tupla tiene los valores de llave y valor de cada elemento del diccionario.

In [39]:
elements = list(my_dictionary.items())
english, spanish = elements[0][0], elements[0][1]
print(english, spanish)

cat gato


y el método `values` que es análogo a `keys`.

#### Añadir/cambiar elementos al diccionario

Las estrategias para añadir o modificar los valores asociados a una llave son los mismos. Existen dos maneras de hacerlo. La primera consiste en reasignar el valor de un elemento a su llave. Si la llave ya existe, se reemplazará el valor asociado a él, si la llave no existe se creará un nuevo elemento en el diccionario.

In [40]:
my_dictionary["bird"] = "pájaro"

In [41]:
print(my_dictionary)

{'cat': 'gato', 'dog': 'perro', 'horse': 'caballo', 'bird': 'pájaro'}


### Ordenamiento vs indexación

#### Secuencias en Python

Una secuencia de datos en Python es una estructura de datos ordenados tal como los strigns, las listas y las tuplas. Una de sus principales funciones es durante procesos iterativos, ya que python requiere que el objeto sobre el que se va a iterar tenga un orden lógico.

In [35]:
my_string = "This is my string"
first_char = my_string[0]
my_substring = my_string[11:]
print(first_char, my_substring)

T string


#### Ordenamiento en Python

Para versiones menores a Python3.6, las estructutras ordenadas son exclusivamente las estructuras indexadas. Por otra parte a partir de la version 3.6 una estructura ordenada es aquella que tiene una regla lógica que determina la posición de cada uno de sus elementos, la indexación es una de ellas, pero también la declaración posicional de los elementos de una estructura.

#### ¿Los diccionarios son secuencias?

A partir de Python3.6 se establecieron los diccionarios como estructuras ordenadas posicionalmente. **Siguen siendo estructuras no indexadas** pero están ordenadas posicionalmente, de manera que para versiones Python3.6 o superiores, los diccionarios pueden ser usados como objetos iterables. 

In [45]:
my_set = {1, "A", 4, (6, 7, 3)}
my_dict = {1: "one", "a":"A", "four":4, "tuple":(6, 7, 3)}

In [46]:
print(my_set)
print(my_dict)

{(6, 7, 3), 1, 4, 'A'}
{1: 'one', 'a': 'A', 'four': 4, 'tuple': (6, 7, 3)}
