<p>
<font size='5' face='Georgia, Arial'>IIC2115 - Programación como herramienta para la ingeniería</font><br>
<font size='1'>Basado en material de Karim Pichara y Christian Pieringer. Todos los derechos reservados.</font>
</p>

# Estructuras de Datos

Se entiende por <b>estructura de datos</b> a un tipo de dato especializado, diseñado para agrupar, almacenar o acceder a la información de manera más eficiente que un tipo de dato básico (int, float, etc). Las estructuras de datos involucran un alto nivel de abstracción y por lo tanto es posible establecer una clara y directa relación con la programación orientada a objetos (POO). El uso de cada tipo de estructura de datos tiene relación directa con el contexto de aplicación, como también con el diseño y eficiencia alcanzada por los algoritmos. Es decir, la elección adecuada de la estructura de datos es fundamental para desarrollar un buen software.

_"El saber que estructura de datos ocupar y en que momento o contexto hacerlo, hace la diferencia entre un programador y un buen programador"_.

Como todos los principales lenguajes, Python posee varias estructuras ya implementadas para el manejo eficiente de datos. En este capítulo revisaremos solo tres (tuplas, listas y diccionarios), mientas que en el siguiente cubriremos algunas más avanzadas.

# Estructuras de datos básicas

En Python, la estructura de datos más simple es una clase vacía, sin métodos. Una vez que esta clase es instanciada en un objeto, el usuario puede agregar atributos o propiedades. Para dejar la estructura vacía se utiliza la sentencia pass. Esta sentencia es una operación nula donde nada ocurre y es utilizada generalmente en lugares donde el código no tiene nada declarado, pero que eventualmente lo tendrá.

In [None]:
# Se crea una clase vacía.
class Video:
    pass

vid = Video()

# se agregan atributos nuevos. ¿Por qué hacer esto no es buena práctica?
vid.ext = 'avi'
vid.size = '1024'

print(vid.ext, vid.size) 

# También se puede crear una clase sin métodos pero con algunos atributos pre-definidos
class Imagen:
    def __init__(self):
        self.ext = ''
        self.size = ''
        self.data = ''

img = Imagen()
img.ext = 'bmp'
img.size = '8'
img.data = [255,255,255,200,34,35]
img.ids = 20 # python permite de todas formas agregar nuevos atributos a pesar de no estar declarados inicialmente

print(img.ext, img.size, img.data, img.ids)

## Tuplas

Estas estructuras se utilizan para manejar datos de forma ordenada. Los contenidos pueden ser accesados utilizando el índice correspondiente al orden con que los contenidos fueron ingresados según se muestra en la figura. 

![](figs/indices_secuencia.png)


Las tuplas pueden contener distintos objetos o tipos de datos. Para declarar o crear una tupla se utiliza `tuple(elementos)`

In [None]:
# Para crear una tupla vacia se usa tuple() sin ingresar elementos.
a = tuple()

# Se puede declarar explícitamente los elementos de la tupla ingresando los elementos entre paréntesis.
b = (0, 1, 2)

# La tupla puede ser creda con objetos de distito tipo. En las tuplas el uso de parentesis no es obligatorio cuando son creadas.
c = 0, 'mensaje'

print(b[0], b[1])
print(c[0], c[1])

Las tuplas son estructuras de datos **INMUTABLES**, es decir, que no es posible agregar o eliminar elementos, o bien cambiar el contenido de ella  una vez que esta fue creada. La principal ventaja de la inmutabilidad es que pueden ser usadas como valor de mapeo o llave en estructuras basadas en *hashing*, como son los diccionarios que veremos más adelante.

En el siguiente ejemplo, la posicion 0 de la tupla **```a```** contiene originalmente un objeto del tipo `Imagen`. Intentamos reemplazar esta posición por un string (o cualquier tipo de dato). En este caso se origina un *error de tipo* debido a que la tupla no permite asignación.

In [None]:
img = Imagen()
a = (img, 'este es', 'un archivo')
a[0] = 'nuevo dato' 

Las tuplas pueden ser desempaquetadas en variables individuales. En este ejemplo creamos una función llamada `calcular_geometria()` que recibe como entrada los lados de un cuadrilátero y retorna algunas medidas geométricas típicas. Cuando las funciones retornan más de un valor, lo hacen empaquetando todos los valores en una tupla.

In [None]:
def calcular_geometria(a, b):
    area = a*b
    perimeter = (2*a) + (2*b)
    mpa = a/2
    mpb = b/2
    return (area, perimeter, mpa, mpb) # Los paréntesis son opcionales

# Obtenemos una tupla con los datos provenientes de la función.
data = calcular_geometria(20.0, 10.0)
print('1: {0}'.format(data))

# Obtenemos un valor desde la tupla directamente referenciando el índice del dato requerido.
a = data[0]
print('2: {0}'.format(a))

# desempaquetando en variables independientes los valores contenidos en una tupla
a, p, mpa, mpb = data
print('3: {0}, {1}, {2}, {3}'.format(a, p, mpa, mpb))

# Las funciones devuelven el conjunto de valores como una tupla. Se puede desempaquetar directamente en variables individuales como en el caso anterior.
a, p, mpa, mpb = calcular_geometria(20.0, 10.0)
print('4: {0}, {1}, {2}, {3}'.format(a, p, mpa, mpb))

## Listas

Este tipo de estructura de datos ha sido diseñada para el almacenamiento de distintas instancias de un mismo tipo de objeto (a pesar que de todas formas no existe restricción en la combinación de tipos de objetos que pueden manejar). Las listas son estructuras que guardan datos de forma **ordenada**, a diferencia de la tuplas que son estructuras que guardan una **disposición** de los datos. Los elementos que se agregan usando `append` se ponen al final de la lista. Los elementos se pueden obtener usando el valor del índice del posición donde fueron almacenados. Las listas son estructuras **MUTABLES**, es decir, que su contenido puede cambiar dinámicamente después que esta fue creada.

NOTA: **EVITA** el uso de las listas para coleccionar distintos atributos de un objeto o en situaciones como la siguiente, donde se utiliza como histograma para almacenar la cuenta de palabras `[‘a’, 1, ‘b’, 2]`. Esto necesita diseñar un algoritmo de acceso a los datos dentro de la lista que hace engorroso su manejo. En este caso preferir el uso de otro tipo de estructuras como diccionarios.

In [None]:
# lista vacía y agregar elementos incrementalmente. En este caso agregamos tuplas.
lista = []
lista.append((2015, 3, 14))
lista.append((2015, 4, 18))
print(lista)

# Tambien es posible agregar los objetos explicitamente al definirla por primera vez
lista = [1, 'string', 20.5, (23, 45)]
print(lista)

# Extraemos un el elemento usando el indice respectivo
print(lista[1])

A veces es necesario agregar nuevos elementos contenidos en otras listas. En estos casos resulta muy útil agregar la lista completa y no cada elemento de forma individual con `append()`. En este caso resulta mejor utilizar el método `extend()`.

In [None]:
canciones = ['Addicted to pain', 'Ghost love score', 'As I am']
print(canciones)

nuevas_canciones = ['Elevate', 'Shine', 'Cry of Achilles']
canciones.extend(nuevas_canciones)
print(canciones)

También es posible insertar elementos en posiciones específicas mediante el método `insert(posicion, elemento)`.

In [None]:
print(canciones)
canciones.insert(1, 'Sober')
print(canciones)

Es posible tomar secciones de las listas usando la notación <i>slicing</i>. En esta notación los índices no coinciden directamente con la posición del elemento en la lista, si no más bien funcionan como márgenes desde donde y hasta donde se necesita recuperar. Esta notación se debe usar como `lista[inicio:término:pasos]`. Por defecto el número de pasos es 1. La siguiente figura muestra un ejemplo de como se debe considerar los indices al usar la notación slicing. 
![](figs/indices_slicing.png)

Forma general de hacer slicing en Python:

- `a[start : end]`: retorna los elementos desde `start` hasta `end-1`.
- `a[start:]`: retorna los elementos desde `start` hasta el final del arreglo.
- `a[:end]`: retorna los elementos desde el principio hasta `end-1`.
- `a[:]`: crea una copia (shallow) del arreglo completo. Es decir, el arreglo retornado está en una nueva dirección de memoria, pero los elementos en el arreglo están hace referencia a la dirección de memoria a los elemenos del arreglo original.
- `a[start : end : step]`: retorna los elementos desde `start` hasta no pasar `end`, en pasos de a `step`.
- `a[-1]`: retorna el último elemento en el arreglo.
- `a[-n:]`:   # últimos `n` elementos en el arreglo.
- `a[:-n]`: retorna todos los elementos del arreglo menos los últimos `n` elementos.

Veamos a continuación ejemplos de *slicing* aplicado a listas (también puede aplicarse a tuplas):

In [None]:
# Tomando una tajada particular
numeros = [6, 7, 2, 4, 10, 20, 25]
print(numeros[2:6])

# tomando una seccion hasta el final de la lista
print(numeros[2:])

# tomando una sección desde el principio hasta un punto específico
print(numeros[:5:])

# considerando pasos de 2
print(numeros[:5:2])

# revirtiendo una lista
print(numeros[::-1])

Las listas pueden ser ordenadas utilizando el método `sort()`. Esto ordena las listas en si mismas y no devuelve nada, es decir, el resultado no es asignable a una nueva lista.

In [None]:
numeros = [6, 7, 2, 4, 10, 20, 25]
print(numeros)

# En sentido ascendente. Observar como a no recibe ninguna asignacion despues de que la lista numeros es ordenada
a = numeros.sort() 
print(numeros, a)

# En sentido descendente
numeros.sort(reverse=True)
print(numeros)

Las listas han sido optimizadas para ser una estructura flexible y fácil de manejar. También se pueden recorrer usando un `for`:

In [None]:
class Pieza:
    pid = 0
    
    def __init__(self, pieza):
        Pieza.pid += 1
        self.pid = Pieza.pid
        self.tipo = pieza

piezas = []
piezas.append(Pieza('Alfil'))
piezas.append(Pieza('Peon'))
piezas.append(Pieza('Rey'))
piezas.append(Pieza('Reina'))

# Por cada iteración en el ciclo la variable pieza recibe un elemento de la lista.
for pieza in piezas:
    print('pid: {0} - tipo de pieza: {1}'.format(pieza.pid, pieza.tipo))