<p>
<font size='5' face='Georgia, Arial'>IIC2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015 Karim Pichara - Christian Pieringer. Todos los derechos reservados.</font>
<br>
<font size='1'> Modificado desde 2017-2 al 2024-2 por Equipo Docente IIC2233</font>
</p>

# Tabla de contenidos

1. [Introducción](#Introducción)
    1. [Clasificación de las estructuras de datos](#Clasificación-de-las-estructuras-de-datos)
2. [Tuplas](#Tuplas)
    1. [Desempaquetado de elementos](#Desempaquetado-de-elementos)
    2. [*Slicing* de tuplas](#Slicing-de-tuplas)
    3. [*Named tuples*](#Named-tuples)

# Introducción
En los modelos tradicionales de programación, estamos permanentemente manipulando datos. Es por esto que para facilitar esta manipulación, se han creado construcciones que permiten **agrupar y manipular** eficientemente conjuntos de datos.
vvvv
En Ciencia de la Computación, estas construcciones se conocen como **estructuras de datos** y consisten de una manera de agrupar datos relacionados, junto con un conjunto de **operaciones para accederlos y modificarlos de manera eficiente**. La mayoría de los lenguajes de programación incluyen soporte para algunas estructuras de datos predefinidas (*built-in*) y también permiten definir estructuras nuevas.

A diferencia de las variables simples o "primitivas" como los enteros, o los reales, las estructuras de datos involucran un mayor nivel de *abstracción*. En esta semana estudiaremos el modelo conceptual de algunas estructuras de datos típicas utilizadas en ciencia de la computación, así como también su implementación en Python. 

La decisión de "qué estructura de datos utilizar" dependerá tanto del contexto de la aplicación en que se desea usar, como también de su diseño y *eficiencia* esperada. Al final de esta semana, habremos aprendido que la elección adecuada de una estructura de datos para cada situación es crucial para desarrollar un *software* eficiente.

## Clasificación de las estructuras de datos

Dependiendo de sus propiedades, clasificaremos las estructuras de datos en dos grandes categorías; las estructuras de datos **secuenciales** y las estructuras de datos **no secuenciales**.

#### Estructuras de datos secuenciales
Corresponden a estructuras basadas en un **ordenamiento secuencial** de los elementos, que dependerá de cómo son ingresados en la estructura. Todas las estructuras de este tipo permiten recorrer los datos que contienen siguiendo el orden que induce la estructura.

Caben dentro de esta clasificiación los *built-ins* `tuple`, `list`, y `str` y las estructuras de *stack* y *cola*.

#### Estructuras de datos no secuenciales
Por otra parte, las estructuras no secuenciales almacenan los datos **sin establecer un orden fijo** de acceso a ellos. Estas estructuras permiten recorrer todos los datos que contienen, pero no garantizan en qué orden se entregarán sus elementos o si este orden se mantendrá constante durante la ejecución del programa.

A pesar de lo anterior, estas estructuras son ampliamante utilizadas, ya que que proveen métodos muy eficientes para la **búsqueda** de datos.

Las dos estructuras no secuenciales que revisaremos durante el curso son los diccionarios y los conjuntos (*sets*).

# Tuplas

Las **tuplas** (`tuple`) se utilizan para manejar datos de forma **ordenada** e **inmutable**, es decir, no se pueden cambiar los valores que contiene. Para acceder a algún elemento de una tupla, es necesario usar índices correlativos al orden en que los valores fueron agregados.

![](img/indices_secuencia.png)

Las tuplas pueden ser heterogéneas, y de hecho es su uso más común, lo que significa que pueden contener objetos pertenecientes a clases o tipos de datos distintos, incluyendo otras tuplas. Una tupla se puede crear de las siguientes maneras:

In [1]:
# Usando tuple() sin ingresar elementos, se crea una tupla vacía.
a = tuple()

# Declarando explícitamente los elementos de la tupla,
# ingresándolos entre paréntesis.
b = (0, 1, 2)

# Cuando creamos una tupla de tamaño 1, debemos incluir una coma al final.
c = (0, )

# Pueden ser creadas con objetos de distinto tipo.
# Al momento de la creación se pueden omitir los paréntesis.
d = 0, 'uno'

print(type(a), a)
print(type(b), b, b[0], b[1])
print(type(c), c)
print(type(d), d, d[0], d[1])

<class 'tuple'> ()
<class 'tuple'> (0, 1, 2) 0 1
<class 'tuple'> (0,)
<class 'tuple'> (0, 'uno') 0 uno


Las tuplas son estructuras de datos **inmutables**. Esto significa que **no es posible agregar o eliminar elementos**, o bien cambiar el contenido de la tupla una vez que ésta fue creada.

En el siguiente ejemplo, la posición 2 de la tupla `a` contiene originalmente un `float`. Si intentamos reemplazar el contenido de esta posición por un *string* (o cualquier otro valor), se genera un *error de tipo* (`TypeError`), debido a que los objetos de la clase `tuple` *no permiten asignación*.

In [2]:
a = ('Chile', 2, 4.15, 'Agosto')
a[2] = 'semestre'

TypeError: 'tuple' object does not support item assignment

Sin embargo, sí es posible modificar algún valor contenido *dentro* de un elemento de la tupla, siempre que el tipo de datos lo permita. En el siguiente caso **no** estamos modificando el objeto `tuple`, sino un valor interno (la posición 0) de la lista que está en la posición 3 de la tupla `meses`.

In [3]:
meses = (2023, "semestre", 2, ['Ago', 'Sep', 'Oct', 'Nov', 'Dic'])

meses[3][0] = 'Ene'
print(meses)

(2023, 'semestre', 2, ['Ene', 'Sep', 'Oct', 'Nov', 'Dic'])


### Desempaquetado de elementos

Las tuplas pueden ser **desempaquetadas** en variables individuales. En el siguiente ejemplo creamos una función llamada `calcular_geometria()`, que recibe como entrada los lados de un cuadrilátero y retorna algunas medidas geométricas. Cuando las funciones retornan más de un valor, lo hacen empaquetando todos los valores en una tupla. Esto es simplemente un [truco](https://en.wikipedia.org/wiki/Syntactic_sugar) de Python, replicable en otros lenguajes, para aparentar que se entregan múltiples valores de retorno.

In [4]:
def calcular_geometria(a, b):
    area = a * b
    perimetro = (2 * a) + (2 * b)
    punto_medio_a = a / 2
    punto_medio_b = b / 2
    # Los paréntesis son opcionales, ya que estamos creando una tupla
    return (area, perimetro, punto_medio_a, punto_medio_b)


# Obtenemos una tupla con los datos provenientes de la función.
data = calcular_geometria(20.0, 10.0)
print(f"1: {data}")

# El tipo de dato obtenido es 'tuple'
print(type(data))

# Obtenemos un valor desde la tupla directamente usando su índice
p = data[1]
print(f"2: {p}")

# Desempaquetamos en variables independientes
# los valores contenidos en una tupla
a, p, mpa, mpb = data
print(f"3: {a}, {p}, {mpa}, {mpb}")

# Las funciones devuelven el conjunto de valores
# como una tupla. Se puede desempaquetar directamente
# en variables individuales como en el caso anterior.
a, p, mpa, mpb = calcular_geometria(20.0, 10.0)
print(f"4: {a}, {p}, {mpa}, {mpb}")

1: (200.0, 60.0, 10.0, 5.0)
<class 'tuple'>
2: 60.0
3: 200.0, 60.0, 10.0, 5.0
4: 200.0, 60.0, 10.0, 5.0


### *Slicing* de tuplas

Es posible tomar secciones de la tupla usando la notación de ***slicing***. En esta notación, los índices indican *desde dónde* y *hasta dónde* deseamos recuperar datos de la tupla. La sintaxis de la notación de *slicing* es:

`secuencia[inicio:término:pasos]`

Por defecto, el número de pasos es 1. La siguiente figura muestra un ejemplo de cómo se deben considerar los índices al usar la notación de *slicing*. 

![](img/indices_slicing.png)

Forma general de hacer *slicing* en Python:

- `a[start:end]`: retorna los elementos desde `start` hasta `end - 1`.

- `a[start:]`: retorna los elementos desde `start` hasta el final del arreglo.

- `a[:end]`: retorna los elementos desde el principio hasta `end - 1`.

- `a[:]`: crea una copia (*shallow*) del arreglo completo. Es decir, el arreglo retornado está en una nueva dirección de memoria, pero los elementos que están en este nuevo arreglo, hacen referencia a la dirección de memoria de los elementos del arreglo inicial.

- `a[start:end:step]`: retorna los elementos desde `start` hasta no pasar `end`, en pasos de a `step`.

- `a[-1]`: retorna el último elemento en el arreglo.

- `a[-n:]`: retorna los últimos `n` elementos en el arreglo.

- `a[:-n]`: retorna todos los elementos del arreglo menos los últimos `n` elementos.

Veamos algunos ejemplos de *slicing* aplicado a tuplas.

In [5]:
# Usando los valores asignados en a, podemos obtener los valores de una sección de la tupla.
data = (400, 20, 1, 4, 10, 11, 12, 500)
print(f'data: {data}')

# 1. Recuperamos los elementos que están entre los índices 1 y 3
a = data[1:3]
print(f'1. data[1:3]: {a}')

# 2. Recuperamos desde el índice 3 en adelante
a = data[3:]
print(f'2. data[3:]: {a}')

# 3. Recuperamos los valores hasta el índice 5
a = data[:5]
print(f'3. data[:5]: {a}')

# 4. Recuperamos desde el índice 2 en adelante respecto del slice en pasos de a dos
a = data[2::2]
print(f'4. data[2::2]: {a}')

# 5. Recuperamos entre los índices 1 y 4, en pasos de a dos
a = data[1:6:2]
print(f'5. data[1:6:2]: {a}')

# 6. Una secuencia puede ser fácilmente invertida
a = data[::-1]
print(f'6. data[::-1]: {a}')

data: (400, 20, 1, 4, 10, 11, 12, 500)
1. data[1:3]: (20, 1)
2. data[3:]: (4, 10, 11, 12, 500)
3. data[:5]: (400, 20, 1, 4, 10)
4. data[2::2]: (1, 10, 12)
5. data[1:6:2]: (20, 4, 11)
6. data[::-1]: (500, 12, 11, 10, 4, 1, 20, 400)


## *Named tuples*

Las [*named tuples*](https://docs.python.org/3/library/collections.html#collections.namedtuple) son estructuras que permiten definir campos para cada una de las posiciones en que han sido ingresados los datos. Son útiles como una forma de agrupar datos. Generalmente, se utilizan como alternativa a las clases cuando los datos no tienen un comportamiento asociado. 

Este tipo de tupla requiere definir un objeto con los nombres de los atributos que tendrá la tupla. Para poder hacer uso de esta estructura se requiere importar el módulo `namedtuple` desde la librería `collections`. La inicialización básica de una `namedtuple` requiere un *string* con el nombre para el tipo de tupla y el nombre de los campos que tendrá, los que se entregan en una lista de *strings* como en el siguiente ejemplo:

In [6]:
from collections import namedtuple


# Asignamos un nombre a la tupla (Register_type), y los nombres de los atributos que tendrá
Register = namedtuple('Register_type', ['RUT', 'name', 'age'])

# Instanciación e inicialización de la tupla
c1 = Register('13427974-5', 'Christian', 20)
c2 = Register('23066987-2', 'Dante', 5)

print(c1.RUT)
print(c2.age)
print(type(c2))

13427974-5
5
<class '__main__.Register_type'>


Al igual que las tuplas, las *named tuples* son inmutables.

In [7]:
c1.name = 'Cristian'

AttributeError: can't set attribute