### ¿Qué es una estructura de datos?

Una estructura de datos es un **arreglo computacional** que organiza sistemáticamente los datos que ocupan la memoria de una computadora. El tipo de estructura bajo la que se encuentre almacenado un conjunto de datos determina el modo en que dicha información es **almacenada, accesada** o **manipulada** por el usuario.

Las estructuras de datos en Python desempeñan un papel crucial en desarrollo **eficiente** de diversas tareas computacionales. El proceso de selección de una estructura **apropiada** para diferentes tareas es conocido como **optimización**. 

Existen cuatro tipos básicos de estructuras de datos en Python: **listas, tuplas, diccionarios** y **conjuntos** (`lists, tuples, dictionaries, sets`). Cada una de estas estructuras sirve un propósito único.

![alternatvie text](https://runawayhorse001.github.io/PythonTipsDS/_images/data_structures.png)

## Listas

Una lista es una **Secuencia de valores**. Los valores que integran una lista son conocidos como **elementos** o **items** y pueden pertenecer a cualquier tipo de dato. 

La forma más fácil de crear una lista es a través del uso de **corchetes**:

In [3]:
#Crear una lista de números enteros
ls_ent = [1, 2, 3, 4, 5]

#Crear una lista de strings
ls_str = ["perro", "gato", "avestruz", "hamster", "pez"]

#Crear una lista con distintos tipos de datos
ls_ran = [1, "dos", 3.0]

#Crear una lista vacía
ls_emp = []

#Generar lista con 'list()'
ls_tot = list(("perro", "gato", "avestruz", "hamster", "pez"))

#Imprimir contenido de listas
print(ls_ent, ls_str, ls_ran, ls_emp)

[1, 2, 3, 4, 5] ['perro', 'gato', 'avestruz', 'hamster', 'pez'] [1, 'dos', 3.0] []


Es posible adicionar elementos a una lista que ya se encuentra en la memoria, o bien sustraer elementos existentes. También es posible generar listas vacías bajo la expectativa de llenarla posteriormente como parte de la ejecución de un algoritmo. Esta característica de las listas es conocida como **mutabilidad**. 

También es posible generar **listas de listas**, es decir, colocar una lista como elemento al interior de otra lista. Este proceso es conocido como **anidación** de listas.

In [4]:
#Generar lista anidada (nested)
ls_tot = [ls_ent, ls_str, ls_ran, ls_emp]

#Imprimir contenido de lista anidada
print(ls_tot)

[[1, 2, 3, 4, 5], ['perro', 'gato', 'avestruz', 'hamster', 'pez'], [1, 'dos', 3.0], []]


La función `list()` puede ser utilizada para convertir cadenas de texto en un objeto de tipo lista. Al utilizar, la cadena será segmentada al nivel del carácter y cada uno de estos se convertirá en un elemento de la lista.

In [13]:
#Definir una variable de tipo string
s = "Olympique de Marseille"

#Generar una lista con la variable 's'
om = list(s)

#Imprimir lista
print(om)

['O', 'l', 'y', 'm', 'p', 'i', 'q', 'u', 'e', ' ', 'd', 'e', ' ', 'M', 'a', 'r', 's', 'e', 'i', 'l', 'l', 'e']


Las listas son estructuras dinámicas y ordenadas de elementos. Su característica más sobresaliente es que pueden ser modificadas en el transcurso de la ejecución de un algoritmo.

La **sintaxis** utilizada para acceder a los elementos de una lista es la misma que la de los **corchetes** (`[]`). Cuando el operador de corchete (*bracket operator*) aparece a la izquierda de una asignación, se identifica el elemento que debe ser filtrado. 

In [14]:
#Seleccionar el elemento número tres de la lista de strings
bird = ls_str[2]

#También es posible utilizar un índice negativo
bird = ls_str[-3]

#Imprimir elemento seleccionado
print(bird)

avestruz


El número provisto al interior de los corchetes es el **índice** que indica la posición del elemento a recuperar. Es posible utilizar la misma sintaxis para **reemplazar elementos** de una lista:

In [15]:
#Cambiar el elemento número tres de la lista de strings
ls_str[2] = "conejo"

#Imprimir lista de strings modificada
print(ls_str)

['perro', 'gato', 'conejo', 'hamster', 'pez']


Es posible utilizar operadores aritméticos para ejecutar **operaciones entre listas**. El operador de **suma** tiene el efecto de **concatenar** listas, mientras que el operador de **multiplicación** tiene el efecto de multiplicar la dimensión de la lista. 

In [16]:
#Concatenar dos listas
print(ls_str + ls_ran)

#Multiplicar lista
print(ls_str*3)

['perro', 'gato', 'conejo', 'hamster', 'pez', 1, 'dos', 3.0]
['perro', 'gato', 'conejo', 'hamster', 'pez', 'perro', 'gato', 'conejo', 'hamster', 'pez', 'perro', 'gato', 'conejo', 'hamster', 'pez']


Por otro lado, para **Segmentar** (*slice*) una lista es necesario utilizar el operador `[ ]` con los índices que se desea recuperar. Antes de segmentar una lista, es importante generar una **copia** o asignar la lista segmentada a una variable diferente.

In [8]:
#Seccionar los primeros tres elementos de la lista de animales
print(ls_str[:3])

#Seleccionar los últimos dos elementos de la lista de animales
print(ls_str[3:])

#Seleccionar el segundo y tercer elemento de la lista de animales
print(ls_str[1:3])

['perro', 'gato', 'conejo']
['hamster', 'pez']
['gato', 'conejo']


Si se omite el primer índice, la segmentación parte del inicio de la lista. Si se omite el segundo índice, la segmentación avanza hasta el final de la lista. 

Es posible utilizar este mismo procedimiento a fin de reemplazar el contenido de múltiples elementos de la lista:

In [17]:
#Cambiar los últimos dos elementos de la lista de animales
ls_str[4:5] = ["caballo", "ajolote"]

#Imprimir lista modificada
print(ls_str)

['perro', 'gato', 'conejo', 'hamster', 'caballo', 'ajolote']


Un objeto de tipo lista tiene diferentes **métodos** o funciones disponibles para la ejecución de operaciones de manipulación de datos. Es posible modificar los contenidos de la lista o incorporar nuevos elementos.

In [10]:
#Adicionar un elemento al final de una lista: apppend
ls_str.append("pollo")
print(ls_str)

#Adicionar una lista a otra lista: extend
ls_str.extend(["gallina", "pato"])
print(ls_str)

#Ordenar los elementos de una lista de menor a mayor: sort
ls_str.sort()
print(ls_str)

['perro', 'gato', 'conejo', 'hamster', 'caballo', 'ajolote', 'pollo']
['perro', 'gato', 'conejo', 'hamster', 'caballo', 'ajolote', 'pollo', 'gallina', 'pato']
['ajolote', 'caballo', 'conejo', 'gallina', 'gato', 'hamster', 'pato', 'perro', 'pollo']


Cuando se cuenta con una lista de valores numéricos, es posible agregar los elementos para obtener la suma del total del conjunto. Esta operación es conocida como **Reduccion** (*reduction*) de una lista.

In [11]:
#Obtener la suma de los elementos de la lista de enteros
sum(ls_ent)

15

En cuanto a la **eliminación** de elementos de una lista, existen múltiples métodos que pueden ser utilizados para completar esta operación. Es necesario conocer el índice del elemento o del rango de elementos que se desea remover.

In [12]:
#Eliminar con el método 'pop': remueve todos los elementos que no son parte del indice provisto
ave_acuatica = ls_str.pop(-3)
print(ave_acuatica)

#Eliminar con el método 'del': remueve el elemento seleccionado
del ls_str[0] #Eliminar ajolote
print(ls_str)

#Eliminar con el método 'remove': remueve por contenido del elemento
ls_str.remove("caballo")
print(ls_str)

#Para remover múltiples elementos es posible indicar un intervalo en el indice
del ls_str[1:5]
print(ls_str)

pato
['caballo', 'conejo', 'gallina', 'gato', 'hamster', 'perro', 'pollo']
['conejo', 'gallina', 'gato', 'hamster', 'perro', 'pollo']
['conejo', 'pollo']


Es importante ser cuidadoso con la manipulación de dos listas guardadas bajo el mismo nombre. Al ser objetivos *iguales* e idénticos, las modificaciones en una también se verán reflejadas en la otra.

In [14]:
#Definir la lista de strings con un 'alias'
ls_alias = ls_str

#Imprimir la lista nueva
print(ls_alias)

#Hacer modificaciones al alias y visualizar lista previa
ls_alias.append("tortuga")
print(ls_str)

['conejo', 'pollo']
['conejo', 'pollo', 'tortuga']


## Diccionarios

Un diccionario es una **colección de índices**. Al igual que las listas, los diccionarios son estructuras bidimensionales que contienen datos estructurados por un índice. El rasgo que los diferencia de las listas es que en estos los índices pueden ser cualquier tipo de datos, no sólo valores numéricos.

Al definir un diccionario cada uno de los índices desempeña el papel de identificador o **llave** (`key`) y cada una de estas llaves estará vinculada con un valor único. La asociación entre llave y valor es conocida como ***key-value pair*** o *item*. Dado que cada uno de los pares es único, es posible señalar que el universo de las asociaciones entre llaves y valores está delimitado.

In [18]:
#Definición de un diccionario
eng2spa = {"dog":"perro", "cat":"gato", "fish":"pez"}

#Visualizar diccionario
print(eng2spa)

{'dog': 'perro', 'cat': 'gato', 'fish': 'pez'}


La definición de un diccionario se apoya en el operador `{ }`. Para agregar un nuevo valor es necesario utilizar el operador de corchetes.

In [19]:
#Agregar un nuevo valor al diccionario
eng2spa["fox"] = "zorro"

#Modificar un valor 
eng2spa["cat"] = "felino"

#Imprimir el diccionario
print(eng2spa)

#Obtener extensión del diccionario
print(len(eng2spa))

{'dog': 'perro', 'cat': 'felino', 'fish': 'pez', 'fox': 'zorro'}
4


El método `len` (*length*) permite obtener la cantidad de pares que integran el diccionario. Para obtener los valores de un diccionario es posible utilizar el método `values`.

In [22]:
#Obtener los valores del diccionario
dic_vals = eng2spa.values()

#Imprimir lista de valores
print(list(dic_vals))

['perro', 'gato', 'pez', 'zorro']


La ventaja de trabajar con diccionarios es que los valores **mapean** siempre a un índice concreto, por lo que facilitan la ejecución de tareas de búsqueda y comparación. El método `get` puede ser utilizado para rastrear un valor dada la provisión de una llave.

In [27]:
#Palabra a traducir
mascota = "cat"

#Generar función para traducir la palabra
def traductor_pets(animal):
    trans = eng2spa.get(animal, "No sé")
    print(trans)

#Implementar función
traductor_pets(mascota)
traductor_pets("rat")

gato
No sé


El método `get` busca a través de las llaves del diccionario a fin de encontrar el valor al que la palabra a traducir (el argumento de la función) mapea en el conjunto de valores del diccionario. Si la llave no se encuentra  presente en el diccionario, la función devuelve un valor alternativo.

En general, implementar operaciones de búsqueda y pareo es más eficiente mediante el uso de diccionarios que de listas. En este sentido, un programa que debe repetirse muchas veces se beneficiaría de la incorporación de esta estructura de datos para la ejecución de sus operaciones.

### ¿Y los Dataframes de Pandas?

Los `DataFrames` de la biblioteca `Pandas` son una estructura de datos integreada por tres componentes: datos, un índice y columnas. Al ser una **estructura tabular**, las filas contienen las observaciones para cada registro individual y las columnas hacen referencia a las **variables** observadas del conjunto de datos.

Los DataFrames comparten algunas características con las **listas**, como el hecho de que son mutables, se encuentran ordenados por un índice númerico o pueden contener datos de distintos tipos.

Los DataFrames también comparten algunas características con los **diccionarios**, en tanto de que es posible acceder a valores utilizando *llaves* o que cada columna hace referencia a un tipo específico de valor.

In [28]:
#Importar bibliotecas requeridas
import pandas as pd

#Importar el archivo de texto de extensión .csv
df = pd.read_csv("D:/Documentos/Otros/Aplicaciones/DESI/Muertes_maternas_2002_2021.csv")

Para buscar valores en un DataFrame también es posible recurrir al método `get`. La aplicación de este método devuelve la columna referenciada. 

In [44]:
#Seleccionar la columna de edad
edad_madres = df.get("EDAD").unique()

#Obtener valores únicos ordenados
edad_madres.sort()

#Visualizar valores únicos de la edad
print(edad_madres)
print(type(edad_madres))

[ 11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28
  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46
  47  48  49  50  51  52  53  54  55  56  59  61  65  66  67  70  71  72
  76  79  81  82  86 998]
<class 'numpy.ndarray'>
