# Introducción a las estructuras de datos en Python

### Data Science and Machine Learning

#### Febrero 2023

**Aurora Cobo Aguilera**

**The Valley**



# Colecciones de datos en Python

Hay cuatro tipos de colecciones que nos permiten recoger o tener datos agrupados en Python:

* La **lista** es una colección ordenada que podemos modificar y que admite miembros duplicados.

In [None]:
miLista = ["manzana", "platano", "pera", "naranja", "limon", "cereza", "kiwi", "melon", "mango"]
print(miLista)

* La **tupla** es una colección ordenada e inalterable de elementos que también admite elementos duplicados. La diferencia con las listas es que no permite modificar sus elementos.

In [None]:
miTupla = ("manzana", "platano", "pera", "naranja")
print(miTupla)

* El **conjunto** es una colección de elementos que no está ordenada ni indexada y en la que no puede haber miembros duplicados.

In [None]:
miConjunto = {"manzana", "platano", "pera", "kiwi", "melon", "mango"}
print(miConjunto)

* El **diccionario** es una colección de elementos no ordenados, modificables e indexados que no admite miembros duplicados.

In [None]:
miDiccionario = {
  "nombre": "Ana",
  "apellidos": "García",
  "edad": 25
}
print(miDiccionario)

Cuando se elige un tipo de colección, es útil entender las propiedades de ese tipo. Elegir el tipo correcto para un conjunto de datos concreto puede significar la conservación del significado, y puede significar una mayor eficiencia o seguridad. A continuación, vamos a revisar las operaciones principales de las listas y los diccionarios ya que son los dos tipos de colecciones con los que más vamos a trabajar en este curso.

## Listas en Python

Como hemos indicado, una lista es una colección ordenada de elementos que podemos modificar y que admite elementos repetidos. Es uno de los tipos más habituales a la hora de programar en Python, por lo que son múltiples las operaciones que podemos realizar con las listas. A continuación  mostramos algunos ejemplos de las más comunes.

### Crear una lista
En Python, las listas se escriben con corchetes `[ ]`. Así que para crear una lista, podemos simplemente incluir una serie de elementos separados por comas entre los corchetes:

In [None]:
miLista = ["manzana", "platano", "pera", "naranja", "limon", "cereza", "kiwi", "melon", "mango"]
print(miLista)

Podemos definir una lista vacía si no incluimos elementos

In [None]:
miListaVacia = []
print(miListaVacia)

También puedes crear una lista con el constructor `list ()`.

In [None]:
miLista2 =list([ "limon", "cereza", "kiwi", "mango"])
print(miLista2)

### Indexación de elementos
Podemos acceder a sus elementos indexando la lista de forma similar a los caracteres de un *string* o cadena.

Analiza los siguientes ejemplos intentando adivinar la salida que vamos a obtener antes de ejecutarlos...

In [None]:
print(miLista[1])

In [None]:
print(miLista[3:5])

In [None]:
print(miLista[:4])

In [None]:
print(miLista[5:])

In [None]:
print(miLista[-1])

In [None]:
print(miLista[-5:-1])

### Comprobar la presencia de un elemento
Podemos utilizar la palabra clave `in` para comprobar si un elemento está en una lista:

In [None]:
"melon" in miLista

In [None]:
"sandia" in miLista

### Calcular la longitud de una lista
Podemos utilizar la función `len ()` para calcular el número de elementos de la lista:

In [None]:
print(len(miLista))

### Concatenar listas
Podemos utilizar el operador `+` para crear una nueva lista uniendo los elementos de las dos listas


In [None]:
miListaUnion = miLista + miLista2
print(miListaUnion)

### Modificación de elementos de la lista
Podemos modificar el valor de un elemento de la lista, accediendo a él directamente:

In [None]:
miLista[1] = "mora"
print(miLista)

E incluir un elemento repetido:

In [None]:
miLista[1] = "manzana"
print(miLista)

Podemos añadir elementos al final de una lista utilizando el método `append ()`:

In [None]:
miLista.append("higo")
print(miLista)

O utilizar el método `insert ()` para añadir un elemento en una posición específica:

In [None]:
miLista.insert(1, "platano")
print(miLista)

Si queremos eliminar elementos de la lista, tenemos varias opciones:

* El método `remove ()` elimina el elemento indicado.

In [None]:
miLista.remove("pera")
print(miLista)

Si tenemos un elemento que se repite, `remove ()` sólo lo elimina de su primera posición

In [None]:
miLista.remove("manzana")
print(miLista)

* El método `pop ()` elimina el elemento indicado por su índice o posición (si no indicamos ningún índice, se elimina el último) 


In [None]:
miLista.pop(4)
print(miLista)

In [None]:
miLista.pop()
print(miLista)

* La palabra clave `del` nos permite eliminar un elemento indicado por su índice o incluso eliminar toda la lista si no indicamos ningún elemento concreto

In [None]:
del miLista[0]
print(miLista)

In [None]:
miLista2 = ['limon', 'cereza', 'kiwi']
print(miLista2)
del miLista2
print(miLista2)

* El método `clear ()` nos permite vaciar la lista

In [None]:
miLista2 = ['limon', 'cereza', 'kiwi']
print(miLista2)
miLista2.clear()
print(miLista2)

> **Ejercicio**: Diseñe una función que calcule el elemento mayor de una lista pasada como argumento.

In [None]:
#<SOL>

a = [1, 2, 3]

def maximo(lista):
  return max(a)

maximo(a)
#</SOL>

3

Otra forma en utilizando None

In [None]:
a = [1, 2, 3, 9]
b = []

def f_maximo(lista):
  maximo = None
  for num in lista:
    if (maximo is None or num > maximo):
        maximo = num
  return maximo


print(f_maximo(a))

9


> **Ejercicio**: Diseñe una función que calcule la media de una lista de números pasada como argumento. La media de una lista vacía es cero.

In [None]:
#<SOL>
a = []
b = [1, 2, 3]

def media(lista):
  resultado = 0
  
  for x in lista:
    resultado += x

  if resultado !=0:
    return resultado/len(lista)
  else:
    return resultado
    
media(a)
#</SOL>

0

## Diccionarios de Python 

Un diccionario es una colección de elementos desordenados, modificables e indexados sin entradas duplicadas. 

Los diccionarios se escriben con llaves `{ }`, y su característica principal radica en que cada elemento tiene una clave para facilitar la indexación de los valores del diccionario. Así, cada elemento del diccionario es un par `{clave:valor}` (`{key:value}`).


### Crear un diccionario
En Python, los diccionarios se escriben con llaves y cada entrada debe indicarse con un par clave-valor. Por ejemplo:

In [None]:
miDiccionario = {
  "nombre": "Ana",
  "apellidos": "García",
  "edad": 25
}
print(miDiccionario)

{'nombre': 'Ana', 'apellidos': 'García', 'edad': 25}


Obsérvese el uso de dos puntos `:` para la asignación clave-valor.

De esta forma, podemos crear un diccionario con 3 entradas asociadas a las claves "nombre", "apellido", "edad" y, para cada clave, hemos guardado también su valor asociado. 

De esta forma, los diccionarios nos permiten crear estructuras muy flexibles donde almacenar información de forma estructurada. 

Podemos crear un diccionario vacío si no incluimos ningún elemento:

In [None]:
miDiccionarioVacio = {}
print(miDiccionarioVacio)

{}


O utilizar el constructor `dict()`:


In [None]:
miDiccionario2 = dict(nombre = "Juan", apellidos = "Pérez", edad = 30)
print(miDiccionario2)

{'nombre': 'Juan', 'apellidos': 'Pérez', 'edad': 30}


Tenga en cuenta que ahora las claves no se proporcionan como literales de cadena y que utilizamos el signo `=`   en lugar de `:` para la asignación clave-valor.

### Acceso a las claves y valores

Una vez creado el diccionario, podemos acceder a un valor concreto a través de su clave:

In [None]:
miDiccionario["nombre"]

'Ana'

Observe que para acceder al elemento, llamamos al diccionario indicando la clave asociada al valor deseado entre corchetes.

Los diccionarios también tienen un método `.get()` que proporcionará el mismo resultado:

In [None]:
miDiccionario.get("nombre")

'Marta'

Podemos cambiar el valor de una entrada específica accediendo con su clave:

In [None]:
miDiccionario["nombre"]='Marta'
miDiccionario.get("nombre")

'Marta'

Obsérvese el uso de `=` en lugar de `:` para la asignación

Si intentamos acceder a una clave que no existe, obtenemos un error

In [None]:
miDiccionario["estado"]

KeyError: ignored

Podemos evitar este error, utilizando la función get 

In [None]:
if miDiccionario.get("estado") is not None:
  print(miDiccionario["estado"])

Si necesitamos acceder a todos los pares clave-valor, puede utilizar el método `.items()`

In [None]:
miDiccionario.items()

dict_items([('nombre', 'Ana'), ('apellidos', 'García'), ('edad', 25)])

Tenga en cuenta que este método devuelve una lista de todos los pares clave-valor, donde cada par se devuelve como una tupla.

También podemos acceder de forma independiente a todas las claves o a todos los valores utilizando los métodos `.keys()` o `.values()`, respectivamente.

In [None]:
miDiccionario.keys()

In [None]:
miDiccionario.values()

Se puede iterar sobre los elementos de un diccionario utilizando un bucle `for`. Para ello, solo hay que tener en cuenta que los elementos devueltos son las claves del diccionario:


In [None]:
for clave in miDiccionario:
  print(clave)

nombre
apellidos
edad


Podemos usar las claves para devolver los valores

In [None]:
for clave in miDiccionario:
  print(miDiccionario[clave])

Marta
García
25


Pero podemos utilizar los métodos `.items` o `.values` para iterar sobre otros elementos

In [None]:
for valor in miDiccionario.values():
  print(valor)

Marta
García
25


In [None]:
for clave, valor in miDiccionario.items():
  print(clave, valor)

nombre Marta
apellidos García
edad 25


### Añadir y eliminar elementos

Para añadir una nueva entrada (clave-valor) a un diccionario, podemos simplemente utilizar una nueva clave y asignarle un valor:



In [None]:
miDiccionario["estado"] = 'soltera'
print(miDiccionario)

O podemos utilizar el método `.update()`:

In [None]:
miDiccionario.update({"trabajo":'profesora'})
print(miDiccionario)

{'nombre': 'Marta', 'apellidos': 'García', 'edad': 25, 'trabajo': 'profesora'}


Aunque, en general, este método actualiza el diccionario con elementos de otro diccionario. En caso de que el otro diccionario tenga nuevos valores clave, éstos se añaden como nuevos elementos; en caso contrario, se actualizan los valores asociados. Por ejemplo:

In [None]:
miDiccionario2 = {1: "one", 2: "three"}
nuevoDiccionario = {2: "two", 3: "three"}

miDiccionario2.update(nuevoDiccionario)
print(miDiccionario2)

{1: 'one', 2: 'two', 3: 'three'}


Para eliminar elementos de un diccionario, podemos utilizar los siguientes métodos:
* `.pop()` o `del` (esta última es una función de Python): eliminan el elemento asociado a una clave determinada.

* `.popitem()`: elimina el último elemento insertado.

In [None]:
print(miDiccionario)
miDiccionario.popitem() 
print(miDiccionario)

{'nombre': 'Marta', 'apellidos': 'García', 'edad': 25, 'trabajo': 'profesora'}
{'nombre': 'Marta', 'apellidos': 'García', 'edad': 25}


In [None]:
miDiccionario.pop("edad") 
print(miDiccionario)

{'nombre': 'Marta', 'apellidos': 'García'}


In [None]:
del miDiccionario["nombre"]
print(miDiccionario)

{'apellidos': 'García'}


O incluso podemos utilizar `del` para eliminar el diccionario completo

In [None]:
del miDiccionario
print(miDiccionario)

Si sólo queremos eliminar los elementos del diccionario, sin borrar la variable, podemos utilizar el método `.clear`:

In [None]:
miDiccionario = {
  "nombre": "Ana",
  "apellidos": "García",
  "edad": 25
}
print(miDiccionario)

{'nombre': 'Ana', 'apellidos': 'García', 'edad': 25}


In [None]:
miDiccionario.clear()
print(miDiccionario)

### **Ejercicios con diccionarios**

Vamos a crear un diccionario con la información de tus compañeros de clase, utilizando el nombre como clave y sus estudios (titulación) como valores. Para este ejercicio, es suficiente con que incluyas los datos de 5 o 6 compañeros.

In [None]:
#<SOL>

compis = {
    "María" : "Ingeniería Agrónoma",
    "Carlos" : "Ingeniero Infromático",
    "Arturo" : "Físico",
    "Cristian" : "Economista",
    "Tania" : "Ha hecho de todo"
}

compis
#</SOL>

{'María': 'Ingeniería Agrónoma',
 'Carlos': 'Ingeniero Infromático',
 'Arturo': 'Físico',
 'Cristian': 'Economista',
 'Tania': 'Ha hecho de todo'}

Ahora resuelve los siguientes ejercicios o preguntas:
* ¿Qué titulación ha estudiado Maria?
* Actualiza el diccionario con información de otro compañero
* Crea una lista con los nombres de todos los compañeros de clase que están en tu diccionario
* ¿Cuánta gente ha estudiado `Ingeniería Agrónoma`?

In [None]:
#<SOL>
print ("Qué titulación estudió María?", compis.get("María"))
#</SOL>

Qué titulación estudió María? Ingeniería Agrónoma


In [None]:
#<SOL>
compis.update({"Victor" : "Ingeniero Informatico"})
compis
#</SOL>

{'María': 'Ingieniería Agrónoma',
 'Carlos': 'Ingeniero Infromático',
 'Arturo': 'Físico',
 'Cristian': 'Economista',
 'Tania': 'Ha hecho de todo',
 'Victor': 'Ingeniero Informatico'}

In [None]:
#<SOL>

#list(miclase.keys()) #esto para que me de todas las claves
#for clave in compis.items():
#for valor in compis.values():

lista_compis = [clave for clave, valor in compis.items() ]

print(lista_compis)
#</SOL>

['María', 'Carlos', 'Arturo', 'Cristian', 'Tania', 'Victor']


In [None]:
#<SOL>

'''La forma de Aurora

for valor in compis.values():
  contador = 0  
  if valor == "Ingeniería Agrónoma":
    contador += 1
  else:
    contador

print(contador)
'''

compis.update({"Agustín" : "Ingeniería Agrónoma"})

lista_agronomos =  [clave for clave, valor in compis.items() if valor == "Ingeniería Agrónoma"]

print(f"Han estudiado Ingeniería Agrónoma {len(lista_agronomos)} personas")
#</SOL>

Han estudiado Ingeniería Agrónoma 2 personas


## Estructuras anidadas

En Python podemos crear estructuras anidadas. Por ejemplo, podemos crear:

**Diccionarios anidados**: Es un diccionario que contiene muchos diccionarios.

**Lista de diccionarios**: Es una lista donde cada elemento es un diccionario. En estas estructuras es bastante común que todos los diccionarios tengan las mismas claves, aunque esto no es obligatorio.  

Ejemplo de diccionario anidado:

In [None]:

chicos = {
  "chico1" : {
    "nombre" : "Alex",
    "edad" : 4
  },
  "chico2" : {
    "nombre" : "Eva",
    "edad" : 7
  },
  "chico3" : {
    "nombre" : "Daniel",
    "edad" : 11
  }
}
print(chicos)

Ejemplo de lista de diccionarios

In [None]:
chicos = [{
    "nombre" : "Alex",
    "edad" : 4
  }, {
    "nombre" : "Eva",
    "edad" : 7
  }, {
    "nombre" : "Daniel",
    "edad" : 11
  }]
print(chicos)

# Comprensión de listas (List Comprehension)

La comprensión de listas es una forma elegante de crear listas en Python a partir de listas (o iteradores) existentes. 

Para definir una nueva lista en Python usando la comprensión de listas definiremos una expresión entre corchetes, pero en lugar de la lista de elementos dentro de ella, definiremos una expresión seguida de un bucle `for`: 

`nueva_lista = [(operación sobre elemento) for elemento in iterador]`

Esta expresión permite tomar elementos de nuestro iterador (que puede ser otra lista), aplicar una operación sobre ellos, y generar los nuevos elementos que se añaden automáticamente en `nueva_lista`.

Esta sintaxis hace que esta nueva forma de definir listas sea más compacta y rápida que la definición normal.

Veamos cómo funciona esto con algunos ejemplos:

**Ejemplo 1**: Vamos a crear una lista con los caracteres de la frase "¡Hello world!" 

In [None]:
# Solución estándar
frase = "Hola mundo!"
miLista = []
for car in frase:
  miLista.append(car)

print(miLista)

In [None]:
# Lista comprimida
frase = "Hola mundo!"
miLista2 = [car for car in frase]
print(miLista2)

**Ejemplo 2**: Calculemos el cuadrado del número de 0 a 10

In [None]:
# Solución estándar
miLista = []
for num in range(11):
  miLista.append(num**2)

print(miLista)

> **Ejercicio**: Haz lo mismo pero con comprensión de listas.

In [None]:
# <SOL>
# Lista comprimida

lista = [num**2 for num in range(11)]
lista

# </SOL>

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

#### If...else con la comprensión de listas

La comprensión de listas también nos permite incluir declaraciones `if... else...` en su definición.

Por ejemplo, en el Ejemplo 2, podemos calcular el cuadrado de sólo los números impares entre 0 y 10.

In [None]:
# Solución estándar
miLista = []
for num in range(11):
  if (num % 2) != 0:
    miLista.append(num**2)

print(miLista)

In [None]:
# Lista comprimida
miLista2 = [num**2 for num in range(11) if (num % 2) != 0]
print(miLista2)

[1, 9, 25, 49, 81]


O podemos calcular el cuadrado de los números impares y el cubo de los pares.

In [None]:
# Solución estándar
miLista = []
for num in range(11):
  if (num % 2) != 0:
    miLista.append(num**2)
  else:
    miLista.append(num**3)
print(miLista)

In [None]:
# Lista comprimida
miLista2 = [num**2 if (num % 2) != 0 else num**3 for num in range(11)]
print(miLista2)

Fíjate que si sólo hay un 'if', este se coloca al final, pero si hay 'if' y 'else' se colocan antes del 'for'.

#### Comprensión de diccionarios / Dictionary Comprehension

Podemos crear un diccionario con el uso de una sintaxis similar utilizando llaves en lugar de corchetes e indicando los pares `clave:valor` en lugar de los elementos de la lista.

**Ejemplo 3**: Vamos a calcular un diccionario con pares `{número: número**2}` donde el número es la clave y el valor su cuadrado.

In [None]:
# Diccionario comprimido
miDiccionario = {num:num**2 for num in range(11)}
print(miDiccionario)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}


In [None]:
miDiccionario[6]

**Ejercicio**: Usa la técnica de listas comprimidas para crear un diccionario con la tabla de multiplicar del número 3: [3, 6, 9, .... 30]. no vale ponerlo a mano! Pista: Genera números del 1 al 10 y multiplicalos por 3. Tiene que caberte todo en una sola línea.

In [2]:
#<SOL>
#Función generatri de la tabla que sea
tabla = lambda x: {f"{num} x {x}": num*x for num in range(1,11)}
tabla(3)
#</SOL>



{'1 x 3': 3,
 '2 x 3': 6,
 '3 x 3': 9,
 '4 x 3': 12,
 '5 x 3': 15,
 '6 x 3': 18,
 '7 x 3': 21,
 '8 x 3': 24,
 '9 x 3': 27,
 '10 x 3': 30}

In [7]:
#Generatriz de las talas del 0 al 10
ind = [x for x in range(11)]
num = [y for y in range(11)]

tabla = [{f"{i} x {n}" : i*n for n in num } for i in ind]

#para acceder ahora a la solución de un producto sería por ejemplo

tabla[3].get("3 x 8") #accedo a la tabla del 3 y pregunto el valor de 3 x 8

24

In [16]:
#generatriz de función que da todas la raices de un número
raiz = lambda x: {f"{x}^(1/{n})" : x**(1/n) for n in range(1,6)}
raiz(25) #calcula raices de 25

{'25^(1/1)': 25.0,
 '25^(1/2)': 5.0,
 '25^(1/3)': 2.924017738212866,
 '25^(1/4)': 2.23606797749979,
 '25^(1/5)': 1.9036539387158786}

## ¿Por qué listas o diccionarios comprimidos?

Este tipo de sintáxis no solo nos permite ahorrar líneas de código, sino que además es más eficiente computacionalmente hablando. Veámoslo con un ejemplo...

In [None]:
import time
MILLION_NUMBERS = list(range(1000000))

salida = []
tiempo_comienzo = time.time()
for elemento in MILLION_NUMBERS:
    if not elemento % 2:
        salida.append(elemento)
tiempo_transcurrido = time.time() - tiempo_comienzo
print(tiempo_transcurrido)

In [None]:
tiempo_comienzo = time.time()
output = [elemento for elemento in MILLION_NUMBERS if not elemento % 2]
tiempo_transcurrido = time.time() - tiempo_comienzo
print(tiempo_transcurrido)

Exacto!! El tiempo de ejecución se reduce con listas comprimidas!! :)

# Guardar/cargar estructuras

El módulo pickle permite guardar y cargar estructuras de datos en python sin tener que escribirlas enteras cada vez que quieras utilizarlas.

In [None]:
import pickle

lista_guardar = [1, 2, 3, 4]

pickle.dump(lista_guardar, open('mifichero', 'wb'))

In [None]:
lista_leer = pickle.load(open('mifichero', 'rb'))
print(lista_leer)

> **Ejercicio**: Imagina que tienes una lista con la evolución del precio de algún producto de una tienda durante los últimos años. Sin embargo, nos encontramos que en algunos valores no tenemos información, lo cual está indicado con un 'None'. A partir de listas de comprensión, crea una nueva lista que compruebe el valor con un 'None' y descarte dichos valores, guardando sólo los datos con información y descartando los datos perdidos ('None').
Comprueba el resultado mostrando la nueva lista creada.

In [None]:
precios = [24, None, None, 21.6, 20.99, 19.99, 24.5, None,  25.5, 24, 26, 28.5, None, 32.99]
print(precios)

[24, None, None, 21.6, 20.99, 19.99, 24.5, None, 25.5, 24, 26, 28.5, None, 32.99]


In [None]:
#<SOL>
precios_limpios = [x for x in precios if x != None]
precios_limpios
#<SOL>

[24, 21.6, 20.99, 19.99, 24.5, 25.5, 24, 26, 28.5, 32.99]

In [25]:
'''
La manera que Bea quería es así, la anterior es más rápida, pero esta 
funcionaría si también hubiese strcu otros tipos de datos menos booleanos (True)
'''

precios2 = [1, 2, 3, None, 'Carlos', 4, 5, None, 'Maria', [2, 3, 4], {"Pedro" : "Amigo"}]
def is_number(x):
  try:
    float(x)
    return True
  except:
    ValueError
    return False

precios_limpios = [num for num in precios2 if isiis_number(num)]
precios_limpios

[1, 2, 3, 4, 5]