<img src="img/viu_logo.png" width="200"><img src="img/python_logo.png" width="250"> *Mario Cervera*

# Tipos de datos compuestos (colecciones)

## En la clase anterior ...

* Expresiones literales.
   * Simples.
   * Compuestos.
* Variables.
* Tipos de datos básicos.
   * Bool.
   * Int.
   * String.
* Operadores.
   * Aritméticos (+, -, *, ...).
   * Comparación (<, >, ==, ...).
   * Lógicos (and, or, not).
   * Binarios (&, |, ~, ...).
   * Asignación (=, +=, -=, ...).
   * Identidad (is, is not).
   * Pertenencia (in, not in).

## Para hoy ...

* Listas.
* Diccionarios.
* Conjuntos (sets).
* Tuplas.

## Listas

* Una colección de objetos.
* Mutables.
* Tipos arbitrarios.
* Puede contener duplicados.
* No tienen tamaño fijo. Pueden contener tantos elementos como quepan en memoria.
* Los elementos van ordenados por posición.
* Se acceden a través de **[index]**.
* Los índices van de 0 a n-1, donde n es el número de elementos de la lista.
* Son un tipo de *Secuencia*, al igual que los strings, por lo tanto el orden importa.
* Soportan anidamiento.
* Son una implementación del tipo abstracto de datos: *Array Dinámico*.

<img src="img/TiposCompuestos/list.png" width="800">

#### Operaciones con listas

In [None]:
# Creación de listas
letras = ['a', 'b', 'c', 'd']
palabras = 'Hola mundo'.split()
numeros = list(range(5))

print(letras)
print(palabras)
print(numeros)
print(type(numeros))

In [None]:
# Pueden contener elementos arbitrarios
mezcla = [1, 3.4, 'a', None, False]
print(mezcla)

In [None]:
# Pueden incluso contener objetos más "complejos"
lista_con_funcion = [1, 2, len]
print(lista_con_funcion)

In [None]:
# Pueden contener duplicados
lista_con_duplicados = [1, 2, 3, 3, 3, 4]
print(lista_con_duplicados)

In [None]:
# Obtención de la longitud de una lista
letras = ['a', 'b', 'c', 'd']
print(len(letras))

In [None]:
# Acceso a un elemento de la lista
print(letras[2])
print(letras[-1])

In [None]:
# Obtención de un fragmento de la lista (slicing)
# Formato: lista[inicio:fin:paso]

letras = ['a', 'b', 'c', 'd']
print(letras[1:3])
print(letras[:1])
print(letras[:-1])
print(letras[2:])
print(letras[:])
print(letras[::2])

In [None]:
# Añadir un elemento al final de la lista
letras.append('e')
print(letras)

In [None]:
# Insertar en posición
letras.insert(1,'b')
print(letras)

In [None]:
# Modificación de la lista (individual)
letras[5] = 'f'

# Modificación mútiple
letras[1:3] = ['z', 'z', 'z']

print(letras)

In [None]:
# Ojo con la diferencia entre modificación individual y múltiple. Asignación individual de lista crea anidamiento.
numeros = [1, 2, 3]
numeros[1] = [0, 0, 0]

print(numeros)

In [None]:
# Eliminar un elemento
letras.remove('f')
letras.remove('z')
letras.remove('z')
print(letras)

In [None]:
# Concatenar listas
lacteos = ['queso', 'leche']
frutas = ['naranja', 'manzana']
print(lacteos + frutas)

# Concatenación sin crear una nueva lista
frutas.extend(['pera'])
print(frutas)

In [None]:
# Replicar una lista
lacteos = ['queso', 'leche']
print(lacteos * 3)

In [None]:
# Copiar una lista
frutas2 = frutas.copy()
print(frutas2)
print('id frutas = ' + str(id(frutas)))
print('id frutas2 = ' + str(id(frutas2)))

In [None]:
# Ordenar una lista
lista = [4,3,8,1]
lista.sort()
print(lista)

lista.sort(reverse=True)
print(lista)

In [None]:
# Los elementos deben ser comparables para poderse ordenar
lista = [1, 'a']
lista.sort()

In [None]:
# Pertenencia
lista = [1, 2, 3, 4]
print(1 in lista)
print(5 in lista)

In [None]:
# Anidamiento
letras = ['a', 'b', 'c', ['x', 'y', ['i', 'j', 'k']]]
print(letras[0])
print(letras[3][0])
print(letras[3][2][0])

<img src="img/TiposCompuestos/nestedlist.png" width="900">

## Diccionarios

* Colección de parejas clave-valor.
* Son mutables.
* Claves:
   * Cualquier objeto inmutable.
   * Sólo pueden aparecer una vez en el diccionario.
* Valores:
   * Sin restricciones. Cualquier objeto (enteros, strings, listas, etc.) puede hacer de valor.
* Desde la versión 3.7 están ordenados.
* Se pueden ver como listas indexadas por cualquier objeto inmutable, no necesariamente por números enteros.
* A diferencia de las listas, no son *secuencias*. Son *mappings*.

#### Operaciones con diccionarios

In [None]:
# Creación de diccionarios (simple)
persona = {'DNI' : '11111111D', 'Nombre' : 'Carlos', 'Edad' : 34}
print(persona)

In [None]:
# Creación de diccionarios (uniendo dos colecciones)
nombres = ['Pablo', 'Manolo', 'Pepe']
edades = [52, 14, 65]

datos = dict(zip(nombres,edades))
print(datos)

In [None]:
# Creación de diccionarios (pasando claves y valores a la función 'dict')
persona2 = dict(nombre='Rosa', apellido='Garcia')
print(persona2)

In [None]:
# Creación de diccionarios (usando una lista de tuplas de dos elementos)
persona2 = dict([('nombre', 'Rosa'), ('apellido','Garcia')])
print(persona2)

In [None]:
# Creación incremental por medio de asignación (como las claves no existen, se crean nuevos items)

persona = {}
persona['DNI'] = '11111111D'
persona['Nombre'] = 'Carlos'
persona['Edad'] = 34

print(persona)

In [None]:
# Acceso a un valor a través de la clave
persona = {'DNI' : '11111111D', 'Nombre' : 'Carlos', 'Edad' : 34}
print(persona['Nombre'])

In [None]:
# Acceso a claves inexistentes o por índice produce error

#persona[1]
persona['Trabajo']

In [None]:
# Modificación de un valor a través de la clave
persona = {'DNI' : '11111111D', 'Nombre' : 'Carlos', 'Edad' : 34}
persona['Nombre'] = 'Fernando'
persona['Edad'] += 1
print(persona)

In [None]:
# Añadir un valor a través de la clave
persona = {'DNI' : '11111111D', 'Nombre' : 'Carlos', 'Edad' : 34}
persona['Ciudad'] = 'Valencia'
print(persona)

In [None]:
# Eliminción de un valor a través de la clave
del persona['Ciudad']
value = persona.pop('Edad')
print(persona)
print(value)

In [None]:
# Comprobar existencia de clave
print('Nombre' in persona)
print('Apellido' in persona)

In [None]:
# Recuperar el valor de una clave, indicando valor por defecto en caso de ausencia
persona = {'Nombre' : 'Carlos'}

value = persona.get('Nombre')
print(value)

value = persona.get('Estatura', 180)
print(value)

value = persona['Estatura'] if 'Estatura' in persona else 185
print(value)

In [None]:
# Anidamiento
persona = {
    'Trabajos' : ['desarrollador', 'gestor'],
    'Direccion' : {'Calle' : 'Pintor Sorolla', 'Ciudad' : 'Valencia'}
}

print(persona['Direccion'])
print(persona['Direccion']['Ciudad'])

In [None]:
# Metodos items, keys, values.

persona = {'DNI' : '11111111D', 'Nombre' : 'Carlos', 'Edad' : 34}

print(list(persona.items()))
print(list(persona.keys()))
print(list(persona.values()))

## Sets (Conjuntos)

Al igual que las listas:

* Colección de elementos.
* Tipos arbitrarios.
* Mutables.
* No tienen tamaño fijo. Pueden contener tantos elementos como quepan en memoria.

A diferencia de las listas:

* No puede tener duplicados.
* Se definen por medio de llaves.
* Los elementos no van ordenados por posición. No hay orden establecido.
* Solo pueden contener objetos inmutables.
* No soportan anidamiento.

In [None]:
# Creación de un conjunto
set1 = {0, 1, 1, 2, 3, 4, 4}
print(set1)
  
set2 = {'user1', 12, 2}
print(set2)

set3 = set(range(7))
print(set3)

set4 = set([0, 1, 2, 3, 4, 0, 1])
print(set4)

In [None]:
# Observa la diferencia entre listas y conjuntos
s = 'aabbc'
print(list(s))
print(set(s))

#### Operaciones con conjuntos

In [None]:
# No se pueden indexar los elementos de la misma forma que en una secuencia.
set1 = {0, 1, 2}
print(set1[0])

In [None]:
set1 = {0, 1, 1, 2, 3, 4, 5, 8, 13, 21}
set2 = set([0, 1, 2, 3, 4, 42])

# union
print(set1 | set2)

# intersección
print(set1 & set2)

# diferencia
print(set1 - set2)
print(set2 - set1)

<img src="img/TiposCompuestos/SetOperations.png" width="500">

In [None]:
# Además de los operadores, que operan únicamente con Sets, también se pueden usar métodos que pueden operar sobre cualquier objeto iterable.
conjunto = {0, 1, 2}
lista = [1, 3, 3]

print(conjunto.union(lista))
print(conjunto.intersection(lista))
print(conjunto.difference(lista))

In [None]:
# Otros métodos: comparación de conjuntos.
set1 = {0, 1, 1, 2, 3, 4, 5, 8, 13, 21}
set2 = set([0, 1, 2, 3, 4])

print(set2.issubset(set1))
print(set1.issuperset(set2))
print(set1.isdisjoint(set2))

In [None]:
# Pertenencia
words = {'calm', 'balm'}
print('calm' in words)

In [None]:
# Los conjuntos no soportan anidamiento, pero como permite elementos inmutables, se pueden "anidar" tuplas.
nested_set = {1, (1, 1, 1), 2, 3}
print(nested_set)

In [None]:
# Modificación de conjuntos.

# A través de operador de asignación

set1 = {'a', 'b', 'c'}
set2 = {'a', 'd'}

set1 |= set2
#set1 &= set2
#set1 -= set2

print(set1)

In [None]:
# Modificación a través de método 'update'.

set1 = {'a', 'b', 'c'}
set2 = {'a', 'd'}

set1.update(set2)
#set1.intersection_update(set2)
#set1.difference_update(set2)

print(set1)

In [None]:
# Modificación a través de métodos 'add' y 'remove'.

set1 = {'a', 'b', 'c'}

set1.add('d')
set1.remove('a')

print(set1)

## Tuplas

Al igual que las listas:

* Colección de elementos.
* Tipos arbitrarios.
* Puede contener duplicados.
* No tienen tamaño fijo. Pueden contener tantos elementos como quepan en memoria.
* Los elementos van ordenados por posición.
* Acceso a través de __[index]__
* Índices van de 0 a n-1, donde n es el número de elementos de la tupla.
* Son *secuencias* donde el orden de los elementos importa.
* Soportan anidamiento.

A diferencia de las listas:

* Se definen por medio de paréntesis.
* Inmutables.

#### ¿Por qué tuplas?

* Representación de una colección fija de elementos (por ejemplo, una fecha).
* Pueden usarse en contextos que requieren inmutabilidad (por ejemplo, como claves de un diccionario).

In [None]:
# Creación de tuplas
tuple1 = ('Foo', 34, 5.0, 34)
print(tuple1)

tuple2 = 1, 2, 3
print(tuple2)

tuple3 = tuple(range(10))
print(tuple3)

tuple4 = tuple([0, 1, 2, 3, 4])
print(tuple4)

#### Operaciones con tuplas

In [None]:
# Número de elementos
print(len(tuple1))

In [None]:
tuple1 = ('Foo', 1, 2, 3)

# Acceso por índice
print(tuple1[0]) # Primer elemento
print(tuple1[len(tuple1)-1]) # Último elemento

print(tuple1[-1]) # Índices negativos comienzan desde el final
print(tuple1[-len(tuple1)]) # primer elemento

In [None]:
# Ojo con las tuplas de un elemento. Los paréntesis se intepretan como indicadores de precedencia de operadores.
singleton_number = (1)
type(singleton_number)

In [None]:
# Creación de tupla de un elemento
singleton_tuple = (1,)
type(singleton_tuple)

In [None]:
# Asignación a tuplas falla
tuple1[0] = 'bar'

In [None]:
# Contar número de ocurrencias
tuple1 = ('Foo',34, 5.0, 34)
print(tuple1.count(34))

In [None]:
# Encontrar el índice de un elemento
tuple1 = ('Foo', 34, 5.0, 34)
indice = tuple1.index(34)
print(indice)
print(tuple1[indice])

In [None]:
# Si el elemento no existe, error
tuple1 = ('Foo', 34, 5.0, 34)
print(tuple1.index(1))

In [None]:
# Desempaquetar una tupla
tuple1 = (1, 2, 3, 4)
a, b, c, d = tuple1
print(a)
print(b)
print(c)
print(d)

In [None]:
a, b, *resto = tuple1
print(a)
print(b)
print(resto)

<img src="img/TiposCompuestos/tuplepacking.png" width="550">

<img src="img/TiposCompuestos/tupleunpacking.png" width="450">

## Para terminar, volvemos a enfatizar un matiz importante ...

> **En Python todo son objetos**

Cada objeto tiene:

* Identidad: Nunca cambia una vez creado. Es como la dirección de memoria. Operador **is** compara identidad, función **id()** devuelve identidad.
* Tipo: determina posibles valores y operaciones. Función **type()** devuelve el tipo. No cambia.
* Valor: que pueden ser *mutables* e *inmutables*.

   * Tipos mutables: list, dictionary, set y tipos definidos por el usuario.
   * Tipos inmutables: int, float, bool, string y tuple.

#### Ejemplos para ilustrar mutabilidad vs inmutabilidad

In [None]:
# Asignación

list_numbers = [1, 2, 3]  # Lista (mutable)
tuple_numbers = (1, 2, 3) # Tupla (inmutable)

print(list_numbers[0])
print(tuple_numbers[0])

list_numbers[0] = 100
#tuple_numbers[0] = 100 

print(list_numbers)
print(tuple_numbers)

In [None]:
# Identidad

list_numbers = [1, 2, 3] 
tuple_numbers = (1, 2, 3)

print('Id list_numbers:  ' + str(id(list_numbers)))
print('Id tuple_numbers: ' + str(id(tuple_numbers)))

list_numbers += [4, 5, 6]  # La lista original se extiende
tuple_numbers += (4, 5, 6) # Se crea un nuevo objeto

print(list_numbers)
print(tuple_numbers)

print('Id list_numbers:  ' + str(id(list_numbers)))
print('Id tuple_numbers: ' + str(id(tuple_numbers)))

In [None]:
# Referencias

list_numbers = [1, 2, 3]
list_numbers_2 = list_numbers  # list_numbers_2 referencia a list_numbers

print('Id list_numbers:  ' + str(id(list_numbers)))
print('Id list_numbers_2:  ' + str(id(list_numbers_2)))

list_numbers.append(4) # Se actualiza list_numbers2 también

print(list_numbers)
print(list_numbers_2)

print('Id list_numbers:  ' + str(id(list_numbers)))
print('Id list_numbers_2:  ' + str(id(list_numbers_2)))

In [None]:
text = "Hola" # Inmutable
text_2 = text  # Referencia

print('Id text:  ' + str(id(text)))
print('Id text_2:  ' + str(id(text_2)))

text += " Mundo"

print(text)
print(text_2)

print('Id text:  ' + str(id(text)))
print('Id text_2:  ' + str(id(text_2)))

In [None]:
teams = ["Team A", "Team B", "Team C"] # Mutable
player = (23, teams) # Inmutable

print(type(player))
print(player)
print(id(player))

teams[2] = "Team J"

print(player)
print(id(player))

## Ejercicios

1. Dada una *lista* con elementos duplicados, escribir un programa que muestre una nueva *lista* con el mismo contenido que la primera pero sin elementos duplicados.

2. Escribe un programa que defina una *tupla* con elementos numéricos, reemplace el valor del último por un valor diferente y muestre la *tupla* por pantalla. Recuerda que las *tuplas* son inmutables. Tendrás que usar objetos intermedios.