# Introducción a Python - Estructuras de datos

En este apartado vamos a revisar las estructuras de datos (colecciones) básicas de Python, sus propiedades y las operaciones básicas que se pueden realizar con y sobre ellos. En concreto, en Python tenemos tres estructuras básicas de datos.

<ul>
<li>Secuencias</li>
<li>Diccionarios</li>
<li>Conjuntos</li>
</ul>


## Secuencias

Una secuencia es un listado unidimensional y ordenado de valores que pueden ser de cualquier tipo, incluso otras estructuras de datos anidadas. Existen tres tipos bien diferenciados

<ul>
<li>Tuplas: listados inmutables.</li>
<li>Listas: listados mutables.</li>
<li>Cadenas de caracteres: inmutables y cuyos elementos son siempre caracteres.</li>
</ul>

Casi todas las operaciones disponibles se pueden aplicar sobre cualquier tipo de secuencia (excepto las que implican modificación que, lógicamente, sólo se pueden aplicar sobre listas).

### Funciones aplicables a todo tipo de secuencias

#### <b>Creación de secuencias</b>

In [1]:
# Tuplas
tuple_1 = (1, 2, 3, 4)

# Listas
list_1 = [1, 2, 3, 4]

# Cadenas
str_1 = "esto es una cadena"

#### <b>Conversión/casting entre tipos de secuencia</b>

In [2]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [3]:
# Lista a tupla
tuple(list_1)

(1, 2, 3, 4)

In [None]:
# Lista a tupla
list(tuple_1)

In [4]:
# Cadena a tupla
tuple(str_1)

('e',
 's',
 't',
 'o',
 ' ',
 'e',
 's',
 ' ',
 'u',
 'n',
 'a',
 ' ',
 'c',
 'a',
 'd',
 'e',
 'n',
 'a')

#### Creación de secuencias anidadas

In [5]:
# Tupla anidada
tuple_1 = (1, 2, (3, 4), [1, 2, 3])
tuple_1

(1, 2, (3, 4), [1, 2, 3])

In [6]:
# Lista anidada
list_1 = [1, 2, 3, [4, 5], "prueba", (1, 2, 3)]
list_1

[1, 2, 3, [4, 5], 'prueba', (1, 2, 3)]

#### Concatenación de secuencias

In [7]:
# Concatenación de tuplas
tuple_1 = (1, 2, 3, 4)
tuple_2 = (5, 6, 7, 8)
tuple_3 = tuple_1 + tuple_2
tuple_3

(1, 2, 3, 4, 5, 6, 7, 8)

In [8]:
# Concatenación de listas
list_1 = [1, 2, 3, 4]
list_2 = [5, 6, 7, 8]
list_3 = list_1 + list_2
list_3

[1, 2, 3, 4, 5, 6, 7, 8]

In [12]:
# Concatenación de candenas
str_1 = "esto es una cadena"
str_2 = "esto es otra cadena"
str_3 = str_1 + str_2
str_3

'esto es una cadenaesto es otra cadena'

#### Multiplicación de secuencias por enteros

In [9]:
# Multiplicación de tuplas
tuple_1 = ("hola", "mundo")
tuple_2 = tuple_1 * 2
tuple_2

('hola', 'mundo', 'hola', 'mundo')

In [10]:
# Multiplicación de listas
list_1 = [1, 2, 3]
list_2 = list_1 * 2
list_2

[1, 2, 3, 1, 2, 3]

In [11]:
# Multipicación de cadenas
str_1 = "prueba"
str_2 = str_1 * 2
str_2

'pruebaprueba'

#### Comprobación de si un elemento existe en la secuencia

In [13]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [14]:
# Elemento en tupla
4 in tuple_1

True

In [15]:
# Elemento no en tupla
5 not in tuple_1

True

In [16]:
# Elemento en lista
4 in list_1

True

In [17]:
# Elemento no en lista
5 not in list_1

True

In [18]:
# Elemento en cadena
"esto" in str_1

True

In [19]:
# Elemento no en cadena
"z" not in str_1

True

#### Acceso a un elemento de la secuencia por posición (índice positivo)

In [20]:
# Indexación positiva en tuplas
tuple_1 = (1, 2, 3, 4)
tuple_1[0]

1

In [21]:
# Indexación positiva en listas
list_1 = [1, 2, 3, 4]
list_1[3]

4

In [22]:
# Indexación positiva en cadenas
str_1 = "esto es una cadena"
str_1[5]

'e'

#### Acceso a un elemento de la secuencia por posición (índice negativo)

In [23]:
# Indexación negativa en tuplas
tuple_1 = (1, 2, 3, 4)
tuple_1[-1]

4

In [24]:
# Indexación negativa en listas
list_1 = [1, 2, 3, 4]
list_1[-3]

2

In [25]:
# Indexación negativa en cadenas
str_1 = "esto es una cadena"
str_1[-5]

'a'

#### Slicing de secuencias

<ul>
<li>Selección de un conjunto ordenado de elementos de una secuencia.</li>
<li>Se realiza mediante la notación secuencia[a:b:c]. Donde:
<ul>
<li>a: Índice del primer elemento a extrar (en base 0). Si se omite se extrae desde el principio de la secuencia.</li>
<li>b: Índice del primero elemento que NO se extrae (en base 0). Si se omite se extrae hasta el final de la secuencia.</li>
<li>c: Tamaño del salto a aplicar en la extracción. Si se omite se asume 1.
</ul>
</ul>

In [26]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [27]:
# Sin parámetros -> Todos los elementos (equivalente a tuple_1)
tuple_1[:]

(1, 2, 3, 4)

In [28]:
# Desde la posición inicial indicada hasta el final
tuple_1[2:]

(3, 4)

In [29]:
# Desde el principio hasa la posición final indicada (no incluida)
list_1[:3]

[1, 2, 3]

In [35]:
# Desde la posición inicial indicada hasta la posición final indicada (no incluida)
list_1[2:3]

[3]

In [31]:
# Desde el prinicpio hasta la posición final indicada (no incluida) con índices negativos
str_1[:-3]

'esto es una cad'

In [40]:
# Desde el principio hasta el final con saltos cada dos elementos
str_1[1::2]

'soe n aea'

In [33]:
# Desde el principio hasta el final con saltos hacia atrás (estructura inversa)
list_1[::-1]

[4, 3, 2, 1]

#### Longitud de secuencias

In [41]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [42]:
# Longitud de una tupla
len(tuple_1)

4

In [43]:
# Longitud de una lista
len(list_1)

4

In [44]:
# Longitud de una cadena
len(str_1)

18

#### Obtención del primer índice de un elemento

In [45]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [46]:
# Posición del primer elemento coincidente en tuplas
tuple_1.index(3)

2

In [47]:
# Posición del primer elemento coincidente en listas
list_1.index(4)

3

In [48]:
# Posición del primer elemento coincidente en cadenas
str_1.index("t")

2

#### Obtención del número de repeticiones de un elemento

In [49]:
tuple_1 = (1, 2, 3, 4)
list_1 = [1, 2, 3, 4]
str_1 = "esto es una cadena"

In [50]:
# Número de veces que se repite el elmento indicado en la tupla
tuple_1.count(1)

1

In [51]:
# Número de veces que se repite el elemento indicado en la lista
list_1.count(1)

1

In [52]:
# Número de veces que se repite el elemento indicado en la cadena
str_1.count("e")

3

#### Extracción de elementos a variables

In [53]:
# Asignación desde secuencia a múltiples variables
tuple_1 = (1, 2, 3, 4)
var_1, var_2, var_3, var_4 = tuple_1

In [54]:
var_1

1

In [55]:
var_2

2

In [56]:
var_3

3

In [57]:
var_4

4

In [58]:
# Asignación "selectiva" desde secuencia a múltiples variables
list_1 = [1, 2, 3, 4]
var_1, _, var_3, _ = list_1

In [59]:
var_1

1

In [60]:
var_3

3

### Funciones aplicables sólo a listas

#### Creación de secuencias numéricas

In [69]:
# Creación de iteradores
range(10)
for a in range(5):
    print(a)

0
1
2
3
4


In [62]:
# Lista a partir de iterador desde 0 hasta el valor indicado (no incluido)
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [63]:
# Lista a partir de iterador desde valor inicial (incluido) hasta valor final (no incluido)
list(range(5, 10))

[5, 6, 7, 8, 9]

In [1]:
# Lista a partir de iterador desde valor inicial (incluido) hasta valor final (no incluido) con saltos específicos
list(range(0, 10, 2))

[0, 2, 4, 6, 8]

#### Adición de elementos a una lista (por el final)

In [2]:
list_1 = ["uno", "dos"]
list_1.append("tres")
list_1

['uno', 'dos', 'tres']

#### Inserción un elemento en una posición específica

In [3]:
list_1 = ["dos", "tres"]
list_1.insert(0, "uno")
list_1

['uno', 'dos', 'tres']

#### Asignación de valor a un slice

In [4]:
# Asignación de iguales dimensiones que el slice
list_1 = [1, 2, 3, 4, 5]
list_1[2:4] = [5, 6]
list_1

[1, 2, 5, 6, 5]

In [5]:
# Asignación de dimensiones distintas al slice
list_1[2:5] = [3, 4]
list_1

[1, 2, 3, 4]

#### Recuperación y eliminación de un elemento en una posición específica

In [6]:
list_1 = [1, 2, 3, 4, 5]

list_1.pop(3)

4

In [7]:
list_1

[1, 2, 3, 5]

#### Eliminación del primer elemento coincidente (no anidado, es decir, sólo primer nivel)

In [10]:
list_1 = [1, 2, 3, [4, 5]]
list_1.remove([4, 5])

In [11]:
list_1

[1, 2, 3]

#### Eliminación de elementos (por posición)

In [12]:
list_1 = [1, 2, 3, 4, 5]
del list_1[2]

In [13]:
list_1

[1, 2, 4, 5]

#### Ordenación de elementos (modificando la lista original)

In [28]:
list_1 = [1, 3, 4, 2, 5]
list_1.sort()

In [29]:
list_1

[1, 2, 3, 4, 5]

In [30]:
list_1.sort(reverse=True)

In [31]:
list_1

[5, 4, 3, 2, 1]

#### Recuperación inversa de elementos (modificando la lista original)

In [32]:
list_1 = [1, 3, 4, 2, 5]
list_1.reverse()

In [33]:
list_1

[5, 2, 4, 3, 1]

### Funciones aplicables únicamente a cadenas

#### Conversión a mayúsculas/minúsculas

In [34]:
str_1 = "esto es una prueba"
str_1.upper()

'ESTO ES UNA PRUEBA'

In [35]:
str_2 = "ESTO ES UNA PRUEBA"
str_2.lower()

'esto es una prueba'

#### Segmentación por carácter

In [36]:
str_1 = "esto es una prueba"
str_1.split(" ")

['esto', 'es', 'una', 'prueba']

#### Reemplazo en cadenas

In [37]:
# Reemplazo global
str_1 = "esto es una prueba una"
str_1.replace("una", "otra")

'esto es otra prueba otra'

In [38]:
# Especificación de número máximo de reemplazos
str_1.replace("una", "otra",1)

'esto es otra prueba una'

## Diccionarios (dict)

Un diccionario es una estructura que:
<ul>
<li>Contiene un listado de pares clave-valor.</li>
<li>También se puede llamar array asociativo o <i>hash map</i>.</li>
<li>Sin orden</li>
<li>Cuyas claves son cadenas de caracteres o valores numéricos.</li>
<li>Cuyos valores son valores o secuencias (anidadas).</li>
</ul>

### Funciones aplicables a diccionarios

#### Creación de un diccionario

In [39]:
# Cadenas como claves
dict_1 = {"clave_1": 1, "clave_2": "prueba"} 
dict_1

{'clave_1': 1, 'clave_2': 'prueba'}

In [40]:
# Valores numéricos como claves
dict_2 = {10:1, 2:2}
dict_2

{10: 1, 2: 2}

#### Creación de diccionarios anidados

In [41]:
dict_1 = {"clave_1": 1, "clave_2": {"clave_21": [1, 2, 3], "clave_22": "prueba"}}
dict_1

{'clave_1': 1, 'clave_2': {'clave_21': [1, 2, 3], 'clave_22': 'prueba'}}

#### Creación de diccionarios desde listas clave-valor

In [42]:
list_1 = [("uno", 1), ("dos", 2), ("tres", 3), ("cuatro", 4), ("cinco", 5)]
dict_1 = dict(list_1)
dict_1

{'uno': 1, 'dos': 2, 'tres': 3, 'cuatro': 4, 'cinco': 5}

#### Unión de dos diccionarios

In [43]:
dict_1 = {"clave_1": 1, "clave_2": 2}
dict_2 = {"clave_2": 3, "clave_4": 4}
dict_1.update(dict_2)  
dict_1

{'clave_1': 1, 'clave_2': 3, 'clave_4': 4}

#### Inserción (o modificación) de un elemento del diccionario por clave

In [46]:
dict_1 = {"clave_1": 1, "clave_2": 2}
dict_1["clave_3"] = "prueba"
dict_1["clave_1"] = 50
dict_1

{'clave_1': 50, 'clave_2': 2, 'clave_3': 'prueba'}

#### Recuperación y eliminación de un elemento de una clave específica

In [47]:
dict_1 = {"clave_1": 1, "clave_2": "prueba"}
dict_1.pop("clave_2")

'prueba'

In [48]:
dict_1

{'clave_1': 1}

#### Comprobación de si un elemento existe en el diccionario

In [49]:
dict_1 = {"clave_1": 1, "clave_2": "prueba"}
"clave_1" in dict_1

True

In [50]:
1 in dict_1

False

#### Eliminación de un elemento de un diccionario

In [51]:
dict_1 = {"clave_1": 1, "clave_2": "prueba"}
del dict_1["clave_1"]

In [52]:
dict_1

{'clave_2': 'prueba'}

#### Eliminación de todos los elementos de un diccionario

In [53]:
dict_1 = {"clave_1": 1, "clave_2": "prueba"}
dict_1.clear()
dict_1

{}

#### Acceso a un elemento por clave

In [54]:
dict_1 = {"clave_1": 1, "clave_2": "prueba"}
dict_1["clave_1"]

1

#### Recuperación de elementos como una lista

In [59]:
dict_1 = {"clave_1": 1, "clave_2": 2, "clave_3": 3}

In [63]:
for el in dict_1.items():
    print(el)
list(dict_1.items())

('clave_1', 1)
('clave_2', 2)
('clave_3', 3)


[('clave_1', 1), ('clave_2', 2), ('clave_3', 3)]

#### Recuperación de claves como una lista

In [64]:
dict_1 = {"clave_1": 1, "clave_2": 2, "clave_3": 3}
list(dict_1.keys())

['clave_1', 'clave_2', 'clave_3']

#### Recuperación de valores como una lista

In [65]:
dict_1 = {"clave_1": 1, "clave_2": 2, "clave_3": 3}
list(dict_1.values())

[1, 2, 3]

## Conjuntos (set)

Un conjunto es una secuencia:
<ul>
<li>Unidimensional (de un único nivel)</li>
<li>Mutable</li>
<li>De tamaño variable (al ser mutable es obvio)</li>
<li>Desordenada</li>
<li>Cuyos elementos son valores o secuencias</li>
<li>Cuyos elementos son únicos</li>
</ul>

### Funciones aplicables a conjuntos

#### Cración de un conjunto

In [67]:
set_1 = {1, 2, 3, 4, 1}
set_1

{1, 2, 3, 4}

#### Conversión/casting a conjunto

In [None]:
hlist_1 = [1, 2, 3, 4, 5]
set_1 = set(list_1)
type(set_1)

#### Unión de conjuntos

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {3, 4, 5, 6, 7}
set_1 | set_2

#### Intersección de conjuntos

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {3, 4, 5, 6, 7}
set_1 & set_2

#### Diferencia de conjuntos

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {3, 4, 5, 6, 7}
set_1 - set_2

In [None]:
set_2 - set_1

#### Diferencia simétrica de conjuntos

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {3, 4, 5, 6, 7}
set_1 ^ set_2

In [None]:
set_2 ^ set_1

#### Inserción de elementos en un conjunto

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_1.add(6)
set_1

#### Comprobación de existencia de un elemento en el conjunto

In [None]:
set_1 = {1, 2, 3, 4, 5}
3 in set_1

#### Comprobación de subconjunto

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {1, 2, 3}
set_1 >= set_2

#### Comprobación de superconjunto

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_2 = {1, 2, 3}
set_2 <= set_1

#### Eliminación de un elemento de un conjunto por valor

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_1.remove(5)
set_1

In [None]:
set_1.discard(6)
set_1

#### Eliminación de todos los elementos de un conjunto

In [None]:
set_1 = {1, 2, 3, 4, 5}
set_1.clear()
set_1