<a href="https://colab.research.google.com/github/LinaMariaCastro/2025-segundo-semestre-ia-economia/blob/main/clases/2_Programacion_en_Python/5_Conjuntos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Inteligencia Artificial con Aplicaciones en Economía I**

- 👩‍🏫 **Profesora:** [Lina María Castro](https://www.linkedin.com/in/lina-maria-castro)  
- 📧 **Email:** [lmcastroco@gmail.com](mailto:lmcastroco@gmail.com)  
- 🎓 **Universidad:** Universidad Externado de Colombia - Facultad de Economía

# **Conjuntos o sets** (no secuencial / mutable)

Es una colección de elementos distintos. A diferencia de otras estructuras como las listas, tuplas y colas, los conjuntos son no secuenciales, lo que significa que no hay un orden definido entre ellos. La siguiente característica importante es que sus elementos se almacenan una sola vez y no están duplicados.

Para escribir conjuntos se utiliza { }.

Se utiliza la instrucción "set" para convertir una lista en cojunto. El conjunto toma los valores únicos de la lista (si hay elementos repetidos deja solo uno).

In [None]:
a = {1,2,3}
a

{1, 2, 3}

In [None]:
# El conjunto no tiene valores repetidos
b = {1,2,3,1,2,1,2,3,3,3,3,2,2,2,1,1,2}
print(b)

{1, 2, 3}


In [None]:
# Con set se saca un conjunto con los valores únicos de una lista. Los deja en orden.
c = set([1, 1, 1, 2, 2, 6, 6, 2, 8, 1, 3])
c

{1, 2, 3, 6, 8}

In [None]:
# Se puede convertir un conjunto en una tupla (secuencial e inmutable)
t = tuple(c)
t

(1, 2, 3, 6, 8)

In [None]:
# Crear un conjunto vacío
conjunto = set()
print(conjunto)

set()


In [None]:
# Puede tener múltiples tipos de objetos
conj = {15, ('Arica', 9), 'Mayo'}
print(conj)

{'Mayo', ('Arica', 9), 15}


Los conjuntos no mantienen una relación de orden dentro de sus elementos, por lo que al darle "print" pueden aparecer en distinto orden a como lo escribimos.

# Operaciones sobre conjuntos

In [None]:
mezcla={'Chile', 8, 4.15, 'Abril', (3,5), '2022', 'MOOC'}

## ¿Cuántos elementos hay en el conjunto?

In [None]:
largo=len(mezcla)
print(largo)

7


## ¿Se encuentra el elemento x en el cojunto?

Para saber si el elementos hace parte del conjunto se utiliza la instrucción "in":

In [None]:
print('Abril' in mezcla)

True


In [None]:
# Se almacenó 4.15 y no 4.151
print(4.151 in mezcla)

False


In [None]:
print((3,5) in mezcla)

True


In [None]:
# 2022 se almacenó como un string y no como un entero, por eso no lo encuentra
print(2022 in mezcla)

False


In [None]:
print("2022" in mezcla)

True


## Para recorrer conjuntos

In [None]:
for elemento in mezcla:
    print(elemento)

MOOC
4.15
Abril
8
2022
Chile
(3, 5)


## Modificar un conjunto

### Agregar elementos

In [None]:
# Para añadir un elemento al conjunto s
s = {1, 2, 3}
s.add(5)
s

{1, 2, 3, 5}

In [None]:
s.add(4)
s

{1, 2, 3, 4, 5}

In [None]:
opciones={'Si','No'}
print(opciones)

{'Si', 'No'}


In [None]:
opciones.add('No sé')
print(opciones)

{'Si', 'No sé', 'No'}


In [None]:
opciones.add('Quizás')
print(opciones)

{'Quizás', 'Si', 'No sé', 'No'}


IMPORTANTE: En los conjuntos solo podemos agregar tipos de datos tales como los strings, los enteros, los float y las tuplas. Los tipos de datos mutables, como las listas y diccionarios, no se pueden agregar a conjuntos.

In [None]:
conjunto=set()
conjunto.add(60.5)
conjunto.add('Lisa')
conjunto.add((1,2))
print(conjunto)

{'Lisa', (1, 2), 60.5}


In [None]:
conjunto.add([3,4])

TypeError: unhashable type: 'list'

In [None]:
conjunto.add({"name":"oscar"})

TypeError: unhashable type: 'dict'

### Sacar elementos

Se utiliza remove o discard. Sin embargo, si se utiliza remove y el elemento no existe se genera un error. En cambio, con discard, no se genera error si el elemento no existe.

In [None]:
cuando={'mañana','pasado','hoy'}
print(cuando)

{'mañana', 'hoy', 'pasado'}


In [None]:
cuando.remove('pasado')
print(cuando)

{'mañana', 'hoy'}


In [None]:
cuando.remove('ayer')
print(cuando)

KeyError: 'ayer'

In [None]:
cuando={'mañana','pasado','hoy'}
print(cuando)

{'mañana', 'hoy', 'pasado'}


In [None]:
cuando.discard('pasado')
print(cuando)

{'mañana', 'hoy'}


In [None]:
cuando.discard('ayer')
print(cuando)

{'mañana', 'hoy'}


No se generó error al no encontrar 'ayer'.

## Unión de conjuntos

Se puede hacer de 2 formas, con | o union. Incluye los elementos de ambos conjuntos y si hay elementos que se repiten, solo deja uno solo.

In [None]:
otoño = {'marzo','abril'}
invierno = {'abril','junio'}

In [None]:
oterno = otoño|invierno
print(oterno)

{'marzo', 'abril', 'junio'}


In [None]:
oterno2 = otoño.union(invierno)
print(oterno2)

{'marzo', 'abril', 'junio'}


## Intersección de conjuntos

Se puede hacer de dos formas: con & o intersection. Arroja los elementos en común de ambos conjuntos sin repeticiones.

In [None]:
solsticio = otoño & invierno
print(solsticio)

{'abril'}


In [None]:
solsticio2 = otoño.intersection(invierno)
print(solsticio2)

{'abril'}


## Diferencia de conjuntos

Se puede hacer con Difference o -. Arroja los elementos que se encuentran en el primer conjunto, pero no se encuentran en el segundo conjunto.

In [None]:
solotoño = otoño - invierno
print(solotoño)

{'marzo'}


In [None]:
solotoño2 = otoño.difference(invierno)
print(solotoño2)

{'marzo'}


## Diferencia simétrica de conjuntos

Se puede hacer con symmetric_difference o ^. Entrega los elementos de ambos conjuntos que no se encuentran en la intersección.

In [None]:
# Acá entrega marzo y junio, pero no abril porque abril está en ambos conjuntos.
puros = otoño ^ invierno
print(puros)

{'marzo', 'junio'}


In [None]:
puros2 = otoño.symmetric_difference(invierno)
print(puros2)

{'marzo', 'junio'}


# Tutorial: Cómo resolver ejercicios usando sets en Python

## Ejercicio 1

In [None]:
# Estas listas indican plantas disponibles para cada época de sembrado
verano = ['acelga','apio','espinaca','repollo','lechuga']
otoño = ['acelga','ajo','apio','cebolla','lechuga','papa']
invierno = ['pimentón','acelga','ají','espinaca','lechuga']
primavera = ['albahaca','acelga','cebolla','lechuga','tomate']


### 1. ¿Cuántas plantas distintas hay?

Convertimos las listas en conjuntos y utilizamos la unión

In [None]:
verano=set(['acelga','apio','espinaca','repollo','lechuga'])
otoño=set(['acelga','ajo','apio','cebolla','lechuga','papa'])
invierno=set(['pimentón','acelga','ají','espinaca','lechuga'])
primavera=set(['albahaca','acelga','cebolla','lechuga','tomate'])

In [None]:
print(verano)
print(otoño)
print(invierno)
print(primavera)

{'repollo', 'apio', 'lechuga', 'acelga', 'espinaca'}
{'papa', 'ajo', 'lechuga', 'acelga', 'apio', 'cebolla'}
{'pimentón', 'lechuga', 'ají', 'acelga', 'espinaca'}
{'lechuga', 'tomate', 'albahaca', 'acelga', 'cebolla'}


In [None]:
plantas = verano | otoño | invierno | primavera
print(plantas)
print(len(plantas))

{'repollo', 'apio', 'papa', 'ajo', 'pimentón', 'lechuga', 'tomate', 'ají', 'albahaca', 'acelga', 'espinaca', 'cebolla'}
12


### 2. ¿Qué plantas se pueden sembrar todo el año?

Utilizamos interseccion

In [None]:
todoelaño = verano & otoño & invierno & primavera
print(todoelaño)

{'acelga', 'lechuga'}


### 3. ¿Qué plantas son exclusivas de primavera y verano?

Se dan solo en verano o primavera, pero no se dan ni en otoño ni en invierno

In [None]:
priver = (verano | primavera) - otoño - invierno
print(priver)

{'albahaca', 'repollo', 'tomate'}


## Ejercicio 2

In [None]:
texto = 'El amor es un mejor profesor que el deber. Información no es conocimiento. Nunca pierdas la sagrada curiosidad. Si no puedes explicarlo en forma simple, no lo entiendes lo suficientemente bien. Todos deben ser respetados como individuos, pero no idolatrados.'
texto

'El amor es un mejor profesor que el deber. Información no es conocimiento. Nunca pierdas la sagrada curiosidad. Si no puedes explicarlo en forma simple, no lo entiendes lo suficientemente bien. Todos deben ser respetados como individuos, pero no idolatrados.'

### ¿Cuántas palabras distintas se usan en este texto?

Primero, pasamos todo a minúsculas, luego quitamos puntos y comas y los reemplazamos por vacío, y luego dividimos cada palabra utilizando los espacios para saber que se trata de palabras diferentes (split()).

In [None]:
lista_de_palabras=texto.lower().replace(".","").replace(",","").split()
print(lista_de_palabras)

['el', 'amor', 'es', 'un', 'mejor', 'profesor', 'que', 'el', 'deber', 'información', 'no', 'es', 'conocimiento', 'nunca', 'pierdas', 'la', 'sagrada', 'curiosidad', 'si', 'no', 'puedes', 'explicarlo', 'en', 'forma', 'simple', 'no', 'lo', 'entiendes', 'lo', 'suficientemente', 'bien', 'todos', 'deben', 'ser', 'respetados', 'como', 'individuos', 'pero', 'no', 'idolatrados']


In [None]:
# Para saber cuántas palabras hay en la lista
print(len(lista_de_palabras))

40


Si convertimos la lista de palabras en un conjunto, podemos saber cuáles son las palabras únicas (que no se repiten).

In [None]:
conjunto_de_palabras=set(lista_de_palabras)
print(conjunto_de_palabras)
print(len(conjunto_de_palabras))

{'bien', 'conocimiento', 'puedes', 'en', 'individuos', 'nunca', 'todos', 'mejor', 'sagrada', 'deben', 'pero', 'el', 'respetados', 'un', 'forma', 'si', 'que', 'lo', 'deber', 'no', 'como', 'suficientemente', 'idolatrados', 'explicarlo', 'amor', 'profesor', 'es', 'ser', 'entiendes', 'información', 'curiosidad', 'pierdas', 'la', 'simple'}
34


## Ejercicio 3

Vamos a hacer un experimento para saber qué es más rápido para buscar, una lista o un conjunto.

In [None]:
# Importamos la librería time que nos ayudará a medir el tiempo de ejecución
from time import time

In [None]:
ELEMENTOS = 10**7 #10^7 son 10.000.000
ELEMENTO_A_BUSCAR = ELEMENTOS//2 # Buscar elemento del medio
lista_gigante = list(range(ELEMENTOS)) # Lista de 10 millones de enteros
set_gigante = set(range(ELEMENTOS)) # Conjunto de 10 millones de enteros

In [None]:
lista_gigante

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 51,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 59,
 60,
 61,
 62,
 63,
 64,
 65,
 66,
 67,
 68,
 69,
 70,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 82,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 97,
 98,
 99,
 100,
 101,
 102,
 103,
 104,
 105,
 106,
 107,
 108,
 109,
 110,
 111,
 112,
 113,
 114,
 115,
 116,
 117,
 118,
 119,
 120,
 121,
 122,
 123,
 124,
 125,
 126,
 127,
 128,
 129,
 130,
 131,
 132,
 133,
 134,
 135,
 136,
 137,
 138,
 139,
 140,
 141,
 142,
 143,
 144,
 145,
 146,
 147,
 148,
 149,
 150,
 151,
 152,
 153,
 154,
 155,
 156,
 157,
 158,
 159,
 160,
 161,
 162,
 163,
 164,
 165,
 166,
 167,
 168,
 169,
 170,
 171,
 172,
 173,
 174,
 175,
 176,
 177,
 178,
 179,
 180,
 181,
 182,
 183,
 184,


In [None]:
ELEMENTO_A_BUSCAR

5000000

In [None]:
tiempo_inicio = time()
ELEMENTO_A_BUSCAR in set_gigante
tiempo_termino = time()
tiempo_set = tiempo_termino - tiempo_inicio
print(f"Tiempo de búsqueda en set: {tiempo_set:.6f} segs") # Imprimir un float con máximo 6 decimales

Tiempo de búsqueda en set: 0.000100 segs


In [None]:
tiempo_inicio = time()
ELEMENTO_A_BUSCAR in lista_gigante
tiempo_termino = time()
tiempo_lista = tiempo_termino - tiempo_inicio
print(f"Tiempo de búsqueda en lista: {tiempo_lista:.6f} segs")

Tiempo de búsqueda en lista: 0.064297 segs
