[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/CamiloVga/Curso-IA-Aplicada/blob/main/Semana%201_Intro%20a%20la%20IA/Script_Lab_1_Conceptos_b%C3%A1sicos_de_Python.ipynb)

# 🤖 Inteligencia Artificial Aplicada para la Economía
## Universidad de los Andes

### 👨‍🏫 Profesores
- **Profesor Magistral:** [Camilo Vega Barbosa](https://www.linkedin.com/in/camilo-vega-169084b1/)
- **Asistente de Docencia:** [Sergio Julian Zona Moreno](https://www.linkedin.com/in/sergio-julian-zona-moreno/)

## 📊 Introducción a Python

Este cuadernillo está diseñado como una introducción básica a Python y su aplicación en la programación, dirigido especialmente a estudiantes interesados en inteligencia artificial y economía. Proporciona una base sólida en los conceptos fundamentales de Python, incluyendo variables, ciclos, booleanos y funciones, así como una visión general del concepto de complejidad algorítmica. A través de ejemplos prácticos y explicaciones claras, este cuadernillo busca facilitar el aprendizaje de las herramientas necesarias para el análisis de datos y el desarrollo de modelos predictivos en un contexto económico.

### 🎯 Objetivos

1. **Entender los conceptos básicos de Python**: Aprender a usar variables, tipos de datos, ciclos, condicionales, booleanos y funciones.
2. **Aplicar estructuras de control**: Desarrollar habilidades para implementar ciclos y estructuras condicionales en la solución de problemas.
3. **Explorar estructuras de datos**: Conocer las principales estructuras de datos en Python y sus aplicaciones prácticas.
4. **Introducir el concepto de complejidad algorítmica**: Comprender cómo la eficiencia de un algoritmo afecta el rendimiento del código.
5. **Familiarizarse con librerías comunes**: Usar herramientas clave como `numpy`, `matplotlib` y `pandas` para manejar datos y visualizar resultados.
6. **Prepararse para aplicaciones avanzadas**: Sentar las bases para el aprendizaje de técnicas más complejas como machine learning.

### 🛠️ Requisitos de Software

- **Python**: Versión 3.8 o superior.
- **Editor recomendado**: Jupyter Notebook, Google Colab o cualquier IDE que soporte cuadernillos de Python.
- **Bibliotecas necesarias**: `numpy`, `matplotlib`, `pandas`.

### 💻 Requisitos Técnicos

- **Entorno de Ejecución**:
  - CPU básica suficiente, ya que se usarán conceptos introductorios.
- **Memoria RAM**: 2 GB mínimo (la mayoría de las máquinas actuales cumplen este requisito).
- **Espacio en Disco**: ~500 MB para instalar Python y bibliotecas necesarias.

### 📝 Temas del Cuadernillo

1. **Introducción a Python**:
   - Variables y tipos de datos.
   - Operadores básicos.
   - **Casting de Variables**: Convertir entre tipos de datos como `int()`, `str()`, `float()`.

2. **Condicionales y Booleanos**:
   - **Condicionales**: (`if`, `else`, `elif`).
   - **Booleanos y Lógica**:
     - Operadores lógicos (`and`, `or`, `not`).
     - Expresiones booleanas.

3. **Funciones**:
   - Definición y uso de funciones.
   - Parámetros y retorno de valores.

4. **Estructuras de Datos**:
   - **Listas**: Creación, acceso y manipulación (CRUD).
   - **Tuplas**: Uso y diferencia frente a listas.
   - **Diccionarios**: Almacenamiento y acceso a datos clave-valor.
   - **Conjuntos (sets)**: Concepto y operaciones.

5. **Ciclos y Complejidad**:
   - **Ciclos**: (`for`, `while`).
   - **Complejidad Algorítmica**:
     - Introducción al análisis de algoritmos.
     - Conceptos de tiempo y espacio computacional.

6. **Librerías**:
   - **`numpy`**: Para cálculos numéricos eficientes.
   - **`pandas`**: Manejo y análisis de datos estructurados.
   - **`matplotlib`**: Visualización de datos.

### 📚 Recursos de Apoyo

1. **Documentación oficial de Python**: [https://docs.python.org/3/](https://docs.python.org/3/)
2. **Google Colab**: [https://colab.research.google.com/](https://colab.research.google.com/)
3. **PyReadiness:** [https://pyreadiness.org/3.12/](https://pyreadiness.org/3.12/)
4. **Python Index Package:** [https://pypi.org/](https://pypi.org/)

## 1. Introducción a Python:

### **¿Qué es Python?**

Python (1991) es un lenguaje de **alto nivel** de programación **interpretado** cuya filosofía hace hincapié en la legibilidad de su código, se utiliza para desarrollar aplicaciones de todo tipo, por ejemplo: Instagram, Netflix, Spotify, Panda3D, entre otros. Se trata de un lenguaje de programación **multiparadigma**, ya que soporta parcialmente la **orientación a objetos**, programación **imperativa** y, en menor medida, **programación funcional**. Es un lenguaje **interpretado**, dinámico (**dinámicamente tipado**) y **multiplataforma**. [Wikipedia](https://es.wikipedia.org/wiki/Python).

In [36]:
!python --version

Python 3.11.4


### **Conceptos básicos**

**¿Qué es una variable?**

Una variable es un lugar donde almacenaremos información, ¿qué información? Depende del tipo de datos que la variable contenga. Las variables nos permiten guardar datos en la memoria del programa para utilizarlos o procesarlos posteriormente.

**Tipos de datos de variables:**

Para efectos prácticos, podemos simplificar los tipos de datos en:
- **String**: Representa texto (por ejemplo, `"Hola, mundo!"`).
- **Int/Float**: Representa números enteros y decimales, respetivamente (por ejemplo, `42`).
- **Boolean**: Representa valores verdaderos o falsos (por ejemplo, `True` o `False`).

In [1]:
# Declaración de variables
a = "Hola esto es una variable"
b = 3
c = True # False
d = None

In [2]:
# Para verificar el tipo de una variable podemos utilizar el comando type()
type(a)

str

In [3]:
type(b)

int

In [4]:
type(c)

bool

In [5]:
type(None)

NoneType

En Python me interesa constantemente conocer los valores de una variable. Para ello puedo utilizar la función print() propia de Python.

In [6]:
print(a)
print(b)
print(c)

Hola esto es una variable
3
True


In [7]:
# Python funciona como una consola, todo lo que le ingresemos lo interpreta y ejecuta.
2+2

4

### **Casting de variables:**

Normalmente quiero cambiar el tipo de una variable a otro tipo. ¿Por qué? Porque ciertas funciones de Python solo reciben algunos tipos específicos de datos (sean numéricos, texto, etc.)

In [8]:
# Convertir un número a texto
numero = 5
print(type(numero))
numero_a_texto = str(numero)
print(type(numero_a_texto))

<class 'int'>
<class 'str'>


In [9]:
# Convertir un texto a número
texto = "5"
print(type(texto))
texto_a_numero = int(texto)
print(type(texto_a_numero))

<class 'str'>
<class 'int'>


In [10]:
# Convertir número a booleano
numero = 1
print(type(numero))
numero_a_booleano = bool(numero)
print(type(numero_a_booleano))
numero_a_booleano

<class 'int'>
<class 'bool'>


True

### **Operadores básicos:**

En Python me interesa hacer operaciones con números. Aquí están las más comúnes.

In [11]:
a = 5
b = 3

In [12]:
# Operaciones
# Suma
print("Suma: " + str(a+b))

# Resta
print("Resta: " + str(a-b))

# Multiplicacion
print("Multiplicacion: " + str(a*b))

# Division
print("Division: " + str(a/b)) # Division decimal
print("Division (entera): "+ str(a//b)) # Division parte entera

# Potencias
print("Potencia: "+ str(a**b))

# Modulo
print("Modulo: " + str(a%b))

Suma: 8
Resta: 2
Multiplicacion: 15
Division: 1.6666666666666667
Division (entera): 1
Potencia: 125
Modulo: 2


## 2. Condicionales y Booleanos:

### **Operadores Booleanos en Python**

Los operadores booleanos nos permiten trabajar con valores lógicos (`True` o `False`) para realizar comparaciones o condiciones. Estos son algunos operadores comunes:

- **AND (`and`)**: Devuelve `True` si ambas condiciones son verdaderas.
- **OR (`or`)**: Devuelve `True` si al menos una de las condiciones es verdadera.
- **NOT (`not`)**: Invierte el valor lógico, convirtiendo `True` en `False` y viceversa.

💡 **Dato curioso**: Estos operadores se basan en el álgebra booleana, desarrollada por el matemático inglés [George Boole en 1847](https://es.wikipedia.org/wiki/Álgebra_de_Boole).

Recordemos las **tablas de verdad**.

![Tablas de verdad](../assets/Script_Lab_1//tablas_de_verdad.jpg)

Imagen de referencia: [Platzi](https://platzi.com/home/clases/3221-pensamiento-logico/50677-operadores-logicos/)

In [13]:
# Operadores booleanos
a = True
b = False

and_operation = a and b
or_operation = a or b
not_operation = not a

print("AND Operation:", and_operation)
print("OR Operation:", or_operation)
print("NOT Operation:", not_operation)

AND Operation: False
OR Operation: True
NOT Operation: False


### **Operadores Relacionales en Python**

Los operadores relacionales, también conocidos como operadores de comparación, se utilizan para evaluar la relación entre dos valores. El resultado de estas comparaciones es un valor booleano: `True` si la relación es verdadera, o `False` si es falsa.

**Principales Operadores Relacionales:**

- **Igual que (`==`)**: Verifica si dos valores son iguales.
- **Distinto de (`!=`)**: Verifica si dos valores son diferentes.
- **Mayor que (`>`)**: Verifica si el valor de la izquierda es mayor que el de la derecha.
- **Menor que (`<`)**: Verifica si el valor de la izquierda es menor que el de la derecha.
- **Mayor o igual que (`>=`)**: Verifica si el valor de la izquierda es mayor o igual que el de la derecha.
- **Menor o igual que (`<=`)**: Verifica si el valor de la izquierda es menor o igual que el de la derecha.


In [14]:
# Definimos dos variables
a = 10
b = 5

# Igual que
print("a == b:", a == b)  # False

# Diferente de
print("a != b:", a != b)  # True

# Mayor que
print("a > b:", a > b)    # True

# Menor que
print("a < b:", a < b)    # False

# Mayor o igual que
print("a >= b:", a >= b)  # True

# Menor o igual que
print("a <= b:", a <= b)  # False

a == b: False
a != b: True
a > b: True
a < b: False
a >= b: True
a <= b: False


In [16]:
# Comparación de cadenas
cadena1 = "Hola"
cadena2 = "Adiós"
print("cadena1 == cadena2:", cadena1 == cadena2)  # False
print("cadena1 != cadena2:", cadena1 != cadena2)  # True

# Comparación de listas - Más abajo en el cuadernillo se explican las listas
lista1 = [1, 2, 3]
lista2 = [1, 2, 3]
print("lista1 == lista2:", lista1 == lista2)  # True
print("lista1 != lista2:", lista1 != lista2)  # False

cadena1 == cadena2: False
cadena1 != cadena2: True
lista1 == lista2: True
lista1 != lista2: False


### **Sentencias Condicionales en Python**

En programación, las **sentencias condicionales** permiten que un programa tome decisiones basadas en ciertas condiciones, ejecutando diferentes bloques de código según si estas condiciones se evalúan como verdaderas (`True`) o falsas (`False`). En Python, las principales sentencias condicionales son `if`, `elif` y `else`.

**1. Sentencia `if`**
La sentencia `if` evalúa una condición. Si la condición es verdadera (`True`), se ejecuta el bloque de código asociado.


**2. Sentencia `else`**
La sentencia else define un bloque de código que se ejecutará si la condición evaluada en el if es falsa (`False`). Siempre debe ir acompañada de un if.

**3. Sentencia `else`**
La sentencia elif, abreviatura de `else if`, se utiliza para verificar múltiples condiciones. Si la condición del if es falsa, se evalúan las condiciones del elif en orden. Se puede usar tantas veces como sea necesario.

¡Les presentamos a Pingüi!

<img src="../assets/Script_Lab_1/ping.jpeg" alt="Ping" width=20%>

In [17]:
# Definimos las variables para la historia de Pingüi
ping_se_paso_de_copas = True
ping_es_mayor_de_edad = False  # No es mayor de edad
ping_tiene_licencia = False  # No tiene licencia de conducir

# Condicional para determinar qué sucede con Pingüi
if ping_se_paso_de_copas:
    if ping_es_mayor_de_edad and ping_tiene_licencia:
        print("¡Pingüi se pasó de copas y se puso a conducir! 🚗🥑")
        print("Es mayor de edad y tiene licencia, así que lo llevan a la cárcel y le quitan la licencia. 🚔🚫")
    elif ping_es_mayor_de_edad and not ping_tiene_licencia:
        print("¡Pingüi se pasó de copas y se puso a conducir! 🚗🥑")
        print("Es mayor de edad pero no tiene licencia, lo llevan a la cárcel. 🚔")
    elif not ping_es_mayor_de_edad and ping_tiene_licencia:
        print("¡Pingüi se pasó de copas y se puso a conducir! 🚗🥑")
        print("No es mayor de edad pero tiene licencia, le quitan la licencia y llaman a sus padres. 🚫📞")
    else:
        print("¡Pingüi se pasó de copas y se puso a conducir! 🚗🥑")
        print("No es mayor de edad y no tiene licencia, lo llevan a la cárcel y llaman a sus padres. 🚔📞")
else:
    print("Pingüi es responsable y no se pasó de copas. ¡Está a salvo! 🥑👍")

# Moraleja: sean responsables. No sean como Pingüi.

¡Pingüi se pasó de copas y se puso a conducir! 🚗🥑
No es mayor de edad y no tiene licencia, lo llevan a la cárcel y llaman a sus padres. 🚔📞


## 3. Funciones

### **¿Qué es una función?**

En Python, una **función** es un bloque de código reutilizable que realiza una tarea específica. Las funciones permiten organizar el código, hacerlo más legible y reducir la repetición de instrucciones al ejecutar tareas similares.

### **¿Por qué usar funciones?**

1. **Reutilización de código**: Puedes llamar una función varias veces en diferentes partes del programa.
2. **Legibilidad**: Facilitan entender el propósito de diferentes secciones del código.
3. **Modularidad**: Dividen un programa en partes más manejables y fáciles de depurar.

### **Definición de una Función**

Para definir una función en Python, se utiliza la palabra clave `def`, seguida del nombre de la función y paréntesis. Dentro de los paréntesis puedes especificar **parámetros** si la función necesita recibir datos.

In [18]:
# Función que tiene salida
def sumar_dos_numeros_salida(x, y):
  # Salida
  return x+y

sumar_dos_numeros_salida(13,-4)

9

In [19]:
# Función sin salida
def sumar_dos_numeros(x, y):
  # Sin salida
  suma = x+y

a = sumar_dos_numeros(13,-4)
print(a)

None


In [20]:
# Función tipada con retorno
def sumar_dos_numeros_tipada(x: int, y: int) -> int:
    return x + y  

a = sumar_dos_numeros_tipada(13, -4)
print(a) 

9


In [None]:
# Función tipada con retorno
def sumar_dos_numeros_tipada(x: int, y: int) -> int:
    return x + y  

a = sumar_dos_numeros_tipada("13", -4) # Dará error del tipo - TypeError: can only concatenate str (not "int") to str
print(a) 

In [22]:
# Función: Determinar el equilibrio en un mercado básico de oferta y demanda
def equilibrio_mercado(precio, oferta, demanda):
    """
    Determina el estado del mercado según la oferta y la demanda.
    
    Parámetros:
    - precio (float): Precio actual del bien.
    - oferta (int): Cantidad ofrecida en el mercado.
    - demanda (int): Cantidad demandada en el mercado.
    
    Retorno:
    - str: Mensaje sobre el estado del mercado.
    """
    
    excedente = "Excedente: la oferta es mayor que la demanda."
    escasez = "Escasez: la demanda es mayor que la oferta."
    equilibrio = "Equilibrio: la oferta y la demanda están balanceadas."
    
    if oferta > demanda:
        return f"{excedente} Baja el precio para ajustar. Precio actual: {precio}"
    elif oferta < demanda:
        return f"{escasez} Sube el precio para ajustar. Precio actual: {precio}"
    else:
        return f"{equilibrio} Precio de equilibrio: {precio}"

# Probamos la función
precio_actual = 100
oferta_actual = 120
demanda_actual = 100

estado_mercado = equilibrio_mercado(precio_actual, oferta_actual, demanda_actual)
print(estado_mercado)

Excedente: la oferta es mayor que la demanda. Baja el precio para ajustar. Precio actual: 100


## **4. Estructuras de datos**


<img src="../assets/Script_Lab_1/importante.png" alt="Importante" width="200">

**Definición simple:** 

Las estructuras de datos son **cajas**, algunas más **complejas**, otras más sencillas y nos permiten almacenar cosas. ¿Por qué queremos almacenar cosas? Para poder utilizarlas en el **futuro**.

**¿Para qué nos sirve el álgebra?:**

<img src="../assets/Script_Lab_1/álgebra.png" alt="Álgebra" width=80%>


#### **CRUD: Create, Read, Update, Delete**

**CRUD** es un acrónimo que representa las cuatro operaciones básicas que realizamos sobre datos:

1. **Create (Crear)**: Insertar nuevos datos.
2. **Read (Leer)**: Acceder a los datos almacenados.
3. **Update (Actualizar)**: Modificar datos existentes.
4. **Delete (Eliminar)**: Borrar datos.

Estas operaciones CRUD se aplican directamente sobre **estructuras de datos**, como listas, diccionarios o bases de datos. Para trabajar con estas operaciones, es fundamental aprender la **sintaxis** correspondiente en Python.

<img src="../assets/Script_Lab_1/CRUD.webp" alt="CRUD" width=80%>

#### **Estructuras en Python**

En Python, se utilizan comúnmente las siguientes estructuras de datos:

1. **Variables**:
   - Almacenan un valor único.

2. **Listas (Arrays o Vectores)**:
   - Almacenan una colección ordenada de elementos, que pueden ser de tipos diferentes. Son dinámicas y permiten modificaciones.
   - 🔑 Una matriz es una lista de listas.
   

3. **Diccionarios (Tablas Hash)**:
   - Almacenan pares clave-valor, permitiendo un acceso rápido a los valores a través de sus claves. Detalles de tablas de hash [aquí](https://es.wikipedia.org/wiki/Tabla_hash).
   - 🔑 Son muy utilizadas en librerías y son muy eficientes.

4. **Tuplas**:
   - Similares a las listas, pero son **inmutables** (no se pueden modificar una vez creadas). Ideales para datos que no cambian.

5. **Conjuntos (`set`)**:
   - Almacenan una colección de elementos **únicos** y no ordenados. Útiles para eliminar duplicados o realizar operaciones de teoría de conjuntos.
   - 🔑 No deja repetir elementos.

In [23]:
# Estructuras de datos básicas en Python

# Variable simple
variable = 3

# Lista (arreglo)
arreglo = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Diccionario (Tabla de Hash)
dictionary = {
    "pedro": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "juan": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "laura": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
}

# Tupla (inmutable)
tupla = (3, 5)

# Conjunto (set) - elimina duplicados automáticamente
conjunto = {"apple", "orange", "apple", "pear", "orange", "banana"}

# Impresión de los datos
print("Variable:", variable)
print("Lista:", arreglo)
print("Diccionario:", dictionary)
print("Tupla:", tupla)
print("Conjunto:", conjunto)

Variable: 3
Lista: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Diccionario: {'pedro': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'juan': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'laura': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]}
Tupla: (3, 5)
Conjunto: {'orange', 'apple', 'pear', 'banana'}


In [24]:
# Operaciones sobre un arreglo

# Declaración inicial del arreglo
arreglo = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Traer elementos de un arreglo
elemento = arreglo[6]
print("Elemento en posición 7 (índice 6):", elemento)

elemento_menos_dos = arreglo[-2]
print("Elemento en posición -2 (penúltimo):", elemento_menos_dos)

# Agregar elementos a un arreglo
arreglo.append(9999)
print("Arreglo después de agregar elemento:", arreglo)

# Eliminar un elemento del arreglo por posición
arreglo.pop(-1)  # -1 elimina el último elemento, en este caso 9999
print("Arreglo después de eliminar el último elemento:", arreglo)

# Actualizar un elemento en una posición
arreglo[-1] = 1000  # Cambia el último elemento (10) por 1000

Elemento en posición 7 (índice 6): 7
Elemento en posición -2 (penúltimo): 9
Arreglo después de agregar elemento: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 9999]
Arreglo después de eliminar el último elemento: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [26]:
# Diccionario - Tabla de Hash:
# Llave - Valor
dictionary = {
    "pedro": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "juan": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    "laura": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
}

# Acceso al valor asociado a la llave "laura"
arreglo = dictionary["laura"]
print("El valor de Laura en la posición 10 es:", arreglo[9])  # Recuerda que los índices empiezan en 0

# Nota: Los diccionarios también soportan operaciones CRUD (Create, Read, Update, Delete)
# Aquí un breve resumen de cómo funcionan:

# 1. **Create (Crear):**
dictionary["maria"] = [11, 12, 13]  # Agregamos una nueva llave con su valor asociado
print("Diccionario después de agregar a María:", dictionary)

# 2. **Read (Leer):**
valor_pedro = dictionary["pedro"]  # Accedemos al valor asociado a la llave "pedro"
print("Valor de Pedro:", valor_pedro)

# 3. **Update (Actualizar):**
dictionary["juan"] = [14, 15, 16]  # Modificamos el valor asociado a la llave "juan"
print("Diccionario después de actualizar a Juan:", dictionary)

# 4. **Delete (Eliminar):**
del dictionary["laura"]  # Eliminamos la llave "laura" del diccionario
print("Diccionario después de eliminar a Laura:", dictionary)

# De igual forma que con los arreglos, los diccionarios también tienen operaciones CRUD.
# CRUD: Create, Read, Update, Delete.

# Para conocere estas operaciones en un diccionario puedes leer la documentación
# o buscar por ChatGPT.

El valor de Laura en la posición 10 es: 10
Diccionario después de agregar a María: {'pedro': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'juan': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'laura': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'maria': [11, 12, 13]}
Valor de Pedro: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Diccionario después de actualizar a Juan: {'pedro': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'juan': [14, 15, 16], 'laura': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'maria': [11, 12, 13]}
Diccionario después de eliminar a Laura: {'pedro': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'juan': [14, 15, 16], 'maria': [11, 12, 13]}


In [27]:
# Tupla - No permite modificar sus elementos, es inmutable.

# Declaración de una tupla
tupla = (3, 'laura', 5454)

# Acceso a elementos de la tupla
print("Elemento en la posición 1 (índice 0):", tupla[0])  # Salida: 3
print("Elemento en la posición 2 (índice 1):", tupla[1])  # Salida: laura
print("Elemento en la última posición:", tupla[-1])       # Salida: 5454

# tupla[1]='Hola'
# La línea de arriba, tira error: TypeError: 'tuple' object does not support item assignment.
# Las tuplas a diferencia de las listas no dejan cambiar los elementos.

Elemento en la posición 1 (índice 0): 3
Elemento en la posición 2 (índice 1): laura
Elemento en la última posición: 5454


In [28]:
# Set (conjunto) - Colección de elementos únicos (sin repeticiones)

# Declaración de un conjunto
conjunto = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}

# Impresión inicial del conjunto (los elementos duplicados se eliminan automáticamente)
print("Conjunto (sin elementos repetidos):", conjunto)

# Agregar un elemento ya existente
conjunto.add('apple')  # 'apple' ya está en el conjunto, no se agrega de nuevo
print("El conjunto no cambia al agregar un elemento repetido:", conjunto)

# Agregar un elemento nuevo
conjunto.add('pineapple')  # 'pineapple' no estaba en el conjunto, se agrega
print("El conjunto cambia al agregar un elemento nuevo:", conjunto)

# Nota: Los conjuntos (sets) también tienen operaciones CRUD (Create, Read, Update, Delete)

# 1. **Create (Crear)**:
conjunto.add('grape')  # Agregamos un nuevo elemento
print("Conjunto después de agregar 'grape':", conjunto)

# 2. **Read (Leer)**:
# Leer si un elemento está en el conjunto
print("¿Está 'banana' en el conjunto?", 'banana' in conjunto)  # Salida: True

# 3. **Update (Actualizar)**:
# En los sets no se actualizan elementos individuales, pero podemos eliminar y agregar elementos.
conjunto.remove('orange')  # Eliminamos 'orange'
conjunto.add('strawberry')  # Agregamos 'strawberry'
print("Conjunto después de actualizar elementos:", conjunto)

# 4. **Delete (Eliminar)**:
conjunto.discard('apple')  # Eliminamos 'apple' del conjunto
print("Conjunto después de eliminar 'apple':", conjunto)

Conjunto (sin elementos repetidos): {'orange', 'apple', 'pear', 'banana'}
El conjunto no cambia al agregar un elemento repetido: {'orange', 'apple', 'pear', 'banana'}
El conjunto cambia al agregar un elemento nuevo: {'pear', 'pineapple', 'banana', 'orange', 'apple'}
Conjunto después de agregar 'grape': {'pear', 'pineapple', 'banana', 'orange', 'apple', 'grape'}
¿Está 'banana' en el conjunto? True
Conjunto después de actualizar elementos: {'strawberry', 'pear', 'pineapple', 'banana', 'apple', 'grape'}
Conjunto después de eliminar 'apple': {'strawberry', 'pear', 'pineapple', 'banana', 'grape'}


## 5. **Ciclos y complejidad**

<img src="../assets/Script_Lab_1/importante.png" alt="Importante" width="200">

**¿Para qué nos sirven los ciclos?:**

<img src="../assets/Script_Lab_1/loops.png" alt="Importante" width=50%>


Con el fin de no tener que repetir muchas veces una tarea, podemos programar que se ejecute un número determinado de veces, o hasta que se cumpla una condición.

Los ciclos (loops en inglés) nos permiten iterar (recorrer) sobre estructuras de datos y esto es algo muy importante para poder trabajar con nuestros datos almacenados.


**Formas de hacer un ciclo**

In [29]:
# Hay 3 formas básicas de hacer ciclos en Python.
lista = [3, 6, 9, 12, 15, 18, 21, 24, 27, 30]

In [30]:
# ---- Forma 1: Iterar directamente sobre los elementos ----
# Esta es la forma más sencilla. Recorre cada elemento que se encuentra en (in) una estructura de datos.

print("Forma 1: Iterar directamente sobre los elementos")
for i in lista:
    print(i)

Forma 1: Iterar directamente sobre los elementos
3
6
9
12
15
18
21
24
27
30


In [31]:
range(0, len(lista))

range(0, 10)

In [32]:
# ---- Forma 2: Iterar utilizando índices ----
# Se itera sobre el tamaño de la lista utilizando índices. Aunque parece más complejo,
# puede ser la única opción para ciertos problemas.

print("\nForma 2: Iterar utilizando índices")

# Ejemplo 1: Acceso a cada elemento mediante su posición
for posicion in range(0, len(lista)):
    print(lista[posicion])


Forma 2: Iterar utilizando índices
3
6
9
12
15
18
21
24
27
30


In [33]:
# Ejemplo 2: Iterar sobre posiciones específicas (por ejemplo, múltiplos de 2)
print("\nElementos en posiciones múltiplos de 2:")
for posicion in range(0, len(lista)):
    if posicion % 2 == 0:
        print(lista[posicion])


Elementos en posiciones múltiplos de 2:
3
9
15
21
27


In [55]:
# ---- Forma 3: Utilizar un ciclo `while` ----
# El ciclo `while` es útil en casos donde no sabemos de antemano cuántas iteraciones necesitamos,
# como en programación dinámica o listas encadenadas.

print("\nForma 3: Utilizar un ciclo while")
posicion = 0
while posicion < len(lista):
    print(lista[posicion])
    posicion += 1


Forma 3: Utilizar un ciclo while
3
6
9
12
15
18
21
24
27
30


In [34]:
# ---- Iterar sobre un diccionario ----
# Cada estructura de datos tiene formas específicas de iteración. A continuación, un ejemplo con un diccionario.

print("\nCiclo sobre un diccionario (pares clave-valor):")

dictionary = {
    "pedro": 1,
    "juan": 2,
    "laura": 3
}  # Tabla de Hash

# Iterar a través de pares clave-valor
for llave, valor in dictionary.items():
    print(f"Llave: {llave}, Valor: {valor}")


Ciclo sobre un diccionario (pares clave-valor):
Llave: pedro, Valor: 1
Llave: juan, Valor: 2
Llave: laura, Valor: 3


#### **Complejidad algorítmica**

Dependiendo cuántas veces yo **itere** una estructura de datos (es decir, haga un ciclo), aumenta la complejidad algorítmica.

**¿Por qué me interesa esto?**

Porque si son muchos datos, mi programa puede que corra muy lento, o se demore tanto en correr que nunca obtendré la respuesta (demore años en correr y yo nunca lo sepa).

La vida real maneja muchos datos y debo optimizar mis algoritmos.

Para ello, se utiliza la notación [Big-O](https://www.freecodecamp.org/espanol/news/explicacion-de-la-notacion-big-o-con-ejemplo/) que nos permite conocer aproximadamente qué tan óptimo es nuestro código.

<img src="https://miro.medium.com/v2/resize:fit:1400/1*5ZLci3SuR0zM_QlZOADv8Q.jpeg" height="350">

Si una estructura de datos tiene tamaño *n* y la recorro 1 vez, entonces la complejidad será de $O(n)$.

Se recomienda que nuestro código tenga complejidad inferior a $O(n)$, pero en la mayoría de casos podemos terminar con complejidad de $O(n^2)$, por ejemplo, para recorrer una matriz.

In [35]:
# Complejidad algorítmica. ¿Qué tal difícil es? ¿Cuánto va a demorar?

# Creamos una lista con número sentre el 1 y el 100.000.000
# Juega con el tamaño y mira como cambia el tiempo de ejecución.
lista_de_numeros = list(range(1, 100000001))

# Iterar sobre una lista - O(n)
suma = 0
for i in lista_de_numeros:
  suma += i

print(suma)

5000000050000000


In [36]:
import numpy as np

# Generar una matriz de 10000x10000 con números aleatorios entre 0 y 1.
matriz = np.random.rand(10000, 10000)
matriz

# Note que la matriz tiene tamaño n x n = 10.000 x 10.000 = 100.000.000 de datos.

# Iterar sobre una matriz - O(n^2)
suma = 0
for fila in matriz:
    for valor in fila:
        # Aquí puedes realizar alguna operación con cada valor
        suma += valor

print(suma)

50000941.042976655


In [37]:
# Traer una llave de un diccionario - Tabla de Hash
import random

# Definir el número de elementos (ajusta según sea necesario)
num_elementos = 100000000  # 10 millones de elementos

# Inicializa un diccionario vacío
mi_diccionario = {}

# Genera un diccionario con llaves y valores aleatorios (evitando valores None)
for llave in range(num_elementos):
    mi_diccionario[str(llave)] = random.random()

In [39]:
len(mi_diccionario)

100000000

In [40]:
# Traer un valor de un diccionario tiene ¡Complejidad constante! - O(1)
# Traer un valor de un arreglo (lista o vector), también tiene complejidad constante - O(1)

# Obtener un valor aleatorio del diccionario
llave_aleatoria = random.choice(list(mi_diccionario.keys()))  # Escoge una llave aleatoria
valor_aleatorio = mi_diccionario[llave_aleatoria]  # Obtiene el valor correspondiente a la llave aleatoria

# Verificar el resultado
print(f"Llave aleatoria: {llave_aleatoria}")
print(f"Valor correspondiente: {valor_aleatorio}")

Llave aleatoria: 42073928
Valor correspondiente: 0.8048934161615855


#### **Beneficio de GPUs y TPUs frente a CPUs al recorrer estructuras de datos**
<img src="../assets/Script_Lab_1/CPU vs GPU vs TPU.jpg" alt="CPU vs GPU vs TPU" width=50%>

Las GPUs y TPUs son significativamente más eficientes que las CPUs al recorrer estructuras de datos, especialmente cuando se trata de grandes volúmenes de información. Esto se debe a sus arquitecturas diseñadas para el **procesamiento paralelo masivo** y su capacidad para manejar cálculos repetitivos de manera simultánea. Aquí se explica por qué:

**1. Procesamiento Paralelo Masivo**

- **CPU**:
  - Diseñada para tareas secuenciales.
  - Tiene un número limitado de núcleos (4 a 16 típicamente) optimizados para ejecutar pocas tareas complejas a la vez.
  - Cuando se recorren grandes estructuras de datos, como listas o matrices, la CPU procesa un elemento a la vez (procesamiento **escalar**).

- **GPU**:
  - Posee miles de núcleos más simples, diseñados para ejecutar **múltiples operaciones en paralelo**.
  - Esto la hace ideal para recorrer matrices o grandes DataFrames en Python, ya que puede procesar bloques completos de datos simultáneamente (procesamiento **vectorial**).
  
- **TPU**:
  - Optimizada para operaciones de **tensores** (estructuras multidimensionales).
  - Es capaz de manejar modelos que requieren cálculos masivos en redes neuronales de aprendizaje profundo.
  - Su diseño permite recorrer y operar sobre estructuras complejas, como matrices de alta dimensión, de forma extremadamente rápida (procesamiento de **tensores**).

**2. Arquitectura de Memoria**

La eficiencia de GPUs y TPUs también se debe a su arquitectura de memoria:

- **CPU**: 
  - Tiene múltiples niveles de caché (L1, L2, L3) y la gestión de la memoria es implícita. Esto puede ser una limitación para manejar datos grandes que no caben en la caché.
  
- **GPU**: 
  - Usa un modelo de memoria **mixto**, donde la memoria compartida entre núcleos permite manejar datos en paralelo con alta velocidad.
  
- **TPU**: 
  - Posee una memoria especializada (buffers de activación y registros de acumulación) que está explícitamente gestionada para maximizar el rendimiento en tareas de aprendizaje automático.

**3. Asociación con la Complejidad**

El uso de GPUs y TPUs afecta directamente la complejidad computacional:

- **CPU**:
  - Para recorrer una estructura de datos de tamaño `n`, una CPU realiza `O(n)` operaciones secuenciales.
  
- **GPU/TPU**:
  - Debido al paralelismo, las GPUs y TPUs dividen las tareas entre múltiples núcleos, reduciendo el tiempo efectivo. Aunque la complejidad teórica sigue siendo `O(n)`, el paralelismo reduce el **tiempo constante** (`k`) asociado a cada operación.
  - Esto es especialmente notable en algoritmos que realizan operaciones en matrices, como el producto matricial, donde el tiempo puede reducirse de `O(n^3)` a **`O(n^2)` en términos prácticos**, gracias al procesamiento paralelo.


### **Resumen**
| **Característica**          | **CPU**             | **GPU**                | **TPU**                     |
|------------------------------|---------------------|------------------------|-----------------------------|
| **Procesamiento**            | Secuencial (escalar)| Paralelo (vectorial)    | Paralelo avanzado (tensores) |
| **Núcleos**                  | Pocos y poderosos  | Miles y simples        | Optimizados para tensores   |
| **Ideal para**               | Tareas generales   | Operaciones paralelas  | Machine Learning            |
| **Complejidad práctica**     | O(n) (secuencial)  | O(n) (paralelo)        | O(n) (paralelo tensorial)   |


**Conclusión**

Las GPUs y TPUs son más rápidas que las CPUs al recorrer estructuras de datos porque pueden procesar múltiples elementos simultáneamente, gracias a su arquitectura paralela. Esto reduce significativamente el tiempo constante de las operaciones, haciendo que tareas como entrenar modelos de machine learning o procesar matrices gigantes sean mucho más eficientes.

#### **¡Un ejemplo importante!**

En el siguiente ejemplo, vamos a buscar un número en un arreglo.

Implementaremos dos algoritmos: uno que busca número a número y otro que lo encuentra por búsqueda binaria.

Veremos cómo optimizar nuestro código y/o utilizar los mejores algoritmos, hace que los tiempos de ejecución se reduzcan drásticamente.

In [41]:
# Crear un arreglo con números hasta 100 millones.
arreglo = range(1, 100000001)

# Buscar el número 667,000
numero_buscado = 66700000

In [42]:
# Complejidad: O(n)
# Iterar a través del arreglo y comparar con cada número, uno por uno.
for numero in arreglo:
    if numero == numero_buscado: # Debe recorrer todo el arreglo hasta encontrarlo.
        print(f"¡Encontrado! El número {numero_buscado} fue encontrado.")
        break

¡Encontrado! El número 66700000 fue encontrado.


In [43]:
# Complejidad: log_2(n)
# Algoritmo - Búsqueda binaria
# Todo algoritmo que tenga complejidad log_2(n) realiza particiones del problema en mitades.
# Explicación: https://es.khanacademy.org/computing/computer-science/algorithms/binary-search/a/binary-search
def busqueda_binaria(lista, numero_buscado):
    izquierda = 0
    derecha = len(lista) - 1

    while izquierda <= derecha:
        medio = (izquierda + derecha) // 2
        numero_medio = lista[medio]

        if numero_medio == numero_buscado:
            return medio
        elif numero_medio < numero_buscado:
            izquierda = medio + 1
        else:
            derecha = medio - 1

    return -1  # Si no se encuentra el número, devolvemos -1

# Llamamos a la función de búsqueda binaria
resultado = busqueda_binaria(arreglo, numero_buscado)

if resultado != -1:
    print(f"¡Encontrado! El número {numero_buscado} está en la posición {resultado}.")
else:
    print(f"No se encontró el número {numero_buscado}.")


¡Encontrado! El número 66700000 está en la posición 66699999.


Compara el tiempo de ejecución de ambos algoritmos...

¿Cuál fue mucho más rápido?

**Respuesta:** Búsqueda binaria.

## 6. Librerías

En Python, las **librerías** son herramientas fundamentales que facilitan la programación al ofrecer funcionalidades ya desarrolladas, permitiendo ahorrar tiempo y esfuerzo. Estas librerías están compuestas por **módulos** y **paquetes**. A continuación, se explica cada uno de estos conceptos.

- **Modulo**: archivo con clases y funciones.
- **Paquete**: conjunto de módulos relacionados que proveen unafuncionalidad (estructura de directorio).
- **Librería:** gran conjunto de módulos con múltiples funcionalidades.

In [44]:
# Importar un módulo estándar
import math

In [45]:
# Importar un módulo dentro de un paquete
from numpy import random

In [46]:
# Importar una librería completa
import pandas as pd

#### **PyPI - Python Package Index**

Es un repositorio oficial de paquetes y librerías para Python. Es una herramienta fundamental para los desarrolladores, ya que permite buscar, descargar e instalar paquetes directamente desde la línea de comandos utilizando herramientas como `pip`.

In [None]:
%%capture # Ocultar la salida
!pip install nombre_del_paquete_1 nombre_del_paquete_2

#### **Pandas y Numpy**

Pandas y Numpy son el **corazón de Python**. Son librerías que nos permiten trabajar con los datos de manera eficiente, y nos facilitan la vida.
Nos permiten manipular **DataFrames**, que son tablas en Python (una aproximación de Excel en Python).
En el mercado laboral es lo que más se utiliza en programación.


- **Pandas**:
  - Es una librería que proporciona estructuras de datos como **DataFrames** y **Series**, diseñadas para trabajar con datos tabulares y temporales.
  - Los **DataFrames** son como tablas en Python, similares a las hojas de cálculo de Excel, pero mucho más poderosas y rápidas.
  - Con Pandas puedes:
    - Cargar datos desde múltiples fuentes (archivos CSV, Excel, bases de datos, etc.).
    - Limpiar y transformar datos con facilidad.
    - Realizar análisis exploratorios de datos (EDA).

In [49]:
import pandas as pd

# Crear un DataFrame
data = {"Nombre": ["Ana", "Luis", "Pedro"], "Edad": [23, 34, 45]}
df = pd.DataFrame(data)

df

Unnamed: 0,Nombre,Edad
0,Ana,23
1,Luis,34
2,Pedro,45


- **Numpy**:
  - Es una librería diseñada para trabajar con arreglos y matrices multidimensionales, ofreciendo operaciones matemáticas y estadísticas eficientes.
  - Es la base sobre la cual se construyen otras librerías como Pandas, debido a su alto rendimiento en cálculos numéricos.
  - Con Numpy puedes:
    - Crear y manipular arreglos n-dimensionales.
    - Realizar operaciones matemáticas avanzadas.
    - Procesar grandes volúmenes de datos de forma eficiente.

In [51]:
import numpy as np

# Crear un arreglo
arreglo = np.array([1, 2, 3, 4, 5])
print(arreglo)


[1 2 3 4 5]


**¿Por qué son importantes?**

- **Eficiencia**: Ambas librerías están optimizadas para manejar grandes cantidades de datos rápidamente.
- **Versatilidad**: Son utilizadas en tareas como análisis de datos, machine learning y visualización.
- **Relevancia en el mercado laboral**: En el mercado laboral, Pandas y Numpy son de las herramientas más solicitadas para programación y análisis de datos. Si aspiras a trabajar en roles relacionados con datos, **dominar estas librerías es imprescindible**.


En el próximo laboratorio veremos algunas funciones de Pandas y Numpy.