# üß∞ **Estructuras de Datos en Python**

En esta sesi√≥n exploraremos **las estructuras de datos fundamentales de Python**, las cuales son la base para procesar, transformar y analizar datos de forma eficiente antes de usar herramientas m√°s complejas como `pandas`, `NumPy` o `scikit-learn`.

### üöÄ **Introducci√≥n**

#### ‚ùì **¬øPor qu√© son tan importantes estas estructuras en Ciencia de Datos?**

Aunque en Ciencia de Datos usamos librer√≠as especializadas como `pandas` o `NumPy`, todas estas se apoyan internamente en estructuras nativas de Python para funcionar. Adem√°s:

- üì¶ **Listas y diccionarios** son estructuras de datos **esenciales para organizar y manipular datos crudos** provenientes de APIs, archivos CSV, JSON, o bases de datos.
- üîê **Tuplas** son √∫tiles para **datos inmutables**, que no deben cambiar, como coordenadas geogr√°ficas, claves de diccionarios o configuraciones fijas.
- üîÅ **Conjuntos** permiten **eliminar duplicados**, hacer intersecciones y verificar membres√≠as r√°pidamente.
- üìä **`pandas.DataFrame`** extiende todas estas capacidades, pero es clave **comprender bien las estructuras b√°sicas antes de entrar a `pandas`**.

Aprender estas estructuras no solo mejora tu l√≥gica como programador, sino que adem√°s:

- üîç Mejora tu capacidad de **limpiar, transformar y explorar datos manualmente**.
- ‚ö° Te permite escribir c√≥digo m√°s **eficiente, claro y escalable**.
- üõ†Ô∏è Te da herramientas para **debuggear** y entender errores al usar librer√≠as externas.

#### üß≠ **Estructura de la sesi√≥n**


A continuaci√≥n, vamos a recorrer cada una de las estructuras de datos m√°s relevantes en Python:

| Estructura   | Tipo       | Mutabilidad | Aplicaciones en Ciencia de Datos |
|--------------|------------|-------------|----------------------------------|
| `list`       | Secuencia  | Mutable     | Recorrer elementos, limpieza, preparaci√≥n |
| `tuple`      | Secuencia  | Inmutable   | Configuraciones, coordenadas, claves |
| `dict`       | Mapeo      | Mutable     | Datos estructurados, JSON, filas de datos |
| `set`        | Colecci√≥n  | Mutable     | Unicidad, limpieza, operaciones de conjunto |
| `DataFrame`  | Tabla      | Mutable     | An√°lisis, estad√≠sticas, modelado |

### üß± **Estructuras de Datos Fundamentales**

Ahora que ya entendemos la importancia de las estructuras de datos en Python y su rol dentro de la Ciencia de Datos, es momento de **explorarlas de forma pr√°ctica**.  

A lo largo de esta secci√≥n, conoceremos y trabajaremos con las estructuras m√°s utilizadas en Python para manejar y transformar datos:

- üìã Listas (`list`)
- üîê Tuplas (`tuple`)
- üóÇÔ∏è Diccionarios (`dict`)
- ‚ôªÔ∏è Conjuntos (`set`)
- üìä Dataframes (`pandas.DataFrame`)

Cada una de estas estructuras tiene propiedades espec√≠ficas que las hacen √∫tiles en diferentes etapas del an√°lisis de datos: desde la recolecci√≥n y limpieza hasta el modelado y visualizaci√≥n.

üîç **Vamos a ver c√≥mo se crean, c√≥mo se manipulan y c√≥mo se integran en tareas reales de Ciencia de Datos.**

#### üìã **Listas (`list`)**

In [None]:
# Definici√≥n: colecci√≥n ordenada y mutable


In [None]:
# Indexaci√≥n y slicing


In [None]:
# M√©todos comunes
    # Agrega un elemento al final
    # Inserta 25 en la posici√≥n 2
    # Elimina el primer 40
    # Elimina y devuelve el √∫ltimo valor
    # Ordena la lista en su lugar
    # Invierte el orden de la lista

In [None]:
# Iteraci√≥n


In [None]:
# List comprehension


#### üîê **Tuplas (`tuple`)**

In [None]:
# Definici√≥n: colecci√≥n ordenada e inmutable


In [None]:
# Indexaci√≥n


In [None]:
# Desempaquetado


In [None]:
# Tuplas anidadas


#### üóÇÔ∏è **Diccionarios (`dict`)**

In [None]:
# Definici√≥n: colecci√≥n no ordenada de pares clave-valor, mutable


In [None]:
# Acceso


In [None]:
# M√©todos comunes


In [None]:
# Claves, valores, items


In [None]:
# Iteraci√≥n


In [None]:
# Diccionario por comprensi√≥n


#### ‚ôªÔ∏è **Conjuntos (`set`)**

In [None]:
# Definici√≥n: colecci√≥n no ordenada de elementos √∫nicos


In [None]:
# M√©todos


In [None]:
# Operaciones de conjuntos


In [None]:
# Iteraci√≥n


#### üìä **Dataframe (`pandas.DataFrame`)**

In [None]:
# Importaci√≥n de la Librer√≠a
import pandas as pd

In [None]:
# Crear DataFrame desde un diccionario


In [None]:
# Exploraci√≥n
    # Primeras filas
    # Informaci√≥n general
    # Estad√≠sticas de columnas num√©ricas

In [None]:
# Acceso a columnas


In [None]:
# Acceso a columnas


In [None]:
# Acceso a filas
    # por etiqueta
    # por posici√≥n

In [None]:
# Filtro de filas


In [None]:
# Agregar columna


In [None]:
# Eliminar columna


In [None]:
# Iteraci√≥n b√°sica (no recomendable en grandes vol√∫menes)


In [None]:
# Operaciones vectorizadas


### üí™üèª **Ejercicios**

##### Ejercicio 1

1. Pide al usuario ingresar las edades de un grupo de personas (hasta que escriba "fin"). Luego:

- Muestra la cantidad total de edades ingresadas.

- Muestra la lista de edades √∫nicas (sin repetir) usando un conjunto.

- Calcula el promedio de edad.

‚úÖ **Ejemplo de entrada y salida esperada**

```plaintext
Ingresa una edad (o "fin" para terminar): 25  
Ingresa una edad (o "fin" para terminar): 30  
Ingresa una edad (o "fin" para terminar): 25  
Ingresa una edad (o "fin" para terminar): fin  

Total de edades: 3  
Edades √∫nicas: [25, 30]  
Promedio de edad: 26.7

In [None]:
# HAZ TU SCRIPT AC√Å

##### Ejercicio 2

1. Pide al usuario ingresar nombres de estudiantes y sus notas (hasta escribir "fin"). Luego:

- Crea un diccionario con los nombres como claves y las notas como valores.

- Convierte el diccionario en un DataFrame.

- Muestra el promedio general.

- Filtra a los estudiantes que tienen nota mayor o igual a 3.0.

**‚úÖ Ejemplo de entrada y salida esperada**

```plaintext
Nombre: Ana  
Nota: 4.5  
Nombre: Luis  
Nota: 2.8  
Nombre: fin  

Promedio general: 3.65  
Estudiantes aprobados:
    Nombre  Nota
0     Ana   4.5

In [None]:
# HAZ TU SCRIPT AC√Å