<a href="https://colab.research.google.com/github/davidlealo/python_pluxee_academy_2025/blob/main/Clases/02_analisis_datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Agenda de la Clase

## Funciones y librerÃ­as

### 1. Funciones en Python
- **a)** Funciones en Python
- **b)** Ejemplos bÃ¡sicos
- **c)** Datasets de anÃ¡lisis de datos

### 2. Uso de Bibliotecas en Python
- **a)** Uso de Pandas
- **b)** AnÃ¡lisis de datos bÃ¡sico
- **c)** AnÃ¡lisis de datos de redes sociales


<hr style="border-top: 3px double #333; color: #333; overflow: visible; text-align: center; height: 5px;">

## Funciones en Python

Una **funciÃ³n** es un bloque de cÃ³digo reutilizable que agrupa instrucciones relacionadas para cumplir una tarea especÃ­fica.  
Sirve para **organizar**, **modularizar** y **evitar la repeticiÃ³n** de cÃ³digo, ademÃ¡s de facilitar el mantenimiento y la legibilidad.

### 1. AnatomÃ­a de una funciÃ³n

```python
def nombre_funcion(parÃ¡metros_opcionales):
    """Docstring: explica quÃ© hace la funciÃ³n."""
    instrucciones
    return valor_opcional
```

| Parte               | DescripciÃ³n                                                                                 |
|---------------------|----------------------------------------------------------------------------------------------|
| `def`               | Palabra clave que seÃ±ala el inicio de la definiciÃ³n.                                         |
| `nombre_funcion`    | Identificador (usa snake_case).                                                              |
| `parÃ¡metros`        | Valores que la funciÃ³n recibe para trabajar.                                                 |
| `docstring`         | Cadena multilÃ­nea (opcional) que documenta propÃ³sito, argumentos y retorno.                  |
| Cuerpo              | Bloque indentado con las instrucciones.                                                      |
| `return` (opcional) | Devuelve un valor al llamador; si se omite, la funciÃ³n retorna `None`.                       |

---

### 2. Ejemplos bÃ¡sicos

#### 2.1 FunciÃ³n sin parÃ¡metros ni retorno

```python
def saluda():
    print("Â¡Hola, Mundo!")

saluda()        # â†’ Â¡Hola, Mundo!
```

---

#### 2.2 FunciÃ³n con parÃ¡metros y retorno

```python
def area_rectÃ¡ngulo(base, altura):
    """Calcula el Ã¡rea de un rectÃ¡ngulo."""
    return base * altura

print(area_rectÃ¡ngulo(5, 3))  # â†’ 15
```

---

#### 2.3 ParÃ¡metros con valor por defecto

```python
def saluda(nombre="invitado"):
    print(f"Â¡Hola, {nombre}!")
    
saluda("David")  # â†’ Â¡Hola, David!
saluda()           # â†’ Â¡Hola, invitado!
```

---

#### 2.4 `*args` y `**kwargs`

```python
def muestra_argumentos(*args, **kwargs):
    print("Posicionales:", args)
    print("Nombrados   :", kwargs)

muestra_argumentos(1, 2, 3, a=10, b=20)
```

---

#### 2.5 Funciones lambda (anÃ³nimas)

```python
cuadrado = lambda x: x**2
print(cuadrado(4))           # â†’ 16
```

---

#### 2.6 Recursividad

```python
def factorial(n):
    if n == 0:
        return 1
    return n * factorial(n-1)

print(factorial(5))          # â†’ 120
```

---

### 3. Buenas prÃ¡cticas

* Usa nombres descriptivos y **snake_case**.  
* AÃ±ade **docstrings** (`"""Triple comillas"""`) claros.  
* MantÃ©n las funciones **cortas y con una sola responsabilidad**.  
* Evita efectos secundarios inesperados; retorna valores en lugar de imprimir dentro de la funciÃ³n cuando sea posible.  
* Coloca los parÃ¡metros con valor por defecto **al final** de la lista de parÃ¡metros.

---

### 4. Ejercicios propuestos

> Prueba resolverlos antes de mirar la soluciÃ³n ðŸ˜‰

| # | Enunciado |
|---|-----------|
| 1 | **ConversiÃ³n de temperaturas**: crea `celsius_a_fahrenheit(c)` que reciba Â°C y devuelva Â°F. |
| 2 | **NÃºmero par o impar**: escribe `es_par(n)` que retorne `True` si `n` es par, `False` si no. |
| 3 | **MÃ¡ximo comÃºn divisor** (MCD): implementa `mcd(a, b)` con el algoritmo de Euclides (recursivo). |
| 4 | **Promedio flexible**: crea `promedio(*numeros)` que acepte cualquier cantidad de valores y devuelva su media. Si no se pasa ningÃºn valor, que retorne `None`. |
| 5 | **Contador de palabras**: define `contar_palabras(frase)` que devuelva un diccionario con la frecuencia de cada palabra (insensible a mayÃºsculas/minÃºsculas). |

---

<details>
<summary><strong>Soluciones (haz clic para desplegar)</strong></summary>

```python
# 1. Celsius a Fahrenheit
def celsius_a_fahrenheit(c):
    return c * 9/5 + 32

# 2. Par o impar
def es_par(n):
    return n % 2 == 0

# 3. MÃ¡ximo comÃºn divisor (Euclides recursivo)
def mcd(a, b):
    return a if b == 0 else mcd(b, a % b)

# 4. Promedio flexible
def promedio(*numeros):
    return sum(numeros)/len(numeros) if numeros else None

# 5. Contador de palabras
def contar_palabras(frase):
    palabras = frase.lower().split()
    conteo = {}
    for p in palabras:
        conteo[p] = conteo.get(p, 0) + 1
    return conteo
```

</details>

---

### 5. Para profundizar

* **PEP 8 â€“ Estilo de cÃ³digo en Python**  
* **PEP 257 â€“ Convenciones de docstrings**  
* MÃ³dulo estÃ¡ndar `functools` para utilidades avanzadas (decoradores, `lru_cache`, etc.).

Â¡Listo! Con esto tienes una base sÃ³lida para entender y practicar funciones en Python.

# ðŸ“‚ Datasets pÃºblicos de redes sociales

Este archivo reÃºne enlaces directos y comandos de descarga en **CSV** para que los estudiantes del curso Pythonâ€¯Pluxeeâ€¯Academy 2025 puedan utilizarlos en la *Tareaâ€¯03 â€“ AnÃ¡lisis de datos con Pandas*.

---
## Tabla resumen

| # | Dataset | Plataforma | Filas / Peso | Enlace directo | InstrucciÃ³n de descarga |
|---|---------|------------|--------------|----------------|-------------------------|
| 1 | **FacebookÂ Metrics** | Facebook (marca de cosmÃ©ticos) | 500 / 37â€¯KB | <https://archive.ics.uci.edu/static/public/438/dataset_facebook.csv> | ```bash
wget https://archive.ics.uci.edu/static/public/438/dataset_facebook.csv -P data/
``` |
| 2 | **TwitterÂ USÂ AirlineÂ Sentiment** | Twitter | 14â€¯640 / 3.4â€¯MB | <https://www.kaggle.com/datasets/crowdflower/twitter-airline-sentiment> | ```bash
kaggle datasets download -d crowdflower/twitter-airline-sentiment -f Tweets.csv -p data/
unzip data/Tweets.csv.zip -d data/
``` |
| 3 | **RedditÂ r/gaming Comments** | Reddit | 23â€¯000 / 4â€¯MB | <https://www.kaggle.com/datasets/sainitishmitta04/23k-reddit-gaming-comments-with-sentiments-dataset> | ```bash
kaggle datasets download -d sainitishmitta04/23k-reddit-gaming-comments-with-sentiments-dataset -p data/
unzip data/*.zip -d data/
``` |
| 4 | **InstagramÂ Reach** | Instagram | 101 / 60â€¯KB | <https://raw.githubusercontent.com/rxsraghavagrawal/instagram-reach/main/Instagram%20Reach.csv> | ```bash
wget "https://raw.githubusercontent.com/rxsraghavagrawal/instagram-reach/main/Instagram%20Reach.csv" -P data/
``` |

> ðŸ’¡ **Nota:** Los datasets hospedados en Kaggle requieren tener configurada laÂ API. Si no la tienes lista, sigue las instrucciones de la siguiente secciÃ³n.

---
## CÃ³mo configurar la API de Kaggle

1. Crea una cuenta en <https://kaggle.com> y ve a **Account â†’ API â†’ Create New API Token**. Se descargarÃ¡ `kaggle.json`.
2. En tu terminal o Colab:
   ```bash
   pip install kaggle
   mkdir -p ~/.kaggle
   mv ~/Downloads/kaggle.json ~/.kaggle/
   chmod 600 ~/.kaggle/kaggle.json
   ```
3. A partir de ahora, cualquier comando `kaggle datasets download â€¦` funcionarÃ¡.

---
## Ejemplo de carga en un notebook

```python
import pandas as pd

# Cargar el dataset de Facebook (ajusta la ruta si usas otro)
df = pd.read_csv("data/dataset_facebook.csv")
print(df.head())
print(df.info())
```

---

Â¡Listo! Copia el comando del dataset que quieras, ejecÃºtalo en tu entorno y continÃºa con la tarea. ðŸš€



## Â¿QuÃ© es una librerÃ­a en Python?

Una librerÃ­a en Python es un conjunto de mÃ³dulos y funciones que pueden ser reutilizados en mÃºltiples programas. Estas librerÃ­as facilitan el desarrollo de software al proporcionar herramientas ya implementadas para realizar tareas comunes. Puedes pensar en una librerÃ­a como una colecciÃ³n de libros donde cada libro (mÃ³dulo) contiene capÃ­tulos (funciones y clases) que tratan sobre un tema especÃ­fico.

### Â¿CÃ³mo usar una librerÃ­a en Python?

Para usar una librerÃ­a en Python, primero debes instalarla (si no estÃ¡ incluida en la biblioteca estÃ¡ndar de Python). Esto se hace generalmente con el gestor de paquetes `pip`. Una vez instalada, puedes importarla en tu script y comenzar a usar sus funciones y clases.

### Ejemplo de uso:

1. **InstalaciÃ³n** (desde la lÃ­nea de comandos):
   ```bash
   pip install nombre_de_la_libreria


2. **ImportaciÃ³n y uso** (en tu script Python):


   ```Python 
import nombre_de_la_libreria

# Usar una funciÃ³n de la librerÃ­a
resultado = nombre_de_la_libreria.algun_metodo()


## ExplicaciÃ³n del uso de Pandas

Pandas es una de las librerÃ­as mÃ¡s populares en Python para el anÃ¡lisis y manipulaciÃ³n de datos. Proporciona estructuras de datos fÃ¡ciles de usar y herramientas para anÃ¡lisis de datos.

### InstalaciÃ³n de Pandas
Puedes instalar Pandas usando pip:

```bach
pip install pandas


### Conceptos bÃ¡sicos de Pandas

1. **Series:** Una Serie es una estructura de datos unidimensional similar a un array. Puede almacenar cualquier tipo de datos (enteros, cadenas, flotantes, etc.).

```Python
import pandas as pd

# Crear una Serie
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)


2. **DataFrame:** Un DataFrame es una estructura de datos bidimensional con etiquetas. Puede considerarse como una hoja de cÃ¡lculo o una tabla SQL.

```Python 
# Crear un DataFrame
data = {'Nombre': ['Ana', 'Juan', 'Pedro', 'Luis'],
        'Edad': [28, 34, 29, 40]}
df = pd.DataFrame(data)
print(df)


## Operaciones comunes con Pandas

1. **Lectura de datos:** Pandas puede leer datos de diferentes fuentes, como archivos CSV, Excel, SQL, etc.

```Python
# Leer datos desde un archivo CSV
df = pd.read_csv('data.csv')


2. **ExploraciÃ³n de datos:** Puedes ver las primeras y Ãºltimas filas de un DataFrame usando *'head()'* y *'tail()'*, respectivamente.

```Python

print(df.head())
print(df.tail())


3. **SelecciÃ³n de datos:** Puedes seleccionar una columna especÃ­fica o un subconjunto de datos.

```Python
# Seleccionar una columna
edades = df['Edad']

# Seleccionar filas por Ã­ndice
filas_seleccionadas = df[0:2]


4. **Operaciones aritmÃ©ticas:** Puedes realizar operaciones aritmÃ©ticas en las columnas del DataFrame.

```Python
# AÃ±adir una nueva columna calculada
df['Edad_Doble'] = df['Edad'] * 2


5. **Filtrado de datos:** Puedes filtrar datos basados en condiciones.

```Python
# Filtrar datos
mayores_de_30 = df[df['Edad'] > 30]


6. **AgrupaciÃ³n de datos:** Puedes agrupar datos y realizar operaciones de agregaciÃ³n.

```Python
# Agrupar por una columna y calcular la media
grupo_por_edad = df.groupby('Edad').mean()
