# Funciones en Programaci√≥n y Paquetes Esenciales para Ciencia de Datos

Este cuaderno explora dos pilares fundamentales en la programaci√≥n y la ciencia de datos: las funciones y el uso de paquetes o librer√≠as.

## Funciones en Programaci√≥n

### Definici√≥n y Uso de Funciones

Una funci√≥n es un bloque de c√≥digo reutilizable dise√±ado para realizar una tarea espec√≠fica. Las funciones ayudan a organizar el c√≥digo, hacerlo m√°s legible, modular y evitan la repetici√≥n (principio DRY: Don't Repeat Yourself).

La sintaxis b√°sica para definir una funci√≥n en Python es:

```python
def NOMBRE_FUNCION(argumento1, argumento2, ...):
    # Cuerpo de la funci√≥n
    # Realiza operaciones
    return resultado # Opcional: devuelve un valor
```

*   `def`: Palabra clave para definir una funci√≥n.
*   `NOMBRE_FUNCION`: Nombre identificador de la funci√≥n (sin espacios, sin acentos, siguiendo convenciones de Python).
*   `argumento`: Valores de entrada que la funci√≥n recibe para operar con ellos.
*   `return`: Opcional. Permite que la funci√≥n devuelva un resultado. Si no se usa, la funci√≥n devuelve `None` por defecto.
*   **Indentaci√≥n**: Es crucial en Python. Define los bloques de c√≥digo. Todo lo que est√© dentro de la funci√≥n debe estar indentado.
*   **Docstrings (`"""..."""`)**: Cadenas de documentaci√≥n que explican el prop√≥sito de la funci√≥n. Son una buena pr√°ctica para hacer tu c√≥digo auto-documentado.


In [None]:
# Ejemplo de funci√≥n simple
def saludar(nombre):
    """Esta funci√≥n imprime un saludo personalizado."""
    print(f"¬°Hola, {nombre}!")

# Llamada a la funci√≥n
saludar("Mundo")
saludar("Ana")


### Tipos de Funciones y Control de Flujo

Las funciones no solo organizan el c√≥digo, sino que tambi√©n interact√∫an con las estructuras de control de flujo, que son esenciales para la l√≥gica y el comportamiento del programa.

*   **Funciones Iterativas**: Aquellas que no se llaman a s√≠ mismas. Realizan tareas secuenciales o repetitivas mediante bucles.
*   **Funciones Recursivas**: Aquellas que se llaman a s√≠ mismas para resolver problemas que pueden dividirse en subproblemas m√°s peque√±os. Son √∫tiles para problemas con una estructura auto-similar (ej. c√°lculo de factoriales, recorrido de √°rboles).

**Estructuras de control de flujo** (imprescindibles dentro de las funciones y en el programa en general):

| Estructura | Uso Principal | Ejemplo |
| :--------- | :------------ | :------ |
| `if`       | Ejecutar un bloque si se cumple una condici√≥n | `if x > 0:` |
| `else`     | Alternativa al `if` cuando no se cumple | `else:` |
| `elif`     | Otra condici√≥n si la anterior no se cumple | `elif x == 0:` |
| `for`      | Iterar sobre una secuencia | `for i in lista:` |
| `while`    | Repetir mientras se cumpla una condici√≥n | `while x < 10:` |
| `break`    | Salir del bucle antes de que termine | `if x == 5: break` |
| `continue` | Saltar a la siguiente iteraci√≥n del bucle | `if x == 3: continue` |


In [None]:
# Ejemplo de Funci√≥n Recursiva: Factorial
def factorial(n):
    if n <= 1:
        return 1
    else:
        return n * factorial(n - 1)

print(f"Factorial de 5: {factorial(5)}")  # Salida: 120
print(f"Factorial de 0: {factorial(0)}")  # Salida: 1


In [None]:
# Ejemplo de Funci√≥n con Control de Flujo (if-else)
def es_par(numero):
    """Verifica si un n√∫mero es par o impar."""
    if numero % 2 == 0:
        print(f"{numero} es un n√∫mero par.")
    else:
        print(f"{numero} es un n√∫mero impar.")

es_par(4)
es_par(7)


In [None]:
# Ejemplo de Funci√≥n con Bucle (for)
def contar_hasta(limite):
    """Cuenta e imprime n√∫meros desde 1 hasta el l√≠mite."""
    print(f"Contando hasta {limite}:")
    for i in range(1, limite + 1):
        print(i)

contar_hasta(5)


In [None]:
# Ejemplo de Funci√≥n con Bucle (while) y break
def buscar_numero(lista, objetivo):
    """Busca un n√∫mero en una lista y se detiene si lo encuentra."""
    i = 0
    while i < len(lista):
        if lista[i] == objetivo:
            print(f"¬°Encontrado {objetivo} en la posici√≥n {i}!")
            break  # Sale del bucle
        i += 1
    else: # Se ejecuta si el bucle while termina sin break
        print(f"{objetivo} no se encontr√≥ en la lista.")

mis_numeros = [10, 20, 30, 40, 50]
buscar_numero(mis_numeros, 30)
buscar_numero(mis_numeros, 60)


## Paquetes Esenciales en Python y R para Ciencia de Datos

### ¬øQu√© son los paquetes o librer√≠as?

Un paquete o librer√≠a es un conjunto de m√≥dulos y funciones preescritas que extienden las capacidades de un lenguaje de programaci√≥n. Son como 'superpoderes' que a√±ades a tu lenguaje, permiti√©ndote realizar tareas complejas de manera m√°s eficiente y con menos c√≥digo.

### Paquetes clave en Python para Ciencia de Datos

| Paquete | ¬øPara qu√© sirve? | C√≥digo de instalaci√≥n (pip) |
| :------ | :--------------- | :------------------------- |
| `pandas` | Manipulaci√≥n y an√°lisis de datos (tablas, CSV, limpieza) | `pip install pandas` |
| `numpy` | C√°lculos num√©ricos, arrays y operaciones matem√°ticas de alto rendimiento | `pip install numpy` |
| `matplotlib` | Creaci√≥n de gr√°ficos est√°ticos, interactivos y animados | `pip install matplotlib` |
| `seaborn` | Visualizaci√≥n de datos estad√≠sticos atractivos y complejos (basado en matplotlib) | `pip install seaborn` |
| `scikit-learn` | Machine Learning (modelos predictivos, clasificaci√≥n, regresi√≥n, clustering) | `pip install scikit-learn` |
| `statsmodels` | An√°lisis estad√≠stico cl√°sico (regresi√≥n lineal, series de tiempo, etc.) | `pip install statsmodels` |

**Ejemplo de uso de `pandas`:**


In [None]:
import pandas as pd

# Crear un DataFrame de ejemplo
data = {
    'Nombre': ['Ana', 'Luis', 'Marta', 'Pedro'],
    'Edad': [28, 34, 29, 42],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla']
}
df = pd.DataFrame(data)

print("DataFrame creado:")
print(df)

# Acceder a una columna
print("
Columna 'Edad':")
print(df['Edad'])

# Filtrar datos
print("
Personas mayores de 30:")
print(df[df['Edad'] > 30])


### Paquetes clave en R para Ciencia de Datos

Aunque este cuaderno se centra en Python, es importante conocer los equivalentes en R, un lenguaje muy popular en estad√≠stica.

| Paquete | ¬øPara qu√© sirve? | C√≥digo de instalaci√≥n (R) |
| :------ | :--------------- | :----------------------- |
| `tidyverse` | Colecci√≥n de paquetes para manipulaci√≥n, visualizaci√≥n y modelado de datos (incluye `dplyr`, `ggplot2`, `readr`) | `install.packages("tidyverse")` |
| `ggplot2` | Creaci√≥n de gr√°ficos estad√≠sticos profesionales y altamente personalizables | Incluido en `tidyverse` |
| `dplyr` | Manipulaci√≥n de datos de forma elegante y eficiente | Incluido en `tidyverse` |
| `readr` | Lectura r√°pida y robusta de archivos de datos (ej. .csv, .tsv) | Incluido en `tidyverse` |
| `caret` | Modelado predictivo, clasificaci√≥n, regresi√≥n (interfaz unificada para muchos algoritmos) | `install.packages("caret")` |
| `lubridate` | Manejo y manipulaci√≥n de fechas y tiempos | `install.packages("lubridate")` |

**Ejemplo conceptual de uso de `dplyr` en R:**
```R
library(dplyr)
data <- read.csv("archivo.csv")
data %>% filter(edad > 18) # Filtra filas donde la edad es mayor a 18
```


### Ruta de aplicaci√≥n: ¬øCu√°ndo usar cada paquete?

La elecci√≥n del paquete depende de la etapa del ciclo de vida de los datos y del lenguaje que est√©s utilizando:

| Etapa del Ciclo de Datos | Python (Paquetes Comunes) | R (Paquetes Comunes) |
| :----------------------- | :------------------------ | :------------------ |
| üì• Cargar/Limpiar datos | `pandas`, `numpy` | `readr`, `dplyr` |
| üìä Visualizar datos | `matplotlib`, `seaborn` | `ggplot2` |
| üìà Analizar y Modelar | `statsmodels`, `scikit-learn` | `stats`, `caret` |
| ‚è± Manejo de Fechas/Horas | `datetime` (m√≥dulo built-in), `pandas` | `lubridate` |
| üîÄ Preparar modelos | `scikit-learn` | `caret` |

**Actividad Interactiva (para el estudiante):**
1.  Elige una etapa del ciclo de vida de los datos (ej. limpieza, visualizaci√≥n, modelado).
2.  Asigna un paquete de Python y otro de R que usar√≠as para esa etapa.
3.  Explica brevemente por qu√© elegir√≠as esos paquetes y qu√© ventajas ofrecen en su respectivo lenguaje.

*Puedes escribir tus respuestas en una celda de texto o c√≥digo aqu√≠ mismo.*


## ¬°Consolida tus habilidades!

La pr√°ctica constante con la definici√≥n y el uso de funciones, as√≠ como el manejo de paquetes, te permitir√° escribir c√≥digo m√°s eficiente, organizado y potente para el an√°lisis de datos. Realiza los ejercicios y explora para afianzar tus conocimientos.

**¬øSab√≠as qu√©...?**
Python fue dise√±ado con legibilidad en mente, mientras que R naci√≥ en la comunidad estad√≠stica. ¬°Por eso, sus paquetes reflejan sus fortalezas!

*‚ÄúDominar un lenguaje es √∫til. Dominar sus paquetes‚Ä¶ es poderoso.‚Äù*

A medida que avances en ciencia de datos, estos paquetes ser√°n tus mejores aliados. Aprender√°s no solo a usarlos, sino a combinarlos como un verdadero cient√≠fico de datos.

¬°Esperamos que este cuaderno te sea de gran utilidad!
