# Resumen

**Pandas** es una de las bibliotecas m√°s importantes de Python para **an√°lisis y manipulaci√≥n de datos**. Est√° dise√±ada para trabajar con datos estructurados (como tablas) de manera eficiente y f√°cil. Aqu√≠ te explico sus principales funcionalidades:

## **1. Estructuras de datos principales**
- **`Series`**:  
  - Un array unidimensional (como una columna de Excel).  
  - Ejemplo:  
    ```python
    import pandas as pd
    datos = pd.Series([10, 20, 30], name="Edad")
    ```

- **`DataFrame`**:  
  - Una tabla bidimensional (como una hoja de Excel o SQL).  
  - Ejemplo:  
    ```python
    datos = pd.DataFrame({
        "Nombre": ["Ana", "Juan", "Luis"],
        "Edad": [25, 30, 35]
    })
    ```

---

## **2. Funcionalidades clave**
### **üìä Carga y guardado de datos**
- Lee/escribe desde m√∫ltiples formatos:  
  ```python
  # CSV, Excel, JSON, SQL, etc.
  df = pd.read_csv("datos.csv")
  df.to_excel("salida.xlsx")
  ```

### **üîç Manipulaci√≥n de datos**
- **Filtrar datos**:  
  ```python
  df[df["Edad"] > 30]  # Personas mayores de 30 a√±os.
  ```
- **Agregar/eliminar columnas**:  
  ```python
  df["Ciudad"] = ["Madrid", "Barcelona", "Valencia"]  # A√±adir columna.
  df.drop("Edad", axis=1, inplace=True)  # Eliminar columna.
  ```

### **üìà Operaciones estad√≠sticas**
- **Res√∫menes r√°pidos**:  
  ```python
  df.describe()  # Media, percentiles, etc.
  df["Edad"].mean()  # Promedio de edades.
  ```

### **üîÑ Limpieza de datos**
- **Manejo de valores nulos**:  
  ```python
  df.dropna()  # Elimina filas con valores faltantes.
  df.fillna(0)  # Rellena con ceros.
  ```
- **Eliminar duplicados**:  
  ```python
  df.drop_duplicates()
  ```

### **üìä Agrupaci√≥n y agregaci√≥n**
- **Agrupar por categor√≠as**:  
  ```python
  df.groupby("Ciudad")["Edad"].mean()  # Edad promedio por ciudad.
  ```

### **‚è≥ Manejo de series temporales**
- **Fechas como √≠ndice**:  
  ```python
  df["Fecha"] = pd.to_datetime(df["Fecha"])
  df.set_index("Fecha", inplace=True)
  ```

### **üîó Combinaci√≥n de datos**
- **Unir tablas (como SQL)**:  
  ```python
  pd.merge(df1, df2, on="ID")  # Inner join.
  ```

---

## **3. Visualizaci√≥n (integrado con Matplotlib/Seaborn)**
```python
df["Edad"].plot(kind="hist")  # Histograma.
df.plot.scatter(x="Edad", y="Ingresos")  # Gr√°fico de dispersi√≥n.
```

---

## **4. Rendimiento optimizado**
- **Operaciones vectorizadas**: M√°s r√°pidas que los bucles `for`.  
- **Compatibilidad con big data**: Integraci√≥n con **Dask** o **modin** para datasets grandes.

---

## **Ejemplo completo**
```python
import pandas as pd

# Cargar datos
datos = pd.read_csv("clientes.csv")

# Limpiar y transformar
datos = datos.dropna()
datos["Ingresos_Anuales"] = datos["Ventas"] * 0.30  # Nueva columna.

# An√°lisis
print(datos.groupby("Regi√≥n")["Ingresos_Anuales"].sum())

# Guardar
datos.to_excel("resultados.xlsx")
```

---

### **üìå ¬øPara qu√© se usa Pandas en proyectos reales?**
- **Ciencia de datos**: Preprocesamiento para machine learning.  
- **Finanzas**: An√°lisis de series temporales.  
- **Web scraping**: Organizar datos extra√≠dos.  
- **Automoci√≥n**: Procesamiento de datos de sensores.  

Es una herramienta **imprescindible** si trabajas con datos en Python. üöÄ

# Borrar

```{figure} ../pandas_tic_2/imagenes/dataframe.png
---
width: 70%
name: demoexample1
align: center
---
example 1: width (70%) as percentage, align center


```{figure} ../pandas_tic_2/imagenes/dataframe.png
---
figclass: margin
name: demoexample1
---
Figura: Ejemplo de un DataFrame mostrado en el margen.


{bdg}`plain badge`

{bdg-secondary}`secondary`, {bdg-secondary-line}`secondary-line`