<a href="https://colab.research.google.com/github/financieras/dataframe/blob/main/pandas/dataframe00.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Apuntes de Pandas: El DataFrame (DataFrame)

Pasemos al pilar central de Pandas y la estructura de datos que usarás en el 95% de los proyectos: el **DataFrame**.

### 1\. Concepto: ¿Qué es un DataFrame?

Si una **Serie** era una sola columna, un **DataFrame** es la tabla completa: una **estructura bidimensional** con filas y columnas, muy similar a una hoja de cálculo de Excel o a una tabla de una base de datos.

[Image of a spreadsheet with rows and columns]

Es la estructura de datos más utilizada en Pandas. Es importante recordar que **cada columna de un DataFrame es, en realidad, una Serie de Pandas**. Todas las columnas comparten el mismo índice de filas.

| Componente | Definición |
| :--- | :--- |
| **Índice ($\\text{Index}$)** | Las etiquetas de las **filas** (por defecto, 0, 1, 2...). |
| **Columnas ($\\text{Columns}$)** | Las etiquetas de las **columnas** (los nombres). |
| **Datos ($\\text{Data}$)** | Los valores que contiene la tabla. |

-----

### 2\. Creación de DataFrames

Aunque la forma más habitual de trabajar con DataFrames es cargándolos desde ficheros ($\\text{CSV}$, $\\text{Excel}$, etc.), es esencial saber crearlos a mano para entender su estructura interna.

#### Ejemplo 1: A partir de un Diccionario de Listas ($\\text{Método más Común}$)

Esta es la forma más directa y popular. Las **claves** del diccionario son los **nombres de las columnas**, y los **valores** son las listas de datos.

In [None]:
import pandas as pd

# Creamos un diccionario donde cada clave es una columna
datos_ventas = {
    'Dia': ['Lunes', 'Martes', 'Miércoles', 'Jueves'],
    'Ventas': [150, 200, 120, 310],
    'Visitantes': [25, 35, 18, 40]
}

# Creamos el DataFrame
df_ventas = pd.DataFrame(datos_ventas)

print(df_ventas)

**Resultado:**

```
         Dia  Ventas  Visitantes
0      Lunes     150          25
1     Martes     200          35
2  Miércoles     120          18
3     Jueves     310          40
```

-----

#### Ejemplo 2: A partir de una Lista de Diccionarios ($\\text{Método Orientado a Filas}$)

Este método es muy útil cuando los datos se generan o se recuperan fila por fila (por ejemplo, desde una $\\text{API}$). Cada diccionario de la lista representa una **fila**.

In [None]:
import pandas as pd

# Creamos una lista donde cada diccionario es una fila
datos_alumnos = [
    {'nombre': 'Ana', 'edad': 22, 'ciudad': 'Madrid'},
    {'nombre': 'Luis', 'edad': 25, 'ciudad': 'Barcelona'},
    {'nombre': 'Marta', 'edad': 23, 'ciudad': 'Valencia'}
]

# Creamos el DataFrame
df_alumnos = pd.DataFrame(datos_alumnos)

print(df_alumnos)

**Resultado:**

```
  nombre  edad     ciudad
0    Ana    22     Madrid
1   Luis    25  Barcelona
2  Marta    23   Valencia
```

-----

### 3\. Reto Práctico: Dataframe de Países y Capitales

**Enunciado:** Crear un $\\text{DataFrame}$ llamado $\\text{df\_paises}$ con 3 columnas ($\\text{pais}$, $\\text{capital}$ y $\\text{poblacion}$ en millones) y 4 filas de países a tu elección.

A continuación, se muestran los dos métodos principales para resolverlo.

#### Solución A: Usando una Lista de Diccionarios ($\\text{Tu Propuesta}$)

Este método es legible y natural, organizando la información por entidad (fila).

In [None]:
import pandas as pd

# Lista donde cada diccionario es una fila
df_paises = [
    {'pais': 'España', 'capital': 'Madrid', 'poblacion': 49.1},
    {'pais': 'Francia', 'capital': 'París', 'poblacion': 68.6},
    {'pais': 'Alemania', 'capital': 'Berlín', 'poblacion': 83.6},
    {'pais': 'Italia', 'capital': 'Roma', 'poblacion': 58.9}
]

# Creación del DataFrame
df_paises = pd.DataFrame(df_paises)

print(df_paises)

#### Solución B: Usando un Diccionario de Listas ($\\text{Método Alternativo}$)

Este método es más **conciso** y se alinea con la forma en que Pandas organiza los datos internamente (por columnas).

In [None]:
import pandas as pd

# Diccionario donde cada clave es una columna
datos_paises = {
    'pais': ['España', 'Francia', 'Alemania', 'Italia'],
    'capital': ['Madrid', 'París', 'Berlín', 'Roma'],
    'poblacion': [49.1, 68.6, 83.6, 58.9]
}

# Creación del DataFrame
df_paises_alt = pd.DataFrame(datos_paises)

print(df_paises_alt)

**Resultado de ambos métodos:**

```
       pais capital  poblacion
0    España  Madrid       49.1
1   Francia   París       68.6
2  Alemania  Berlín       83.6
3     Italia    Roma       58.9
```