# DataFrame
Un DataFrame en Python es una estructura de datos bidimensional proporcionada por la biblioteca Pandas. Se asemeja a una hoja de c√°lculo de Excel o a una tabla en una base de datos, donde los datos se organizan en filas y columnas.

## Caracter√≠sticas principales:
- Filas y columnas: Cada columna puede contener un tipo de dato diferente (n√∫meros, cadenas, etc.), y cada fila representa una instancia de datos.
- Etiquetas: Tanto las filas como las columnas pueden tener etiquetas, lo que facilita la manipulaci√≥n y el acceso a los datos.
- M√©todos y atributos: Pandas ofrece una variedad de m√©todos para importar, manipular y analizar datos, como read_csv() para importar datos desde un archivo CSV, info() para obtener informaci√≥n sobre el DataFrame, y describe() para obtener estad√≠sticas descriptivas.
- Para crear un dataframe en python se debe hacer uso de la libreria pandas. 

## ¬øQu√© es una librer√≠a en Python?
Una librer√≠a en Python es una colecci√≥n de m√≥dulos y paquetes que contienen funciones, clases y m√©todos predefinidos. Estas librer√≠as extienden la funcionalidad b√°sica del lenguaje, permitiendo a los desarrolladores reutilizar c√≥digo y acceder a funcionalidades adicionales sin tener que escribir todo desde cero. Por ejemplo, hay librer√≠as para manipulaci√≥n de datos, visualizaci√≥n, aprendizaje autom√°tico, y mucho m√°s.

## ¬øQu√© es Pandas?
Pandas es una de las librer√≠as m√°s populares en Python para la manipulaci√≥n y an√°lisis de datos. Fue creada por Wes McKinney en 2008 y proporciona estructuras de datos poderosas y flexibles, como Series y DataFrames, que facilitan el trabajo con datos tabulares (similares a las hojas de c√°lculo de Excel).

Para usar la libreria pnadas en python debemos incluir el siguiente c√≥digo
```python
import pandas as pd
```




## Ejemplo b√°sico
```python
# Cargando la libreria pandas
import pandas as pd

# Crear un DataFrame a partir de un diccionario
data = {
    'Nombre': ['Ana', 'Luis', 'Mar√≠a'],
    'Edad': [23, 45, 34],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}

df = pd.DataFrame(data)

print(df)

```

In [8]:
# Cargando la libreria pandas
import pandas as pd

# Crear un DataFrame a partir de un diccionario
data = {
    'Nombre': ['Ana', 'Luis', 'Mar√≠a'],
    'Edad': [23, 45, 34],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia']
}

df = pd.DataFrame(data)

print(df)


  Nombre  Edad     Ciudad
0    Ana    23     Madrid
1   Luis    45  Barcelona
2  Mar√≠a    34   Valencia


## Crea un dataframe con los datos de las personas del curso, las columnas son: nombre, apellido, edad, mascota. La columna mascota es booleano y depende de si la persona tiene mascota o no.

## Datraframe a partir de un diccionario
Tu diccionario debe tener el siguiente formato:

Las claves del diccionario ser√°n los nombres de tus columnas.

Los valores asociados a cada clave deben ser listas (o arreglos de NumPy) que contengan los datos para esa columna espec√≠fica. Es crucial que todas estas listas tengan la misma longitud, ya que cada elemento en la misma posici√≥n de cada lista formar√° una fila del DataFrame.

## Ejemplo

```python
import pandas as pd
datos_alumnos = {
    'Nombre': ['Ana', 'Juan', 'Mar√≠a', 'Pedro'],
    'Edad': [20, 22, 21, 23],
    'Carrera': ['Ingenier√≠a', 'Derecho', 'Medicina', 'Arquitectura'],
    'Promedio': [8.5, 7.9, 9.1, 8.2]
}

```

In [10]:
import pandas as pd
datos_alumnos = {
    'Nombre': ['Ana', 'Juan', 'Mar√≠a', 'Pedro'],
    'Edad': [20, 22, 21, 23],
    'Carrera': ['Ingenier√≠a', 'Derecho', 'Medicina', 'Arquitectura'],
    'Promedio': [8.5, 7.9, 9.1, 8.2]
}
# Creamos el DataFrame a partir del diccionario
df_alumnos = pd.DataFrame(datos_alumnos)

# Mostramos el DataFrame para ver su contenido
print(df_alumnos)

  Nombre  Edad       Carrera  Promedio
0    Ana    20    Ingenier√≠a       8.5
1   Juan    22       Derecho       7.9
2  Mar√≠a    21      Medicina       9.1
3  Pedro    23  Arquitectura       8.2


Observa c√≥mo pandas ha interpretado autom√°ticamente:

Las claves del diccionario como los nombres de las columnas.

Las listas como los datos de cada columna.

Ha a√±adido un √≠ndice num√©rico por defecto (0, 1, 2, 3) para las filas.



## Otro ejemplo

```python
import pandas as pd

# Diccionario con informaci√≥n de productos
datos_productos = {
    'Producto': ['Laptop', 'Mouse', 'Teclado', 'Monitor'],
    'Precio': [1200, 25, 75, 300],
    'Stock': [50, 200, 150, 30],
    'Categoria': ['Electr√≥nica', 'Accesorios', 'Accesorios', 'Electr√≥nica']
}

# Crear el DataFrame
df_productos = pd.DataFrame(datos_productos)

# Imprimir el DataFrame
print(df_productos)
```

In [11]:
import pandas as pd

# Diccionario con informaci√≥n de productos
datos_productos = {
    'Producto': ['Laptop', 'Mouse', 'Teclado', 'Monitor'],
    'Precio': [1200, 25, 75, 300],
    'Stock': [50, 200, 150, 30],
    'Categoria': ['Electr√≥nica', 'Accesorios', 'Accesorios', 'Electr√≥nica']
}

# Crear el DataFrame
df_productos = pd.DataFrame(datos_productos)

# Imprimir el DataFrame
print(df_productos)

  Producto  Precio  Stock    Categoria
0   Laptop    1200     50  Electr√≥nica
1    Mouse      25    200   Accesorios
2  Teclado      75    150   Accesorios
3  Monitor     300     30  Electr√≥nica


# Data frame a partir de una lista

In [13]:
import pandas as pd

datos = [
    ['Ana', 23, 'Madrid'],
    ['Luis', 34, 'Barcelona'],
    ['Carlos', 45, 'Valencia']
]

columnas = ['Nombre', 'Edad', 'Ciudad']

df = pd.DataFrame(datos, columns=columnas)
print(df)


   Nombre  Edad     Ciudad
0     Ana    23     Madrid
1    Luis    34  Barcelona
2  Carlos    45   Valencia


# Data frame a partir de una lista de diccionarios

In [12]:
datos = [
    {'Nombre': 'Ana', 'Edad': 23, 'Ciudad': 'Madrid'},
    {'Nombre': 'Luis', 'Edad': 34, 'Ciudad': 'Barcelona'},
    {'Nombre': 'Carlos', 'Edad': 45, 'Ciudad': 'Valencia'}
]

df = pd.DataFrame(datos)
print(df)


   Nombre  Edad     Ciudad
0     Ana    23     Madrid
1    Luis    34  Barcelona
2  Carlos    45   Valencia


# Dataframe a patir de una lista simple


In [14]:
datos = ['Ana', 'Luis', 'Carlos']

df = pd.DataFrame(datos, columns=['Nombre'])
print(df)


   Nombre
0     Ana
1    Luis
2  Carlos


# Crear dataframe a partir de un archivo
### DataFrame a partir de un archivo CSV

```python
import pandas as pd

# Leer un archivo CSV y crear un DataFrame
df = pd.read_csv('archivo.csv')
print(df)
```

### Ejemplo carga el archivo datos.csv

In [18]:
import pandas as pd

# Cargar el archivo CSV
df1 = pd.read_csv('datos.csv')

# Mostrar el DataFrame
print(df1)

  Nombre  Edad   Curso  Nota
0    Ana    21  F√≠sica   6.5
1   Luis    22  F√≠sica   5.8
2  Carla    20  F√≠sica   7.2
3  Tom√°s    23  F√≠sica   4.9


### DataFrame a partir de un archivo Excel

```python
import pandas as pd

# Leer un archivo Excel y crear un DataFrame
df = pd.read_excel('datos.xlsx')
print(df)
```


In [21]:
import pandas as pd

# Leer un archivo Excel y crear un DataFrame
df = pd.read_excel('datos.xlsx')
print(df)

  Nombre  Edad   Curso  Nota
0    Ana    21  F√≠sica   6.5
1   Luis    22  F√≠sica   5.8
2  Carla    20  F√≠sica   7.2
3  Tom√°s    23  F√≠sica   4.9


## M√©todos de dataframes

# üìä M√©todos comunes de DataFrames en Pandas (con ejemplos)

## 1. `.head(n)`
**Muestra las primeras `n` filas del DataFrame.**
```python
df.head(3)
```

## 2. `.tail(n)`
**Muestra las √∫ltimas `n` filas del DataFrame.**
```python
df.tail(2)
```

## 3. `.info()`
**Muestra un resumen del DataFrame: columnas, tipos de datos, valores no nulos.**
```python
df.info()
```

## 4. `.describe()`
**Estad√≠sticas b√°sicas (media, desviaci√≥n, min, max...) de columnas num√©ricas.**
```python
df.describe()
```

## 5. `.shape`
**Devuelve una tupla con el n√∫mero de filas y columnas.**
```python
df.shape  # (filas, columnas)
```

## 6. `.columns`
**Devuelve el listado de nombres de columnas.**
```python
df.columns
```

## 7. `.dtypes`
**Devuelve el tipo de datos de cada columna.**
```python
df.dtypes
```

## 8. `.isnull()`
**Indica con True/False si un valor es nulo.**
```python
df.isnull()
```

## 9. `.dropna()`
**Elimina filas con valores nulos.**
```python
df.dropna()
```

## 10. `.fillna(valor)`
**Rellena los valores nulos con `valor`.**
```python
df.fillna(0)
```

## 11. `.sort_values(by='col')`
**Ordena el DataFrame seg√∫n una columna.**
```python
df.sort_values(by='Edad')
```

## 12. `.groupby('col')`
**Agrupa datos por una columna (√∫til para operaciones estad√≠sticas).**
```python
df.groupby('Ciudad').mean()
```

## 13. `.value_counts()`
**Cuenta la frecuencia de cada valor en una columna.**
```python
df['Ciudad'].value_counts()
```

## 14. `.loc[filas, columnas]`
**Accede a filas/columnas por etiqueta.**
```python
df.loc[0, 'Nombre']  # primer nombre
```

## 15. `.iloc[fila, columna]`
**Accede por posici√≥n (√≠ndice entero).**
```python
df.iloc[0, 1]  # valor en fila 0, columna 1
```

## 16. `.rename(columns={'ViejoNombre': 'NuevoNombre'})`
**Renombra columnas.**
```python
df.rename(columns={'Edad': 'A√±os'})
```

## 17. `.drop('col', axis=1)`
**Elimina una columna.**
```python
df.drop('Ciudad', axis=1)
```

## 18. `.apply(func)`
**Aplica una funci√≥n a cada valor de una columna.**
```python
df['Edad'].apply(lambda x: x + 1)
```

## 19. `.astype(tipo)`
**Cambia el tipo de datos de una columna.**
```python
df['Edad'] = df['Edad'].astype(float)
```

## 20. `.duplicated()`
**Detecta filas duplicadas.**
```python
df.duplicated()
```