## Resumen de los principales métodos de Pandas


### Selección y filtrado de datos:

``loc[]``: Selecciona datos por etiquetas.  
``iloc[]``: Selecciona datos por posición.  
``query()``: Filtra datos utilizando una expresión de cadena.

In [37]:
import pandas as pd
# Definir el DataFrame
df = pd.DataFrame({
    'Nombre': ['Ana', 'Juan', 'Pedro', 'Laura', 'Carlos'],
    'Edad': [23, 25, 28, 30, 22]
})

# Seleccionar una columna
edades = df['Edad']

# Filtrar filas basado en una condición
mayores_de_25 = df[df['Edad'] > 25]
print(mayores_de_25)

# Seleccionar una fila por etiqueta
fila_1 = df.loc[1]
print("\n", fila_1)

# Seleccionar una fila por posición
fila_2 = df.iloc[4]
print("\n", fila_2)

# Filtrar usando query
mayores_de_25 = df.query('Edad > 25')
print("\n", mayores_de_25)


  Nombre  Edad
2  Pedro    28
3  Laura    30

 Nombre    Juan
Edad        25
Name: 1, dtype: object

 Nombre    Carlos
Edad          22
Name: 4, dtype: object

   Nombre  Edad
2  Pedro    28
3  Laura    30


### Manipulación de datos:

``assign()``: Añade nuevas columnas a un DataFrame.  
``drop()``: Elimina filas o columnas.  
``rename()``: Cambia el nombre de las filas o columnas.  
``sort_values()``: Ordena los datos por valores.  

In [60]:
import pandas as pd
# Definir el DataFrame
df = pd.DataFrame({
    'Nombre': ['Ana', 'Juan', 'Pedro', 'Laura', 'Carlos'],
    'Edad': [23, 25, 28, 30, 22]
})
print(df)

# Agregar una nueva columna
df = df.assign(Edad_mas_5=df['Edad'] + 5)
print("\n", df)

# Eliminar una columna
df = df.drop(columns=['Edad_mas_5'])
print("\n", df)

# Ordenar los datos por una columna
df = df.sort_values(by='Edad').rename(columns={'Edad': 'Years'})
print("\n", df)


# Cambiar el nombre de una columna
df = df.rename(columns={'Edad': 'Years'})
print("\n", df)


   Nombre  Edad
0     Ana    23
1    Juan    25
2   Pedro    28
3   Laura    30
4  Carlos    22

    Nombre  Edad  Edad_mas_5
0     Ana    23          28
1    Juan    25          30
2   Pedro    28          33
3   Laura    30          35
4  Carlos    22          27

    Nombre  Edad
0     Ana    23
1    Juan    25
2   Pedro    28
3   Laura    30
4  Carlos    22

    Nombre  Years
4  Carlos     22
0     Ana     23
1    Juan     25
2   Pedro     28
3   Laura     30

    Nombre  Years
4  Carlos     22
0     Ana     23
1    Juan     25
2   Pedro     28
3   Laura     30


### Agrupación y agregación de datos:

``groupby()``: Agrupa los datos por una o más columnas.  
``agg()``: Aplica funciones de agregación a los grupos.  
``pivot_table()``: Crea una tabla pivote.

In [74]:
import pandas as pd

df = pd.DataFrame({
    'Ciudad': ['Madrid', 'Barcelona', 'Madrid', 'Barcelona', 'Madrid'],
    'Nombre': ['Ana', 'Juan', 'Pedro', 'Laura', 'Carlos'],
    'Años': [23, 25, 28, 30, 22]
})

# Agrupar por una columna y calcular la media de 'Años'
media_edad = df.groupby('Ciudad')['Años'].mean()
print("Media de años por ciudad:")
print(media_edad)

# Aplicar múltiples funciones de agregación
agg_funcs = df.groupby('Ciudad')['Años'].agg(['mean', 'sum', 'count'])
print("\nFunciones de agregación (media, suma, cuenta):")
print(agg_funcs)

# Crear una tabla pivote
tabla_pivote = df.pivot_table(values='Años', index='Ciudad', columns='Nombre', aggfunc='mean')
print("\nTabla pivote de años por ciudad y nombre:")
print(tabla_pivote)


Media de años por ciudad:
Ciudad
Barcelona    27.500000
Madrid       24.333333
Name: Años, dtype: float64

Funciones de agregación (media, suma, cuenta):
                mean  sum  count
Ciudad                          
Barcelona  27.500000   55      2
Madrid     24.333333   73      3

Tabla pivote de años por ciudad y nombre:
Nombre      Ana  Carlos  Juan  Laura  Pedro
Ciudad                                     
Barcelona   NaN     NaN  25.0   30.0    NaN
Madrid     23.0    22.0   NaN    NaN   28.0


### Lectura y escritura de datos:
**``read_sql()``: Lee un ? SQL y lo convierte en un DataFrame.  
``read_sql_table()``: Lee una tabla SQL y lo convierte en un DataFrame.   
``read_sql_query()``: Lee un query SQL y lo convierte en un DataFrame.   
``to_sql()``: Escribe un DataFrame en un SQL.**  
``read_csv()``: Lee un archivo CSV y lo convierte en un DataFrame.  
``to_csv()``: Escribe un DataFrame en un archivo CSV.  
``read_excel()``: Lee un archivo Excel y lo convierte en un DataFrame.  
``to_excel()``: Escribe un DataFrame en un archivo Excel.

In [None]:
import pandas as pd

# Leer un archivo CSV
df = pd.read_csv('archivo.csv')

# Escribir un DataFrame a un archivo CSV
df.to_csv('archivo_salida.csv', index=False)

# Leer un archivo Excel
df = pd.read_excel('archivo.xlsx')

# Escribir un DataFrame a un archivo Excel
df.to_excel('archivo_salida.xlsx', index=False)