

# Análisis de Datos con Pandas

## Importar datos

Se pueden importar datos CSV, JSON, Excel, SQL, etc. con Pandas:


```python
import pandas as pd

df = pd.read_csv('datos.csv')
df = pd.read_json('datos.json') 
df = pd.read_excel('datos.xlsx')
```

## Limpieza de datos

Es importante hacer limpieza de datos faltantes, duplicados, etc:


```python
df.dropna()
df = df.fillna(0)
df = df.drop_duplicates()
```

## Análisis descriptivo

Pandas permite calcular estadísticas descriptivas:


```python
df.describe()
df.mean()
df.corr()
```

## Selección de datos

Se pueden seleccionar columnas, filas, subtablas:


```python 
df['columna']
df.loc[:, ['col1', 'col2']]
df[df['columna'] > 0]
```

## Agrupamiento y agregación

Agrupar y agregar cálculos por categorías:


```python
df.groupby('columna').mean()
df.groupby(['col1','col2']).agg({'col3': 'sum'})
df.pivot_table(index='col1', values='col2', aggfunc='count') 
```

## Unión y combinación

Combinar y unir diferentes DataFrames:


```python
pd.concat([df1, df2])
df1.merge(df2, on='columna') 
df1.join(df2, lsuffix='_izq')
```

## Visualización 

Generar gráficos con Pandas:


```python
df.plot()
df.plot.bar()
df['columna'].hist()
```

## Series de tiempo

Operaciones sobre series temporales:


```python
df.resample('M').mean() 
df.rolling(12).mean()
df.shift(periods=3)
```