# Visualización y Exploración de Datos

Este notebook cubre técnicas para visualizar y explorar datos en pandas.

In [None]:
import numpy as np
import pandas as pd

# Crear datos de ejemplo
np.random.seed(42)
fechas = pd.date_range('20240101', periods=10)
df = pd.DataFrame({
    'A': np.random.randn(10),
    'B': np.random.randn(10),
    'C': np.random.randint(1, 100, 10),
    'D': ['grupo1', 'grupo2', 'grupo1', 'grupo2', 'grupo1', 
          'grupo2', 'grupo1', 'grupo2', 'grupo1', 'grupo2']
}, index=fechas)

print("DataFrame de ejemplo:")
print(df)

## Métodos Básicos de Visualización

In [None]:
# Primeras y últimas filas
print("Primeras 3 filas:")
print(df.head(3))

print("\nÚltimas 3 filas:")
print(df.tail(3))

# Información del DataFrame
print("\nInformación del DataFrame:")
print(f"Forma: {df.shape}")
print(f"Índice: {df.index}")
print(f"Columnas: {df.columns.tolist()}")
print(f"Tipos de datos:\n{df.dtypes}")

In [None]:
# Estadísticas descriptivas
print("Estadísticas descriptivas:")
print(df.describe())

print("\nEstadísticas solo para columnas numéricas:")
print(df.describe(include=[np.number]))

print("\nEstadísticas para columnas categóricas:")
print(df.describe(include=['object']))

## Transposición y Ordenamiento

In [None]:
# Transponer el DataFrame
print("DataFrame transpuesto:")
print(df.T)

# Ordenar por índice
print("\nOrdenar por índice (descendente):")
print(df.sort_index(ascending=False).head())

# Ordenar por columnas
print("\nOrdenar columnas alfabéticamente:")
print(df.sort_index(axis=1))

In [None]:
# Ordenar por valores
print("Ordenar por columna B (ascendente):")
print(df.sort_values(by='B'))

print("\nOrdenar por múltiples columnas:")
print(df.sort_values(by=['D', 'C'], ascending=[True, False]))

## Información Detallada y Resúmenes

In [None]:
# Información detallada del DataFrame
print("Información detallada:")
df.info()

print("\nMemoria utilizada:")
print(df.memory_usage(deep=True))

print("\nNúmero de valores únicos por columna:")
print(df.nunique())

print("\nValores únicos en columna D:")
print(df['D'].unique())

In [None]:
# Conteo de valores
print("Conteo de valores en columna D:")
print(df['D'].value_counts())

print("\nConteo de valores nulos:")
print(df.isnull().sum())

print("\nConteo de valores no nulos:")
print(df.count())

## Muestreo y Visualización Rápida

In [None]:
# Muestra aleatoria
print("Muestra aleatoria de 3 filas:")
print(df.sample(3))

print("\nMuestra aleatoria del 30% de los datos:")
print(df.sample(frac=0.3))

# Percentiles específicos
print("\nPercentiles específicos para columna C:")
print(df['C'].quantile([0.25, 0.5, 0.75, 0.9]))