# Análisis de Datos desde SQLite

En este notebook vamos a leer datos de la base de datos `database/datos.db` usando pandas y crear visualizaciones interesantes.

In [None]:
# Cerrar la conexión a la base de datos
conn.close()
print("✓ Conexión cerrada exitosamente")

## 6. Cerrar la Conexión

Cerramos la conexión a la base de datos.

In [None]:
# Crear visualizaciones para las tablas numéricas
for table_name, df in dataframes.items():
    # Obtener solo columnas numéricas
    numeric_cols = df.select_dtypes(include=['number']).columns
    
    if len(numeric_cols) > 0:
        print(f"\nVisualizaciones para la tabla: {table_name}")
        
        # Si hay columnas numéricas, crear gráficos
        if len(numeric_cols) == 1:
            # Histograma
            fig, ax = plt.subplots()
            df[numeric_cols[0]].hist(bins=30, ax=ax, color='skyblue', edgecolor='black')
            ax.set_title(f'Distribución de {numeric_cols[0]} - {table_name}')
            ax.set_xlabel(numeric_cols[0])
            ax.set_ylabel('Frecuencia')
            plt.tight_layout()
            plt.show()
        
        elif len(numeric_cols) >= 2:
            # Gráfico de dispersión
            fig, ax = plt.subplots()
            ax.scatter(df[numeric_cols[0]], df[numeric_cols[1]], alpha=0.6)
            ax.set_title(f'Relación entre {numeric_cols[0]} y {numeric_cols[1]}')
            ax.set_xlabel(numeric_cols[0])
            ax.set_ylabel(numeric_cols[1])
            plt.tight_layout()
            plt.show()
            
            # Box plots para comparación
            fig, axes = plt.subplots(1, len(numeric_cols), figsize=(15, 5))
            if len(numeric_cols) == 1:
                axes = [axes]
            
            for idx, col in enumerate(numeric_cols):
                df[col].plot(kind='box', ax=axes[idx])
                axes[idx].set_title(f'Box Plot de {col}')
            
            plt.tight_layout()
            plt.show()
    else:
        print(f"\nNo hay columnas numéricas en la tabla: {table_name}")

## 5. Crear Visualizaciones

Generamos gráficos diversos para visualizar los datos.

In [None]:
# Explorar cada tabla
for table_name, df in dataframes.items():
    print(f"\n{'='*60}")
    print(f"TABLA: {table_name}")
    print(f"{'='*60}")
    
    print(f"\nForma del DataFrame: {df.shape}")
    
    print("\nTipos de datos:")
    print(df.dtypes)
    
    print("\nPrimeras 5 filas:")
    print(df.head())
    
    print("\nValores nulos:")
    print(df.isnull().sum())
    
    print("\nEstadísticas descriptivas:")
    print(df.describe())

## 4. Explorar los Datos

Analizamos la estructura, tipos de datos, valores nulos y estadísticas de los datos.

In [None]:
# Obtener lista de tablas en la base de datos
query = "SELECT name FROM sqlite_master WHERE type='table';"
tables = pd.read_sql_query(query, conn)
print("Tablas disponibles en la base de datos:")
print(tables)
print()

# Cargar datos de cada tabla
dataframes = {}
for table_name in tables['name']:
    try:
        df = pd.read_sql_query(f"SELECT * FROM {table_name}", conn)
        dataframes[table_name] = df
        print(f"✓ Tabla '{table_name}' cargada: {df.shape[0]} filas, {df.shape[1]} columnas")
    except Exception as e:
        print(f"✗ Error al cargar tabla '{table_name}': {e}")
        
print("\nDatos cargados en diccionario 'dataframes'")

## 3. Cargar Datos con Pandas

Leemos los datos de las tablas de la base de datos usando pandas.

In [None]:
# Definir la ruta a la base de datos
db_path = '../database/datos.db'

# Verificar si el archivo existe
if os.path.exists(db_path):
    print(f"✓ Base de datos encontrada: {db_path}")
    
    # Crear conexión a SQLite
    conn = sqlite3.connect(db_path)
    print("✓ Conexión establecida exitosamente")
else:
    print(f"✗ No se encontró la base de datos en: {db_path}")

## 2. Conectar a la Base de Datos SQLite

Establecemos la conexión a la base de datos `database/datos.db`.

In [None]:
import pandas as pd
import sqlite3
import matplotlib.pyplot as plt
import seaborn as sns
import os

# Configurar el estilo de los gráficos
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)

## 1. Importar Librerías Requeridas

Importamos las librerías necesarias para manipulación de datos, conexión a la base de datos y visualización.