# Carga de Datos: Preparando el Producto Final

## Introducci√≥n
Es hora de almacenar nuestros datos procesados y realizar un an√°lisis preliminar.

## Objetivos
- Exportar datos en formatos √∫tiles
- Crear una base de datos estructurada
- Realizar visualizaciones b√°sicas

## Contenido
1. Exportaci√≥n a CSV y Parquet
2. Creaci√≥n de base de datos SQLite
3. Visualizaciones preliminares

# üéØ Carga de Datos: Preparando el Producto Final
## üåü Introducci√≥n
¬°Bienvenidos futuros ingenieros pesqueros! Hemos llegado a la etapa final de nuestro proceso ETL: la Carga de datos. En este cuaderno, aprenderemos c√≥mo almacenar nuestros datos procesados de manera que sean f√°cilmente accesibles para an√°lisis futuros.

## üìö ¬øQu√© aprenderemos?
- Exportar datos en diferentes formatos
- Crear y utilizar una base de datos SQLite
- Realizar visualizaciones b√°sicas de nuestros datos procesados

In [None]:
# Importamos las bibliotecas necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sqlite3
from sqlalchemy import create_engine
import os

# Configuraci√≥n de visualizaci√≥n
plt.rcParams['figure.figsize'] = (12, 6)
sns.set_theme(style="whitegrid")
sns.set_palette("deep")
%matplotlib inline

# Configuraci√≥n para mostrar todas las columnas
pd.set_option('display.max_columns', None)

üì• 2. Cargando Nuestros Datos Transformados

In [None]:
# Cargamos los datos transformados
df_desembarques = pd.read_csv("../data/processed/desembarques_transformados.csv")
df_oceano = pd.read_csv("../data/processed/oceanograficos_transformados.csv")
df_flota = pd.read_csv("../data/processed/flota_transformada.csv")

print("üìä Resumen de nuestros datos:")
print(f"Registros de desembarques: {len(df_desembarques)}")
print(f"Registros oceanogr√°ficos: {len(df_oceano)}")
print(f"Registros de flota: {len(df_flota)}")

## üíΩ 3. Exportaci√≥n a Diferentes Formatos
### 3.1 Exportaci√≥n a CSV (Formato m√°s com√∫n)

In [None]:
# Creamos el directorio si no existe
os.makedirs("../data/final", exist_ok=True)

# Exportamos a CSV
df_desembarques.to_csv("../data/final/desembarques_final.csv", index=False)
df_oceano.to_csv("../data/final/oceanograficos_final.csv", index=False)
df_flota.to_csv("../data/final/flota_final.csv", index=False)

print("‚úÖ Datos exportados exitosamente en formato CSV")

3.2 Exportaci√≥n a Excel (M√∫ltiples hojas)

In [None]:
# Creamos un archivo Excel con m√∫ltiples hojas
with pd.ExcelWriter("../data/final/datos_pesqueros_completos.xlsx") as writer:
    df_desembarques.to_excel(writer, sheet_name="Desembarques", index=False)
    df_oceano.to_excel(writer, sheet_name="Datos_Oceanograficos", index=False)
    df_flota.to_excel(writer, sheet_name="Flota", index=False)

print("‚úÖ Datos exportados exitosamente en formato Excel")

üóÑÔ∏è 4. Creaci√≥n de Base de Datos SQLite

In [None]:
# Crear conexi√≥n a la base de datos
db_path = "../data/final/pesquerias.db"
engine = create_engine(f'sqlite:///{db_path}')

# Exportar DataFrames a tablas SQLite
df_desembarques.to_sql('desembarques', engine, if_exists='replace', index=False)
df_oceano.to_sql('datos_oceanograficos', engine, if_exists='replace', index=False)
df_flota.to_sql('flota', engine, if_exists='replace', index=False)

print("‚úÖ Base de datos SQLite creada exitosamente")

## üìä 5. Visualizaciones B√°sicas
### 5.1 Desembarques por Especie y Puerto

In [None]:
# Gr√°fico de desembarques por especie
plt.figure(figsize=(12, 6))
sns.barplot(data=df_desembarques.groupby('especie')['captura_ton'].sum().reset_index(),
            x='especie', y='captura_ton')
plt.title('Desembarques Totales por Especie')
plt.xticks(rotation=45)
plt.ylabel('Toneladas')
plt.show()

5.2 Condiciones Oceanogr√°ficas por Zona

In [None]:
# Gr√°fico de condiciones oceanogr√°ficas
plt.figure(figsize=(12, 6))
sns.boxplot(data=df_oceano, x='zona', y='temperatura_c')
plt.title('Distribuci√≥n de Temperatura por Zona')
plt.xticks(rotation=45)
plt.ylabel('Temperatura (¬∞C)')
plt.show()

## üéì Conclusiones y Pr√≥ximos Pasos
En este cuaderno hemos aprendido:

1. C√≥mo exportar datos en diferentes formatos (CSV, Excel)
2. C√≥mo crear y utilizar una base de datos SQLite
3. C√≥mo realizar visualizaciones b√°sicas de nuestros datos
### üìö Para profundizar m√°s:
- Explorar otros formatos de almacenamiento (Parquet, HDF5)
- Aprender sobre bases de datos m√°s avanzadas (PostgreSQL, MySQL)
- Desarrollar visualizaciones interactivas con Plotly o Bokeh