# 0.1 - Control de calidad y depuración del merge

**Objetivo:**  
Verificar que todos los datasets procesados contengan datos, que las columnas clave (`Año`, `Mes`) coincidan en nombre, tipo y valores, y detectar posibles causas de un dataset final vacío tras el merge.

**Proyecto:** Predicción de volumen sostenible de centolla  
**Autor:** Rafael Mamani  
**Fecha:** [colocá la fecha actual]

---
## Montar Google Drive y ubicarse en el proyecto

Monto Google Drive y navego a la carpeta del repositorio para acceder a los datos procesados.

In [1]:
from google.colab import drive
drive.mount('/content/drive')
%cd /content/drive/MyDrive/ProyCentolla/PCentolla

Mounted at /content/drive
/content/drive/MyDrive/ProyCentolla/PCentolla


## Verificación de datasets procesados

Verifico que los archivos procesados tengan datos y sus columnas clave sean correctas.

In [2]:
import pandas as pd

# Cargar datasets procesados
centolla = pd.read_csv('data/processed/desembarque_centolla_2019_2024.csv')
esfuerzo = pd.read_csv('data/processed/esfuerzo_pesquero_punta_arenas_2019_2024.csv')
temperatura = pd.read_csv('data/processed/temperatura_punta_arenas_2019_2024.csv')
regulaciones = pd.read_csv('data/processed/regulaciones_centolla.csv')

# Shape y primeras filas
print("Centolla:", centolla.shape)
print(centolla.head())
print("Esfuerzo pesquero:", esfuerzo.shape)
print(esfuerzo.head())
print("Temperatura:", temperatura.shape)
print(temperatura.head())
print("Regulaciones:", regulaciones.shape)
print(regulaciones.head())

Centolla: (0, 15)
Empty DataFrame
Columns: [ESPECIE, ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV, DIC, Total, Año]
Index: []
Esfuerzo pesquero: (72, 7)
    Año  Mes        Puerto area_geografica tipo_arte  horas_pesca  \
0  2019    1  Punta Arenas      Magallanes   trampas          202   
1  2019    2  Punta Arenas      Magallanes   trampas          279   
2  2019    3  Punta Arenas      Magallanes   trampas          192   
3  2019    4  Punta Arenas      Magallanes   trampas          114   
4  2019    5  Punta Arenas      Magallanes   trampas          206   

   embarcaciones_activas  
0                      8  
1                      6  
2                     18  
3                     10  
4                     10  
Temperatura: (970, 3)
    Año  Mes  temp_promedio
0  2019    1          19.29
1  2019    2          18.68
2  2019    3          18.84
3  2019    4          17.99
4  2019    5          17.02
Regulaciones: (72, 3)
    Año  Mes  veda_centolla
0  2019    1         

## Chequeo de nombres, tipos y valores de las columnas clave (`Año`, `Mes`)

In [3]:
print("Centolla:", centolla.dtypes)
print("Esfuerzo pesquero:", esfuerzo.dtypes)
print("Temperatura:", temperatura.dtypes)
print("Regulaciones:", regulaciones.dtypes)

print("Años centolla:", centolla['Año'].unique())
print("Años esfuerzo:", esfuerzo['Año'].unique())
print("Años temperatura:", temperatura['Año'].unique())
print("Años regulaciones:", regulaciones['Año'].unique())

print("Meses esfuerzo:", esfuerzo['Mes'].unique())
print("Meses temperatura:", temperatura['Mes'].unique())
print("Meses regulaciones:", regulaciones['Mes'].unique())

Centolla: ESPECIE    object
ENE        object
FEB        object
MAR        object
ABR        object
MAY        object
JUN        object
JUL        object
AGO        object
SEP        object
OCT        object
NOV        object
DIC        object
Total      object
Año        object
dtype: object
Esfuerzo pesquero: Año                       int64
Mes                       int64
Puerto                   object
area_geografica          object
tipo_arte                object
horas_pesca               int64
embarcaciones_activas     int64
dtype: object
Temperatura: Año                int64
Mes                int64
temp_promedio    float64
dtype: object
Regulaciones: Año              int64
Mes              int64
veda_centolla    int64
dtype: object
Años centolla: []
Años esfuerzo: [2019 2020 2021 2022 2023 2024]
Años temperatura: [2019 2020 2021 2022 2023]
Años regulaciones: [2019 2020 2021 2022 2023 2024]
Meses esfuerzo: [ 1  2  3  4  5  6  7  8  9 10 11 12]
Meses temperatura: [ 1  2  3  4  5 