In [None]:
# %% [markdown] 01_data_exploration.ipynb
# # Exploração de Dados sobre Nódulos Polimetálicos no Atlântico
# 
# Este notebook realiza uma exploração inicial dos dados coletados sobre nódulos polimetálicos no Oceano Atlântico, 
# incluindo localização, composição, preços de metais e fatores logísticos.

# %%
# Importar bibliotecas
import os
import sys
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar visualizações
plt.style.use('seaborn-whitegrid')
sns.set(style="whitegrid", font_scale=1.2)

# Adicionar o diretório src ao path
sys.path.append(os.path.abspath('../'))

# %%
# Carregar dados de exemplo
# Em um caso real, usaríamos os dados coletados
from src.data.isa_data_collector import download_isa_exploration_data, download_metal_price_data, download_atlantic_bathymetry_sample

# Obter dados
isa_data = download_isa_exploration_data()
price_data = download_metal_price_data()
bathymetry_data = download_atlantic_bathymetry_sample()

# %% [markdown]
# ## 1. Exploração de Contratos de Exploração da ISA

# %%
# Examinar dados de contratos
print("Resumo dos contratos de exploração da ISA:")
print(f"Número de contratos: {len(isa_data)}")
print("\nDistribuição por tipo de recurso:")
print(isa_data['resource_type'].value_counts())
print("\nDistribuição por localização:")
print(isa_data['location'].value_counts())
print("\nPrimeiros registros:")
isa_data.head()

# %% [markdown]
# ## 2. Análise de Preços de Metais

# %%
# Plotar séries temporais de preços
plt.figure(figsize=(12, 8))
for column in price_data.columns:
    plt.plot(price_data.index, price_data[column], label=column)
    
plt.title('Preços Históricos de Metais Encontrados em Nódulos Polimetálicos')
plt.xlabel('Data')
plt.ylabel('Preço (USD/tonelada)')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

# %%
# Calcular estatísticas básicas
price_stats = price_data.describe()
print("Estatísticas de preços (USD/tonelada):")
price_stats

# %%
# Calcular correlações entre preços
price_corr = price_data.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(price_corr, annot=True, cmap='coolwarm', vmin=-1, vmax=1)
plt.title('Correlação entre Preços de Metais')
plt.tight_layout()
plt.show()

# %% [markdown]
# ## 3. Exploração de Dados Batimétricos

# %%
# Plotar distribuição de profundidades
plt.figure(figsize=(10, 6))
sns.histplot(bathymetry_data['depth_m'], bins=30, kde=True)
plt.title('Distribuição de Profundidades no Atlântico (Amostra)')
plt.xlabel('Profundidade (m)')
plt.ylabel('Frequência')
plt.axvline(bathymetry_data['depth_m'].mean(), color='r', linestyle='--', label=f'Profundidade Média: {bathymetry_data["depth_m"].mean():.0f}m')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

# %%
# Plotar mapa de profundidades (visualização simplificada)
plt.figure(figsize=(12, 10))
plt.scatter(bathymetry_data['longitude'], bathymetry_data['latitude'], 
            c=bathymetry_data['depth_m'], cmap='viridis', alpha=0.7)
plt.colorbar(label='Profundidade (m)')
plt.title('Mapa de Profundidades no Atlântico (Amostra)')
plt.xlabel('Longitude')
plt.ylabel('Latitude')
plt.grid(True)
plt.tight_layout()
plt.show()

# %% [markdown]
# ## 4. Próximos Passos
# 
# Com base nesta exploração inicial, os próximos passos incluem:
# 
# 1. Coletar dados reais mais completos das fontes identificadas
# 2. Integrar dados de composição química de nódulos com dados de localização
# 3. Desenvolver análises de viabilidade econômica preliminares
# 4. Começar a implementar o framework de redes complexas baseado em LETE