<a href="https://colab.research.google.com/github/Angelasilva15/inform-tica/blob/main/exporta%C3%A7%C3%A3o.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [6]:
import pandas as pd
import glob
import os

def analyze_export_data():
    """
    Carrega, consolida e analisa dados de exportação de múltiplos arquivos CSV.
    """
    all_files = glob.glob(os.path.join(os.getcwd(), "/EXP_2021_MUN.csv"))

    if not all_files:
        print("Nenhum arquivo 'EXP_*.csv' encontrado no diretório atual.")
        return

    df_list = []
    for f in all_files:
        try:
            df = pd.read_csv(f, sep=';', on_bad_lines='skip')
            df_list.append(df)
        except Exception as e:
            print(f"Erro ao ler o arquivo {f}: {e}")

    if not df_list:
        print("Não foi possível carregar nenhum arquivo.")
        return

    combined_df = pd.concat(df_list, ignore_index=True)

    # Convertendo colunas para o tipo correto, lidando com erros
    for col in ['CO_ANO', 'CO_MES', 'KG_LIQUIDO', 'VL_FOB']:
        combined_df[col] = pd.to_numeric(combined_df[col], errors='coerce')

    print("--- Visão Geral dos Dados ---")
    print(combined_df.head())
    print("\n--- Informações da Tabela ---")
    combined_df.info()

    print("\n--- Estatísticas Descritivas ---")
    print(combined_df[['KG_LIQUIDO', 'VL_FOB']].describe())

    print("\n--- Análise por Ano (Valor Total em FOB) ---")
    total_fob_by_year = combined_df.groupby('CO_ANO')['VL_FOB'].sum().sort_index()
    print(total_fob_by_year)

    print("\n--- Top 10 Estados por Valor de Exportação ---")
    top_states = combined_df.groupby('SG_UF_MUN')['VL_FOB'].sum().nlargest(10)
    print(top_states)

if __name__ == "__main__":
    analyze_export_data()

--- Visão Geral dos Dados ---
   CO_ANO  CO_MES   SH4  CO_PAIS SG_UF_MUN   CO_MUN  KG_LIQUIDO  VL_FOB
0    2021       3  3305      493        SP  3434401         966    7788
1    2021       7  8419      386        SP  3409502           1    1544
2    2021      12  8511       63        PR  4106902          73     907
3    2021       7  6204      586        SC  4202909          75    3942
4    2021       8  8708       63        SP  3440002        6949   29604

--- Informações da Tabela ---
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1075522 entries, 0 to 1075521
Data columns (total 8 columns):
 #   Column      Non-Null Count    Dtype 
---  ------      --------------    ----- 
 0   CO_ANO      1075522 non-null  int64 
 1   CO_MES      1075522 non-null  int64 
 2   SH4         1075522 non-null  int64 
 3   CO_PAIS     1075522 non-null  int64 
 4   SG_UF_MUN   1075522 non-null  object
 5   CO_MUN      1075522 non-null  int64 
 6   KG_LIQUIDO  1075522 non-null  int64 
 7   VL_FOB      

In [None]:
from google.colab import drive
drive.mount('/content/drive')