In [1]:
!pip install numpy



In [2]:
!pip install pandas



In [3]:
!pip install matplotlib

Collecting matplotlib
  Downloading matplotlib-3.9.0-cp311-cp311-win_amd64.whl.metadata (11 kB)
Collecting contourpy>=1.0.1 (from matplotlib)
  Downloading contourpy-1.2.1-cp311-cp311-win_amd64.whl.metadata (5.8 kB)
Collecting cycler>=0.10 (from matplotlib)
  Downloading cycler-0.12.1-py3-none-any.whl.metadata (3.8 kB)
Collecting fonttools>=4.22.0 (from matplotlib)
  Downloading fonttools-4.53.0-cp311-cp311-win_amd64.whl.metadata (165 kB)
     ---------------------------------------- 0.0/165.5 kB ? eta -:--:--
     ------- ------------------------------- 30.7/165.5 kB 1.3 MB/s eta 0:00:01
     ------------------------- ------------ 112.6/165.5 kB 1.6 MB/s eta 0:00:01
     -------------------------------------- 165.5/165.5 kB 1.7 MB/s eta 0:00:00
Collecting kiwisolver>=1.3.1 (from matplotlib)
  Downloading kiwisolver-1.4.5-cp311-cp311-win_amd64.whl.metadata (6.5 kB)
Collecting pyparsing>=2.3.1 (from matplotlib)
  Downloading pyparsing-3.1.2-py3-none-any.whl.metadata (5.1 kB)
Downloading

In [4]:
!pip install seaborn

Collecting seaborn
  Downloading seaborn-0.13.2-py3-none-any.whl.metadata (5.4 kB)
Downloading seaborn-0.13.2-py3-none-any.whl (294 kB)
   ---------------------------------------- 0.0/294.9 kB ? eta -:--:--
   - -------------------------------------- 10.2/294.9 kB ? eta -:--:--
   ----- --------------------------------- 41.0/294.9 kB 487.6 kB/s eta 0:00:01
   ------------- ------------------------ 102.4/294.9 kB 837.8 kB/s eta 0:00:01
   ------------------------ --------------- 184.3/294.9 kB 1.1 MB/s eta 0:00:01
   -------------------------------------- - 286.7/294.9 kB 1.4 MB/s eta 0:00:01
   ---------------------------------------- 294.9/294.9 kB 1.3 MB/s eta 0:00:00
Installing collected packages: seaborn
Successfully installed seaborn-0.13.2


In [5]:
!pip install scikit-learn

Collecting scikit-learn
  Downloading scikit_learn-1.5.0-cp311-cp311-win_amd64.whl.metadata (11 kB)
Collecting scipy>=1.6.0 (from scikit-learn)
  Downloading scipy-1.13.1-cp311-cp311-win_amd64.whl.metadata (60 kB)
     ---------------------------------------- 0.0/60.6 kB ? eta -:--:--
     ------ --------------------------------- 10.2/60.6 kB ? eta -:--:--
     -------------------------------- ----- 51.2/60.6 kB 660.6 kB/s eta 0:00:01
     -------------------------------------- 60.6/60.6 kB 645.4 kB/s eta 0:00:00
Collecting joblib>=1.2.0 (from scikit-learn)
  Downloading joblib-1.4.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=3.1.0 (from scikit-learn)
  Downloading threadpoolctl-3.5.0-py3-none-any.whl.metadata (13 kB)
Downloading scikit_learn-1.5.0-cp311-cp311-win_amd64.whl (11.0 MB)
   ---------------------------------------- 0.0/11.0 MB ? eta -:--:--
   ---------------------------------------- 0.1/11.0 MB 2.0 MB/s eta 0:00:06
    ------------------------------------

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Carregar os dados
url = 'https://www.gov.br/receitafederal/dados/arrecadacao-estado.csv'
df = pd.read_csv(url)

# Selecionar as colunas relevantes
df = df[['Ano', 'Mês', 'UF', 'IMPOSTO SOBRE IMPORTAÇÃO', 'IMPOSTO SOBRE EXPORTAÇÃO']]

# Verificar valores nulos
print(df.isnull().sum())

# Preencher valores nulos com 0 (se necessário)
df = df.fillna(0)

# Codificar a coluna 'UF'
df = pd.get_dummies(df, columns=['UF'])

# Dividir as features e o label
features = df.drop(columns=['IMPOSTO SOBRE IMPORTAÇÃO'])
label = df['IMPOSTO SOBRE IMPORTAÇÃO']

# Dividir o dataset em treino e teste
X_train, X_test, y_train, y_test = train_test_split(features, label, test_size=0.2, random_state=42)

# Treinar o modelo KNN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Fazer previsões e calcular a acurácia
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f'Acurácia do modelo: {accuracy:.2f}')

# Análise das tendências de arrecadação
df_grouped = df.groupby('Ano').sum()[['IMPOSTO SOBRE IMPORTAÇÃO', 'IMPOSTO SOBRE EXPORTAÇÃO']]
df_grouped.plot(kind='line', figsize=(12, 6))
plt.title('Tendências de Arrecadação ao Longo dos Anos')
plt.ylabel('Arrecadação (R$)')
plt.xlabel('Ano')
plt.grid(True)
plt.show()

# Comparação entre estados
df_states = df.groupby('UF').sum()[['IMPOSTO SOBRE IMPORTAÇÃO', 'IMPOSTO SOBRE EXPORTAÇÃO']]
df_states.plot(kind='bar', figsize=(14, 7))
plt.title('Comparação de Arrecadação por Estado')
plt.ylabel('Arrecadação (R$)')
plt.xlabel('Estado')
plt.grid(True)
plt.show()

# Análise de sazonalidade
df_months = df.groupby('Mês').sum()[['IMPOSTO SOBRE IMPORTAÇÃO', 'IMPOSTO SOBRE EXPORTAÇÃO']]
df_months.plot(kind='line', figsize=(12, 6))
plt.title('Sazonalidade nas Receitas de Impostos')
plt.ylabel('Arrecadação (R$)')
plt.xlabel('Mês')
plt.grid(True)
plt.show()

# Análise de correlações
correlation = df[['IMPOSTO SOBRE IMPORTAÇÃO', 'IMPOSTO SOBRE EXPORTAÇÃO']].corr()
sns.heatmap(correlation, annot=True, cmap='coolwarm')
plt.title('Correlação entre as Receitas de Importação e Exportação')
plt.show()
