In [2]:
#IMPORTANDO BIBLIOTECAS
import numpy as np
import pandas as pd
import random
import csv
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
import datetime

In [3]:
# INTERVALOS DE VALORES PARA OS CAMPOS
loa_min = 15
loa_max = 60

boca_min = 6
boca_max = 18

dwt_min = 30000
dwt_max = 200000

calado_entrada_min = 8
calado_entrada_max = 20

calado_saida_min = 8
calado_saida_max = 20

calado_aereo_min = 10
calado_aereo_max = 35

pontal_min = 5
pontal_max = 20

tamanho_lanca_min = 10
tamanho_lanca_max = 120

ano_construcao_min = 1990
ano_construcao_max = 2023

tipos_navio = ['GS', 'CG', 'GSM', 'GL', 'GLP', 'CNTR']


In [4]:
# NUMERO DE AMOSTRAS QUE SERÃO GERADAS
num_amostras = 2000

# GERAÇÃO DE VALORES ALEATÓRIOS VIA NUMPY
np.random.seed(0)
random.seed(0)

nomes = np.array(['Navio' + str(i) for i in range(1, num_amostras + 1)])

loa = np.random.randint(loa_min, loa_max, num_amostras)

boca = np.random.randint(boca_min, boca_max, num_amostras)

dwt = np.random.randint(dwt_min, dwt_max, num_amostras)

calado_entrada = np.random.randint(calado_entrada_min, calado_entrada_max, num_amostras)

calado_saida = np.random.randint(calado_saida_min, calado_saida_max, num_amostras)

calado_aereo = np.random.randint(calado_aereo_min, calado_aereo_max, num_amostras)

pontal = np.random.randint(pontal_min, pontal_max, num_amostras)

tamanho_lanca = np.random.randint(tamanho_lanca_min, tamanho_lanca_max, num_amostras)

ano_construcao = np.random.randint(ano_construcao_min, ano_construcao_max, num_amostras)

ultimo_porto = np.array(['Porto' + str(i) for i in np.random.randint(1, 6, num_amostras)])

proximo_porto = np.array(['Porto' + str(i) for i in np.random.randint(1, 6, num_amostras)])

tipo_navio = [random.choice(tipos_navio) for _ in range(num_amostras)]



In [5]:
#CRIAÇÃO DE DATAFRAME COM VALORES
data = {
    'Nome': nomes,
    'LOA (m)': loa,
    'Boca (m)': boca,
    'DWT (ton)': dwt,
    'Calado de Entrada (m)': calado_entrada,
    'Calado de Saída (m)': calado_saida,
    'Calado Aéreo (m)': calado_aereo,
    'Pontal (m)': pontal,
    'Tamanho de Lança (m)': tamanho_lanca,
    'Ano de Construção': ano_construcao,
    'Tipo do Navio': tipo_navio,
    'Último Porto': ultimo_porto,
    'Próximo Porto': proximo_porto
    
}

df = pd.DataFrame(data)

In [7]:
#CRIACAO DE CONDICOES
def determinar_classificacao(df):
    condicao_loa = df['LOA (m)'] <= 280
    condicao_boca = df['Boca (m)'] <= 50
    condicao_dwt = df['DWT (ton)'] <= 155000
    condicao_ce = df['Calado de Entrada (m)'] <= 18.5
    condicao_cs = df['Calado de Saída (m)'] <= 18.5
    condicao_idade = 2023 - df['Ano de Construção'] < 18

    combinacao = condicao_loa and condicao_boca and condicao_dwt and condicao_ce and condicao_cs and condicao_idade
    return 1 if combinacao else 0

In [13]:
df['Situação'] = df.apply(determinar_classificacao, axis=1)
df.head(30)

Unnamed: 0,Nome,LOA (m),Boca (m),DWT (ton),Calado de Entrada (m),Calado de Saída (m),Calado Aéreo (m),Pontal (m),Tamanho de Lança (m),Ano de Construção,Tipo do Navio,Último Porto,Próximo Porto,Situação
0,Navio1,59,12,93953,11,8,21,14,16,2011,GL,Porto3,Porto1,1
1,Navio2,15,11,144548,9,8,25,6,90,1995,GL,Porto1,Porto4,0
2,Navio3,18,7,108851,11,18,20,19,42,2010,GS,Porto5,Porto1,1
3,Navio4,18,16,111313,16,14,31,9,44,2019,GSM,Porto4,Porto5,1
4,Navio5,54,11,47921,11,10,21,12,20,2002,GLP,Porto2,Porto3,0
5,Navio6,24,7,168680,18,11,28,16,74,2002,GL,Porto1,Porto2,0
6,Navio7,34,15,76897,14,19,20,5,93,2015,GL,Porto2,Porto3,0
7,Navio8,36,8,125016,12,14,22,10,54,1996,GSM,Porto5,Porto1,0
8,Navio9,51,9,57730,15,17,26,18,68,2021,GL,Porto2,Porto5,1
9,Navio10,38,6,104038,19,9,32,9,40,1996,GSM,Porto5,Porto4,0


In [10]:
# Defina as características (X) e o alvo (y)
X = data[['LOA (m)', 'Boca (m)', 'DWT (ton)', 'Ano de Construção']]
y = data['Próximo Porto']

In [11]:
# Defina os limites
limite_comprimento_berco = 340
idade_maxima_navio = 18

# Filtrar dados com base nos limites
data = data[(data['LOA (m)'] <= limite_comprimento_berco) & ((data_hora_atual.year - data['Ano de Construção']) <= idade_maxima_navio)]


In [12]:
# Divida os dados em conjunto de treinamento e conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crie o modelo de Random Forest
model = RandomForestClassifier(n_estimators=100, random_state=42)


In [15]:
# Treine o modelo
model.fit(X_train, y_train)

# Faça previsões no conjunto de teste
y_pred = model.predict(X_test)

# Avalie a precisão do modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Acurácia do modelo: {accuracy}')

Acurácia do modelo: 0.225


  if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
  if not hasattr(array, "sparse") and array.dtypes.apply(is_sparse).any():
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
  if is_sparse(pd_dtype):
  if is_sparse(pd_dtype) or not is_extension_array_dtype(pd_dtype):
