In [12]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder

#Gerando dataset
n = 10000

columns = ['tipo_solo', 'ph_solo', 'nutrientes_solo', 'temperatura', 'precipitacao', 'semente']
data = []
np.random.seed(42)

for _ in range(n):
    semente = np.random.choice(['milho', 'soja', 'cevada'])
    
    #Aqui eu defino um pouco o dataset, para que não haja uma aleatoridade muito grande nos dados, claramente os dados não condizem com a realidade, visto que isso necessita de um estudo enorme por trás
    if semente == 'milho':
        tipo_solo = 'arenoso'
        ph_solo = np.random.uniform(4, 6)
        nutrientes_solo = np.random.uniform(60, 100)
        temperatura = np.random.uniform(10, 15)
        precipitacao = np.random.uniform(50, 100)
    elif semente == 'soja':
        tipo_solo = 'siltoso'
        ph_solo = np.random.uniform(6, 7)
        nutrientes_solo = np.random.uniform(40, 80)
        temperatura = np.random.uniform(20, 25)
        precipitacao = np.random.uniform(0, 50)
    elif semente == 'cevada':
        tipo_solo = 'argiloso'
        ph_solo = np.random.uniform(5, 7)
        nutrientes_solo = np.random.uniform(20, 60)
        temperatura = np.random.uniform(5, 10)
        precipitacao = np.random.uniform(50, 100)
    
    data.append([tipo_solo, ph_solo, nutrientes_solo, temperatura, precipitacao, semente])

df = pd.DataFrame(data, columns=columns)

label_encoder = LabelEncoder()
df['tipo_solo'] = label_encoder.fit_transform(df['tipo_solo'])
df['semente'] = label_encoder.fit_transform(df['semente'])

print(df.head())

   tipo_solo   ph_solo  nutrientes_solo  temperatura  precipitacao  semente
0          1  6.593086        27.337392     8.898455     79.842508        0
1          2  6.155995        42.323344    24.330881     30.055751        2
2          1  5.041169        58.796394     9.162213     60.616956        0
3          0  5.234963        84.466126    10.035332     51.153121        1
4          1  6.223706        25.579754     6.460723     68.318092        0


In [13]:
df.to_csv('dataset.csv', index=False)
print("Dataset salvo com sucesso!")

Dataset salvo com sucesso!


In [1]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder


df = pd.read_csv('dataset.csv')


df_copia = df.copy()


label_encoder = LabelEncoder()
df_copia['tipo_solo'] = label_encoder.fit_transform(df['tipo_solo'])
df_copia['semente'] = label_encoder.fit_transform(df['semente'])

print(df_copia.head())

   tipo_solo   ph_solo  nutrientes_solo  temperatura  precipitacao  semente
0          1  6.593086        27.337392     8.898455     79.842508        0
1          2  6.155995        42.323344    24.330881     30.055751        2
2          1  5.041169        58.796394     9.162213     60.616956        0
3          0  5.234963        84.466126    10.035332     51.153121        1
4          1  6.223706        25.579754     6.460723     68.318092        0


In [3]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler, OneHotEncoder

df = pd.read_csv('dataset.csv')

cat_columns = ['tipo_solo', 'ph_solo', 'semente']
df_copia = pd.get_dummies(df, columns=cat_columns)

scaler = MinMaxScaler()
df_normalizado = pd.DataFrame(scaler.fit_transform(df_copia), columns=df_copia.columns)

print(df_normalizado.head())

   nutrientes_solo  temperatura  precipitacao  tipo_solo_0  tipo_solo_1  \
0         0.091684     0.194926      0.798494          0.0          1.0   
1         0.279124     0.966570      0.300578          0.0          0.0   
2         0.485165     0.208115      0.606220          0.0          1.0   
3         0.806235     0.251772      0.511573          1.0          0.0   
4         0.069700     0.073036      0.683239          0.0          1.0   

   tipo_solo_2  ph_solo_4.001189516085315  ph_solo_4.001497618429743  \
0          0.0                        0.0                        0.0   
1          1.0                        0.0                        0.0   
2          0.0                        0.0                        0.0   
3          0.0                        0.0                        0.0   
4          0.0                        0.0                        0.0   

   ph_solo_4.002183082045914  ph_solo_4.002327328655957  ...  \
0                        0.0                        

In [21]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, MinMaxScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

df = pd.read_csv('dataset.csv')

X = df.drop('semente', axis=1)
y = df['semente']

label_encoder = LabelEncoder()
X['tipo_solo'] = label_encoder.fit_transform(X['tipo_solo'])
X['ph_solo'] = label_encoder.fit_transform(X['ph_solo'])

scaler = MinMaxScaler()
X[['nutrientes_solo', 'temperatura', 'precipitacao']] = scaler.fit_transform(X[['nutrientes_solo', 'temperatura', 'precipitacao']])

y_encoded = label_encoder.fit_transform(y)

X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.20, random_state=42)
#após testes, esse foi a configuração que rendeu 100%
model = MLPClassifier(hidden_layer_sizes=(6,6,6), activation='relu', max_iter=100000, learning_rate_init=0.0001)

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo no conjunto de teste: {accuracy}")

Acurácia do modelo no conjunto de teste: 1.0
