In [4]:
import pandas as pd
from pymongo import MongoClient
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.model_selection import cross_val_score

# Connexion à MongoDB
client = MongoClient('localhost', 27017)
db = client['agriculture']
collection = db['irrigation_data']

# Charger les données de MongoDB dans un DataFrame pandas
data = pd.DataFrame(list(collection.find()))

# Supprimer l'ID MongoDB car il ne sera pas utilisé
data.drop('_id', axis=1, inplace=True)

# Pré-traiter les données
data = data.dropna()
data = pd.get_dummies(data)

# Séparer les caractéristiques (features) de la cible (target)
X = data.drop('Irrigation(Y/N)', axis=1)
y = data['Irrigation(Y/N)']

# Validation croisée pour évaluer le modèle
# `random_state` est un paramètre utilisé pour assurer la reproductibilité des résultats en fixant 
# la graine du générateur de nombres aléatoires dans les algorithmes de machine learning.
model = RandomForestClassifier(n_estimators=100, random_state=42)
scores = cross_val_score(model, X, y, cv=5)

print(f"Accuracy with cross validation: {scores.mean():.2f} ± {scores.std():.2f}")




Accuracy with cross validation: 0.95 ± 0.03


In [5]:
# Diviser les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Créer et entraîner le modèle
model.fit(X_train, y_train)

# Faire des prédictions
y_pred = model.predict(X_test)

# Calculer et afficher la précision
accuracy = accuracy_score(y_test, y_pred)

# Exemple de prédiction sur de nouvelles données
new_data = [[1, 5, 720, 18, 28, 63], [2, 1, 580, 20, 32, 55], [2, 3, 420, 21, 31, 54], [2, 5, 720, 18, 28, 63]]  
prediction = model.predict(new_data)
print("Prediction for new data:", prediction)

Prediction for new data: [1 1 0 1]


