In [None]:
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score
from sklearn.model_selection import train_test_split

# Excel dosyasından verileri oku
df = pd.read_excel('/content/COVIDSONRASI.xlsx')

# NaN değerlere sahip satırları çıkar
df = df.dropna(subset=['tweets', 'total'])

# Özellik çıkarma: Tweetleri kelime sayısına göre özellik olarak temsil et
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(df['tweets'].values.astype(str))

# Etiketleri al
y = df['total'].values

# Veri kümesini eğitim ve test kümelerine ayır
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Random Forest modelini eğit
rf_clf = RandomForestClassifier()
rf_clf.fit(X_train, y_train)

# Test kümesini kullanarak modeli değerlendir
y_pred = rf_clf.predict(X_test)

# Doğruluk oranını hesapla
accuracy = accuracy_score(y_test, y_pred)
print("Modelin doğruluk oranı: {:.2%}".format(accuracy))

# Recall değerini hesapla (Makro, Mikro)
recall_macro = recall_score(y_test, y_pred, average='macro')
recall_micro = recall_score(y_test, y_pred, average='micro')
print("Recall (Macro): {:.2%}".format(recall_macro))
print("Recall (Micro): {:.2%}".format(recall_micro))

# Precision değerini hesapla (Makro, Mikro)
precision_macro = precision_score(y_test, y_pred, average='macro')
precision_micro = precision_score(y_test, y_pred, average='micro')
print("Precision (Macro): {:.2%}".format(precision_macro))
print("Precision (Micro): {:.2%}".format(precision_micro))

# F1 skoru hesapla (Makro, Mikro)
f1_macro = f1_score(y_test, y_pred, average='macro')
f1_micro = f1_score(y_test, y_pred, average='micro')
print("F1 Score (Macro): {:.2%}".format(f1_macro))
print("F1 Score (Micro): {:.2%}".format(f1_micro))


Modelin doğruluk oranı: 79.64%
Recall (Macro): 60.01%
Recall (Micro): 79.64%
Precision (Macro): 74.69%
Precision (Micro): 79.64%
F1 Score (Macro): 61.34%
F1 Score (Micro): 79.64%
