In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_curve, auc
import numpy as np
import matplotlib.pyplot as plt

# Veri Setinin Yüklenmesi (ISO-8859-1 kodlaması ile)
data = pd.read_csv('GSR_veriler1.csv', encoding='ISO-8859-1')

# Özellikler ve Hedef Değişkenin Ayrılması
X = data[['human_resistance', 'gsr_average']]
y = data['emotion']  # 'emotion' sütunu hedef değişkeni temsil eder

# Eğitim ve Test Setlerinin Ayrılması
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelin Eğitilmesi
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Test Seti Üzerinde Tahmin Yapma
y_pred = model.predict(X_test)

# Doğruluk Skoru
accuracy = accuracy_score(y_test, y_pred)
print(f'Model Doğruluğu: %{accuracy * 100:.2f}')

# Sınıflandırma Raporu
print("\nSınıflandırma Raporu:")
print(classification_report(y_test, y_pred))

# Karışıklık Matrisi
print("Karışıklık Matrisi:")
print(confusion_matrix(y_test, y_pred))

# ROC Eğrisi ve AUC Hesaplama
y_prob = model.predict_proba(X_test)  # Sınıf olasılıklarını al
fpr = {}
tpr = {}
roc_auc = {}

# Her bir sınıf için ROC eğrisi oluştur
n_classes = len(model.classes_)
for i in range(n_classes):
    # Binary sınıflandırma için y_test ve y_prob ile ROC hesaplama
    if n_classes > 2:
        # Multi-class ROC
        y_test_bin = (y_test == model.classes_[i]).astype(int)
        fpr[i], tpr[i], _ = roc_curve(y_test_bin, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])
    else:
        # Binary ROC
        fpr[i], tpr[i], _ = roc_curve(y_test, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])

# ROC Eğrisini Çizdirme
plt.figure()
for i in range(n_classes):
    plt.plot(fpr[i], tpr[i], label=f'{model.classes_[i]} ROC eğrisi (AUC = {roc_auc[i]:.2f})')

plt.plot([0, 1], [0, 1], 'k--')  # Rastgele tahmin eğrisi
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Yanlış Pozitif Oranı (False Positive Rate)')
plt.ylabel('Doğru Pozitif Oranı (True Positive Rate)')
plt.title('ROC Eğrisi')
plt.legend(loc="lower right")
plt.show()


In [None]:
import chardet

# Dosyanın kodlamasını tahmin etme
with open('GSR_veriler1.csv', 'rb') as f:
    result = chardet.detect(f.read())

print(result)

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score, learning_curve
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_curve, auc
import numpy as np
import matplotlib.pyplot as plt

# Veri Setinin Yüklenmesi (ISO-8859-1 kodlaması ile)
data = pd.read_csv('GSR_veriler1.csv', encoding='ISO-8859-1')

# Özellikler ve Hedef Değişkenin Ayrılması
X = data[['human_resistance', 'gsr_average']]
y = data['emotion']  # 'emotion' sütunu hedef değişkeni temsil eder

# Eğitim ve Test Setlerinin Ayrılması
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelin Eğitilmesi
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Eğitim Seti Üzerinde Tahmin Yapma
y_train_pred = model.predict(X_train)

# Eğitim Seti Üzerinde Doğruluk Skoru
train_accuracy = accuracy_score(y_train, y_train_pred)
print(f'Eğitim Seti Doğruluğu: %{train_accuracy * 100:.2f}')

# Test Seti Üzerinde Tahmin Yapma
y_pred = model.predict(X_test)

# Doğruluk Skoru
accuracy = accuracy_score(y_test, y_pred)
print(f'\nModel Doğruluğu: %{accuracy * 100:.2f}')

# Sınıflandırma Raporu
print("\nSınıflandırma Raporu:")
print(classification_report(y_test, y_pred))

# Karışıklık Matrisi
print("Karışıklık Matrisi:")
print(confusion_matrix(y_test, y_pred))

# ROC Eğrisi ve AUC Hesaplama
y_prob = model.predict_proba(X_test)  # Sınıf olasılıklarını al
fpr = {}
tpr = {}
roc_auc = {}

# Her bir sınıf için ROC eğrisi oluştur
n_classes = len(model.classes_)
for i in range(n_classes):
    if n_classes > 2:
        # Multi-class ROC
        y_test_bin = (y_test == model.classes_[i]).astype(int)
        fpr[i], tpr[i], _ = roc_curve(y_test_bin, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])
    else:
        # Binary ROC
        fpr[i], tpr[i], _ = roc_curve(y_test, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])

# ROC Eğrisini Çizdirme
plt.figure()
for i in range(n_classes):
    plt.plot(fpr[i], tpr[i], label=f'{model.classes_[i]} ROC eğrisi (AUC = {roc_auc[i]:.2f})')

plt.plot([0, 1], [0, 1], 'k--')  # Rastgele tahmin eğrisi
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Yanlış Pozitif Oranı (False Positive Rate)')
plt.ylabel('Doğru Pozitif Oranı (True Positive Rate)')
plt.title('ROC Eğrisi')
plt.legend(loc="lower right")
plt.show()

# Çapraz Doğrulama (Cross-Validation)
cv_scores = cross_val_score(model, X, y, cv=5)
print(f'\nÇapraz Doğrulama Ortalama Doğruluk: %{cv_scores.mean() * 100:.2f}')

# Öğrenme Eğrisi
train_sizes, train_scores, test_scores = learning_curve(model, X, y, cv=5, scoring='accuracy', n_jobs=-1)

# Ortalama ve standart sapmayı hesapla
train_mean = np.mean(train_scores, axis=1)
train_std = np.std(train_scores, axis=1)
test_mean = np.mean(test_scores, axis=1)
test_std = np.std(test_scores, axis=1)

# Öğrenme eğrisini çiz
plt.figure()
plt.plot(train_sizes, train_mean, 'o-', color='r', label='Eğitim Doğruluğu')
plt.plot(train_sizes, test_mean, 'o-', color='g', label='Doğrulama Doğruluğu')

# Eğitim ve doğrulama doğrulukları için standart sapma aralıklarını göster
plt.fill_between(train_sizes, train_mean - train_std, train_mean + train_std, alpha=0.1, color='r')
plt.fill_between(train_sizes, test_mean - test_std, test_mean + test_std, alpha=0.1, color='g')

plt.xlabel('Eğitim Verisi Miktarı')
plt.ylabel('Doğruluk')
plt.title('Öğrenme Eğrisi')
plt.legend(loc='best')
plt.grid(True)
plt.show()


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score, learning_curve
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_curve, auc
from imblearn.over_sampling import RandomOverSampler
import numpy as np
import matplotlib.pyplot as plt

# Veri Setinin Yüklenmesi (ISO-8859-1 kodlaması ile)
data = pd.read_csv('GSR_verileriiiii.csv', encoding='ISO-8859-1')

# Özellikler ve Hedef Değişkenin Ayrılması
X = data[['human_resistance', 'gsr_average']]
y = data['emotion']  # 'emotion' sütunu hedef değişkeni temsil eder

# Özelliklerin Ölçeklenmesi
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# RandomOverSampler ile Veri Çeşitlendirme
ros = RandomOverSampler(random_state=42)
X_resampled, y_resampled = ros.fit_resample(X_scaled, y)

# Eğitim ve Test Setlerinin Ayrılması
X_train, X_test, y_train, y_test = train_test_split(X_resampled, y_resampled, test_size=0.2, random_state=42)

# Modelin Eğitilmesi
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Eğitim Seti Üzerinde Tahmin Yapma
y_train_pred = model.predict(X_train)

# Eğitim Seti Üzerinde Doğruluk Skoru
train_accuracy = accuracy_score(y_train, y_train_pred)
print(f'Eğitim Seti Doğruluğu: %{train_accuracy * 100:.2f}')

# Test Seti Üzerinde Tahmin Yapma
y_pred = model.predict(X_test)

# Doğruluk Skoru
accuracy = accuracy_score(y_test, y_pred)
print(f'\nModel Doğruluğu: %{accuracy * 100:.2f}')

# Sınıflandırma Raporu
print("\nSınıflandırma Raporu:")
print(classification_report(y_test, y_pred))

# Karışıklık Matrisi
print("Karışıklık Matrisi:")
print(confusion_matrix(y_test, y_pred))

# ROC Eğrisi ve AUC Hesaplama
y_prob = model.predict_proba(X_test)  # Sınıf olasılıklarını al
fpr = {}
tpr = {}
roc_auc = {}

# Her bir sınıf için ROC eğrisi oluştur
n_classes = len(model.classes_)
for i in range(n_classes):
    if n_classes > 2:
        # Multi-class ROC
        y_test_bin = (y_test == model.classes_[i]).astype(int)
        fpr[i], tpr[i], _ = roc_curve(y_test_bin, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])
    else:
        # Binary ROC
        fpr[i], tpr[i], _ = roc_curve(y_test, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])

# ROC Eğrisini Çizdirme
plt.figure()
for i in range(n_classes):
    plt.plot(fpr[i], tpr[i], label=f'{model.classes_[i]} ROC eğrisi (AUC = {roc_auc[i]:.2f})')

plt.plot([0, 1], [0, 1], 'k--')  # Rastgele tahmin eğrisi
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Yanlış Pozitif Oranı (False Positive Rate)')
plt.ylabel('Doğru Pozitif Oranı (True Positive Rate)')
plt.title('ROC Eğrisi')
plt.legend(loc="lower right")
plt.show()

# Çapraz Doğrulama (Cross-Validation)
cv_scores = cross_val_score(model, X_resampled, y_resampled, cv=5)
print(f'\nÇapraz Doğrulama Ortalama Doğruluk: %{cv_scores.mean() * 100:.2f}')

# Öğrenme Eğrisi
train_sizes, train_scores, test_scores = learning_curve(model, X_resampled, y_resampled, cv=5, scoring='accuracy', n_jobs=-1)

# Ortalama ve standart sapmayı hesapla
train_mean = np.mean(train_scores, axis=1)
train_std = np.std(train_scores, axis=1)
test_mean = np.mean(test_scores, axis=1)
test_std = np.std(test_scores, axis=1)

# Öğrenme eğrisini çiz
plt.figure()
plt.plot(train_sizes, train_mean, 'o-', color='r', label='Eğitim Doğruluğu')
plt.plot(train_sizes, test_mean, 'o-', color='g', label='Doğrulama Doğruluğu')

# Eğitim ve doğrulama doğrulukları için standart sapma aralıklarını göster
plt.fill_between(train_sizes, train_mean - train_std, train_mean + train_std, alpha=0.1, color='r')
plt.fill_between(train_sizes, test_mean - test_std, test_mean + test_std, alpha=0.1, color='g')

plt.xlabel('Eğitim Verisi Miktarı')
plt.ylabel('Doğruluk')
plt.title('Öğrenme Eğrisi')
plt.legend(loc='best')
plt.grid(True)
plt.show()


In [None]:
import pandas as pd
import numpy as np

# Define the emotions and their ranges based on the sample data
emotions = {
    "Rahatlamış Durum": {"human_resistance": (-70, 35), "gsr_average": (11, 37)},
    "Heyecanlı Durum": {"human_resistance": (-105, 33), "gsr_average": (50, 220)},
    "Şaşırmış Durum": {"human_resistance": (-40, 30), "gsr_average": (125, 260)},
    "Üzgün Durum": {"human_resistance": (-3276, 55), "gsr_average": (10, 800)},
    "Sinirli Durum": {"human_resistance": (-105, -35), "gsr_average": (10, 830)},
    "Mutlu Durum": {"human_resistance": (15, 35), "gsr_average": (350, 480)}
}

# Function to generate random data for each emotion
def generate_data(emotion, num_samples):
    h_range = emotions[emotion]["human_resistance"]
    g_range = emotions[emotion]["gsr_average"]
    human_resistance = np.random.randint(h_range[0], h_range[1] + 1, num_samples)
    gsr_average = np.random.randint(g_range[0], g_range[1] + 1, num_samples)
    return pd.DataFrame({
        'human_resistance': human_resistance,
        'gsr_average': gsr_average,
        'emotion': [emotion] * num_samples
    })

# Calculate the number of samples per emotion to reach a total of 10,000 samples
total_samples = 10000
num_emotions = len(emotions)
samples_per_emotion = total_samples // num_emotions

# Generate data
dataframes = []
for emotion in emotions.keys():
    df = generate_data(emotion, samples_per_emotion)
    dataframes.append(df)

# Concatenate all dataframes
final_df = pd.concat(dataframes, ignore_index=True)

# Shuffle the data
final_df = final_df.sample(frac=1).reset_index(drop=True)

# Save to CSV
final_df.to_csv('GSR_verileriiiii.csv', index=False)
print("Data generation complete. File saved as 'GSR_verileriiiii.csv'.")


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score, learning_curve, GridSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_curve, auc
from imblearn.over_sampling import RandomOverSampler
import numpy as np
import matplotlib.pyplot as plt

# Veri Setinin Yüklenmesi (ISO-8859-1 kodlaması ile)
data = pd.read_csv('GSR_verileriiiii.csv', encoding='ISO-8859-1')

# Özellikler ve Hedef Değişkenin Ayrılması
X = data[['human_resistance', 'gsr_average']]
y = data['emotion']  # 'emotion' sütunu hedef değişkeni temsil eder

# Özelliklerin Ölçeklenmesi
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# RandomOverSampler ile Veri Çeşitlendirme
ros = RandomOverSampler(random_state=42)
X_resampled, y_resampled = ros.fit_resample(X_scaled, y)

# Eğitim ve Test Setlerinin Ayrılması
X_train, X_test, y_train, y_test = train_test_split(X_resampled, y_resampled, test_size=0.1, random_state=42)

# Modelin Eğitilmesi
model = RandomForestClassifier(random_state=42)

# Hiperparametre Optimizasyonu (Grid Search)
param_grid = {
    'n_estimators': [50, 100, 150],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10],
    'min_samples_leaf': [1, 2, 4]
}
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, n_jobs=-1, verbose=2)
grid_search.fit(X_train, y_train)

# En İyi Parametrelerle Modeli Seçme
best_model = grid_search.best_estimator_

# Eğitim Seti Üzerinde Tahmin Yapma
y_train_pred = best_model.predict(X_train)

# Eğitim Seti Üzerinde Doğruluk Skoru
train_accuracy = accuracy_score(y_train, y_train_pred)
print(f'Eğitim Seti Doğruluğu: %{train_accuracy * 100:.2f}')

# Test Seti Üzerinde Tahmin Yapma
y_pred = best_model.predict(X_test)

# Doğruluk Skoru
accuracy = accuracy_score(y_test, y_pred)
print(f'\nModel Doğruluğu: %{accuracy * 100:.2f}')

# Sınıflandırma Raporu
print("\nSınıflandırma Raporu:")
print(classification_report(y_test, y_pred))

# Karışıklık Matrisi
print("Karışıklık Matrisi:")
print(confusion_matrix(y_test, y_pred))

# ROC Eğrisi ve AUC Hesaplama
y_prob = best_model.predict_proba(X_test)  # Sınıf olasılıklarını al
fpr = {}
tpr = {}
roc_auc = {}

# Her bir sınıf için ROC eğrisi oluştur
n_classes = len(best_model.classes_)
for i in range(n_classes):
    if n_classes > 2:
        # Multi-class ROC
        y_test_bin = (y_test == best_model.classes_[i]).astype(int)
        fpr[i], tpr[i], _ = roc_curve(y_test_bin, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])
    else:
        # Binary ROC
        fpr[i], tpr[i], _ = roc_curve(y_test, y_prob[:, i])
        roc_auc[i] = auc(fpr[i], tpr[i])

# ROC Eğrisini Çizdirme
plt.figure()
for i in range(n_classes):
    plt.plot(fpr[i], tpr[i], label=f'{best_model.classes_[i]} ROC eğrisi (AUC = {roc_auc[i]:.2f})')

plt.plot([0, 1], [0, 1], 'k--')  # Rastgele tahmin eğrisi
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Yanlış Pozitif Oranı (False Positive Rate)')
plt.ylabel('Doğru Pozitif Oranı (True Positive Rate)')
plt.title('ROC Eğrisi')
plt.legend(loc="lower right")
plt.show()

# Çapraz Doğrulama (Cross-Validation)
cv_scores = cross_val_score(best_model, X_resampled, y_resampled, cv=5)
print(f'\nÇapraz Doğrulama Ortalama Doğruluk: %{cv_scores.mean() * 100:.2f}')

# Öğrenme Eğrisi
train_sizes, train_scores, test_scores = learning_curve(best_model, X_resampled, y_resampled, cv=5, scoring='accuracy', n_jobs=-1)

# Ortalama ve standart sapmayı hesapla
train_mean = np.mean(train_scores, axis=1)
train_std = np.std(train_scores, axis=1)
test_mean = np.mean(test_scores, axis=1)
test_std = np.std(test_scores, axis=1)

# Öğrenme eğrisini çiz
plt.figure()
plt.plot(train_sizes, train_mean, 'o-', color='r', label='Eğitim Doğruluğu')
plt.plot(train_sizes, test_mean, 'o-', color='g', label='Doğrulama Doğruluğu')

# Eğitim ve doğrulama doğrulukları için standart sapma aralıklarını göster
plt.fill_between(train_sizes, train_mean - train_std, train_mean + train_std, alpha=0.1, color='r')
plt.fill_between(train_sizes, test_mean - test_std, test_mean + test_std, alpha=0.1, color='g')

plt.xlabel('Eğitim Verisi Miktarı')
plt.ylabel('Doğruluk')
plt.title('Öğrenme Eğrisi')
plt.legend(loc='best')
plt.grid(True)
plt.show()


In [2]:
from flask import Flask, request, jsonify
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_curve, auc
from imblearn.over_sampling import RandomOverSampler
import pandas as pd
import numpy as np

app = Flask(__name__)

# Veri Setinin Yüklenmesi ve Modelin Eğitilmesi
def train_model():
    # Veri setinin yüklenmesi
    data = pd.read_csv('GSR_verileri_nihai.csv', encoding='ISO-8859-1')

    # Özellikler ve Hedef Değişkenin Ayrılması
    X = data[['human_resistance', 'gsr_average']]
    y = data['emotion']

    # Özelliklerin Ölçeklenmesi
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X)

    # RandomOverSampler ile Veri Çeşitlendirme
    ros = RandomOverSampler(random_state=42)
    X_resampled, y_resampled = ros.fit_resample(X_scaled, y)

    # Eğitim ve Test Setlerinin Ayrılması
    X_train, X_test, y_train, y_test = train_test_split(X_resampled, y_resampled, test_size=0.1, random_state=42)

    # Modelin Eğitilmesi
    model = RandomForestClassifier(random_state=42)

    # Hiperparametre Optimizasyonu (Grid Search)
    param_grid = {
        'n_estimators': [50, 100, 150],
        'max_depth': [None, 10, 20, 30],
        'min_samples_split': [2, 5, 10],
        'min_samples_leaf': [1, 2, 4]
    }
    grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, n_jobs=-1, verbose=2)
    grid_search.fit(X_train, y_train)

    # En İyi Modeli Seçme
    best_model = grid_search.best_estimator_

    return scaler, best_model

# Modeli Eğit ve Belleğe Al
scaler, best_model = train_model()

@app.route('/predict', methods=['POST'])
def predict():
    # İstekten veri alınması
    data = request.json
    input_data = np.array([data['human_resistance'], data['gsr_average']]).reshape(1, -1)

    # Özelliklerin ölçeklenmesi
    input_data_scaled = scaler.transform(input_data)

    # Tahmin yapılması
    prediction = best_model.predict(input_data_scaled)
    prediction_proba = best_model.predict_proba(input_data_scaled)

    # Sonucun döndürülmesi
    response = {
        'predicted_emotion': prediction[0],
        'probabilities': dict(zip(best_model.classes_, prediction_proba[0]))
    }
    
    return jsonify(response)

if __name__ == '__main__':
    app.run(debug=False)


Fitting 5 folds for each of 108 candidates, totalling 540 fits
 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on http://127.0.0.1:5000
Press CTRL+C to quit
127.0.0.1 - - [07/Sep/2024 20:42:05] "POST /predict HTTP/1.1" 200 -
127.0.0.1 - - [07/Sep/2024 20:42:29] "POST /predict HTTP/1.1" 200 -
127.0.0.1 - - [07/Sep/2024 20:42:53] "POST /predict HTTP/1.1" 200 -
127.0.0.1 - - [07/Sep/2024 20:43:24] "POST /predict HTTP/1.1" 200 -
