In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.tree import DecisionTreeRegressor, DecisionTreeClassifier
from sklearn.metrics import mean_squared_error, r2_score, accuracy_score, confusion_matrix, classification_report
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer


In [2]:
data = pd.read_csv('fictional_character_battles_complex.csv')
data.head()

Unnamed: 0,Character,Universe,Strength,Speed,Intelligence,SpecialAbilities,Weaknesses,BattleOutcome
0,Wonder Woman,Marvel,7,8,3,Telekinesis,Kryptonite,0
1,Iron Man,Marvel,4,7,9,Telekinesis,Kryptonite,0
2,Iron Man,DC Comics,8,7,5,Telekinesis,Magic,0
3,Spider-Man,DC Comics,5,6,10,Telekinesis,Kryptonite,0
4,Flash,Marvel,7,6,2,Invisibility,Magic,0


In [3]:
# კატეგორიული ცვლადები
categorical_features = ['Character', 'Universe', 'SpecialAbilities', 'Weaknesses']
numerical_features = ['Strength', 'Speed', 'Intelligence']

In [4]:
# პრეპროცესორის განსაზღვრა
preprocessor = ColumnTransformer(
    transformers=[
        ('num', SimpleImputer(strategy='median'), numerical_features),
        ('cat', OneHotEncoder(handle_unknown='ignore'), categorical_features)])

In [5]:
X = data.drop('BattleOutcome', axis=1)
y = data['BattleOutcome']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [6]:
# 1. Simple Linear Regression მოდელი

# ვაპროგნოზებთ მებრძოლის შედეგს ერთი ფუნქციის მიხედვით და ვამოწმებთ სიზუსტეს

linear_model = Pipeline(steps=[('preprocessor', preprocessor),
                               ('regressor', LinearRegression())])

linear_model.fit(X_train, y_train)
y_pred_linear = linear_model.predict(X_test)

print("Simple Linear Regression")
print(f"საშუალო კვადრატული შეცდომა: {mean_squared_error(y_test, y_pred_linear)}")
print(f"R^2 ქულა: {r2_score(y_test, y_pred_linear)}\n")


Simple Linear Regression
საშუალო კვადრატული შეცდომა: 0.14425706601314597
R^2 ქულა: 0.2600663171925477



In [7]:
# 2. Multiple Linear Regression მოდელი

# ვიყენებთ ყველა ფუნქციას მებრძოლის შედეგის პროგნოზირებისთვის და ვამოწმებთ სიზუსტეს

multiple_linear_model = Pipeline(steps=[('preprocessor', preprocessor),
                                        ('regressor', LinearRegression())])

multiple_linear_model.fit(X_train, y_train)
y_pred_multiple_linear = multiple_linear_model.predict(X_test)

print("Multiple Linear Regression")
print(f"საშუალო კვადრატული შეცდომა: {mean_squared_error(y_test, y_pred_multiple_linear)}")
print(f"R^2 ქულა: {r2_score(y_test, y_pred_multiple_linear)}\n")


Multiple Linear Regression
საშუალო კვადრატული შეცდომა: 0.14425706601314597
R^2 ქულა: 0.2600663171925477



In [8]:
# 3. Decision Tree Regression მოდელი

# ვიყენებთ ერთ ან რამდენიმე ფუნქციას მებრძოლის შედეგის პროგნოზირებისთვის და ვამოწმებთ სიზუსტეს

tree_regressor = Pipeline(steps=[('preprocessor', preprocessor),
                                 ('regressor', DecisionTreeRegressor(random_state=42))])

tree_regressor.fit(X_train, y_train)
y_pred_tree_reg = tree_regressor.predict(X_test)

print("Decision Tree Regression")
print(f"საშუალო კვადრატული შეცდომა: {mean_squared_error(y_test, y_pred_tree_reg)}")
print(f"R^2 ქულა: {r2_score(y_test, y_pred_tree_reg)}\n")

Decision Tree Regression
საშუალო კვადრატული შეცდომა: 0.25849256900212314
R^2 ქულა: -0.325878612716763



In [9]:
# 4. Logistic Regression მოდელი

logistic_model = Pipeline(steps=[('preprocessor', preprocessor),
                                 ('classifier', LogisticRegression(max_iter=1000))])

logistic_model.fit(X_train, y_train)
y_pred_logistic = logistic_model.predict(X_test)

print("Logistic Regression")
print(f"სიზუსტე: {accuracy_score(y_test, y_pred_logistic)}")
print(f"კლასიფიკაციის რეპორტი:\n{classification_report(y_test, y_pred_logistic)}\n")

Logistic Regression
სიზუსტე: 0.7919320594479831
კლასიფიკაციის რეპორტი:
              precision    recall  f1-score   support

           0       0.84      0.88      0.86       346
           1       0.62      0.54      0.58       125

    accuracy                           0.79       471
   macro avg       0.73      0.71      0.72       471
weighted avg       0.78      0.79      0.79       471




In [10]:
# 5. Decision Tree Classification მოდელი

tree_classifier = Pipeline(steps=[('preprocessor', preprocessor),
                                  ('classifier', DecisionTreeClassifier(random_state=42))])

tree_classifier.fit(X_train, y_train)
y_pred_tree_class = tree_classifier.predict(X_test)

print("Decision Tree Classification")
print(f"სიზუსტე: {accuracy_score(y_test, y_pred_tree_class)}")
print(f"კლასიფიკაციის რეპორტი:\n{classification_report(y_test, y_pred_tree_class)}\n")

Decision Tree Classification
სიზუსტე: 0.7409766454352441
კლასიფიკაციის რეპორტი:
              precision    recall  f1-score   support

           0       0.85      0.79      0.82       346
           1       0.51      0.61      0.55       125

    accuracy                           0.74       471
   macro avg       0.68      0.70      0.69       471
weighted avg       0.76      0.74      0.75       471


