In [25]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.tree import DecisionTreeClassifier
from tabulate import tabulate

In [26]:
file_path = 'NBA Player Stats 23-24.csv'
player_stats = pd.read_csv(file_path)
player_stats.head()

Unnamed: 0,RANK,NAME,TEAM,POS,AGE,GP,MPG,USG%,TO%,FTA,...,APG,SPG,BPG,TPG,P+R,P+A,P+R+A,VI,ORtg,DRtg
0,1,Joel Embiid,Phi,C,30.2,6,41.4,35.7,15.8,78,...,5.7,1.2,1.5,4.2,43.8,38.7,49.5,12.2,117.1,108.0
1,2,Jalen Brunson,Nyk,G,27.8,13,39.8,36.4,9.3,120,...,7.5,0.8,0.2,2.7,35.7,39.8,43.2,9.3,114.8,114.7
2,3,Damian Lillard,Mil,G,33.9,4,39.1,31.4,10.0,38,...,5.0,1.0,0.0,2.3,34.5,36.3,39.5,8.2,127.6,115.7
3,4,Shai Gilgeous-Alexander,Okc,G,25.9,10,39.9,32.3,8.9,81,...,6.4,1.3,1.7,2.2,37.4,36.6,43.8,11.2,118.3,106.9
4,5,Tyrese Maxey,Phi,G,23.6,6,44.6,28.1,8.6,28,...,6.8,0.8,0.3,2.2,35.0,36.7,41.8,9.1,120.9,113.3


In [27]:
player_stats.columns

Index(['RANK', 'NAME', 'TEAM', 'POS', 'AGE', 'GP', 'MPG', 'USG%', 'TO%', 'FTA',
       'FT%', '2PA', '2P%', '3PA', '3P%', 'eFG%', 'TS%', 'PPG', 'RPG', 'APG',
       'SPG', 'BPG', 'TPG', 'P+R', 'P+A', 'P+R+A', 'VI', 'ORtg', 'DRtg'],
      dtype='object')

In [28]:
# Simple Linear Regression

# ინფორმაცია MPG = Minute Per Game, PPG = Point Per Game
X = player_stats[['MPG']]
y = player_stats['PPG']

# ინფორმაციის დაყოფა ტესტირების ნაკრებად
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# სატესტო მოდელი
simple_model = LinearRegression()
simple_model.fit(X_train, y_train)

# წინასწარმეტყველება
y_pred = simple_model.predict(X_test)

# ეფექტურობის გამოთვლა
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

mse, r2

(10.462069015814478, 0.8170848312611002)

In [29]:
# Multiple Linear Regression

# ინფორმაცია MPG = Minute Per Game, PPG = Point Per Game, USG = Usage Percentage, FTA = Free Throws Attempted
X = player_stats[['MPG', 'USG%', 'FTA']]
y = player_stats['PPG']

# ინფორმაციის დაყოფა ტესტირების ნაკრებად
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# სატესტო მოდელი
multi_model = LinearRegression()
multi_model.fit(X_train, y_train)

# წინასწარმეტყველება
y_pred = multi_model.predict(X_test)

# ეფექტურობის გამოთვლა
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

mse, r2

(6.049040049677991, 0.894240691805542)

In [30]:
# Decision Tree Regression Model

# ინფორმაცია MPG = Minute Per Game, PPG = Point Per Game
X = player_stats[['MPG']]
y = player_stats['PPG']

# ინფორმაციის დაყოფა ტესტირების ნაკრებად
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# სატესტო მოდელი
tree_regressor = DecisionTreeRegressor(random_state=42)
tree_regressor.fit(X_train, y_train)

# წინასწარმეტყველება
y_pred = tree_regressor.predict(X_test)

# ეფექტურობის გამოთვლა
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

mse, r2

(7.1470025839793285, 0.8750442974855335)

In [33]:
# ინფორმაცია MPG = Minute Per Game, PPG = Point Per Game
X = player_stats[['MPG']]
y = (player_stats['PPG'] > 20).astype(int)  # ბინარული კლასიფიცაკია: თუ PPG მეტი იქნება 20 ზე დაიწერება 1 სხვა შემთხვევაში 0.

# ინფორმაციის დაყოფა ტესტირების ნაკრებად
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# სატესტო მოდელი
logistic_model = LogisticRegression()
logistic_model.fit(X_train, y_train)

# წინასწარმეტყველება
y_pred = logistic_model.predict(X_test)

# ეფექტურობის გამოთვლა
accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)
class_report = classification_report(y_test, y_pred, output_dict=True)

# მატრიცა
conf_matrix_df = pd.DataFrame(conf_matrix, index=['Actual: 0', 'Actual: 1'], columns=['Predicted: 0', 'Predicted: 1'])
print("Confusion Matrix:")
print(conf_matrix_df)

# კლასიფიკაციის რეპორტი
class_report_df = pd.DataFrame(class_report).transpose()
print("\nClassification Report:")
print(tabulate(class_report_df, headers='keys', tablefmt='pretty'))

# სიზუსტე
print("\nAccuracy:")
print(accuracy)

Confusion Matrix:
           Predicted: 0  Predicted: 1
Actual: 0            39             0
Actual: 1             3             1

Classification Report:
+--------------+--------------------+--------------------+--------------------+--------------------+
|              |     precision      |       recall       |      f1-score      |      support       |
+--------------+--------------------+--------------------+--------------------+--------------------+
|      0       | 0.9285714285714286 |        1.0         | 0.962962962962963  |        39.0        |
|      1       |        1.0         |        0.25        |        0.4         |        4.0         |
|   accuracy   | 0.9302325581395349 | 0.9302325581395349 | 0.9302325581395349 | 0.9302325581395349 |
|  macro avg   | 0.9642857142857143 |       0.625        | 0.6814814814814816 |        43.0        |
| weighted avg | 0.9352159468438539 | 0.9302325581395349 | 0.9105943152454781 |        43.0        |
+--------------+--------------------

In [35]:
# ინფორმაცია MPG = Minute Per Game, PPG = Point Per Game, USG = Usage Percentage, FTA = Free Throws Attempted
X = player_stats[['MPG', 'USG%', 'FTA']]
y = (player_stats['PPG'] > 20).astype(int)   # ბინარული კლასიფიცაკია: თუ PPG მეტი იქნება 20 ზე დაიწერება 1 სხვა შემთხვევაში 0.

# ინფორმაციის დაყოფა ტესტირების ნაკრებად
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# სატესტო მოდელი
tree_classifier = DecisionTreeClassifier(random_state=42)
tree_classifier.fit(X_train, y_train)

# წინასწარმეტყველება
y_pred = tree_classifier.predict(X_test)

# ეფექტურობის გამოთვლა
accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)
class_report = classification_report(y_test, y_pred, output_dict=True)

# მატრიცა
conf_matrix_df = pd.DataFrame(conf_matrix, index=['Actual: 0', 'Actual: 1'], columns=['Predicted: 0', 'Predicted: 1'])
print("Confusion Matrix:")
print(conf_matrix_df)

# კლასიფიკაციის რეპორტი
class_report_df = pd.DataFrame(class_report).transpose()
print("\nClassification Report:")
print(tabulate(class_report_df, headers='keys', tablefmt='pretty'))

# სიზუსტე
print("\nAccuracy:")
print(accuracy)

Confusion Matrix:
           Predicted: 0  Predicted: 1
Actual: 0            39             0
Actual: 1             0             4

Classification Report:
+--------------+-----------+--------+----------+---------+
|              | precision | recall | f1-score | support |
+--------------+-----------+--------+----------+---------+
|      0       |    1.0    |  1.0   |   1.0    |  39.0   |
|      1       |    1.0    |  1.0   |   1.0    |   4.0   |
|   accuracy   |    1.0    |  1.0   |   1.0    |   1.0   |
|  macro avg   |    1.0    |  1.0   |   1.0    |  43.0   |
| weighted avg |    1.0    |  1.0   |   1.0    |  43.0   |
+--------------+-----------+--------+----------+---------+

Accuracy:
1.0
