# DSA210 Project: Magnesium, Sleep, and Performance Analysis
This notebook performs EDA, hypothesis testing, and machine learning analysis on a synthetic dataset to explore relationships between magnesium intake, sleep, and performance metrics.

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import pearsonr
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.model_selection import train_test_split
import warnings
warnings.filterwarnings("ignore")

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
df = pd.read_excel("dsa 210 data.xlsx")
df.columns = df.columns.str.strip()
df.dropna(inplace=True)
df.head()

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
plt.figure(figsize=(10, 6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', fmt=".2f")
plt.title("Correlation Heatmap")
plt.show()

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
df.hist(bins=15, figsize=(15, 10), edgecolor='black')
plt.tight_layout()
plt.show()

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
import math
num_features = len(df.columns[1:])
rows = math.ceil(num_features / 3)
plt.figure(figsize=(18, rows * 4))

for i, column in enumerate(df.columns[1:], 1):
    plt.subplot(rows, 3, i)
    sns.boxplot(y=df[column])
    plt.title(f'Boxplot of {column}')

plt.tight_layout()
plt.show()

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
sns.pairplot(df)
plt.show()

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
correlations = {}
hypothesis_results = {}
for col in df.columns:
    if col != "Magnesium_mg":
        corr, p_val = pearsonr(df["Magnesium_mg"], df[col])
        correlations[col] = corr
        hypothesis_results[col] = "Reject H₀" if p_val < 0.05 else "Fail to Reject H₀"

pd.DataFrame.from_dict(correlations, orient='index', columns=["Correlation"])

In [None]:
# Bu hücre, belirli bir analiz adımını gerçekleştirmektedir
features = df.drop(columns=["Weight_kg"])
target = df["Weight_kg"]
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.2, random_state=42)

lr = LinearRegression()
lr.fit(X_train, y_train)
lr_pred = lr.predict(X_test)

rf = RandomForestRegressor(random_state=42)
rf.fit(X_train, y_train)
rf_pred = rf.predict(X_test)

svm = SVR()
svm.fit(X_train, y_train)
svm_pred = svm.predict(X_test)

ml_results = pd.DataFrame({
    "Model": ["Linear Regression", "Random Forest", "Support Vector Machine"],
    "RMSE": [
        mean_squared_error(y_test, lr_pred, squared=False),
        mean_squared_error(y_test, rf_pred, squared=False),
        mean_squared_error(y_test, svm_pred, squared=False),
    ],
    "R^2 Score": [
        r2_score(y_test, lr_pred),
        r2_score(y_test, rf_pred),
        r2_score(y_test, svm_pred),
    ]
})
ml_results