In [48]:
import pandas as pd
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression


In [49]:
import pandas as pd

columns = [
    "id",
    "diagnosis",  # M = malignant (kötü huylu), B = benign (iyi huylu)
    
    # mean features
    "radius_mean", "texture_mean", "perimeter_mean", "area_mean",
    "smoothness_mean", "compactness_mean", "concavity_mean", 
    "concave_points_mean", "symmetry_mean", "fractal_dimension_mean",

    # standard error features
    "radius_se", "texture_se", "perimeter_se", "area_se",
    "smoothness_se", "compactness_se", "concavity_se", 
    "concave_points_se", "symmetry_se", "fractal_dimension_se",

    # worst (largest) features
    "radius_worst", "texture_worst", "perimeter_worst", "area_worst",
    "smoothness_worst", "compactness_worst", "concavity_worst", 
    "concave_points_worst", "symmetry_worst", "fractal_dimension_worst"
]

veriler = pd.read_csv("wdbc.csv", names=columns, header=None)



In [50]:
# 'diagnosis' sütununu sayıya çeviriyoruz: M=1, B=0
le = preprocessing.LabelEncoder()
veriler["diagnosis"] = le.fit_transform(veriler["diagnosis"])


In [51]:
# id sütunu model için gereksiz, silebiliriz
veriler = veriler.drop(columns=["id"])

# Hedef: 'diagnosis'
y = veriler["diagnosis"]

# Özellikler: geri kalan her şey
X = veriler.drop(columns=["diagnosis"])


In [52]:
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=0)


In [53]:
sc = StandardScaler()
X_train = sc.fit_transform(x_train)
X_test = sc.transform(x_test)  # fit tekrar yapılmaz


In [54]:
regressor = LinearRegression()
regressor.fit(X_train, y_train)


In [55]:
y_pred = regressor.predict(X_test)

# round() ile sınıflandırma (0.5 ve üzeri: 1, altı: 0)
y_pred_class = [round(pred) for pred in y_pred]

# İlk 10 sonucu yazdır
for i in range(20):
    print(f"Tahmin: {y_pred[i]: .3f} → Sınıf: {y_pred_class[i]} - Gerçek: {y_test.iloc[i]}")


Tahmin:  0.813 → Sınıf: 1 - Gerçek: 1
Tahmin:  0.181 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.032 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.189 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.061 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.082 → Sınıf: 0 - Gerçek: 0
Tahmin: -0.058 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.021 → Sınıf: 0 - Gerçek: 0
Tahmin: -0.140 → Sınıf: 0 - Gerçek: 0
Tahmin: -0.087 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.291 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.213 → Sınıf: 0 - Gerçek: 0
Tahmin: -0.283 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.301 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.372 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.809 → Sınıf: 1 - Gerçek: 1
Tahmin: -0.027 → Sınıf: 0 - Gerçek: 0
Tahmin:  0.880 → Sınıf: 1 - Gerçek: 1
Tahmin:  0.930 → Sınıf: 1 - Gerçek: 1
Tahmin:  1.174 → Sınıf: 1 - Gerçek: 1


In [56]:
from sklearn.metrics import accuracy_score

# Linear Regression tahminleri
y_pred = regressor.predict(X_test)

# Tahminleri sınıflandır (round ile)
y_pred_class = [round(pred) for pred in y_pred]

# Doğruluk oranını hesapla
accuracy = accuracy_score(y_test, y_pred_class)
print(f"Doğruluk (Accuracy): {accuracy:.4f}")


Doğruluk (Accuracy): 0.9574
