## Daten Laden

In [1]:
file_path = "LITTLE_normalisiert_cleaned.csv"
print(file_path)

/content/drive/MyDrive/Uni/Power_Management/LITTLE_normalisiert_cleaned.csv


In [2]:
import pandas as pd

df = pd.read_csv(file_path)

# Drop command column
df = df.drop(columns=['command'])

# Display the first few rows to understand the structure
df.head()

FileNotFoundError: [Errno 2] No such file or directory: '/content/drive/MyDrive/Uni/Power_Management/LITTLE_normalisiert_cleaned.csv'

## Korrelationsmatrix

In [None]:
corr = df.corr()
corr.style.background_gradient(cmap='RdYlGn')

## 1. Versuch (Regression)

In [None]:
import pandas as pd
from sklearn.feature_selection import SelectKBest, f_regression
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Zielvariable: Annahme, dass die erste Spalte die zu schätzende Zahl enthält
y = df.iloc[:, 0]

# Feature, das immer genutzt werden soll: 'instructions'
X_instructions = df[['instructions']]

# Potenzielle zusätzliche Features: Alle Spalten außer der Zielvariable und 'instructions'
potential_features = df.drop(columns=[df.columns[0], 'instructions'])

# Automatische Auswahl der 4 besten Features basierend auf f_regression
selector = SelectKBest(score_func=f_regression, k=4)
X_selected = selector.fit_transform(potential_features, y)

# Ausgabe der Namen der ausgewählten Features
selected_feature_names = potential_features.columns[selector.get_support()]
print("Ausgewählte Features:", selected_feature_names.tolist())

# Falls gewünscht: Umwandeln in DataFrame, um die Spaltennamen beizubehalten
X_selected_df = pd.DataFrame(X_selected, columns=selected_feature_names, index=df.index)

# Kombination der 'instructions'-Spalte mit den ausgewählten Features
X_combined = pd.concat([X_instructions, X_selected_df], axis=1)

# Aufteilen in Trainings- und Testdaten
X_train, X_test, y_train, y_test = train_test_split(X_combined, y, test_size=0.2, random_state=42)

# Training eines Regressionsmodells (z. B. Lineare Regression)
model = LinearRegression()
model.fit(X_train, y_train)

# Vorhersagen und Evaluation
y_pred = model.predict(X_test)
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))


## 2. Versuch (Regression)

### Modell trainieren

In [None]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.feature_selection import SequentialFeatureSelector
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Zielvariable: erste Spalte (angenommen, es handelt sich um numerische Werte)
y = df.iloc[:, 0]

# Fixes Feature: 'instructions'
X_instructions = df[['instructions']]

# Kandidaten für die automatische Feature-Auswahl:
# Entfernen der Zielvariable und der Spalte 'instructions'
X_candidates = df.drop(columns=[df.columns[0], 'instructions'])

# Basisregressor für die Feature-Selektion (hier: Lineare Regression)
model = LinearRegression()

# Sequential Feature Selector (forward selection) wählt 4 zusätzliche Features aus
sfs = SequentialFeatureSelector(
    model,
    n_features_to_select=4,
    direction='forward',
    scoring='neg_mean_squared_error',
    cv=5  # 5-fache Kreuzvalidierung
)

# Durchführung der Feature-Selektion auf den Kandidatenfeatures
sfs.fit(X_candidates, y)

# Ermitteln der Namen der ausgewählten Features
selected_feature_names = X_candidates.columns[sfs.get_support()]
print("Ausgewählte Features:", selected_feature_names.tolist())

# Zusammenführen des fixen Features 'instructions' mit den ausgewählten Features
X_selected = pd.concat([X_instructions, X_candidates[selected_feature_names]], axis=1)

# Aufteilen in Trainings- und Testdaten
X_train, X_test, y_train, y_test = train_test_split(X_selected, y, test_size=0.2, random_state=42)

# Modelltraining auf den kombinierten Features
model.fit(X_train, y_train)

# Vorhersagen und Evaluation
y_pred = model.predict(X_test)
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))

# Ausgabe der Regressionsparameter
print("\nRegression Parameter:")
print("Achsenabschnitt (Intercept):", model.intercept_)

# Ausgabe der Koeffizienten mit den zugehörigen Feature-Namen
print("Koeffizienten:")
for feature, coef in zip(X_selected.columns, model.coef_):
    print(f"{feature}: {coef}")

### Modell testen

In [None]:
def do_regression(instructions, L1_dcache_loads, L1_icache_loads, topdown_retiring, uncore_clock_clockticks):
  return 5.671202142645853 + instructions * -4.037434477408138e-11 + L1_dcache_loads * 3.7727498541646285e-10 + topdown_retiring * 9.090283761268329e-11 + uncore_clock_clockticks * 1.4513036090171807e-09

# sleep 10 (expected 2.14)
print("sleep 10 (expected 2.14)")
print(do_regression(165556.153198144, 44181.0547038958, 54556.2364921857, 208105.052597547, 38000929.1425307))

print("")

# sum_up_benchmark (expected 10.46)
print("sum_up_benchmark (expected 10.46)")
print(do_regression(7658080659.63333, 1628055678.50196, 1528910300.65665, 7961570136.8392, 2696560318.9496))

print("")

# stress-ng --cpu 2 --cpu-method all --timeout 10s (expected 11.055)
print("stress-ng --cpu 2 --cpu-method all --timeout 10s (expected 11.055)")
print(do_regression(9439119304.88239, 1242411937.11209, 1632001751.87898, 9934301707.13731, 2690003038.87471))