# Early Steps of Work: Creating Test Data in csv & Testing Neural Networks

In [6]:
import numpy as np
import random
import csv


# ====================================================
# 1. GENEROWANIE DANYCH
# ====================================================
def generate_random_schedule(employee_shifts_wanted, max_tries=1000):
    """
    Próbuje wygenerować harmonogram dla zadanych 'zapotrzebowań'
    (ile zmian chce przepracować każdy z 5 pracowników).

    Zwraca:
       - 105-elementową listę (0/1) oznaczającą przypisanie pracownik->zmiana
         w układzie: (dzień 0..6) x (zmiana 0..2) x (pracownik 0..4).
       - True, jeśli się udało, False w przeciwnym razie.
    """
    num_days = 7
    num_shifts_per_day = 3
    num_emps = 5

    # Maska [dzień][zmiana] -> który pracownik (0..4) lub 5 ("nikt")
    # Początkowo wszędzie "nikt"
    assignment = [[5 for _ in range(num_shifts_per_day)] for _ in range(num_days)]

    # Licznik, ile zmian każdemu pracownikowi przypisaliśmy
    shifts_count = [0] * num_emps

    # Funkcja pomocnicza do sprawdzenia, czy można przypisać pracownika e
    def can_assign(day, shift, e):
        # 1) Sprawdź, czy e już nie pracował dziś w innej zmianie
        for s in range(num_shifts_per_day):
            if assignment[day][s] == e:
                return False

        # 2) Sprawdź przerwę noc->rano (nocna zmiana = 2, poranna = 0)
        if shift == 0 and day > 0:
            # Czy dzień wcześniej nocna zmiana była tą samą osobą?
            if assignment[day - 1][2] == e:
                return False

        # 3) Czy pracownik nie przekroczy zapotrzebowania?
        if shifts_count[e] >= employee_shifts_wanted[e]:
            return False

        return True

    # Spróbujmy "na ślepo" losować przypisania
    # Będziemy próbować rozlosować obsadę, dopóki nie spełnimy warunków
    # albo nie wyczerpiemy prób (max_tries)

    for _ in range(max_tries):
        # Wyzeruj
        for d in range(num_days):
            for s in range(num_shifts_per_day):
                assignment[d][s] = 5  # "nikt"
        shifts_count = [0] * num_emps

        # Iterujemy przez wszystkie dni i zmiany
        for d in range(num_days):
            for s in range(num_shifts_per_day):
                # Losowo permutujemy kolejnosc pracownikow + "nikt" (index 5)
                candidates = list(range(num_emps + 1))  # 0..4 + 5
                random.shuffle(candidates)

                assigned = False
                for e in candidates:
                    if e == 5:
                        # Opcja: nikt nie pracuje
                        # Możemy zostawić tak i przejść dalej
                        assigned = True
                        assignment[d][s] = 5
                        break
                    else:
                        if can_assign(d, s, e):
                            # Przypisz
                            assignment[d][s] = e
                            shifts_count[e] += 1
                            assigned = True
                            break
                # Jeśli nie udało się nikogo przypisać (candidates wyczerpani),
                # to wychodzimy z pętli i próbujemy od nowa
                if not assigned:
                    break
            if not assigned:
                break

        # Po skończonej próbie sprawdzamy, czy wszyscy pracownicy
        # mają DOKŁADNIE tyle zmian, ile chcieli
        # (jeśli ma być minimalnie zamiast dokładnie, można modyfikować warunek)
        if shifts_count == employee_shifts_wanted:
            # Udało się
            # Zamieniamy assignment na 105 binarnych atrybutów
            output = []
            for d in range(num_days):
                for s in range(num_shifts_per_day):
                    for e in range(num_emps):
                        if assignment[d][s] == e:
                            output.append(1)
                        else:
                            output.append(0)
            return output, True

    # Jeśli nie udało się w max_tries
    return [], False


def generate_dataset(num_samples=50, filename="harmonogram_data.csv"):
    """
    Generuje 'num_samples' przykładów i zapisuje do pliku CSV.
    Każdy przykład:
      - 5 kolumn wejściowych (employee_shifts_wanted)
      - 105 kolumn wyjściowych (assignment binarny)
    """
    # Przygotuj nagłówek
    # Input: wanted_emp0..4
    # Output: out_0..out_104
    header = []
    for i in range(5):
        header.append(f"wanted_emp{i}")
    for i in range(105):
        header.append(f"out_{i}")

    rows = []
    generated = 0

    # Aby generować pewne zróżnicowanie, weźmy w pętli,
    # ale można też generować do skutku, aż zbierzemy 50
    attempts = 0
    while generated < num_samples and attempts < 10000:
        attempts += 1

        # Losujemy, ile zmian chce każdy z 5 pracowników (2-5)
        emp_wanted = [random.randint(2, 5) for _ in range(5)]

        schedule, success = generate_random_schedule(emp_wanted)
        if success:
            row = emp_wanted + schedule
            rows.append(row)
            generated += 1

    # Zapis do CSV
    with open(filename, "w", newline="") as f:
        writer = csv.writer(f)
        writer.writerow(header)
        writer.writerows(rows)

    print(f"Wygenerowano {generated} harmonogramów i zapisano do {filename}.")

# ====================================================
# 2. WYWOŁANIE GENEROWANIA DANYCH
# ====================================================
generate_dataset(num_samples=50, filename="harmonogram_data.csv")

Wygenerowano 50 harmonogramów i zapisano do harmonogram_data.csv.


In [7]:
# ====================================================
# 3. TRENOWANIE SIECI NEURONOWEJ
# ====================================================
# Poniżej przykład z Keras (TensorFlow).
# Musisz mieć zainstalowane biblioteki: tensorflow lub keras.
# Jeżeli nie masz – zainstaluj:
#   pip install tensorflow
# lub
#   pip install keras
# (zależnie od wersji Pythona i środowiska).

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
import pandas as pd

# Wczytanie danych z CSV
data = pd.read_csv("harmonogram_data.csv")

# Podział na X (wejście: 5 kolumn) i Y (wyjście: 105 kolumn)
X_cols = [f"wanted_emp{i}" for i in range(5)]
Y_cols = [f"out_{i}" for i in range(105)]

X = data[X_cols].values
Y = data[Y_cols].values

# Definicja modelu
model = Sequential()
model.add(Dense(32, activation='relu', input_shape=(5,)))
model.add(Dense(64, activation='relu'))
model.add(Dense(105, activation='sigmoid'))  # 105 wyjść binarnych
model.compile(optimizer=Adam(), loss='binary_crossentropy')

# Trening
model.fit(X, Y, epochs=50, batch_size=8, validation_split=0.2)

# Po treningu możesz wypróbować prognozę:
# (oczywiście sieć może "głupoty" przewidywać przy tak małej liczbie próbek)
test_input = np.array([[3, 4, 5, 2, 5]])
prediction = model.predict(test_input)
print("Przewidywany harmonogram (pierwsze 21 wartości):")
print(prediction[0][:21])


Epoch 1/50


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 56ms/step - loss: 0.7571 - val_loss: 0.7193
Epoch 2/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 21ms/step - loss: 0.7097 - val_loss: 0.6831
Epoch 3/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 19ms/step - loss: 0.6755 - val_loss: 0.6536
Epoch 4/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 21ms/step - loss: 0.6446 - val_loss: 0.6261
Epoch 5/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 22ms/step - loss: 0.6153 - val_loss: 0.5983
Epoch 6/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 22ms/step - loss: 0.5901 - val_loss: 0.5691
Epoch 7/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 20ms/step - loss: 0.5613 - val_loss: 0.5391
Epoch 8/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 19ms/step - loss: 0.5301 - val_loss: 0.5108
Epoch 9/50
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 21