# Dynamika zawodników defensywnych podczas meczu piłki nożnej. Optymalizacja ustawienia

Odkąd w Cambridge w 1848 roku zapisano pierwsze zasady piłki nożnej, gra nieustannie ewoluuje. Początkowo najpopularniejszą formacją była tak zwana „odwrócona piramida”, czyli ustawienie 1-2-3-5. Dopiero później uświadomiono sobie, że dwóch środkowych obrońców to zdecydowanie za mało, i dziś w formacji obronnej widujemy trzech, czterech, a nawet pięciu obrońców. Jeden z najlepszych menedżerów w piłce nożnej, Sir Alex Ferguson, powiedział: „Atak wygrywa ci mecze, obrona wygrywa ci trofea” – i jest w tym wiele prawdy. Aby wygrać mecz, zazwyczaj musisz zdobyć jedną bramkę więcej niż przeciwnik, a staje się to o wiele łatwiejsze, gdy twoja defensywa jest szczelna.

Na zachowanie obrońcy wpływa wiele czynników, ale my skupimy się głównie na trzech z nich: wyznaczonej pozycji, odległości od przeciwnika oraz odległości od kolegów z drużyny. W naszym projekcie postaramy się znaleźć optymalne zachowanie obrońców za pomocą równania różniczkowego i zdecydować, jaka mieszanka tych czynników przynosi najlepsze rezultaty w obronie własnej bramki. Oczywiście tak uproszczony model nie rozwiąże problemów menedżerów największych klubów piłkarskich, ale może okazać się pomocny przy planowaniu treningów czy tworzeniu piłkarskich gier komputerowych.

---

## Wzór na całkowitą siłę działającą na zawodnika

Równanie opisujące całkowitą siłę działającą na $i$-tego zawodnika w drużynie można zapisać jako:

$$
\frac{d \mathbf{r}_{i}}{dt} = \mathbf{F}_{\text{pos},i} + \mathbf{F}_{\text{opp},i} + \mathbf{F}_{\text{team},i}
$$

### Gdzie:
- $\mathbf{r}_i(t)$: Pozycja $i$-tego obrońcy w czasie $t$ jako wektor $[\mathbf{x}_i(t), \mathbf{y}_i(t)]$,
- $\frac{d\mathbf{r}_i}{dt}$: Prędkość $i$-tego obrońcy (zmiana pozycji w czasie),
- $\mathbf{F}_{\text{pos},i}$: Siła przyciągania $i$-tego obrońcy do ustalonej pozycji na boisku,
- $\mathbf{F}_{\text{opp},i}$: Siła działająca na $i$-tego obrońcę reagująca na przeciwnika z piłką,
- $\mathbf{F}_{\text{team},i}$: Siła działająca na $i$-tego obrońcę reagująca na pozycję kolegów z drużyny.

Zgodnie z zasadą superpozycji w mechanice klasycznej, siły pochodzące z różnych źródeł mogą być sumowane w celu wyznaczenia całkowitej siły działającej na ciało.

---

## 1. Siła dążenia do pozycji ($F_{\text{pos}, i}$)

Siła ta opisuje dążenie zawodnika do swojej wyznaczonej pozycji na boisku. Bazuje ona na **prawie Hooke’a** (siła sprężystości): $F = -k \cdot x$.

$$
F_{\text{pos}, i} = -k_{\text{pos}} \cdot (\mathbf{r}_i - \mathbf{r}_{\text{pos}, i})
$$

Gdzie:
- $\mathbf{r}_i$: Aktualna pozycja $i$-tego zawodnika,
- $\mathbf{r}_{\text{pos}, i}$: Wyznaczona pozycja $i$-tego zawodnika,
- $k_{\text{pos}}$: Współczynnik określający intensywność dążenia do celu.

---

## 2. Siła przyciągania do przeciwnika ($F_{\text{opp}, i}$)

Siła ta opisuje reakcję zawodnika na pozycję przeciwnika. Bazuje ona na **prawie grawitacji** (przyciąganie ciał):

$$
F_{\text{opp}, i} = \frac{k_{\text{opp}} \cdot (\mathbf{r}_{\text{opp}} - \mathbf{r}_i)}{\|\mathbf{r}_{\text{opp}} - \mathbf{r}_i\|^2 + \epsilon}
$$

Gdzie:
- $\mathbf{r}_{\text{opp}}$: Pozycja przeciwnika z piłką,
- $\mathbf{r}_i$: Aktualna pozycja $i$-tego zawodnika,
- $k_{\text{opp}}$: Współczynnik określający intensywność reakcji na przeciwnika,
- $\epsilon$: Mała wartość dodana w celu uniknięcia dzielenia przez zero.

W naszym modelu zawodnik $i$ jest przyciągany przez przeciwnika w punkcie $\mathbf{r}_{\text{opp}}$, a siła maleje z kwadratem odległości ($\|\mathbf{r}_{\text{opp}} - \mathbf{r}_i\|^2$). Współczynnik $k_{\text{opp}}$ kontroluje, jak silne jest przyciąganie, a $\varepsilon$ zapobiega dzieleniu przez zero, gdy zawodnik $i$ znajduje się bardzo blisko przeciwnika.

---

## 3. Siła odpychania od kolegów z drużyny ($F_{\text{team}, i}$)

Siła ta opisuje interakcje przestrzenne zawodnika z innymi członkami drużyny. Bazuje ona na **prawie Coulomba** (odpychanie między ładunkami): $F \sim \frac{1}{r^2}$.

$$
F_{\text{team}, i} = \sum_{j \neq i} \frac{-k_{\text{team}} \cdot (\mathbf{r}_j - \mathbf{r}_i)}{\|\mathbf{r}_j - \mathbf{r}_i\|^2 + \epsilon}
$$

Gdzie:
- $\mathbf{r}_j$: Pozycja $j$-tego kolegi z drużyny,
- $\mathbf{r}_i$: Aktualna pozycja $i$-tego zawodnika,
- $k_{\text{team}}$: Współczynnik określający intensywność odpychania,
- $\epsilon$: Mała wartość dodana w celu uniknięcia dzielenia przez zero.

Ten składnik inspirowany jest zjawiskiem "odpychania", podobnym do sił między naładowanymi cząstkami w modelu elektrostatycznym, gdzie zawodnicy unikają nadmiernego tłoku wokół siebie.

---

## Podobieństwo do algorytmu stada (Boids)

Stworzony przez nas wzór jest bardzo podobny do algorytmu **Boids**, opracowanego przez Craiga Reynoldsa w 1986 roku, który służy do symulowania zachowań grupy autonomicznych agentów (np. ptaków, ryb, owadów) poruszających się w przestrzeni na podstawie trzech prostych zasad: separacji, wyrównania i kohezji. Zasady te w pewnym sensie odpowiadają naszym zasadom ruchu.

- **Separacja** w Boids zapobiega zderzeniom między agentami, co w naszym przypadku odpowiada sile $F_{\text{team}, i}$, która utrzymuje odpowiednią odległość między obrońcami, zapobiegając zbytnim skupiskom.
- **Wyrównanie** powoduje, że boidy dążą do wyrównania swoich prędkości – ten aspekt nie ma odzwierciedlenia w naszym modelu.
- **Kohezja** zapewnia spójność grupy, co w naszym modelu odpowiada równowadze między siłami $F_{\text{pos}, i}$ i $F_{\text{opp}, i}$, które pomagają obrońcom reagować na ruchy przeciwnika, jednocześnie utrzymując pozycje w drużynie.

---

## Symulacja ataku na bramkę

Korzystając z naszego wzoru przygotowaliśmy prostą symulację obrony akcji bramkowej. Napastnicy przemieszczają się w linii prostej w stronę pola karnego, a zachowanie obrońców jest wynikową sumy naszych sił działających na nich. Gdy dochodzi do spotkania defensora i atakującego z piłką, z prawdopodobieństwem do 50% (w zależności od odległości miedzy zawodnikami) piłka zostaje odebrana, co kończy symulację na korzyść drużyny broniącej. Alternatywnie, napastnik podaje piłkę do najbliższego kolegi z drużyny, który jest w bezpiecznej pozycji. Zwycięstwem drużyny atakującej jest dotarcie do pola karnego przeciwnika.

---




In [1]:
import numpy as np
import random


class OffensivePlayer:
    def __init__(self, name, x:int, y, ideal_x, ideal_y, has_ball=False)->None:
        self.name = name
        self.initial_x = x
        self.initial_y = y
        self.x = self.initial_x
        self.y = self.initial_y
        self.ideal_x = ideal_x
        self.ideal_y = ideal_y
        self.has_ball = has_ball
        self.speed = 1.0

    def reset_position(self):
        self.x = self.initial_x
        self.y = self.initial_y
        self.has_ball = False

    def __str__(self):
        return self.name

    def move(self, delta_t, defenders):
        if self.has_ball:
            closest_defender_y = min(defender.y for defender in defenders)
            if self.y < closest_defender_y:
                target_y = min(closest_defender_y - 2, 105 / 2)
                direction = np.arctan2(target_y - self.y, 0)
                self.y += self.speed * np.sin(direction) * delta_t
            else:
                self.y -= self.speed * delta_t
        else:
            direction = np.arctan2(self.ideal_y - self.y, self.ideal_x - self.x)
            self.x += self.speed * np.cos(direction) * delta_t * 0.5
            self.y += (-delta_t * 0.75) + (self.speed * np.sin(direction) * delta_t * 0.5)

    def closest_defender_distance(self, defenders):
        distances = [np.linalg.norm((self.x - d.x, self.y - d.y)) for d in defenders]
        return min(distances)

    def find_best_teammate(self, teammates, defenders):
        best_teammate = None
        max_distance = -np.inf
        for teammate in teammates:
            if teammate != self:
                distance_to_closest_defender = teammate.closest_defender_distance(defenders)
                if distance_to_closest_defender > max_distance:
                    max_distance = distance_to_closest_defender
                    best_teammate = teammate
        return best_teammate

    def pass_ball(self, ball, teammates, defenders):
        best_teammate = self.find_best_teammate(teammates, defenders)
        if best_teammate:
            self.has_ball = False
            ball.owner = None
            ball.target = best_teammate
            ball.is_moving = True

class DefensivePlayer:
    def __init__(self, x, y, ideal_x, ideal_y):
        self.initial_x = x
        self.initial_y = y
        self.x = self.initial_x
        self.y = self.initial_y
        self.ideal_x = ideal_x
        self.ideal_y = ideal_y
        self.speed = 1.1
        self.has_ball = False

    def reset_position(self):
        self.x = self.initial_x
        self.y = self.initial_y
        self.has_ball = False

    def closest_offensive_distance(self, offs):
        distances = [np.linalg.norm((self.x - o.x, self.y - o.y)) for o in offs]
        return min(distances)

    def move_towards(self, target_x, target_y, delta_t):
        direction = np.arctan2(target_y - self.y, target_x - self.x)
        self.x += self.speed * np.cos(direction) * delta_t
        self.y += self.speed * np.sin(direction) * delta_t

    def calculate_total_force(self, offs, teammates, k_goal, k_opp, k_team, epsilon=5e-1):
        r_x, r_y = self.x, self.y
        r_goal_x, r_goal_y = self.ideal_x, self.ideal_y
        f_goal_x = -k_goal * (r_x - r_goal_x)
        f_goal_y = -k_goal * (r_y - r_goal_y)
        f_opp_x, f_opp_y = 0.0, 0.0
        for opponent in offs:
            r_opp_x, r_opp_y = opponent.x, opponent.y
            r_diff_opp_x = r_opp_x - r_x
            r_diff_opp_y = r_opp_y - r_y
            distance_opp = max((r_diff_opp_x ** 2 + r_diff_opp_y ** 2) ** 0.5, epsilon)
            f_opp_x += (k_opp * r_diff_opp_x) / (distance_opp ** 2 + epsilon)
            f_opp_y += (k_opp * r_diff_opp_y) / (distance_opp ** 2 + epsilon)
        f_team_x, f_team_y = 0.0, 0.0
        for teammate in teammates:
            if teammate == self:
                continue
            r_j_x, r_j_y = teammate.x, teammate.y
            r_diff_team_x = r_j_x - r_x
            r_diff_team_y = r_j_y - r_y
            distance_team = max((r_diff_team_x ** 2 + r_diff_team_y ** 2) ** 0.5, epsilon)
            f_team_x += (-k_team * r_diff_team_x) / (distance_team ** 2 + epsilon)
            f_team_y += (-k_team * r_diff_team_y) / (distance_team ** 2 + epsilon)
        f_total_x = f_goal_x + f_opp_x + f_team_x
        f_total_y = f_goal_y + f_opp_y + f_team_y
        return f_total_x, f_total_y

    def move(self, offs, teammates, k_goal, k_opp, k_team, delta_t):
        att_x, att_y = self.calculate_total_force(offs, teammates, k_goal, k_opp, k_team)
        self.x += att_x * self.speed * delta_t
        self.y += att_y * self.speed * delta_t

    def intercept_pass(self, ball):
        if ball.is_moving and not ball.owner:
            distance_to_ball = np.linalg.norm((self.x - ball.x, self.y - ball.y))
            if random.random() < 0.5 and distance_to_ball < 0.75:
                return True
        return False

    def tackle(self, offensive_player):
        distance_to_player = np.linalg.norm((self.x - offensive_player.x, self.y - offensive_player.y))
        if offensive_player.has_ball:
            if distance_to_player <= 1.5:
                tackle_chance = max(0.5 * (1.5 - distance_to_player) / 1.5, 0)
                if random.random() < tackle_chance:
                    offensive_player.has_ball = False
                    return True
        return False

class Ball:
    def __init__(self, x, y, owner=None):
        self.x = x
        self.y = y
        self.initial_x = self.x
        self.initial_y = self.y
        self.owner = owner
        self.is_moving = False
        self.speed = 4.0
        self.target = None

    def reset(self):
        self.x = self.initial_x
        self.y = self.initial_y
        self.owner = None
        self.is_moving = False

    def closest_defender_distance(self, defenders):
        distances = [np.linalg.norm((self.x - d.x, self.y - d.y)) for d in defenders]
        return min(distances)

    def update_position(self, delta_t):
        if self.is_moving and self.target:
            direction = np.arctan2(self.target.y - self.y, self.target.x - self.x)
            self.x += self.speed * np.cos(direction) * delta_t
            self.y += self.speed * np.sin(direction) * delta_t
            if np.linalg.norm((self.x - self.target.x, self.y - self.target.y)) < 1:
                self.is_moving = False
                self.owner = self.target
                self.owner.has_ball = True
                self.target = None

    def move(self):
        if self.owner:
            self.x = self.owner.x
            self.y = self.owner.y


import matplotlib as plt
plt.use('TkAgg')

field_x_min, field_x_max = float(0), float(68)
field_y_min, field_y_max = float(0), float(105)

def draw_pitch():
    plt.plot([field_x_min, field_x_max], [0, 0], 'k-')
    plt.plot([field_x_min, field_x_max], [field_y_max, field_y_max], 'k-')
    plt.plot([field_x_min, field_x_min], [0, field_y_max], 'k-')
    plt.plot([field_x_max, field_x_max], [0, field_y_max], 'k-')
    plt.plot([field_x_min, field_x_max], [field_y_max / 2, field_y_max / 2], 'k--')
    plt.plot([13.84, 13.84], [0, 16.5], 'k-')
    plt.plot([field_x_max - 13.84, field_x_max - 13.84], [0, 16.5], 'k-')
    plt.plot([13.84, field_x_max - 13.84], [16.5, 16.5], 'k-')
    plt.plot([13.84, 13.84], [field_y_max, field_y_max - 16.5], 'k-')
    plt.plot([field_x_max - 13.84, field_x_max - 13.84], [field_y_max, field_y_max - 16.5], 'k-')
    plt.plot([13.84, field_x_max - 13.84], [field_y_max - 16.5, field_y_max - 16.5], 'k-')
    plt.scatter([34], [11], color='k', s=30)
    plt.scatter([34], [field_y_max - 11], color='k', s=30)
    circle = plt.Circle((34, field_y_max / 2), 9.15, color='k', fill=False)
    plt.gca().add_artist(circle)
    plt.scatter([34], [field_y_max / 2], color='k', s=30)

d1 = DefensivePlayer(18, 15, 18, 18)
d2 = DefensivePlayer(23, 15, 28, 18)
d3 = DefensivePlayer(41, 15, 38, 18)
d4 = DefensivePlayer(48, 15, 48, 18)
d5 = DefensivePlayer(25, 30, 25, 30)
d6 = DefensivePlayer(35, 30, 35, 30)
d7 = DefensivePlayer(45, 30, 45, 30)

o1 = OffensivePlayer("o1", 20, 40, 14, 40, False)
o2 = OffensivePlayer("o2", 34, 45, 30, 45, True)
o3 = OffensivePlayer("o3", 48, 40, 52, 40, False)
o4 = OffensivePlayer("o4", 25, 55, 20, 55, False)
o5 = OffensivePlayer("o5", 34, 60, 32, 60, False)
o6 = OffensivePlayer("o6", 43, 55, 46, 55, False)

k_goal = 1.0
k_opp = 5.0
k_team = 1.0

ball = Ball(x=34, y=45, owner=o2)

defenders = [d1, d2, d3, d4, d5, d6, d7]
offensives = [o1, o2, o3, o4, o5, o6]

delta_t = 0.3
steps = 2000

def plot_state():
    plt.gca().cla()
    draw_pitch()
    for i, defender in enumerate(defenders):
        plt.scatter(defender.x, defender.y, color="blue", label="Defensywni" if i == 0 else "", s=100)
        plt.text(defender.x, defender.y + 2, f"D{i+1}", color="blue", ha="center")
    for i, offensive in enumerate(offensives):
        plt.scatter(offensive.x, offensive.y, color="orange", label="Ofensywni" if i == 0 else "", s=100)
        plt.text(offensive.x, offensive.y + 2, f"O{i+1}", color="orange", ha="center")
    plt.scatter(ball.x, ball.y, color="black", label="Piłka", s=50)
    plt.xlim(field_x_min - 5, field_x_max + 5)
    plt.ylim(-5, field_y_max + 5)
    plt.gca().set_aspect("equal", adjustable="box")
    plt.legend()
    plt.pause(0.01)

def find_closest_to_ball(defenders, ball):
    distances = [(defender, np.linalg.norm((defender.x - ball.x, defender.y - ball.y))) for defender in defenders]
    closest_defender, min_distance = min(distances, key=lambda x: x[1])
    return closest_defender

def simulate_step():
    if ball.is_moving:
        ball.update_position(delta_t)
    else:
        ball.move()
    for offensive in offensives:
        if offensive.has_ball:
            offensive.move(delta_t, defenders)
            closest_defender_distance = offensive.closest_defender_distance(defenders)
            if closest_defender_distance < 1.5:
                offensive.pass_ball(ball, offensives, defenders)
        else:
            offensive.move(delta_t, defenders)
    for defender in defenders:
        if ball.is_moving and defender.intercept_pass(ball):
            ball.is_moving = False
            ball.owner = defender
            defender.has_ball = True
            for offensive in offensives:
                offensive.has_ball = False
            return False
    if ball.owner and isinstance(ball.owner, OffensivePlayer):
        closest_defender = find_closest_to_ball(defenders, ball)
        success = closest_defender.tackle(ball.owner)
        if success:
            ball.owner = closest_defender
            for offensive in offensives:
                offensive.has_ball = False
            closest_defender.has_ball = True
            return False
    for defender in defenders:
        if ball.owner is None:
            defender.move_towards(ball.x, ball.y, delta_t)
        else:
            defender.move(offensives, defenders, k_goal, k_opp, k_team, delta_t)
    if ball.y < 16 and ball.owner and 13 < ball.x < 52:
        return False
    return True

def animation():
    plt.figure(figsize=(10, 15))
    plt.ion()
    for step in range(steps):
        if not simulate_step():
            break
        plot_state()
    plt.ioff()

## Optymalizacja

Chcemy znaleźć takie wartości parametrów $k_{\text{pos}}, k_{\text{opp}}, k_{\text{team}}$, które maksymalizują funkcję celu:

$$
f(k_{\text{pos}}, k_{\text{opp}}, k_{\text{team}}) = \frac{1}{N} \sum_{i=1}^N \text{simulate}(k_{\text{pos}}, k_{\text{opp}}, k_{\text{team}})
$$

Gdzie:
- $\text{simulate}$ zwraca wynik pojedynczej symulacji (1 dla sukcesu obrońców, 0 dla porażki),
- $N$ oznacza liczbę przeprowadzonych symulacji (w naszym przypadku będzie to 200).

W tym celu zastosujemy metodę **gradient ascent**, aby iteracyjnie znaleźć maksimum tej funkcji.

---

## Gradient ascent

Gradient ascent to iteracyjna metoda znajdowania maksimum funkcji. W odróżnieniu od gradient descent, w którym schodzimy w dół funkcji, w gradient ascent poruszamy się w kierunku gradientu, czyli w górę funkcji, poszukując jej maksimum.

### Gradient funkcji celu

$$
\nabla f = \left( \frac{\partial f}{\partial k_{\text{pos}}}, \frac{\partial f}{\partial k_{\text{opp}}}, \frac{\partial f}{\partial k_{\text{team}}} \right)
$$

Ponieważ $f$ nie jest podana w sposób analityczny, gradient liczymy numerycznie:

$
\frac{\partial f}{\partial k_i} \approx \frac{f(k + \epsilon e_i) - f(k - \epsilon e_i)}{\epsilon}
$

Gdzie:
- $e_i$ to jednostkowy wektor wskazujący kierunek parametru k,
- $\epsilon$ to mała wartość, np. $10^{-6}$.

---

## Aktualizacja parametrów

W gradient ascent aktualizujemy parametry, poruszając się w kierunku gradientu:

$$
k^{(t+1)} = k^{(t)} + \alpha \nabla f(k^{(t)})
$$

Gdzie:
- $k^{(t)}$: Wektor parametrów w iteracji $t$,
- $\alpha$: Krok uczenia (**learning rate**),
- $\nabla f(k^{(t)})$: Gradient funkcji celu w bieżącym punkcie.

Krok uczenia ($\textit{learning rate}$) to mała wartość, która określa wielkość kroku wykonywanego w kierunku gradientu podczas optymalizacji. Odpowiedni dobór kroku uczenia ma kluczowe znaczenie dla skuteczności algorytmu:

- **Zbyt duży krok uczenia** może prowadzić do niestabilności i trudności w znalezieniu maksimum, ponieważ algorytm może „przeskakiwać” nad szczytem funkcji celu.
- **Zbyt mały krok uczenia** sprawia, że algorytm działa wolno i może zatrzymać się w lokalnym maksimum, zwłaszcza jeśli funkcja celu ma płaskie obszary.

---

## Kroki algorytmu

1. **Inicjacja parametrów:**  
   Wybieramy początkowe wartości \(k_{\text{pos}}, k_{\text{opp}}, k_{\text{team}}\).  
   (W naszym przypadku \([5.0, 5.0, 5.0]\)).

2. **Liczenie gradientu:**  
   Wyznaczamy gradient \(\nabla f\) numerycznie w bieżącym punkcie.

3. **Aktualizacja parametrów:**  
   Aktualizujemy wartości parametrów zgodnie ze wzorem aktualizacji.

4. **Powtórz:**  
   Powtarzamy kroki od 2 do 3 określoną liczbę razy.

Ze względu na element losowości w naszej symulacji, funkcja nie osiągnie jednego, definitywnego maksimum.  
Dlatego, zamiast ustalać warunek stopu, iterujemy algorytm przez dużą liczbę kroków. W praktyce, jeśli sukces obrońców wzrasta, parametry są przesuwane w kierunku odpowiadającemu większemu sukcesowi.




In [None]:
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm


def reset_simulation():
    global defenders, offensives, ball

    for defender in defenders:
        defender.reset_position()
        defender.has_ball = False

    for offensive in offensives:
        offensive.reset_position()
        offensive.has_ball = False

    ball.reset()
    offensives[1].has_ball = True
    ball.owner = offensives[1]
    ball.x, ball.y = offensives[1].x, offensives[1].y
    ball.is_moving = False

def simulate_multiple_times(num_simulations=100, k_goal=1.0, k_opp=1.0, k_team=1.0):
    global defenders, offensives, ball
    for defender in defenders:
        defender.k_goal = k_goal
        defender.k_opp = k_opp
        defender.k_team = k_team

    defender_wins = 0

    for simulation in range(num_simulations):
        reset_simulation()

        for step in range(steps):
            if not simulate_step():
                if ball.owner and isinstance(ball.owner, DefensivePlayer):
                    defender_wins += 1
                break

    return defender_wins / num_simulations

def gradient_ascent(num_simulations=100, alpha=0.005, max_iters=100, epsilon=1e-6, decay_rate=1):
    k_goal, k_opp, k_team = 5, 5, 5
    results = []
    best_k_goal, best_k_opp, best_k_team = k_goal, k_opp, k_team
    best_value = 0.0

    for iteration in range(max_iters):
        current_value = simulate_multiple_times(num_simulations, k_goal, k_opp, k_team)
        results.append([k_goal, k_opp, k_team, current_value])

        if current_value > best_value:
            best_value = current_value
            best_k_goal, best_k_opp, best_k_team = k_goal, k_opp, k_team

        grad_k_goal = (simulate_multiple_times(num_simulations, k_goal + epsilon, k_opp, k_team) - current_value) / epsilon
        grad_k_opp = (simulate_multiple_times(num_simulations, k_goal, k_opp + epsilon, k_team) - current_value) / epsilon
        grad_k_team = (simulate_multiple_times(num_simulations, k_goal, k_opp, k_team + epsilon) - current_value) / epsilon

        grad_norm = np.sqrt(grad_k_goal**2 + grad_k_opp**2 + grad_k_team**2 + 1e-8)
        grad_k_goal /= grad_norm
        grad_k_opp /= grad_norm
        grad_k_team /= grad_norm

        k_goal = max(0.1, min(k_goal + alpha * grad_k_goal, 10.0))
        k_opp = max(0.1, min(k_opp + alpha * grad_k_opp, 10.0))
        k_team = max(0.1, min(k_team + alpha * grad_k_team, 10.0))

        alpha *= decay_rate

        print(f"Iteracja {iteration + 1}: k_goal={k_goal:.4f}, k_opp={k_opp:.4f}, k_team={k_team:.4f}, wartość={current_value:.4f}")

        if grad_norm < epsilon:
            print("Gradient ascent zakończony - osiągnięto zbieżność.")
            break

    print(f"\nNajlepsza wartość funkcji celu: {best_value:.4f}")
    print(f"Odpowiadające jej parametry: k_goal={best_k_goal:.4f}, k_opp={best_k_opp:.4f}, k_team={best_k_team:.4f}")

    return best_k_goal, best_k_opp, best_k_team, np.array(results)

optimal_k_goal, optimal_k_opp, optimal_k_team, results = gradient_ascent(num_simulations=100, alpha=1, max_iters=1000)

function_values = results[:, 3]

plt.plot(function_values)
plt.title("Wartość funkcji celu w kolejnych iteracjach")
plt.xlabel("Iteracja")
plt.ylabel("f(x, y, z)")
plt.show()

def plot_3d_heatmap(results):
    fig = plt.figure(figsize=(10, 8))
    ax = fig.add_subplot(111, projection='3d')
    k_goal = results[:, 0]
    k_opp = results[:, 1]
    k_team = results[:, 2]
    function_values = results[:, 3]
    norm = plt.Normalize(function_values.min(), function_values.max())
    colors = cm.get_cmap('RdYlGn')(norm(function_values))
    scatter = ax.scatter(k_goal, k_opp, k_team, c=function_values, cmap='RdYlGn', s=50, edgecolor='k')
    cbar = fig.colorbar(scatter, ax=ax, pad=0.1, shrink=0.8)
    cbar.set_label('Wartość funkcji celu (f(x, y, z))')
    ax.set_xlabel('k_goal')
    ax.set_ylabel('k_opp')
    ax.set_zlabel('k_team')
    plt.title("Heatmapa przestrzeni parametrów z wartościami funkcji celu")
    plt.show()

plot_3d_heatmap(results)

![image.jpg](image.jpg)

## Wnioski
   Najlepszy wynik funkcji celu wynosi \( f(x, y, z) = 0.6350 \), co zostało osiągnięte dla parametrów:  
   - $k_{\text{pos}}$ = 4.49,  
   - $k_{\text{opp}}$ = 3.20,  
   - $k_{\text{team}}$ = 9.02.

Na podstawie uzyskanych wyników oraz wizualizacji można stwierdzić, że algorytm działa zgodnie z oczekiwaniami. Na wykresie przestrzeni parametrów zauważalne jest zagęszczenie punktów w okolicach wartości odpowiadających najlepszym wynikom funkcji celu. Świadczy to o skuteczności metody w przybliżeniu optymalnych parametrów.

Należy jednak podkreślić, że obecność elementu losowości w symulacji powoduje, że wartości funkcji celu oraz gradientu nie są całkowicie stabilne. W efekcie na wykresie wartości funkcji w kolejnych iteracjach widoczne są fluktuacje, a wyniki nie układają się w gładką krzywą.

Mimo to, wyraźne tendencje wskazujące na poprawę wyników w miarę postępu iteracji potwierdzają skuteczność algorytmu. Można więc uznać, że zastosowana metoda gradient ascent z komponentem losowości jest adekwatna do analizowanego problemu. W praktyce daje to narzędzie do skutecznego modelowania zachowań obrońców w symulacji, z możliwością dalszej optymalizacji parametrów i założeń symulacyjnych.

## Źródła
- Odwrócona piramida. Historia taktyki piłkarskiej - Jonathan Wilson
- https://pl.wikipedia.org/wiki/Prawo_Hooke’a
- https://pl.wikipedia.org/wiki/Prawo_powszechnego_ciążenia
- https://pl.wikipedia.org/wiki/Prawo_Coulomba
- https://www.baeldung.com/cs/gradient-descent-vs-ascent
- https://en.wikipedia.org/wiki/Gradient_descent
- https://en.wikipedia.org/wiki/Boids