#  Çiftçi Ajan Projesi

Bu proje, **model-tabanlı refleks ajanların** kısmi gözlemlenebilir bir çiftlik ortamında nasıl farklı stratejilerle karar verdiklerini simüle eder.  
Ajanlar, **yumurta (Y)** ve **süt (S)** toplarken **bataklık (B)** ve **ayı (A)** gibi tehlikelerden kaçınarak **maksimum performans puanı** elde etmeyi hedefler.

Proje kapsamında üç farklı ajan geliştirilmiştir:

| Ajan | Davranış Tipi | Kısaca |
|------|----------------|--------|
| **Agent1** | Temel Model-Tabanlı Refleks Ajan | Hedef odaklı, planlı hareket eder |
| **Agent2** | Gelişmiş Model-Tabanlı Refleks Ajan | Tehlikeleri belleğinde tutar, riskten kaçınır |
| **Agent3** | Rastgele Model-Tabanlı Refleks Ajan | Model yapısını korur fakat rastgele kararlar verir |

---

##  Amaç (PEAS Tanımı)

| Bileşen | Açıklama |
|----------|-----------|
| **Performance (P)** | Yumurta toplamak **+2**, süt toplamak **+5**, bataklığa girmek **-10**, ayıya girmek **-100** puan etkiler. |
| **Environment (E)** | 10×10 ızgara harita. Kaynaklar (S, Y) ve tehlikeler (A, B) sabit konumludur. |
| **Actuators (A)** | `FORWARD`, `LEFT`, `RIGHT`, `LOAD` hareketleri. |
| **Sensors (S)** | Ajan, bulunduğu hücre ve dört komşunun durumunu algılayabilir. |

---

##  Ortam Özellikleri

| Özellik | Değer |
|----------|--------|
| Gözlemlenebilirlik | **Kısmi** – yalnızca mevcut konum ve komşu hücreler algılanır |
| Deterministik | **Evet** – aynı hareket her zaman aynı sonucu üretir |
| Dinamiklik | **Statik** – çevre zamanla değişmez |
| Ajan Sayısı | **Tek ajan** |
| Episodiklik | **Sekansiyel** – geçmiş kararlar sonraki adımları etkiler |

---

##  Ajan Türleri ve Davranış Farkları

###  **Agent1 – Temel Model-Tabanlı Refleks Ajan**

- Çevreyi algılar ve **gözlem geçmişini belleğinde tutar.**
- Bilinen kaynaklara yönelir, yoksa rastgele keşif yapar.
- Tehlike bilgisini dikkate almaz.

**Karar Mekanizması:**
1. Bulunduğu hücrede kaynak varsa → **LOAD**  
2. Hafızasında bilinen kaynak varsa → **Yöne dön ve ilerle**  
3. Bilgi yoksa → **Rastgele keşfet (öncelikli ileri)**  

---

###  **Agent2 – Risk Odaklı Model-Tabanlı Refleks Ajan**

- Agent1’in tüm özelliklerine ek olarak:
  - **Tehlikeli hücreleri (A, B)** hafızaya kaydeder.
  - Riskli yönleri tercih etmez.
- Daha güvenli bir rota belirler, verimlilik artar.

**Ek Farklar:**
- Tehlikeden kaçınmak için hafızadaki bilgiye dayanır.  
- Öncelikli hedef: **Kaynak toplamak + riskten kaçınmak.**

---

###  **Agent3 – Rastgele Hareketli Ajan**

- Model tabanlı yapıya sahip olsa da **bellek veya karar mantığı yoktur.**
- Her adımda rastgele yön ve hareket seçer.
- **Zekâ seviyesi düşüktür**, ancak “davranış testi” için kullanılır.

**Amaç:**  
Rastgele hareket eden bir ajanın performansını ölçerek, refleks ve bellekli ajanlarla karşılaştırmak.

---

##  Karşılaştırmalı Özellik Tablosu

| Özellik | Agent1 | Agent2 | Agent3 |
|----------|---------|---------|---------|
| Model Tabanlılık | ✅ | ✅ | ✅ |
| Bellek / Hafıza | 🟡 (Kaynak) | 🟢 (Kaynak + Tehlike) | ❌ |
| Karar Mekanizması | Hedef odaklı | Hedef + risk analizi | Rastgele |
| Öğrenme Yeteneği | ❌ | ❌ | ❌ |
| Zekâ Seviyesi | Orta | Yüksek | Düşük |
| Performans Beklentisi | Orta | Yüksek | Düşük |
| Rastgelelik | Düşük | Düşük | Yüksek |

---

##  Kod Yapısı

| Dosya / Sınıf | Açıklama |
|----------------|-----------|
| `XYEnvironment` | 10×10 ortamın haritasını, sınırları, kaynakları ve tehlikeleri yönetir. |
| `Agent1` / `Agent2` / `Agent3` | Farklı stratejilerle karar veren ajan sınıfları. |
| `create_grid()` | Haritayı oluşturur; kaynak ve tehlike yerleşimlerini belirler. |
| `run_episode()` | Simülasyonu başlatır, ajan hareketlerini çalıştırır ve toplam puanı döndürür. |
| `display_grid()` | Simülasyonun görsel çıktısını (ızgara halinde) ekrana yazdırır. |

---

##  Performans Değerlendirmesi

Ajanlar, aynı harita üzerinde çalıştırılarak **ortalama performans**, **toplanan kaynak sayısı** ve **maruz kalınan tehlike sayısı** açısından kıyaslanır.

| Metrik | Agent1 | Agent2 | Agent3 |
|--------|---------|---------|---------|
| Toplanan Kaynak | Orta | Yüksek | Düşük |
| Tehlike Çarpışması | Orta | Düşük | Yüksek |
| Ortalama Skor | Orta | Yüksek | Düşük |

---

##  Sonuç

Bu çalışma, **model tabanlı refleks ajanların bellek, karar verme ve rastgelelik seviyelerine göre performans farklarını** göstermektedir.  
Sonuç olarak:

- **Agent2**, dengeli stratejisiyle en başarılı ajandır.  
- **Agent1**, sınırlı hafızasıyla orta düzeyde performans sergiler.  
- **Agent3**, karar zekâsı olmadan rastgele hareket ettiği için düşük performans gösterir.


In [None]:
# AGENT1 - Temel Model-Tabanlı Refleks Ajan

import nbformat
from nbformat.v4 import new_notebook, new_markdown_cell, new_code_cell
import random
import statistics
from enum import Enum



class Direction(Enum):
    """Yön tanımları"""
    NORTH = 0
    EAST = 1
    SOUTH = 2
    WEST = 3

# Her yön için hareket deltaları
move_delta = {
    Direction.NORTH: (-1, 0),
    Direction.SOUTH: (1, 0),
    Direction.EAST: (0, 1),
    Direction.WEST: (0, -1)
}

class XYEnvironment:
    """
    10x10 grid ortamı.
    - 'E': Engel (geçilemez)
    - 'Y': Yumurta (+2 puan)
    - 'S': Süt (+5 puan)
    - 'B': Bataklık (-10 puan)
    - 'A': Ayı (-100 puan)
    - 'C': Başlangıç pozisyonu
    - ' ': Boş alan
    """
    
    def __init__(self, grid, start):
        self.grid = [row[:] for row in grid]  # Deep copy
        self.start = start
        self.rows = len(grid)
        self.cols = len(grid[0])
    
    def in_bounds(self, pos):
        """Pozisyon sınırlar içinde mi?"""
        r, c = pos
        return 0 <= r < self.rows and 0 <= c < self.cols
    
    def is_obstacle(self, pos):
        """Pozisyon engel mi?"""
        r, c = pos
        return self.grid[r][c] == "E"
    
    def percept(self, pos):
        """
        Kısmi gözlem: Bulunulan hücre + 4 komşu hücrenin içeriği
        """
        r, c = pos
        obs = {}
        obs['current'] = self.grid[r][c]
        
        neighbours = {}
        for d, delta in move_delta.items():
            nr, nc = r + delta[0], c + delta[1]
            if self.in_bounds((nr, nc)):
                neighbours[d.name] = self.grid[nr][nc]
            else:
                neighbours[d.name] = None
        obs['neighbours'] = neighbours
        return obs
    
    def execute(self, agent, action):
        """
        Aksiyonu uygula ve performans değişimini döndür.
        Aksiyonlar: 'FORWARD', 'LEFT', 'RIGHT', 'LOAD'
        """
        perf_delta = 0
        
        if action == "LEFT":
            # Sadece sola dön
            agent.orientation = Direction((agent.orientation.value - 1) % 4)
            
        elif action == "RIGHT":
            # Sadece sağa dön
            agent.orientation = Direction((agent.orientation.value + 1) % 4)
            
        elif action == "FORWARD":
            # İleri git
            dr, dc = move_delta[agent.orientation]
            newpos = (agent.pos[0] + dr, agent.pos[1] + dc)
            
            if not self.in_bounds(newpos) or self.is_obstacle(newpos):
                # Engele veya sınır dışına gidilemez, yerinde kal
                return perf_delta
            
            agent.pos = newpos
            
            # Yeni hücredeki tehlikeleri kontrol et
            r, c = agent.pos
            cell_content = self.grid[r][c]
            if cell_content == "B":
                perf_delta -= 10  # Bataklık
            elif cell_content == "A":
                perf_delta -= 100  # Ayı
                
        elif action == "LOAD":
            # Bulunulan hücredeki kaynağı yükle
            r, c = agent.pos
            content = self.grid[r][c]
            
            if content == "Y" and not agent.carry_egg:
                agent.carry_egg = True
                self.grid[r][c] = " "  # Yumurtayı haritadan kaldır
                perf_delta += 2
            elif content == "S" and not agent.carry_milk:
                agent.carry_milk = True
                self.grid[r][c] = " "  # Sütü haritadan kaldır
                perf_delta += 5
            
            # LOAD sonrası hücredeki tehlikeleri kontrol et
            cell_content = self.grid[r][c]
            if cell_content == "B":
                perf_delta -= 10
            elif cell_content == "A":
                perf_delta -= 100
        
        return perf_delta


class Agent:
  
    
    def __init__(self, start, orientation=Direction.EAST):
        self.pos = start
        self.orientation = orientation
        self.carry_egg = False
        self.carry_milk = False
        self.memory = {}  # Gözlemlenen hücrelerin hafızası
    
    def perceive(self, env):
        """Ortamdan algılama yap ve hafızaya kaydet"""
        p = env.percept(self.pos)
        
        # Bulunulan hücreyi hafızaya kaydet
        r, c = self.pos
        self.memory[(r, c)] = p['current']
        
        # Komşuları hafızaya kaydet
        for dname, content in p['neighbours'].items():
            if content is not None:
                dir_enum = Direction[dname]
                dr, dc = move_delta[dir_enum]
                nr, nc = r + dr, c + dc
                self.memory[(nr, nc)] = content
        
        return p
    
    def program(self, percept, env):
      
        cur = percept['current']
        
        # 1. Bulunduğu yerde kaynak varsa yükle
        if cur == "S" and not self.carry_milk:
            return "LOAD"
        if cur == "Y" and not self.carry_egg:
            return "LOAD"
        
        # 2. Bilinen kaynaklara yönel
        targets = []
        for (pos, content) in self.memory.items():
            if content == "S" and not self.carry_milk:
                targets.append(pos)
            elif content == "Y" and not self.carry_egg:
                targets.append(pos)
        
        if targets:
            # En yakın hedefi seç (Manhattan distance)
            target = min(targets, key=lambda t: abs(t[0] - self.pos[0]) + abs(t[1] - self.pos[1]))
            
            # Hedefe doğru yönelim belirle
            dr = target[0] - self.pos[0]
            dc = target[1] - self.pos[1]
            
            # Önce dikey, sonra yatay hareket tercih et
            if dr < 0 and self.orientation != Direction.NORTH:
                return self.turn_towards(Direction.NORTH)
            elif dr > 0 and self.orientation != Direction.SOUTH:
                return self.turn_towards(Direction.SOUTH)
            elif dc < 0 and self.orientation != Direction.WEST:
                return self.turn_towards(Direction.WEST)
            elif dc > 0 and self.orientation != Direction.EAST:
                return self.turn_towards(Direction.EAST)
            else:
                # Doğru yöne bakıyoruz, ileri git
                return "FORWARD"
        
        # 3. Keşif: İleri gidebiliyorsa %70 ileri git, yoksa dön
        dr, dc = move_delta[self.orientation]
        forward_pos = (self.pos[0] + dr, self.pos[1] + dc)
        
        if env.in_bounds(forward_pos) and not env.is_obstacle(forward_pos):
            if random.random() < 0.7:
                return "FORWARD"
        
        # Rastgele dön
        return random.choice(["LEFT", "RIGHT"])
    
    def turn_towards(self, desired_dir):
        """İstenilen yöne dönmek için LEFT veya RIGHT döndür"""
        diff = (desired_dir.value - self.orientation.value) % 4
        
        if diff == 0:
            return "FORWARD"
        elif diff == 1:
            return "RIGHT"
        elif diff == 3:
            return "LEFT"
        else:  # diff == 2 (ters yön)
            return random.choice(["LEFT", "RIGHT"])




def create_grid():
    """10x10 grid haritası oluştur"""
    # Tüm kenarlar engel ile başla
    grid = [["E"] * 10 for _ in range(10)]
    
    # İç kısmı boşalt
    for i in range(1, 9):
        for j in range(1, 9):
            grid[i][j] = " "
    
    # Kaynakları ve tehlikeleri yerleştir
    placements = {
        (1, 2): "Y", (2, 2): "Y", (2, 3): "Y",  # Yumurtalar
        (1, 6): "S", (2, 6): "S", (5, 1): "S",  # Sütler
        (4, 6): "Y", (4, 7): "Y",                # Daha fazla yumurta
        (7, 5): "B", (6, 5): "B",                # Bataklıklar
        (8, 2): "A"                               # Ayı
    }
    
    for (r, c), value in placements.items():
        grid[r][c] = value
    
    # Başlangıç pozisyonu
    start = (3, 1)
    grid[start[0]][start[1]] = "C"
    
    return grid, start




def run_episode(grid, start, max_steps=50):
    """Bir epizodu çalıştır ve toplam performansı döndür"""
    env = XYEnvironment(grid, start)
    agent = Agent(start, orientation=Direction.EAST)
    total_perf = 0
    
    for step in range(max_steps):
        percept = agent.perceive(env)
        action = agent.program(percept, env)
        perf_delta = env.execute(agent, action)
        total_perf += perf_delta
    
    return total_perf



GRID, START = create_grid()
performances = []

print("Simülasyon başlatılıyor...\n")
for i in range(5):
    perf = run_episode(GRID, START, max_steps=50)
    performances.append(perf)
    print(f"Deneme {i+1}: {perf} puan")

mean_perf = statistics.mean(performances)
print(f"\n{'='*40}")
print(f"Ortalama Performans: {mean_perf:.2f} puan")
print(f"{'='*40}")






Simülasyon başlatılıyor...

Deneme 1: -93 puan
Deneme 2: 7 puan
Deneme 3: 7 puan
Deneme 4: -93 puan
Deneme 5: 7 puan

Ortalama Performans: -33.00 puan


## AGENT1 : 

###  Ajanın Özellikleri

1. **Model-Based Reflex Agent (Model Tabanlı Refleks Ajan)**  
   - Ajan, ortamdan aldığı algıları (percept) hafızasında saklayarak model oluşturur.  
   - Önceden gözlemlenen hücrelerin içeriğini (`self.memory`) kaydeder ve kararlarında bu bilgiyi kullanır.

2. **Kısmi Gözlem (Partial Observability) ile Çalışma**  
   - Ajan sadece bulunduğu hücreyi ve dört komşu hücreyi gözlemleyebilir.  
   - Bu, gerçekçi bir kısıt getirerek ajanı belirsizlik altında karar vermeye zorlar.

3. **Hedef Odaklı Karar Verme**  
   - Hafızasında bulunan “Süt (S)” veya “Yumurta (Y)” hücrelerine yönelir.  
   - Eğer bilinen bir kaynak yoksa, rastgele keşif stratejisi uygular.

4. **Eylem Kümesi**  
   - `"FORWARD"`, `"LEFT"`, `"RIGHT"`, `"LOAD"` aksiyonlarını kullanır.  
   - `"LOAD"` komutu, ajan bulunduğu hücredeki kaynağı topladığında performans artışı sağlar.

5. **Performans Ölçütü (Performance Function)**  
   - Pozitif ödüller:  
     - Yumurta toplama: **+2 puan**  
     - Süt toplama: **+5 puan**  
   - Negatif ödüller:  
     - Bataklığa girme: **-10 puan**  
     - Ayı hücresine girme: **-100 puan**

6. **Basit Yönelim Sistemi**  
   - Ajan, bulunduğu yönü `Direction` enum sınıfı ile temsil eder ve sola/sağa dönerek yönünü değiştirir.  
   - Hedef hücreye göre yönünü ayarlamak için `turn_towards()` fonksiyonunu kullanır.

---

###  Geliştirilebilecek Yönler

1. **Hedef Planlama ve Yol Bulma (Path Planning)**  
   - Şu anda ajan sadece Manhattan mesafesine göre en yakın hedefe yöneliyor.  
   - Bunun yerine **BFS**, **A\*** veya **Dijkstra** gibi algoritmalarla engelleri ve tehlikeleri dikkate alan bir yol planlama stratejisi eklenebilir.

2. **Bellek Güncelleme Mekanizması**  
   - Ajanın hafızası sadece gözlemlenen hücreleri kaydediyor, ancak ortamda değişim (örneğin kaynakların toplanması) sonrası bellek güncellenmiyor.  
   - “Artık boş” olan hücrelerin hafızadan silinmesi veya güncellenmesi daha verimli olur.

3. **Risk Değerlendirme (Utility-Based Decision)**  
   - Karar mekanizmasında sadece kaynak odaklı hareket var.  
   - Bunun yerine **beklenen kazanç (expected utility)** hesaplayan bir sistem eklenebilir:  
     örn. `utility = reward - risk`.

4. **Enerji veya Zaman Sınırlaması**  
   - Şu an ajan sınırsız hareket ediyor.  
   - Bir “enerji” veya “adım limiti” eklenerek stratejik optimizasyon teşvik edilebilir.

5. **Öğrenme Yeteneği (Learning Agent)**  
   - Performans geçmişine göre aksiyonlarını optimize eden bir öğrenme mekanizması (örneğin Q-Learning veya SARSA) eklenebilir.  
   - Bu sayede ajan zamanla daha verimli yollar keşfedebilir.

6. **Çoklu Hedef Önceliklendirme**  
   - Şu anda süt ve yumurta aynı öneme sahip.  
   - Farklı kaynak türlerine ağırlık atayan bir **öncelik sistemi** geliştirilebilir.

7. **Bataklık ve Ayıdan Kaçınma**  
   - Ajan, tehlikeli hücreleri bilse de bunlardan kaçınma stratejisine sahip değil.  
   - Bellekte “tehlikeli bölgeler” olarak işaretleme ve rotadan çıkarma (avoidance logic) eklenebilir.

---



In [None]:
#AGENT2 - Risk Odaklı Model-Tabanlı Refleks Ajan


import random
import statistics
from enum import Enum


class Direction(Enum):
    """Yön tanımları: Kuzey=0, Doğu=1, Güney=2, Batı=3"""
    NORTH = 0
    EAST = 1
    SOUTH = 2
    WEST = 3

# Her yön için hareket deltaları (row, col)
move_delta = {
    Direction.NORTH: (-1, 0),
    Direction.SOUTH: (1, 0),
    Direction.EAST: (0, 1),
    Direction.WEST: (0, -1)
}



class XYEnvironment:
    """
    10x10 grid ortamı.
    - 'E': Engel (geçilemez)
    - 'Y': Yumurta (+2 puan)
    - 'S': Süt (+5 puan)
    - 'B': Bataklık (-10 puan) -> Performans kaybı
    - 'A': Ayı (-100 puan) -> Performans kaybı
    - 'C': Başlangıç pozisyonu
    - ' ': Boş alan
    """
    
    def __init__(self, grid, start):
        # Ortamın başlangıç durumunu sakla (simülasyon tekrarı için)
        self._initial_grid = [row[:] for row in grid]
        self.start = start
        self.rows = len(grid)
        self.cols = len(grid[0])
        self.reset()
        
    def reset(self):
        """Ortamı başlangıç durumuna döndürür."""
        self.grid = [row[:] for row in self._initial_grid]
    
    def in_bounds(self, pos):
        """Pozisyon sınırlar içinde mi?"""
        r, c = pos
        return 0 <= r < self.rows and 0 <= c < self.cols
    
    def is_obstacle(self, pos):
        """Pozisyon engel mi?"""
        r, c = pos
        return self.grid[r][c] == "E"
    
    def percept(self, pos):
        """
        Kısmi gözlem: Bulunulan hücre + 4 komşu hücrenin içeriği
        """
        r, c = pos
        obs = {}
        # Bulunulan hücrenin içeriği
        obs['current'] = self.grid[r][c]
        
        # Komşu hücrelerin içeriği
        neighbours = {}
        for d, delta in move_delta.items():
            nr, nc = r + delta[0], c + delta[1]
            if self.in_bounds((nr, nc)):
                neighbours[d.name] = self.grid[nr][nc]
            else:
                neighbours[d.name] = "E" # Sınır dışını engel olarak algıla
        obs['neighbours'] = neighbours
        return obs
    
    def execute(self, agent, action):
        """
        Aksiyonu uygula ve performans değişimini döndür.
    
        """
        perf_delta = 0
        
        # 1. Yön Değiştirme (LEFT/RIGHT)
        if action == "LEFT":
            agent.orientation = Direction((agent.orientation.value - 1) % 4)
            
        elif action == "RIGHT":
            agent.orientation = Direction((agent.orientation.value + 1) % 4)
            
        # 2. İlerleme (FORWARD)
        elif action == "FORWARD":
            dr, dc = move_delta[agent.orientation]
            newpos = (agent.pos[0] + dr, agent.pos[1] + dc)
            
            if not self.in_bounds(newpos) or self.is_obstacle(newpos):
                # Engele veya sınır dışına gidilemez, yerinde kal
                return perf_delta
            
            agent.pos = newpos
            
            # Yeni hücredeki tehlikeleri kontrol et (Ek hareket yapmadan performans kaybı)
            r, c = agent.pos
            cell_content = self.grid[r][c]
            if cell_content == "B":
                perf_delta -= 10  # Bataklık
            elif cell_content == "A":
                perf_delta -= 100  # Ayı
                
        # 3. Yükleme (LOAD)
        elif action == "LOAD":
            # Bulunulan hücredeki kaynağı yükle
            r, c = agent.pos
            content = self.grid[r][c]
            
            if content == "Y" and not agent.carry_egg:
                agent.carry_egg = True
                self.grid[r][c] = " "  # Yumurtayı haritadan kaldır
                perf_delta += 2
            elif content == "S" and not agent.carry_milk:
                agent.carry_milk = True
                self.grid[r][c] = " "  # Sütü haritadan kaldır
                perf_delta += 5
        
        return perf_delta



class Agent:
    """
    Model-based reflex agent: Hafıza ve tehlike bilgisi kullanarak karar verir.
    """
    
    def __init__(self, start, orientation=Direction.EAST):
        self.start = start
        self.initial_orientation = orientation
        self.reset()

    def reset(self):
        """Ajanı başlangıç durumuna döndürür."""
        self.pos = self.start
        self.orientation = self.initial_orientation
        self.carry_egg = False
        self.carry_milk = False
        self.memory = {}  # Gözlemlenen hücrelerin içeriği
        self.dangers = set()  # Tehlikeli hücreler (ayı ve bataklık)
        self.visited = set()  # Ziyaret edilen hücreler
        self.visited.add(self.start)
    
    def perceive(self, env):
        """Ortamdan algılama yap ve hafızaya kaydet"""
        p = env.percept(self.pos)
        
        # Bulunulan hücreyi hafızaya kaydet/güncelle
        r, c = self.pos
        self.memory[(r, c)] = p['current']
        
        # Komşuları hafızaya kaydet/güncelle
        for dname, content in p['neighbours'].items():
            if content is not None:
                dir_enum = Direction[dname]
                dr, dc = move_delta[dir_enum]
                nr, nc = r + dr, c + dc
                
                # Sınır dışı/Engel değilse (None veya "E" değilse)
                if env.in_bounds((nr, nc)) and not env.is_obstacle((nr, nc)):
                    self.memory[(nr, nc)] = content
                
                # Tehlikeleri işaretle
                if content in ('A', 'B'):
                    self.dangers.add((nr, nc))
        
        return p
    
    def is_safe(self, pos):
        
        return pos not in self.dangers
    
    def program(self, percept, env):
       
        cur = percept['current']
        
        # 1. Amaç: Bulunduğu yerde kaynak varsa yükle
        if (cur == "S" and not self.carry_milk) or \
           (cur == "Y" and not self.carry_egg):
            return "LOAD"
        
        # Mevcut yön:
        dr, dc = move_delta[self.orientation]
        forward_pos = (self.pos[0] + dr, self.pos[1] + dc)
        
        # 2. Tehlike Kontrolü: İlerideki hücre tehlikeli, engel veya sınır dışı mı?
        forward_safe = env.in_bounds(forward_pos) and \
                       not env.is_obstacle(forward_pos) and \
                       self.is_safe(forward_pos)
        
        if not forward_safe:
            # İleride engel, sınır veya tehlike var, dön
            return random.choice(["LEFT", "RIGHT"])
            
        # 3. Amaç: Güvenli kaynaklara yönel
        targets = []
        for pos, content in self.memory.items():
            if pos in self.dangers: continue # Güvenli olmayan hedefleri atla
                
            if content == "S" and not self.carry_milk:
                targets.append((pos, 5)) # Süt öncelik 5
            elif content == "Y" and not self.carry_egg:
                targets.append((pos, 2)) # Yumurta öncelik 2
                
        if targets:
          
            target_pos = max(targets, key=lambda t: (
                t[1], # Önce değer
                - (abs(t[0][0] - self.pos[0]) + abs(t[0][1] - self.pos[1])) # Sonra yakınlık
            ))[0]
            
            # Hedefe doğru yönelim belirle
            action = self.get_action_to_target(target_pos)
            
            # Eğer aksiyon ileri gitmekse ve güvenliyse uygula
            if action == "FORWARD":
                return "FORWARD"
            # Dönme eylemi ise, dön ve yeni ileri pozisyonu kontrol et
            elif action in ("LEFT", "RIGHT"):
                return action
            # Hiçbir şey yapılamıyorsa (hedef yanımızda ama ileri gidemiyoruz)
            else:
                return random.choice(["LEFT", "RIGHT"]) # Rastgele dön
        
        # 4. Keşif: Güvenli ve ziyaret edilmemiş hücrelere doğru ilerle
        if forward_safe:
            if forward_pos not in self.visited:
                self.visited.add(forward_pos)
                return "FORWARD"
            # Ziyaret edilmiş güvenli bir yolda %50 şansla ilerle (döngüden kaçınma)
            elif random.random() < 0.5:
                return "FORWARD"
                
        # 5. Son çare: Rastgele güvenli bir yöne dön
        return random.choice(["LEFT", "RIGHT"])
    
    def get_action_to_target(self, target_pos):
        """Hedefe doğru dönmek için gerekli eylemi bulur."""
        dr = target_pos[0] - self.pos[0]
        dc = target_pos[1] - self.pos[1]
        
        # Öncelikli hareket yönünü belirle
        desired_dir = None
        if abs(dr) > abs(dc): # Dikey hareket öncelikli
            desired_dir = Direction.NORTH if dr < 0 else Direction.SOUTH
        elif abs(dc) > 0: # Yatay hareket öncelikli (dr=0 olabilir)
            desired_dir = Direction.WEST if dc < 0 else Direction.EAST
        else: # Zaten hedefteyiz (LOAD'dan sonra buraya düşebiliriz)
            return "LOAD" 
            
        # Mevcut yönden hedef yöne dönme eylemini hesapla
        if desired_dir is not None:
            diff = (desired_dir.value - self.orientation.value) % 4
            
            if diff == 0:
                return "FORWARD"
            elif diff == 1:
                return "RIGHT"
            elif diff == 3:
                return "LEFT"
            else: # diff == 2 (Ters yön)
                return random.choice(["LEFT", "RIGHT"])
        
        return random.choice(["LEFT", "RIGHT"]) # Güvenlik



def create_grid():
    """10x10 grid haritası oluştur"""
    # ... (Aynı harita tanımı) ...
    grid = [["E"] * 10 for _ in range(10)]
    
    for i in range(1, 9):
        for j in range(1, 9):
            grid[i][j] = " "
    
    placements = {
        (1, 2): "Y", (2, 2): "Y", (2, 3): "Y", 
        (1, 6): "S", (2, 6): "S", 
        (5, 2): "S", 
        (4, 6): "Y", (4, 7): "Y", 
        (7, 5): "B", (6, 5): "B", 
        (8, 2): "A" 
    }
    
    for (r, c), value in placements.items():
        grid[r][c] = value
    
    start = (3, 1)
    grid[start[0]][start[1]] = "C"
    
    return grid, start

def run_episode(grid, start, max_steps=50, verbose=False):
    """Bir epizodu çalıştır ve toplam performansı döndür"""
    env = XYEnvironment(grid, start)
    agent = Agent(start, orientation=Direction.EAST)
    total_perf = 0
    
    if verbose:
        print(f"Başlangıç: {start}, Yön: {agent.orientation.name}")
    
    for step in range(max_steps):
        percept = agent.perceive(env)
        action = agent.program(percept, env)
        perf_delta = env.execute(agent, action)
        total_perf += perf_delta
        
        if verbose:
            # Sadece LOAD, FORWARD (Bat/Ayı) veya yön değiştirmeler için çıktı ver
            if action == "LOAD" or (action == "FORWARD" and perf_delta != 0) or action in ("LEFT", "RIGHT"):
                print(f"Adım {step+1}: {action} -> Pozisyon: {agent.pos}, Yön: {agent.orientation.name}, Puan: {perf_delta:+d} (Toplam: {total_perf})")
            elif action == "FORWARD":
                 print(f"Adım {step+1}: {action} -> Pozisyon: {agent.pos}")
    
    if verbose:
        print(f"\nSon Pozisyon: {agent.pos}, Son Yön: {agent.orientation.name}")
        print(f"Yumurta taşıyor: {agent.carry_egg}, Süt taşıyor: {agent.carry_milk}")
        print(f"Hafızadaki tehlike sayısı: {len(agent.dangers)}")
    
    return total_perf



GRID, START = create_grid()

print("=" * 50)
print("HARITA (10x10)")
print("=" * 50)
for i, row in enumerate(GRID):
    print(f"Satır {i}: {''.join(row)}")
print("\nLegend: E=Engel, Y=Yumurta(+2), S=Süt(+5), B=Bataklık(-10), A=Ayı(-100), C=Başlangıç")
print("=" * 50)

performances = []
NUM_EPISODES = 5
MAX_STEPS = 50

print(f"\n🚜 Simülasyon başlatılıyor ({NUM_EPISODES} x {MAX_STEPS} adım)...")

# Her denemede ortamı ve ajanı sıfırla
for i in range(NUM_EPISODES):
    # İlk denemeyi detaylı göster
    verbose = (i == 0)
    if verbose:
        print(f"\n DETAYLI DENEME #{i+1}:")
        print("-" * 50)
    
   
    perf = run_episode(GRID, START, max_steps=MAX_STEPS, verbose=verbose)
    performances.append(perf)
    
    if verbose:
        print(f"\n Deneme {i+1} Sonucu: {perf} puan\n")
    else:
        print(f"Deneme {i+1}: {perf} puan")

mean_perf = statistics.mean(performances)
max_perf = max(performances)
min_perf = min(performances)

print(f"\n{'='*50}")
print(f"📈 PERFORMANS ÖZETİ")
print(f"{'='*50}")
print(f"Performans Değerleri (Liste): {performances}")
print(f"Ortalama Performans ({NUM_EPISODES} Deneme): {mean_perf:.2f} puan")
print(f"En İyi Performans: {max_perf} puan")
print(f"{'='*50}")

HARITA (10x10)
Satır 0: EEEEEEEEEE
Satır 1: E Y   S  E
Satır 2: E YY  S  E
Satır 3: EC       E
Satır 4: E     YY E
Satır 5: E S      E
Satır 6: E    B   E
Satır 7: E    B   E
Satır 8: E A      E
Satır 9: EEEEEEEEEE

Legend: E=Engel, Y=Yumurta(+2), S=Süt(+5), B=Bataklık(-10), A=Ayı(-100), C=Başlangıç

🚜 Simülasyon başlatılıyor (5 x 50 adım)...

📊 DETAYLI DENEME #1:
--------------------------------------------------
Başlangıç: (3, 1), Yön: EAST
Adım 1: FORWARD -> Pozisyon: (3, 2)
Adım 2: LEFT -> Pozisyon: (3, 2), Yön: NORTH, Puan: +0 (Toplam: 0)
Adım 3: FORWARD -> Pozisyon: (2, 2)
Adım 4: LOAD -> Pozisyon: (2, 2), Yön: NORTH, Puan: +2 (Toplam: 2)
Adım 5: FORWARD -> Pozisyon: (1, 2)
Adım 6: LEFT -> Pozisyon: (1, 2), Yön: WEST, Puan: +0 (Toplam: 2)
Adım 7: FORWARD -> Pozisyon: (1, 1)
Adım 8: LEFT -> Pozisyon: (1, 1), Yön: SOUTH, Puan: +0 (Toplam: 2)
Adım 9: FORWARD -> Pozisyon: (2, 1)
Adım 10: FORWARD -> Pozisyon: (3, 1)
Adım 11: FORWARD -> Pozisyon: (4, 1)
Adım 12: FORWARD -> Pozisyon: (5

#  Agent 1 vs Agent 2 

##  Genel Karşılaştırma

| Özellik | **Agent 1** | **Agent 2** | **Fark / İyileşme Noktası** |
|----------|--------------|--------------|------------------------------|
| **Ajan Tipi** | Model-Based Reflex Agent | Model-Based Reflex Agent | Aynı temel yapı korunmuş. |
| **Bellek Kullanımı** | Sadece gözlemlenen hücreleri kaydeder. | Hücrelerin durumuna göre ayrıca “tehlike (A, B)” etiketleri ekler. | Agent 2, **tehlike bilinci** eklemiştir. |
| **Algı Yeteneği** | Bulunduğu hücre + 4 komşu | Bulunduğu hücre + 4 komşu | Aynı. |
| **Karar Mekanizması** | Sadece kaynaklara yönelir veya rastgele keşif yapar. | Öncelik sırası belirlenmiştir (LOAD > Kaçınma > Hedefe ilerleme > Keşif). | Agent 2’de **öncelik tabanlı karar mantığı** eklenmiş. |
| **Hedef Seçimi** | Manhattan mesafesine göre en yakın hedef | Ödül (puan) + mesafe birlikte değerlendirilir | Agent 2, **ödül-ağırlıklı hedef seçimi** yapıyor. |
| **Tehlike Yönetimi** | Tehlikelerden kaçınma stratejisi yok. | Tehlikeli hücreleri hafızada işaretler ve tekrar girmekten kaçınır. | Agent 2, **aktif risk takibi** içeriyor. |
| **Performans Ölçütü** | Kaynak ve tehlike puanları tanımlı | Aynı puan sistemi + istatistiksel analiz | Agent 2’de **epizodik test ve performans analizi** var. |
| **Planlama / Yol Bulma** | Henüz yok (sadece Manhattan mesafesi) | Henüz yok ama geliştirme önerilerinde daha net tanımlanmış | Her iki ajan da henüz planlama yapmıyor, ancak Agent 2 bu yönde daha sistematik. |
| **Öğrenme Yeteneği** | Henüz yok (öneri olarak belirtilmiş) | Henüz yok (öneri olarak belirtilmiş) | Benzer. |
| **Görselleştirme / Analiz** | Yok | Öneri olarak var | Agent 2, **analiz & görselleştirme odaklı** düşünülmüş. |

---

##  Temel Farkların Özeti

1. **Agent 2, Agent 1’in geliştirilmiş bir sürümüdür.**  
   Agent 1 yalnızca çevreyi gözlemleyip hedefe yönelirken, Agent 2 bu bilgiyi **tehlike bilinci** ve **öncelik mantığı**yla birleştirir.

2. **Karar verme süreci Agent 2’de daha katmanlıdır.**  
   Ajan, güvenlik → hedef → keşif sıralamasında karar alır.

3. **Hedef seçimi artık daha rasyonel.**  
   Agent 2, sadece yakınlık değil, **ödül değerini** de dikkate alır.

4. **Risk yönetimi eklendi.**  
   Tehlikeli hücreler (Ayı, Bataklık) hafızada tutulur ve kaçınılır — Agent 1 bunu yapmıyordu.

5. **Deneysel değerlendirme yapısı eklenmiş.**  
   Agent 2, epizot bazlı testlerle performansını ölçer ve kıyaslar.

---

##  Sonuç

> **Agent 2**, Agent 1’in temel prensiplerini koruyarak üzerine şu üç önemli katmanı eklemiştir:  
> - **Risk bilinci (tehlike takibi)**  
> - **Öncelik tabanlı karar mantığı**  
> - **Ödül + mesafe odaklı hedef seçimi**  

Bu da Agent 2’yi daha **akıllı**, **uyanık** ve **stratejik** bir ajan haline getirmiştir.


In [None]:
#AGENT3-  Rastgele Hareketli Ajan

import random

class XYEnvironment:
    def __init__(self, width=10, height=10):
        self.width = width
        self.height = height
        self.grid = [[' ' for _ in range(width)] for _ in range(height)]
        self.populate_environment()

    def populate_environment(self):
        # Rastgele konumlara yumurta, süt, bataklık ve ayı yerleştir ! 
        items = ['Y', 'S', 'B', 'A']
        for item in items:
            for _ in range(random.randint(3, 5)):
                x, y = random.randint(0, self.width - 1), random.randint(0, self.height - 1)
                self.grid[y][x] = item

        # Başlangıç pozisyonu
        self.start = (random.randint(0, self.width - 1), random.randint(0, self.height - 1))
        self.grid[self.start[1]][self.start[0]] = 'C'

    def get_cell(self, x, y):
        if 0 <= x < self.width and 0 <= y < self.height:
            return self.grid[y][x]
        else:
            return 'E'  # Engel sınır dışında

    def set_cell(self, x, y, value):
        if 0 <= x < self.width and 0 <= y < self.height:
            self.grid[y][x] = value



class Direction:
    NORTH, EAST, SOUTH, WEST = 0, 1, 2, 3

    @staticmethod
    def turn_left(direction):
        return (direction - 1) % 4

    @staticmethod
    def turn_right(direction):
        return (direction + 1) % 4

class FarmerAgent:
    def __init__(self, env):
        self.env = env
        self.x, self.y = env.start
        self.direction = random.choice([0, 1, 2, 3])
        self.performance = 0
        self.loaded = False

    def perceive(self):
        return self.env.get_cell(self.x, self.y)

    def move_forward(self):
        if self.direction == Direction.NORTH:
            new_y = self.y - 1
            new_x = self.x
        elif self.direction == Direction.SOUTH:
            new_y = self.y + 1
            new_x = self.x
        elif self.direction == Direction.EAST:
            new_x = self.x + 1
            new_y = self.y
        else:
            new_x = self.x - 1
            new_y = self.y

        if self.env.get_cell(new_x, new_y) != 'E':
            self.x, self.y = new_x, new_y

    def turn_left(self):
        self.direction = Direction.turn_left(self.direction)

    def turn_right(self):
        self.direction = Direction.turn_right(self.direction)

    def load(self):
        cell = self.perceive()
        if cell == 'Y':
            self.performance += 2
            self.env.set_cell(self.x, self.y, ' ')
        elif cell == 'S':
            self.performance += 5
            self.env.set_cell(self.x, self.y, ' ')
        self.loaded = True

    def step(self):
        # Algıla
        cell = self.perceive()

        # Ortam etkileri
        if cell == 'B':
            self.performance -= 10
        elif cell == 'A':
            self.performance -= 100

        # Karar verme (basit rastgele hareket)
        action = random.choice(['move', 'left', 'right', 'load'])
        if action == 'move':
            self.move_forward()
        elif action == 'left':
            self.turn_left()
        elif action == 'right':
            self.turn_right()
        elif action == 'load':
            self.load()

    def run(self, steps=50):
        for _ in range(steps):
            self.step()
        return self.performance



performances = []

for i in range(5):
    env = XYEnvironment()
    agent = FarmerAgent(env)
    perf = agent.run(50)
    performances.append(perf)
    print(f"Deneme {i+1}: {perf} puan")

ortalama = sum(performances) / len(performances)
print(f"\nOrtalama Performans: {ortalama:.2f}")


Deneme 1: 5 puan
Deneme 2: 10 puan
Deneme 3: -70 puan
Deneme 4: -1100 puan
Deneme 5: 0 puan

Ortalama Performans: -231.00


# Agent3 - Rastgele Hareketli Model Tabanlı Refleks Ajanı  
### (Agent1 ve Agent2 ile Karşılaştırması)

##  Genel Karşılaştırma Tablosu

| Özellik | **Agent1** | **Agent2** | **Agent3** | **Fark / Gelişim Düzeyi** |
|----------|-------------|-------------|-------------|-----------------------------|
| **Ajan Tipi** | Model-Based Reflex | Model-Based Reflex | Model-Based Reflex | Temel yapı aynı, ancak zekâ düzeyi farklı. |
| **Karar Mekanizması** | Hedef odaklı (S, Y hücrelerine yönelir) | Hedef + risk odaklı, öncelikli karar mantığı | **Tamamen rastgele karar verir** | Agent3’te bilinçli karar mekanizması yok. |
| **Bellek Kullanımı** | Gözlemlenen hücreleri kaydeder | Hücreleri + tehlike (A, B) bilgisiyle hafızada tutar | **Bellek yok** | Agent3, “model-based” yapıda tanımlı olsa da pratikte hafızasız çalışır. |
| **Hedef Seçimi** | Bilinen kaynaklara yönelir | Ödül (puan) + mesafeye göre hedef seçer | **Hiç hedef belirlemez** | Agent3, tamamen rastgele hareket eder. |
| **Tehlike Yönetimi** | Tehlikeleri fark eder ama kaçınmaz | Tehlikeleri hafızada tutar ve kaçınır | **Tehlikelerden kaçınmaz** | Agent3, bataklık ve ayıya girebilir. |
| **Performans Ölçütü** | Kaynak toplama ve tehlike cezası | Aynı ölçüt + epizodik istatistik | **Aynı ölçüt, ama rastgelelik nedeniyle tutarsız sonuçlar** | Agent3 performansı yüksek varyanslıdır. |
| **Yönelim Sistemi** | `Direction` enum ile yön değiştirir | Aynı | Aynı | Ortak sistem kullanılmış. |
| **Öğrenme Yeteneği** | Henüz yok (öneri olarak belirtilmiş) | Henüz yok (öneri olarak belirtilmiş) | **Yok** | Üçü de öğrenmiyor, ancak Agent3 tamamen kör. |
| **Planlama / Yol Bulma** | Henüz yok, öneri olarak geçiyor | Henüz yok, öneri olarak geçiyor | **Yok** | Agent3’te hiçbir planlama yok. |
| **Strateji Türü** | Hedef odaklı refleks | Risk + hedef + öncelik odaklı refleks | **Rastgele hareket** | Agent3 saf “random exploration” uygular. |

---

##  Agent3’ün Temel Özellikleri

1. **Rastgele Davranış**  
   Ajan, her adımda `move`, `left`, `right` veya `load` aksiyonlarından birini tamamen rastgele seçer.  
   Bu nedenle yönelimi veya stratejik karar mantığı yoktur.

2. **Bellek veya Hedef Takibi Yok**  
   Önceki adımlarda topladığı bilgi veya algılarını hatırlamaz.  
   “Model-Based Reflex” olarak tanımlansa da fiilen **modeli yoktur.**

3. **Performansın Değişkenliği**  
   Rastgele kararlar nedeniyle performans büyük oranda şansa bağlıdır.  
   Bazı epizotlarda yüksek puan toplayabilirken, bazılarında hızla puan kaybeder.

4. **Basit Ama Karşılaştırma İçin Önemli**  
   Agent3, **taban seviye kontrol ajanı** olarak kullanılabilir.  
   Agent1 ve Agent2’nin başarımı, bu rastgele davranan ajanla karşılaştırılarak ölçülebilir.

---

##  Sonuç

> **Agent3**, karar mekanizması veya bellek içermeyen, tamamen **rastgele hareket eden** bir ajan modelidir.  
> Bu yapı, Agent1 ve Agent2’nin zekâ düzeyini karşılaştırmak için “kontrol grubu” görevi görebilir.

**Özetle:**
- Agent1 → Hedef odaklı refleks ajan  
- Agent2 → Risk ve ödül bilinci olan refleks ajan  
- Agent3 → Rastgele aksiyon alan basit ajan  

Bu farklar, ajanın karar verme yeteneği arttıkça performansın **daha tutarlı ve verimli** hale geldiğini göstermektedir.
