## 🧩 Week 4 – LangGraph, LangChain & LangSmith

## LangChain:

**LangChain** היא ספרייה פופולרית שנועדה להקל על בניית אפליקציות מבוססות LLM  
(כמו GPT, Claude, Gemini וכו').  
היא מספקת שכבת הפשטה (abstraction layer) לניהול:

- פרומפטים (Prompt Templates)  
- שרשראות קריאות (Chains)  
- כלים (Tools)  
- זיכרון (Memory)  
- סוכנים (Agents)  

### ⚙️ עקרון הפעולה
LangChain מאפשרת לבנות “שרשראות” של שלבים (Chains),  
כאשר כל שלב הוא פעולה או כלי שהמודל מפעיל ברצף:

1. קבלת קלט מהמשתמש  
2. קריאה למודל  
3. עיבוד התוצאה  
4. החזרת תשובה למשתמש  

### 💬 דוגמה פשוטה
```python
from langchain import OpenAI, LLMMathChain, SerpAPIWrapper
from langchain.agents import initialize_agent, AgentType

llm = OpenAI(model="gpt-4o-mini")
tools = [SerpAPIWrapper(), LLMMathChain(llm=llm)]
agent = initialize_agent(tools, llm, agent_type=AgentType.ZERO_SHOT_REACT_DESCRIPTION)
agent.run("חפש את אוכלוסיית ישראל וחלק ב-10")
```

---

## LangGraph:

**LangGraph** היא פלטפורמה נפרדת שפותחה על ידי אותה חברה שיצרה את LangChain,  
אך היא **לא תלויה בה** – ניתן להשתמש בה גם לבד.

LangGraph נוצרה כדי להתמודד עם האתגרים:
- **stability (יציבות)**
- **resiliency (עמידות)** 
- **repeatability (יכולת חזרה על תהליך)**  
- **Multi-Agent Systems (מערכות מבוססות סוכנים)**

## 🧩 מטרת LangGraph

LangGraph מאפשרת **לנהל ולתזמר זרימות עבודה (Workflows)**  
שכוללות כמה סוכנים (Agents), כלים (Tools), וזיכרון (Memory),  
בצורה **מאורגנת, יציבה, ניתנת לניטור ולשחזור**.

היא מבוססת על **גרף של Nodes (צמתים)** –  
כאשר כל צומת מייצג שלב בתהליך, פעולה, סוכן, או כלי.

## ⚙️ תכונות עיקריות

| תכונה | תיאור |
|--------|--------|
| 🧠 **Human-in-the-loop** | שילוב שלב שבו בן אדם יכול לאשר או לשנות החלטה של הסוכן |
| 🤖 **Multi-Agent Collaboration** | תמיכה בעבודה משותפת בין כמה סוכנים שמחליפים ביניהם מידע |
| 🪣 **Memory & Time Travel** | שמירת מצב (checkpoint) והיכולת לחזור לאחור בזמן אם יש שגיאה |
| 🧱 **Fault-Tolerant Scalability** | המשכיות של התהליך גם אם אחד השלבים נופל |
| 🔍 **Monitoring (באמצעות LangSmith)** | נראות מלאה של כל שלב בגרף לצורך ניתוח, ניטור ודיבוג |


## 🧩 עקרון פעולה

LangGraph חושבת על כל תהליך (Workflow) בתור **גרף של צעדים**  
ולא רק שרשרת ליניארית (כמו ב־LangChain).

כל צעד (Node) מחזיר מידע למערכת,  
וקובע לאן להמשיך בגרף בהתאם לתוצאה.

כך אפשר לבנות תהליכים מורכבים,  
כולל הסתעפויות (branches), לולאות, והחזרות אחורה.

## 🧾 LangGraph עצמה מורכבת משלושה חלקים נפרדים
- LangGraph (Framework) – המסגרת עצמה, שהיא בעצם הבסיס הפונקציונלי, כמו ה־ SDK או ה־ API של LangGraph.
- LangGraph Studio – כלי בעל ממשק משתמש (UI) גרפי, שמאפשר “לחבר” את השלבים והסוכנים בצורה ויזואלית
- LangGraph Platform – הפתרון המסחרי (המאוחסן בענן) של החברה, שנועד להרצה, ניהול ופריסה (deployment) של agents בקנה מידה גדול.

## 💬 דוגמה פשוטה

```python
from langgraph.graph import StateGraph, END

graph = StateGraph()

@graph.node
def greet(state):
    print("👋 שלום!")
    return {"step": "ask_name"}

@graph.node
def ask_name(state):
    name = input("מה שמך? ")
    return {"name": name, "step": "reply"}

@graph.node
def reply(state):
    print(f"נעים להכיר, {state['name']}!")
    return END

graph.set_entry_point("greet")
graph.compile().run()
```

---

## LangSmith:

**LangSmith** הוא מוצר נוסף של אותה חברה שפיתחה את LangChain ו־LangGraph.  
תפקידו הוא לשמש ככלי **ניטור (Monitoring)** ו־**בקרה (Debugging)**  
עבור תהליכים שמבוצעים במערכות מבוססות LLM —  
ובפרט בתוך **LangChain** ו־**LangGraph**.

## 🧩 מטרות עיקריות

LangSmith נועד לאפשר לך:
- 🕵️ **מעקב בזמן אמת** אחרי כל קריאה למודל (LLM Calls)  
- 🧠 **ניתוח reasoning פנימי** – לראות כיצד המודל הגיע למסקנותיו  
- 🧾 **ניהול גרסאות של פרומפטים** – השוואה בין ניסוחים שונים  
- 🐞 **איתור שגיאות ודיבוג מהיר** בתהליכים מורכבים  
- 📊 **תיעוד מלא** של כל תהליך: מי קרא למי, באיזה הקשר, ומה התוצאה שהתקבלה  

LangGraph מסוגל **להתחבר ישירות** ל־ LangSmith,  
כך שניתן לצפות בכל הצמתים (Nodes) בגרף, בתוצאות ובשגיאות בזמן אמת.

## ⚙️ דוגמה לשימוש טיפוסי

כאשר אתה מריץ Workflow עם LangGraph,  
LangSmith יכול להציג עבורך Dashboard מפורט עם מידע כגון:
- איזה Agent הופעל ובאיזה שלב  
- מה היה ה־ Prompt המדויק שנשלח למודל  
- איזו תשובה התקבלה  
- כמה זמן ארכה הקריאה  
- האם התרחשה שגיאה ובאיזה Node  

כך ניתן לבצע **ניתוח מדויק של זרימת הביצוע** ולפתור באגים במהירות.

---

## 🧭 השוואה בין LangChain, LangGraph & LangSmith

| רכיב | תפקיד עיקרי | דגש עיקרי |
|-------|---------------|------------|
| **LangChain** | בניית אפליקציות מבוססות LLM | שרשראות וכלים (Chains & Tools) |
| **LangGraph** | תזמור זרימות עבודה בין סוכנים | יציבות, חזרתיות, עמידות |
| **LangSmith** | ניטור ותיעוד תהליכים | Debugging, Tracking, Logging |

## 📘 תרשים קשרים בין LangChain, LangGraph & LangSmith

            ┌──────────────────────────────┐
            │          LangChain           │
            │  📦 בסיס הפיתוח עם LLMs     │
            │  • Chains (שרשראות)         │
            │  • Tools (כלים)              │
            │  • Memory (זיכרון)          │
            │  • Agents (סוכנים)          │
            └──────────────┬───────────────┘
                           │
                           │ משתמש ב־
                           ▼
            ┌──────────────────────────────┐
            │          LangGraph           │
            │  🕸️ תזמור ותפעול זרימות     │
            │  • גרף של Nodes (שלבים)     │
            │  • Multi-Agent Workflows     │
            │  • Checkpoints & Recovery    │
            │  • Fault Tolerance           │
            └──────────────┬───────────────┘
                           │
                           │ מנוטר ע"י
                           ▼
            ┌──────────────────────────────┐
            │          LangSmith           │
            │  🔍 ניטור ודיבוג            │
            │  • Trace כל קריאה למודל     │
            │  • צפייה בזמן אמת           │
            │  • ניתוח reasoning פנימי    │
            │  • השוואת גרסאות פרומפטים  │
            └──────────────────────────────┘


 **הסבר התרשים:**
- **LangChain** – מספקת את אבני הבניין (LLMs, כלים, memory, agents).  
- **LangGraph** – משתמשת באבנים האלה כדי לבנות **תהליכים מורכבים** על בסיס גרף זרימה.  
- **LangSmith** – מספקת **ניטור, ניתוח ודיבוג** של כל שלב בתהליך.

## 🧩 LangGraph – Terminology & Core Concepts  

### 🧠 State (מצב)

**State** מייצג את **תמונת המצב הנוכחית של המערכת**.  
זהו אובייקט שמחזיק את הנתונים הרלוונטיים ברגע נתון –  
כמו snapshot של העולם בזמן נתון.

- הוא משותף לכל חלקי המערכת.  
- הוא אינו פונקציה, אלא **מידע**.  
- בכל פעם שמתרחשת פעולה, נוצרת גרסה חדשה של state  
  (הוא נחשב **immutable** – לא משנים, אלא יוצרים מופע חדש).

💬 ניתן לחשוב על state כמו “זיכרון זמני” של מה שקורה כעת.

### 🧱 דוגמה בקוד – `my_counting_node`

```python
def my_counting_node(State: old_state) -> State:
    count = old_state.count      # לוקחים את הערך הקיים
    count += 1                   # מוסיפים לו 1
    new_state = State(count=count)  # יוצרים אובייקט חדש
    return new_state             # מחזירים את ה־ state החדש
```

---

### 🧩 Reducer:

לכל שדה (field) בתוך ה־ State שלך,  
ניתן להגדיר פונקציה מיוחדת בשם **Reducer**.

ה־ **Reducer** אומר ל־ LangGraph _איך לשלב (merge)_  
את השדות החדשים מה־ State החדש עם השדות הקיימים מה־ State הקודם.

### ⚙️ מתי זה נדרש?

כאשר **כמה Nodes רצים במקביל (concurrently)**,  
כל אחד מהם מחזיר `State` חדש עם שדות משלו.  
ה־ Reducer קובע כיצד לשלב בין התוצאות,  
כדי שאף Node לא ידרוס את הנתונים של Node אחר.

### 🔧 איך זה עובד מאחורי הקלעים

1. כל Node מחזיר State חדש.  
2. LangGraph מזהה אילו שדות ב־ State הוגדרו עם Reducer.  
3. פונקציית ה־ Reducer משמשת כדי **למזג (merge)** בין הערכים החדשים והישנים.  
4. כך נוצר State מאוחד אחד, ללא איבוד מידע.

---

### ⚙️ Nodes (צמתים)

**Nodes** הם הנקודות בגרף —  
ב־ LangGraph, כל Node הוא **פונקציה ב־ Python** שמבצעת פעולה מסוימת.

🔹 כל Node:
1. מקבל את ה־ state הנוכחי כקלט.  
2. מבצע פעולה (למשל – קריאה ל־ LLM, שמירת קובץ, שליחת אימייל וכו).  
3. מחזיר **state חדש** כתוצאה.

ה־ state החדש משקף את השינויים שחלו בעקבות הפעולה.

```text
[state_in] → [node does something] → [state_out]
```

---

### 🔗 Edges (חיבורים)

**Edges** הם הקווים שמחברים בין ה־ Nodes בגרף.  
גם הם למעשה **פונקציות ב־ Python**,  
שתפקידן להחליט **מהו הצומת הבא שצריך לרוץ** בהתאם למצב הנוכחי (state).

---

### 🧩 תפקיד ה־ Edge

- קובע את **סדר הביצוע** של ה־ nodes.  
- מגדיר האם המעבר בין צומת אחד לאחר הוא **ישיר** או **מותנה**.  
- מאפשר לבנות **לוגיקה דינמית** – שבה הזרימה משתנה בהתאם ל־ state.

---

### ⚙️ סוגי Edges

| סוג Edge | תיאור | דוגמה |
|-----------|--------|--------|
| **Simple Edge** | מעבר ישיר בין שני Nodes | Node A → Node B (ללא תנאים) |
| **Conditional Edge** | מעבר מותנה – מתבצע רק אם תנאי מסוים מתקיים | אם `state.success == True` → עבור ל־Node C |

---

### 💡 איך זה עובד?

1. Node אחד מסיים לרוץ ומחזיר `state` חדש.  
2. ה־ Edge קורא את ה־ state ומחליט מה ה־ Node הבא שצריך לרוץ.  
3. אם יש כמה קישורים, ניתן לקבוע **תנאי מעבר** לכל אחד.  
4. כל מעבר כזה הוא פונקציה שמחזירה את ה־ Node הבא.

---

### 📊 המחשה גרפית
<img src="attachments/Screenshot 2025-10-10 110432.png" width="400">
<img src="attachments/Screenshot 2025-10-10 110454.png" width="300">

---

### 🧱 חמשת השלבים ליצירת גרף ראשון        

**5 השלבים הבסיסיים** לבניית גרף ראשון ב־ LangGraph:

| שלב | פעולה | תיאור |
|------|--------|--------|
| **1. Define State Class** | מגדירים מחלקה שתשמור את מצב האפליקציה | המחלקה תכיל גם רכיב בשם `Reducer` (עליו נלמד בשיעור הבא). |
| **2. Start Graph Builder** | מתחילים את תהליך בניית הגרף (Graph Builder) | זהו שלב התכנון – עוד לא מריצים שום דבר בפועל. |
| **3. Create Nodes** | מגדירים את הפונקציות (Nodes) שיבצעו פעולות שונות | לדוגמה – קריאה ל־LLM, שמירת קובץ או עיבוד נתונים. |
| **4. Create Edges** | מוסיפים חיבורים (Edges) בין הצמתים | ניתן ליצור מעבר ישיר (Simple) או מותנה (Conditional). |
| **5. Compile the Graph** | “מהדרים” (Compile) את הגרף להרצה | לאחר הקומפילציה, הגרף מוכן לביצוע בפועל. |

---

### 🧭 שני שלבים עיקריים בהרצת אפליקציית Graph

בעת הרצת מערכת **LangGraph** יש שני שלבים מרכזיים:

| שלב | שם | תיאור |
|------|------|--------|
| **שלב 1** | **Definition Phase** | שלב ההגדרה – בניית המחלקות (`State`), הצמתים (`Nodes`) והחיבורים (`Edges`). כאן אנו מתארים למערכת מה עליה לבצע. |
| **שלב 2** | **Execution Phase** | שלב ההרצה – הגרף רץ בפועל לפי המבנה והלוגיקה שהוגדרו בשלב הקודם. כאן הצמתים מבצעים פעולות וה־edges מכתיבים את הזרימה. |

---

### 📘 סיכום עקרונות חשובים

| מושג | תיאור קצר |
|-------|-------------|
| 🧠 **State** | זיכרון המערכת – האובייקט שמתאר את תמונת המצב הנוכחית. |
| ⚙️ **Nodes** | פונקציות שמבצעות פעולות או משימות כחלק מהתהליך. |
| 🔗 **Edges** | חיבורים שמחליטים מה קורה הלאה – קובעים את סדר הפעולות והלוגיקה. |
| 🧱 **Graph Builder** | שלב בניית הגרף – שבו מגדירים את הצמתים והמעברים ביניהם. |
| 🧩 **Compile** | הפיכת ההגדרה של הגרף למבנה שניתן להריץ בפועל. |
| 🚀 **Execution Phase** | שלב ההפעלה – שבו הגרף רץ ומבצע את הלוגיקה שהוגדרה. |



### 🚀 Superstep 
**Superstep** = הרצה אחת מלאה של כל הגרף

כל פעם שהמשתמש שולח הודעה ← הגרף רץ מתחילתו ועד סופו ← זו אינטראקציה אחת שלמה

<u>🔹 שלב ההפעלה</u>  
```text
🧑‍💻 המשתמש שולח הודעה → graph.invoke()
│
│  ┌────────────────────────────────────────────┐
│  │        🧩 Superstep #1                    │
│  │                                            │
│  │   Node A → Node B → Node C ...             │           
│  │   (כולם רצים לפי הקשרים שהוגדרו)         │
│  └────────────────────────────────────────────┘
│
💬 התשובה חוזרת למשתמש
```

<u>🔹 המשך השיחה – Superstep חדש</u>
```text
🧑‍💻 המשתמש מגיב שוב → graph.invoke() חדש

┌────────────────────────────────────────────┐
│        🧩 Superstep #2                    │
│                                            │
│   כל הצמתים שוב רצים (אותו גרף בדיוק)   │
│   אבל עם קלט חדש או הקשר קודם            │
└────────────────────────────────────────────┘
```

**המשמעות עבור ניהול מצב (State)**<br>
כאשר מספר צמתים מעדכנים את אותו State באותו Superstep –  
ה־ **Reducer** מאחד את כל השינויים.<br> 
❗אבל:<br>
הוא **לא** שומר את המצב בין Supersteps שונים.  
לשם כך נשתמש ב־ **Checkpointing** 👇

### 💾 Checkpointing 
**Checkpointing** = שמירה על ההקשר והזיכרון בין סופרסטפ אחד לשני (כלומר, בין שיחות שונות עם המשתמש) 
```text
[סיום Superstep #1]
   ↓
💾 נוצר Checkpoint – צילום מצב ה־ State
   ↓
[התחלה של Superstep #2]
   ↓
🧠 הגרף טוען את ה־ State מה־ Checkpoint הקודם
```
<img src="attachments/Screenshot 2025-10-10 161651.png" width="300">