In [1]:
import os
from dotenv import load_dotenv
load_dotenv()

True

# What Is Groq 

<div dir="rtl">

# 🟢 GROQ LPU | Language Processing Unit

## ✅ إيه هو Groq؟
- **Groq Inc.** شركة متخصصة في تصميم معالجات (Accelerators) لتشغيل **AI Models** بسرعات رهيبة.
- مش GPU زي NVIDIA ولا TPU زي Google.
- عاملين معمارية جديدة اسمها **LPU (Language Processing Unit)**.

---

## 🚀 LPU = Language Processing Unit
- معمارية مصممة مخصوص لتشغيل **LLMs** بسرعة عالية و **latency منخفض جدًا**.
- بيعتمد على **Single Large Matrix Multiply Engine** بدل من Cores كتير زي GPUs.
- بيحقق **deterministic execution** ➔ مفيش delays عشوائية.
- مخصص أكتر لـ **Inference** مش Training.

---

## 🧠 فكرة LPU ببساطة
- مش parallel cores زي الـ GPUs.
- بيعتمد على **dataflow architecture** (كل العمليات ماشية في pipeline سريع).
- بيوصل لـ **ultra-low latency inference** (ميلي ثانية قليلة جدًا).

---

## 📊 Groq LPU vs NVIDIA GPU (مقارنة)
| | **GPU (NVIDIA A100)** | **Groq LPU** |
|---|---------------------|--------------|
| **Throughput** | عالي | عالي جدًا |
| **Latency** | ممكن يتأخر | ultra-low latency |
| **Architecture** | Parallel Cores | Single Dataflow Engine |
| **Use-case** | Training & Inference | Inference-focused (LLM) |

---

## 🎯 استخدامات Groq LPU
- AI Chatbots (ChatGPT Alternatives).
- Real-time AI Agents.
- Robotics & Autonomous Systems.
- أي حاجة محتاجة **استجابات لحظية وسريعة**.

---

## 🟡 ليه الناس مهتمة بـ Groq؟
- للشركات اللي محتاجة **Real-time Responses** (زي البورصة، السيارات الذكية).
- GPUs ساعات latency بتاعها مش كافي.
- **Groq LPU** بيحقق سرعة خرافية من غير ما يضحي بالدقة.

---

## 📝 ملحوظة
- Groq عملت **chat service** بيشتغل على LPU.
- أسرع فعليًا من GPT-3.5 في وقت الاستجابة.



<div dir="rtl">

# 🏗️ إيه هي الـ Infrastructure؟

## ✅ التعريف:
> **Infrastructure = البنية التحتية**  
هي كل حاجة أساسية بنبني عليها أنظمة الـ IT و الـ AI  
(زي ما العمارة لازم يبقى ليها أساس).

---

## 🖥️ مكونات الـ Infrastructure (في التكنولوجيا):
### 1. **Hardware (العتاد):**
- سيرفرات (Servers)
- GPUs / TPUs / LPUs (زي Groq LPU)
- Networking Devices (Routers, Switches)
- Storage (Hard Drives, SSDs)

### 2. **Software Platforms:**
- أنظمة تشغيل (Linux, Windows)
- Cloud Platforms (AWS, Azure, GCP)
- Kubernetes, Docker (لإدارة الـ Containers)

### 3. **Services & Tools:**
- Databases (MySQL, MongoDB)
- APIs و Gateways
- Monitoring Tools (Grafana, Prometheus)

### 4. **DevOps & CI/CD:**
- Automation (Jenkins, GitLab CI)
- Version Control (Git)
- Deployment Pipelines

---

## 🎯 ليه Infrastructure مهمة؟
- بتوفر **البيئة الأساسية** اللي الأنظمة بتشتغل عليها.
- بتحقق:
  - 🔹 سرعة (Performance)
  - 🔹 استقرار (Reliability)
  - 🔹 أمان (Security)
  - 🔹 قابلية التوسع (Scalability)

---

# 🚀 علاقة Groq LPU بالـ Infrastructure

## 🟢 Groq LPU = Hardware Accelerator
- **Groq LPU** عبارة عن معالج (Chip) متخصص في تشغيل **Large Language Models** بسرعة.
- جزء من **Hardware Layer** في الـ Infrastructure.
- هدفه الأساسي: **Ultra-low Latency Inference**.

---

## 🖥️ مكان Groq LPU في الـ Infrastructure Stack

| Layer | Example | علاقة Groq LPU |
|--------|---------|---------------|
| **Applications** | AI Chatbot, Copilot | بيشتغلوا فوق الـ LPU |
| **AI Models** | LLaMa, Mistral | بتعمل Inference على LPU |
| **AI Accelerators** | Groq LPU, NVIDIA GPU | 🟡 Groq LPU موجود هنا |
| **Servers / Data Centers** | Cloud Servers | LPU بيركب في السيرفرات |
| **Networking & Storage** | Routers, Databases | بيتوصل معاهم |

---

## 🎯 وظيفة Groq LPU جوه الـ Infrastructure
- بيقوم بتسريع **تشغيل النماذج (Inference)**.
- بيتكامل مع باقي مكونات الـ Infrastructure (شبكات، سيرفرات، Storage).
- بيحقق Latency منخفض جدًا.

---

## 🔥 الفرق بين GPU Infrastructure و Groq LPU Infrastructure

| | **GPU (NVIDIA)** | **Groq LPU** |
|---|-----------------|-------------|
| **Architecture** | Parallel Cores | Dataflow Matrix Engine |
| **Latency** | ممكن يتأخر | Ultra-Low Latency |
| **Use-case** | Training + Inference | Inference فقط |
| **Integration** | Cloud, AI Farms | نفس الكلام but optimized for LPU |

---

## 📝 الخلاصة:
> **Infrastructure = كل اللي بيشغل النظام (عتاد + سوفتوير + شبكات).**  
> **Groq LPU** هو قطعة Hardware جوه الـ Infrastructure مخصصة لتسريع الـ AI Models.  
> من غير Infrastructure كاملة، الـ LPU مش هيعرف يطلع كل إمكانياته.



In [2]:
groq_api_key = os.getenv('GROQ_API_KEY') # to get groq api key

# if use openai we do same thins
# openai_api_key = os.getenv('OPENAI_API_KEY')

In [3]:
from langchain_groq import ChatGroq
# if use openai we do same thins
# from langchain_openai import ChatOpenAI

# to call specific model from groq
model = ChatGroq(model="Gemma2-9b-It", groq_api_key=groq_api_key) # get name model from groq website
model

ChatGroq(client=<groq.resources.chat.completions.Completions object at 0x00000121DDCA3170>, async_client=<groq.resources.chat.completions.AsyncCompletions object at 0x00000121DDE28F80>, model_name='Gemma2-9b-It', model_kwargs={}, groq_api_key=SecretStr('**********'))

In [4]:
model.invoke('How Are You')

AIMessage(content="As an AI, I don't have feelings or experiences like humans do. But I'm here and ready to assist you! How can I help you today?\n", additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 37, 'prompt_tokens': 12, 'total_tokens': 49, 'completion_time': 0.067272727, 'prompt_time': 0.001929916, 'queue_time': 0.16359846, 'total_time': 0.069202643}, 'model_name': 'Gemma2-9b-It', 'system_fingerprint': 'fp_10c08bf97d', 'finish_reason': 'stop', 'logprobs': None}, id='run--9adc361b-8415-4cce-91c7-d515eeb5c04f-0', usage_metadata={'input_tokens': 12, 'output_tokens': 37, 'total_tokens': 49})

- لاحظ ان اللى بيرجع من الموديل هو من نوع Ai Message 
- علشان ناخد ال content بس كنا نبستخدم ال Parser

# Humman Messages & SystemMessages

<div dir="rtl">

- SystemMessage => 
- دي رسائل للموديل بنقوله هيتصرف ازاى او هنخصصه ازاى او نحدد دوره زى نقوله انت خبير ذكاء اصطناعى وجاوب على الاساله دي
- HumanMessage => دا ال i/p الحقيقي بتاع ال user 

- prompt template => اللى كنا بنعمله قبل كدا كان ف الحقيقه بيعمل النوعين اللى فاتو دول كنا بنديله فعلا رساله للنظام مع الدخل بتاع المستخدم
- هنعملها يدوى بقى دلوقتي وهنلاقي ان الطريقه بتاعة ال Prompt احسن

- بالمناسبه نوع الرد اللى بيجي من الموديل بيبقي AiMessages

In [7]:
from langchain_core.messages import HumanMessage, SystemMessage
messages = [
    SystemMessage(content='Translate the following from english to french'),
    HumanMessage(content='Hello How Are You?')
]

# SystemMessage => instruction to model
# HumanMessage => input by user

respone = model.invoke(messages)
respone

AIMessage(content='The most common way to say "Hello How Are You?" in French is:\n\n**Bonjour, comment allez-vous ?** \n\nHere\'s a breakdown:\n\n* **Bonjour:** Hello\n* **comment:** how\n* **allez-vous:**  are you (formal, polite)\n\n\nLet me know if you\'d like some other ways to say it! 😊\n', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 81, 'prompt_tokens': 21, 'total_tokens': 102, 'completion_time': 0.147272727, 'prompt_time': 0.002506044, 'queue_time': 0.16203005599999998, 'total_time': 0.149778771}, 'model_name': 'Gemma2-9b-It', 'system_fingerprint': 'fp_10c08bf97d', 'finish_reason': 'stop', 'logprobs': None}, id='run--2a109651-f690-4e63-817f-56b46f9c6217-0', usage_metadata={'input_tokens': 21, 'output_tokens': 81, 'total_tokens': 102})

In [8]:
respone.content  # To Get Content Of Message Only 

'The most common way to say "Hello How Are You?" in French is:\n\n**Bonjour, comment allez-vous ?** \n\nHere\'s a breakdown:\n\n* **Bonjour:** Hello\n* **comment:** how\n* **allez-vous:**  are you (formal, polite)\n\n\nLet me know if you\'d like some other ways to say it! 😊\n'

In [9]:
# Another Way To Get Content Only We Can Use StrOutputParser
from langchain_core.output_parsers import StrOutputParser
parser = StrOutputParser() # We Can Create Custom Parser
parser.invoke(respone)

'The most common way to say "Hello How Are You?" in French is:\n\n**Bonjour, comment allez-vous ?** \n\nHere\'s a breakdown:\n\n* **Bonjour:** Hello\n* **comment:** how\n* **allez-vous:**  are you (formal, polite)\n\n\nLet me know if you\'d like some other ways to say it! 😊\n'

<div dir="rtl">

# LangChain Language Expression to Chain Components Together

---

## ما هو LangChain؟

- **LangChain** هو إطار عمل (framework) لبناء تطبيقات تعتمد على نماذج اللغة الكبيرة (LLMs).
- يهدف إلى تسهيل **ربط (chain)** مكونات مختلفة لإنشاء سير عمل ذكي ومتسلسل.

---

## معنى "to chain components together"

- في LangChain يوجد مكونات متعددة مثل:
  - **Prompts** (قوالب النصوص)
  - **LLMs** (نماذج اللغة)
  - **Memory** (الذاكرة)
  - **Agents** (الوكلاء)
  - **Tools** (أدوات خارجية)

- كلمة **"chain"** تعني ربط هذه المكونات معًا بحيث تعمل بشكل تسلسلي أو متتابع.
- تشبه فكرة ربط عدة مراحل معًا في خط إنتاج (pipeline).

---

## لماذا نستخدم Chain؟

- لبناء تطبيقات معقدة من مكونات بسيطة.
- لتنظيم الكود وجعله أكثر مرونة وقابلية لإعادة الاستخدام.
- للتحكم في تدفق البيانات


In [11]:
# using LCEL we can chain th components
chain = model|parser  # first messages go to the model then the output go to the parser
chain.invoke(messages)

'Here are some ways to translate "Hello, How are you?" to French, depending on the level of formality:\n\n**Formal:**\n\n* **Bonjour, comment allez-vous ?** (This is the most formal and polite option.)\n\n**Informal:**\n\n* **Salut, ça va ?** (This is a very common and casual greeting.)\n* **Coucou, comment vas-tu ?** (This is a friendly and informal greeting, typically used with people you know well.)\n\n**Other options:**\n\n* **Bonjour, comment vous portez-vous ?** (A bit more formal than "comment allez-vous?")\n* **Ça roule ?** (Slang, meaning "How\'s it going?")\n\n\n\nLet me know if you have any other phrases you\'d like translated!\n'

In [13]:
# بدل ما نبعتله مجموعه من ال messages 
# زي اللى فاتت كدا ف طريقه احسن وهى اننا بنكتب Prompt Template 
# Prompt take combine input by user and some application logic
from langchain_core.prompts import ChatPromptTemplate
gereric_template = "Translate The Following Into {language}"
prompt = ChatPromptTemplate.from_messages(
    [
        ('system', gereric_template),
        ('user', '{text}')
    ]
)

# لاحظ كدا محتاج لما انادى على الموديل اديله language, text

In [16]:
result = prompt.invoke({'language': 'French', 'text': 'Hello'})
result
#ChatPromptValue => contain and translate prompt to SystemMessage, HummanMessage

ChatPromptValue(messages=[SystemMessage(content='Translate The Following Into French', additional_kwargs={}, response_metadata={}), HumanMessage(content='Hello', additional_kwargs={}, response_metadata={})])

In [17]:
result.to_messages() # The We Passed By Hand Before

[SystemMessage(content='Translate The Following Into French', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='Hello', additional_kwargs={}, response_metadata={})]

In [18]:
# lets create chain
chain = prompt|model|parser
chain.invoke({
    'language':'french',
    'text':'Hello'
})


'Bonjour \n'

<div dir="rtl">

# معنى `add_routes` في LangServe

---

## ١. إيه هو LangServe؟

- **LangServe** هو سيرفر (Server) لتشغيل تطبيقات LangChain كنماذج أو خدمات API.
- بيسمح لك تعرض الـ Chains أو الـ Agents بتوعك كـ APIs تقدر تستخدمها في تطبيقات مختلفة.

---

## ٢. إيه وظيفة `add_routes`؟

- `add_routes` هي دالة (function) تستخدمها عشان:
  - تضيف **Routes (مسارات)** جديدة للسيرفر.
  - كل Route هو نقطة دخول (Endpoint) بتستقبل طلبات (Requests) وبترد عليهم.
- بتربط بين **URL معين** و **كود معالجة الطلب** (مثل Chain أو Agent معين).

---

## ٣. ليه نستخدم `add_routes`؟

- عشان تبني سيرفر API مرن.
- تقدر تضيف مسارات مختلفة لخدمات متعددة في نفس السيرفر.
- تسهل إدارة الطلبات وتوجيهها للكود المناسب.

---

## ٤. مثال مبسط

```python
from langserve import LangServe

app = LangServe()

# نضيف Route جديد بيسمع على /chat
@app.add_routes("/chat")
def chat_handler(request):
    # هنا بتتعامل مع الطلب
    return {"message": "مرحبا من نقطة دخول /chat"}


<div dir="rtl">

# ملخص سريع عن API و Schema

---

## 1. API (واجهة برمجة التطبيقات)

- **API** هي طريقة تواصل بين برنامجين أو نظامين مختلفين.
- بتسمح لتطبيقات مختلفة تبادل البيانات وتنفيذ وظائف عبر الإنترنت أو داخليًا.
- ممكن تكون RESTful API، GraphQL، أو غيرها.
- مثال: لما تستخدم تطبيق يطلب بيانات الطقس من سيرفر خارجي، ده بيتم عن طريق API.

---

## 2. Schema (مخطط البيانات)

- **Schema** هو تعريف أو خريطة توضح شكل وتركيب البيانات.
- بيحدد الحقول، نوع البيانات (نص، رقم، تاريخ...)، والقواعد اللي لازم تتبعها البيانات.
- بيستخدم في قواعد البيانات، APIs، ونماذج البيانات المختلفة.
- مثال: مخطط JSON Schema يوضح إن حقل "name" لازم يكون نص وحقل "age" رقم.

---

## الفرق ببساطة:

- **API** هو الوسيط اللي بين التطبيقات.
- **Schema** هو شكل البيانات اللي بتنتقل بين التطبيقات أو بتخزن.

</div>
