In [None]:
from langchain_openai import ChatOpenAI  # pip install -U langchain_openai

from app_config import API_KEY
# Initialize OpenAI with your API key
from typing import List
# Choose your model here: "gpt-4" or "gpt-4-turbo"
DEFAULT_MODEL = "gpt-4o-mini"


def generate_chat_response(user_query: str, retrieved_chunks: List[str], model_name: str = DEFAULT_MODEL) -> str:
    """
    Generates a main response using OpenAI's ChatGPT based on the user query and retrieval context.

    Args:
        user_query (str): The user's query.
        retrieved_chunks (List[str]): Contextual chunks to provide to the model.
        model_name (str): Which model to use (e.g., "gpt-4", "gpt-4-turbo").

    Returns:
        str: The response from ChatGPT.
    """
    system_prompt = (
        "You are an expert AI assistant. Use the provided context to answer the user's query as helpfully and accurately as possible."
    )

    context = "\n\n".join(retrieved_chunks)

    messages = [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": f"Context:\n{context}\n\nQuery: {user_query}"}
    ]



    try:
        
        llm = ChatOpenAI(
             model=model_name, base_url="https://api.avalai.ir/v1", api_key=API_KEY)

        response = llm.invoke(messages)
            
        return response.dict()["content"]

    except Exception as e:
        return f"[Error generating AI response: {e}]"

if __name__ == "__main__":
    user_query = "What is the capital of France?"
    retrieved_chunks = ["France is a country in Europe.", "The capital of France is Paris."]
    response = generate_chat_response(user_query, retrieved_chunks)
    print(response)

The capital of France is Paris.


/tmp/ipykernel_79559/2817227045.py:42: PydanticDeprecatedSince20: The `dict` method is deprecated; use `model_dump` instead. Deprecated in Pydantic V2.0 to be removed in V3.0. See Pydantic V2 Migration Guide at https://errors.pydantic.dev/2.11/migration/
  return response.dict()["content"]


In [3]:
# First, make sure you have the `markdown` package:
#    pip install markdown

import markdown

def preprocess_md_to_html(md_text: str) -> str:
    """
    Convert a Markdown-like string into HTML.
    Uses Python-Markdown under the hood, so you get support for:
      - ATX headings (#, ##, …)
      - bold (**bold**), italic (*italic*), combined (***both***)
      - inline `code` and fenced code blocks
      - lists, links, images, blockquotes, etc.
    """
    # You can enable extensions as needed:
    extensions = [
        "fenced_code",      # ```code blocks
        "codehilite",       # syntax highlighting (needs Pygments)
        "tables",           # pipe-style tables
        "nl2br",            # newline -> <br>
    ]
    html = markdown.markdown(md_text, extensions=extensions)
    return html



if __name__ == "__main__":
    sample = """
# Hello World

This is **bold**, *italic*, and ***both***.

```python
def foo():
    return "bar"
```

- Item 1
- Item 2

> A blockquote.

[Link to OpenAI](https://openai.com)
"""
html_output = preprocess_md_to_html(sample)

# Print to console
print(html_output)
print(type(html_output))

<h1>Hello World</h1>
<p>This is <strong>bold</strong>, <em>italic</em>, and <strong><em>both</em></strong>.</p>
<div class="codehilite"><pre><span></span><code><span class="k">def</span><span class="w"> </span><span class="nf">foo</span><span class="p">():</span>
    <span class="k">return</span> <span class="s2">&quot;bar&quot;</span>
</code></pre></div>

<ul>
<li>Item 1</li>
<li>Item 2</li>
</ul>
<blockquote>
<p>A blockquote.</p>
</blockquote>
<p><a href="https://openai.com">Link to OpenAI</a></p>
<class 'str'>


In [4]:
# Test the preprocess_md_to_html function
test_md = """
حتماً! در اینجا همان مثال قبلی را با استفاده از تگ‌های Markdown، اما به زبان فارسی برایتان آورده‌ام:

---

# عنوان سطح ۱

## عنوان سطح ۲

### عنوان سطح ۳

#### عنوان سطح ۴

##### عنوان سطح ۵

###### عنوان سطح ۶

---

**متن بولد (توپر)**

*متن ایتالیک (کج)*

***متن هم بولد و هم ایتالیک***

~~متن خط‌خورده~~

> این یک نقل‌قول است.  
> می‌تواند چند خطی باشد.

---

### لیست‌ها

**لیست بدون ترتیب:**
- مورد اول
- مورد دوم  
  - زیرمورد ۲.۱  
  - زیرمورد ۲.۲  

**لیست ترتیبی:**
1. اولین مورد  
2. دومین مورد  
   1. زیرمورد ۲.۱  
   2. زیرمورد ۲.۲  

---

### کد

کد درون‌خطی: `print("سلام، مارک‌داون!")`

بلاک کد (با مشخص کردن زبان):

```python
def salam(nam):
    return f"سلام، {nam}!"
```

---

### پیوند و تصویر

[وب‌سایت OpenAI](https://www.openai.com)

![لوگوی مارک‌داون](https://markdown-here.com/img/icon256.png)

---

### لیست وظایف

- [x] نوشتن مثال مارک‌داون  
- [ ] افزودن مثال‌های بیشتر  
- [x] انتشار محتوا  

---

### خط افقی

---

### جدول

| نام     | سن | کشور    |
|----------|----|---------|
| آلیس    | ۳۰ | آمریکا  |
| باب      | ۲۵ | کانادا  |
| چارلی   | ۳۵ | انگلیس  |

---

### استفاده از HTML در مارک‌داون

شما می‌توانید از HTML خام نیز استفاده کنید:

<p style="color:blue">این یک پاراگراف با رنگ آبی است.</p>

---

اگر خواستی اینو به‌صورت فایل Markdown هم برات درست کنم، فقط کافیه بگی 🌟

"""

html_output = preprocess_md_to_html(test_md)

print(html_output)

<p>حتماً! در اینجا همان مثال قبلی را با استفاده از تگ‌های Markdown، اما به زبان فارسی برایتان آورده‌ام:</p>
<hr />
<h1>عنوان سطح ۱</h1>
<h2>عنوان سطح ۲</h2>
<h3>عنوان سطح ۳</h3>
<h4>عنوان سطح ۴</h4>
<h5>عنوان سطح ۵</h5>
<h6>عنوان سطح ۶</h6>
<hr />
<p><strong>متن بولد (توپر)</strong></p>
<p><em>متن ایتالیک (کج)</em></p>
<p><strong><em>متن هم بولد و هم ایتالیک</em></strong></p>
<p>~~متن خط‌خورده~~</p>
<blockquote>
<p>این یک نقل‌قول است.<br />
می‌تواند چند خطی باشد.</p>
</blockquote>
<hr />
<h3>لیست‌ها</h3>
<p><strong>لیست بدون ترتیب:</strong><br />
- مورد اول<br />
- مورد دوم<br />
  - زیرمورد ۲.۱<br />
  - زیرمورد ۲.۲  </p>
<p><strong>لیست ترتیبی:</strong><br />
1. اولین مورد<br />
2. دومین مورد<br />
   1. زیرمورد ۲.۱<br />
   2. زیرمورد ۲.۲  </p>
<hr />
<h3>کد</h3>
<p>کد درون‌خطی: <code>print("سلام، مارک‌داون!")</code></p>
<p>بلاک کد (با مشخص کردن زبان):</p>
<div class="codehilite"><pre><span></span><code><span class="k">def</span><span class="w"> </span><span class="nf">salam</span><

In [6]:
import markdown
from bs4 import BeautifulSoup

def preprocess_md_to_html_with_classes(md_text: str) -> str:
    """
    Convert Markdown to HTML and add classes to certain elements.
    """
    # Convert Markdown to HTML
    extensions = [
        "fenced_code",
        "codehilite",
        "tables",
        "nl2br",
    ]
    html = markdown.markdown(md_text, extensions=extensions)

    # Parse HTML and add custom classes
    soup = BeautifulSoup(html, "html.parser")

    # Example: add classes to specific tags
    tag_class_map = {
        "h1": "heading heading-1",
        "h2": "heading heading-2",
        "p": "paragraph",
        "ul": "list list-unordered",
        "ol": "list list-ordered",
        "code": "inline-code",
        "pre": "code-block",
        "table": "table table-striped",
        "blockquote": "blockquote",
    }

    for tag, class_name in tag_class_map.items():
        for elem in soup.find_all(tag):
            existing_classes = elem.get("class", [])
            new_classes = class_name.split()
            elem["class"] = list(set(existing_classes + new_classes))

    return str(soup)


In [7]:
# Test the preprocess_md_to_html function
test_md = """
حتماً! در اینجا همان مثال قبلی را با استفاده از تگ‌های Markdown، اما به زبان فارسی برایتان آورده‌ام:

---

# عنوان سطح ۱

## عنوان سطح ۲

### عنوان سطح ۳

#### عنوان سطح ۴

##### عنوان سطح ۵

###### عنوان سطح ۶

---

**متن بولد (توپر)**

*متن ایتالیک (کج)*

***متن هم بولد و هم ایتالیک***

~~متن خط‌خورده~~

> این یک نقل‌قول است.  
> می‌تواند چند خطی باشد.

---

### لیست‌ها

**لیست بدون ترتیب:**
- مورد اول
- مورد دوم  
  - زیرمورد ۲.۱  
  - زیرمورد ۲.۲  

**لیست ترتیبی:**
1. اولین مورد  
2. دومین مورد  
   1. زیرمورد ۲.۱  
   2. زیرمورد ۲.۲  

---

### کد

کد درون‌خطی: `print("سلام، مارک‌داون!")`

بلاک کد (با مشخص کردن زبان):

```python
def salam(nam):
    return f"سلام، {nam}!"
```

---

### پیوند و تصویر

[وب‌سایت OpenAI](https://www.openai.com)

![لوگوی مارک‌داون](https://markdown-here.com/img/icon256.png)

---

### لیست وظایف

- [x] نوشتن مثال مارک‌داون  
- [ ] افزودن مثال‌های بیشتر  
- [x] انتشار محتوا  

---

### خط افقی

---

### جدول

| نام     | سن | کشور    |
|----------|----|---------|
| آلیس    | ۳۰ | آمریکا  |
| باب      | ۲۵ | کانادا  |
| چارلی   | ۳۵ | انگلیس  |

---

### استفاده از HTML در مارک‌داون

شما می‌توانید از HTML خام نیز استفاده کنید:

<p style="color:blue">این یک پاراگراف با رنگ آبی است.</p>

---

اگر خواستی اینو به‌صورت فایل Markdown هم برات درست کنم، فقط کافیه بگی 🌟

"""

html_output = preprocess_md_to_html_with_classes(test_md)

print(html_output)

<p class="paragraph">حتماً! در اینجا همان مثال قبلی را با استفاده از تگ‌های Markdown، اما به زبان فارسی برایتان آورده‌ام:</p>
<hr/>
<h1 class="heading heading-1">عنوان سطح ۱</h1>
<h2 class="heading heading-2">عنوان سطح ۲</h2>
<h3>عنوان سطح ۳</h3>
<h4>عنوان سطح ۴</h4>
<h5>عنوان سطح ۵</h5>
<h6>عنوان سطح ۶</h6>
<hr/>
<p class="paragraph"><strong>متن بولد (توپر)</strong></p>
<p class="paragraph"><em>متن ایتالیک (کج)</em></p>
<p class="paragraph"><strong><em>متن هم بولد و هم ایتالیک</em></strong></p>
<p class="paragraph">~~متن خط‌خورده~~</p>
<blockquote class="blockquote">
<p class="paragraph">این یک نقل‌قول است.<br/>
می‌تواند چند خطی باشد.</p>
</blockquote>
<hr/>
<h3>لیست‌ها</h3>
<p class="paragraph"><strong>لیست بدون ترتیب:</strong><br/>
- مورد اول<br/>
- مورد دوم<br/>
  - زیرمورد ۲.۱<br/>
  - زیرمورد ۲.۲  </p>
<p class="paragraph"><strong>لیست ترتیبی:</strong><br/>
1. اولین مورد<br/>
2. دومین مورد<br/>
   1. زیرمورد ۲.۱<br/>
   2. زیرمورد ۲.۲  </p>
<hr/>
<h3>کد</h3>
<p class="paragraph">