In [1]:
import getpass
import os
os.environ["COHERE_API_KEY"] = getpass.getpass()

In [2]:
import json

with open("gods.json", "r", encoding="utf-8") as file:
    gods = json.load(file)
print('Total number of items:', len(gods))
print('First item:', gods[0])

Total number of items: 14
First item: {'name': 'زئوس', 'description': 'زئوس بر کوه الیمپوس حکومت می\u200cکند و پادشاه خدایان است. او پسر کرونوس و ریا، شوهر هرا است، و 15 کودک دارد که همه آنها المپیایی هستند.', 'appearance': 'او به عنوان یک مرد قد بلند و ستبر با لباس فاخر نشان داده شده است. او دارای موی بلند و ریش بلند است. به طور کلی، او به صورت ایستاده به تصویر درآمده است.', 'features': 'رعد، اسلحه او و ویژگی اصلی وی است که به طور کلی در دست راست او قرار دارد. گاهی اوقات او یک عصای سلطنتی را در دست چپ خود حمل می\u200cکند. گاو و عقاب حیوانات مقدس او هستند.'}


In [3]:
gods_text = ""
for god in gods:
    god_description = f"{god['name']}: {god['description']} {god['appearance']} {god['features']}"
    gods_text += god_description + "\n\n"

system_message = f"اطلاعات خدایان:\n\n{gods_text}\nپاسخ باید در حداکثر 4 الی 5 کلمه خلاصه شود!\nاگر نتوانستی در 4 الی 5 کلمه پاسخ بدی با رشته ی «نمی‌دانم» پاسخ بده.\nاگر پاسخ سوالی را نمیدانی با رشته ی «نمی‌دانم» پاسخ بده."

In [4]:
examples = [
    {"question": "کدام خدا آتش را به انسان‌ها داد؟", "answer": "پرومته"},
    {"question": "نام معبد آپولون کجاست؟", "answer": "دلفی"},
    {"question": "چه کسی پاندورا را ساخت؟", "answer": "هفایستوس"},
    {"question": "نام رود عالم زیرین چیست؟", "answer": "استیکس"},
    {"question": "چه کسی دیوارهای تروی را ساخت؟", "answer": "پوسوئیدون"},
    {"question": "کدام خدا هیولای پیتون را کشت؟", "answer": "آپولون"},
    {"question": "نام جزیره تولد آرتمیس چیست؟", "answer": "دلوس"},
    {"question": "چه کسی هلن را ربود؟", "answer": "پاریس"},
    {"question": "کدام خدا طوفان ادیسه را ایجاد کرد؟", "answer": "پوسوئیدون"},
    {"question": "چه کسی جعبه پاندورا را باز کرد؟", "answer": "اپیمته"},
    {"question": "نام هیولای سر شیر چیست؟", "answer": "کایمرا"},
    {"question": "چه کسی به عنکبوت تبدیل شد؟", "answer": "آراخنه"},
    {"question": "کدام خدا لابیرنت کرت را ساخت؟", "answer": "ددالوس"},
    {"question": "نام شهر حامی آتنا چیست؟", "answer": "آتن"},
    {"question": "چه کسی با بال‌های مومی پرواز کرد؟", "answer": "ایکاروس"},
    {"question": "کدام خدا تیتان‌ها را شکست داد؟", "answer": "زئوس"},
    {"question": "چه کسی مدوسا را نفرین کرد؟", "answer": "آتنا"},
    {"question": "نام شیر کشته‌شده توسط هراکلس چیست؟", "answer": "شیر نومه"},
    {"question": "کدام خدا نگهبان دروازه‌های المپوس بود؟", "answer": "هبه"},
    {"question": "چه کسی اشعار عاشقانه سرود؟", "answer": "آپولون"},
    {"question": "نام مسابقه انتخاب همسر هیپومنه چیست؟", "answer": "مسابقه دو"},
    {"question": "چه کسی سیب طلایی را اهدا کرد؟", "answer": "پاریس"},
    {"question": "کدام خدا به دلیل عشق به نرگس شناخته می‌شود؟", "answer": "نارسیس"},
    {"question": "چه کسی پارچه بی‌نقص بافت؟", "answer": "آتنا"},
    {"question": "کدام خدا ضیافت‌های المپوس را برگزار کرد؟", "answer": "دیونیسوس"},
    {"question": "چه کسی زئوس را با استخوان فریب داد؟", "answer": "پرومته"},
    {"question": "نام موجودی که هراکلس آن را شکار کرد چیست؟", "answer": "گراز اریانتیوس"},
    {"question": "کدام خدا ارواح را هدایت می‌کرد؟", "answer": "هرمس"},
    {"question": "چه کسی دیوارهای شهر آتن را تقویت کرد؟", "answer": "آتنا"},
    {"question": "نام موجودی که مینوتور را کشت چیست؟", "answer": "تسئوس"}
]

In [5]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.prompts import FewShotChatMessagePromptTemplate
from langchain_chroma import Chroma
from langchain_core.example_selectors import SemanticSimilarityExampleSelector
from langchain_cohere import CohereEmbeddings

embeddings = CohereEmbeddings(model='embed-multilingual-v3.0')
to_vectorize = [" ".join(example.values()) for example in examples]
vectorstore = Chroma.from_texts(to_vectorize, embeddings, metadatas=examples)

In [6]:
example_selector = SemanticSimilarityExampleSelector(
    vectorstore=vectorstore,
    k=5,
)

example_selector.select_examples({"question": "در مورد زئوس بگو"})

[{'answer': 'زئوس', 'question': 'کدام خدا تیتان\u200cها را شکست داد؟'},
 {'answer': 'پرومته', 'question': 'چه کسی زئوس را با استخوان فریب داد؟'},
 {'answer': 'تسئوس', 'question': 'نام موجودی که مینوتور را کشت چیست؟'},
 {'answer': 'نارسیس',
  'question': 'کدام خدا به دلیل عشق به نرگس شناخته می\u200cشود؟'},
 {'answer': 'پوسوئیدون', 'question': 'کدام خدا طوفان ادیسه را ایجاد کرد؟'}]

In [7]:
from langchain_core.prompts import ChatPromptTemplate

few_shot_prompt = FewShotChatMessagePromptTemplate(
    input_variables=["question"],
    example_selector=example_selector,
    example_prompt=ChatPromptTemplate.from_messages(
        [("human", "{question}"), ("ai", "{answer}")]
    )
)

prompt = ChatPromptTemplate.from_messages(
    [
     ("system", system_message),
     few_shot_prompt,
     ("human", "{question}")
    ]
)

In [8]:
from langchain_cohere import ChatCohere

model = ChatCohere(top_p=0.9, tempreature=0)

In [9]:
from langchain_core.output_parsers import StrOutputParser
chain = prompt | model | StrOutputParser()

In [10]:
import pandas as pd

questions = pd.read_csv("questions.csv", encoding="utf-8")

In [11]:
import time

# لیستی برای ذخیره پاسخ‌ها
answers = []

# تعداد درخواست‌ها
request_count = 0
max_requests = 10  # تعداد درخواست‌هایی که قبل از محدودیت می‌توان ارسال کرد

# پردازش سوالات و تولید پاسخ‌ها
for index, row in questions.iterrows():
    question = row["question"]  # استخراج سوال از دیتافریم
    
    try:
        answer = chain.invoke(question)  # تولید پاسخ با chain.invoke
        answers.append({"answer": answer})  # ذخیره فقط پاسخ‌ها
    except Exception as e: #مشکل در پردازش سوال
        print(f"Error occurred: {e}")
        answers.append({"answer": "Error occurred"})  # در صورت خطا یک پیام جایگزین ذخیره می‌کنیم

    # شمارش تعداد درخواست‌ها
    request_count += 1

    # اگر تعداد درخواست‌ها به 10 رسید، یک دقیقه توقف می‌کنیم
    if request_count >= max_requests:
        print("Reached API request limit. Sleeping for 1 minute...")
        time.sleep(60)  # توقف برای یک دقیقه
        request_count = 0  # بازنشانی شمارنده درخواست‌ها

# تبدیل لیست پاسخ‌ها به دیتافریم با فقط یک ستون "answer"
submission = pd.DataFrame(answers)

# نمایش نتیجه
print(submission.head())  # نمایش چند ردیف اول دیتافریم برای بررسی


Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
Reached API request limit. Sleeping for 1 minute...
                                              answer
0                                                هرا
1                                                جغد
2  هرمس خدای بدبختی، سفر، تجارت، زبان و حیوانات است.
3                                        مار و خرچنگ
4                                    لاک‌پشت و خرگوش


In [None]:
print(submission)

In [12]:
import zipfile
import os

if not os.path.exists(os.path.join(os.getcwd(), 'Olympians.ipynb')):
    %notebook -e Olympians.ipynb

def compress(file_names): 
    print("File Paths:")
    print(file_names)
    compression = zipfile.ZIP_DEFLATED
    with zipfile.ZipFile("result.zip", mode="w") as zf:
        for file_name in file_names:
            zf.write('./' + file_name, file_name, compress_type=compression)

configs = {
    "messages": len(prompt.messages),
    "temperature": model.temperature
}

with open('model_configs.json', 'w') as json_file:
    json.dump(configs, json_file, indent=4)

submission.to_csv('submission.csv', index=False)
pd.DataFrame(examples).to_csv('examples.csv', index=False)

file_names = ['Olympians.ipynb', 'submission.csv',
              'examples.csv','model_configs.json' ]
compress(file_names)

File Paths:
['Olympians.ipynb', 'submission.csv', 'examples.csv', 'model_configs.json']
