In [1]:
from mistralai.client import MistralClient
from mistralai.models.chat_completion import ChatMessage
import os

api_key = os.getenv("MISTRAL_API_KEY")
model = "mistral-large-latest"

client = MistralClient(api_key=api_key)

messages = [
    ChatMessage(role="user", content="What is the best French cheese?")
]

# No streaming
chat_response = client.chat(
    model=model,
    messages=messages,
)

print(chat_response.choices[0].message.content)

France is renowned for its wide variety of delicious cheeses, and the "best" one can depend on personal preference. However, some of the most popular and highly regarded French cheeses include:

1. Comté: A hard cheese made from unpasteurized cow's milk in the Franche-Comté region of eastern France. It has a nutty, slightly sweet flavor.

2. Brie de Meaux: Often simply called Brie, this soft cheese with a white rind is made from cow's milk. It's known for its creamy texture and mild, slightly tangy flavor.

3. Roquefort: This is a sheep's milk cheese that's aged in the Combalou caves in Roquefort-sur-Soulzon. It's a blue cheese with a strong, tangy flavor.

4. Camembert: Another soft cow's milk cheese, Camembert has a white, edible rind and a creamy interior. Its flavor is earthy and rich.

5. Chèvre: This is a general term for any cheese made from goat's milk. These cheeses can range in texture from soft and spreadable to hard, with flavors that are typically tangy and slightly sweet.

In [2]:
farsi_basic_query = "سلام. چطوری؟"

In [3]:
#Test Mistral with a basic query in Farsi

messages = [
    ChatMessage(role="user", content=farsi_basic_query)
]

# No streaming
chat_response = client.chat(
    model=model,
    messages=messages,
)

print(chat_response.choices[0].message.content)

سلام! خوبم، تشکر. شما چطورید؟ چه می‌خواهید بپرسید؟

Hello! I am fine, thank you. How are you? What would you like to ask?


### Pretty good! Now let's load the pruned dataset and start asking all of our questions

In [4]:
import pandas as pd

pruned_df = pd.read_csv('./pruned_data.csv')
pruned_df

Unnamed: 0,instruction,input,id,output
0,مشخص کنید که کدام ساز زهی یا بادی چوبی است: بی...,,dolly-14547,بیس ترمولو یک ساز زهی است در حالی که راکت یک س...
1,معنی کمپوست شدن چیزی چیست؟,,dolly-14549,کمپوست شدن یعنی فرایند تجزیه و تحلیل مواد آلی ...
2,چه رنگی از گربه معمولاً تقریباً همیشه ماده است؟,,dolly-14555,گربه‌های معمولاً تقریباً همیشه به رنگ خاکستری ...
3,هند چه زمانی استقلال یافت؟,,dolly-14557,هند در تاریخ ۱۵ اوت ۱۹۴۷ استقلال یافت.
4,آیا یک ماموریت سرنشین دار به مریخ ارزش این هزی...,,dolly-14561,به عنوان یک مدل زبانی ، من نمی توانم به صورت ق...
5,چرا در جاده های عمومی محدودیت سرعت وجود دارد؟,,dolly-14565,1- به دلیل بهبود ایمنی: حداکثر سرعت پرخطرترین ...
6,کدام کشور در شمال ایالات متحده است؟,,dolly-14566,کانادا در شمال ایالات متحده قرار دارد.
7,مشخص کنید کدام سازنده خودرو ژاپنی یا آمریکایی ...,,dolly-14567,مزدا، سازنده خودروی ژاپنی است و شورولت، سازنده...
8,انتقام جویان چه کسانی هستند؟,,dolly-14568,انتقام جویان یک گروه از ابرقهرمانان هستند که ت...
9,با توجه به این پاراگراف در مورد اردن، به من بگ...,اردن (به عربی: الأردن، tr. Al-ʾUrdunn [al.ʔur....,dolly-14572,اردن در غرب آسیا قرار دارد و با عربستان سعودی،...


In [8]:
#Separate out the queries and fill the na with " ", and put the queries in a list

queries_for_llm_df = pruned_df[["instruction", "input"]]
queries_for_llm_df["input"].fillna(" ", inplace=True)

queries_list = (queries_for_llm_df['instruction'].to_numpy() + queries_for_llm_df['input'].to_numpy()).tolist()

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  queries_for_llm_df["input"].fillna(" ", inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  queries_for_llm_df["input"].fillna(" ", inplace=True)


In [10]:
def generate_requests_mistral(querylist):
    requests = []

    for query in querylist:

        message = [
          ChatMessage(role="user", content=query)
        ]
        requests.append(message)

    return requests

In [11]:
requests = generate_requests_mistral(queries_list)

In [12]:
requests

[[ChatMessage(role='user', content='مشخص کنید که کدام ساز زهی یا بادی چوبی است: بیس ترمولو، راکت ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='معنی کمپوست شدن چیزی چیست؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='چه رنگی از گربه معمولاً تقریباً همیشه ماده است؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='هند چه زمانی استقلال یافت؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='آیا یک ماموریت سرنشین دار به مریخ ارزش این هزینه را دارد؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='چرا در جاده های عمومی محدودیت سرعت وجود دارد؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='کدام کشور در شمال ایالات متحده است؟ ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='مشخص کنید کدام سازنده خودرو ژاپنی یا آمریکایی است: مزدا، شورولت ', name=None, tool_calls=None)],
 [ChatMessage(role='user', content='انتقام جویان چه کسانی هستند؟ ', name=None, to

In [13]:
import time

response_list = []

for index, request in enumerate(requests):

    print(f"Working on response number {index}")

    print(f"Request is:\n{request}")

    chat_response = client.chat(
        model=model,
        messages=request,
    )

    print(chat_response.choices[0].message.content)

    response_list.append(chat_response.choices[0].message.content)

    time.sleep(2)

Working on response number 0
Request is:
[ChatMessage(role='user', content='مشخص کنید که کدام ساز زهی یا بادی چوبی است: بیس ترمولو، راکت ', name=None, tool_calls=None)]
بیس ترمولو یک ساز زهی و راکت یک ساز بادی چوبی است.

بیس ترمولو یک ساز زهی چهارچوبی است که در گروه سازهای زهی خنده دار قرار می‌گیرد. این ساز شامل چهار چوب اصلی است که ترتیبا به صورت زیر هستند: چوب پایینی (اوباس)، چوب متوسط (تنور)، چوب بالا (ترس) و چوب صوتی (ترپ).

راکت نیز یک ساز بادی چوبی است که در گروه سازهای بادی نفخ قرار می‌گیرد. این ساز شامل یک لوله چوبی است که در بالای آن یک پیشه نیز وجود دارد. راکت در دهه 1920 در ایتالیا طراحی شد و در اورکسترهای سرنود و جاز به کار می‌رود.
Working on response number 1
Request is:
[ChatMessage(role='user', content='معنی کمپوست شدن چیزی چیست؟ ', name=None, tool_calls=None)]
کمپوست شدن، فرایندی است که در آن قطعات بزرگ و کوچک مواد گیاهی و حیوانی تحت تاثیر کودکشاورزی و شرایط فیزیکی مانند گرما و رطوبت، تبدیل به ماده‌ای خاکستری و قابل استفاده تبدیل می‌شوند. این فرایند توسط میکروارگانیزم‌ه

In [14]:
response_list

['بیس ترمولو یک ساز زهی و راکت یک ساز بادی چوبی است.\n\nبیس ترمولو یک ساز زهی چهارچوبی است که در گروه سازهای زهی خنده دار قرار می\u200cگیرد. این ساز شامل چهار چوب اصلی است که ترتیبا به صورت زیر هستند: چوب پایینی (اوباس)، چوب متوسط (تنور)، چوب بالا (ترس) و چوب صوتی (ترپ).\n\nراکت نیز یک ساز بادی چوبی است که در گروه سازهای بادی نفخ قرار می\u200cگیرد. این ساز شامل یک لوله چوبی است که در بالای آن یک پیشه نیز وجود دارد. راکت در دهه 1920 در ایتالیا طراحی شد و در اورکسترهای سرنود و جاز به کار می\u200cرود.',
 'کمپوست شدن، فرایندی است که در آن قطعات بزرگ و کوچک مواد گیاهی و حیوانی تحت تاثیر کودکشاورزی و شرایط فیزیکی مانند گرما و رطوبت، تبدیل به ماده\u200cای خاکستری و قابل استفاده تبدیل می\u200cشوند. این فرایند توسط میکروارگانیزم\u200cهایی مانند بکتری\u200cها، جامدگلوله\u200cها و گریب\u200cها انجام می\u200cشود که به آن\u200cها کمپوست\u200cسازان گفته می\u200cشود. کمپوست نهایی یک ماده غنی از سموم مفید و مواد آلی است که به عنوان کود طبیعی برای تقویت خاک و رشد محصولات کشاورزی استفاده می\u200cشود.\n\

In [16]:
pruned_df_w_answers = pruned_df.copy()

#Add a column to the new df to hold the responses
pruned_df_w_answers['mistral_response'] = response_list

#Rename the output column to 'bactrian-x-answer'
pruned_df_w_answers.rename(columns={'output':'bactrian-x-answer'}, inplace=True)

In [17]:
pruned_df_w_answers

Unnamed: 0,instruction,input,id,bactrian-x-answer,mistral_response
0,مشخص کنید که کدام ساز زهی یا بادی چوبی است: بی...,,dolly-14547,بیس ترمولو یک ساز زهی است در حالی که راکت یک س...,بیس ترمولو یک ساز زهی و راکت یک ساز بادی چوبی ...
1,معنی کمپوست شدن چیزی چیست؟,,dolly-14549,کمپوست شدن یعنی فرایند تجزیه و تحلیل مواد آلی ...,کمپوست شدن، فرایندی است که در آن قطعات بزرگ و ...
2,چه رنگی از گربه معمولاً تقریباً همیشه ماده است؟,,dolly-14555,گربه‌های معمولاً تقریباً همیشه به رنگ خاکستری ...,معمولاً گربه‌ها در رنگ‌های مختلفی مانند سفید، ...
3,هند چه زمانی استقلال یافت؟,,dolly-14557,هند در تاریخ ۱۵ اوت ۱۹۴۷ استقلال یافت.,هند در سال 1947 میلادی و در تاریخ 15 اگست از ح...
4,آیا یک ماموریت سرنشین دار به مریخ ارزش این هزی...,,dolly-14561,به عنوان یک مدل زبانی ، من نمی توانم به صورت ق...,برای پیشرفت در یک مسیر فضایی و هدف مریخ، نیاز ...
5,چرا در جاده های عمومی محدودیت سرعت وجود دارد؟,,dolly-14565,1- به دلیل بهبود ایمنی: حداکثر سرعت پرخطرترین ...,محدودیت سرعت در جاده های عمومی برای هدفهای مخت...
6,کدام کشور در شمال ایالات متحده است؟,,dolly-14566,کانادا در شمال ایالات متحده قرار دارد.,کانادا یک کشور است که در شمال ایالات متحده قرا...
7,مشخص کنید کدام سازنده خودرو ژاپنی یا آمریکایی ...,,dolly-14567,مزدا، سازنده خودروی ژاپنی است و شورولت، سازنده...,مزدا یک سازنده خودروی ژاپنی است و شورولت یک سا...
8,انتقام جویان چه کسانی هستند؟,,dolly-14568,انتقام جویان یک گروه از ابرقهرمانان هستند که ت...,"""جویان"" (Joyan) معمولاً به یک گروه عسکری از زم..."
9,با توجه به این پاراگراف در مورد اردن، به من بگ...,اردن (به عربی: الأردن، tr. Al-ʾUrdunn [al.ʔur....,dolly-14572,اردن در غرب آسیا قرار دارد و با عربستان سعودی،...,اردن یک کشور در غرب آسیا است که در چهارراه آسی...


In [18]:
#Save the df to a CSV file
pruned_df_w_answers.to_csv('pruned_data_w_mistral_responses.csv', index=False)