#### Loading Dataset

In [21]:
import pandas as pd
df = pd.read_csv('imdb_urdu_reviews_train.csv')

In [22]:
df.head()

Unnamed: 0,review,sentiment
0,میں نے اسے 80 کی دہائی کے وسط میں ایک کیبل گائ...,positive
1,چونکہ میں نے 80 کی دہائی میں انسپکٹر گیجٹ کارٹ...,negative
2,ایک ایسے معاشرے کی حالت کے بارے میں تعجب کرتا ...,positive
3,مفید البرٹ پیون کی طرف سے ایک اور ردی کی ٹوکری...,negative
4,یہ کولمبو ہے جس کی ہدایتکاری اپنے کیریئر کے اب...,positive


#### Combining text in one paragraph

In [23]:
# Combine all sentences in the 'review' column into one paragraph
combined_paragraph = ' '.join(df['review'])

print(combined_paragraph[0:500])

میں نے اسے 80 کی دہائی کے وسط میں ایک کیبل گائیڈ (اسکائینجر ہنٹ پہلو نے مجھ سے اپیل کی تھی) کی علامت پر مبنی ایک نوعمر کی حیثیت سے ٹیپ کیا ، اس فلم کی کوئی معلومات یا توقعات نہیں تھیں۔ کتنی خوشگوار حیرت ہے جب میں نے اسے دیکھا! یہ ایک ایسی تفریحی فلم تھی اور مجھے یاد ہے کہ اسے بار بار دیکھا جاتا تھا۔ میں نے سوچا کہ یہ تصور اچھی طرح سے نافذ کیا گیا ہے ، میں نے مختلف گروہوں کے مابین بے ضرر مسابقت کا لطف اٹھایا ، اور مجھے لگتا ہے کہ مقتول کا شکار خود ہی کافی ہوشیار تھا۔ کبھی کبھی ایسا لگتا ہے کہ لوگ


#### Removing punctuations (except full stop & comma)

In [24]:
import string

# Define a translation table to remove punctuations except Urdu comma and full stop
translator = str.maketrans('', '', string.punctuation.replace('،', '').replace('۔', ''))

# Remove punctuations and extra spaces
cleaned_text = combined_paragraph.translate(translator).replace('  ', ' ')

# Print the result
print(cleaned_text[0:500])

میں نے اسے 80 کی دہائی کے وسط میں ایک کیبل گائیڈ اسکائینجر ہنٹ پہلو نے مجھ سے اپیل کی تھی کی علامت پر مبنی ایک نوعمر کی حیثیت سے ٹیپ کیا ، اس فلم کی کوئی معلومات یا توقعات نہیں تھیں۔ کتنی خوشگوار حیرت ہے جب میں نے اسے دیکھا یہ ایک ایسی تفریحی فلم تھی اور مجھے یاد ہے کہ اسے بار بار دیکھا جاتا تھا۔ میں نے سوچا کہ یہ تصور اچھی طرح سے نافذ کیا گیا ہے ، میں نے مختلف گروہوں کے مابین بے ضرر مسابقت کا لطف اٹھایا ، اور مجھے لگتا ہے کہ مقتول کا شکار خود ہی کافی ہوشیار تھا۔ کبھی کبھی ایسا لگتا ہے کہ لوگوں 


#### Splitting the text into sentences

In [25]:
# Split the text into sentences using Urdu full stop (۔) as the delimiter
broken_sentences = cleaned_text.split('۔')

# Include the Urdu full stop in each sentence
broken_sentences = [sentence.strip() + '۔' for sentence in broken_sentences if sentence.strip()]

# Remove the space before Urdu commas in each sentence
broken_sentences = [sentence.replace(' ،', '،') for sentence in broken_sentences]

# Print the result
print(broken_sentences[0:5])

['میں نے اسے 80 کی دہائی کے وسط میں ایک کیبل گائیڈ اسکائینجر ہنٹ پہلو نے مجھ سے اپیل کی تھی کی علامت پر مبنی ایک نوعمر کی حیثیت سے ٹیپ کیا، اس فلم کی کوئی معلومات یا توقعات نہیں تھیں۔', 'کتنی خوشگوار حیرت ہے جب میں نے اسے دیکھا یہ ایک ایسی تفریحی فلم تھی اور مجھے یاد ہے کہ اسے بار بار دیکھا جاتا تھا۔', 'میں نے سوچا کہ یہ تصور اچھی طرح سے نافذ کیا گیا ہے، میں نے مختلف گروہوں کے مابین بے ضرر مسابقت کا لطف اٹھایا، اور مجھے لگتا ہے کہ مقتول کا شکار خود ہی کافی ہوشیار تھا۔', 'کبھی کبھی ایسا لگتا ہے کہ لوگوں کو فلموں سے بہت زیادہ توقعات وابستہ ہیں۔', 'تمام فلموں میں ایک بھاری پیغام یا شاندار اداکاری، پروڈکشن کی قدریں، یا خصوصی اثرات مرتب نہیں ہوں گے۔']


### Applying Filters

#### 1- List with 25 to 30 word sentences

In [26]:
# Define a function to count words in a sentence
def count_words(sentence):
    return len(sentence.split())

# Create a new list with sentences meeting the criteria
selected_sentences = [
    sentence for sentence in broken_sentences
    if 25 <= count_words(sentence) <= 30 and '،' in sentence
]

#### 2- Sentences without English words

In [27]:
import re

# Define a regular expression to match Urdu words
urdu_word_pattern = re.compile(r'[\u0600-\u06FF]+')

# Filter sentences that do not contain any English words
urdu_sentences = [sentence for sentence in selected_sentences if not re.search(r'[a-zA-Z]', sentence) and re.search(urdu_word_pattern, sentence)]

#### 3- Sentences with only commas & full stops

In [28]:
# Filter sentences that do not contain the Urdu question mark (؟)
urdu_sentences = [
    sentence for sentence in urdu_sentences
    if '؟' not in sentence
]

In [30]:
len(urdu_sentences)

32951

In [31]:
print(urdu_sentences[0:3])

['بلکہ بے رحمی کے ساتھ، وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے، اور وہ خاتون دوسرے حصے پیش کرتی ہے۔', 'یہ پرل، نوعمر حراستی مرکز میں استاد ہے جو نوجوان کے اندر ہنگامہ دیکھتا ہے اور مدد کرنا چاہتا ہے، لیکن بدقسمتی سے، اس کے پاس کوئی موقع نہیں ہے۔', 'دھندلا کیونکہ اس کتاب کی زیادہ تر ایک کولمبو فلم ہے جس میں حقیقی یادگار لمحات نہیں ہوتے ہیں، پھیکا نہیں ہوتا ہے کیونکہ یہ دیکھنا ایک بورنگ فلم ہے۔']


#### List of sentences without punctuations

In [11]:
# Define a regular expression to match Urdu full stop (۔) and Urdu comma (،)
punctuation_pattern = re.compile(r'[،۔]')

# Remove punctuations from each sentence
sentences_without_punctuation = [
    re.sub(punctuation_pattern, '', sentence)
    for sentence in urdu_sentences
]

In [12]:
len(sentences_without_punctuation)

32951

In [14]:
print(sentences_without_punctuation[0:10])

['بلکہ بے رحمی کے ساتھ وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے اور وہ خاتون دوسرے حصے پیش کرتی ہے', 'یہ پرل نوعمر حراستی مرکز میں استاد ہے جو نوجوان کے اندر ہنگامہ دیکھتا ہے اور مدد کرنا چاہتا ہے لیکن بدقسمتی سے اس کے پاس کوئی موقع نہیں ہے', 'دھندلا کیونکہ اس کتاب کی زیادہ تر ایک کولمبو فلم ہے جس میں حقیقی یادگار لمحات نہیں ہوتے ہیں پھیکا نہیں ہوتا ہے کیونکہ یہ دیکھنا ایک بورنگ فلم ہے', 'یہ دیکھ کر حیرت کی بات ہے کہ اس میں سے زیادہ تر اسپیلبرگ کے بعد کے کام خاص طور پر کچھ کیمرہ زاویوں کے ساتھ مطابقت رکھتا تھا', 'آخر میں مجھے حیرت نہیں ہے ہاؤس آف موم نے آئی ایم ڈی بی ٹاپ 250 میں جگہ نہیں بنائی لیکن یہ یقینی طور پر دیکھنے کے قابل ہے', 'پہلی فلم میں اس کے پاس لوگوں کو مارنے کی ایک وجہ تھی لیکن اس سلسلے میں آدھے قتل قتل کی بنیادی وجہ بلا وجہ تھی', 'میں نے سوچا کہ اداکاروں نے کچھ حد تک کوشش کی لیکن اس فلم کے ساتھ یہ اتنا لنگڑا تھا کہ صرف اتنی دور تک جاسکتی ہے', 'یہاں ایک اور چھوٹی سی کہانی کی معمولی لائنیں ہیں جو واقعی میں لینے سے کہیں زیادہ دلچسپ ہوسکتی ہیں لیکن ان کی پوری تلاش نہیں

### For HuggingFace

#### Sentence List for Training

In [80]:
# Take the first 2000 sentences from sentences_without_punctuation
sentences_without_punctuations_train = sentences_without_punctuation[:2000]

# Take the first 2000 sentences from urdu_sentences
sentences_with_punctuations_train = urdu_sentences[:2000]

#### Dataframe for training

In [86]:
# Create a dictionary with the data
data = {
    'Instructions': ['Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don\'t include any kind of html tags and don\'t truncate the output. Provide the actual input that has been asked. "،" "۔" These are the punctuations that need to be added'] * 2000,
    'Prompt': sentences_without_punctuations_train,
    'Response': sentences_with_punctuations_train
}

# Create a DataFrame
df = pd.DataFrame(data)

In [116]:
df.head()

Unnamed: 0,Instructions,Prompt,Response
0,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",بلکہ بے رحمی کے ساتھ وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے اور وہ خاتون دوسرے حصے پیش کرتی ہے,بلکہ بے رحمی کے ساتھ، وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے، اور وہ خاتون دوسرے حصے پیش کرتی ہے۔
1,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",یہ پرل نوعمر حراستی مرکز میں استاد ہے جو نوجوان کے اندر ہنگامہ دیکھتا ہے اور مدد کرنا چاہتا ہے لیکن بدقسمتی سے اس کے پاس کوئی موقع نہیں ہے,یہ پرل، نوعمر حراستی مرکز میں استاد ہے جو نوجوان کے اندر ہنگامہ دیکھتا ہے اور مدد کرنا چاہتا ہے، لیکن بدقسمتی سے، اس کے پاس کوئی موقع نہیں ہے۔
2,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",دھندلا کیونکہ اس کتاب کی زیادہ تر ایک کولمبو فلم ہے جس میں حقیقی یادگار لمحات نہیں ہوتے ہیں پھیکا نہیں ہوتا ہے کیونکہ یہ دیکھنا ایک بورنگ فلم ہے,دھندلا کیونکہ اس کتاب کی زیادہ تر ایک کولمبو فلم ہے جس میں حقیقی یادگار لمحات نہیں ہوتے ہیں، پھیکا نہیں ہوتا ہے کیونکہ یہ دیکھنا ایک بورنگ فلم ہے۔
3,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",یہ دیکھ کر حیرت کی بات ہے کہ اس میں سے زیادہ تر اسپیلبرگ کے بعد کے کام خاص طور پر کچھ کیمرہ زاویوں کے ساتھ مطابقت رکھتا تھا,یہ دیکھ کر حیرت کی بات ہے کہ اس میں سے زیادہ تر اسپیلبرگ کے بعد کے کام، خاص طور پر کچھ کیمرہ زاویوں کے ساتھ مطابقت رکھتا تھا۔
4,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",آخر میں مجھے حیرت نہیں ہے ہاؤس آف موم نے آئی ایم ڈی بی ٹاپ 250 میں جگہ نہیں بنائی لیکن یہ یقینی طور پر دیکھنے کے قابل ہے,آخر میں، مجھے حیرت نہیں ہے ہاؤس آف موم نے آئی ایم ڈی بی ٹاپ 250 میں جگہ نہیں بنائی، لیکن یہ یقینی طور پر دیکھنے کے قابل ہے۔


In [92]:
# Save the DataFrame to a CSV file
df.to_csv('urdu_sentences_train.csv', index=False, encoding='utf-8-sig')

#### Sentence List for Testing

In [15]:
# Take 1000 sentences from sentences_without_punctuation
sentences_without_punctuations_test = sentences_without_punctuation[2000:3000]

# Take 1000 sentences from urdu_sentences
sentences_with_punctuations_test = urdu_sentences[2000:3000]

#### Dataframe for testing

In [163]:
# Create a dictionary with the data
data_test = {
    'Instructions': ['Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don\'t include any kind of html tags and don\'t truncate the output. Provide the actual input that has been asked. "،" "۔" These are the punctuations that need to be added'] * 1000,
    'Prompt': sentences_without_punctuations_test,
}

# Create a DataFrame
df_test = pd.DataFrame(data_test)

In [164]:
df_test.head()

Unnamed: 0,Instructions,Prompt
0,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",وہ پہلے ایک بہت ہی ہمدرد کردار کی حیثیت سے نہیں آسکتی ہے لیکن پوری فلم کو دیکھ کر آپ چاہتے ہیں کہ اس کی کامیابی ہوجائے
1,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",میں نے اس سے پہلے کبھی نہیں سنا تھا اور نہ ہی جان بوجھ کر اسے کسی دوسری فلم میں دیکھا تھا لیکن یہ زبردست اداکاری تھی
2,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",اس فلم کی خوبصورتی کا ثبوت ماں کی محبت کی طاقت غیر معمولی پرفارمنس مستقل پھانسی اور کافی جدید اسکرپٹ کے عظیم نقاشی میں ہے
3,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",اس فلم میں ایک ہندوستانی خاتون نندنی کی کہانی بیان کی گئی ہے جو اپنے شوہر شیکھر اور چھوٹے بچے راجہ کے ساتھ کینیڈا میں رہتی ہیں
4,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",مقامات حیرت انگیز ہیں موسیقی حیرت انگیز ہے اور کرشنا وامشی کی ہدایتکاری کا اثر بہت موثر فلم سازی اور اچھی ترمیم نے حاصل کیا ہے


### For One-shot learning

#### With Punctuations

In [33]:
sentences_1000_one_shot = urdu_sentences[2000:3000]

#### Removing unnecessary characters

In [35]:
sentences_1000_one_shot= [sentence.replace('\u200b\u200b', '') for sentence in sentences_1000_one_shot]

In [37]:
import pickle

# Specify the file path where you want to save the list
file_path = 'sentences_1000_one_shot.pkl'

# Save the list using pickle
with open(file_path, 'wb') as file:
    pickle.dump(sentences_1000_one_shot, file)

#### Without Punctuations

In [16]:
sentences_1000_without_punctuations = sentences_without_punctuation[2000:3000]

In [19]:
import pickle

# Specify the file path where you want to save the list
file_path = 'sentences_1000_without_punctuations.pkl'

# Save the list using pickle
with open(file_path, 'wb') as file:
    pickle.dump(sentences_1000_without_punctuations, file)

### Creating instruction set for fine-tuning 

#### Training data

In [121]:
def create_instruction_template(row):
    system_prompt = "<<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n"
    my_input = row['Prompt']
    model_answer = row['Response']
    model_answer = f"\nFollowing is the correct sentence: {model_answer}"

    return f"<s>[INST] {system_prompt} {my_input} [/INST] {model_answer} </s>"

In [122]:
# Display the updated DataFrame
df['text'] = df.apply(create_instruction_template, axis=1)

In [124]:
print(df.iloc[0]['text'])

<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>
 بلکہ بے رحمی کے ساتھ وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے اور وہ خاتون دوسرے حصے پیش کرتی ہے [/INST] 
Following is the correct sentence: بلکہ بے رحمی کے ساتھ، وہ اس سے پوچھتی ہے کہ کیا وہ اخبار رکھ سکتا ہے، اور وہ خاتون دوسرے حصے پیش کرتی ہے۔ </s>


In [125]:
# Save the DataFrame to a CSV file
df.to_csv('train_sentences.csv', index=False, encoding='utf-8-sig')

#### Test data

In [165]:
def test_data(row):
    system_prompt = "<<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n"
    my_input = row['Prompt']

    return f"<s>[INST] {system_prompt} {my_input} [/INST] \nFollowing is the correct sentence: "

In [166]:
# Display the updated DataFrame
df_test['text'] = df_test.apply(test_data, axis=1)

In [167]:
print(df_test.iloc[0]['text'])

<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>
 وہ پہلے ایک بہت ہی ہمدرد کردار کی حیثیت سے نہیں آسکتی ہے لیکن پوری فلم کو دیکھ کر آپ چاہتے ہیں کہ اس کی کامیابی ہوجائے [/INST] 
Following is the correct sentence: 


In [169]:
# Add a new column 'True Value'
df_test['True Value'] = sentences_with_punctuations_test

In [170]:
df_test.head()

Unnamed: 0,Instructions,Prompt,text,True Value
0,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",وہ پہلے ایک بہت ہی ہمدرد کردار کی حیثیت سے نہیں آسکتی ہے لیکن پوری فلم کو دیکھ کر آپ چاہتے ہیں کہ اس کی کامیابی ہوجائے,<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n وہ پہلے ایک بہت ہی ہمدرد کردار کی حیثیت سے نہیں آسکتی ہے لیکن پوری فلم کو دیکھ کر آپ چاہتے ہیں کہ اس کی کامیابی ہوجائے [/INST] \nFollowing is the correct sentence:,وہ پہلے ایک بہت ہی ہمدرد کردار کی حیثیت سے نہیں آسکتی ہے، لیکن پوری فلم کو دیکھ کر، آپ چاہتے ہیں کہ اس کی کامیابی ہوجائے۔
1,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",میں نے اس سے پہلے کبھی نہیں سنا تھا اور نہ ہی جان بوجھ کر اسے کسی دوسری فلم میں دیکھا تھا لیکن یہ زبردست اداکاری تھی,<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n میں نے اس سے پہلے کبھی نہیں سنا تھا اور نہ ہی جان بوجھ کر اسے کسی دوسری فلم میں دیکھا تھا لیکن یہ زبردست اداکاری تھی [/INST] \nFollowing is the correct sentence:,میں نے اس سے پہلے کبھی نہیں سنا تھا اور نہ ہی جان بوجھ کر اسے کسی دوسری فلم میں دیکھا تھا، لیکن یہ زبردست اداکاری تھی۔
2,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",اس فلم کی خوبصورتی کا ثبوت ماں کی محبت کی طاقت غیر معمولی پرفارمنس مستقل پھانسی اور کافی جدید اسکرپٹ کے عظیم نقاشی میں ہے,<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n اس فلم کی خوبصورتی کا ثبوت ماں کی محبت کی طاقت غیر معمولی پرفارمنس مستقل پھانسی اور کافی جدید اسکرپٹ کے عظیم نقاشی میں ہے [/INST] \nFollowing is the correct sentence:,اس فلم کی خوبصورتی کا ثبوت ماں کی محبت کی طاقت، غیر معمولی پرفارمنس، مستقل پھانسی اور کافی جدید اسکرپٹ کے عظیم نقاشی میں ہے۔
3,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",اس فلم میں ایک ہندوستانی خاتون نندنی کی کہانی بیان کی گئی ہے جو اپنے شوہر شیکھر اور چھوٹے بچے راجہ کے ساتھ کینیڈا میں رہتی ہیں,<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n اس فلم میں ایک ہندوستانی خاتون نندنی کی کہانی بیان کی گئی ہے جو اپنے شوہر شیکھر اور چھوٹے بچے راجہ کے ساتھ کینیڈا میں رہتی ہیں [/INST] \nFollowing is the correct sentence:,اس فلم میں ایک ہندوستانی خاتون، نندنی کی کہانی بیان کی گئی ہے، جو اپنے شوہر شیکھر اور چھوٹے بچے راجہ کے ساتھ کینیڈا میں رہتی ہیں۔
4,"Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. ""،"" ""۔"" These are the punctuations that need to be added",مقامات حیرت انگیز ہیں موسیقی حیرت انگیز ہے اور کرشنا وامشی کی ہدایتکاری کا اثر بہت موثر فلم سازی اور اچھی ترمیم نے حاصل کیا ہے,<s>[INST] <<SYS>>Add appropriate punctuations and sentence boundaries to the following Urdu text in input. Don't include any kind of html tags and don't truncate the output. Provide the actual input that has been asked. '،' '۔' These are the punctuations that need to be added<</SYS>>\n مقامات حیرت انگیز ہیں موسیقی حیرت انگیز ہے اور کرشنا وامشی کی ہدایتکاری کا اثر بہت موثر فلم سازی اور اچھی ترمیم نے حاصل کیا ہے [/INST] \nFollowing is the correct sentence:,مقامات حیرت انگیز ہیں، موسیقی حیرت انگیز ہے، اور کرشنا وامشی کی ہدایتکاری کا اثر بہت موثر فلم سازی اور اچھی ترمیم نے حاصل کیا ہے۔


In [171]:
# Save the DataFrame to a CSV file
df_test.to_csv('test_sentences.csv', index=False, encoding='utf-8-sig')