## Load 72B AWQ Model using vLLM on L4 x4

In this notebook, we load the awq quantized of Qwen/Qwen2.5-72B-Instruct. The model card on huggingface.com can be found [here](https://huggingface.co/Qwen/Qwen2.5-72B-Instruct-AWQ).

### Next steps

Specialized math models exist in the Qwen2.5 family of models. A good starting point might be to awq quantize their best math model: [Qwen/Qwen2.5-Math-72B-Instruct](https://huggingface.co/Qwen/Qwen2.5-Math-72B-Instruct)!

The sky's the limit, happy kaggling!

In [1]:
import pandas as pd

# Load the CSV file correctly by specifying the header row
file_path = '/kaggle/input/rqa-cfa-merged-1/Validation.csv'
combined_data = pd.read_csv(file_path, header=0)  # Use header=1 to skip the first row

# Print the column names to verify
print(combined_data.columns)

# Optionally, print the first few rows to see the data
print(combined_data.head())

Index(['Name', 'passage_id', 'context', 'title', 'question_id',
       'question_text', 'is_answerable', 'question_type', 'Parametric_answer',
       'Contextual_answer', 'answer_type', 'context-Type'],
      dtype='object')
   Name    passage_id                                            context  \
0  data  bn_wiki_2812  আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অ...   
1  data  bn_wiki_2812  আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অ...   
2  data  bn_wiki_2812  আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অ...   
3  data  bn_wiki_2812  আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অ...   
4  data  bn_wiki_2812  আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অ...   

            title        question_id  \
0  আক্কাদীয় সরগন    bn_wiki_2812_01   
1  আক্কাদীয় সরগন  bn_wiki_2812_01_X   
2  আক্কাদীয় সরগন    bn_wiki_2812_02   
3  আক্কাদীয় সরগন  bn_wiki_2812_02_X   
4  আক্কাদীয় সরগন    bn_wiki_2812_03   

                                       question_text  is_answerable  \
0     

In [2]:
import pandas as pd

# Create empty lists to store data
questions = []
answers = []

# Iterate over each row in the DataFrame
for index, row in combined_data.iterrows():
    
    context =  row['context']  # Get the context
    question_text = "Question: " + row['question_text']  # Get the question text
    parametric_answer = str(row['Parametric_answer']).lstrip("'")  # Get the parametric answer
    contextual_answer = str(row['Contextual_answer']).lstrip("'")  # Get the contextual answer
    
    # Format the question and answer as per your requirement
    question = f"{question_text}\nContext:<p> {context} </p>"
    answer = f"parametric answer: {parametric_answer}\ncontextual answer: {contextual_answer}"
    
    # Append data to lists
    questions.append(question)
    answers.append(answer)

# Create a new DataFrame
new_dataframe = pd.DataFrame({'Question': questions, 'Answer': answers})

# Print the new DataFrame
print(new_dataframe)

                                               Question  \
0     Question: কোন জাদুঘরে সারগনিক বিজয় ফলক আছে?\nC...   
1     Question: কোন জাদুঘরে সারগনিক বিজয় ফলক আছে?\nC...   
2     Question: ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফল...   
3     Question: ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফল...   
4     Question: ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফল...   
...                                                 ...   
2100  Question: কোন দশকে আধুনিক সাংবাদিকতা রূপ ধারণ ...   
2101  Question: কোন দশকে আধুনিক সাংবাদিকতা রূপ ধারণ ...   
2102  Question: আধুনিক সাংবাদিকতা রূপ ধারণ করতে শুরু...   
2103  Question: আধুনিক সাংবাদিকতা রূপ ধারণ করতে শুরু...   
2104  Question: কোনটি কে প্রথম সংবাদপত্র বলে অভিহিত ...   

                                                 Answer  
0     parametric answer: ল্যুভর জাদুঘরে\ncontextual ...  
1     parametric answer: ল্যুভর জাদুঘরে\ncontextual ...  
2     parametric answer: খুব সম্ভবত মেসোপটেমিয়া ত্থ...  
3     parametric answer: খুব সম্ভবত মেসোপটেমিয়া ত্থ...  
4

In [3]:
pd.set_option('display.max_colwidth', None)
print(new_dataframe.iloc[5])

Question    Question: ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক কোন শতাব্দীতে স্থানান্তরিত করা হয়েছিল?\nContext:<p> আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অবনমিত অবস্থান থেকে ক্ষমতায় উত্থান ও মেসোপটেমিয়া অভিযানের জন্য কিংবদন্তি গল্পের মুল উপজীব্যে পরিনত হয়েছিলেন, এরকম আরও কিছু কিছু আংশিক কিংবদন্তী\n\nউপাখ্যান ছাড়াও সারগনের খোদ নিজের অনেক লিপি আছে যদিও তার বেশিরভাগ পরবর্তী সংস্করনগুলি থেকে নেওয়া। ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক এর অংশবিশেষ আছে যা সুসা (যেখানে এগুলি খুব সম্ভবত মেসোপটেমিয়া ত্থেকে চতুর্দশ শতাব্দীতে স্থানান্তরিত করা হয়েছিল) থেকে পুনঃউদ্ধার করা হয়েছিল।\n\nদৃশ্যত সরগন সেমেটিক (আক্কাদীয়ান) ভাষার লিপির লিখিত আকারে প্রসার ঘটিয়েছিলেন, তিনি আক্কাদ শহর প্রতিষ্ঠিত করার প্রথমদিকে নিজেকে প্রায়শয়ই আক্কাদীয়ান রাজা হিসিবে প্রচার করতেন, পরে তিনি কোন এক সময় কিস শহর অধিগ্রহণ করে নেন, পরবর্তীতে মেসোপটেমিয়ার বৃহদাংশও দখল করে নেন, এবং ক্রমে ক্রমে “সরগন, আক্কদীয়ান রাজা, ইনান্নার তত্ত্বাবধায়ক, কিস এর রাজা, আনুর স্থলাভিষিক্ত, রাজ্যের[মেসোপটেমিয়া] রাজা, এনলিলের রাজ্যপাল[এ

In [4]:
print(new_dataframe['Question'].iloc[5])

Question: ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক কোন শতাব্দীতে স্থানান্তরিত করা হয়েছিল?
Context:<p> আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অবনমিত অবস্থান থেকে ক্ষমতায় উত্থান ও মেসোপটেমিয়া অভিযানের জন্য কিংবদন্তি গল্পের মুল উপজীব্যে পরিনত হয়েছিলেন, এরকম আরও কিছু কিছু আংশিক কিংবদন্তী

উপাখ্যান ছাড়াও সারগনের খোদ নিজের অনেক লিপি আছে যদিও তার বেশিরভাগ পরবর্তী সংস্করনগুলি থেকে নেওয়া। ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক এর অংশবিশেষ আছে যা সুসা (যেখানে এগুলি খুব সম্ভবত মেসোপটেমিয়া ত্থেকে চতুর্দশ শতাব্দীতে স্থানান্তরিত করা হয়েছিল) থেকে পুনঃউদ্ধার করা হয়েছিল।

দৃশ্যত সরগন সেমেটিক (আক্কাদীয়ান) ভাষার লিপির লিখিত আকারে প্রসার ঘটিয়েছিলেন, তিনি আক্কাদ শহর প্রতিষ্ঠিত করার প্রথমদিকে নিজেকে প্রায়শয়ই আক্কাদীয়ান রাজা হিসিবে প্রচার করতেন, পরে তিনি কোন এক সময় কিস শহর অধিগ্রহণ করে নেন, পরবর্তীতে মেসোপটেমিয়ার বৃহদাংশও দখল করে নেন, এবং ক্রমে ক্রমে “সরগন, আক্কদীয়ান রাজা, ইনান্নার তত্ত্বাবধায়ক, কিস এর রাজা, আনুর স্থলাভিষিক্ত, রাজ্যের[মেসোপটেমিয়া] রাজা, এনলিলের রাজ্যপাল[এনসি]” নামে নিজেকে

In [5]:
question,context = new_dataframe['Question'].iloc[5].split("Context:")

In [6]:
question.lstrip("Question:").strip("\n")

' ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক কোন শতাব্দীতে স্থানান্তরিত করা হয়েছিল?'

In [7]:
context.strip("<p>").strip("</p>").strip()

'আস্যাইরিয়ান ও ব্যাবলিয়ান সাহিত্যে সরগন তার অবনমিত অবস্থান থেকে ক্ষমতায় উত্থান ও মেসোপটেমিয়া অভিযানের জন্য কিংবদন্তি গল্পের মুল উপজীব্যে পরিনত হয়েছিলেন, এরকম আরও কিছু কিছু আংশিক কিংবদন্তী\n\nউপাখ্যান ছাড়াও সারগনের খোদ নিজের অনেক লিপি আছে যদিও তার বেশিরভাগ পরবর্তী সংস্করনগুলি থেকে নেওয়া। ল্যুভর জাদুঘরে দুটি সারগনিক বিজয় ফলক এর অংশবিশেষ আছে যা সুসা (যেখানে এগুলি খুব সম্ভবত মেসোপটেমিয়া ত্থেকে চতুর্দশ শতাব্দীতে স্থানান্তরিত করা হয়েছিল) থেকে পুনঃউদ্ধার করা হয়েছিল।\n\nদৃশ্যত সরগন সেমেটিক (আক্কাদীয়ান) ভাষার লিপির লিখিত আকারে প্রসার ঘটিয়েছিলেন, তিনি আক্কাদ শহর প্রতিষ্ঠিত করার প্রথমদিকে নিজেকে প্রায়শয়ই আক্কাদীয়ান রাজা হিসিবে প্রচার করতেন, পরে তিনি কোন এক সময় কিস শহর অধিগ্রহণ করে নেন, পরবর্তীতে মেসোপটেমিয়ার বৃহদাংশও দখল করে নেন, এবং ক্রমে ক্রমে “সরগন, আক্কদীয়ান রাজা, ইনান্নার তত্ত্বাবধায়ক, কিস এর রাজা, আনুর স্থলাভিষিক্ত, রাজ্যের[মেসোপটেমিয়া] রাজা, এনলিলের রাজ্যপাল[এনসি]” নামে নিজেকে  প্রচার করে ছিলেন।\n\nযদিও সুমেরিয়ান রাজাদের তালিকার অনেক অনুলিপিতে সারগনের শাসনকাল ৫৬, ৫৫ ব

In [8]:
print(new_dataframe['Answer'].iloc[5])

parametric answer: দ্বাদশ শতাব্দীতে
contextual answer: চতুর্দশ শতাব্দীতে


In [9]:
import os
import gc
import ctypes
import warnings

import torch
from vllm import LLM, SamplingParams

2025-01-24 17:42:49,382	INFO util.py:124 -- Outdated packages:
  ipywidgets==7.7.1 found, needs ipywidgets>=8
Run `pip install -U ipywidgets`, then restart the notebook server for rich notebook output.


In [10]:
warnings.simplefilter('ignore')

os.environ["CUDA_VISIBLE_DEVICES"]   = "0,1,2,3"
os.environ["TOKENIZERS_PARALLELISM"] = "false"

def clean_memory(deep=False):
    gc.collect()
    if deep:
        ctypes.CDLL("libc.so.6").malloc_trim(0)
    torch.cuda.empty_cache()

In [11]:
llm_model_pth = '/kaggle/input/meta-llama-3.3-70b/transformers/ibnzterrell-instruct-awq-int4/1'

In [12]:
llm = LLM(
    llm_model_pth,
    dtype="half",                # The data type for the model weights and activations
    max_num_seqs=8,              # Maximum number of sequences per iteration. Default is 256
    max_model_len=4096,          # Model context length
    trust_remote_code=True,      # Trust remote code (e.g., from HuggingFace) when downloading the model and tokenizer
    tensor_parallel_size=4,      # The number of GPUs to use for distributed execution with tensor parallelism
    gpu_memory_utilization=0.97, # The ratio (between 0 and 1) of GPU memory to reserve for the model
)

INFO 01-24 17:43:16 awq_marlin.py:97] The model is convertible to awq_marlin during runtime. Using awq_marlin kernel.
INFO 01-24 17:43:16 config.py:905] Defaulting to use mp for distributed inference
INFO 01-24 17:43:16 llm_engine.py:237] Initializing an LLM engine (v0.6.3.post1) with config: model='/kaggle/input/meta-llama-3.3-70b/transformers/ibnzterrell-instruct-awq-int4/1', speculative_config=None, tokenizer='/kaggle/input/meta-llama-3.3-70b/transformers/ibnzterrell-instruct-awq-int4/1', skip_tokenizer_init=False, tokenizer_mode=auto, revision=None, override_neuron_config=None, rope_scaling=None, rope_theta=None, tokenizer_revision=None, trust_remote_code=True, dtype=torch.float16, max_seq_len=4096, download_dir=None, load_format=LoadFormat.AUTO, tensor_parallel_size=4, pipeline_parallel_size=1, disable_custom_all_reduce=False, quantization=awq_marlin, enforce_eager=False, kv_cache_dtype=auto, quantization_param_path=None, device_config=cuda, decoding_config=DecodingConfig(guided_d

Loading safetensors checkpoint shards:   0% Completed | 0/9 [00:00<?, ?it/s]


[1;36m(VllmWorkerProcess pid=354)[0;0m INFO 01-24 17:47:44 model_runner.py:1067] Loading model weights took 9.3162 GB
[1;36m(VllmWorkerProcess pid=356)[0;0m INFO 01-24 17:47:44 model_runner.py:1067] Loading model weights took 9.3162 GB
INFO 01-24 17:47:44 model_runner.py:1067] Loading model weights took 9.3162 GB
[1;36m(VllmWorkerProcess pid=355)[0;0m INFO 01-24 17:47:44 model_runner.py:1067] Loading model weights took 9.3162 GB
INFO 01-24 17:47:51 distributed_gpu_executor.py:57] # GPU blocks: 9489, # CPU blocks: 3276
INFO 01-24 17:47:51 distributed_gpu_executor.py:61] Maximum concurrency for 4096 tokens per request: 37.07x
INFO 01-24 17:47:55 model_runner.py:1395] Capturing the model for CUDA graphs. This may lead to unexpected consequences if the model is not static. To run the model in eager mode, set 'enforce_eager=True' or use '--enforce-eager' in the CLI.
[1;36m(VllmWorkerProcess pid=355)[0;0m INFO 01-24 17:47:55 model_runner.py:1399] CUDA graphs can take additional 1~3 G

In [13]:
sampling_params = SamplingParams(
    temperature=0.3,              # randomness of the sampling
    seed=1,                       # Seed for reprodicibility
    skip_special_tokens=True,     # Whether to skip special tokens in the output.
)

msgs = [
    {"role": "user", "content": "Hello!"}
]

response = llm.chat(msgs, sampling_params, use_tqdm=False)

print(response[0].outputs[0].text)

Hello! It's nice to meet you. Is there something I can help you


In [14]:
# del llm

# clean_memory(deep=True)

In [15]:
sampling_params = SamplingParams(
    temperature=0.3,              # randomness of the sampling
    seed=1,
    max_tokens=1024*8,# Seed for reprodicibility
    skip_special_tokens=True,     # Whether to skip special tokens in the output.
)

msgs = [
    {"role": "user", "content": '''
ফুডপান্ডা হলো অনলাইনে খাবার অর্ডার করার একধরনের ব্র্যান্ড বা কোম্পানি। এটি ডেলিভারি হিরো এর মালিকানাধীন একটি অনলাইন খাদ্য এবং মুদি বিতরণ প্ল্যাটফর্ম ব্র্যান্ড। এটির প্রধান সদরদপ্তর জার্মানির বার্লিন শহরে অবস্থিত এবং চারটি মহাদেশ জুড়ে প্রায় ৫০ টি দেশে ২০ টি ব্র্যান্ডের সাথে এটি কাজ করে। ২০১৬ সালের ডিসেম্বরে জার্মানির ডেলিভারি হিরো নামক প্রতিষ্ঠানটি ফুডপান্ডা গ্রুপকে কিনে নেয় এবং বর্তমানে এটি তাদের দ্বারাই পরিচালিত হয়ে থাকে। ফুডপান্ডা বর্তমানে চীনের বাইরে এশিয়ার বৃহত্তম খাদ্য ও মুদি সরবরাহের প্ল্যাটফর্ম। দ্য ফুডপান্ডা গ্রুপ ২০১২ সালে রালফ ওয়েনজেল, রোহিত চাড্ডা, বেন বাউয়ের এবং ফেলিক্স প্লগ এর দ্বারা প্রতিষ্ঠা লাভ করে। লুকাস নাজেল ও রিকু ওয়েডার এর মাধ্যমে ফুডপান্ডার সিঙ্গাপুরে ব্যবসা শুরু হয়। ২০১৪ এর ফেব্রুয়ারিতে ফুডপান্ডা তাদের প্রতিদ্বন্দ্বী পাকিস্তানি ইট অই কে কিনে নেয়। ২০১৬ সালের নভেম্বরে কোম্পানিটি তাদের ডেলিভারি ক্লাবে বিজনেস ১০০ মিলিয়ন ডলারের বিনিময়ে রাশিয়ার মেইল ডট আরইউ কে বিক্রি করে দেয়। এবং ২০১৬ সালের ডিসেম্বরে দ্য ফুডপান্ডা গ্রুপকে ডেলিভারি হিরো নামক প্রতিষ্ঠান কিনে নেয়। ২০১৭ সালের ডিসেম্বরে ওলা ক্যাবস কর্তৃক ভারতে ফুডপান্ডার ব্যবসা প্রতিষ্ঠিত হয়। বর্তমানে কোম্পানিটির মূলধন ৩১৮ মিলিয়ন ডলারে পৌঁছেছে। ২০১৩ সালের এপ্রিলে ফুডপান্ডাকে শুরুর দিকে ২০ মিলিয়ন ডলার অর্থায়ন করে ইনভেস্টমেন্ট এবি কিনেভিক, পেনোমেন ভেঞ্চার এবং রকেট ইন্টারনেট কোম্পানিত্রয়। ২০১৩ সালের সেপ্টেম্বরে আইএমইএনএ নামক কোম্পানিও ফুডপান্ডাকে ব্যবসায়িক কাজে ৮ মিলিয়ন ডলার অর্থায়ন করে। ২০১৪ সালের ফেব্রুয়ারিতেও গ্রুপ অব ইনভেস্টর এবং পেনোমেন ভেঞ্চার থেকেও ২০ মিলিয়নের অধিক অর্থায়ন আসে। একই বছরের আগস্টের ১১ তারিখে ফুডপান্ডা ঘোষণা করে যে গ্রুপ অব ইনভেস্টর থেকে আরও ৬০ মিলিয়ন ডলারের অর্থ সাহায্য আসে। এছাড়াও কোম্পানিটি পরবর্তীতে আরও বিভিন্ন অর্থ বিনিয়োগকারী সংস্থা হতে অর্থ সাহায্য নেয়। ২০১৭ সালের ১ নভেম্বর ফুডপান্ডা তাদের লোগো কমলা রঙ থেকে পরিবর্তন করে বর্তমান সংস্করণ গোলাপি রঙে হালনাগাদ করে। ফুডপান্ডার মূল ব্র্যান্ড ডেলিভারি হিরো তাদের লোগোতে পরিবর্তন আনার পর, ফুড পান্ডার লোগোতেও পরিবর্তন করা হয়। কোম্পানি অনুযায়ী তাদের নতুন লোগোটি পূর্বের তুলনায় আরও স্মরণীয় হবে বলে মনে করেন তারা। ফুডপান্ডার আরেকটি সহযোগী কোম্পানি হচ্ছে ফুডুরা, যেটির অনুকরণেই বর্তমান লোগো ডিজাইন করা হয়েছে।


Question: কোম্পানি অনুযায়ী তাদের নতুন লোগোটি পূর্বের তুলনায় আরও স্মরণীয় হবে বলে কেন মনে করেন তারা?

Thought Process**: Start by explaining your step-by-step reasoning for solving the task. 
After explaining the derivation process, write "End of thought process"
After that you will answer,
Contextual Answer: {Provide the answer in Bengali based on the given context only. Do not include any external knowledge. Do not need for your own knowledge base to answer this}
Parametric Answer: {Provide the answer in Bengali based on your pre-trained knowledge only. Do not reference the context.}
'''
    
    }
]

response = llm.chat(msgs, sampling_params, use_tqdm=False)

print(response[0].outputs[0].text)

কোম্পানি অনুযায়ী তাদের নতুন লোগোটি পূর্বের তুলনায় আরও স্মরণীয় হবে বলে মনে করেন তারা কারণ তারা মনে করেন যে নতুন লোগোটি আরও সহজে স্মরণ করা যাবে এবং গ্রাহকদের কাছে আরও আকর্ষণীয় হবে। তারা মনে করেন যে নতুন লোগোটি তাদের ব্র্যান্ডের পরিচয় এবং মূল্যবোধকে আরও ভালোভাবে প্রকাশ করবে।

End of thought process

Contextual Answer: কোম্পানি অনুযায়ী তাদের নতুন লোগোটি পূর্বের তুলনায় আরও স্মরণীয় হবে বলে মনে করেন তারা কারণ তারা মনে করেন যে নতুন লোগোটি আরও সহজে স্মরণ করা যাবে এবং গ্রাহকদের কাছে আরও আকর্ষণীয় হবে।

Parametric Answer: কোম্পানি অনুযায়ী তাদের নতুন লোগোটি পূর্বের তুলনায় আরও স্মরণীয় হবে বলে মনে করেন তারা কারণ এটি তাদের ব্র্যান্ডের পরিচয় এবং মূল্যবোধকে আরও ভালোভাবে প্রকাশ করবে।


In [16]:
tokenizer = llm.get_tokenizer()

In [17]:
input_text = "What is the capital of France?"

# Generate output
output = llm.generate(input_text)

# Decode the output
decoded_output = output[0].outputs[0].text

print("Model Output:", decoded_output)

Processed prompts: 100%|██████████| 1/1 [00:00<00:00,  1.13it/s, est. speed input: 9.02 toks/s, output: 18.04 toks/s]

Model Output:  It is France’s largest city and a global center for art, fashion, gastr





In [18]:
from collections import Counter
import re
import vllm

# Function to interact with the model
def generate_response(messages, stop_sequences=None, start_sequence=None):
    sampling_params = vllm.SamplingParams(
        temperature=0.1,
        top_p=0.1,
        repetition_penalty=1.02,
        max_tokens=1500,
        stop=stop_sequences,
        include_stop_str_in_output=True,
    )
    # Prepare the prompt
    prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    if start_sequence:
        prompt += start_sequence
    
    # Generate output
    output = llm.generate([prompt], sampling_params, use_tqdm=False)
    response = output[0].outputs[0].text
    
    if start_sequence:
        response = start_sequence + response
    return response

# Example of extracting structured information
def extract_information(response):
    # Example pattern to extract structured information
    pattern = r"Answer:\s*(.+)"
    match = re.search(pattern, response)
    return match.group(1).strip() if match else "No answer found."

# Usage with chain of thoughts prompting
def interact_with_model(user_message: str):
    messages = [
        {"role": "system","content": '''You are tasked with generating both parametric and contextual answers based on a Bengali context.

Contextual Answer:
Derive strictly from the given context. If the context lacks sufficient info, reply: "Context does not provide enough information."

Parametric Answer:
Use pre-trained knowledge only; do not refer to the context. If information is missing, make reasonable assumptions and state them. If not possible, reply: "None."

Key Note:
In the context, a word, year, or number might be incorrect. However, you must extract contextual answers as given in the context, even if it is wrong.
On the contrary, you should answer parametric answers correctly while correcting error of context based on your knowledge.

Thought Process:
Think step by step to ensure clarity.
Explain how the contextual and parametric answers were derived.
After explaining the derivation process, make sure to write "end of thought process" and then provide your response.

Response Format:
Contextual Answer: {Answer based only on the context.}
Parametric Answer: {Answer based on knowledge without referencing the context.}
Reasoning: Explain how both answers were derived step by step.

Example:

Context: "বাংলাদেশের রাজধানী চট্টগ্রাম।"
Question: "বাংলাদেশের রাজধানীর নাম কী?"
Output that you will generate:
Reasoning:

The context explicitly states the capital is Chattogram, so the contextual answer is "চট্টগ্রাম।"
Based on my knowledge, the capital is Dhaka, correcting the error in the context.

End of thought process

Contextual Answer: "চট্টগ্রাম।"
Parametric Answer: "ঢাকা।"

'''},
        {"role": "user", "content": user_message},
    ]
    response = generate_response(messages)
    structured_info = extract_information(response)
    fresponse = f"Output:\n{response}\nExplanation:\n{structured_info}"
    return fresponse

# Example input with Chain of Thoughts prompting
user_input = '''Here is some context:
বাস্কেটবল অত্যন্ত জনপ্রিয় খেলা হিসেবে বিশ্বব্যাপী পরিচিত। গোলাকৃতি, কমলা রঙের বল দিয়ে অভ্যন্তরীণ এবং বহিঃস্থ - উভয় প্রকার মাঠেই খেলা হয়ে থাকে। দলগত ক্রীড়া হিসেবে বাস্কেটবলের মূল উদ্দেশ্য হচ্ছে কোর্টে উলম্বভাবে স্থাপিত একটি বাস্কেট বা ঝুড়িতে বল নিক্ষেপের মাধ্যমে পয়েন্ট সংগ্রহ করা। নির্দিষ্ট আইন-কানুন অনুসরণ করে সর্বাধিক পয়েন্ট সংগ্রহকারী দল খেলায় বিজয়ী ঘোষিত হয়। সাধারণতঃ প্রত্যেক দলে ৯ জন খেলোয়াড় থাকে। চতুর্ভূজ আকৃতির বাস্কেটবল কোর্টের উভয় দিকের শেষ প্রান্তে বাস্কেট ঝুলিয়ে রাখা হয় যা রিম নামে পরিচিত। বাস্কেটবল খেলার প্রধান উপকরণ হিসেবে বলকেও বাস্কেটবল নামে আখ্যায়িত করা হয়।


Question: বাস্কেটবল খেলায় প্রত্যেক দলে কতজন খেলোয়াড় থাকে ?

Thought Process**: Start by explaining your step-by-step reasoning for solving the task. 
After explaining the derivation process, write "End of thought process"
After that you will answer,
Contextual Answer: {Provide the answer in Bengali based on the given context only. Do not include any external knowledge. Do not need for your own knowledge base to answer this}
Parametric Answer: {Provide the answer in Bengali based on your pre-trained knowledge only. Do not reference the context.}'''

print(interact_with_model(user_input))


Output:
বাস্কেটবল খেলায় প্রত্যেক দলে কতজন খেলোয়াড় থাকে তা নির্ধারণ করার জন্য, আমাকে প্রদত্ত পাঠ্যটি পরীক্ষা করতে হবে। পাঠ্যটিতে বলা হয়েছে, "সাধারণতঃ প্রত্যেক দলে ৯ জন খেলোয়াড় থাকে"। এটি আমাকে প্রস্তাব করে যে প্রতিটি দলে ৯ জন খেলোয়াড় রয়েছে। যাইহোক, আমার পূর্বশিক্ষিত জ্ঞান অনুসারে, একটি বাস্কেটবল দলে সাধারণত ৫ জন খেলোয়াড় থাকে।

এখন, প্রশ্নের উত্তর দেওয়ার জন্য, আমাকে প্রসঙ্গ এবং পরামিতি উত্তর আলাদা করতে হবে। প্রসঙ্গ উত্তর হবে প্রদত্ত পাঠ্যের উপর ভিত্তি করে, যা ৯ জন খেলোয়াড়। পরামিতি উত্তর হবে আমার পূর্বশিক্ষিত জ্ঞানের উপর ভিত্তি করে, যা ৫ জন খেলোয়াড়।

End of thought process

Contextual Answer: ৯ জন খেলোয়াড়
Parametric Answer: ৫ জন খেলোয়াড়
Explanation:
৯ জন খেলোয়াড়


In [19]:
resultlst = []
p = 1

In [20]:
lst = [None]*47
resultlst = []

In [21]:
starting = 150
ending = 300

In [22]:
import tqdm
for p in tqdm.tqdm(range(starting,ending)):
    question, context = new_dataframe['Question'].iloc[p].split("Context:")
    question = question.lstrip("Question:").strip("\n")
    context = context.strip("<p>").strip("</p>").strip()

    user_input = f'''Here is some context:
{context}

Question: {question}


Thought Process**: Start by explaining your step-by-step reasoning for solving the task. 
After explaining the derivation process, write "End of thought process"
After that you will answer,
Contextual Answer: {{Provide the answer in Bengali based on the given context only. Do not include any external knowledge. Do not need for your own knowledge base to answer this}}
Parametric Answer: {{Provide the answer in Bengali based on your pre-trained knowledge only. Do not reference the context.}}'''
    #print(user_input)
    print(p)
    modelresult = interact_with_model(user_input)
    resultlst.append({"Context":context, "Question":question, "Answer":new_dataframe['Answer'].iloc[p],"Predicted Answer":modelresult})
print(resultlst)

  0%|          | 0/150 [00:00<?, ?it/s]

150


  1%|          | 1/150 [00:21<52:09, 21.01s/it]

151


  1%|▏         | 2/150 [00:40<50:17, 20.39s/it]

152


  2%|▏         | 3/150 [01:02<50:53, 20.77s/it]

153


  3%|▎         | 4/150 [01:23<51:11, 21.04s/it]

154


  3%|▎         | 5/150 [01:45<51:14, 21.20s/it]

155


  4%|▍         | 6/150 [02:00<46:03, 19.19s/it]

156


  5%|▍         | 7/150 [02:15<42:50, 17.98s/it]

157


  5%|▌         | 8/150 [02:37<45:05, 19.06s/it]

158


  6%|▌         | 9/150 [02:58<46:28, 19.78s/it]

159


  7%|▋         | 10/150 [03:17<45:16, 19.40s/it]

160


  7%|▋         | 11/150 [03:44<50:54, 21.97s/it]

161


  8%|▊         | 12/150 [04:07<50:58, 22.16s/it]

162


  9%|▊         | 13/150 [04:32<52:16, 22.89s/it]

163


  9%|▉         | 14/150 [04:58<54:24, 24.00s/it]

164


 10%|█         | 15/150 [05:20<52:46, 23.46s/it]

165


 11%|█         | 16/150 [06:03<1:05:11, 29.19s/it]

166


 11%|█▏        | 17/150 [06:37<1:08:07, 30.74s/it]

167


 12%|█▏        | 18/150 [07:15<1:11:55, 32.70s/it]

168


 13%|█▎        | 19/150 [07:51<1:13:52, 33.84s/it]

169


 13%|█▎        | 20/150 [08:28<1:15:03, 34.64s/it]

170


 14%|█▍        | 21/150 [09:03<1:14:45, 34.77s/it]

171


 15%|█▍        | 22/150 [09:38<1:14:22, 34.86s/it]

172


 15%|█▌        | 23/150 [10:09<1:11:26, 33.75s/it]

173


 16%|█▌        | 24/150 [10:47<1:13:22, 34.94s/it]

174


 17%|█▋        | 25/150 [11:20<1:11:46, 34.45s/it]

175


 17%|█▋        | 26/150 [11:54<1:10:51, 34.29s/it]

176


 18%|█▊        | 27/150 [12:28<1:10:05, 34.19s/it]

177


 19%|█▊        | 28/150 [13:02<1:09:35, 34.22s/it]

178


 19%|█▉        | 29/150 [13:36<1:08:34, 34.01s/it]

179


 20%|██        | 30/150 [14:09<1:07:55, 33.96s/it]

180


 21%|██        | 31/150 [14:31<59:48, 30.15s/it]  

181


 21%|██▏       | 32/150 [14:52<54:03, 27.49s/it]

182


 22%|██▏       | 33/150 [15:17<52:18, 26.83s/it]

183


 23%|██▎       | 34/150 [15:42<50:26, 26.09s/it]

184


 23%|██▎       | 35/150 [16:05<48:15, 25.18s/it]

185


 24%|██▍       | 36/150 [16:30<48:08, 25.34s/it]

186


 25%|██▍       | 37/150 [17:04<52:15, 27.75s/it]

187


 25%|██▌       | 38/150 [17:36<54:23, 29.14s/it]

188


 26%|██▌       | 39/150 [18:30<1:07:55, 36.72s/it]

189


 27%|██▋       | 40/150 [19:01<1:04:07, 34.98s/it]

190


 27%|██▋       | 41/150 [19:36<1:03:07, 34.75s/it]

191


 28%|██▊       | 42/150 [20:18<1:06:34, 36.98s/it]

192


 29%|██▊       | 43/150 [20:58<1:07:35, 37.90s/it]

193


 29%|██▉       | 44/150 [21:26<1:01:59, 35.09s/it]

194


 30%|███       | 45/150 [21:44<52:29, 30.00s/it]  

195


 31%|███       | 46/150 [22:08<48:33, 28.01s/it]

196


 31%|███▏      | 47/150 [22:21<40:21, 23.51s/it]

197


 32%|███▏      | 48/150 [22:41<38:13, 22.49s/it]

198


 33%|███▎      | 49/150 [23:22<47:20, 28.12s/it]

199


 33%|███▎      | 50/150 [24:38<1:10:54, 42.54s/it]

200


 34%|███▍      | 51/150 [25:00<59:34, 36.10s/it]  

201


 35%|███▍      | 52/150 [25:25<53:52, 32.98s/it]

202


 35%|███▌      | 53/150 [25:52<50:20, 31.14s/it]

203


 36%|███▌      | 54/150 [26:21<48:35, 30.37s/it]

204


 37%|███▋      | 55/150 [26:55<49:57, 31.55s/it]

205


 37%|███▋      | 56/150 [27:07<40:15, 25.70s/it]

206


 38%|███▊      | 57/150 [27:28<37:27, 24.16s/it]

207


 39%|███▊      | 58/150 [27:43<32:56, 21.49s/it]

208


 39%|███▉      | 59/150 [28:01<31:02, 20.47s/it]

209


 40%|████      | 60/150 [28:31<35:08, 23.43s/it]

210


 41%|████      | 61/150 [29:14<43:26, 29.29s/it]

211


 41%|████▏     | 62/150 [29:25<34:55, 23.82s/it]

212


 42%|████▏     | 63/150 [29:36<28:55, 19.95s/it]

213


 43%|████▎     | 64/150 [29:53<27:16, 19.03s/it]

214


 43%|████▎     | 65/150 [30:09<25:51, 18.25s/it]

215


 44%|████▍     | 66/150 [31:00<39:17, 28.06s/it]

216


 45%|████▍     | 67/150 [31:25<37:14, 26.92s/it]

217


 45%|████▌     | 68/150 [31:56<38:38, 28.27s/it]

218


 46%|████▌     | 69/150 [32:29<40:05, 29.70s/it]

219


 47%|████▋     | 70/150 [33:13<45:05, 33.82s/it]

220


 47%|████▋     | 71/150 [33:47<44:56, 34.13s/it]

221


 48%|████▊     | 72/150 [34:23<44:51, 34.51s/it]

222


 49%|████▊     | 73/150 [35:08<48:17, 37.63s/it]

223


 49%|████▉     | 74/150 [35:53<50:34, 39.93s/it]

224


 50%|█████     | 75/150 [36:27<47:41, 38.16s/it]

225


 51%|█████     | 76/150 [37:02<45:46, 37.12s/it]

226


 51%|█████▏    | 77/150 [37:43<46:45, 38.43s/it]

227


 52%|█████▏    | 78/150 [38:26<47:35, 39.66s/it]

228


 53%|█████▎    | 79/150 [39:32<56:29, 47.74s/it]

229


 53%|█████▎    | 80/150 [40:36<1:01:14, 52.50s/it]

230


 54%|█████▍    | 81/150 [41:16<55:54, 48.62s/it]  

231


 55%|█████▍    | 82/150 [41:51<50:43, 44.76s/it]

232


 55%|█████▌    | 83/150 [42:29<47:29, 42.52s/it]

233


 56%|█████▌    | 84/150 [43:17<48:47, 44.36s/it]

234


 57%|█████▋    | 85/150 [44:11<50:58, 47.05s/it]

235


 57%|█████▋    | 86/150 [44:55<49:16, 46.19s/it]

236


 58%|█████▊    | 87/150 [45:46<50:00, 47.62s/it]

237


 59%|█████▊    | 88/150 [46:38<50:45, 49.12s/it]

238


 59%|█████▉    | 89/150 [47:11<44:54, 44.18s/it]

239


 60%|██████    | 90/150 [47:46<41:28, 41.47s/it]

240


 61%|██████    | 91/150 [48:20<38:35, 39.24s/it]

241


 61%|██████▏   | 92/150 [49:13<42:00, 43.46s/it]

242


 62%|██████▏   | 93/150 [49:36<35:25, 37.28s/it]

243


 63%|██████▎   | 94/150 [50:04<32:08, 34.43s/it]

244


 63%|██████▎   | 95/150 [50:24<27:36, 30.11s/it]

245


 64%|██████▍   | 96/150 [50:47<25:11, 27.98s/it]

246


 65%|██████▍   | 97/150 [51:45<32:41, 37.01s/it]

247


 65%|██████▌   | 98/150 [52:10<28:47, 33.22s/it]

248


 66%|██████▌   | 99/150 [52:46<29:04, 34.21s/it]

249


 67%|██████▋   | 100/150 [53:22<28:59, 34.78s/it]

250


 67%|██████▋   | 101/150 [54:09<31:20, 38.37s/it]

251


 68%|██████▊   | 102/150 [55:00<33:39, 42.08s/it]

252


 69%|██████▊   | 103/150 [55:14<26:24, 33.71s/it]

253


 69%|██████▉   | 104/150 [55:45<25:19, 33.03s/it]

254


 70%|███████   | 105/150 [57:00<34:14, 45.65s/it]

255


 71%|███████   | 106/150 [58:01<36:42, 50.06s/it]

256


 71%|███████▏  | 107/150 [58:18<28:48, 40.19s/it]

257


 72%|███████▏  | 108/150 [58:36<23:24, 33.45s/it]

258


 73%|███████▎  | 109/150 [59:17<24:24, 35.72s/it]

259


 73%|███████▎  | 110/150 [59:53<24:00, 36.02s/it]

260


 74%|███████▍  | 111/150 [1:00:50<27:23, 42.14s/it]

261


 75%|███████▍  | 112/150 [1:01:16<23:33, 37.19s/it]

262


 75%|███████▌  | 113/150 [1:01:53<23:04, 37.42s/it]

263


 76%|███████▌  | 114/150 [1:03:06<28:42, 47.86s/it]

264
265
266
267
268
269
270
271


 81%|████████▏ | 122/150 [1:03:25<05:55, 12.71s/it]

272


 82%|████████▏ | 123/150 [1:03:49<06:17, 13.99s/it]

273


 83%|████████▎ | 124/150 [1:04:04<06:09, 14.20s/it]

274


 83%|████████▎ | 125/150 [1:04:20<06:04, 14.57s/it]

275


 84%|████████▍ | 126/150 [1:04:40<06:15, 15.66s/it]

276


 85%|████████▍ | 127/150 [1:05:12<07:22, 19.22s/it]

277


 85%|████████▌ | 128/150 [1:05:58<09:25, 25.68s/it]

278


 86%|████████▌ | 129/150 [1:06:38<10:13, 29.19s/it]

279


 87%|████████▋ | 130/150 [1:07:36<12:18, 36.90s/it]

280


 87%|████████▋ | 131/150 [1:08:11<11:33, 36.52s/it]

281


 88%|████████▊ | 132/150 [1:08:53<11:24, 38.02s/it]

282


 89%|████████▊ | 133/150 [1:09:44<11:48, 41.69s/it]

283


 89%|████████▉ | 134/150 [1:10:22<10:52, 40.80s/it]

284


 90%|█████████ | 135/150 [1:11:08<10:34, 42.31s/it]

285


 91%|█████████ | 136/150 [1:12:07<11:00, 47.20s/it]

286


 91%|█████████▏| 137/150 [1:12:52<10:03, 46.39s/it]

287


 92%|█████████▏| 138/150 [1:13:34<09:04, 45.36s/it]

288


 93%|█████████▎| 139/150 [1:14:18<08:13, 44.89s/it]

289


 93%|█████████▎| 140/150 [1:15:00<07:19, 43.99s/it]

290


 94%|█████████▍| 141/150 [1:15:43<06:31, 43.53s/it]

291


 95%|█████████▍| 142/150 [1:16:24<05:43, 42.98s/it]

292


 95%|█████████▌| 143/150 [1:17:18<05:23, 46.16s/it]

293


 96%|█████████▌| 144/150 [1:17:37<03:49, 38.20s/it]

294


 97%|█████████▋| 145/150 [1:18:07<02:57, 35.57s/it]

295


 97%|█████████▋| 146/150 [1:18:58<02:41, 40.27s/it]

296


 98%|█████████▊| 147/150 [1:20:00<02:20, 46.84s/it]

297


 99%|█████████▊| 148/150 [1:21:15<01:50, 55.21s/it]

298


 99%|█████████▉| 149/150 [1:21:27<00:42, 42.22s/it]

299


100%|██████████| 150/150 [1:21:54<00:00, 32.76s/it]

[{'Context': 'বৃহস্পতি গ্রহ সূর্য থেকে দূরত্বের দিক দিয়ে একাদশ এবং আকার আয়তনের দিক দিয়ে সৌরজগতের বৃহত্তম গ্রহ। বৃহস্পতি ব্যতীত সৌর জগতের বাকি সবগুলো গ্রহের ভরকে একত্র করলে বৃহস্পতির ভর তা থেকে আড়াই গুণ বেশি হবে। বৃহস্পতিসহ আরও তিনটি গ্রহ অর্থাৎ শনি, ইউরেনাস এবং নেপচুনকে একসাথে গ্যাস দানব বলা হয়। এই চারটির অপর জনপ্রিয় নাম হচ্ছে জোভিয়ান গ্রহ। জোভিয়ান শব্দটি জুপিটার শব্দের বিশেষণ রুপ। জুপিটারের গ্রিক প্রতিশব্দ হিসেবে ব্যবহৃত হয় জিউস। এই জিউস থেকেই জেনো- মূলটি উৎপত্তি লাভ করেছে। এই মূল দ্বারা বেশ কিছু জুপিটার তথা বৃহস্পতি গ্রহ সংশ্লিষ্ট শব্দের সৃষ্টি হয়েছে। যেমন: জেনোগ্রাফিক। পৃথিবী থেকে দেখলে বৃহস্পতির আপাত মান পাওয়া যায় ২.৮। এটি পৃথিবীর আকাশে দৃশ্যমান তৃতীয় উজ্জ্বল জ্যোতিষ্ক। কেবল চাঁদ এবং শুক্র গ্রহের উজ্জ্বলতা এর থেকে বেশি। অবশ্য কক্ষপথের কিছু বিন্দুতে মঙ্গল গ্রহের উজ্জ্বলতা বৃহস্পতির চেয়ে বেশি হয়ে থাকে। সুপ্রাচীনকাল থেকেই গ্রহটি জ্যোতির্বিজ্ঞানী ও জ্যোতিষীদের কাছে পরিচিত ছিল। বিভিন্ন সংস্কৃতির প্রচুর পৌরাণিক কাহিনী এবং ধর্মীয় বিশ্বাসও আবর্তিত হয়েছে বৃহস্পতিকে কেন্দ্র 




In [23]:
resultlst[0]

{'Context': 'বৃহস্পতি গ্রহ সূর্য থেকে দূরত্বের দিক দিয়ে একাদশ এবং আকার আয়তনের দিক দিয়ে সৌরজগতের বৃহত্তম গ্রহ। বৃহস্পতি ব্যতীত সৌর জগতের বাকি সবগুলো গ্রহের ভরকে একত্র করলে বৃহস্পতির ভর তা থেকে আড়াই গুণ বেশি হবে। বৃহস্পতিসহ আরও তিনটি গ্রহ অর্থাৎ শনি, ইউরেনাস এবং নেপচুনকে একসাথে গ্যাস দানব বলা হয়। এই চারটির অপর জনপ্রিয় নাম হচ্ছে জোভিয়ান গ্রহ। জোভিয়ান শব্দটি জুপিটার শব্দের বিশেষণ রুপ। জুপিটারের গ্রিক প্রতিশব্দ হিসেবে ব্যবহৃত হয় জিউস। এই জিউস থেকেই জেনো- মূলটি উৎপত্তি লাভ করেছে। এই মূল দ্বারা বেশ কিছু জুপিটার তথা বৃহস্পতি গ্রহ সংশ্লিষ্ট শব্দের সৃষ্টি হয়েছে। যেমন: জেনোগ্রাফিক। পৃথিবী থেকে দেখলে বৃহস্পতির আপাত মান পাওয়া যায় ২.৮। এটি পৃথিবীর আকাশে দৃশ্যমান তৃতীয় উজ্জ্বল জ্যোতিষ্ক। কেবল চাঁদ এবং শুক্র গ্রহের উজ্জ্বলতা এর থেকে বেশি। অবশ্য কক্ষপথের কিছু বিন্দুতে মঙ্গল গ্রহের উজ্জ্বলতা বৃহস্পতির চেয়ে বেশি হয়ে থাকে। সুপ্রাচীনকাল থেকেই গ্রহটি জ্যোতির্বিজ্ঞানী ও জ্যোতিষীদের কাছে পরিচিত ছিল। বিভিন্ন সংস্কৃতির প্রচুর পৌরাণিক কাহিনী এবং ধর্মীয় বিশ্বাসও আবর্তিত হয়েছে বৃহস্পতিকে কেন্দ্র ক

In [24]:
df = pd.DataFrame(resultlst)

# Save DataFrame as CSV
output_path = "/kaggle/working/resultlst.csv"
df.to_csv(output_path, index=False)

output_path

'/kaggle/working/resultlst.csv'