## SYED MUHAMMAD HAMZA
# Problem 1

In [5]:
# For simple approach I used a difflib python library to get lcs lengths
from difflib import SequenceMatcher

def lcs_length(s1, s2):
    matcher = SequenceMatcher(None, s1, s2)
    match = matcher.find_longest_match(0, len(s1), 0, len(s2))
    return match.size

In [6]:
# Here I have used dynamic programming techniques to find lcs Length
# Function for calculating longest common subsequence length of 2 sentences s1 and s2 are 2 strings to check
def lcs_length(s1, s2):
    m = len(s1)
    n = len(s2)

    # Create a table to compare and store len of the common characters 
    table = [[0] * (n + 1) for _ in range(m + 1)]

    # Building the LCS table in a bottom-up manner
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if s1[i - 1] == s2[j - 1]:
                table[i][j] = table[i - 1][j - 1] + 1
            else:
                table[i][j] = max(table[i - 1][j], table[i][j - 1])

    return table[m][n]

In [7]:
# To show better output of the results I used pandas
import pandas as pd

def read_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        sentences = [line.strip() for line in file.readlines() if line.strip()]
    return sentences

def main():
    file_path = 'FOR_LCS.txt'
    sentences = read_file(file_path)
    print(sentences)
    num_sentences = 20

    # Create a pandas DataFrame to store the LCS lengths
    data = []
    columns = ["Sentence " + str(i+1) for i in range(num_sentences)]

    # Traversing the sentences in the txt file one by one
    for i in range(num_sentences):
        row = []
        for j in range(num_sentences):
            lcs_lengths = lcs_length(sentences[i], sentences[j])
            row.append(lcs_lengths)
        data.append(row)

    df = pd.DataFrame(data, columns=columns, index=columns)
    print(df)

if __name__ == "__main__":
    main()


['کیا آپ نے ساری چیزیں رکھی ہیں', 'بدتمیزی نہ کریں', 'یہ کپڑے استری کریں', 'ایک کپ چائے بنادیں', 'آپ کے استاد صاحب آ چکے ہیں', 'جائیں جا کر پڑھیے', 'میں بہت تھکا ہوا ہوں', 'مجھے سونے دو', 'آج پھر آپ کے ٹیچر نے شکایت کی ہے', 'آپ نے سبق یاد نہیں کیا', 'کچن میں آکر بھی تھوڑی مدد کردیں', 'ناشتہ جلدی سے ختم کرو', 'آپ کی گاری آگئی ہے', 'آپ ہر وقت موبائل استعمال کرتے رہتے ہیں', 'کیا آپ نے نماز ادا کرلی', 'گھر کا خیال رکھنا', 'میں بس تھوڑی دیر میں آتا ہوں', 'میں شدید سر درد میں مبتلا ہوں', 'میرے سر میں شدید درد ہو رہا ہے', 'آپ کا فون مسلسل بج رہا ہے', 'آپ فون کیوں نہیں اٹھا رہے ہیں', 'مجھے اس ماہ کے آخر میں تنخواہ ملے گی', 'کیا یہ ڈرامہ دوبارہ ٹیلی کاسٹ کیا جا رہا ہے', 'آپ ذیابیطس کے مریض ہیں', 'دن بدن وہ ضدی ہوتا جارہا ہے', 'صبح سے بجلی نہیں ہے', 'بچوں کے ساتھ بھی کچھ وقت گزارا کریں', 'آپ ہر وقت کام کرتے رہتے ہیں', 'آپ نے اپنی آنکھیں خراب کر لی ہیں ٹی وی دیکھ دیکھ کر', 'آپ نے آج پھر جھوٹ بولا', 'آپ نے پھر دوائی نہیں کھائی', 'ابھی تک سارے برتن گندے پڑے ہیں', 'میں ناشتہ بنانے ہی والا ہوں', 'ماس

In [11]:
import gradio as gr
from difflib import SequenceMatcher

# Here I have created a small interface using gradio to show the working of lcs finder method visually

# Interface to show the input and output fields
iface = gr.Interface(
    fn=lcs_length,
    inputs=["text", "text"],
    outputs="text",
    title="Longest Common Subsequence",
    description="Enter two strings to find the length of the Longest Common Subsequence (LCS) between them."
)

iface.launch(share=True)


Running on local URL:  http://127.0.0.1:7863
Running on public URL: https://974165c02e7707fd8c.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)


