In [1]:
import pandas as pd

def calculate_accuracy(correct_outputs, model_outputs):
    total = len(correct_outputs)
    matches = sum(1 for c, m in zip(correct_outputs, model_outputs) if c.strip() == m.strip())
    return (matches / total) * 100

# Define correct outputs
correct_outputs = [
    "අපි කඩේට යමු",
    "අපි උදේට කඩෙන් කමු",
    "මම අද ගෙදර යමි",
    "අපි හෙට ගමට යමු",
    "අපි හෙට නුවර යන්නෙමු",
    "මම දැන් වැවට යමි",
    "මම ඔයාට අදරය කරමි",
    "මම ඔයාගේ ගෙදර යමි",
    "අපි උත්සාහයෙන් වැඩ කරමු",
    "අපි කොහොමහරි දිනමු"
]

# Read the Excel files
llm_df = pd.read_excel('LLM.xlsx')
rag_df = pd.read_excel('RAG.xlsx')
rule_based_df = pd.read_excel('rule_based.xlsx')

# Calculate accuracies
llm_accuracy = calculate_accuracy(correct_outputs, llm_df['output'].tolist())
rag_accuracy = calculate_accuracy(correct_outputs, rag_df['output'].tolist())
rule_based_accuracy = calculate_accuracy(correct_outputs, rule_based_df['output'].tolist())

# Print results
print(f"Accuracy Scores:")
print(f"LLM Model: {llm_accuracy:.2f}%")
print(f"RAG Model: {rag_accuracy:.2f}%")
print(f"Rule-based Model: {rule_based_accuracy:.2f}%")

# Analyze errors
def print_errors(model_name, correct_outputs, model_outputs):
    print(f"\nErrors in {model_name}:")
    for i, (correct, model) in enumerate(zip(correct_outputs, model_outputs)):
        if correct.strip() != model.strip():
            print(f"Line {i+1}:")
            print(f"Expected: {correct}")
            print(f"Got     : {model}")
            print()

# Print errors for each model
print_errors("LLM Model", correct_outputs, llm_df['output'].tolist())
print_errors("RAG Model", correct_outputs, rag_df['output'].tolist())
print_errors("Rule-based Model", correct_outputs, rule_based_df['output'].tolist())

Accuracy Scores:
LLM Model: 70.00%
RAG Model: 60.00%
Rule-based Model: 90.00%

Errors in LLM Model:
Line 1:
Expected: අපි කඩේට යමු
Got     : අපි කඩේ යමු

Line 2:
Expected: අපි උදේට කඩෙන් කමු
Got     : අපි උදේට කඩෙන කමු

Line 3:
Expected: මම අද ගෙදර යමි
Got     : මම අද ගදර යමි


Errors in RAG Model:
Line 1:
Expected: අපි කඩේට යමු
Got     : අපි කඩේ යමු

Line 2:
Expected: අපි උදේට කඩෙන් කමු
Got     : අපි උදේට කඩේන් කමු

Line 5:
Expected: අපි හෙට නුවර යන්නෙමු
Got     : අපි හෙට නුවර යමු

Line 7:
Expected: මම ඔයාට අදරය කරමි
Got     : මම ඔයාට අදරය කරනවා 


Errors in Rule-based Model:
Line 1:
Expected: අපි කඩේට යමු
Got     : අපි කඩේ යමු

