In [1]:
import sys
import os
import json

# Add the parent directory of the package to sys.path
sys.path.append(os.path.abspath('.'))
from solver.refund_solver import Refund_Solver

# Create an instance of Portion_Solver
solver = Refund_Solver()

In [2]:
path = "training_dataset/training_refund.json"

In [3]:
with open(path, 'r') as file:
    data = json.load(file)

In [4]:
def extract_data(data, stype_values):
        extracted_data = []
        for item in data:
            # Check if the 'stype' key exists and its value matches one of the specified values in stype_values
            if 'stype' in item and item['stype'] == stype_values:
                extracted_data.append(item)
        return extracted_data

In [5]:
import pandas as pd
from collections import Counter
stype_combinations = [tuple(d["stype"]) for d in data]
combination_counts = Counter(stype_combinations)

# Convert to DataFrame for better visualization
combination_df = pd.DataFrame(combination_counts.items(), columns=['Combination', 'Count'])
combination_df = combination_df.sort_values(by='Count', ascending=False)

combination_df

Unnamed: 0,Combination,Count
1,"(每單位量, 量變, 量變, 問找回)",8
0,"(每單位量, 有, 量變, 問找回)",2
2,"(每單位量, 每單位量, 量變, 量變, 問找回)",2
3,"(量變, 量變, 問找回)",2
4,"(有, 量變, 量變, 問找回)",1


In [6]:
extracted_data = data

In [7]:
# stype_list=[
#     ["每單位量","量變","量變","問找回"],
#     ["量變","量變","問找回"],
#     ["每單位量","每單位量","量變","量變","問找回"],
# ]
# stype = stype_list[0]
# extracted_data = extract_data(data,stype)

In [8]:
len(extracted_data)

15

In [9]:
extracted_data[0]

{'qid': '52339',
 'sentence': '展覽會門票每人80元，全班33人買票入場，付3000元，應該找回多少元？',
 'quantities': {'s1': [{'qtyid': 'E1',
    'quantity': {'value': '80', 'unit': '元', 'entity': '門票'},
    'verb': None,
    'subject': None,
    'object': None},
   {'qtyid': 'E2',
    'quantity': {'value': '每', 'unit': None, 'entity': '人'},
    'verb': None,
    'subject': None,
    'object': None}],
  's2': [{'qtyid': 'E3',
    'quantity': {'value': '33', 'unit': None, 'entity': '人'},
    'verb': None,
    'subject': None,
    'object': None}],
  's3': [{'qtyid': 'E4',
    'quantity': {'value': '3000', 'unit': '元', 'entity': None},
    'verb': '付',
    'subject': None,
    'object': None}],
  's4': [{'qtyid': 'E5',
    'quantity': {'value': '多少', 'unit': '元', 'entity': '人'},
    'verb': '應該',
    'subject': None,
    'object': None},
   {'qtyid': 'E6',
    'quantity': {'value': '多少', 'unit': '元', 'entity': '人'},
    'verb': '找回',
    'subject': None,
    'object': None}]},
 'unitmaps': {'s1': [{'denominator': 'E1', 

In [10]:

wrong_case = []

correct_case = []
wrong = 0
correct = 0
unsolve  = 0

for i in range(0, len(extracted_data)):
    try:
        if solver.solve(extracted_data[i]):
            correct_case.append(extracted_data[i])
            correct+=1
        else:
            wrong_case.append(extracted_data[i])
            wrong+=1

    except:
        wrong_case.append((extracted_data[i]))
        wrong+=1

print(f"Problems:{len(extracted_data)}, Correct:{correct}, Wrong:{wrong}, Accuracy:{correct/len(extracted_data)} ")     
    

{'Question ID': '1MA0140466', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'付'得知，付了250塊錢。250為已付。蘋果5元為單位價格。將購買的量與單位價格相乘得到應付價格。40顆蘋果 * 5 = 200 (應付價格)。計算應買總價格=200。將已付減去應付總價極為所求。250 - 200 = 50。", 'Formula': '', 'My Answer': 50, 'Solution': '50元'}
{'Question ID': '1MA0140462', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'付'得知，付了2500塊錢。2500為已付。票100元為單位價格。將購買的量與單位價格相乘得到應付價格。20張票 * 100 = 2000 (應付價格)。計算應買總價格=2000。將已付減去應付總價極為所求。2500 - 2000 = 500。", 'Formula': '', 'My Answer': 500, 'Solution': '500元'}
{'Question ID': '52248', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'付'得知，付了2000塊錢。2000為已付。棒棒糖24元為單位價格。將購買的量與單位價格相乘得到應付價格。64枝棒棒糖 * 24 = 1536 (應付價格)。計算應買總價格=1536。將已付減去應付總價極為所求。2000 - 1536 = 464。", 'Formula': '', 'My Answer': 464, 'Solution': '464元'}
{'Question ID': '51837', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'拿'得知，付了1500塊錢。1500為已付。蛋糕26元為單位價格。蛋糕28元為單位價格。將購買的量與單位價格相乘得到應付價格。18個蛋糕 * 26 = 468 (應付價格)。23個蛋糕 * 26 = 5

In [11]:
correct_case

[{'qid': '1MA0140466',
  'sentence': '一顆蘋果5元，小明買了40顆，付了250元，可以找回多少元？',
  'quantities': {'s1': [{'qtyid': 'E1',
     'quantity': {'value': 1, 'unit': '顆', 'entity': '蘋果'},
     'verb': None,
     'subject': None,
     'object': None},
    {'qtyid': 'E2',
     'quantity': {'value': '5', 'unit': '元', 'entity': '蘋果'},
     'verb': None,
     'subject': None,
     'object': None}],
   's2': [{'qtyid': 'E3',
     'quantity': {'value': '40', 'unit': '顆', 'entity': '蘋果'},
     'verb': '買',
     'subject': '小明',
     'object': None}],
   's3': [{'qtyid': 'E4',
     'quantity': {'value': '250', 'unit': '元', 'entity': None},
     'verb': '付',
     'subject': '小明',
     'object': None}],
   's4': [{'qtyid': 'E5',
     'quantity': {'value': '?', 'unit': '元', 'entity': '蘋果'},
     'verb': '找回',
     'subject': '小明',
     'object': None}]},
  'unitmaps': {'s1': [{'denominator': 'E1', 'numerator': 'E2'}]},
  'answer': '50元',
  'stype': ['每單位量', '量變', '量變', '問找回']},
 {'qid': '1MA0140462',
  'sentence':

In [12]:
wrong_case

[{'qid': '52339',
  'sentence': '展覽會門票每人80元，全班33人買票入場，付3000元，應該找回多少元？',
  'quantities': {'s1': [{'qtyid': 'E1',
     'quantity': {'value': '80', 'unit': '元', 'entity': '門票'},
     'verb': None,
     'subject': None,
     'object': None},
    {'qtyid': 'E2',
     'quantity': {'value': 1, 'unit': None, 'entity': '人'},
     'verb': None,
     'subject': None,
     'object': None}],
   's2': [{'qtyid': 'E3',
     'quantity': {'value': '33', 'unit': None, 'entity': '人'},
     'verb': None,
     'subject': None,
     'object': None}],
   's3': [{'qtyid': 'E4',
     'quantity': {'value': '3000', 'unit': '元', 'entity': None},
     'verb': '付',
     'subject': None,
     'object': None}],
   's4': [{'qtyid': 'E5',
     'quantity': {'value': '?', 'unit': '元', 'entity': '人'},
     'verb': '應該',
     'subject': None,
     'object': None},
    {'qtyid': 'E6',
     'quantity': {'value': '?', 'unit': '元', 'entity': '人'},
     'verb': '找回',
     'subject': None,
     'object': None}]},
  'unitmaps': {

In [13]:
wrong_case[1]

{'qid': '51837',
 'sentence': '一個草莓蛋糕26元，一個巧克力蛋糕28元，阿姨拿1500元，買了18個草莓蛋糕和23個巧克力蛋糕，應該找回多少元？',
 'quantities': {'s1': [{'qtyid': 'E1',
    'quantity': {'value': 1, 'unit': '個', 'entity': '蛋糕'},
    'verb': None,
    'subject': None,
    'object': None},
   {'qtyid': 'E2',
    'quantity': {'value': '26', 'unit': '元', 'entity': '蛋糕'},
    'verb': None,
    'subject': None,
    'object': None}],
  's2': [{'qtyid': 'E3',
    'quantity': {'value': 1, 'unit': '個', 'entity': '蛋糕'},
    'verb': None,
    'subject': None,
    'object': None},
   {'qtyid': 'E4',
    'quantity': {'value': '28', 'unit': '元', 'entity': '蛋糕'},
    'verb': None,
    'subject': None,
    'object': None}],
  's3': [{'qtyid': 'E5',
    'quantity': {'value': '1500', 'unit': '元', 'entity': '蛋糕'},
    'verb': '拿',
    'subject': '阿姨',
    'object': None}],
  's4': [{'qtyid': 'E6',
    'quantity': {'value': '18', 'unit': '個', 'entity': '蛋糕'},
    'verb': '買',
    'subject': '阿姨',
    'object': None},
   {'qtyid': 'E7',
    'quan

In [14]:
solver.solve(wrong_case[1])

{'Question ID': '51837', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'拿'得知，付了1500塊錢。1500為已付。蛋糕26元為單位價格。蛋糕28元為單位價格。將購買的量與單位價格相乘得到應付價格。18個蛋糕 * 26 = 468 (應付價格)。23個蛋糕 * 26 = 598 (應付價格)。計算應買總價格=1066。將已付減去應付總價極為所求。1500 - 1066 = 434。", 'Formula': '', 'My Answer': 434, 'Solution': '388元'}


False

In [15]:
solver.solve(correct_case[0])

{'Question ID': '1MA0140466', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'付'得知，付了250塊錢。250為已付。蘋果5元為單位價格。將購買的量與單位價格相乘得到應付價格。40顆蘋果 * 5 = 200 (應付價格)。計算應買總價格=200。將已付減去應付總價極為所求。250 - 200 = 50。", 'Formula': '', 'My Answer': 50, 'Solution': '50元'}


True

In [16]:
correct_case

[{'qid': '1MA0140466',
  'sentence': '一顆蘋果5元，小明買了40顆，付了250元，可以找回多少元？',
  'quantities': {'s1': [{'qtyid': 'E1',
     'quantity': {'value': 1, 'unit': '顆', 'entity': '蘋果'},
     'verb': None,
     'subject': None,
     'object': None},
    {'qtyid': 'E2',
     'quantity': {'value': '5', 'unit': '元', 'entity': '蘋果'},
     'verb': None,
     'subject': None,
     'object': None}],
   's2': [{'qtyid': 'E3',
     'quantity': {'value': '40', 'unit': '顆', 'entity': '蘋果'},
     'verb': '買',
     'subject': '小明',
     'object': None}],
   's3': [{'qtyid': 'E4',
     'quantity': {'value': '250', 'unit': '元', 'entity': None},
     'verb': '付',
     'subject': '小明',
     'object': None}],
   's4': [{'qtyid': 'E5',
     'quantity': {'value': '?', 'unit': '元', 'entity': '蘋果'},
     'verb': '找回',
     'subject': '小明',
     'object': None}]},
  'unitmaps': {'s1': [{'denominator': 'E1', 'numerator': 'E2'}]},
  'answer': '50元',
  'stype': ['每單位量', '量變', '量變', '問找回']},
 {'qid': '1MA0140462',
  'sentence':

In [17]:
wrong_case

[{'qid': '52339',
  'sentence': '展覽會門票每人80元，全班33人買票入場，付3000元，應該找回多少元？',
  'quantities': {'s1': [{'qtyid': 'E1',
     'quantity': {'value': '80', 'unit': '元', 'entity': '門票'},
     'verb': None,
     'subject': None,
     'object': None},
    {'qtyid': 'E2',
     'quantity': {'value': 1, 'unit': None, 'entity': '人'},
     'verb': None,
     'subject': None,
     'object': None}],
   's2': [{'qtyid': 'E3',
     'quantity': {'value': '33', 'unit': None, 'entity': '人'},
     'verb': None,
     'subject': None,
     'object': None}],
   's3': [{'qtyid': 'E4',
     'quantity': {'value': '3000', 'unit': '元', 'entity': None},
     'verb': '付',
     'subject': None,
     'object': None}],
   's4': [{'qtyid': 'E5',
     'quantity': {'value': '?', 'unit': '元', 'entity': '人'},
     'verb': '應該',
     'subject': None,
     'object': None},
    {'qtyid': 'E6',
     'quantity': {'value': '?', 'unit': '元', 'entity': '人'},
     'verb': '找回',
     'subject': None,
     'object': None}]},
  'unitmaps': {

In [18]:
solver.solve(wrong_case[1])

{'Question ID': '51837', 'Question Type': 'Single', 'Description': "此題為問找回，我們先找付的錢。可在第3句裡的'拿'得知，付了1500塊錢。1500為已付。蛋糕26元為單位價格。蛋糕28元為單位價格。將購買的量與單位價格相乘得到應付價格。18個蛋糕 * 26 = 468 (應付價格)。23個蛋糕 * 26 = 598 (應付價格)。計算應買總價格=1066。將已付減去應付總價極為所求。1500 - 1066 = 434。", 'Formula': '', 'My Answer': 434, 'Solution': '388元'}


False

In [19]:
wrong_case[4]

{'qid': '1MA0140445',
 'sentence': '一件T恤賣199元，阿姨買了15件，付了3000元，可以找回多少元？',
 'quantities': {'s1': [],
  's2': [],
  's3': [{'qtyid': 'E1',
    'quantity': {'value': '3000', 'unit': '元', 'entity': None},
    'verb': '付',
    'subject': None,
    'object': None}],
  's4': []},
 'unitmaps': {},
 'answer': '15元',
 'stype': ['每單位量', '量變', '量變', '問找回']}