<style>
.rendered_html {
  direction: rtl;
  text-align: right;
}
</style>


# دمو اجرای سبک UOCE روی CPU

در این نوت‌بوک:
- نتایج بازتولید (بدون بهبود) را نشان می‌دهیم.
- نتایج بعد از بهبود را نشان می‌دهیم.
- یک خروجی نموداری ساده تولید می‌کنیم.
- امکان جستجوی دستی جمله و مشاهده خروجی فراهم می‌شود.


## گام ۱: تنظیم مسیرها و بارگذاری نتایج
در این بخش مسیرها را مشخص می‌کنیم و خروجی‌های JSON مربوط به بازتولید و بهبود را بارگذاری می‌کنیم.


In [2]:
import json
from pathlib import Path

ROOT = Path('..').resolve()
REPO = ROOT / 'original_repo'
EXP = ROOT / 'experiments'

BASELINE_JSON = EXP / 'baseline_results.json'
IMPROVED_JSON = EXP / 'improved_results.json'

baseline = json.loads(BASELINE_JSON.read_text(encoding='utf-8'))
improved = json.loads(IMPROVED_JSON.read_text(encoding='utf-8'))

baseline, improved


({'mvp': {'aste': {'precision': 0.3310810810810811,
    'recall': 0.3656716417910448,
    'f1': 0.3475177304964539},
   'acos': {'precision': 0.12837837837837837,
    'recall': 0.1417910447761194,
    'f1': 0.13475177304964536}},
  'gen_scl_nat': {'aste': {'precision': 0.32679738562091504,
    'recall': 0.373134328358209,
    'f1': 0.34843205574912894},
   'acos': {'precision': 0.03205128205128205,
    'recall': 0.03731343283582089,
    'f1': 0.034482758620689655}}},
 {'baseline': {'precision': 0.3310810810810811,
   'recall': 0.3656716417910448,
   'f1': 0.3475177304964539},
  'fixed_entcat': {'precision': 0.33783783783783783,
   'recall': 0.373134328358209,
   'f1': 0.35460992907801414}})

## گام ۲: نمایش خروجی بدون بهبود (Baseline)
در این بخش نتایج اصلی Tuple-Level Exact Match را برای MVP و GEN_SCL_NAT نمایش می‌دهیم.


In [3]:
print('Baseline - MVP / ASTE:', baseline['mvp']['aste'])
print('Baseline - MVP / ACOS:', baseline['mvp']['acos'])
print('Baseline - GEN_SCL_NAT / ASTE:', baseline['gen_scl_nat']['aste'])
print('Baseline - GEN_SCL_NAT / ACOS:', baseline['gen_scl_nat']['acos'])


Baseline - MVP / ASTE: {'precision': 0.3310810810810811, 'recall': 0.3656716417910448, 'f1': 0.3475177304964539}
Baseline - MVP / ACOS: {'precision': 0.12837837837837837, 'recall': 0.1417910447761194, 'f1': 0.13475177304964536}
Baseline - GEN_SCL_NAT / ASTE: {'precision': 0.32679738562091504, 'recall': 0.373134328358209, 'f1': 0.34843205574912894}
Baseline - GEN_SCL_NAT / ACOS: {'precision': 0.03205128205128205, 'recall': 0.03731343283582089, 'f1': 0.034482758620689655}


## گام ۳: نمایش خروجی با بهبود
اینجا نتیجه همان معیار اما با پارس بهبود‌یافته موجودیت–دسته نمایش داده می‌شود.


In [4]:
print('Improved - MVP / ASTE:', improved['fixed_entcat'])
print('Baseline (برای مقایسه) - MVP / ASTE:', improved['baseline'])


Improved - MVP / ASTE: {'precision': 0.33783783783783783, 'recall': 0.373134328358209, 'f1': 0.35460992907801414}
Baseline (برای مقایسه) - MVP / ASTE: {'precision': 0.3310810810810811, 'recall': 0.3656716417910448, 'f1': 0.3475177304964539}


## گام ۴: تولید خروجی نموداری ساده
یک نمودار ساده از مقایسه F1 قبل و بعد از بهبود تولید می‌کنیم.


In [5]:
from PIL import Image, ImageDraw, ImageFont

out_img = ROOT / 'demo' / 'results_chart.png'

f1_base = improved['baseline']['f1']
f1_impr = improved['fixed_entcat']['f1']

w, h = 600, 300
img = Image.new('RGB', (w, h), 'white')
draw = ImageDraw.Draw(img)

max_f1 = max(f1_base, f1_impr)
bar_w = 150
base_h = int((f1_base / max_f1) * 200)
impr_h = int((f1_impr / max_f1) * 200)

# baseline bar
draw.rectangle([100, h-50-base_h, 100+bar_w, h-50], fill='#4c78a8')
# improved bar
draw.rectangle([350, h-50-impr_h, 350+bar_w, h-50], fill='#f58518')

draw.text((110, h-45), 'Baseline', fill='black')
draw.text((365, h-45), 'Improved', fill='black')

draw.text((110, h-70-base_h), f'F1={f1_base:.3f}', fill='black')
draw.text((365, h-70-impr_h), f'F1={f1_impr:.3f}', fill='black')

img.save(out_img)
print('saved:', out_img)


saved: /home/parham/Projects/University/NLP/project/demo/results_chart.png


## گام ۵: تولید خروجی CSV از نتایج
خروجی نتایج در قالب CSV ذخیره می‌شود تا برای گزارش یا نمودارهای بعدی قابل استفاده باشد.


In [6]:
csv_path = ROOT / 'experiments' / 'results_summary.csv'
print('CSV path:', csv_path)
print(csv_path.read_text(encoding='utf-8')[:500])


CSV path: /home/parham/Projects/University/NLP/project/experiments/results_summary.csv
variant,model,mode,precision,recall,f1
baseline,mvp,aste,0.3310810810810811,0.3656716417910448,0.3475177304964539
baseline,mvp,acos,0.12837837837837837,0.1417910447761194,0.13475177304964536
baseline,gen_scl_nat,aste,0.32679738562091504,0.373134328358209,0.34843205574912894
baseline,gen_scl_nat,acos,0.03205128205128205,0.03731343283582089,0.034482758620689655
baseline,mvp,aste,0.3310810810810811,0.3656716417910448,0.3475177304964539
fixed_entcat,mvp,aste,0.33783783783783783,0.373134328358209,0.3


## گام ۶: بارگذاری داده‌ها برای نمایش خروجی نمونه
در این بخش فایل طلایی و خروجی مدل را می‌خوانیم.


In [7]:
import csv

GOLD = REPO / 'final_result/gold_annotations_fin_3.csv'
PRED = REPO / 'final_result/gpt-4o/nlprompt/csv/desc_format_eg.csv'

def load_csv(path):
    rows = []
    with path.open(newline='', encoding='utf-8') as f:
        reader = csv.DictReader(f)
        for row in reader:
            rows.append(row)
    return rows

gold_rows = load_csv(GOLD)
pred_rows = load_csv(PRED)
print('gold rows:', len(gold_rows))
print('pred rows:', len(pred_rows))


gold rows: 134
pred rows: 163


## گام ۷: گروه‌بندی بر اساس شناسه
ردیف‌ها را بر اساس `id` گروه‌بندی می‌کنیم تا بتوانیم خروجی یک نمونه را ببینیم.


In [8]:
def group_by_id(rows):
    groups = {}
    current_id = None
    for row in rows:
        rid = row.get('id') or ''
        if rid.strip():
            current_id = rid.strip()
            groups.setdefault(current_id, []).append(row)
        else:
            if current_id:
                groups[current_id].append(row)
    return groups

gold_by_id = group_by_id(gold_rows)
pred_by_id = group_by_id(pred_rows)
print('unique ids in gold:', len(gold_by_id))
print('unique ids in pred:', len(pred_by_id))


unique ids in gold: 98
unique ids in pred: 98


## گام ۸: نمایش نمونه خروجی (قبل از بهبود / بعد از بهبود)
توجه: بهبود ما مربوط به ارزیابی است، نه تولید خروجی مدل؛ بنابراین خروجی نمونه یکی است اما امتیاز تغییر می‌کند.


In [9]:
sample_id = 'b-1'
sample_gold = gold_by_id.get(sample_id, [])
sample_pred = pred_by_id.get(sample_id, [])

print('متن ورودی:')
print(sample_gold[0].get('raw_text') if sample_gold else 'N/A')

print('\nخروجی مدل (مشترک برای هر دو حالت):')
for row in sample_pred:
    print({
        'aspect_term': row.get('aspect_term'),
        'sentiment_expression': row.get('sentiment_expression'),
        'target_entity': row.get('target_entity'),
        'aspect_category': row.get('aspect_category'),
        'sentiment_polarity': row.get('sentiment_polarity'),
        'sentiment_intensity': row.get('sentiment_intensity'),
        'opinion_holder_span': row.get('opinion_holder_span'),
        'opinion_holder_entity': row.get('opinion_holder_entity'),
        'opinion_qualifier': row.get('opinion_qualifier'),
        'opinion_reason': row.get('opinion_reason'),
    })

print('\nF1 بدون بهبود (MVP/ASTE):', improved['baseline']['f1'])
print('F1 با بهبود (MVP/ASTE):', improved['fixed_entcat']['f1'])


متن ورودی:
I ca n't imagine a better-written treatment of the subject .

خروجی مدل (مشترک برای هر دو حالت):
{'aspect_term': 'treatment of the subject', 'sentiment_expression': 'better-written', 'target_entity': 'book', 'aspect_category': 'writing_quality', 'sentiment_polarity': 'positive', 'sentiment_intensity': 'strong', 'opinion_holder_span': 'I', 'opinion_holder_entity': 'author', 'opinion_qualifier': '', 'opinion_reason': ''}

F1 بدون بهبود (MVP/ASTE): 0.3475177304964539
F1 با بهبود (MVP/ASTE): 0.35460992907801414


## گام ۹: ورودی دستی جمله و نمایش خروجی
در این بخش می‌توانید یک جمله را وارد کنید و اگر در دیتاست وجود داشته باشد، خروجی مدل برای همان جمله نمایش داده می‌شود.


In [10]:
def normalize_text(x):
    return ' '.join((x or '').lower().strip().split())

def find_id_by_sentence(sentence):
    target = normalize_text(sentence)
    for row in gold_rows:
        if normalize_text(row.get('raw_text', '')) == target:
            return row.get('id')
    return None

def predict_for_sentence(sentence):
    rid = find_id_by_sentence(sentence)
    if not rid:
        print('این جمله در دیتاست پیدا نشد.')
        return
    preds = pred_by_id.get(rid, [])
    print(f'ID: {rid}')
    for row in preds:
        print({
            'aspect_term': row.get('aspect_term'),
            'sentiment_expression': row.get('sentiment_expression'),
            'target_entity': row.get('target_entity'),
            'aspect_category': row.get('aspect_category'),
            'sentiment_polarity': row.get('sentiment_polarity'),
            'sentiment_intensity': row.get('sentiment_intensity'),
            'opinion_holder_span': row.get('opinion_holder_span'),
            'opinion_holder_entity': row.get('opinion_holder_entity'),
            'opinion_qualifier': row.get('opinion_qualifier'),
            'opinion_reason': row.get('opinion_reason'),
        })

user_sentence = "I ca n't imagine a better-written treatment of the subject ."
predict_for_sentence(user_sentence)


ID: b-1
{'aspect_term': 'treatment of the subject', 'sentiment_expression': 'better-written', 'target_entity': 'book', 'aspect_category': 'writing_quality', 'sentiment_polarity': 'positive', 'sentiment_intensity': 'strong', 'opinion_holder_span': 'I', 'opinion_holder_entity': 'author', 'opinion_qualifier': '', 'opinion_reason': ''}


## گام ۱۰: ورودی آزاد (بدون وابستگی به دیتاست)
در این بخش یک استخراج‌گر بسیار ساده و قانون‌محور (Rule-based) داریم که روی هر جمله دلخواه اجرا می‌شود.
این خروجی صرفاً یک دمو سبک است و جایگزین مدل واقعی نیست، اما شرط "قابل اجرا روی CPU" را به‌صورت عملی نشان می‌دهد.


In [11]:
import re

POS_WORDS = {'good','great','excellent','amazing','love','loved','like','liked','fantastic','wonderful','best','awesome'}
NEG_WORDS = {'bad','poor','awful','terrible','hate','hated','worst','boring','disappointed','slow','dirty'}
INTENSIFIERS = {'very','really','so','extremely','super'}
ASPECT_KEYWORDS = {
    'battery': ('battery', 'operational_performance', 'laptop'),
    'screen': ('screen', 'display', 'laptop'),
    'keyboard': ('keyboard', 'operational_performance', 'laptop'),
    'service': ('service', 'service', 'restaurant'),
    'food': ('food', 'food_and_beverage', 'restaurant'),
    'price': ('price', 'price', 'general'),
    'ambience': ('ambience', 'ambience', 'restaurant'),
    'clean': ('cleanliness', 'hygiene', 'restaurant'),
}

def rule_based_extract(sentence):
    text = sentence.lower()
    # sentiment polarity
    polarity = 'neutral'
    expr = 'N/A'
    intensity = 'average'
    words = re.findall(r'[a-zA-Z]+' , text)
    for i, w in enumerate(words):
        if w in POS_WORDS:
            polarity = 'positive'
            expr = w
            if i > 0 and words[i-1] in INTENSIFIERS:
                expr = words[i-1] + ' ' + w
                intensity = 'strong'
            break
        if w in NEG_WORDS:
            polarity = 'negative'
            expr = w
            if i > 0 and words[i-1] in INTENSIFIERS:
                expr = words[i-1] + ' ' + w
                intensity = 'strong'
            break

    aspect_term, aspect_category, target_entity = 'N/A', 'general', 'general'
    for k, (a, c, e) in ASPECT_KEYWORDS.items():
        if k in text:
            aspect_term, aspect_category, target_entity = a, c, e
            break

    return [{
        'aspect_term': aspect_term,
        'sentiment_expression': expr,
        'target_entity': target_entity,
        'aspect_category': aspect_category,
        'sentiment_polarity': polarity,
        'sentiment_intensity': intensity,
        'opinion_holder_span': 'N/A',
        'opinion_holder_entity': 'author',
        'opinion_qualifier': 'N/A',
        'opinion_reason': 'N/A',
    }]

free_sentence = 'The battery life is really good but the screen is bad.'
print(rule_based_extract(free_sentence))


[{'aspect_term': 'battery', 'sentiment_expression': 'really good', 'target_entity': 'laptop', 'aspect_category': 'operational_performance', 'sentiment_polarity': 'positive', 'sentiment_intensity': 'strong', 'opinion_holder_span': 'N/A', 'opinion_holder_entity': 'author', 'opinion_qualifier': 'N/A', 'opinion_reason': 'N/A'}]
