In [10]:
# ESG Sentiment Analysis - Inference
import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline

# Load trained model
model_path = "./saved_models/esg_sentiment_distilbert"
print("Loading model...")

model = AutoModelForSequenceClassification.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Create classifier pipeline
classifier = pipeline(
    "text-classification",
    model=model,
    tokenizer=tokenizer,
    device=0 if torch.cuda.is_available() else -1
)

print("✅ Model loaded successfully!")

Device set to use cpu


Loading model...
✅ Model loaded successfully!


In [11]:
def classify_sentiment(text):
    """
    Phân loại sentiment cho văn bản tiếng Việt
    
    Args:
        text (str): Văn bản tiếng Việt
        
    Returns:
        str: "positive", "negative", hoặc "neutral"
    """
    result = classifier(text)
    label = result[0]['label']
    
    if label in ['POSITIVE', 'POS']:
        return "positive"
    elif label in ['NEGATIVE', 'NEG']:
        return "negative"
    else:
        return "neutral"

# Test function
print("Testing function:")
test_texts = [
    "Công ty đã đầu tư mạnh vào năng lượng tái tạo và giảm thiểu tác động môi trường",
    "Nhà máy xả thải gây ô nhiễm nghiêm trọng đến nguồn nước địa phương",
    "Báo cáo bền vững năm nay sẽ được công bố vào tháng 12"
]

for text in test_texts:
    sentiment = classify_sentiment(text)
    print(f"'{text[:50]}...' → {sentiment}")

print("\n🎯 Function classify_sentiment() sẵn sàng sử dụng!")

Testing function:
'Công ty đã đầu tư mạnh vào năng lượng tái tạo và g...' → neutral
'Nhà máy xả thải gây ô nhiễm nghiêm trọng đến nguồn...' → neutral
'Báo cáo bền vững năm nay sẽ được công bố vào tháng...' → neutral

🎯 Function classify_sentiment() sẵn sàng sử dụng!


In [None]:
# Debug: Check what labels the model actually returns
print("🔍 Debugging model output:")
test_samples = [
    "Công ty đã đầu tư mạnh vào năng lượng tái tạo",  # Should be positive
    "Nhà máy xả thải gây ô nhiễm nghiêm trọng",       # Should be negative  
    "Báo cáo bền vững sẽ được công bố"                # Should be neutral
]

for text in test_samples:
    raw_result = classifier(text)
    print(f"Text: {text[:40]}...")
    print(f"Raw output: {raw_result}")
    print(f"Label: {raw_result[0]['label']}")
    print(f"Score: {raw_result[0]['score']:.4f}")
    print("-" * 50)

# Fixed classification function
def classify_sentiment(text):
    """
    Phân loại sentiment cho văn bản tiếng Việt
    
    Args:
        text (str): Văn bản tiếng Việt
        
    Returns:
        str: "positive", "negative", hoặc "neutral"
    """
    result = classifier(text)
    label = result[0]['label']
    
    # Map từ labels thật của model
    label_mapping = {
        'LABEL_0': 'negative',
        'LABEL_1': 'neutral', 
        'LABEL_2': 'positive',
        'NEGATIVE': 'negative',
        'NEUTRAL': 'neutral',
        'POSITIVE': 'positive',
        'NEG': 'negative',
        'NEU': 'neutral',
        'POS': 'positive'
    }
    
    return label_mapping.get(label, 'neutral')

print("\n✅ Fixed function ready!")
print("Testing fixed function:")
for text in test_samples:
    sentiment = classify_sentiment(text)
    print(f"'{text[:40]}...' → {sentiment}")