In [None]:
print("จำนวนแต่ละอารมณ์:", Counter(sentiments))

# ขั้นตอนที่ 1: ติดตั้งไลบรารีที่จำเป็น

In [None]:
pip install transformers torch google-api-python-client matplotlib seaborn

# ขั้นตอนที่ 2: นำเข้าไลบรารี

In [None]:
from transformers import RobertaTokenizer, RobertaForSequenceClassification
import torch
from googleapiclient.discovery import build
from collections import Counter
import matplotlib.pyplot as plt
import seaborn as sns
import re

# ขั้นตอนที่ 3: ตั้งค่า YouTube Data **API**

In [None]:
API_KEY = "AIzaSyDf79eV7sSb-_viRh5VXyftETqo5jMwUrM"  # เปลี่ยนเป็น API Key ของคุณ
youtube = build('youtube', 'v3', developerKey=API_KEY)

# ขั้นตอนที่ 4: โหลดโมเดลและ Tokenizer

In [None]:
def load_model_and_tokenizer(model_name="cardiffnlp/twitter-roberta-base-sentiment"):
    tokenizer = RobertaTokenizer.from_pretrained(model_name)
    model = RobertaForSequenceClassification.from_pretrained(model_name)
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    return tokenizer, model, device

# ขั้นตอนที่ 5: ทำความสะอาดข้อความ

In [None]:
def clean_comment(comment):
    comment = comment.lower()  # เปลี่ยนเป็นตัวพิมพ์เล็ก
    comment = re.sub(r'[^\w\s]', '', comment)  # ลบอักขระพิเศษ
    comment = re.sub(r'\d+', '', comment)  # ลบตัวเลข
    comment = re.sub(r'\s+', ' ', comment)  # ลบช่องว่างเกิน
    return comment.strip()  # ตัดช่องว่างด้านหน้าและด้านหลัง

# ขั้นตอนที่ 6: วิเคราะห์อารมณ์แบบ Batch

In [None]:
def analyze_sentiment_batch(comments, tokenizer, model, device, batch_size=64):
    sentiments = []
    for i in range(0, len(comments), batch_size):
        batch = comments[i:i + batch_size]
        encoding = tokenizer.batch_encode_plus(
            batch,
            add_special_tokens=True,
            max_length=512,
            truncation=True,
            padding='max_length',
            return_tensors='pt'
        )
        input_ids = encoding['input_ids'].to(device)
        attention_mask = encoding['attention_mask'].to(device)
        with torch.no_grad():
            outputs = model(input_ids, attention_mask=attention_mask)
            logits = outputs.logits
            predictions = logits.argmax(dim=-1).cpu().numpy()
            sentiments.extend(predictions)
    return sentiments

# ขั้นตอนที่ 7: ดึงคอมเมนต์จาก YouTube

In [None]:
def get_video_comments(video_id, youtube):
    comments = []
    request = youtube.commentThreads().list(
        part="snippet",
        videoId=video_id,
        textFormat="plainText",
        maxResults=500  # จำกัดจำนวนคอมเมนต์ที่ดึงในแต่ละครั้ง
    )

    while request:
        response = request.execute()
        for item in response["items"]:
            comment = item["snippet"]["topLevelComment"]["snippet"]["textDisplay"]
            comments.append(comment)
        request = youtube.commentThreads().list_next(request, response)

    return comments

# ขั้นตอนที่ 8: **แสดงผลลัพธ์**

In [None]:
def plot_sentiment_results(sentiments):
    sentiment_counts = Counter(sentiments)
    sentiment_labels = ['Negative', 'Neutral', 'Positive']

    # สร้างกราฟแท่ง
    plt.figure(figsize=(8, 6))
    sns.barplot(x=sentiment_labels, y=[sentiment_counts.get(i, 0) for i in range(3)], palette='viridis')
    plt.title('Sentiment Analysis Results', fontsize=14)
    plt.xlabel('Sentiment', fontsize=12)
    plt.ylabel('Count', fontsize=12)
    plt.show()  # แสดงกราฟแท่ง

    # สร้าง Pie Chart
    plt.figure(figsize=(6, 6))
    plt.pie(
        [sentiment_counts.get(i, 0) for i in range(3)],  # ข้อมูล
        labels=sentiment_labels,  # ป้ายชื่อ
        autopct='%1.1f%%',  # แสดงเปอร์เซ็นต์
        colors=['red', 'gray', 'green']  # สี
    )
    plt.title('Sentiment Distribution', fontsize=14)
    plt.show()  # แสดงกราฟวงกลม

# **ขั้นตอนที่ 9: ตัวอย่างการใช้งาน**

In [None]:
if __name__ == "__main__":
    # โหลดโมเดลและ Tokenizer
    tokenizer, model, device = load_model_and_tokenizer()

    # ดึงคอมเมนต์จาก YouTube
    video_id = "oX7OduG1YmI"  # เปลี่ยนเป็น video_id ที่คุณต้องการ
    comments = get_video_comments(video_id, youtube)
    print("จำนวนคอมเมนต์ที่ดึงมาได้:", len(comments))
    print("ตัวอย่างคอมเมนต์:", comments[:2])

    # ทำความสะอาดคอมเมนต์
    cleaned_comments = [clean_comment(comment) for comment in comments]
    print("ตัวอย่างคอมเมนต์ที่ทำความสะอาดแล้ว:", cleaned_comments[:2])

    # วิเคราะห์อารมณ์แบบ Batch
    sentiments = analyze_sentiment_batch(cleaned_comments, tokenizer, model, device)
    print("ผลลัพธ์อารมณ์:", sentiments)

    # แสดงผลลัพธ์
    plot_sentiment_results(sentiments)

    # แสดงตัวอย่างผลลัพธ์
    print("ตัวอย่างผลลัพธ์การวิเคราะห์อารมณ์:")
    sentiment_labels = ['Negative', 'Neutral', 'Positive']
    for comment, sentiment in zip(comments[:5], sentiments[:5]):
        print(f"Comment: {comment}\nSentiment: {sentiment_labels[sentiment]}\n")

In [None]:
from sklearn.metrics import accuracy_score

# คำนวณความแม่นยำ (accuracy)
def calculate_accuracy(predictions, true_labels):
    return accuracy_score(true_labels, predictions) * 100  # แปลงเป็นเปอร์เซ็นต์

# ตัวอย่างการใช้
if __name__ == "__main__":
    # สมมติว่าคุณมี true_labels (ค่าจริง) และ predictions (ค่าที่โมเดลทำนาย)
    true_labels = [0, 1, 2, 1, 0, 2]  # ตัวอย่างของค่าจริง (Negative, Neutral, Positive)
    predictions = [0, 1, 2, 0, 0, 2]  # ตัวอย่างของค่าที่โมเดลทำนาย

    # คำนวณ Accuracy
    accuracy = calculate_accuracy(predictions, true_labels)
    print(f"Accuracy of the sentiment analysis model: {accuracy:.2f}%")


In [None]:
# ติดตั้ง Git (หากยังไม่ได้ติดตั้ง)
!apt-get install git

# ตั้งค่า Git
!git config --global user.name "nisawaraa"
!git config --global user.email "quietdollphin@gmail.com"


In [None]:
!git push origin main


In [None]:
!git clone https://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@github.com/nisawaraa/NLP-.git


In [None]:
!git push https://nisawaraa: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@github.com/nisawaraa/NLP-.git


In [None]:
# สมมติว่าคุณมีผลลัพธ์ในตัวแปร `output`
output = "นี่คือผลลัพธ์จากการทดสอบโมเดล"

# สร้างไฟล์ผลลัพธ์ลงใน Colab
file_path = '/content/NLP-/output.csv'  # กำหนดที่อยู่ไฟล์
with open(file_path, 'w') as f:
    f.write(output)

# ตรวจสอบว่าไฟล์ถูกสร้างขึ้นหรือไม่
!cat /content/NLP-/output.txt
