<a href="https://colab.research.google.com/github/Albayt54/uas_datamining/blob/main/Senti.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import csv
import re
import pandas as pd
import nltk
nltk.download('vader_lexicon')
from nltk.sentiment.vader import SentimentIntensityAnalyzer
import plotly.express as px
import plotly.graph_objects as go
from colorama import Fore, Style
from typing import Dict
import streamlit as st

**csv: Untuk membaca dan menulis file CSV.**

**re: Untuk pencocokan pola menggunakan ekspresi reguler.**

**pandas as pd: Untuk manipulasi data menggunakan DataFrame.**

**nltk dan nltk.sentiment.vader: Library Natural Language Toolkit untuk analisis sentimen menggunakan VADER.**

**plotly.express dan plotly.graph_objects: Untuk membuat visualisasi data, seperti grafik batang dan diagram lingkaran.**

**colorama: Untuk mencetak teks berwarna di terminal.
typing: Digunakan untuk memberikan tipe pada variabel, seperti Dict.**

**streamlit as st: Digunakan untuk membuat antarmuka web yang interaktif.**

**nltk.download('vader_lexicon'): Mengunduh kamus VADER yang digunakan untuk analisis sentimen.**

In [None]:
def extract_video_id(youtube_link):
    video_id_regex = r"^(?:https?:\/\/)?(?:www\.)?(?:youtube\.com\/watch\?v=|youtu.be\/)([a-zA-Z0-9_-]{11})"
    match = re.search(video_id_regex, youtube_link)
    if match:
        video_id = match.group(1)
        return video_id
    else:
        return None

**extract_video_id(youtube_link): Fungsi ini digunakan untuk mengekstrak ID video dari link YouTube menggunakan ekspresi reguler.**

**video_id_regex: Pola ekspresi reguler untuk mencocokkan ID video dalam berbagai format URL YouTube.**

**re.search: Mencari pola dalam link YouTube, dan jika cocok, ID video dikembalikan.**

In [None]:
def analyze_sentiment(csv_file):
    # Initialize the sentiment analyzer
    sid = SentimentIntensityAnalyzer()

    # Read in the YouTube comments from the CSV file
    comments = []
    with open(csv_file, 'r', encoding='utf-8-sig') as csvfile:
        reader = csv.DictReader(csvfile)
        for row in reader:
            comments.append(row['Comment'])

    # Count the number of neutral, positive, and negative comments
    num_neutral = 0
    num_positive = 0
    num_negative = 0
    for comment in comments:
        sentiment_scores = sid.polarity_scores(comment)
        if sentiment_scores['compound'] == 0.0:
            num_neutral += 1
        elif sentiment_scores['compound'] > 0.0:
            num_positive += 1
        else:
            num_negative += 1

    # Return the results as a dictionary
    results = {'num_neutral': num_neutral, 'num_positive': num_positive, 'num_negative': num_negative}
    return results

**analyze_sentiment(csv_file): Fungsi ini menganalisis sentimen dari komentar-komentar YouTube yang disimpan dalam file CSV.**

**SentimentIntensityAnalyzer(): Menginisialisasi analyzer sentimen VADER.**

**csv.DictReader: Membaca file CSV dan menyimpan komentar ke dalam daftar comments.**

**sid.polarity_scores(comment): Menghitung skor sentimen dari komentar. Skor 'compound' digunakan untuk menentukan apakah komentar netral, positif, atau negatif.**

**results: Mengembalikan hasil analisis dalam bentuk dictionary yang berisi jumlah komentar netral, positif, dan negatif.**

In [None]:
def bar_chart(csv_file: str) -> None:
    # Call analyze_sentiment function to get the results
    results: Dict[str, int] = analyze_sentiment(csv_file)

    # Get the counts for each sentiment category
    num_neutral = results['num_neutral']
    num_positive = results['num_positive']
    num_negative = results['num_negative']

    # Create a Pandas DataFrame with the results
    df = pd.DataFrame({
        'Sentiment': ['Positive', 'Negative', 'Neutral'],
        'Number of Comments': [num_positive, num_negative, num_neutral]
    })

    # Create the bar chart using Plotly Express
    fig = px.bar(df, x='Sentiment', y='Number of Comments', color='Sentiment',
                 color_discrete_sequence=['#87CEFA', '#FFA07A', '#D3D3D3'],
                 title='Sentiment Analysis Results')
    fig.update_layout(title_font=dict(size=20))


    # Show the chart
    st.plotly_chart(fig, use_container_width=True)

**bar_chart(csv_file: str) -> None: Fungsi ini menampilkan grafik batang dari hasil analisis sentimen.**

**results: Mendapatkan hasil analisis sentimen dengan memanggil analyze_sentiment.**

**pd.DataFrame: Membuat DataFrame dari hasil analisis untuk visualisasi.**

**px.bar: Menggunakan Plotly Express untuk membuat grafik batang berdasarkan hasil analisis sentimen.**

**st.plotly_chart: Menampilkan grafik batang di aplikasi Streamlit.**

In [None]:
def plot_sentiment(csv_file: str) -> None:
    # Call analyze_sentiment function to get the results
    results: Dict[str, int] = analyze_sentiment(csv_file)

    # Get the counts for each sentiment category
    num_neutral = results['num_neutral']
    num_positive = results['num_positive']
    num_negative = results['num_negative']

    # Plot the pie chart
    labels = ['Neutral', 'Positive', 'Negative']
    values = [num_neutral, num_positive, num_negative]
    colors = ['yellow', 'green', 'red']
    fig = go.Figure(data=[go.Pie(labels=labels, values=values, textinfo='label+percent',
                                 marker=dict(colors=colors))])
    fig.update_layout(title={'text': 'Sentiment Analysis Results', 'font': {'size': 20, 'family': 'Arial', 'color': 'grey'},
                              'x': 0.5, 'y': 0.9},
                      font=dict(size=14))
    st.plotly_chart(fig)

**plot_sentiment(csv_file: str) -> None: Fungsi ini menampilkan diagram lingkaran dari hasil analisis sentimen.**

**go.Figure(data=[go.Pie(...)]): Menggunakan Plotly Graph Objects untuk membuat diagram lingkaran yang menampilkan persentase setiap kategori sentimen.**

**st.plotly_chart: Menampilkan diagram lingkaran di aplikasi Streamlit.**

In [None]:
def create_scatterplot(csv_file: str, x_column: str, y_column: str) -> None:
    # Load data from CSV
    data = pd.read_csv(csv_file)

    # Create scatter plot using Plotly
    fig = px.scatter(data, x=x_column, y=y_column, color='Category')

    # Customize layout
    fig.update_layout(
        title='Scatter Plot',
        xaxis_title=x_column,
        yaxis_title=y_column,
        font=dict(size=18)
    )

    # Display plot in Streamlit
    st.plotly_chart(fig, use_container_width=True)

**create_scatterplot(csv_file: str, x_column: str, y_column: str) -> None: Fungsi ini membuat dan menampilkan scatter plot berdasarkan data dalam file CSV.**

**pd.read_csv: Membaca data dari file CSV.**

**px.scatter: Menggunakan Plotly Express untuk membuat scatter plot berdasarkan kolom yang ditentukan.**

**st.plotly_chart: Menampilkan scatter plot di aplikasi Streamlit.**

In [None]:
def print_sentiment(csv_file: str) -> None:
    # Call analyze_sentiment function to get the results
    results: Dict[str, int] = analyze_sentiment(csv_file)

    # Get the counts for each sentiment category
    num_neutral = results['num_neutral']
    num_positive = results['num_positive']
    num_negative = results['num_negative']


    # Determine the overall sentiment
    if num_positive > num_negative:
        overall_sentiment = 'POSITIVE'
        color = Fore.GREEN
    elif num_negative > num_positive:
        overall_sentiment = 'NEGATIVE'
        color = Fore.RED
    else:
        overall_sentiment = 'NEUTRAL'
        color = Fore.YELLOW

    # Print the overall sentiment in color
    print('\n'+ Style.BRIGHT+ color + overall_sentiment.upper().center(50, ' ') + Style.RESET_ALL)

**print_sentiment(csv_file: str) -> None: Fungsi ini menentukan dan mencetak sentimen keseluruhan berdasarkan hasil analisis komentar.**

**if num_positive > num_negative: Menentukan apakah sentimen keseluruhan positif, negatif, atau netral.**

**colorama.Fore dan Style: Digunakan untuk mencetak sentimen keseluruhan dalam warna tertentu di terminal.**