### Mini Project : Analisis Emosi Penonton Pada Komentar Video Cerita Horor di YouTube

### Tahap Pertama :Scraping

In [1]:
# Import Libabry Yang di Gunakan
import pandas as pd
from googleapiclient.discovery import build

In [2]:
# Fungsi Scraping Komentar
def get_youtube_comments(video_id, api_key, max_results=100):
    """
    Mengambil komentar dari video YouTube menggunakan YouTube Data API.

    Args:
        video_id (str): ID video YouTube.
        api_key (str): Kunci API YouTube Data API.
        max_results (int): Jumlah komentar maksimum yang ingin diambil (maks 100 per request,
                           fungsi ini akan melakukan multiple requests jika max_results > 100).

    Returns:
        list: Daftar komentar dalam bentuk dictionary { "Comment": "...", "Author": "..." }.
    """
    youtube = build('youtube', 'v3', developerKey=api_key)
    comments_data = []
    nextPageToken = None

# Scraping Komentar secara Bertahap
    while len(comments_data) < max_results:
        request = youtube.commentThreads().list(
            part="snippet",
            videoId=video_id,
            maxResults=min(100, max_results - len(comments_data)), # Ambil maksimal 100 atau sisa yang dibutuhkan
            pageToken=nextPageToken,
            textFormat="plainText" # Mengambil komentar dalam format teks biasa
        )
        try:
            response = request.execute()
        except Exception as e:
            print(f"Error fetching comments: {e}")
            break

# Mengambil Data Komentar dan Author
        for item in response.get('items', []):
            # Pastikan path ke komentar dan author valid
            try:
                comment_snippet = item['snippet']['topLevelComment']['snippet']
                comment_text = comment_snippet['textDisplay']
                author_name = comment_snippet['authorDisplayName']
                comments_data.append({"Author": author_name,"Comment": comment_text})
            except KeyError as e:
                print(f"Skipping comment due to unexpected structure or missing key: {e}")
                continue


        nextPageToken = response.get('nextPageToken')
        if not nextPageToken or not response.get('items'): # Hentikan loop jika tidak ada halaman berikutnya atau tidak ada item yang didapat
            break

    return comments_data


In [3]:
# Inisialisasi dan Eksekusi Scraping komentar dari Youtube
# Masukkan API Key dan Id Video Youtube yang akan di scraping:
API_KEY = "AIzaSyC4QIH-UreFOcw7FkcEv4pZfI__SZRNeVs"
VIDEO_ID = "_y0urVbkzzw"
MAX_RESULTS = 1500

comments_list = get_youtube_comments(VIDEO_ID, API_KEY, MAX_RESULTS)
df = pd.DataFrame(comments_list)
display(df.head(20))
len(df)

Unnamed: 0,Author,Comment
0,@NadiaOmaraa,Hai wak! Untuk 2 minggu kedepan aku bakal uplo...
1,@Jirothom,Aku lupa udah nonton ini atau blm ya? Kayak ud...
2,@LuthFiah-vw2tk,Sy pernah ketemu cowo gaib sm supirnya di thn ...
3,@indahwindari8508,"Aku jg prnh mimpi bertemu laki² ganteng,bhkan ..."
4,@arfaasis1834,Keren banget aku juga mau mimpi. Kaya gini 😅😊
5,@rizkyfajaryanto5040,"Kita berbeda, tapi ini bukan mangu 😂"
6,@Ayunda-c6z,Antara bahagia dan sedih jd Tiara yakkk🥹🥹
7,@UniiBeby,Siapa yang nntn di thun 2025😭 critanya kak tia...
8,@wyou.indrie,Apa si Tyara gak pernah ikut kajian kajian dal...
9,@amandasilvia-xs1sm,berasa gantung ceritanyaa😅


1500

### Prepocessing

In [9]:
# Melakukan Case Folding
df['CaseFolding'] = df['Comment'].str.lower()

# Tampilkan perbandingan Author, Comment sebelum, dan sesudah case folding
compare_df = df[['Author', 'Comment', 'CaseFolding']]

# Pemanggilan
display(compare_df.head(10))

Unnamed: 0,Author,Comment,CaseFolding
0,@NadiaOmaraa,Hai wak! Untuk 2 minggu kedepan aku bakal uplo...,hai wak! untuk 2 minggu kedepan aku bakal uplo...
1,@Jirothom,Aku lupa udah nonton ini atau blm ya? Kayak ud...,aku lupa udah nonton ini atau blm ya? kayak ud...
2,@LuthFiah-vw2tk,Sy pernah ketemu cowo gaib sm supirnya di thn ...,sy pernah ketemu cowo gaib sm supirnya di thn ...
3,@indahwindari8508,"Aku jg prnh mimpi bertemu laki² ganteng,bhkan ...","aku jg prnh mimpi bertemu laki² ganteng,bhkan ..."
4,@arfaasis1834,Keren banget aku juga mau mimpi. Kaya gini 😅😊,keren banget aku juga mau mimpi. kaya gini 😅😊
5,@rizkyfajaryanto5040,"Kita berbeda, tapi ini bukan mangu 😂","kita berbeda, tapi ini bukan mangu 😂"
6,@Ayunda-c6z,Antara bahagia dan sedih jd Tiara yakkk🥹🥹,antara bahagia dan sedih jd tiara yakkk🥹🥹
7,@UniiBeby,Siapa yang nntn di thun 2025😭 critanya kak tia...,siapa yang nntn di thun 2025😭 critanya kak tia...
8,@wyou.indrie,Apa si Tyara gak pernah ikut kajian kajian dal...,apa si tyara gak pernah ikut kajian kajian dal...
9,@amandasilvia-xs1sm,berasa gantung ceritanyaa😅,berasa gantung ceritanyaa😅


In [10]:
#import Libabry Tokenisasi
from nltk.tokenize import word_tokenize
import nltk
nltk.download('punkt')
nltk.download('punkt_tab')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!


True

In [11]:
# fungsi Untuk Melkaukan tokenisasi
def tokenize_text(text):
  return word_tokenize(text)

# Menambahkan kolom baru tokenize Review
df['tokenized_comment'] = df['CaseFolding'].apply(tokenize_text)

# menampilkan dataframe dengan kolom baru 'tokenize_review
display(df.head())

Unnamed: 0,Author,Comment,Comment_casefolded,CaseFolding,tokenized_comment
0,@NadiaOmaraa,Hai wak! Untuk 2 minggu kedepan aku bakal uplo...,hai wak! untuk 2 minggu kedepan aku bakal uplo...,hai wak! untuk 2 minggu kedepan aku bakal uplo...,"[hai, wak, !, untuk, 2, minggu, kedepan, aku, ..."
1,@Jirothom,Aku lupa udah nonton ini atau blm ya? Kayak ud...,aku lupa udah nonton ini atau blm ya? kayak ud...,aku lupa udah nonton ini atau blm ya? kayak ud...,"[aku, lupa, udah, nonton, ini, atau, blm, ya, ..."
2,@LuthFiah-vw2tk,Sy pernah ketemu cowo gaib sm supirnya di thn ...,sy pernah ketemu cowo gaib sm supirnya di thn ...,sy pernah ketemu cowo gaib sm supirnya di thn ...,"[sy, pernah, ketemu, cowo, gaib, sm, supirnya,..."
3,@indahwindari8508,"Aku jg prnh mimpi bertemu laki² ganteng,bhkan ...","aku jg prnh mimpi bertemu laki² ganteng,bhkan ...","aku jg prnh mimpi bertemu laki² ganteng,bhkan ...","[aku, jg, prnh, mimpi, bertemu, laki², ganteng..."
4,@arfaasis1834,Keren banget aku juga mau mimpi. Kaya gini 😅😊,keren banget aku juga mau mimpi. kaya gini 😅😊,keren banget aku juga mau mimpi. kaya gini 😅😊,"[keren, banget, aku, juga, mau, mimpi, ., kaya..."


Unnamed: 0,Author,Comment,Comment_casefolded
0,@NadiaOmaraa,Hai wak! Untuk 2 minggu kedepan aku bakal uplo...,hai wak! untuk 2 minggu kedepan aku bakal uplo...
1,@zakiasz5556,ya kalo udah ngajak tidur ya pasti asli wujudn...,ya kalo udah ngajak tidur ya pasti asli wujudn...
2,@aliarohali8163,TIDAK ADA PART 2 NYA KAH ?? SERUUU😭,tidak ada part 2 nya kah ?? seruuu😭
3,@ElsaNuraeni-k9z,Adakah Yg nnton kembali Khw Teeerrrrrr Epic P...,adakah yg nnton kembali khw teeerrrrrr epic p...
4,@sarahagudjir7305,Anak kembar itu nyata aa tidak yaaa🤔🤔,anak kembar itu nyata aa tidak yaaa🤔🤔
5,@SarminahMinah-s7l,Merinding terus pas di sken tiara di bwa itu a...,merinding terus pas di sken tiara di bwa itu a...
6,@lilylyrics_40,siapa yang nonton ulang☝🏻,siapa yang nonton ulang☝🏻
7,@JuniSetiawati-v2b,Jin satu ini jatuh cinta ajah ga brni nyentuh ...,jin satu ini jatuh cinta ajah ga brni nyentuh ...
8,@RinaSulistianingsih-m6v,😂 sampe udh brp x nnton cerita ini gmn ya nasi...,😂 sampe udh brp x nnton cerita ini gmn ya nasi...
9,@rismaaulia8780,Nonton ini di 2025 👋🏻,nonton ini di 2025 👋🏻


In [None]:
# mengekspor dataset ke file CSV
compare_df.to_csv("Komentar_Video_Horor.csv", index=False, encoding ='utf-8')

# mengekspor dataset ke file Excel
compare_df.to_excel("Komentar_Video_Horor.xlsx", index=False)