## 1. Import Libraries for Scraping Data YouTube Comments and Create API based on Google YouTube Data API

In [9]:
"""
Meng-import pandas library serta sebuah library dari Google Client untuk dapat
mengambil beberapa informasi/data rangkaian komentar utama dari video YouTube
menggunakan API yang telah disediakan oleh service YouTube Data API V3 dari Google Cloud Platform Console
"""
import pandas as pd
from googleapiclient.discovery import build

In [10]:
"""
Menginisialisasikan resource/sumber daya dari Google API Client sehingga dengan resource
Google API dapat melakukan proses pengambilan (scraping) data/informasi tentang rangkaian-rangkaian
komentar utama (bukan sebuah teks komentar yang bersifat balasan/reply dari suatu komentar) yang ada di dalam video
debat babak kedua capres-cawapres Republik Indonesia tahun 2024 yang di-upload oleh channel YouTube KOMPASTV
menggunakan API yang telah didapatkan dari service oogle Cloud Platform Console yaitu YouTube Data API v3
"""

"""
Nilai 'youtube' pada variabel "API_Service_Name" menjelaskan bahwa API yang digunakan di dalam penelitian ini
merupakan sebuah nama layanan/service dari Google Cloud Platform yaitu YouTube Data API karena
data-data yang akan diambil dan digunakan berasal dari rangkaian data pada konten video YouTube
debat capres-cawapres babak kedua yang di-upload oleh channel YouTube KOMPASTV
"""
API_Service_Name = "youtube"


"""
Nilai v3 yang tersimpan pada variabel "API_Version_Name" menjelaskan bahwasanya jenis/tipe versi API yang digunakan oleh nama
service API dari Google Client yakni youtube(sesuai dengan nama service yang tersimpan pada variabel "API_Service_Name")
merupakan versi ketiga dari sebuah layanan/service yang berada di dalam Google Cloud Platform Console yaitu YouTube Data API v3
"""
API_Version_Name = "v3"


"""
Merupakan sebuah kunci dari nama service API yang digunakan (yaitu service yang bernama youtube v3) dengan didapatkan dari
proses pembuatan API Key pada CREDENTIALS di dalam service YouTube Data API v3 yang ada di dalam
Google Cloud Platform Console agar dengan API ini dapat mengakses serta menggunakan rangkaian
objek/elemen yang tersimpan di dalam YouTube seperti informasi video playlist pada suatu channel, komentar video, dll
"""
API_Key = "AIzaSyC7xHw2L7e_bJ-zCRyOKxwB3Drje2f4zd4"


"""
Menyimpan 3 variabel objek resource yang sebelumnya telah didefinisikan seperti
nama service API (API_Version_Name), versi API Youtube yang digunakan (API_Version_Name)
serta kunci API (API_Key) yang didapatkan melalui proses pembuatan API Key di dalam CREDENTIALS YouTube Data API v3
dan disimpan di dalam variabel bernama "youtube_scrape_comment_objects"
"""
youtube_scrape_comment_objects = build(API_Service_Name, API_Version_Name, developerKey = API_Key)

Code script diatas merupakan proses inisialisasi API Key yang telah berhasil didapatkan melalui Google Cloud Platform dengan pilihan service yakni YouTube Data API v3. Maka dari itu nama service API yang digunakan (API_Service_Name) ditulis sebagai "youtube" karena service/layanan Google pada Google Cloud Platform yang digunakan di dalam penelitian kali ini adalah sebuah video yang ter-upload pada media sosial YouTube dan versi API yang digunakan adalah versi ketiga dari API YouTube Data sehingga nilai dari variabel API_Version_Name yang disimpan adalah "v3".

Selain itu, untuk mendapatkan kunci API dari layanan yang bernama "youtube", pertama-tama saya harus masuk ke dalam service YouTube Data API v3 di dalam Google Cloud Platform dan mengaktifkan (enable) service tersebut dan memilih fitur/opsi CREDENTIALS karena API Key berada di dalam fitur tersebut. Jadi dapat disimpulkan kalau untuk membuat API Key agar dapat mengambil data-data yang ada di dalam suatu video YouTube seperti komentar dari 1 video YouTube, Playlist, Subscription, dll., maka terlebih dahulu harus mengaktifkan service YouTube Data API v3 di dalam Google Cloud Platform dan kemudian membuat/generate API Key di dalam opsi CREDENTIALS. Jika API sudah berhasil dibuat, maka kita dapat meng-copy API tersebut untuk diletakkan di dalam variabel. Pada code script diatas, API yang berhasil didapatkan disimpan di dalam variabel yang bernama "API_KEY".

Di samping itu, fungsi build pada library googleapiclient.discovery merupakan sebuah Software Development Kits (SDKs) yang telah disediakan oleh Google agar para developer/scientist dapat mengakses semua layanan berbasis Google melalui API seperti video/konten YouTube, BigQuery, dll. Jadi dapat disimpulkan bahwasanya dengan mendefinisikan nama layanan Google yang akan digunakan dan API yang telah didapatkan berdasarkan layanan yang akan digunakan, maka setiap orang diseluruh dunia dapat mengakses dan mendapatkan data-data atau informasi dunia melalui layanan Google. Seperti pada penelitian kali ini yang sumber datanya merupakan data-data komentar dari video debat babak kedua capres-cawapres yang di-upload oleh channel YouTube KOMPASTV.

## 2. Request Access to Retrieve Main Comments Data Objects on YouTube Video based on API Key, API Service Name, and API Version

In [11]:
"""
Melakukan proses request untuk dapat mengambil/mengakses serangkaian informasi/data
komentar utama dari sebuah konten video YouTube tentang debat capres-cawapres babak kedua
Republik Indonesia tahun 2024 yang di-upload oleh channel YouTube KOMPASTV
berdasarkan ID yang dimiliki oleh video tersebut dengan menggunakan API yang sebelumnya
telah didapatkan di CREDENTIALS service YouTube Data API v3
"""

video_youtube_data_request = youtube_scrape_comment_objects.commentThreads().list(
    part = "snippet", # snippet pada parameter part merupakan objek list dari seluruh elemen yang dimiliki oleh komentar utama
    videoId = "92k51DVSDv4", # Sebuah ID dari video debat kedua capres-cawapres yang di-upload oleh channel YouTube KOMPASTV 
    maxResults = 100, # Jumlah komentar yang akan diambil dari video debat kedua sesuai jumlah limit di service Youtube Data API
    order = "time" # time pada parameter order mengartikan urutan komentar yang akan diambil dari yang terbaru hingga terlama
)


"""
Mengeksekusi/menjalankan request yang telah dibuat dan disimpan pada variabel "video_youtube_data_request"
untuk mendapatkan 100 rangkaian data/informasi komentar utama berdasarkan video debat capres-cawapres
babak kedua yang memiliki ID video yaitu 92k51DVSDv4 dengan urutan data komentar yang akan diambil
berdasarkan teks komentar dengan tanggal dan waktu komentar terbaru hingga tanggal dan waktu komentar terlama
"""
video_youtube_data_response = video_youtube_data_request.execute()

Berikut adalah penjelasan mengenai code script diatas berikut ini:

1. youtube_scrape_comment_objects merupakan sebuah nama variabel yang berisikan parameter-parameter beserta nilainya yang berfungsi sebagai tempat menyimpan resource utama Google Client serta API dari YouTube untuk dapat mengakses data-data dan informasi yang dimiliki oleh suatu konten YouTube seperti informasi video, komentar di dalam suatu video, playlist dari suatu channel, dll, dengan memanfaatkan kunci API (API KEY) yang didapatkan melalui Google Cloud Platform dengan cara membuat credentials API di dalam salah satu service Google Cloud Platform yaitu YouTube Data API v3.

2. commentThreads merupakan suatu sumber daya dari YouTube Data API yang berisikan objek/elemen atas informasi-informasi dari rangkaian komentar utama/komentar paling atas dari suatu konten video di YouTube atau rangkaian komentar balasan atas komentar utama jike komentar utama memiliki komentar balasannya.

3. Parameter "part" bertujuan untuk mendapatkan banyak objek list properti yang dipisahkan oleh tanda koma (comma-separated list) dari sumber daya yang dimiliki oleh service YouTube Data API v3 yang membentuk rangkaian komentar utama (komentar teratas) dari suatu video. Sedangkan "snippet" pada parameter "part" bertujuan untuk mendapatkan objek informasi detail dasar tentang elemen-elemen/item yang dimiliki oleh komentar utama sebagai bentuk respon API YouTube terhadap permintaan dalam mengambil objek-objek data dari sebuah konten video berdasarkan video id yang didefinisikan pada parameter "videoId". Salah satu contoh detail dasar dari komentar utama seperti channel id sebagai identitas unik dari suatu channel yang ada di media sosial YouTube.

4. Parameter videoId merupakan sebuah identitas unik dari setiap konten video (ID dari suatu konten video YouTube) yang informasi dasarnya ingin diambil (data scraping) untuk kebutuhan yang berbeda-beda. Sebagai contohnya pada penelitian kali ini, saya ingin menggunakan video tentang debat babak kedua capres-cawapres Republik Indonesia tahun 2024 dari channel YouTube KOMPASTV dan video tersebut memiliki alamat URL yakni https://www.youtube.com/watch?v=92k51DVSDv4. Jadi ID video "92k51DVSDv4" diambil dari URL pada video tersebut yang letaknya setelah v=.

4. Parameter maxResult merupakan sebuah parameter yang secara spesifik bertujuan untuk mengambil jumlah kuantitas dari data/informasi komentar utama yang ingin diambil dari suatu konten video di media sosial YouTube berdasarkan ID unik yang didefinisikan pada parameter videoId. Tetapi kuantitas jumlah data/informasi komentar yang dapat diambil menggunakan API dari service Google Client hanya 100 data saja, tidak bisa lebih dari 100 data. Sehingga karena penelitian kali ini akan mengambil lebih dari 100 data, maka diperlukan tahapan/teknik pengulangan supaya data komentar yang terambil dapat melebihi 100 data. Tahapan untuk mengambil data lebih dari 100 data akan dilakukan setelah berhasil mendapatkan 100 data komentar (berdasarkan jumlah maksimal data komentar yang dapat diambil menggunakan API Google YouTube v3).

5. Parameter order merupakan sebuah parameter yang dimiliki oleh fungsi commentThreads() yang bertujuan untuk menentukan urutan data komentar yang ingin diambil (di-scraping) sebagai permintaan/request dari Google API Client terhadap komentar yang dimiliki oleh konten-konten video yang berada di media sosial YouTube. Konten video tersebut ditentukan oleh video ID yang dimiliki oleh parameter videoId. Parameter order memiliki 2 nilai yang valid yaitu time dan relevance. Jika nilai dari parameter order adalah time maka urutan data komentar yang diambil akan terdiri dari komentar-komentar yang paling baru dibuat pada video tersebut berdasarkan tanggal dan waktu dari setiap teks komentar. Sebagai contoh jika terdapat teks komentar seperti "47, 39, 32 merupakan angka yang diurutkan secara Descending (nilai paling tinggi hingga nilai terendah)" dibuat di tanggal 12 Februari tahun 2024 dan teks komentar lainnya adalah "11, 12, 15 merupakan angka yang diurutkan secara Ascending (nilai paling rendah hingga nilai paling tinggi)" yang dibuat di tanggal 29 Agustus tahun 2023, maka urutan data teks komentar yang tersimpan lebih dulu yang berada paling atas dari urutan data adalah teks komentar yang berbunyi "47, 39, 32 merupakan angka yang diurutkan secara Descending (nilai paling tinggi hingga nilai terendah)" dan setelahnya adalah "11, 12, 15 merupakan angka yang diurutkan secara Ascending (nilai paling rendah hingga nilai paling tinggi)". Jadi pada dasarnya nilai time di dalam parameter order akan mengurutkan rangkaian komentar dari suatu konten video di media sosial YouTube (berdasarkan video id) yang berhasil diambil berdasarkan tanggal dan waktu pembuatan teks komentar paling baru hingga tanggal dan waktu pembuatan teks komentar paling terlama.

In [12]:
"""
Menampilkan seluruh objek serta elemen dari 100 data/informasi pada rangkaian komentar utama
(teks komentar yang bukan merupakan balasan/reply dari suatu komentar) dari video debat
babak kedua capres-cawapres yang ditayangkan oleh channel YouTube KOMPASTV yang berhasil
di-scraping menggunakan API Key dari service Google Cloud Console yaitu YouTube Data API v3
"""
video_youtube_data_response

{'kind': 'youtube#commentThreadListResponse',
 'etag': 'xAz6s5ZPk6sprwTPH-OV55Bc8lU',
 'nextPageToken': 'Z2V0X25ld2VzdF9maXJzdC0tQ2dnSWdBUVZGN2ZST0JJRkNLZ2dHQUFTQlFpZElCZ0JFZ1VJaHlBWUFCSUZDSWdnR0FBU0JRaUpJQmdBR0FBaURnb01DUFRyajYwR0VNaWVsc0FD',
 'pageInfo': {'totalResults': 100, 'resultsPerPage': 100},
 'items': [{'kind': 'youtube#commentThread',
   'etag': 'iqNl7DCwzGjdFmjdte-7S30EY-M',
   'id': 'Ugx4IdhlAX3ObKYL0EN4AaABAg',
   'snippet': {'channelId': 'UC5BMIWZe9isJXLZZWPWvBlg',
    'videoId': '92k51DVSDv4',
    'topLevelComment': {'kind': 'youtube#comment',
     'etag': 'LwnDCxkEdbrGzLooFYTwaOeTPOg',
     'id': 'Ugx4IdhlAX3ObKYL0EN4AaABAg',
     'snippet': {'channelId': 'UC5BMIWZe9isJXLZZWPWvBlg',
      'videoId': '92k51DVSDv4',
      'textDisplay': '1.FAJAR=MUHAIMIN<br>2.JAFAR=GIBRAN<br>3.RAJAF=MAHFUD',
      'textOriginal': '1.FAJAR=MUHAIMIN\n2.JAFAR=GIBRAN\n3.RAJAF=MAHFUD',
      'authorDisplayName': '@muhammadfajar4208',
      'authorProfileImageUrl': 'https://yt3.ggpht.com/-I9mz