Nama : Rika Ajeng Finatih

NIM : 121450036

Kelas : Pemrosesan Bahasa Alami

# Crawling Video Youtube

**Tujuan** dari program ini adalah melakukan crawling (pengambilan) data komentar pada sebuah video Youtube menggunakan **Youtube Data API v3**. Sebelum mencoba program ini, pastikan Anda sudah memiliki (mengaktifkan) layanan Youtube Data API dan telah membangkitkan **API Key**.

Jika belum memiliki **API KEY**, Anda dapat mengikuti petunjuk singkat sebagai berikut:
1. Login ke Google Developer Console (https://console.developers.google.com/) dengan akun Google Anda
2. Buat project baru dan lengkapi isian yang diminta.
3. Aktifkan Layanan API pada halaman project, dan cari **Youtube Data API v3**.
4. Dari halaman dashboard, buat kredential agar API tersebut dapat digunakan. Klik tombol **Buat Kredensial** (**Create Credential**). Lengkapi isian formnya.
5. Anda dapat mengakses / melihat API KEY pada tab **Credentials**.



##1. Import Library

In [115]:
import pandas as pd
# Mengimpor pustaka Pandas, yang digunakan untuk manipulasi dan analisis data dalam bentuk DataFrame.
# Pandas sangat berguna untuk operasi seperti membaca, memanipulasi, dan menyimpan data tabular.

from googleapiclient.discovery import build
# Mengimpor fungsi 'build' dari pustaka 'googleapiclient.discovery'.
# Fungsi 'build' digunakan untuk membuat objek layanan yang memungkinkan interaksi dengan API Google.
# Pustaka ini sering digunakan untuk berinteraksi dengan berbagai layanan Google API, seperti Google Sheets API, Google Drive API, dan lainnya.


##2. Fungsi untuk crawling komentar

In [116]:
def video_comments(video_id):
    # Daftar kosong untuk menyimpan balasan komentar
    replies = []

    # Membuat objek layanan YouTube menggunakan API key
    youtube = build('youtube', 'v3', developerKey=api_key)

    # Mengambil komentar video YouTube
    video_response = youtube.commentThreads().list(part='snippet,replies', videoId=video_id).execute()

    # Mengulangi respons video selama masih ada data
    while video_response:
        # Mengekstrak informasi dari setiap objek hasil
        for item in video_response['items']:
            # Mengekstrak informasi dari komentar tingkat atas
            published = item['snippet']['topLevelComment']['snippet']['publishedAt']
            user = item['snippet']['topLevelComment']['snippet']['authorDisplayName']
            comment = item['snippet']['topLevelComment']['snippet']['textDisplay']
            likeCount = item['snippet']['topLevelComment']['snippet']['likeCount']

            # Menambahkan komentar dan detailnya ke daftar balasan
            replies.append([published, user, comment, likeCount])

            # Menghitung jumlah balasan untuk komentar ini
            replycount = item['snippet']['totalReplyCount']

            # Jika ada balasan
            if replycount > 0:
                # Mengulangi setiap balasan
                for reply in item['replies']['comments']:
                    # Mengekstrak informasi dari setiap balasan
                    published = reply['snippet']['publishedAt']
                    user = reply['snippet']['authorDisplayName']
                    repl = reply['snippet']['textDisplay']
                    likeCount = reply['snippet']['likeCount']

                    # Menambahkan balasan dan detailnya ke daftar balasan
                    replies.append([published, user, repl, likeCount])

        # Jika ada halaman berikutnya, ambil data dari halaman berikutnya
        if 'nextPageToken' in video_response:
            video_response = youtube.commentThreads().list(
                part='snippet,replies',
                pageToken=video_response['nextPageToken'],
                videoId=video_id
            ).execute()
        else:
            break

    # Mengembalikan daftar balasan komentar
    return replies


##3. Jalankan Proses Crawling

In [117]:
# Isikan dengan API key
api_key = "AIzaSyBzJcbdOVsa9jjNz9e26WWAEOt0JQQWqC4"
# Ini adalah kunci API yang digunakan untuk mengakses YouTube Data API.
# Pastikan untuk mengganti dengan kunci API sendiri yang valid.

# Masukkan ID video
# URL video = https://www.youtube.com/watch?v=COgEJD_Fyec
video_id = "COgEJD_Fyec" # Isikan dengan kode / ID video YouTube yang ingin dianalisis
# Ini adalah ID video YouTube yang akan digunakan untuk mengambil komentar.
# ID video ini bisa ditemukan pada URL video YouTube setelah "v=".

# Memanggil fungsi untuk mengambil komentar
comments = video_comments(video_id)
# Fungsi video_comments dipanggil dengan ID video yang diberikan untuk mendapatkan daftar komentar dan balasan.
# Hasilnya disimpan dalam variabel 'comments'.

# Menampilkan hasil komentar
comments
# Menampilkan daftar komentar dan balasan yang telah diambil oleh fungsi video_comments.
# Ini akan menampilkan data dalam format yang telah ditentukan, termasuk tanggal publikasi, nama penulis, teks komentar, dan jumlah like.


[['2024-08-09T13:07:56Z',
  '@NessieJudge',
  'Hey Nerrroristtt!!! Seneng banget ditemenin Sandy di video kali ini!!<br>Ayo semua dm Sandy buat bikin channel youtubenya!! Hehehehe karena aku genuinely seneng banget buat konten bareng Sandy, such a fun, bright, kind, entertaining persona! What a blessing it is to have you emerged from &quot;Ruang Guru &#39;Clash of Champions&#39;&quot; 🙏🏻<br>Thanks for coming &amp; chillin with Nerrorist, Sandy! You&#39;re always welcome! 🖤✨',
  4754],
 ['2024-08-09T13:08:57Z', '@Vivihartini26', 'makasihhh ka ness ❤❤❤❤❤', 24],
 ['2024-08-09T13:10:38Z',
  '@annisanurhidayah_',
  'hihi happy bngt ada Sandy, thanks kak Nessie 😍',
  24],
 ['2024-08-09T13:16:52Z',
  '@HESTIYANI2909',
  'Asiyaaap kk. Terimakasih telah memberikan saran yg baik🎉❤',
  14],
 ['2024-08-09T13:23:52Z', '@halo6849', 'Wow ada esther', 11],
 ['2024-08-09T13:25:52Z',
  '@putrisaputri3763',
  'Makasih ka Nessie udh ngajak Sandy Nerror❤',
  12],
 ['2024-09-07T09:41:55Z',
  '@micchonshikim

##4. Ubah Hasil Crawling ke Dataframe

In [118]:
# Mengonversi daftar komentar menjadi DataFrame Pandas
# 'comments' adalah daftar yang berisi data komentar dan balasan yang diambil dari video YouTube
df = pd.DataFrame(comments, columns=['publishedAt', 'authorDisplayName', 'textDisplay', 'likeCount'])
# Menggunakan pd.DataFrame() untuk membuat objek DataFrame dari daftar 'comments'
# Parameter 'columns' digunakan untuk memberikan nama kolom yang sesuai untuk DataFrame
# - 'publishedAt': Tanggal dan waktu komentar diterbitkan
# - 'authorDisplayName': Nama penulis komentar
# - 'textDisplay': Teks dari komentar
# - 'likeCount': Jumlah like yang diterima oleh komentar

# Menampilkan DataFrame
df
# Menampilkan DataFrame 'df' yang berisi data komentar dalam format tabel
# Setiap baris mewakili sebuah komentar atau balasan, dengan kolom-kolom yang telah ditentukan


Unnamed: 0,publishedAt,authorDisplayName,textDisplay,likeCount
0,2024-08-09T13:07:56Z,@NessieJudge,Hey Nerrroristtt!!! Seneng banget ditemenin Sa...,4754
1,2024-08-09T13:08:57Z,@Vivihartini26,makasihhh ka ness ❤❤❤❤❤,24
2,2024-08-09T13:10:38Z,@annisanurhidayah_,"hihi happy bngt ada Sandy, thanks kak Nessie 😍",24
3,2024-08-09T13:16:52Z,@HESTIYANI2909,Asiyaaap kk. Terimakasih telah memberikan sara...,14
4,2024-08-09T13:23:52Z,@halo6849,Wow ada esther,11
...,...,...,...,...
2579,2024-08-09T12:01:01Z,@nadyazerlia3582,SERUUUU BGTTT SAMA SANDYYYY!!!,30
2580,2024-08-09T12:01:00Z,@aisyahprimasuri5863,first,0
2581,2024-08-09T12:01:00Z,@vanessanurhaliza6614,kerenn,0
2582,2024-08-09T12:00:59Z,@_saalsabilaaa,yeeyy akhirnya🎉,3


##5. Simpan Hasil Crawling ke file CSV

In [119]:
# Menyimpan DataFrame 'df' ke dalam file CSV
df.to_csv('Hasil Scraping Data.csv', index=False)
# Fungsi to_csv() digunakan untuk menyimpan DataFrame Pandas 'df' ke dalam format file CSV
# Nama file output adalah 'Hasil Scraping Data.csv'
# Parameter 'index=False' memastikan bahwa kolom indeks DataFrame tidak disertakan dalam file CSV
# Hanya kolom data yang akan disimpan, tanpa kolom indeks
# Ini memungkinkan Anda untuk menyimpan dan membagikan data komentar yang telah diambil dari video YouTube dalam format yang mudah diakses dan digunakan.


**Referensi:**
1. [Crawling data dengan python](https://youtu.be/BOER7ua8L14?si=86tVkQ95Pgq_n8Sc)

2. [Aktivasi Key Youtube Data API v3](https://youtu.be/LLAZUTbc97I?si=nChlS6iA0wWTLPhi)

# Preprocessing Data

Preprocessing data teks adalah proses awal yang dilakukan untuk mempersiapkan data teks mentah sebelum digunakan dalam analisis lebih lanjut, seperti pemodelan mesin pembelajaran, analisis sentimen, atau text mining. Tujuan dari preprocessing adalah untuk mengubah teks mentah menjadi bentuk yang lebih terstruktur dan bersih, sehingga dapat diolah dengan lebih efektif oleh algoritma.

Berikut adalah beberapa langkah umum dalam preprocessing data teks:

## 1. Load Data

Setelah dataset kita dapatkan, kita akan masuk ke tahap text preprocessing. Pertama kita akan load dataset kedalam Dataframe menggunakan Pandas.

In [120]:
# Import library
import pandas as pd  # Mengimpor pustaka Pandas, digunakan untuk manipulasi dan analisis data dalam bentuk DataFrame.
import numpy as np   # Mengimpor pustaka NumPy, digunakan untuk operasi numerik dan array multidimensi.

# Load Dataset
MyData = pd.read_csv("/content/Hasil Scraping Data.csv")
# Membaca dataset dari file CSV bernama "Hasil Scraping Data.csv" yang berada di direktori "/content/".
# Dataset tersebut kemudian dimuat ke dalam variabel `MyData` sebagai DataFrame.

# Menampilkan seluruh konten dari DataFrame `MyData`
MyData


Unnamed: 0,publishedAt,authorDisplayName,textDisplay,likeCount
0,2024-08-09T13:07:56Z,@NessieJudge,Hey Nerrroristtt!!! Seneng banget ditemenin Sa...,4754
1,2024-08-09T13:08:57Z,@Vivihartini26,makasihhh ka ness ❤❤❤❤❤,24
2,2024-08-09T13:10:38Z,@annisanurhidayah_,"hihi happy bngt ada Sandy, thanks kak Nessie 😍",24
3,2024-08-09T13:16:52Z,@HESTIYANI2909,Asiyaaap kk. Terimakasih telah memberikan sara...,14
4,2024-08-09T13:23:52Z,@halo6849,Wow ada esther,11
...,...,...,...,...
2579,2024-08-09T12:01:01Z,@nadyazerlia3582,SERUUUU BGTTT SAMA SANDYYYY!!!,30
2580,2024-08-09T12:01:00Z,@aisyahprimasuri5863,first,0
2581,2024-08-09T12:01:00Z,@vanessanurhaliza6614,kerenn,0
2582,2024-08-09T12:00:59Z,@_saalsabilaaa,yeeyy akhirnya🎉,3


## 2. Case Folding

Kemudian, gunakan fungsi `lower()` di kelas `Series.str` di perpustakaan `Pandas` untuk melakukan pelipatan kasus pada bingkai data crawling komentar youtube di atas.
 Menggunakan fungsi Pandas internal  ini jauh lebih cepat daripada mengulangi semua baris dalam bingkai data dan melipat huruf untuk setiap baris menggunakan fungsi `.lower()` biasa.



In [121]:
# Mengubah semua teks pada kolom 'textDisplay' menjadi huruf kecil (lowercase)
# Fungsi Series.str.lower() pada Pandas digunakan untuk mengubah setiap karakter dalam string menjadi huruf kecil.
# Ini berguna untuk proses normalisasi teks, terutama dalam analisis teks seperti text mining atau sentiment analysis,
# di mana perbedaan antara huruf besar dan kecil tidak relevan.
MyData['textDisplay'] = MyData['textDisplay'].str.lower()

# Menampilkan pesan untuk menunjukkan hasil dari proses case folding (konversi ke huruf kecil)
print('Case Folding Result : \n')

# Menampilkan 5 baris pertama dari kolom 'textDisplay' yang telah diubah ke huruf kecil
print(MyData['textDisplay'].head(5))

# Menambahkan beberapa baris kosong untuk pemisahan visual
print('\n\n\n')

Case Folding Result : 

0    hey nerrroristtt!!! seneng banget ditemenin sa...
1                              makasihhh ka ness ❤❤❤❤❤
2       hihi happy bngt ada sandy, thanks kak nessie 😍
3    asiyaaap kk. terimakasih telah memberikan sara...
4                                       wow ada esther
Name: textDisplay, dtype: object






## 3. Tokenizing

Selama fase ini, proses penghapusan nomor, penghapusan huruf besar-kecil, penghapusan tanda baca, dan `word_tokenize()` dilakukan untuk membagi string menjadi token.
 Kerangka Data atau Seri Pandas dapat menjalankan fungsi eksternal yang diterapkan ke kolom atau baris  menggunakan fungsi `.apply().`

In [122]:
import string
import re # Mengimpor pustaka regex (regular expressions)

# Mengimpor word_tokenize & FreqDist dari NLTK
from nltk.tokenize import word_tokenize
from nltk.probability import FreqDist

#!pip install nltk # Instalasi pustaka NLTK jika belum terinstal
import nltk # Mengimpor pustaka NLTK
nltk.download('punkt') # Mengunduh sumber daya 'punkt' untuk tokenisasi

# ------ Tokenizing ---------

# Fungsi untuk menghapus karakter spesial pada tweet
def remove_tweet_special(text):
    # Menghapus tab, new line, dan backslash
    text = text.replace('\\t'," ").replace('\\n'," ").replace('\\u'," ").replace('\\',"")
    # Menghapus karakter non-ASCII (emoticon, karakter China, dll.)
    text = text.encode('ascii', 'replace').decode('ascii')
    # Menghapus mention, link, dan hashtag
    text = ' '.join(re.sub("([@#][A-Za-z0-9]+)|(\w+:\/\/\S+)"," ", text).split())
    # Menghapus URL yang tidak lengkap
    return text.replace("http://", " ").replace("https://", " ")

# Menerapkan fungsi remove_tweet_special pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_tweet_special)

# Fungsi untuk menghapus angka dari teks
def remove_number(text):
    return  re.sub(r"\d+", "", text)

# Menerapkan fungsi remove_number pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_number)

# Fungsi untuk menghapus tanda baca dari teks
def remove_punctuation(text):
    return text.translate(str.maketrans("", "", string.punctuation))

# Menerapkan fungsi remove_punctuation pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_punctuation)

# Fungsi untuk menghapus spasi berlebih di awal dan akhir teks
def remove_whitespace_LT(text):
    return text.strip()

# Menerapkan fungsi remove_whitespace_LT pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_whitespace_LT)

# Fungsi untuk mengubah spasi ganda menjadi satu spasi
def remove_whitespace_multiple(text):
    return re.sub('\s+',' ',text)

# Menerapkan fungsi remove_whitespace_multiple pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_whitespace_multiple)

# Fungsi untuk menghapus karakter tunggal (misalnya, huruf tunggal yang berdiri sendiri)
def remove_singl_char(text):
    return re.sub(r"\b[a-zA-Z]\b", "", text)

# Menerapkan fungsi remove_singl_char pada kolom 'textDisplay'
MyData['textDisplay'] = MyData['textDisplay'].apply(remove_singl_char)

# Fungsi untuk melakukan tokenisasi kata menggunakan NLTK
def word_tokenize_wrapper(text):
    return word_tokenize(text)

# Menerapkan fungsi word_tokenize_wrapper pada kolom 'textDisplay' dan menyimpan hasilnya di kolom 'tweet_tokens'
MyData['tweet_tokens'] = MyData['textDisplay'].apply(word_tokenize_wrapper)

# Menampilkan hasil tokenisasi
print('Tokenizing Result : \n')
print(MyData['tweet_tokens'].head())
print('\n\n\n')


[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


Tokenizing Result : 

0    [hey, nerrroristtt, seneng, banget, ditemenin,...
1                                [makasihhh, ka, ness]
2    [hihi, happy, bngt, ada, sandy, thanks, kak, n...
3    [asiyaaap, kk, terimakasih, telah, memberikan,...
4                                   [wow, ada, esther]
Name: tweet_tokens, dtype: object






Selanjutnya, gunakan fungsi `.freqDist()` dalam fungsi .`apply()` untuk menghitung frekuensi distribusi token untuk setiap baris bingkai data.












In [123]:
# NLTK calc frequency distribution
def freqDist_wrapper(text):
    # Menghitung distribusi frekuensi kata dalam teks yang diberikan
    # FreqDist adalah fungsi dari NLTK yang menghitung frekuensi kemunculan setiap token (kata) dalam teks
    return FreqDist(text)

# Menerapkan fungsi freqDist_wrapper pada kolom 'tweet_tokens'
# 'tweet_tokens' berisi token kata dari tweet yang sudah diolah sebelumnya
MyData['tweet_tokens_fdist'] = MyData['tweet_tokens'].apply(freqDist_wrapper)

# Menampilkan hasil distribusi frekuensi dari token yang paling umum
print('Frequency Tokens : \n')
# Menampilkan lima baris pertama dari kolom 'tweet_tokens_fdist'
# Fungsi apply dengan lambda digunakan untuk menampilkan token yang paling umum beserta frekuensinya
print(MyData['tweet_tokens_fdist'].head().apply(lambda x : x.most_common()))


Frequency Tokens : 

0    [(sandy, 4), (seneng, 2), (banget, 2), (buat, ...
1                 [(makasihhh, 1), (ka, 1), (ness, 1)]
2    [(hihi, 1), (happy, 1), (bngt, 1), (ada, 1), (...
3    [(asiyaaap, 1), (kk, 1), (terimakasih, 1), (te...
4                    [(wow, 1), (ada, 1), (esther, 1)]
Name: tweet_tokens_fdist, dtype: object


## 4. Filtering (Stop Removal)

Pada tahap ini dilakukan filter frame data menggunakan stopword bahasa Indonesia dari perpustakaan NLTK.
 kita juga dapat menambahkan ke daftar stopwords menggunakan fungsi `.extend() `dari `list_stopword.`
 Menggunakan fungsi `.set()` berguna untuk mengubah daftar yang dapat diubah menjadi rangkaian elemen yang dapat diubah.
 Hal ini dapat mempercepat proses pengecekan apakah token ada di `list_stopword `(jika tidak ada di `list_stopword:` ).

In [124]:
import nltk
import pandas as pd
from nltk.corpus import stopwords

# ----------------------- get stopword from NLTK stopword -------------------------------
# Mendapatkan daftar stopword bahasa Indonesia dari NLTK
list_stopwords = stopwords.words('indonesian')

# ---------------------------- manually add stopword ------------------------------------
# Menambahkan stopword tambahan secara manual ke daftar stopword
list_stopwords.extend(["di", "aku", "ada", "itu", "dan", "yg", 'yang',
                       'sama', 'dia', 'ini', 'ke', 'pas',
                       'ga', 'banget', 'nya', 'juga', 'jadi'])

# ---------------------------------------------------------------------------------------
# Mengonversi daftar stopword menjadi set untuk pencarian yang lebih cepat
list_stopwords = set(list_stopwords)

# Fungsi untuk menghapus stopwords dari daftar token
def stopwords_removal(words):
    # Mengembalikan daftar token yang tidak termasuk dalam daftar stopword
    return [word for word in words if word not in list_stopwords]

# Menerapkan fungsi stopwords_removal pada kolom 'tweet_tokens'
# Kolom 'tweet_tokens' berisi token kata dari tweet yang telah diolah sebelumnya
MyData['tweet_tokens_WSW'] = MyData['tweet_tokens'].apply(stopwords_removal)

# Menampilkan beberapa hasil pertama dari kolom 'tweet_tokens_WSW'
print(MyData['tweet_tokens_WSW'].head())


0    [hey, nerrroristtt, seneng, ditemenin, sandy, ...
1                                [makasihhh, ka, ness]
2      [hihi, happy, bngt, sandy, thanks, kak, nessie]
3                   [asiyaaap, kk, terimakasih, saran]
4                                        [wow, esther]
Name: tweet_tokens_WSW, dtype: object


## 5. Normalization

Normalisasi membakukan istilah-istilah yang mempunyai arti sama tetapi ejaannya berbeda.
 Hal ini dapat disebabkan oleh kesalahan ejaan, singkatan kata, atau “bahasa gaul”.

In [125]:
# Membaca file Excel yang berisi tabel normalisasi kata
# File ini diharapkan memiliki dua kolom: kata asli dan kata normalisasi
normalizad_word = pd.read_excel("normalisasi.xlsx")

# Membuat dictionary untuk menyimpan pasangan kata asli dan kata normalisasi
normalizad_word_dict = {}

# Mengisi dictionary dengan data dari file Excel
for index, row in normalizad_word.iterrows():
    if row[0] not in normalizad_word_dict:
        normalizad_word_dict[row[0]] = row[1]

# Fungsi untuk menggantikan kata dalam dokumen dengan kata normalisasi
def normalized_term(document):
    # Mengembalikan daftar kata yang telah dinormalisasi
    # Jika kata ada dalam dictionary normalizad_word_dict, ganti dengan nilai yang sesuai
    # Jika tidak ada, tetap gunakan kata aslinya
    return [normalizad_word_dict[term] if term in normalizad_word_dict else term for term in document]

# Menerapkan fungsi normalized_term pada kolom 'tweet_tokens_WSW'
# Kolom ini berisi token kata setelah penghapusan stopword
# Hasilnya adalah kolom baru 'tweet_normalized' yang berisi token yang telah dinormalisasi
MyData['tweet_normalized'] = MyData['tweet_tokens_WSW'].apply(normalized_term)

# Menampilkan sepuluh baris pertama dari kolom 'tweet_normalized'
# Kolom ini berisi token yang telah dinormalisasi
MyData['tweet_normalized'].head(10)


  if row[0] not in normalizad_word_dict:
  normalizad_word_dict[row[0]] = row[1]


Unnamed: 0,tweet_normalized
0,"[hey, nerorist, senang, ditemenin, sandy, vide..."
1,"[terimakasih, kakak, nessie]"
2,"[hihi, bahagia, banget, sandy, terimakasih, ka..."
3,"[siap, kakak, terimakasih, saran]"
4,"[wow, esther]"
5,"[terimakasih, kakak, nessie, sudah, mengundang..."
6,"[kakak, nessie, seperti, orang, india, cantik,..."
7,"[kuntilanak, laki, rambutnya, gaada, barbersho..."
8,"[kakak, nessie, ceritain, tpi, gtau, kpan]"
9,"[kejutan, sandy, pengetahuan, mistisnya, lumay..."


## 6. Simpan Hasil Preprocessing

In [126]:
# Menyimpan DataFrame MyData ke dalam file CSV
# Nama file output adalah "Hasil Processing Data.csv"
# File ini akan berisi hasil pemrosesan data yang telah dilakukan sebelumnya
# termasuk token yang telah dinormalisasi dan hasil pemrosesan lainnya.
MyData.to_csv("Hasil Processing Data.csv", index=False)

# Lampiran

Berikut merupakan hasil dari scaraping data dan hasil dari proses processing data: [Klik disini](https://drive.google.com/drive/folders/1iydmbhM9JGFYux5FGapYJGf7mFZGyzbz?usp=sharing)