In [10]:
import sys, io, time, csv
import pandas as pd
from tqdm import tqdm
from selenium import webdriver
from selenium.common import exceptions

Extracts the comments from the Youtube video given by the URL.

In [13]:
def scrape(url):
    """
    Extracts the comments from the Youtube video given by the URL.
    Args:
        url (str): The URL to the Youtube video
    Raises:
        selenium.common.exceptions.NoSuchElementException:
        When certain elements to look for cannot be found
    """

    # Note: Download and replace argument with path to the driver executable.
    # Simply download the executable and move it into the webdrivers folder.
    driver = webdriver.Chrome('./chromedriver.exe')

    # Navigates to the URL, maximizes the current window, and
    # then suspends execution for (at least) 5 seconds (this
    # gives time for the page to load).
    driver.get(url)
    driver.maximize_window()
    time.sleep(10)

    try:
        # Extract the elements storing the video title and
        # comment section.
        title = driver.find_element_by_xpath('//*[@id="container"]/h1/yt-formatted-string').text
        comment_section = driver.find_element_by_xpath('//*[@id="comments"]')
    except exceptions.NoSuchElementException:
        # Note: Youtube may have changed their HTML layouts for
        # videos, so raise an error for sanity sake in case the
        # elements provided cannot be found anymore.
        error = "Error: Double check selector OR "
        error += "element may not yet be on the screen at the time of the find operation"
        print(error)

    # Scroll into view the comment section, then allow some time
    # for everything to be loaded as necessary.
    driver.execute_script("arguments[0].scrollIntoView();", comment_section)
    time.sleep(12)

    # Scroll all the way down to the bottom in order to get all the
    # elements loaded (since Youtube dynamically loads them).
    last_height = driver.execute_script("return document.documentElement.scrollHeight")

    while True:
        # Scroll down 'til "next load".
        driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")

        # Wait to load everything thus far.
        time.sleep(5)

        # Calculate new scroll height and compare with last scroll height.
        new_height = driver.execute_script("return document.documentElement.scrollHeight")
        if new_height == last_height:
            break
        last_height = new_height

    # One last scroll just in case.
    driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")

    try:
        # Extract the elements storing the usernames and comments.
        username_elems = driver.find_elements_by_xpath('//*[@id="author-text"]')
        comment_elems = driver.find_elements_by_xpath('//*[@id="content-text"]')
    except exceptions.NoSuchElementException:
        error = "Error: Double check selector OR "
        error += "element may not yet be on the screen at the time of the find operation"
        print(error)

#     print("> VIDEO TITLE: " + title + "\n" + "====> " + str(len(username_elems)) + " Comments found. \n")

    with io.open('./data/results.csv', 'a', newline='', encoding="utf-16") as file:
        writer = csv.writer(file, delimiter =",", quoting=csv.QUOTE_ALL)
#         writer.writerow(["Username", "Comment"])
        for username, comment in zip(username_elems, comment_elems):
            writer.writerow([username.text, comment.text])

    driver.close()

In [14]:
scrape("https://www.youtube.com/watch?v=WuisRYDpQQg")

> VIDEO TITLE: حلقة بعنوان : بزاااف ديال البرد
====> 38 Comments found. 



In [26]:
yt_urls = pd.read_csv('./data/youtube_videos.csv')
yt_urls.head()

Unnamed: 0,url
0,https://www.youtube.com/watch?v=zpAxJfKxucw
1,https://www.youtube.com/watch?v=C5z27AuXRck
2,https://www.youtube.com/watch?v=61FilFpMVJ8
3,https://www.youtube.com/watch?v=Kxq1id9Be0o
4,https://www.youtube.com/watch?v=AEOFY1E499o


In [27]:
for url in tqdm(yt_urls["url"]):
    scrape(url)

  0%|                                                                                           | 0/51 [00:00<?, ?it/s]

> VIDEO TITLE: من طنجة..نايضة بالمحكمة وقاتل الطفل عدنان يعترف للقاضي بتفاصيل خطيرة..شوفو كيفاش قتل الضحية
====> 20 Comments found. 



  4%|███▎                                                                               | 2/51 [01:07<28:58, 35.48s/it]

> VIDEO TITLE: الفنان ولد الحوات فركع الرمانة وفضح المنادجر ديالو والقضية فيها الاعتداء على الشيخات والفلوس
====> 0 Comments found. 

> VIDEO TITLE: من الدارالبيضاء..فضيحة كبرى للفنان سعيد ولد الحوات يكشفها مدير أعماله: هاشنو دار ليا أسرار خطيرة
====> 60 Comments found. 



  6%|████▉                                                                              | 3/51 [01:51<30:24, 38.02s/it]

> VIDEO TITLE: مباشرة من برشيد ..الشيخة الناشطة تفجرها وتدخل على خط قضية سعيد ولد الحوات والمنادجر
====> 490 Comments found. 



  8%|██████▌                                                                            | 4/51 [04:34<59:15, 75.64s/it]

> VIDEO TITLE: Chikha Trax, ACH GALOU 3LIK ? l DailyBuzz
====> 450 Comments found. 



 10%|███████▉                                                                         | 5/51 [07:04<1:15:02, 97.89s/it]

> VIDEO TITLE: حصري..فيديو كليب " حلوفة " عادل الميلودي ـ الشيخة طراكس - adil el miloudi Chikha trax 7aloufa
====> 1560 Comments found. 



 12%|█████████▍                                                                      | 6/51 [23:28<4:32:43, 363.63s/it]

> VIDEO TITLE: فيصل إثري قلب الأسم وولات سميتو "تسكت شو"..شوفو كيفاش لابس ملابس النساء وكيفاش كيهدر
====> 1560 Comments found. 



 14%|██████████▉                                                                     | 7/51 [38:04<6:19:23, 517.36s/it]

> VIDEO TITLE: 💥فيصل إثريFaysal Itri يجيب بصراحة على أسئلة عمو الباريزيAmou Albarizi🔥😁
====> 20 Comments found. 



 16%|████████████▌                                                                   | 8/51 [38:39<4:27:04, 372.66s/it]

> VIDEO TITLE: التحيار.. الشطيح والرديح في تيميتار
====> 810 Comments found. 



 18%|██████████████                                                                  | 9/51 [43:08<3:59:09, 341.64s/it]

> VIDEO TITLE: فديو كليب فيصل اتري اغنية الله سيدنا حصريا 2020faysal itri
====> 1471 Comments found. 



 20%|███████████████▍                                                               | 10/51 [52:34<4:39:27, 408.95s/it]

> VIDEO TITLE: فيصل إثري يدافع على بطمة: دنيا ماكتستهزأش مني... وهذا سر الروبيني وقيمة هوليود سمايل
====> 364 Comments found. 



 22%|█████████████████                                                              | 11/51 [54:32<3:34:20, 321.52s/it]

> VIDEO TITLE: بعد ضجة رقصتهما الغريبة بمهرجان تميتار الشابان المثيران للجدل بأكادير يردان
====> 60 Comments found. 



 24%|██████████████████▌                                                            | 12/51 [55:09<2:33:39, 236.40s/it]

> VIDEO TITLE: Adam lhlou live ادوما يتحلون متل البناة 2020
====> 4 Comments found. 



 25%|████████████████████▏                                                          | 13/51 [55:41<1:50:45, 174.89s/it]

> VIDEO TITLE: ساري كوول طلعات مع صوفيا طالوني نري شد فكرشك بالضحك 🔥🔥🔥
====> 1300 Comments found. 



 27%|█████████████████████▏                                                       | 14/51 [1:04:30<2:53:26, 281.27s/it]

> VIDEO TITLE: المثير للجدل جواد قنانة يفضح الفنانة باعزية:كلات اللوبيا وتفركعات عليا وشميت الريحة خايبة
====> 386 Comments found. 



 29%|██████████████████████▋                                                      | 15/51 [1:06:34<2:20:28, 234.11s/it]

> VIDEO TITLE: Malhama : Abtal Al Watan l ملحمة : أبطال الوطن
====> 1019 Comments found. 



 31%|████████████████████████▏                                                    | 16/51 [1:13:03<2:43:38, 280.52s/it]

> VIDEO TITLE: ساري كوول حصللت واحد تيكفت فلايف نري الهربة ديال الضحك🤣🤣
====> 20 Comments found. 



 33%|█████████████████████████▋                                                   | 17/51 [1:13:42<1:57:51, 208.00s/it]

> VIDEO TITLE: ⛔صوفيا طالوني خطفات الرجل ديال ساري كوول 😝نري خو.راتها على المباشر 😆
====> 361 Comments found. 



 35%|███████████████████████████▏                                                 | 18/51 [1:15:41<1:39:46, 181.42s/it]

> VIDEO TITLE: 💥صوفيا طالوني وسينا فالفراش 😯نري كيديرو الكلام😆
====> 20 Comments found. 



 37%|████████████████████████████▋                                                | 19/51 [1:16:20<1:13:56, 138.63s/it]

> VIDEO TITLE: نسولو الناس : علاش الدعارة انتشرات بكثرة فكازا؟ | شوف تيفي
====> 1540 Comments found. 



 39%|██████████████████████████████▏                                              | 20/51 [1:31:19<3:09:32, 366.84s/it]

> VIDEO TITLE: فوضى..عربدة و حوادث في ليل الدارالبيضاء
====> 260 Comments found. 



 41%|███████████████████████████████▋                                             | 21/51 [1:32:45<2:21:10, 282.35s/it]

> VIDEO TITLE: مؤثر .. عاهرة تحكي لشوف تيفي عن عالمها الليلي و تطلب المساعدة من المحسنين | شوف تيفي
====> 60 Comments found. 



 43%|█████████████████████████████████▏                                           | 22/51 [1:33:17<1:40:15, 207.43s/it]

> VIDEO TITLE: صاحب عبارة إكشوان يكشف لأول مرة قصته المؤثرة وهاكيفاش تعرف على مراتو اليتيمة و نقذها من الزنقة
====> 1540 Comments found. 



 45%|██████████████████████████████████▋                                          | 23/51 [1:47:55<3:10:40, 408.60s/it]

> VIDEO TITLE: بعيدا عن بذلة الرقص..أول خروج إعلامي للراقصة مايا الشهيرة.. الراقصة نور هي اللي دخلاتني لهاذ الميدان
====> 80 Comments found. 



 47%|████████████████████████████████████▏                                        | 24/51 [1:48:37<2:14:23, 298.65s/it]

> VIDEO TITLE: أسرة الشابة مولات الخمار بطلة الفيديو الفاضح بتطوان تفجر قنبلة من العيار الثقيل والقضية كبيرة
====> 998 Comments found. 



 49%|█████████████████████████████████████▋                                       | 25/51 [1:54:50<2:19:02, 320.86s/it]

> VIDEO TITLE: الصديقة المقربة من مولات الخمار بطلة الفيديو الفاضح لي هز المغاربة تكشف حقائق خطيرة
====> 200 Comments found. 



 51%|███████████████████████████████████████▎                                     | 26/51 [1:56:02<1:42:34, 246.16s/it]

> VIDEO TITLE: ولد فنانة مغربية شهيرة يفجرها بوجه مكشوف:"أنا مثلي وخالي غتاصبني وكنمشي مع الرجال بالفلوس
====> 180 Comments found. 



 53%|████████████████████████████████████████▊                                    | 27/51 [1:57:11<1:17:13, 193.06s/it]

> VIDEO TITLE: من كازا: أول خروج إعلامي للشابة لي قالت بأنها كتفسد على راجلها وكتمارس الجنس مع أي واحد تلاقات به
====> 40 Comments found. 



 55%|███████████████████████████████████████████▎                                   | 28/51 [1:57:54<56:41, 147.91s/it]

> VIDEO TITLE: قضية أخطر فضيحة زنا محارم كبرات والشابة المتزوجة تفجرها مرة أخرى بوجه مكشوف:بابا وخويا تناوبو عليا
====> 813 Comments found. 



 57%|███████████████████████████████████████████▊                                 | 29/51 [2:02:35<1:08:56, 188.04s/it]

> VIDEO TITLE: أول روتيني يومي على المباشروهاكيفاش كدير البطلة ديالو هي وراجلها:عاجبني راسي وخشا ليا جنوية فالمؤخرة
====> 1540 Comments found. 



 59%|█████████████████████████████████████████████▎                               | 30/51 [2:16:57<2:16:32, 390.13s/it]

> VIDEO TITLE: ابنة نوال المتوكل تثير الجدل بسبب صورها المثيرة
====> 952 Comments found. 



 61%|██████████████████████████████████████████████▊                              | 31/51 [2:22:37<2:05:04, 375.23s/it]

> VIDEO TITLE: فيديو الفضيحة:أول رد من ليلى بعد تسريب صورها الخاصة:هاذوك التصاور ديالي وسيفطتهم ليه ولختو وهاالدليل
====> 1458 Comments found. 



 63%|████████████████████████████████████████████████▎                            | 32/51 [2:32:59<2:22:11, 449.01s/it]

> VIDEO TITLE: الراقصة هيام تعود إليكم برقصة جريئة ولباس جديد وتقول لمنتقديها:"موتو بالسم"
====> 1540 Comments found. 



 65%|█████████████████████████████████████████████████▊                           | 33/51 [2:48:02<2:55:35, 585.30s/it]

> VIDEO TITLE: شاب عندو الشكل ديال البنات :"أنا شاذ جنسي ومعنديش الخصيتين والأب ديالي جرا عليا وكندير الماكياج"
====> 80 Comments found. 



 67%|███████████████████████████████████████████████████▎                         | 34/51 [2:48:43<1:59:35, 422.10s/it]

> VIDEO TITLE: المحامي الشهير بطل فضيحة الشابة التي أنجب منها طفلة وأنكرها "ما مرتاحش" مسكين
====> 882 Comments found. 



 69%|████████████████████████████████████████████████████▊                        | 35/51 [2:53:38<1:42:22, 383.89s/it]

> VIDEO TITLE: على المباشر..فضيحة زيان الأخلاقية تهز الرأي العام المغربي..حصل عريان مع امرأة متزوجة..ما تعليقكم؟
====> 60 Comments found. 



 71%|██████████████████████████████████████████████████████▎                      | 36/51 [2:54:15<1:09:56, 279.78s/it]

> VIDEO TITLE: أميمة باعزية تكشف المستور وترد على المثير للجدل قنانة:"هداك راه مهتوك ومشروك وكذاب"
====> 456 Comments found. 



 73%|█████████████████████████████████████████████████████████▎                     | 37/51 [2:56:38<55:41, 238.69s/it]

> VIDEO TITLE: أسرار فضيحة محامي كازا الشهير وليلى الضحية ومقلب زوجته المحامية
====> 1296 Comments found. 



 75%|█████████████████████████████████████████████████████████▎                   | 38/51 [3:05:05<1:09:12, 319.40s/it]

> VIDEO TITLE: بعد ظهورها فروتيني اليومي زوج طعن مراتو فالمؤخرة ديالها وفمناطقها الحساسة بسبب الفيديوهات ديالها
====> 1540 Comments found. 



 76%|██████████████████████████████████████████████████████████▉                  | 39/51 [3:20:12<1:39:07, 495.65s/it]

> VIDEO TITLE: قنبلة:رشيد رفيق مشى فيها..شابة تفجرها:مشيت معاه لوطيل خذا ليا شرفي ولدو عندو 10 أشهر ومامعترفش بيه
====> 1540 Comments found. 



 78%|████████████████████████████████████████████████████████████▍                | 40/51 [3:34:46<1:51:39, 609.06s/it]

> VIDEO TITLE: ميمة معر ية فلايف وكلام سا خن نسخة روتيني اليومي | Fa diha Rotini Alyawmi V2
====> 20 Comments found. 



 80%|█████████████████████████████████████████████████████████████▉               | 41/51 [3:35:19<1:12:43, 436.39s/it]

> VIDEO TITLE: أول روتيني يومي على المباشروهاكيفاش كدير البطلة ديالو هي وراجلها:عاجبني راسي وخشا ليا جنوية فالمؤخرة
====> 1540 Comments found. 



 82%|███████████████████████████████████████████████████████████████▍             | 42/51 [3:49:53<1:25:07, 567.54s/it]

> VIDEO TITLE: لـمــوت ديال ضـحــك لـمـغـاربـة و لــجـنـس
====> 1273 Comments found. 



 86%|████████████████████████████████████████████████████████████████████▏          | 44/51 [3:59:13<46:35, 399.30s/it]

> VIDEO TITLE: مباشرة من إقليم الصويرة: تصريحات صادمة من اسرة الأم للقاوها مقتولة فدار راجلها ج2
====> 0 Comments found. 

> VIDEO TITLE: أغرب وأخطر قصة فزمن كورونا..مغربية تعيش في جسد رجل:أنا راجل وكنتعذب حيت عندي جهاز تناسلي بحال البنات
====> 1480 Comments found. 



 88%|█████████████████████████████████████████████████████████████████████▋         | 45/51 [4:10:07<47:33, 475.53s/it]

> VIDEO TITLE: قضية أخطر فضيحة زنا محارم كبرات والشابة المتزوجة تفجرها مرة أخرى بوجه مكشوف:بابا وخويا تناوبو عليا
====> 812 Comments found. 



 90%|███████████████████████████████████████████████████████████████████████▎       | 46/51 [4:14:39<34:32, 414.45s/it]

> VIDEO TITLE: شابة جميلة مزوجة بجن ولي كيجي يتزوجها كيتسطا:والدة معاه ولد وقاليا بقاي ديالي ولي بغيتها كيديرها ليا
====> 1540 Comments found. 



 92%|████████████████████████████████████████████████████████████████████████▊      | 47/51 [4:29:19<36:56, 554.12s/it]

> VIDEO TITLE: المايكب أرتيست عماد الدين يصرح بحقائق مثيرة: أنا ماشي بنت وعائلتني متقبلونيش بالماكياج
====> 1540 Comments found. 



 94%|██████████████████████████████████████████████████████████████████████████▎    | 48/51 [4:43:37<32:15, 645.33s/it]

> VIDEO TITLE: جد صادم:شاب يرتدي ملابس نسائية يعترف بممارسة الجــــــــنس مقابل 100 درهم
====> 60 Comments found. 



 96%|███████████████████████████████████████████████████████████████████████████▉   | 49/51 [4:44:13<15:24, 462.49s/it]

> VIDEO TITLE: الفيديو القنبلة..رقص مثير للشيخة الطراكس في حفل زفاف بنت الستاتي وهاشنو دارت سعيدة شرف
====> 721 Comments found. 



 98%|█████████████████████████████████████████████████████████████████████████████▍ | 50/51 [4:48:10<06:34, 394.82s/it]

> VIDEO TITLE: MANAL - NIYA (official parody by matrixmen )
====> 1540 Comments found. 



100%|███████████████████████████████████████████████████████████████████████████████| 51/51 [5:03:41<00:00, 357.28s/it]


In [24]:
with io.open('./data/results.csv', 'a', newline='', encoding="utf-16") as file:
        writer = csv.writer(file, delimiter =",", quoting=csv.QUOTE_ALL)
        writer.writerow(["Username", "Comment"])