In [1]:
# %%
import re, json, time
from selenium import webdriver
import os



from parsel import Selector

import pandas as pd
import numpy as np


In [2]:
def scroll_page(url):
    # service = Service(EdgeDriverManager().install())

    # options = webdriver.EdgeOptions()
    # options.add_argument("--headless")
    # options.add_argument("--lang=en")
    # options.add_argument(
    #     "user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Edge/104.0.0.0 Safari/537.36"
    # )

    driver = webdriver.Edge()
    driver.get(url)
    driver.implicitly_wait(10)

    time.sleep(3)
    selector = Selector(driver.page_source)
    driver.quit()

    return selector


def scrape_all_data(selector):
    youtube_video_page = []

    all_script_tags = selector.css("script").getall()

    title = selector.css(".title .ytd-video-primary-info-renderer::text").get()

    # https://regex101.com/r/gHeLwZ/1
    views = int(
        re.search(r"(.*)\s", selector.css(".view-count::text").get())
        .group()
        .replace(",", "")
    )

    # https://regex101.com/r/9OGwJp/1
    likes = int(
        re.search(
            r"(.*)\s",
            selector.css(
                "#top-level-buttons-computed > ytd-toggle-button-renderer:first-child #text::attr(aria-label)"
            ).get(),
        )
        .group()
        .replace(",", "")
    )

    date = selector.css("#info-strings yt-formatted-string::text").get()

    duration = selector.css(".ytp-time-duration::text").get()

    # https://regex101.com/r/0JNma3/1
    keywords = (
        "".join(
            re.findall(r'"keywords":\[(.*)\],"channelId":".*"', str(all_script_tags))
        )
        .replace('"', "")
        .split(",")
    )

    # https://regex101.com/r/9VhH1s/1
    thumbnail = re.findall(
        r'\[{"url":"(\S+)","width":\d*,"height":\d*},', str(all_script_tags)
    )[0].split('",')[0]

    channel = {
        # https://regex101.com/r/xFUzq5/1
        "id": "".join(
            re.findall(r'"channelId":"(.*)","isOwnerViewing"', str(all_script_tags))
        ),
        "name": selector.css("#channel-name a::text").get(),
        "link": f'https://www.youtube.com{selector.css("#channel-name a::attr(href)").get()}',
        "subscribers": selector.css("#owner-sub-count::text").get(),
        "thumbnail": selector.css("#img::attr(src)").get(),
    }

    description = selector.css(
        ".ytd-expandable-video-description-body-renderer span:nth-child(1)::text"
    ).get()

    hash_tags = [
        {
            "name": hash_tag.css("::text").get(),
            "link": f'https://www.youtube.com{hash_tag.css("::attr(href)").get()}',
        }
        for hash_tag in selector.css(
            ".ytd-expandable-video-description-body-renderer a"
        )
    ]

    # https://regex101.com/r/onRk9j/1
    category = "".join(
        re.findall(r'"category":"(.*)","publishDate"', str(all_script_tags))
    )

    comments_amount = int(
        selector.css("#count .count-text span:nth-child(1)::text")
        .get()
        .replace(",", "")
    )

    comments = []

    for comment in selector.css("#contents > ytd-comment-thread-renderer"):
        comments.append(
            {
                "author": comment.css("#author-text span::text").get().strip(),
                "link": f'https://www.youtube.com{comment.css("#author-text::attr(href)").get()}',
                "date": comment.css(".published-time-text a::text").get(),
                "likes": comment.css("#vote-count-middle::text").get().strip(),
                "comment": comment.css("#content-text::text").get(),
                "avatar": comment.css("#author-thumbnail #img::attr(src)").get(),
            }
        )

    suggested_videos = []

    for video in selector.css("ytd-compact-video-renderer"):
        suggested_videos.append(
            {
                "title": video.css("#video-title::text").get().strip(),
                "link": f'https://www.youtube.com{video.css("#thumbnail::attr(href)").get()}',
                "channel_name": video.css("#channel-name #text::text").get(),
                "date": video.css("#metadata-line span:nth-child(2)::text").get(),
                "views": video.css("#metadata-line span:nth-child(1)::text").get(),
                "duration": video.css("#overlays #text::text").get().strip(),
                "thumbnail": video.css("#thumbnail img::attr(src)").get(),
            }
        )

    youtube_video_page.append(
        {
            "title": title,
            "views": views,
            "likes": likes,
            "date": date,
            "duration": duration,
            "channel": channel,
            "keywords": keywords,
            "thumbnail": thumbnail,
            "description": description,
            "hash_tags": hash_tags,
            "category": category,
            "suggested_videos": suggested_videos,
            "comments_amount": comments_amount,
            "comments": comments,
        }
    )

    print(json.dumps(youtube_video_page, indent=2, ensure_ascii=False))


def get_info_from_channel(channel_link: str):
    driver = webdriver.Edge()

    driver.get(channel_link)
    driver.maximize_window()

    time.sleep(5)

    selector = Selector(text=driver.page_source)
    driver.quit()

    # channel title
    channel_title = selector.css("#text-container #text::text").get()

    # date joined //*[@id="right-column"]/yt-formatted-string[2]/span[2]
    date_joined = selector.css(
        "#right-column > yt-formatted-string:nth-child(2) > span:nth-child(2)::text"
    ).get()

    # total views //*[@id="right-column"]/yt-formatted-string[3]

    total_views = selector.css(
        "#right-column > yt-formatted-string:nth-child(3)::text"
    ).get()

    # total subs //*[@id="subscriber-count"]

    total_subs = selector.css("#subscriber-count::text").get()

    # total videos //*[@id="videos-count"]/span[1]

    total_videos = selector.css("#videos-count > span:nth-child(1)::text").get()

    channel_info = {
        "channel_title": channel_title,
        "date_joined": date_joined,
        "total_views": total_views,
        "total_subs": total_subs,
        "total_videos": total_videos,
    }

    print(json.dumps(channel_info, indent=2, ensure_ascii=False))

    return pd.DataFrame(channel_info, index=[0])


def get_info_from_video(selector):
    # title
    title = ''.join(selector.xpath('//*[@id="title"]/h1//text()').getall()).strip()

    # date
    date = selector.css("#info-strings yt-formatted-string::text").get()

    # views
    views = selector.css("span.bold.style-scope.yt-formatted-string::text").get()

    # likes
    likes = selector.css(
        "#segmented-like-button > ytd-toggle-button-renderer > yt-button-shape > button::attr(aria-label)"
    ).get()

    # comments
    comments = selector.css("yt-formatted-string::text").getall()
    next_item = None
    for i, item in enumerate(comments):
        if item == "Comentários":
            if i < len(comments) - 1:
                next_item = comments[i + 1]
                break

    comments_amount = next_item

    # keywords
    # all_script_tags = selector.css("script").getall()
    # keywords = (
    #     "".join(
    #         re.findall(r'"keywords":\[(.*)\],"channelId":".*"', str(all_script_tags))
    #     )
    #     .replace('"', "")
    #     .split(",")
    # )

    print(title, views, likes, date, comments_amount)

    try:
        likes = re.search(r"(\d+)", likes).group()
    except Exception as e:
        likes = 0
    # views = re.search(r"(\d+)", views).group()

    return pd.DataFrame.from_dict(
        {
            "title": [title],
            "views": [views],
            "likes": [likes],
            "date": [date],
            "comments_amount": [comments_amount],
            # "keywords": [keywords],
        }
    )


def parse_channel(selector) -> pd.DataFrame:
    subscribers = selector.css(
        "#subscriber-count.style-scope.ytd-c4-tabbed-header-renderer::text"
    ).get()

    # subscribers = re.search(r"(\d+)", subscribers).group()

    # get recent 5 videos
    channel_name = (
        selector.css("div#channel-header-container yt-formatted-string#text::text")
        .get()
    )
    
    if channel_name is None:
        channel_name = selector.css("div#channel-header-container h1#text::text").get()
        
    print("Channel name: ", channel_name)

    videos = selector.css(
        "div.style-scope.ytd-rich-item-renderer ytd-rich-grid-media div.style-scope.ytd-rich-grid-media a#thumbnail.yt-simple-endpoint.inline-block.style-scope.ytd-thumbnail::attr(href)"
    ).getall()[:5]

    u, ind = np.unique(videos, return_index=True)
    videos = u[np.argsort(ind)]

    df = pd.DataFrame()
    for v in videos:
        print("Video: ", v)

        result = scroll_page(f"https://www.youtube.com{v}")

        info = get_info_from_video(result)
        info["channel_name"] = channel_name
        info["subscribers"] = subscribers
        # print(info)

        df = pd.concat([df, info])
        # df = df.append(info, ignore_index=True)

    print("Videos i got: ", len(videos))
    return df


def parse_top_channel(channel_link: str) -> pd.DataFrame:
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    from selenium.webdriver.common.by import By

    driver = webdriver.Edge()
    wait = WebDriverWait(driver, 3)
    driver.implicitly_wait(10)

    driver.get(channel_link)
    driver.maximize_window()

    # //*[@id="chips"]/yt-chip-cloud-chip-renderer[2]
    # wait for page to load

    try:
        wait.until(
            EC.presence_of_element_located(
                (By.XPATH, '//*[@id="chips"]/yt-chip-cloud-chip-renderer[2]')
            )
        ).click()
    except Exception as e:
        print("Nao possui aba de videos em alta")
        # return empty dataframe
        # return pd.DataFrame()

    time.sleep(3)
    selector = Selector(text=driver.page_source)
    driver.quit()

    channel_name = (
        selector.css("div#channel-header-container yt-formatted-string#text::text")
        .get()
        .strip()
    )

    videos = selector.css(
        "div.style-scope.ytd-rich-item-renderer ytd-rich-grid-media div.style-scope.ytd-rich-grid-media a#thumbnail.yt-simple-endpoint.inline-block.style-scope.ytd-thumbnail::attr(href)"
    ).getall()[:5]

    u, ind = np.unique(videos, return_index=True)
    videos = u[np.argsort(ind)]

    df = pd.DataFrame()
    for v in videos:
        # print("Video: ", v)

        result = scroll_page(f"https://www.youtube.com{v}")

        info = get_info_from_video(result)
        print(info)
        info["channel_name"] = channel_name
        # print(info)

        df = pd.concat([df, info])
        # df = df.append(info, ignore_index=True)

    print("Videos i got: ", len(videos))
    return df



Pegar dados

In [3]:

# %%
with open("canais.txt", "r") as f:
    # read each line as a item in a list and remove the \n
    canais = [line.strip() for line in f.readlines()]

base_path = f"./data/{canais[0].split('@')[-1]}/"

df = pd.DataFrame()
df_top = pd.DataFrame()
df_lifetime = pd.DataFrame()
for ch in canais:
    # recent videos
    result = scroll_page(ch + "/videos")
    df_channel = parse_channel(result)
    df = pd.concat([df, df_channel])

    # top videos
    df_top_channel = parse_top_channel(ch + "/videos")
    df_top = pd.concat([df_top, df_top_channel])

    # lifetime info
    df_lifetime_channel = get_info_from_channel(ch + "/about")
    df_lifetime = pd.concat([df_lifetime, df_lifetime_channel])


os.makedirs(base_path, exist_ok=True)

df.to_csv(base_path + "videos.csv", index=False)
df_top.to_csv(base_path + "top_videos.csv", index=False)
df_lifetime.to_csv(base_path + "lifetime.csv", index=False)


Channel name:  Farmácias Unipreço
Video:  /watch?v=J6YXhYeWfzk


Álbum Oficial Brasileirão 2023 149 visualizações Marque este vídeo como "Gostei" com mais 1 pessoa 11 de set. de 2023 None
Video:  /watch?v=AP_GKTup0Ho


A MAIOR FARMÁCIA DE PALMEIRA - FARMÁCIAS UNIPREÇO 125 visualizações Marque este vídeo como "Gostei" com mais 1 pessoa 2 de dez. de 2022 A MAIOR FARMÁCIA DE PALMEIRA - FARMÁCIAS UNIPREÇO
Video:  /watch?v=Nf961mHQGh8


CHEGAMOS UNIPREÇO SÍTIO CERCADO 51 mil visualizações Marque este vídeo como "Gostei" com mais 0 pessoa Estreou em 20 de set. de 2022 None
Video:  /watch?v=9XYm471kIak


Surpresa em comemoração aos 11 anos de Aniversário Unipreço 25 visualizações Marque este vídeo como "Gostei" com mais 0 pessoa Estreou em 13 de set. de 2022 None
Video:  /watch?v=NkQ5JbuE5kU


Comemoração 11 anos de Aniversário Farmácias Unipreço 1,4 mil visualizações Marque este vídeo como "Gostei" com mais 11 pessoas Estreou em 1 de set. de 2022 None
Videos i got:  5


CHEGAMOS UNIPREÇO SÍTIO CERCADO 51 mil visualizações Marque este vídeo como "Gostei" com mais 0 pessoa Estreou em 20 de set. de 2022 None
                             title                 views likes  \
0  CHEGAMOS UNIPREÇO SÍTIO CERCADO  51 mil visualizações     0   

                            date comments_amount  
0  Estreou em 20 de set. de 2022            None  


Inauguração Mega Store Paranaguá 22 mil visualizações Marque este vídeo como "Gostei" com mais 5 pessoas 1 de set. de 2021 None
                              title                 views likes  \
0  Inauguração Mega Store Paranaguá  22 mil visualizações     5   

                date comments_amount  
0  1 de set. de 2021            None  


Inauguração  Farmácias Unipreço Sitio Cercado 17 mil visualizações Marque este vídeo como "Gostei" com mais 4 pessoas 28 de jan. de 2022 Transcrição
                                           title                 views likes  \
0  Inauguração  Farmácias Unipreço Sitio Cercado  17 mil visualizações     4   

                 date comments_amount  
0  28 de jan. de 2022     Transcrição  


Polivitamínico Politabs Femme - Farmácias Unipreço 13 mil visualizações Marque este vídeo como "Gostei" com mais 91 pessoas 19 de ago. de 2016 None
                                               title                 views  \
0  Polivitamínico Politabs Femme - Farmácias Unip...  13 mil visualizações   

  likes                date comments_amount  
0    91  19 de ago. de 2016            None  


Inauguração Farmácias Unipreço IPO Água Verde 12 mil visualizações Marque este vídeo como "Gostei" com mais 2 pessoas 28 de jan. de 2022 Transcrição
                                           title                 views likes  \
0  Inauguração Farmácias Unipreço IPO Água Verde  12 mil visualizações     2   

                 date comments_amount  
0  28 de jan. de 2022     Transcrição  
Videos i got:  5


{
  "channel_title": "Farmácias Unipreço",
  "date_joined": "16 de nov. de 2011",
  "total_views": "196.650 visualizações",
  "total_subs": "242 inscritos",
  "total_videos": "79"
}


Channel name:  Farmácias Nissei
Video:  /watch?v=wMvsLlIHAig


Nos Caminhos do Verão - Farmácias Nissei | EP. 12 - Curitiba 174 visualizações Marque este vídeo como "Gostei" com mais 4 pessoas 27 de fev. de 2023 Transcrição
Video:  /watch?v=ixRvZzE7C34


Nos Caminhos do Verão - Farmácias Nissei | EP. 11 - Matinhos 81 visualizações Marque este vídeo como "Gostei" com mais 2 pessoas 24 de fev. de 2023 Transcrição
Video:  /watch?v=en3GlJ_Ioz4


Nos Caminhos do Verão - Farmácias Nissei | EP. 10 - Joinville 49 visualizações Marque este vídeo como "Gostei" com mais 2 pessoas 23 de fev. de 2023 Transcrição
Video:  /watch?v=UwWCvbTjJhw


Nos Caminhos do Verão - Farmácias Nissei | EP. 09 - Balneário Camboriú 47 visualizações Marque este vídeo como "Gostei" com mais 1 pessoa 23 de fev. de 2023 Transcrição
Video:  /watch?v=CNP3UwJc00Q


Nos Caminhos do Verão - Farmácias Nissei | EP. 08 - Ponta Grossa 32 visualizações Marque este vídeo como "Gostei" com mais 1 pessoa 22 de fev. de 2023 Transcrição
Videos i got:  5


Nissei - Presente em sua vida | Episódio 02 - Josiane e Ana Flávia 286 mil visualizações Marque este vídeo como "Gostei" com mais 29 pessoas 12 de jun. de 2018 2
                                               title                  views  \
0  Nissei - Presente em sua vida | Episódio 02 - ...  286 mil visualizações   

  likes                date comments_amount  
0    29  12 de jun. de 2018               2  


Nissei - Presente em sua vida | Episódio 03 - Eliane Dos Santos 269 mil visualizações Marque este vídeo como "Gostei" com mais 20 pessoas 19 de jun. de 2018 1
                                               title                  views  \
0  Nissei - Presente em sua vida | Episódio 03 - ...  269 mil visualizações   

  likes                date comments_amount  
0    20  19 de jun. de 2018               1  


Nissei - Presente em sua vida | Episódio 01 - Dona Conceição 264 mil visualizações Marque este vídeo como "Gostei" com mais 23 pessoas 7 de jun. de 2018 Transcrição
                                               title                  views  \
0  Nissei - Presente em sua vida | Episódio 01 - ...  264 mil visualizações   

  likes               date comments_amount  
0    23  7 de jun. de 2018     Transcrição  


Nissei - Presente em sua vida | Episódio 04 - Fernanda Sachet 243 mil visualizações Marque este vídeo como "Gostei" com mais 19 pessoas 25 de jun. de 2018 2
                                               title                  views  \
0  Nissei - Presente em sua vida | Episódio 04 - ...  243 mil visualizações   

  likes                date comments_amount  
0    19  25 de jun. de 2018               2  


Farmácias Nissei | Mais inovação e comodidade para você 102 mil visualizações Marque este vídeo como "Gostei" com mais 21 pessoas 27 de abr. de 2018 1
                                               title                  views  \
0  Farmácias Nissei | Mais inovação e comodidade ...  102 mil visualizações   

  likes                date comments_amount  
0    21  27 de abr. de 2018               1  
Videos i got:  5


{
  "channel_title": "Farmácias Nissei",
  "date_joined": "22 de jan. de 2013",
  "total_views": "1.317.082 visualizações",
  "total_subs": "1,16 mil inscritos",
  "total_videos": "169"
}


Channel name:  Farmácias Pague Menos
Video:  /watch?v=hMfoulmEME8


Como As CRIANÇAS Enxergam O MUNDO? 28 visualizações Marque este vídeo como "Gostei" com mais 5 pessoas 9 de out. de 2023 Transcrição
Video:  /watch?v=7Rpcpc5Lmww


SAIBA TUDO Sobre O BEACH TENNIS 1,5 mil visualizações Marque este vídeo como "Gostei" com mais 6 pessoas 6 de out. de 2023 Transcrição
Video:  /watch?v=AcThVYhxpOY


Tirei A Mama, E Agora? Quais Os IMPACTOS PSICOLÓGICOS Da MASTECTOMIA? 122 visualizações Marque este vídeo como "Gostei" com mais 6 pessoas 5 de out. de 2023 Transcrição
Video:  /watch?v=D4og-c0457U


Sintomas de Alerta do DIABETES 143 visualizações Marque este vídeo como "Gostei" com mais 10 pessoas 3 de out. de 2023 Transcrição
Video:  /watch?v=nlsvylXAgDE


Como A MASTECTOMIA Afeta A AUTOESTIMA E A SEXUALIDADE 157 visualizações Marque este vídeo como "Gostei" com mais 9 pessoas 2 de out. de 2023 1
Videos i got:  5


Tudo sobre menstruação - by Farmácias Pague Menos 2,3 mi de visualizações Marque este vídeo como "Gostei" com mais 51.559 pessoas 9 de fev. de 2019 1,6 mil
                                               title                    views  \
0  Tudo sobre menstruação - by Farmácias Pague Menos  2,3 mi de visualizações   

  likes               date comments_amount  
0    51  9 de fev. de 2019         1,6 mil  


Procure as amarelinhas nas lojas e economize ainda mais. 1,8 mi de visualizações Marque este vídeo como "Gostei" com mais 92 pessoas 3 de abr. de 2019 1
                                               title                    views  \
0  Procure as amarelinhas nas lojas e economize a...  1,8 mi de visualizações   

  likes               date comments_amount  
0    92  3 de abr. de 2019               1  


#FiqueEmCasaFiqueBem 1,6 mi de visualizações Marque este vídeo como "Gostei" com mais 58 pessoas 9 de abr. de 2020 1
                  title                    views likes               date  \
0  #FiqueEmCasaFiqueBem  1,6 mi de visualizações    58  9 de abr. de 2020   

  comments_amount  
0               1  


SIMONY Fala Como Descobriu o Câncer De Intestino no PodSempre 1,5 mi de visualizações Marque este vídeo como "Gostei" com mais 21.023 pessoas 30 de mar. de 2023 1,4 mil
                                               title                    views  \
0  SIMONY Fala Como Descobriu o Câncer De Intesti...  1,5 mi de visualizações   

  likes                date comments_amount  
0    21  30 de mar. de 2023         1,4 mil  


Onde você vai estar nos próximos passos do seu filho? 1,1 mi de visualizações Marque este vídeo como "Gostei" com mais 147 pessoas 9 de jan. de 2017 None
                                               title                    views  \
0  Onde você vai estar nos próximos passos do seu...  1,1 mi de visualizações   

  likes               date comments_amount  
0   147  9 de jan. de 2017            None  
Videos i got:  5


{
  "channel_title": "Farmácias Pague Menos",
  "date_joined": "29 de nov. de 2013",
  "total_views": "53.283.388 visualizações",
  "total_subs": "248 mil inscritos",
  "total_videos": "7,5 mil"
}


Channel name:  Drogaria São Paulo
Video:  /watch?v=O2X_uHcn-_I


Festival do Bebê na Drogaria São Paulo 147 visualizações Marque este vídeo como "Gostei" com mais 3 pessoas 1 de out. de 2023 Transcrição
Video:  /watch?v=7ALoxUb6Vr4


Como fazer reanimação cardíaca? 45 visualizações Marque este vídeo como "Gostei" com mais 2 pessoas 27 de set. de 2023 Transcrição
Video:  /watch?v=gVYn8Bv0T2w


Drauziocast - Um papo sobre infarto em jovens 48 visualizações Marque este vídeo como "Gostei" com mais 5 pessoas 22 de set. de 2023 Transcrição
Video:  /watch?v=_0pATibE-EQ


ANIVERSÁRIO PREMIADO DROGARIA SÃO PAULO 511 visualizações Marque este vídeo como "Gostei" com mais 7 pessoas 5 de set. de 2023 3
Video:  /watch?v=HqUQ5xUYy4w


Acnes  em adultos. 86 visualizações Marque este vídeo como "Gostei" com mais 3 pessoas 23 de ago. de 2023 None
Videos i got:  5


Começou a Temporada da Beleza na Drogaria São Paulo! 770 mil visualizações Marque este vídeo como "Gostei" com mais 3 pessoas 1 de out. de 2022 Transcrição
                                               title                  views  \
0  Começou a Temporada da Beleza na Drogaria São ...  770 mil visualizações   

  likes               date comments_amount  
0     3  1 de out. de 2022     Transcrição  


Dr. Drauzio responde: Otite 770 mil visualizações Marque este vídeo como "Gostei" com mais 21.969 pessoas 23 de dez. de 2019 1,9 mil
                         title                  views likes  \
0  Dr. Drauzio responde: Otite  770 mil visualizações    21   

                 date comments_amount  
0  23 de dez. de 2019         1,9 mil  


Drauzio Varella - Dicas Práticas - Como medir sua pressão 699 mil visualizações Marque este vídeo como "Gostei" com mais 13.577 pessoas 11 de abr. de 2018 143
                                               title                  views  \
0  Drauzio Varella - Dicas Práticas - Como medir ...  699 mil visualizações   

  likes                date comments_amount  
0    13  11 de abr. de 2018             143  


Aniversário Drogaria São Paulo 685 mil visualizações Marque este vídeo como "Gostei" com mais 7 pessoas 1 de set. de 2022 2
                            title                  views likes  \
0  Aniversário Drogaria São Paulo  685 mil visualizações     7   

                date comments_amount  
0  1 de set. de 2022               2  


Diabetes - dr. Drauzio Varella 535 mil visualizações Marque este vídeo como "Gostei" com mais 22 pessoas 6 de nov. de 2018 1
                            title                  views likes  \
0  Diabetes - dr. Drauzio Varella  535 mil visualizações    22   

                date comments_amount  
0  6 de nov. de 2018               1  
Videos i got:  5


{
  "channel_title": "Drogaria São Paulo",
  "date_joined": "1 de out. de 2013",
  "total_views": "8.302.275 visualizações",
  "total_subs": "25,6 mil inscritos",
  "total_videos": "161"
}


Channel name:  Panvel Farmácias
Video:  /watch?v=Uq9sB5vz0dU


Panvel 50 Anos 314 visualizações Marque este vídeo como "Gostei" com mais 7 pessoas 19 de jun. de 2023 Panvel 50 Anos
Video:  /watch?v=pA2XUnMQw7I


Panvel | Fica Tudo Bem com Presentes da Panvel 591 visualizações Marque este vídeo como "Gostei" com mais 6 pessoas 24 de abr. de 2023 None
Video:  /watch?v=B5FenBlhZx0


Panvel | Fica Tudo Bem Quando Você Tem Com Quem Contar 12 mil visualizações Marque este vídeo como "Gostei" com mais 7 pessoas 24 de abr. de 2023 None
Video:  /watch?v=_A4heu3t-YI


Panvel | Fica Tudo Bem Quando Você Cuida da Sua Saúde 284 visualizações Marque este vídeo como "Gostei" com mais 2 pessoas 24 de abr. de 2023 None
Video:  /watch?v=PZIkDCJeves


Panvel | Fica Tudo Bem Do Seu Jeito 408 visualizações Marque este vídeo como "Gostei" com mais 3 pessoas 24 de abr. de 2023 None
Videos i got:  5


Natal Panvel - Bem você, bem Natal. 4,7 mi de visualizações Marque este vídeo como "Gostei" com mais 457 pessoas 2 de dez. de 2020 None
                                 title                    views likes  \
0  Natal Panvel - Bem você, bem Natal.  4,7 mi de visualizações   457   

                date comments_amount  
0  2 de dez. de 2020            None  


Panvel | Feliz Dezembro Novo 4,7 mi de visualizações Marque este vídeo como "Gostei" com mais 552 pessoas 3 de dez. de 2018 19
                          title                    views likes  \
0  Panvel | Feliz Dezembro Novo  4,7 mi de visualizações   552   

                date comments_amount  
0  3 de dez. de 2018              19  


A História de Sofia - Filme da Panvel 2,6 mi de visualizações Marque este vídeo como "Gostei" com mais 20.061 pessoas 3 de out. de 2012 1,1 mil
                                   title                    views likes  \
0  A História de Sofia - Filme da Panvel  2,6 mi de visualizações    20   

                date comments_amount  
0  3 de out. de 2012         1,1 mil  


Natal Panvel 2014 1,7 mi de visualizações Marque este vídeo como "Gostei" com mais 199 pessoas 1 de dez. de 2014 5
               title                    views likes               date  \
0  Natal Panvel 2014  1,7 mi de visualizações   199  1 de dez. de 2014   

  comments_amount  
0               5  


Você Bem Digital 1,6 mi de visualizações Marque este vídeo como "Gostei" com mais 11.304 pessoas 1 de set. de 2020 2
              title                    views likes               date  \
0  Você Bem Digital  1,6 mi de visualizações    11  1 de set. de 2020   

  comments_amount  
0               2  
Videos i got:  5


{
  "channel_title": "Panvel Farmácias",
  "date_joined": "8 de abr. de 2009",
  "total_views": "22.673.817 visualizações",
  "total_subs": "9,88 mil inscritos",
  "total_videos": "106"
}


last 30 days

In [4]:

# read channel IDs

with open("canais.txt", "r") as f:
    canais = f.readlines()


canais = [c.strip() for c in canais]
# take only the string after the last slash
canais = [c.split("/")[-1] for c in canais]

print(canais)

base_url = "https://socialblade.com/youtube/channel/"

social_blade_data = []
for c in canais:
    response = scroll_page(base_url + c)

    # last 30 days views #socialblade-user-content > div:nth-child(23) > div:nth-child(3) > span
    views = response.css(
        "#socialblade-user-content > div:nth-child(23) > div:nth-child(3) > span::text"
    ).get()
    subs = response.css(
        "#socialblade-user-content > div:nth-child(23) > div:nth-child(2) > span::text"
    ).get()

    if views is None or subs is None:
        views = response.css(
            "#socialblade-user-content > div:nth-child(16) > div:nth-child(3) > span::text"
        ).get()
        subs = response.css(
            "#socialblade-user-content > div:nth-child(16) > div:nth-child(2) > span::text"
        ).get()

    social_blade_data.append({"Channel": c, "views": views, "subs": subs})

last_30days = pd.DataFrame(social_blade_data)
last_30days = last_30days.fillna("0")

last_30days.to_parquet(f'data/{canais[0].split("@")[-1]}/last_30_days.parquet', index=False)

['@farmacias.unipreco', '@farmaciasnisseioficial', '@paguemenosbr', '@drogariasaopaulo1427', '@panvelfarmacias']
