In [1]:
# %%
import re, json, time
from selenium import webdriver
import os


from parsel import Selector

import pandas as pd
import numpy as np

In [2]:
def scroll_page(url):
    # service = Service(EdgeDriverManager().install())

    # options = webdriver.EdgeOptions()
    # options.add_argument("--headless")
    # options.add_argument("--lang=en")
    # options.add_argument(
    #     "user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Edge/104.0.0.0 Safari/537.36"
    # )

    driver = webdriver.Edge()
    driver.get(url)
    driver.implicitly_wait(10)

    time.sleep(3)
    selector = Selector(driver.page_source)
    driver.quit()

    return selector


def scrape_all_data(selector):
    youtube_video_page = []

    all_script_tags = selector.css("script").getall()

    title = selector.css(".title .ytd-video-primary-info-renderer::text").get()

    # https://regex101.com/r/gHeLwZ/1
    views = int(
        re.search(r"(.*)\s", selector.css(".view-count::text").get())
        .group()
        .replace(",", "")
    )

    # https://regex101.com/r/9OGwJp/1
    likes = int(
        re.search(
            r"(.*)\s",
            selector.css(
                "#top-level-buttons-computed > ytd-toggle-button-renderer:first-child #text::attr(aria-label)"
            ).get(),
        )
        .group()
        .replace(",", "")
    )

    date = selector.css("#info-strings yt-formatted-string::text").get()

    duration = selector.css(".ytp-time-duration::text").get()

    # https://regex101.com/r/0JNma3/1
    keywords = (
        "".join(
            re.findall(r'"keywords":\[(.*)\],"channelId":".*"', str(all_script_tags))
        )
        .replace('"', "")
        .split(",")
    )

    # https://regex101.com/r/9VhH1s/1
    thumbnail = re.findall(
        r'\[{"url":"(\S+)","width":\d*,"height":\d*},', str(all_script_tags)
    )[0].split('",')[0]

    channel = {
        # https://regex101.com/r/xFUzq5/1
        "id": "".join(
            re.findall(r'"channelId":"(.*)","isOwnerViewing"', str(all_script_tags))
        ),
        "name": selector.css("#channel-name a::text").get(),
        "link": f'https://www.youtube.com{selector.css("#channel-name a::attr(href)").get()}',
        "subscribers": selector.css("#owner-sub-count::text").get(),
        "thumbnail": selector.css("#img::attr(src)").get(),
    }

    description = selector.css(
        ".ytd-expandable-video-description-body-renderer span:nth-child(1)::text"
    ).get()

    hash_tags = [
        {
            "name": hash_tag.css("::text").get(),
            "link": f'https://www.youtube.com{hash_tag.css("::attr(href)").get()}',
        }
        for hash_tag in selector.css(
            ".ytd-expandable-video-description-body-renderer a"
        )
    ]

    # https://regex101.com/r/onRk9j/1
    category = "".join(
        re.findall(r'"category":"(.*)","publishDate"', str(all_script_tags))
    )

    comments_amount = int(
        selector.css("#count .count-text span:nth-child(1)::text")
        .get()
        .replace(",", "")
    )

    comments = []

    for comment in selector.css("#contents > ytd-comment-thread-renderer"):
        comments.append(
            {
                "author": comment.css("#author-text span::text").get().strip(),
                "link": f'https://www.youtube.com{comment.css("#author-text::attr(href)").get()}',
                "date": comment.css(".published-time-text a::text").get(),
                "likes": comment.css("#vote-count-middle::text").get().strip(),
                "comment": comment.css("#content-text::text").get(),
                "avatar": comment.css("#author-thumbnail #img::attr(src)").get(),
            }
        )

    suggested_videos = []

    for video in selector.css("ytd-compact-video-renderer"):
        suggested_videos.append(
            {
                "title": video.css("#video-title::text").get().strip(),
                "link": f'https://www.youtube.com{video.css("#thumbnail::attr(href)").get()}',
                "channel_name": video.css("#channel-name #text::text").get(),
                "date": video.css("#metadata-line span:nth-child(2)::text").get(),
                "views": video.css("#metadata-line span:nth-child(1)::text").get(),
                "duration": video.css("#overlays #text::text").get().strip(),
                "thumbnail": video.css("#thumbnail img::attr(src)").get(),
            }
        )

    youtube_video_page.append(
        {
            "title": title,
            "views": views,
            "likes": likes,
            "date": date,
            "duration": duration,
            "channel": channel,
            "keywords": keywords,
            "thumbnail": thumbnail,
            "description": description,
            "hash_tags": hash_tags,
            "category": category,
            "suggested_videos": suggested_videos,
            "comments_amount": comments_amount,
            "comments": comments,
        }
    )

    print(json.dumps(youtube_video_page, indent=2, ensure_ascii=False))


def get_info_from_channel(channel_link: str):
    driver = webdriver.Edge()

    driver.get(channel_link)
    driver.maximize_window()

    time.sleep(5)

    selector = Selector(text=driver.page_source)
    driver.quit()

    # channel title
    channel_title = selector.css("#text-container #text::text").get()

    # date joined //*[@id="right-column"]/yt-formatted-string[2]/span[2]
    date_joined = selector.css(
        "#additional-info-container > table > tbody > tr:nth-child(7) > td:nth-child(2) > yt-attributed-string > span > span::text"
    ).get()

    print(date_joined)

    # total views //*[@id="right-column"]/yt-formatted-string[3]

    total_views = selector.css(
        "#additional-info-container > table > tbody > tr:nth-child(6) > td:nth-child(2)::text"
    ).get()

    # total subs //*[@id="subscriber-count"]

    total_subs = selector.css("#subscriber-count::text").get()

    # total videos //*[@id="videos-count"]/span[1]

    total_videos = selector.css("#videos-count > span:nth-child(1)::text").get()

    channel_info = {
        "channel_title": channel_title,
        "date_joined": date_joined,
        "total_views": total_views,
        "total_subs": total_subs,
        "total_videos": total_videos,
    }

    print(json.dumps(channel_info, indent=2, ensure_ascii=False))

    return pd.DataFrame(channel_info, index=[0])


def get_info_from_video(selector):
    # title
    title = "".join(selector.xpath('//*[@id="title"]/h1//text()').getall()).strip()

    # date
    date = selector.css("#info-strings yt-formatted-string::text").get()

    # views
    views = selector.css("span.bold.style-scope.yt-formatted-string::text").get()

    # likes
    likes = selector.css(
        "#segmented-like-button > ytd-toggle-button-renderer > yt-button-shape > button::attr(aria-label)"
    ).get()

    # comments
    comments = selector.css("yt-formatted-string::text").getall()
    next_item = None
    for i, item in enumerate(comments):
        if item == "Coment√°rios":
            if i < len(comments) - 1:
                next_item = comments[i + 1]
                break

    comments_amount = next_item

    # keywords
    # all_script_tags = selector.css("script").getall()
    # keywords = (
    #     "".join(
    #         re.findall(r'"keywords":\[(.*)\],"channelId":".*"', str(all_script_tags))
    #     )
    #     .replace('"', "")
    #     .split(",")
    # )

    print(title, views, likes, date, comments_amount)

    try:
        likes = re.search(r"(\d+)", likes).group()
    except Exception as e:
        likes = 0
    # views = re.search(r"(\d+)", views).group()

    return pd.DataFrame.from_dict(
        {
            "title": [title],
            "views": [views],
            "likes": [likes],
            "date": [date],
            "comments_amount": [comments_amount],
            # "keywords": [keywords],
        }
    )


def parse_channel(selector) -> pd.DataFrame:
    subscribers = selector.css(
        "#subscriber-count.style-scope.ytd-c4-tabbed-header-renderer::text"
    ).get()

    # subscribers = re.search(r"(\d+)", subscribers).group()

    # get recent 5 videos
    channel_name = selector.css(
        "div#channel-header-container yt-formatted-string#text::text"
    ).get()

    if channel_name is None:
        channel_name = selector.css("div#channel-header-container h1#text::text").get()

    print("Channel name: ", channel_name)

    videos = selector.css(
        "div.style-scope.ytd-rich-item-renderer ytd-rich-grid-media div.style-scope.ytd-rich-grid-media a#thumbnail.yt-simple-endpoint.inline-block.style-scope.ytd-thumbnail::attr(href)"
    ).getall()[:5]

    u, ind = np.unique(videos, return_index=True)
    videos = u[np.argsort(ind)]

    df = pd.DataFrame()
    for v in videos:
        print("Video: ", v)

        result = scroll_page(f"https://www.youtube.com{v}")

        info = get_info_from_video(result)
        info["channel_name"] = channel_name
        info["subscribers"] = subscribers
        # print(info)

        df = pd.concat([df, info])
        # df = df.append(info, ignore_index=True)

    print("Videos i got: ", len(videos))
    return df


def parse_top_channel(channel_link: str) -> pd.DataFrame:
    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    from selenium.webdriver.common.by import By

    driver = webdriver.Edge()
    wait = WebDriverWait(driver, 3)
    driver.implicitly_wait(10)

    driver.get(channel_link)
    driver.maximize_window()

    # //*[@id="chips"]/yt-chip-cloud-chip-renderer[2]
    # wait for page to load

    try:
        wait.until(
            EC.presence_of_element_located(
                (By.XPATH, '//*[@id="chips"]/yt-chip-cloud-chip-renderer[2]')
            )
        ).click()
    except Exception as e:
        print("Nao possui aba de videos em alta")
        # return empty dataframe
        # return pd.DataFrame()

    time.sleep(3)
    selector = Selector(text=driver.page_source)
    driver.quit()

    channel_name = (
        selector.css("div#channel-header-container yt-formatted-string#text::text")
        .get()
        .strip()
    )

    videos = selector.css(
        "div.style-scope.ytd-rich-item-renderer ytd-rich-grid-media div.style-scope.ytd-rich-grid-media a#thumbnail.yt-simple-endpoint.inline-block.style-scope.ytd-thumbnail::attr(href)"
    ).getall()[:5]

    u, ind = np.unique(videos, return_index=True)
    videos = u[np.argsort(ind)]

    df = pd.DataFrame()
    for v in videos:
        # print("Video: ", v)

        result = scroll_page(f"https://www.youtube.com{v}")

        info = get_info_from_video(result)
        print(info)
        info["channel_name"] = channel_name
        # print(info)

        df = pd.concat([df, info])
        # df = df.append(info, ignore_index=True)

    print("Videos i got: ", len(videos))
    return df

Pegar dados

In [3]:
# %%
with open("canais.txt", "r") as f:
    # read each line as a item in a list and remove the \n
    canais = [line.strip() for line in f.readlines()]

base_path = f"./data/{canais[0].split('@')[-1]}/"

df = pd.DataFrame()
df_top = pd.DataFrame()
df_lifetime = pd.DataFrame()
for ch in canais:
    # recent videos
    result = scroll_page(ch + "/videos")
    df_channel = parse_channel(result)
    df = pd.concat([df, df_channel])

    # # top videos
    df_top_channel = parse_top_channel(ch + "/videos")
    df_top = pd.concat([df_top, df_top_channel])

    # lifetime info
    df_lifetime_channel = get_info_from_channel(ch + "/about")
    df_lifetime = pd.concat([df_lifetime, df_lifetime_channel])


os.makedirs(base_path, exist_ok=True)

df.to_csv(base_path + "videos.csv", index=False)
df_top.to_csv(base_path + "top_videos.csv", index=False)
df_lifetime.to_csv(base_path + "lifetime.csv", index=False)

Channel name:  Syngenta Digital Brasil
Video:  /watch?v=6a1a2bVrXjM


Caminho da inova√ß√£o  visualiza√ß√µes   Marque este v√≠deo como "Gostei" com mais 2 pessoas 20 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=qZMXpQbX0Sk


Qual praga est√° colocando a sua lavoura em risco? 90 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 3 pessoas 19 de set. de 2023 Transcri√ß√£o
Video:  /watch?v=8ArzJ042mj0


Plataforma Cropwise - Solu√ß√µes conectadas, sem retrabalho. 207 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 1 pessoa 8 de set. de 2023 Transcri√ß√£o
Video:  /watch?v=zIg-gZRfLM8


Digital no suporte a tomada de decis√£o. 512 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 16 pessoas 29 de jun. de 2023 1
Video:  /watch?v=xqUzwhGsu_w


Cases de Reinven√ß√£o de 2022 170 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 6 pessoas 5 de jan. de 2023 Transcri√ß√£o
Videos i got:  5


Cropwise Protector | Pr√©-plantio: monitoramento de daninhas 127¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 24 pessoas 4 de nov. de 2020 Transcri√ß√£o
                                               title                  views  \
0  Cropwise Protector | Pr√©-plantio: monitorament...  127¬†mil visualiza√ß√µes   

  likes               date comments_amount  
0    24  4 de nov. de 2020     Transcri√ß√£o  


Syngenta Digital | Chegou a evolu√ß√£o da agricultura digital 114¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 92 pessoas 15 de jun. de 2020 2
                                               title                  views  \
0  Syngenta Digital | Chegou a evolu√ß√£o da agricu...  114¬†mil visualiza√ß√µes   

  likes                date comments_amount  
0    92  15 de jun. de 2020               2  


#WeConnectAg: Tecnologia na agricultura √© aposta para produtividade 58¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 4 pessoas 10 de fev. de 2020 Transcri√ß√£o
                                               title                 views  \
0  #WeConnectAg: Tecnologia na agricultura √© apos...  58¬†mil visualiza√ß√µes   

  likes                date comments_amount  
0     4  10 de fev. de 2020     Transcri√ß√£o  


#WeConnectAg: estamos vivendo a quarta revolu√ß√£o agr√≠cola? 54¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 2 pessoas 3 de fev. de 2020 1
                                               title                 views  \
0  #WeConnectAg: estamos vivendo a quarta revolu√ß...  54¬†mil visualiza√ß√µes   

  likes               date comments_amount  
0     2  3 de fev. de 2020               1  


#WeConnectAg: Mudan√ßas clim√°ticas pedem nova agricultura United Nations Marque este v√≠deo como "Gostei" com mais 2 pessoas 5 de fev. de 2020 1
                                               title           views likes  \
0  #WeConnectAg: Mudan√ßas clim√°ticas pedem nova a...  United Nations     2   

                date comments_amount  
0  5 de fev. de 2020               1  
Videos i got:  5


Inscreveu-se em 25 de jul. de 2014
{
  "channel_title": "Syngenta Digital Brasil",
  "date_joined": "Inscreveu-se em 25 de jul. de 2014",
  "total_views": "833.066 visualiza√ß√µes",
  "total_subs": "3,26¬†mil inscritos",
  "total_videos": "141"
}


Channel name:  Farmbox
Video:  /watch?v=I92iBEQ-Ljk


Do plantio √† colheita, ao seu lado! 111 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 15 pessoas 9 de out. de 2023 5
Video:  /watch?v=sYqpcIzA49Q


Conhe√ßa o Labs: Um mundo de possibilidades dentro do Farmbox. üå± 143 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 17 pessoas 3 de ago. de 2023 4
Video:  /watch?v=NAObwZ2gzE0


Agroimpar e Farmbox - Hist√≥ria de sucesso 111 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 12 pessoas 27 de abr. de 2023 5
Video:  /watch?v=qZXsN55UJOE


 None None None None
Video:  /watch?v=6g3B9toQN4c


Alex Bruno - Fazenda Estrela Boscoli 420 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 52 pessoas 3 de jan. de 2023 3
Videos i got:  5


 None None None None
  title views  likes  date comments_amount
0        None      0  None            None


Gest√£o agron√¥mica na palma da m√£o 6,3¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 21 pessoas 8 de jul. de 2022 1
                               title                  views likes  \
0  Gest√£o agron√¥mica na palma da m√£o  6,3¬†mil visualiza√ß√µes    21   

                date comments_amount  
0  8 de jul. de 2022               1  


Farmbox: Poder de Gest√£o Agron√¥mica 2,4¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 20 pessoas 27 de abr. de 2020 Transcri√ß√£o
                                 title                  views likes  \
0  Farmbox: Poder de Gest√£o Agron√¥mica  2,4¬†mil visualiza√ß√µes    20   

                 date comments_amount  
0  27 de abr. de 2020     Transcri√ß√£o  


Franciosi Agro e Farmbox 1,8¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 61 pessoas 1 de set. de 2021 1
                      title                  views likes               date  \
0  Franciosi Agro e Farmbox  1,8¬†mil visualiza√ß√µes    61  1 de set. de 2021   

  comments_amount  
0               1  


Ricardo Atarasi - Fazenda 7 Povos 1,3¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 62 pessoas 16 de ago. de 2021 1
                               title                  views likes  \
0  Ricardo Atarasi - Fazenda 7 Povos  1,3¬†mil visualiza√ß√µes    62   

                 date comments_amount  
0  16 de ago. de 2021               1  
Videos i got:  5


Inscreveu-se em 29 de jul. de 2019
{
  "channel_title": "Farmbox",
  "date_joined": "Inscreveu-se em 29 de jul. de 2019",
  "total_views": "27.752 visualiza√ß√µes",
  "total_subs": "553 inscritos",
  "total_videos": "32"
}


Channel name:  xarvio Digital Farming Solutions
Video:  /watch?v=avzyuqMkRUI


xarvio John Deere - Optimierung der Pflanzenproduktion 47 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 0 pessoa 12 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=t06SNUvkZW8


xarvio John Deere Distributor ENG 27 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 1 pessoa 12 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=EACPffcFxcU


xarvio John Deere - Heikos Erfahrungsbericht - Das Prinzip und seine Vorteile 118 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 1 pessoa 11 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=LKbGZm9aalY


xarvio John Deere - Heiko's Testimonial on the approach and the benefits 11 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 0 pessoa 11 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=2qTCFupJRZo


xarvio und John Deere - Ein erfolgreiches Pilotprojekt 23 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 1 pessoa 11 de nov. de 2023 Transcri√ß√£o
Videos i got:  5


xarvio SCOUTING ‡§∏‡•ç‡§ï‡§æ‡§â‡§ü‡§ø‡§Ç‡§ó -‡§ï‡•É‡§∑‡§ï ‡§Æ‡§ø‡§§‡•ç‡§∞ 6,9¬†mi de visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 115 pessoas 22 de abr. de 2021 3
                                   title                    views likes  \
0  xarvio SCOUTING ‡§∏‡•ç‡§ï‡§æ‡§â‡§ü‡§ø‡§Ç‡§ó -‡§ï‡•É‡§∑‡§ï ‡§Æ‡§ø‡§§‡•ç‡§∞  6,9¬†mi de visualiza√ß√µes   115   

                 date comments_amount  
0  22 de abr. de 2021               3  


xarvio SCOUTING - Asistentul agricol din buzunarul dvs. 2,8¬†mi de visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 13 pessoas 27 de abr. de 2021 xarvio SCOUTING - Asistentul agricol din buzunarul dvs.
                                               title                    views  \
0  xarvio SCOUTING - Asistentul agricol din buzun...  2,8¬†mi de visualiza√ß√µes   

  likes                date                                    comments_amount  
0    13  27 de abr. de 2021  xarvio SCOUTING - Asistentul agricol din buzun...  


xarvio SCOUTING (ES) 2,7¬†mi de visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 14 pessoas 27 de abr. de 2021 xarvio SCOUTING (ES)
                  title                    views likes                date  \
0  xarvio SCOUTING (ES)  2,7¬†mi de visualiza√ß√µes    14  27 de abr. de 2021   

        comments_amount  
0  xarvio SCOUTING (ES)  


xarvio FIELD MANAGER [EN] 1,9¬†mi de visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 43 pessoas 11 de abr. de 2019 1
                       title                    views likes  \
0  xarvio FIELD MANAGER [EN]  1,9¬†mi de visualiza√ß√µes    43   

                 date comments_amount  
0  11 de abr. de 2019               1  


xarvio SCOUTING (PL) Automatyczna diagnostyka p√≥l 934¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 17 pessoas 3 de set. de 2020 1
                                               title                  views  \
0  xarvio SCOUTING (PL) Automatyczna diagnostyka p√≥l  934¬†mil visualiza√ß√µes   

  likes               date comments_amount  
0    17  3 de set. de 2020               1  
Videos i got:  5


Inscreveu-se em 1 de abr. de 2019
{
  "channel_title": "xarvio Digital Farming Solutions",
  "date_joined": "Inscreveu-se em 1 de abr. de 2019",
  "total_views": "19.743.313 visualiza√ß√µes",
  "total_subs": "1,99¬†mil inscritos",
  "total_videos": "363"
}


Channel name:  FieldView TV
Video:  /watch?v=jEJXF_-Ejhg


Melhores funcionalidades digitais para a gest√£o da fazenda | Conex√£o FieldView‚Ñ¢ 222 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 3 pessoas 24 de out. de 2023 Transcri√ß√£o
Video:  /watch?v=UcxZCemHFU4


Usando os pins georreferenciados | Conex√£o FieldView‚Ñ¢Ô∏è 725 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 2 pessoas 17 de out. de 2023 Transcri√ß√£o
Video:  /watch?v=u0GNdJG066A


Qual √© o melhor manejo contra anomalia da soja? 39 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 4 pessoas 11 de out. de 2023 Transcri√ß√£o
Video:  /watch?v=keRHuU1EUec


3 agricultores que usaram o monitoramento digital a seu favor | Conex√£o FieldView‚Ñ¢ 442 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 6 pessoas 10 de out. de 2023 Transcri√ß√£o
Video:  /watch?v=Za5KRhA0ito


Diagn√≥stico FieldView‚Ñ¢, como usar? | Conex√£o FieldView‚Ñ¢ 68 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 7 pessoas 3 de out. de 2023 Transcri√ß√£o
Videos i got:  5


Mas afinal, o que √© o FieldView‚Ñ¢? - Ep. 21 823¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 254 pessoas 15 de mai. de 2018 7
                                        title                  views likes  \
0  Mas afinal, o que √© o FieldView‚Ñ¢? - Ep. 21  823¬†mil visualiza√ß√µes   254   

                 date comments_amount  
0  15 de mai. de 2018               7  


FieldView‚Ñ¢ ‚Äì Teaser ‚Äì Voc√™ conecta e evolui_ 627¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 35 pessoas 3 de mai. de 2023 Transcri√ß√£o
                                          title                  views likes  \
0  FieldView‚Ñ¢ ‚Äì Teaser ‚Äì Voc√™ conecta e evolui_  627¬†mil visualiza√ß√µes    35   

                date comments_amount  
0  3 de mai. de 2023     Transcri√ß√£o  


Sua Fazenda Digital ‚Äì FieldView‚Ñ¢ ‚Äì Voc√™ conecta e evolui_ 625¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 44 pessoas 24 de mai. de 2023 Transcri√ß√£o
                                               title                  views  \
0  Sua Fazenda Digital ‚Äì FieldView‚Ñ¢ ‚Äì Voc√™ conect...  625¬†mil visualiza√ß√µes   

  likes                date comments_amount  
0    44  24 de mai. de 2023     Transcri√ß√£o  


Voc√™ conecta e evolui_ 605¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 21 pessoas 10 de mai. de 2023 2
                    title                  views likes                date  \
0  Voc√™ conecta e evolui_  605¬†mil visualiza√ß√µes    21  10 de mai. de 2023   

  comments_amount  
0               2  


De pai para filho ‚Äì FieldView‚Ñ¢ ‚Äì Voc√™ conecta e evolui_ 519¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 8 pessoas 17 de mai. de 2023 Transcri√ß√£o
                                               title                  views  \
0  De pai para filho ‚Äì FieldView‚Ñ¢ ‚Äì Voc√™ conecta ...  519¬†mil visualiza√ß√µes   

  likes                date comments_amount  
0     8  17 de mai. de 2023     Transcri√ß√£o  
Videos i got:  5


Inscreveu-se em 9 de out. de 2015
{
  "channel_title": "FieldView TV",
  "date_joined": "Inscreveu-se em 9 de out. de 2015",
  "total_views": "10.345.865 visualiza√ß√µes",
  "total_subs": "10,6¬†mil inscritos",
  "total_videos": "289"
}


Channel name:  Aegro
Video:  /watch?v=EgxE-4S0s70


9 anos de Aegro 73 visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 5 pessoas 1 de nov. de 2023 Transcri√ß√£o
Video:  /watch?v=U0ZwJpTDc18


Como a Fazenda 4 Maravilhas integrou informa√ß√µes essenciais da pecu√°ria e lavoura com o Aegro 1,2¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 15 pessoas 25 de out. de 2023 Transcri√ß√£o
Video:  /watch?v=Vi97Qmp5y94


Como a Fazenda Agro Ivers alcan√ßou 42% de margem de lucro na safra utilizando o Aegro 30¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 115 pessoas 21 de set. de 2023 Transcri√ß√£o
Video:  /watch?v=C9X9eBrCFxY


Como a Fazenda Alvorada Bueno dobrou a quantidade de √°rea plantada utilizando o Aegro 27¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 37 pessoas 25 de ago. de 2023 Transcri√ß√£o
Video:  /watch?v=uthccjcgekw


Como o grupo Nutriva Cereais maximizou sua rentabilidade usando o Aegro 115¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 222 pessoas 2 de jun. de 2023 3
Videos i got:  5


Hist√≥ria de sucesso #SouAegro - George Vital 175¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 79 pessoas 8 de mar. de 2023 2
                                          title                  views likes  \
0  Hist√≥ria de sucesso #SouAegro - George Vital  175¬†mil visualiza√ß√µes    79   

                date comments_amount  
0  8 de mar. de 2023               2  


Como o grupo Nutriva Cereais maximizou sua rentabilidade usando o Aegro 115¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 222 pessoas 2 de jun. de 2023 3
                                               title                  views  \
0  Como o grupo Nutriva Cereais maximizou sua ren...  115¬†mil visualiza√ß√µes   

  likes               date comments_amount  
0   222  2 de jun. de 2023               3  


Conhe√ßa o aplicativo Aegro para gest√£o de fazendas 106¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 33 pessoas 27 de out. de 2020 Conhe√ßa o aplicativo Aegro para gest√£o de fazendas
                                               title                  views  \
0  Conhe√ßa o aplicativo Aegro para gest√£o de faze...  106¬†mil visualiza√ß√µes   

  likes                date                                    comments_amount  
0    33  27 de out. de 2020  Conhe√ßa o aplicativo Aegro para gest√£o de faze...  


Hist√≥ria de sucesso #SouAegro - Oberdan Ermita 104¬†mil visualiza√ß√µes Marque este v√≠deo como "Gostei" com mais 57 pessoas 28 de mar. de 2023 Transcri√ß√£o
                                            title                  views  \
0  Hist√≥ria de sucesso #SouAegro - Oberdan Ermita  104¬†mil visualiza√ß√µes   

  likes                date comments_amount  
0    57  28 de mar. de 2023     Transcri√ß√£o  


 None None None None
  title views  likes  date comments_amount
0        None      0  None            None
Videos i got:  5


Inscreveu-se em 27 de jun. de 2015
{
  "channel_title": "Aegro",
  "date_joined": "Inscreveu-se em 27 de jun. de 2015",
  "total_views": "1.014.378 visualiza√ß√µes",
  "total_subs": "9,11¬†mil inscritos",
  "total_videos": "169"
}


last 30 days

In [4]:
# read channel IDs

with open("canais.txt", "r") as f:
    canais = f.readlines()


canais = [c.strip() for c in canais]
# take only the string after the last slash
canais = [c.split("/")[-1] for c in canais]

print(canais)

base_url = "https://socialblade.com/youtube/channel/"

social_blade_data = []
for c in canais:
    response = scroll_page(base_url + c)

    # last 30 days views #socialblade-user-content > div:nth-child(23) > div:nth-child(3) > span
    views = response.css(
        "#socialblade-user-content > div:nth-child(23) > div:nth-child(3) > span::text"
    ).get()
    subs = response.css(
        "#socialblade-user-content > div:nth-child(23) > div:nth-child(2) > span::text"
    ).get()

    if views is None or subs is None:
        views = response.css(
            "#socialblade-user-content > div:nth-child(16) > div:nth-child(3) > span::text"
        ).get()
        subs = response.css(
            "#socialblade-user-content > div:nth-child(16) > div:nth-child(2) > span::text"
        ).get()

    social_blade_data.append({"Channel": c, "views": views, "subs": subs})

last_30days = pd.DataFrame(social_blade_data)
last_30days = last_30days.fillna("0")

last_30days.to_parquet(
    f'data/{canais[0].split("@")[-1]}/last_30_days.parquet', index=False
)

['@syngentadigitalbrasil', '@Farmboxapp', '@xarvioDigitalFarmingSolutions', '@FieldViewTV', '@Aegro']
