# <span style="color: green; font-size: 40px; font-weight: bold;"> Projeto Dashboard para Visualização </span>

<br> <br>

# Projeto YouTube Success Predictor

<br><br>

In [187]:
import dash
from dash import dcc, html
from dash.dependencies import Input, Output, State
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

# Carregar os DataFrames salvos
total_criacao_mes = pd.read_csv('dashboard_visualizacao/total_criacao_mes.csv')
total_criacao_ano = pd.read_csv('dashboard_visualizacao/total_criacao_ano.csv')
total_videos_mes = pd.read_csv('dashboard_visualizacao/total_videos_mes.csv')
total_videos_ano = pd.read_csv('dashboard_visualizacao/total_videos_ano.csv')
total_visualizacoes_mes = pd.read_csv('dashboard_visualizacao/total_visualizacoes_mes.csv')
total_visualizacoes_ano = pd.read_csv('dashboard_visualizacao/total_visualizacoes_ano.csv')
taxa_crescimento_visualizacoes_ano = pd.read_csv('dashboard_visualizacao/taxa_crescimento_visualizacoes_ano.csv')

# Carregar dados adicionais para mapas
dados = pd.read_csv('dashboard_visualizacao/dados_da_atualizado.csv')

# Carregar dados de tipo de canal por país
dados_tipo_canal = pd.read_csv('dashboard_visualizacao/dados_tipo_canal.csv')

# Calcular a média dos ganhos mensais estimados mínimos para cada país
media_ganhos_pais = dados.groupby('pais')['ganhos_mensais_estimados_minimo'].mean().reset_index()
media_ganhos_pais['ganhos_mensais_estimados_minimo'] = media_ganhos_pais['ganhos_mensais_estimados_minimo'].apply(lambda x: round(x, 2))

# Calcular a média da relação PIB per capita x ganhos mensais estimados mínimos para cada país
media_relacao_pib_pais = dados.groupby('pais')['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'].mean().reset_index()
media_relacao_pib_pais['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'] = media_relacao_pib_pais['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'].apply(lambda x: round(x, 2))

# Converter 'data_criacao' para datetime
total_criacao_mes['data_criacao'] = pd.to_datetime(total_criacao_mes['data_criacao'])
total_videos_mes['data_criacao'] = pd.to_datetime(total_videos_mes['data_criacao'])
total_visualizacoes_mes['data_criacao'] = pd.to_datetime(total_visualizacoes_mes['data_criacao'])

# Lista dos meses
meses = ["Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho", 
         "Julho", "Agosto", "Setembro", "Outubro", "Novembro", "Dezembro"]

# Mapear os meses para nomes em português
total_criacao_mes['mes'] = total_criacao_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                            7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_criacao_mes['mes'] = pd.Categorical(total_criacao_mes['mes'], categories=meses, ordered=True)

total_videos_mes['mes'] = total_videos_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                          7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_videos_mes['mes'] = pd.Categorical(total_videos_mes['mes'], categories=meses, ordered=True)

total_visualizacoes_mes['mes'] = total_visualizacoes_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                                      7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_visualizacoes_mes['mes'] = pd.Categorical(total_visualizacoes_mes['mes'], categories=meses, ordered=True)

# Agrupar dados por mês para remover as listras
total_criacao_mes = total_criacao_mes.groupby('mes').sum().reset_index()
total_videos_mes = total_videos_mes.groupby('mes').sum().reset_index()
total_visualizacoes_mes = total_visualizacoes_mes.groupby('mes').sum().reset_index()

# Inicializa a aplicação Dash
app = dash.Dash(__name__)

# Função para criar gráficos de barras
def create_bar_chart(data, x_col, y_col, title, xaxis_title):
    fig = px.bar(data, x=x_col, y=y_col, title=title)
    fig.update_layout(xaxis_title=xaxis_title, yaxis_title='Total')
    fig.update_xaxes(type='category')
    return fig

# Função para criar gráficos de mapa
def create_map(data, color_col, title):
    hover_template = {
        'ganhos_mensais_estimados_minimo': '<b>%{location}</b><br>Média de Ganhos Mensais Estimados Por Canal: U$$ %{z:,.2f}<extra></extra>',
        'total_usuarios_estimado_por_pais': '<b>%{location}</b><br>Total de Usuários Estimados por País: %{customdata[0]}<extra></extra>',
        'proporcao_usuarios_youtube_x_populacao_pais': '<b>%{location}</b><br>Proporção de Usuários do YouTube x População do País: Aproximadamente %{z:.0%} da população<extra></extra>',
        'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo': '<b>%{location}</b><br>Relação PIB Per Capita x Ganhos Mensais Estimados Mínimos: U$$ %{z:,.2f}<extra></extra>'
    }
    
    if color_col == 'total_usuarios_estimado_por_pais':
        data['customdata'] = data[color_col].apply(lambda x: f'{x / 1e6:.1f} milhões' if x >= 1e6 else f'{x:,.0f} mil')
    else:
        data['customdata'] = data[color_col]

    fig = px.choropleth(data, locations='pais', locationmode='country names', color=color_col,
                        hover_name='pais', title=title, color_continuous_scale=px.colors.sequential.Plasma,
                        custom_data=['customdata'])
    fig.update_geos(projection_type="natural earth")
    fig.update_layout(
        margin={"r":0,"t":0,"l":0,"b":0},
        geo=dict(
            showframe=False,
            showcoastlines=True,
            coastlinecolor="Black",
            showland=True,
            landcolor="white",
            showocean=True,
            oceancolor="LightBlue",
            showlakes=True,
            lakecolor="LightBlue"
        )
    )
    # Formatar o texto ao passar o mouse
    fig.update_traces(
        hovertemplate=hover_template[color_col]
    )
    return fig

# Função para criar gráficos de treemap
def create_treemap(data, path_col, value_col, title):
    unique_types = data[path_col[0]].nunique()  # Contar o número de tipos únicos de canal

    if unique_types == 1:
        # Definir a cor manualmente quando há apenas um tipo de canal
        fig = px.treemap(data, path=path_col, values=value_col, title=title)
        fig.update_traces(marker=dict(colors=["#1f77b4"]))  # Usar uma cor específica
    else:
        fig = px.treemap(data, path=path_col, values=value_col, title=title)

    fig.update_traces(textinfo="label", hovertemplate="%{label}<br>Contagem: %{value}<extra></extra>")
    return fig

# Função para criar gráficos de bolhas
def create_bubble_chart(data, x_col, y_col, size_col, title):
    fig = px.scatter(data, x=x_col, y=y_col, size=size_col, title=title, hover_name='nome_do_canal', size_max=60)
    fig.update_layout(xaxis_title=x_col, yaxis_title=y_col)
    return fig

# Função para criar gráficos de comparação
def create_comparison_chart(canal_info, dados):
    tipo_canal = canal_info['tipo_do_canal']
    pais = canal_info['pais']
    
    # Selecionar apenas colunas numéricas para calcular a média
    numeric_cols = ['total_de_inscritos', 'total_de_visualizacoes', 'total_de_videos_publicado', 'ganhos_mensais_estimados_minimo']
    media_tipo_canal = dados[dados['tipo_do_canal'] == tipo_canal][numeric_cols].mean()
    media_pais = dados[dados['pais'] == pais][numeric_cols].mean()

    fig = make_subplots(rows=2, cols=2, subplot_titles=[
        'Inscritos do Canal vs Média do Tipo', 
        'Visualizações do Canal vs Média do Tipo', 
        'Vídeos Publicados do Canal vs Média do Tipo',
        'Ganhos Mensais do Canal vs Média do Tipo'
    ])

    fig.add_trace(go.Bar(name='Canal', x=['Inscritos'], y=[canal_info['total_de_inscritos']]), row=1, col=1)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Inscritos'], y=[media_tipo_canal['total_de_inscritos']]), row=1, col=1)
    
    fig.add_trace(go.Bar(name='Canal', x=['Visualizações'], y=[canal_info['total_de_visualizacoes']]), row=1, col=2)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Visualizações'], y=[media_tipo_canal['total_de_visualizacoes']]), row=1, col=2)
    
    fig.add_trace(go.Bar(name='Canal', x=['Vídeos Publicados'], y=[canal_info['total_de_videos_publicado']]), row=2, col=1)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Vídeos Publicados'], y=[media_tipo_canal['total_de_videos_publicado']]), row=2, col=1)
    
    fig.add_trace(go.Bar(name='Canal', x=['Ganhos Mensais'], y=[canal_info['ganhos_mensais_estimados_minimo']]), row=2, col=2)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Ganhos Mensais'], y=[media_tipo_canal['ganhos_mensais_estimados_minimo']]), row=2, col=2)

    # Atualizando cada subtraço com suas legendas específicas
    for i, trace in enumerate(fig['data']):
        trace['showlegend'] = True
        trace['legendgroup'] = i // 2  # Cada par de gráficos compartilhará a mesma legenda
        trace['legendgrouptitle'] = {'text': f"Gráfico {i // 2 + 1}"}

    fig.update_layout(
        title_text="Comparação do Canal com Média do Tipo e País", 
        barmode='group'
    )

    fig.update_xaxes(title_text="Inscritos", row=1, col=1)
    fig.update_xaxes(title_text="Visualizações", row=1, col=2)
    fig.update_xaxes(title_text="Vídeos Publicados", row=2, col=1)
    fig.update_xaxes(title_text="Ganhos Mensais", row=2, col=2)

    fig.update_yaxes(title_text="Total", row=1, col=1)
    fig.update_yaxes(title_text="Total", row=1, col=2)
    fig.update_yaxes(title_text="Total", row=2, col=1)
    fig.update_yaxes(title_text="Total", row=2, col=2)

    return fig

# Layout da aplicação
app.layout = html.Div([
    dcc.Tabs([
        dcc.Tab(label='Visão Geral', children=[
            html.Div([
                html.H3('Selecione o Gráfico para Visualizar:'),
                dcc.Dropdown(
                    id='grafico-dropdown',
                    options=[
                        {'label': 'Top 10 canais com mais inscritos (Barras)', 'value': 'top_10_inscritos_barras'},
                        {'label': 'Top 30 canais com mais inscritos (Treemap)', 'value': 'top_30_inscritos_treemap'},
                        {'label': 'Top 10 canais com mais vídeos publicados (Barras)', 'value': 'top_10_videos_barras'},
                        {'label': 'Top 30 canais com mais vídeos publicados (Treemap)', 'value': 'top_30_videos_treemap'},
                        {'label': 'Top 10 canais com mais visualizações (Barras)', 'value': 'top_10_visualizacoes_barras'},
                        {'label': 'Top 30 canais com mais visualizações (Bolhas)', 'value': 'top_30_visualizacoes_bolhas'},
                        {'label': 'Total de Criação de Canal Por Mês', 'value': 'total_criacao_mes'},
                        {'label': 'Total de Criação de Canal Por Ano', 'value': 'total_criacao_ano'},
                        {'label': 'Total de Vídeos Publicados por Mês', 'value': 'total_videos_mes'},
                        {'label': 'Total de Vídeos Publicados por Ano', 'value': 'total_videos_ano'},
                        {'label': 'Total de Vídeos Visualizados por Mês', 'value': 'total_visualizacoes_mes'},
                        {'label': 'Total de Vídeos Visualizados por Ano', 'value': 'total_visualizacoes_ano'},
                        {'label': 'Taxa de Crescimento de Visualizações por Ano', 'value': 'taxa_crescimento_visualizacoes_ano'}
                    ],
                    value='top_10_inscritos_barras',
                    clearable=False
                ),
                dcc.Graph(id='grafico-visualizacao')
            ])
        ]),
        dcc.Tab(label='Visão por País', children=[
            html.Div([
                html.H3('Selecione a Escala:'),
                dcc.Dropdown(
                    id='escala-dropdown',
                    options=[
                        {'label': 'Ganhos Estimados Mínimos', 'value': 'ganhos_mensais_estimados_minimo'},
                        {'label': 'Total de Usuários Estimados por País', 'value': 'total_usuarios_estimado_por_pais'},
                        {'label': 'Proporção de Usuários do YouTube x População do País', 'value': 'proporcao_usuarios_youtube_x_populacao_pais'},
                        {'label': 'Relação PIB Per Capita x Ganhos Mensais Estimados Mínimos', 'value': 'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'}
                    ],
                    value='ganhos_mensais_estimados_minimo',
                    clearable=False
                ),
                dcc.Graph(id='mapa-visualizacao')
            ])
        ]),
        dcc.Tab(label='Visão por Tipo do Canal', children=[
            html.Div([
                html.Div([
                    html.H3('Selecione o País:'),
                    dcc.Dropdown(
                        id='pais-dropdown',
                        options=[{'label': 'Total', 'value': 'Total'}] + [{'label': pais, 'value': pais} for pais in sorted(dados_tipo_canal['pais'].unique())],
                        value='Total',
                        clearable=False
                    )
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div([
                    dcc.Graph(id='treemap-visualizacao')
                ], style={'width': '48%', 'display': 'inline-block'})
            ])
        ]),
        dcc.Tab(label='Visão Canais Individuais', children=[
            html.Div([
                html.H3('Selecione o País e Canal:'),
                html.Div([
                    dcc.Dropdown(
                        id='pais-dropdown-individual',
                        options=[{'label': pais, 'value': pais} for pais in sorted(dados['pais'].unique())],
                        value=None,
                        placeholder="Selecione um país",
                        clearable=False
                    ),
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div([
                    dcc.Dropdown(
                        id='canal-dropdown-individual',
                        options=[],
                        value=None,
                        placeholder="Selecione um canal",
                        clearable=False
                    ),
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div(id='canal-info', children=[
                    html.H4('Informações sobre o canal selecionado:')
                ]),
                dcc.Graph(id='grafico-comparacao')
            ])
        ])
    ])
])

# Callback para atualizar o gráfico selecionado
@app.callback(
    Output('grafico-visualizacao', 'figure'),
    Input('grafico-dropdown', 'value')
)
def update_graph(selected_graph):
    if selected_graph == 'top_10_inscritos_barras':
        data = dados.nlargest(10, 'total_de_inscritos')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_inscritos', 'Top 10 Canais com Mais Inscritos', 'Canais')
    elif selected_graph == 'top_30_inscritos_treemap':
        data = dados.nlargest(30, 'total_de_inscritos')
        return create_treemap(data, ['nome_do_canal'], 'total_de_inscritos', 'Top 30 Canais com Mais Inscritos')
    elif selected_graph == 'top_10_videos_barras':
        data = dados.nlargest(10, 'total_de_videos_publicado')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_videos_publicado', 'Top 10 Canais com Mais Vídeos Publicados', 'Canais')
    elif selected_graph == 'top_30_videos_treemap':
        data = dados.nlargest(30, 'total_de_videos_publicado')
        return create_treemap(data, ['nome_do_canal'], 'total_de_videos_publicado', 'Top 30 Canais com Mais Vídeos Publicados')
    elif selected_graph == 'top_10_visualizacoes_barras':
        data = dados.nlargest(10, 'total_de_visualizacoes')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_visualizacoes', 'Top 10 Canais com Mais Visualizações', 'Canais')
    elif selected_graph == 'top_30_visualizacoes_bolhas':
        data = dados.nlargest(30, 'total_de_visualizacoes')
        return create_bubble_chart(data, 'nome_do_canal', 'total_de_visualizacoes', 'total_de_visualizacoes', 'Top 30 Canais com Mais Visualizações')
    elif selected_graph == 'total_criacao_mes':
        return create_bar_chart(total_criacao_mes, 'mes', 'total', 'Total de Criação de Canal Por Mês', 'Mês')
    elif selected_graph == 'total_criacao_ano':
        return create_bar_chart(total_criacao_ano, 'data_criacao', 'total', 'Total de Criação de Canal Por Ano', 'Ano')
    elif selected_graph == 'total_videos_mes':
        return create_bar_chart(total_videos_mes, 'mes', 'total_de_videos_publicado', 'Total de Vídeos Publicados por Mês', 'Mês')
    elif selected_graph == 'total_videos_ano':
        return create_bar_chart(total_videos_ano, 'data_criacao', 'total_de_videos_publicado', 'Total de Vídeos Publicados por Ano', 'Ano')
    elif selected_graph == 'total_visualizacoes_mes':
        return create_bar_chart(total_visualizacoes_mes, 'mes', 'total_de_visualizacoes', 'Total de Vídeos Visualizados por Mês', 'Mês')
    elif selected_graph == 'total_visualizacoes_ano':
        return create_bar_chart(total_visualizacoes_ano, 'data_criacao', 'total_de_visualizacoes', 'Total de Vídeos Visualizados por Ano', 'Ano')
    elif selected_graph == 'taxa_crescimento_visualizacoes_ano':
        return create_bar_chart(taxa_crescimento_visualizacoes_ano, 'data_criacao', 'taxa_crescimento', 'Taxa de Crescimento de Visualizações por Ano', 'Ano')
    else:
        return {}

# Callback para atualizar o mapa selecionado
@app.callback(
    Output('mapa-visualizacao', 'figure'),
    Input('escala-dropdown', 'value')
)
def update_map(selected_scale):
    if selected_scale == 'ganhos_mensais_estimados_minimo':
        data = media_ganhos_pais
    elif selected_scale == 'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo':
        data = media_relacao_pib_pais
    else:
        data = dados
    return create_map(data, selected_scale, f'Mapa de {selected_scale.replace("_", " ").capitalize()}')

# Callback para atualizar o treemap com base no país selecionado
@app.callback(
    Output('treemap-visualizacao', 'figure'),
    Input('pais-dropdown', 'value')
)
def update_treemap(selected_country):
    if selected_country == 'Total':
        filtered_data = dados_tipo_canal.groupby('tipo_do_canal').sum().reset_index()
    else:
        filtered_data = dados_tipo_canal[dados_tipo_canal['pais'] == selected_country]
    return create_treemap(filtered_data, ['tipo_do_canal'], 'contagem', f'Número de Canais por Tipo de Canal em {selected_country}')

# Callback para atualizar a lista de canais com base no país selecionado
@app.callback(
    Output('canal-dropdown-individual', 'options'),
    Input('pais-dropdown-individual', 'value')
)
def set_canal_options(selected_pais):
    if selected_pais:
        canais = dados[dados['pais'] == selected_pais]['nome_do_canal'].unique()
        sorted_canais = sorted(canais, key=lambda s: (s.lower(), s))
        return [{'label': canal, 'value': canal} for canal in sorted_canais]
    return []

# Callback para exibir as informações do canal selecionado e atualizar o gráfico de comparação
@app.callback(
    [Output('canal-info', 'children'), Output('grafico-comparacao', 'figure')],
    Input('canal-dropdown-individual', 'value')
)
def display_canal_info(selected_canal):
    if selected_canal:
        canal_info = dados[dados['nome_do_canal'] == selected_canal].iloc[0]
        info = html.Div([
            html.H4(f"Aqui estão as principais informações do '{selected_canal}':"),
            html.P(f"Nome do canal: {selected_canal}"),
            html.P(f"País de origem: {canal_info['pais']}"),
            html.P(f"Tipo de canal: {canal_info['tipo_do_canal']}"),
            html.P(f"Data de criação do canal: {canal_info['dia_criacao_do_canal']}/{canal_info['mes_criacao_do_canal']}/{canal_info['ano_criacao_do_canal']}"),
            html.P(f"Idade do canal (em anos): {canal_info['idade_do_canal']}"),
            html.H4("Estatísticas do Canal:"),
            html.P(f"Total de inscritos: {canal_info['total_de_inscritos']:,}"),
            html.P(f"Total de visualizações: {canal_info['total_de_visualizacoes']:,}"),
            html.P(f"Total de vídeos publicados: {canal_info['total_de_videos_publicado']}"),
            html.P(f"Ganhos mensais estimados mínimos: ${canal_info['ganhos_mensais_estimados_minimo']:,.1f}")
        ])
        grafico = create_comparison_chart(canal_info, dados)
        return info, grafico
    return html.H4('Informações sobre o canal selecionado:'), {}

if __name__ == '__main__':
    app.run_server(debug=True)


<br><br><br>

# FIM!

In [172]:
import pandas as pd
from datetime import datetime

# Carregar o dataset existente
dados = pd.read_csv('dashboard_visualizacao/dados_da.csv')


# Dados do canal fictício "Alice Brandão"
novo_canal = {
    'nome_do_canal': 'Alice Brandão',
    'total_de_videos_publicado': 105,
    'total_de_inscritos': 255.0,
    'total_de_visualizacoes': 23589.0,
    'pais': 'Brazil',
    'tipo_do_canal': 'Music',
    'dia_criacao_do_canal': 7,
    'mes_criacao_do_canal': 8,
    'ano_criacao_do_canal': 2016,
    'idade_do_canal': 8,
    'rank_social_blade': 898933.0,
    'rank_inscritos': 18557.0,
    'rank_visualizacoes': 4511034.0,
    'rank_pais': 6115.0,
    'ganhos_mensais_estimados_minimo': 6.0,
    'total_de_visualizacoes_ultimos_30_dias': 23451.0,
    'total_de_inscritos_ultimos_30_dias': 10,
    'total_usuarios_estimado_por_pais': 138000000.0,
    'populacao_2022': 213317639.0,
    'pib_nominal_2022': 1.608e+12,
    'pib_per_capita_2022': 7544.0,
    'expectativa_de_vida_2022': 75.9,
    'taxa_de_natalidade': 13.5,
    'taxa_alfabetizacao_total_%': 92.6,
    'taxa_alfabetizacao_masculina_%': 93.2,
    'taxa_alfabetizacao_feminina_%': 92.0,
    'diferenca_alfabetizacao_masculino_feminino': 1.2,
    'taxa_desemprego_2022_%': 8.5,
    'taxa_de_pobreza': 21.4,
    'indice_de_watts': 0.7,
    'human_development_groups': 'High',
    'IDH_2021': 0.755,
    'indice_de_corrupcao_score': 38,
    'nivel_de_urbanizacao_2023_%_da_pop': 87.6,
    'continente': 'South America',
    'taxa_de_engajamento': 255.0 / 23589.0,  # Correção para incluir esta variável
    'proporcao_de_visualizacoes_recentes': 23451.0 / 23589.0,  # Correção para incluir esta variável
    'proporcao_de_inscritos_recentes': 10 / 255.0,  # Correção para incluir esta variável
    'media_de_inscritos_por_video': 255.0 / 105,  # Média de inscritos por vídeo
    'media_de_visualizacoes_por_video': 23589.0 / 105,  # Média de visualizações por vídeo
    'media_videos_publicados_por_dia': 105 / (8 * 365),  # Média de vídeos publicados por dia
    'media_videos_publicados_por_mes': 105 / (8 * 12),  # Média de vídeos publicados por mês
    'media_videos_publicados_por_ano': 105 / 8,  # Média de vídeos publicados por ano
    'proporcao_usuarios_youtube_x_populacao_pais': 138000000.0 / 213317639.0,  # Proporção de usuários do YouTube x população do país
    'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo': 7544.0 / 6.0,  # Relação PIB per capita x ganhos mensais estimados mínimos
    'media_crescimento_inscritos_dia': 10 / 30,  # Correção para novo valor de crescimento de inscritos por dia
    'media_crescimento_inscritos_mes': 10,  # Correção para novo valor de crescimento de inscritos por mês
    'media_crescimento_visualizacoes_dia': 23451.0 / 30  # Média de crescimento de visualizações por dia
}

# Adicionar o novo canal ao DataFrame
dados = dados.append(novo_canal, ignore_index=True)

# Verificar se o DataFrame possui todas as colunas necessárias
for col in novo_canal.keys():
    if col not in dados.columns:
        dados[col] = None

# Ordenar o DataFrame pelo país e pelo nome do canal
dados = dados.sort_values(by=['pais', 'nome_do_canal']).reset_index(drop=True)

# Verificar se o canal foi adicionado corretamente
display(dados[dados['nome_do_canal'] == 'Alice Brandão'])

Unnamed: 0,nome_do_canal,total_de_videos_publicado,total_de_inscritos,total_de_visualizacoes,pais,tipo_do_canal,dia_criacao_do_canal,mes_criacao_do_canal,ano_criacao_do_canal,idade_do_canal,rank_social_blade,rank_inscritos,rank_visualizacoes,rank_pais,ganhos_mensais_estimados_minimo,total_de_visualizacoes_ultimos_30_dias,total_de_inscritos_ultimos_30_dias,total_usuarios_estimado_por_pais,populacao_2022,pib_nominal_2022,pib_per_capita_2022,expectativa_de_vida_2022,taxa_de_natalidade,taxa_alfabetizacao_total_%,taxa_alfabetizacao_masculina_%,taxa_alfabetizacao_feminina_%,diferenca_alfabetizacao_masculino_feminino,taxa_desemprego_2022_%,taxa_de_pobreza,indice_de_watts,human_development_groups,IDH_2021,indice_de_corrupcao_score,nivel_de_urbanizacao_2023_%_da_pop,continente,media_de_inscritos_por_video,media_de_visualizacoes_por_video,media_videos_publicados_por_dia,media_videos_publicados_por_mes,media_videos_publicados_por_ano,proporcao_usuarios_youtube_x_populacao_pais,relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo,media_crescimento_inscritos_dia,media_crescimento_inscritos_mes,media_crescimento_visualizacoes_dia,proporcao_de_inscritos_recentes,proporcao_de_visualizacoes_recentes,taxa_de_engajamento
104,Alice Brandão,105,255.0,23589.0,Brazil,Music,7,8,2016,8,898933.0,18557.0,4511034.0,6115.0,6.0,23451.0,10.0,138000000.0,213317639.0,1608000000000.0,7544.0,75.9,13.5,92.6,93.2,92.0,1.2,8.5,21.4,0.7,High,0.755,38.0,87.6,South America,2.428571,224.657143,0.035959,1.09375,13.125,0.646923,1257.333333,0.333333,10.0,781.7,0.039216,0.99415,0.01081


In [188]:
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1350 entries, 0 to 1349
Data columns (total 48 columns):
 #   Column                                                    Non-Null Count  Dtype  
---  ------                                                    --------------  -----  
 0   nome_do_canal                                             1350 non-null   object 
 1   total_de_videos_publicado                                 1350 non-null   int64  
 2   total_de_inscritos                                        1350 non-null   float64
 3   total_de_visualizacoes                                    1350 non-null   float64
 4   pais                                                      1350 non-null   object 
 5   tipo_do_canal                                             1350 non-null   object 
 6   dia_criacao_do_canal                                      1350 non-null   int64  
 7   mes_criacao_do_canal                                      1350 non-null   int64  
 8   ano_criacao_do_can