# <span style="color: green; font-size: 40px; font-weight: bold;"> Projeto Dashboard para Visualização </span>

<br> <br>

# Projeto YouTube Success Predictor

In [154]:
import dash
from dash import dcc, html
from dash.dependencies import Input, Output, State
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

# Carregar os DataFrames salvos
total_criacao_mes = pd.read_csv('dashboard_visualizacao/total_criacao_mes.csv')
total_criacao_ano = pd.read_csv('dashboard_visualizacao/total_criacao_ano.csv')
total_videos_mes = pd.read_csv('dashboard_visualizacao/total_videos_mes.csv')
total_videos_ano = pd.read_csv('dashboard_visualizacao/total_videos_ano.csv')
total_visualizacoes_mes = pd.read_csv('dashboard_visualizacao/total_visualizacoes_mes.csv')
total_visualizacoes_ano = pd.read_csv('dashboard_visualizacao/total_visualizacoes_ano.csv')
taxa_crescimento_visualizacoes_ano = pd.read_csv('dashboard_visualizacao/taxa_crescimento_visualizacoes_ano.csv')

# Carregar dados adicionais para mapas
dados = pd.read_csv('dashboard_visualizacao/dados_da.csv')

# Carregar dados de tipo de canal por país
dados_tipo_canal = pd.read_csv('dashboard_visualizacao/dados_tipo_canal.csv')

# Calcular a média dos ganhos mensais estimados mínimos para cada país
media_ganhos_pais = dados.groupby('pais')['ganhos_mensais_estimados_minimo'].mean().reset_index()
media_ganhos_pais['ganhos_mensais_estimados_minimo'] = media_ganhos_pais['ganhos_mensais_estimados_minimo'].apply(lambda x: round(x, 2))

# Calcular a média da relação PIB per capita x ganhos mensais estimados mínimos para cada país
media_relacao_pib_pais = dados.groupby('pais')['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'].mean().reset_index()
media_relacao_pib_pais['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'] = media_relacao_pib_pais['relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'].apply(lambda x: round(x, 2))

# Converter 'data_criacao' para datetime
total_criacao_mes['data_criacao'] = pd.to_datetime(total_criacao_mes['data_criacao'])
total_videos_mes['data_criacao'] = pd.to_datetime(total_videos_mes['data_criacao'])
total_visualizacoes_mes['data_criacao'] = pd.to_datetime(total_visualizacoes_mes['data_criacao'])

# Lista dos meses
meses = ["Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho", 
         "Julho", "Agosto", "Setembro", "Outubro", "Novembro", "Dezembro"]

# Mapear os meses para nomes em português
total_criacao_mes['mes'] = total_criacao_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                            7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_criacao_mes['mes'] = pd.Categorical(total_criacao_mes['mes'], categories=meses, ordered=True)

total_videos_mes['mes'] = total_videos_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                          7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_videos_mes['mes'] = pd.Categorical(total_videos_mes['mes'], categories=meses, ordered=True)

total_visualizacoes_mes['mes'] = total_visualizacoes_mes['data_criacao'].dt.month.map({1: 'Janeiro', 2: 'Fevereiro', 3: 'Março', 4: 'Abril', 5: 'Maio', 6: 'Junho',
                                                                                      7: 'Julho', 8: 'Agosto', 9: 'Setembro', 10: 'Outubro', 11: 'Novembro', 12: 'Dezembro'})
total_visualizacoes_mes['mes'] = pd.Categorical(total_visualizacoes_mes['mes'], categories=meses, ordered=True)

# Agrupar dados por mês para remover as listras
total_criacao_mes = total_criacao_mes.groupby('mes').sum().reset_index()
total_videos_mes = total_videos_mes.groupby('mes').sum().reset_index()
total_visualizacoes_mes = total_visualizacoes_mes.groupby('mes').sum().reset_index()

# Inicializa a aplicação Dash
app = dash.Dash(__name__)

# Função para criar gráficos de barras
def create_bar_chart(data, x_col, y_col, title, xaxis_title):
    fig = px.bar(data, x=x_col, y=y_col, title=title)
    fig.update_layout(xaxis_title=xaxis_title, yaxis_title='Total')
    fig.update_xaxes(type='category')
    return fig

# Função para criar gráficos de mapa
def create_map(data, color_col, title):
    hover_template = {
        'ganhos_mensais_estimados_minimo': '<b>%{location}</b><br>Média de Ganhos Mensais Estimados Por Canal: U$$ %{z:,.2f}<extra></extra>',
        'total_usuarios_estimado_por_pais': '<b>%{location}</b><br>Total de Usuários Estimados por País: %{customdata[0]}<extra></extra>',
        'proporcao_usuarios_youtube_x_populacao_pais': '<b>%{location}</b><br>Proporção de Usuários do YouTube x População do País: Aproximadamente %{z:.0%} da população<extra></extra>',
        'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo': '<b>%{location}</b><br>Relação PIB Per Capita x Ganhos Mensais Estimados Mínimos: U$$ %{z:,.2f}<extra></extra>'
    }
    
    if color_col == 'total_usuarios_estimado_por_pais':
        data['customdata'] = data[color_col].apply(lambda x: f'{x / 1e6:.1f} milhões' if x >= 1e6 else f'{x:,.0f} mil')
    else:
        data['customdata'] = data[color_col]

    fig = px.choropleth(data, locations='pais', locationmode='country names', color=color_col,
                        hover_name='pais', title=title, color_continuous_scale=px.colors.sequential.Plasma,
                        custom_data=['customdata'])
    fig.update_geos(projection_type="natural earth")
    fig.update_layout(
        margin={"r":0,"t":0,"l":0,"b":0},
        geo=dict(
            showframe=False,
            showcoastlines=True,
            coastlinecolor="Black",
            showland=True,
            landcolor="white",
            showocean=True,
            oceancolor="LightBlue",
            showlakes=True,
            lakecolor="LightBlue"
        )
    )
    # Formatar o texto ao passar o mouse
    fig.update_traces(
        hovertemplate=hover_template[color_col]
    )
    return fig

# Função para criar gráficos de treemap
def create_treemap(data, path_col, value_col, title):
    unique_types = data[path_col[0]].nunique()  # Contar o número de tipos únicos de canal

    if unique_types == 1:
        # Definir a cor manualmente quando há apenas um tipo de canal
        fig = px.treemap(data, path=path_col, values=value_col, title=title)
        fig.update_traces(marker=dict(colors=["#1f77b4"]))  # Usar uma cor específica
    else:
        fig = px.treemap(data, path=path_col, values=value_col, title=title)

    fig.update_traces(textinfo="label", hovertemplate="%{label}<br>Contagem: %{value}<extra></extra>")
    return fig

# Função para criar gráficos de bolhas
def create_bubble_chart(data, x_col, y_col, size_col, title):
    fig = px.scatter(data, x=x_col, y=y_col, size=size_col, title=title, hover_name='nome_do_canal', size_max=60)
    fig.update_layout(xaxis_title=x_col, yaxis_title=y_col)
    return fig

# Função para criar gráficos de comparação
def create_comparison_chart(canal_info, dados):
    tipo_canal = canal_info['tipo_do_canal']
    pais = canal_info['pais']
    
    # Selecionar apenas colunas numéricas para calcular a média
    numeric_cols = ['total_de_inscritos', 'total_de_visualizacoes', 'total_de_videos_publicado', 'ganhos_mensais_estimados_minimo']
    media_tipo_canal = dados[dados['tipo_do_canal'] == tipo_canal][numeric_cols].mean()
    media_pais = dados[dados['pais'] == pais][numeric_cols].mean()

    fig = make_subplots(rows=2, cols=2, subplot_titles=[
        'Inscritos do Canal vs Média do Tipo', 
        'Visualizações do Canal vs Média do Tipo', 
        'Vídeos Publicados do Canal vs Média do Tipo',
        'Ganhos Mensais do Canal vs Média do Tipo'
    ])

    fig.add_trace(go.Bar(name='Canal', x=['Inscritos'], y=[canal_info['total_de_inscritos']]), row=1, col=1)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Inscritos'], y=[media_tipo_canal['total_de_inscritos']]), row=1, col=1)
    
    fig.add_trace(go.Bar(name='Canal', x=['Visualizações'], y=[canal_info['total_de_visualizacoes']]), row=1, col=2)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Visualizações'], y=[media_tipo_canal['total_de_visualizacoes']]), row=1, col=2)
    
    fig.add_trace(go.Bar(name='Canal', x=['Vídeos Publicados'], y=[canal_info['total_de_videos_publicado']]), row=2, col=1)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Vídeos Publicados'], y=[media_tipo_canal['total_de_videos_publicado']]), row=2, col=1)
    
    fig.add_trace(go.Bar(name='Canal', x=['Ganhos Mensais'], y=[canal_info['ganhos_mensais_estimados_minimo']]), row=2, col=2)
    fig.add_trace(go.Bar(name='Média Tipo', x=['Ganhos Mensais'], y=[media_tipo_canal['ganhos_mensais_estimados_minimo']]), row=2, col=2)

    fig.update_layout(title_text="Comparação do Canal com Média do Tipo e País", barmode='group')
    
    return fig

# Layout da aplicação
app.layout = html.Div([
    dcc.Tabs([
        dcc.Tab(label='Visão Geral', children=[
            html.Div([
                html.H3('Selecione o Gráfico para Visualizar:'),
                dcc.Dropdown(
                    id='grafico-dropdown',
                    options=[
                        {'label': 'Top 10 canais com mais inscritos (Barras)', 'value': 'top_10_inscritos_barras'},
                        {'label': 'Top 30 canais com mais inscritos (Treemap)', 'value': 'top_30_inscritos_treemap'},
                        {'label': 'Top 10 canais com mais vídeos publicados (Barras)', 'value': 'top_10_videos_barras'},
                        {'label': 'Top 30 canais com mais vídeos publicados (Treemap)', 'value': 'top_30_videos_treemap'},
                        {'label': 'Top 10 canais com mais visualizações (Barras)', 'value': 'top_10_visualizacoes_barras'},
                        {'label': 'Top 30 canais com mais visualizações (Bolhas)', 'value': 'top_30_visualizacoes_bolhas'},
                        {'label': 'Total de Criação de Canal Por Mês', 'value': 'total_criacao_mes'},
                        {'label': 'Total de Criação de Canal Por Ano', 'value': 'total_criacao_ano'},
                        {'label': 'Total de Vídeos Publicados por Mês', 'value': 'total_videos_mes'},
                        {'label': 'Total de Vídeos Publicados por Ano', 'value': 'total_videos_ano'},
                        {'label': 'Total de Vídeos Visualizados por Mês', 'value': 'total_visualizacoes_mes'},
                        {'label': 'Total de Vídeos Visualizados por Ano', 'value': 'total_visualizacoes_ano'},
                        {'label': 'Taxa de Crescimento de Visualizações por Ano', 'value': 'taxa_crescimento_visualizacoes_ano'}
                    ],
                    value='top_10_inscritos_barras',
                    clearable=False
                ),
                dcc.Graph(id='grafico-visualizacao')
            ])
        ]),
        dcc.Tab(label='Visão por País', children=[
            html.Div([
                html.H3('Selecione a Escala:'),
                dcc.Dropdown(
                    id='escala-dropdown',
                    options=[
                        {'label': 'Ganhos Estimados Mínimos', 'value': 'ganhos_mensais_estimados_minimo'},
                        {'label': 'Total de Usuários Estimados por País', 'value': 'total_usuarios_estimado_por_pais'},
                        {'label': 'Proporção de Usuários do YouTube x População do País', 'value': 'proporcao_usuarios_youtube_x_populacao_pais'},
                        {'label': 'Relação PIB Per Capita x Ganhos Mensais Estimados Mínimos', 'value': 'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo'}
                    ],
                    value='ganhos_mensais_estimados_minimo',
                    clearable=False
                ),
                dcc.Graph(id='mapa-visualizacao')
            ])
        ]),
        dcc.Tab(label='Visão por Tipo do Canal', children=[
            html.Div([
                html.Div([
                    html.H3('Selecione o País:'),
                    dcc.Dropdown(
                        id='pais-dropdown',
                        options=[{'label': 'Total', 'value': 'Total'}] + [{'label': pais, 'value': pais} for pais in sorted(dados_tipo_canal['pais'].unique())],
                        value='Total',
                        clearable=False
                    )
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div([
                    dcc.Graph(id='treemap-visualizacao')
                ], style={'width': '48%', 'display': 'inline-block'})
            ])
        ]),
        dcc.Tab(label='Visão Canais Individuais', children=[
            html.Div([
                html.H3('Selecione o País e Canal:'),
                html.Div([
                    dcc.Dropdown(
                        id='pais-dropdown-individual',
                        options=[{'label': pais, 'value': pais} for pais in sorted(dados['pais'].unique())],
                        value=None,
                        placeholder="Selecione um país",
                        clearable=False
                    ),
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div([
                    dcc.Dropdown(
                        id='canal-dropdown-individual',
                        options=[],
                        value=None,
                        placeholder="Selecione um canal",
                        clearable=False
                    ),
                ], style={'width': '48%', 'display': 'inline-block'}),
                html.Div(id='canal-info', children=[
                    html.H4('Informações sobre o canal selecionado:')
                ]),
                dcc.Graph(id='grafico-comparacao')
            ])
        ])
    ])
])

# Callback para atualizar o gráfico selecionado
@app.callback(
    Output('grafico-visualizacao', 'figure'),
    Input('grafico-dropdown', 'value')
)
def update_graph(selected_graph):
    if selected_graph == 'top_10_inscritos_barras':
        data = dados.nlargest(10, 'total_de_inscritos')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_inscritos', 'Top 10 Canais com Mais Inscritos', 'Canais')
    elif selected_graph == 'top_30_inscritos_treemap':
        data = dados.nlargest(30, 'total_de_inscritos')
        return create_treemap(data, ['nome_do_canal'], 'total_de_inscritos', 'Top 30 Canais com Mais Inscritos')
    elif selected_graph == 'top_10_videos_barras':
        data = dados.nlargest(10, 'total_de_videos_publicado')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_videos_publicado', 'Top 10 Canais com Mais Vídeos Publicados', 'Canais')
    elif selected_graph == 'top_30_videos_treemap':
        data = dados.nlargest(30, 'total_de_videos_publicado')
        return create_treemap(data, ['nome_do_canal'], 'total_de_videos_publicado', 'Top 30 Canais com Mais Vídeos Publicados')
    elif selected_graph == 'top_10_visualizacoes_barras':
        data = dados.nlargest(10, 'total_de_visualizacoes')
        return create_bar_chart(data, 'nome_do_canal', 'total_de_visualizacoes', 'Top 10 Canais com Mais Visualizações', 'Canais')
    elif selected_graph == 'top_30_visualizacoes_bolhas':
        data = dados.nlargest(30, 'total_de_visualizacoes')
        return create_bubble_chart(data, 'nome_do_canal', 'total_de_visualizacoes', 'total_de_visualizacoes', 'Top 30 Canais com Mais Visualizações')
    elif selected_graph == 'total_criacao_mes':
        return create_bar_chart(total_criacao_mes, 'mes', 'total', 'Total de Criação de Canal Por Mês', 'Mês')
    elif selected_graph == 'total_criacao_ano':
        return create_bar_chart(total_criacao_ano, 'data_criacao', 'total', 'Total de Criação de Canal Por Ano', 'Ano')
    elif selected_graph == 'total_videos_mes':
        return create_bar_chart(total_videos_mes, 'mes', 'total_de_videos_publicado', 'Total de Vídeos Publicados por Mês', 'Mês')
    elif selected_graph == 'total_videos_ano':
        return create_bar_chart(total_videos_ano, 'data_criacao', 'total_de_videos_publicado', 'Total de Vídeos Publicados por Ano', 'Ano')
    elif selected_graph == 'total_visualizacoes_mes':
        return create_bar_chart(total_visualizacoes_mes, 'mes', 'total_de_visualizacoes', 'Total de Vídeos Visualizados por Mês', 'Mês')
    elif selected_graph == 'total_visualizacoes_ano':
        return create_bar_chart(total_visualizacoes_ano, 'data_criacao', 'total_de_visualizacoes', 'Total de Vídeos Visualizados por Ano', 'Ano')
    elif selected_graph == 'taxa_crescimento_visualizacoes_ano':
        return create_bar_chart(taxa_crescimento_visualizacoes_ano, 'data_criacao', 'taxa_crescimento', 'Taxa de Crescimento de Visualizações por Ano', 'Ano')
    else:
        return {}

# Callback para atualizar o mapa selecionado
@app.callback(
    Output('mapa-visualizacao', 'figure'),
    Input('escala-dropdown', 'value')
)
def update_map(selected_scale):
    if selected_scale == 'ganhos_mensais_estimados_minimo':
        data = media_ganhos_pais
    elif selected_scale == 'relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo':
        data = media_relacao_pib_pais
    else:
        data = dados
    return create_map(data, selected_scale, f'Mapa de {selected_scale.replace("_", " ").capitalize()}')

# Callback para atualizar o treemap com base no país selecionado
@app.callback(
    Output('treemap-visualizacao', 'figure'),
    Input('pais-dropdown', 'value')
)
def update_treemap(selected_country):
    if selected_country == 'Total':
        filtered_data = dados_tipo_canal.groupby('tipo_do_canal').sum().reset_index()
    else:
        filtered_data = dados_tipo_canal[dados_tipo_canal['pais'] == selected_country]
    return create_treemap(filtered_data, ['tipo_do_canal'], 'contagem', f'Número de Canais por Tipo de Canal em {selected_country}')

# Callback para atualizar a lista de canais com base no país selecionado
@app.callback(
    Output('canal-dropdown-individual', 'options'),
    Input('pais-dropdown-individual', 'value')
)
def set_canal_options(selected_pais):
    if selected_pais:
        canais = dados[dados['pais'] == selected_pais]['nome_do_canal'].unique()
        sorted_canais = sorted(canais, key=lambda s: (s.lower(), s))
        return [{'label': canal, 'value': canal} for canal in sorted_canais]
    return []

# Callback para exibir as informações do canal selecionado e atualizar o gráfico de comparação
@app.callback(
    [Output('canal-info', 'children'), Output('grafico-comparacao', 'figure')],
    Input('canal-dropdown-individual', 'value')
)
def display_canal_info(selected_canal):
    if selected_canal:
        canal_info = dados[dados['nome_do_canal'] == selected_canal].iloc[0]
        info = html.Div([
            html.H4(f"Aqui estão as principais informações do '{selected_canal}':"),
            html.P(f"Nome do canal: {selected_canal}"),
            html.P(f"País de origem: {canal_info['pais']}"),
            html.P(f"Tipo de canal: {canal_info['tipo_do_canal']}"),
            html.P(f"Data de criação do canal: {canal_info['dia_criacao_do_canal']}/{canal_info['mes_criacao_do_canal']}/{canal_info['ano_criacao_do_canal']}"),
            html.P(f"Idade do canal (em anos): {canal_info['idade_do_canal']}"),
            html.H4("Estatísticas do Canal:"),
            html.P(f"Total de inscritos: {canal_info['total_de_inscritos']:,}"),
            html.P(f"Total de visualizações: {canal_info['total_de_visualizacoes']:,}"),
            html.P(f"Total de vídeos publicados: {canal_info['total_de_videos_publicado']}"),
            html.P(f"Ganhos mensais estimados mínimos: ${canal_info['ganhos_mensais_estimados_minimo']:,.1f}")
        ])
        grafico = create_comparison_chart(canal_info, dados)
        return info, grafico
    return html.H4('Informações sobre o canal selecionado:'), {}

if __name__ == '__main__':
    app.run_server(debug=True)


In [137]:
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1349 entries, 0 to 1348
Data columns (total 45 columns):
 #   Column                                                    Non-Null Count  Dtype  
---  ------                                                    --------------  -----  
 0   nome_do_canal                                             1349 non-null   object 
 1   total_de_videos_publicado                                 1349 non-null   int64  
 2   total_de_inscritos                                        1349 non-null   float64
 3   total_de_visualizacoes                                    1349 non-null   float64
 4   pais                                                      1349 non-null   object 
 5   tipo_do_canal                                             1349 non-null   object 
 6   dia_criacao_do_canal                                      1349 non-null   int64  
 7   mes_criacao_do_canal                                      1349 non-null   int64  
 8   ano_criacao_do_can

In [106]:
dados.sample(2)

Unnamed: 0,nome_do_canal,total_de_videos_publicado,total_de_inscritos,total_de_visualizacoes,pais,tipo_do_canal,dia_criacao_do_canal,mes_criacao_do_canal,ano_criacao_do_canal,idade_do_canal,rank_social_blade,rank_inscritos,rank_visualizacoes,rank_pais,ganhos_mensais_estimados_minimo,total_de_visualizacoes_ultimos_30_dias,total_de_inscritos_ultimos_30_dias,total_usuarios_estimado_por_pais,populacao_2022,pib_nominal_2022,pib_per_capita_2022,expectativa_de_vida_2022,taxa_de_natalidade,taxa_alfabetizacao_total_%,taxa_alfabetizacao_masculina_%,taxa_alfabetizacao_feminina_%,diferenca_alfabetizacao_masculino_feminino,taxa_desemprego_2022_%,taxa_de_pobreza,indice_de_watts,human_development_groups,IDH_2021,indice_de_corrupcao_score,nivel_de_urbanizacao_2023_%_da_pop,continente,media_de_inscritos_por_video,media_de_visualizacoes_por_video,media_videos_publicados_por_dia,media_videos_publicados_por_mes,media_videos_publicados_por_ano,proporcao_usuarios_youtube_x_populacao_pais,relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo,media_crescimento_inscritos_dia,media_crescimento_inscritos_mes,media_crescimento_visualizacoes_dia
539,MR.Shorts 03,10,8.61,0.001140429,India,People,2,2,2021,3,863719.0,499.0,3393641.0,270.0,13.0,50388.0,-30000.0,476000000.0,1417173000.0,3416646000000.0,2366.309609,67.744,17.86,72.1,80.9,62.8,18.1,4.822,0.106997,0.027762,Medium,0.633,39.0,35.872,Asia,0.861,0.0001140429,3.333333,0.277778,3.333333,0.33588,182.023816,2.87,0.239167,0.000380143
563,Payal Panchal,399,12700000.0,4698509000.0,India,Entertainment,27,6,2019,5,3009.0,335.0,2111.0,166.0,32300.0,129261000.0,200000.0,476000000.0,1417173000.0,3416646000000.0,2366.309609,67.744,17.86,72.1,80.9,62.8,18.1,4.822,0.106997,0.027762,Medium,0.633,39.0,35.872,Asia,31829.573935,11775710.0,79.8,6.65,79.8,0.33588,0.07326,2540000.0,211666.666667,939701800.0


In [107]:
dados.columns

Index(['nome_do_canal', 'total_de_videos_publicado', 'total_de_inscritos',
       'total_de_visualizacoes', 'pais', 'tipo_do_canal',
       'dia_criacao_do_canal', 'mes_criacao_do_canal', 'ano_criacao_do_canal',
       'idade_do_canal', 'rank_social_blade', 'rank_inscritos',
       'rank_visualizacoes', 'rank_pais', 'ganhos_mensais_estimados_minimo',
       'total_de_visualizacoes_ultimos_30_dias',
       'total_de_inscritos_ultimos_30_dias',
       'total_usuarios_estimado_por_pais', 'populacao_2022',
       'pib_nominal_2022', 'pib_per_capita_2022', 'expectativa_de_vida_2022',
       'taxa_de_natalidade', 'taxa_alfabetizacao_total_%',
       'taxa_alfabetizacao_masculina_%', 'taxa_alfabetizacao_feminina_%',
       'diferenca_alfabetizacao_masculino_feminino', 'taxa_desemprego_2022_%',
       'taxa_de_pobreza', 'indice_de_watts', 'human_development_groups',
       'IDH_2021', 'indice_de_corrupcao_score',
       'nivel_de_urbanizacao_2023_%_da_pop', 'continente',
       'media_de_inscr

In [146]:
dados.describe()

Unnamed: 0,total_de_videos_publicado,total_de_inscritos,total_de_visualizacoes,dia_criacao_do_canal,mes_criacao_do_canal,ano_criacao_do_canal,idade_do_canal,rank_social_blade,rank_inscritos,rank_visualizacoes,ganhos_mensais_estimados_minimo,total_de_visualizacoes_ultimos_30_dias,total_de_inscritos_ultimos_30_dias,total_usuarios_estimado_por_pais,populacao_2022,pib_nominal_2022,pib_per_capita_2022,expectativa_de_vida_2022,taxa_de_natalidade,taxa_alfabetizacao_total_%,taxa_alfabetizacao_masculina_%,taxa_alfabetizacao_feminina_%,diferenca_alfabetizacao_masculino_feminino,taxa_desemprego_2022_%,taxa_de_pobreza,indice_de_watts,IDH_2021,indice_de_corrupcao_score,nivel_de_urbanizacao_2023_%_da_pop,media_de_inscritos_por_video,media_de_visualizacoes_por_video,media_videos_publicados_por_dia,media_videos_publicados_por_mes,media_videos_publicados_por_ano,proporcao_usuarios_youtube_x_populacao_pais,relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo,media_crescimento_inscritos_dia,media_crescimento_inscritos_mes,media_crescimento_visualizacoes_dia
count,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0,1349.0
mean,4991.906597,8989849.0,4849968000.0,15.756116,6.265382,2015.55152,7.989622,166512.3,10340.33,356022.2,43145.72,165219600.0,259555.0,164551800.0,363027000.0,6253066000000.0,31178.700154,75.222277,13.790178,89.642031,91.587324,87.551816,4.036471,5.834122,0.044547,0.020352,0.808743,52.111828,71.649003,inf,inf,624.794906,52.066242,624.794906,0.653895,inf,inf,inf,inf
std,24767.080583,17966000.0,12824680000.0,8.693801,3.398266,5.148512,5.14045,305578.8,156619.4,982371.7,124218.8,505329000.0,926445.5,163107000.0,492791900.0,9307698000000.0,30567.612537,5.529181,4.607557,10.482595,7.560723,13.950173,7.422765,3.60458,0.072291,0.035994,0.118113,17.888796,19.724175,,,2904.909754,242.075813,2904.909754,0.225441,,,,
min,0.0,0.0,0.0,1.0,1.0,2005.0,0.0,1.0,1.0,1.0,0.0,-3350000000.0,-100000.0,10000.0,15040.0,336000000.0,352.603733,60.958,6.4,38.2,52.0,24.2,-9.1,0.909,0.0,0.0,0.478,17.0,14.538,0.0,0.0,0.0,0.0,0.0,7e-06,0.002151,0.0,0.0,0.0
25%,254.0,86900.0,16200820.0,8.0,3.0,2012.0,3.0,1539.0,336.0,1443.0,892.0,3232000.0,8000.0,27600000.0,46234830.0,631133400000.0,5715.280221,71.475,11.0,88.0,88.0,88.0,0.0,3.65,0.002487,0.00332,0.717,36.0,62.818,135.3846,35937.13,39.25,3.270833,39.25,0.494417,0.347489,11933.33,994.4444,2131713.0
50%,739.0,2610000.0,785785600.0,16.0,6.0,2016.0,7.0,10447.0,959.0,9436.0,11100.0,43371000.0,90000.0,138000000.0,215313500.0,1920096000000.0,13974.449249,76.064,12.6,92.6,92.2,92.9,0.0,4.822,0.008145,0.014403,0.822,42.0,81.509,2878.571,1018355.0,133.2,11.1,133.2,0.741138,2.110431,494285.7,41190.48,155620200.0
75%,1782.0,10800000.0,4393079000.0,23.0,9.0,2020.0,12.0,116359.0,1694.0,98068.0,43800.0,174660000.0,300000.0,247000000.0,333271400.0,3416646000000.0,55509.393176,79.72,17.86,98.8,99.0,98.7,4.2,7.392,0.09,0.02,0.921,69.0,84.398,13095.24,4813721.0,339.166667,28.263889,339.166667,0.828578,19.311668,2136364.0,178030.3,846351500.0
max,426935.0,289000000.0,258896700000.0,31.0,12.0,2024.0,19.0,1107983.0,4493626.0,4514321.0,3300000.0,13187000000.0,27000000.0,476000000.0,1417173000.0,25439700000000.0,187267.132381,84.5,40.73,99.9,100.0,100.0,27.8,28.838,0.494,0.3,0.962,90.0,100.0,inf,inf,57964.0,4830.333333,57964.0,1.0,inf,inf,inf,inf


In [None]:
file_path_dados = 'dashboard_visualizacao/dados_da.csv'
dados = pd.read_csv(file_path_dados)

In [74]:
dados_brasil['ganhos_mensais_estimados_minimo'].mean()

21100.49

In [139]:
dados.sample(2)

Unnamed: 0,nome_do_canal,total_de_videos_publicado,total_de_inscritos,total_de_visualizacoes,pais,tipo_do_canal,dia_criacao_do_canal,mes_criacao_do_canal,ano_criacao_do_canal,idade_do_canal,rank_social_blade,rank_inscritos,rank_visualizacoes,rank_pais,ganhos_mensais_estimados_minimo,total_de_visualizacoes_ultimos_30_dias,total_de_inscritos_ultimos_30_dias,total_usuarios_estimado_por_pais,populacao_2022,pib_nominal_2022,pib_per_capita_2022,expectativa_de_vida_2022,taxa_de_natalidade,taxa_alfabetizacao_total_%,taxa_alfabetizacao_masculina_%,taxa_alfabetizacao_feminina_%,diferenca_alfabetizacao_masculino_feminino,taxa_desemprego_2022_%,taxa_de_pobreza,indice_de_watts,human_development_groups,IDH_2021,indice_de_corrupcao_score,nivel_de_urbanizacao_2023_%_da_pop,continente,media_de_inscritos_por_video,media_de_visualizacoes_por_video,media_videos_publicados_por_dia,media_videos_publicados_por_mes,media_videos_publicados_por_ano,proporcao_usuarios_youtube_x_populacao_pais,relacao_pib_per_capita_x_ganhos_mensais_estimados_minimo,media_crescimento_inscritos_dia,media_crescimento_inscritos_mes,media_crescimento_visualizacoes_dia
1315,Jake Fellman,441,24000000.0,15352000000.0,United States,Entertainment,13,10,2012,11,339.0,221.0,305.0,95,105500.0,421932000.0,700000.0,247000000.0,333271411.0,25439700000000.0,77246.673883,77.434146,11.6,88.0,88.0,88.0,0.0,3.65,0.002487,0.017836,Very High,0.921,69.0,83.084,North America,54421.768707,34811790.0,40.090909,3.340909,40.090909,0.741138,0.732196,2181818.0,181818.181818,1395637000.0
1317,Dr Ryan,1512,17500000.0,9590972000.0,United States,Entertainment,10,7,2020,3,1083.0,286.0,676.0,149,54600.0,218317000.0,400000.0,247000000.0,333271411.0,25439700000000.0,77246.673883,77.434146,11.6,88.0,88.0,88.0,0.0,3.65,0.002487,0.017836,Very High,0.921,69.0,83.084,North America,11574.074074,6343235.0,504.0,42.0,504.0,0.741138,1.414774,5833333.0,486111.111111,3196991000.0


<br><br><br>
    
Com base nas suas instruções e estrutura proposta, aqui estão algumas sugestões adicionais para cada menu que podem enriquecer a análise:

## MENU VISÃO GERAL
### Gráficos de Visão Geral:

- Total de Criação de Canal Por Mês: Já incluído.
- Total de Criação de Canal Por Ano: Já incluído.
- Total de Vídeos Publicados por Mês: Já incluído.
- Total de Vídeos Publicados por Ano: Já incluído.
- Total de Vídeos Visualizados por Mês: Já incluído.
- Total de Vídeos Visualizados por Ano: Já incluído.
- Taxa de Crescimento de Visualizações por Ano: Já incluído..

#### Adicionar

- Top 10 canais com mais inscritos (grafico de barras) Já incluído.
- top 30 canais com mais inscritos (Treemap (Mapa de Árvore)) Já incluído.
- Top 10 canais com mais vídeos publicados (grafico de barras) Já incluído.
- top 30 canais com mais vídeos publicados (Treemap (Mapa de Árvore)) Já incluído.
- Top 10 canais com mais visualizações (grafico de barras) Já incluído.
- top 30 canais com mais visualizações (Bubble Chart (Gráfico de Bolhas)) Já incluído.



## MENU VISÃO POR PAÍS
### Gráficos de País:

- Mapa Interativo: Mostrar o total de usuários agrupados por país, com tooltip exibindo a quantidade de usuários.
- Mapa de Proporção de Usuários: Mostrar a proporção de usuários do YouTube em relação à população total de cada país.

#### Sugestões Adicionais:

- Total de Inscritos por País: Gráfico de barras mostrando o total de inscritos por país.
- Total de Visualizações por País: Gráfico de barras mostrando o total de visualizações por país.
- Ganho Médio por Canal por País: Gráfico de barras mostrando o ganho médio por canal em cada país.

## MENU VISÃO POR TIPO DO CANAL
### Gráficos de Tipo de Canal:

- Treemap Interativo:
Dropdown menu para selecionar o país.
Gráfico treemap mostrando os tipos de canais e o total de cada tipo para o país selecionado.

#### Sugestões Adicionais:

- Distribuição de Inscritos por Tipo de Canal: Gráfico de barras mostrando a distribuição total de inscritos por tipo de canal.
- Distribuição de Visualizações por Tipo de Canal: Gráfico de barras mostrando a distribuição total de visualizações por tipo de canal.
- Crescimento de Inscritos por Tipo de Canal: Gráfico de linhas mostrando o crescimento de inscritos ao longo do tempo para diferentes tipos de canais.

## MENU VISÃO CANAIS INDIVIDUAIS
### Gráficos Relacionados a um Canal Específico:

- Lista de Canais em Ordem Alfabética:
Dropdown menu para selecionar o canal.
Gráficos individuais referentes ao canal escolhido.

#### Sugestões Adicionais:

- Evolução de Inscritos ao Longo do Tempo: Gráfico de linhas mostrando o crescimento de inscritos para o canal selecionado.
- Evolução de Visualizações ao Longo do Tempo: Gráfico de linhas mostrando o crescimento de visualizações para o canal selecionado.
- Relação Entre Publicações e Engajamento: Gráfico de dispersão mostrando a relação entre o número de vídeos publicados e o engajamento (inscritos/visualizações) para o canal selecionado.
- Comparação com Média do Tipo de Canal: Gráficos comparando as métricas do canal selecionado com a média de outros canais do mesmo tipo.


Estas sugestões visam oferecer uma visão mais ampla e detalhada dos dados, ajudando a identificar tendências, padrões e insights significativos. Se você gostar de alguma dessas ideias ou quiser ajustar algo, podemos discutir mais detalhadamente.





In [152]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

# Filtrar dados para o canal "PNation" de Angola
canal_nome = 'PNation'
pais_nome = 'Angola'
canal_info = dados[(dados['nome_do_canal'] == canal_nome) & (dados['pais'] == pais_nome)].iloc[0]

# Calcular a média das métricas para o mesmo tipo de canal
tipo_do_canal = canal_info['tipo_do_canal']
dados_tipo_canal = dados[dados['tipo_do_canal'] == tipo_do_canal]

# Selecionar apenas as colunas numéricas
dados_tipo_canal_numerico = dados_tipo_canal.select_dtypes(include=['float64', 'int64']).mean()

# Criar DataFrames individuais para cada métrica
metrics = ['Total de Inscritos', 'Total de Visualizações', 'Total de Vídeos Publicados', 'Ganhos Mensais Estimados']
values_canal = [canal_info['total_de_inscritos'], canal_info['total_de_visualizacoes'], canal_info['total_de_videos_publicado'], canal_info['ganhos_mensais_estimados_minimo']]
values_media_tipo = [dados_tipo_canal_numerico['total_de_inscritos'], dados_tipo_canal_numerico['total_de_visualizacoes'], dados_tipo_canal_numerico['total_de_videos_publicado'], dados_tipo_canal_numerico['ganhos_mensais_estimados_minimo']]

# Criar subplots
fig = make_subplots(rows=2, cols=2, subplot_titles=metrics)

# Adicionar gráficos de barras
for i, metrica in enumerate(metrics):
    comparacao_metrica = {
        'Categoria': ['Valor Canal', 'Valor Médio Tipo'],
        'Valor': [values_canal[i], values_media_tipo[i]]
    }
    comparacao_df = pd.DataFrame(comparacao_metrica)

    # Adicionar gráfico de barras ao subplot
    fig.add_trace(
        go.Bar(name=metrica, x=comparacao_df['Categoria'], y=comparacao_df['Valor']),
        row=(i//2)+1, col=(i%2)+1
    )

# Atualizar layout do gráfico
fig.update_layout(title_text=f'Comparação das Métricas do Canal {canal_nome} com a Média do Tipo de Canal', showlegend=False)
fig.show()