<a href="https://colab.research.google.com/github/Thaleslsilva/DataScience/blob/master/Graficos_Padroes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Exemplos de Gráficos Padrões

Aqui você encontra exemplos de alguns dos gráficos padrões com Plotly.

### Pacotes Python Para Manipulação de Dados e Visualização

Certifique-se de usar os pacotes nas mesmas versões mostradas abaixo.

In [1]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [2]:
# Manipulação de Dados
import numpy as np
import pandas as pd

# Visualização com Plotly
import plotly.express as px
import plotly.graph_objects as go
import plotly.figure_factory as ff
from plotly.colors import n_colors
from plotly.subplots import make_subplots

In [3]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "Thales de Lima Silva" --iversions

pandas 1.1.5
numpy  1.19.5
Thales de Lima Silva


## Carregando os Dados

Consulte as fontes dos dados no manual em pdf **Gráficos Padrões com Plotly** no Capítulo 2.

In [None]:
titanic = pd.read_csv('https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/titanic-train.csv')
#titanic.head(3)

In [None]:
netflix = pd.read_csv("https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/netflix-shows-netflix_titles.csv")
#netflix.head(3)

In [None]:
world = pd.read_csv('https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/world-university-rankings-cwurData.csv')
#world.head(3)

In [None]:
google = pd.read_csv("https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/google-play-store-apps-googleplaystore.csv")
#google.head(3)

In [None]:
covid = pd.read_csv('https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/novel-corona-virus-2019-dataset-covid_19_data.csv')
#covid.head(3)

In [None]:
covid_line = pd.read_csv('https://raw.githubusercontent.com/Thaleslsilva/DataScience/master/VisualizacaoDados/Metodos_Visualizacao/dados/novel-corona-virus-2019-dataset-COVID19_line_list_data.csv')
#covid_line.head(3)

### Gráfico de Barras Simples
**Objetivo**: Exibe a representação quantitativa de uma variável.

Quais países tem universidades com pontuação superior a 70?

In [12]:
# Prepara os dados
top_countries = world[world['score'] > 70]['country'].value_counts().reset_index().rename(columns = {'index':'country','country':'count'})

# Cria a figura
fig = go.Figure(go.Bar(x = top_countries['country'], y = top_countries['count'],))

# Configura o layout
fig.update_layout(title_text = 'Países com Universidades com Pontuação Superior a 70',
                  xaxis_title = "País",
                  yaxis_title = "Número de Universidades")

# Mostra o gráfico
fig.show()

### Gráfico de Barras - Gradiente de Cores e Posicionamento de Texto
**Objetivo**: Exibe a representação quantitativa de uma variável destacando as contagens com gradiente de cor e posição do texto para todas as barras.

Em que gênero se enquadra a maioria dos aplicativos da Google Play Store? 

In [13]:
# Prepara os dados
apps = google['Genres'].value_counts()[:10].to_frame().reset_index().rename(columns = {'index':'Genres','Genres':'Count'})

# Cria a figura e formata o gradiente de cores
fig = go.Figure(go.Bar(x = apps['Genres'],
                       y = apps['Count'], 
                       marker = {'color': apps['Count'], 'colorscale': 'Viridis'},  
                       text = apps['Count'],
                       textposition = "outside",))

# Configura o layout
fig.update_layout(title_text = 'Top Apps da Google Playstore',
                  xaxis_title = "Gêneros de Aplicativos",
                  yaxis_title = "Número de Apps")

# Mostra o gráfico
fig.show()

### Gráfico de Barras Empilhado
**Objetivo**: Exibe a representação quantitativa de uma variável agrupando / empilhando as barras.

Quantos programas / filmes foram lançados na Netflix do Brasil e dos Estados Unidos entre 2015 e 2020?

In [14]:
# Agrupamento dos dados
top_release_brazil = netflix[(netflix['country']=='Brazil')&
                    ((netflix['release_year']==2015)|(netflix['release_year']==2016)|(netflix['release_year']==2017)|(netflix['release_year']==2018)|
                    (netflix['release_year']==2019)|(netflix['release_year']==2020))]['release_year'].value_counts().to_frame().reset_index().rename(columns={'index':'release_year','release_year':'count'})

top_release_us = netflix[(netflix['country']=='United States')&
                    ((netflix['release_year']==2015)|(netflix['release_year']==2016)|(netflix['release_year']==2017)|(netflix['release_year']==2018)|
                    (netflix['release_year']==2019)|(netflix['release_year']==2020))]['release_year'].value_counts().to_frame().reset_index().rename(columns={'index':'release_year','release_year':'count'})

# Cria a figura
fig = go.Figure()

# Formata as barras por agrupamento
fig.add_trace(go.Bar(x = top_release_brazil['release_year'], 
                     y = top_release_brazil['count'],
                     name = 'Brasil',
                     marker_color = 'violet'))

fig.add_trace(go.Bar(x = top_release_us['release_year'],
                     y = top_release_us['count'],
                     name = 'Estados Unidos',
                     marker_color = 'blue'))

# Formata o layout
fig.update_layout(title_text = 'Filmes e Programas Lançados na Netflix do Brasil / EUA Entre 2015 e 2020',
                  xaxis_title = "Ano",
                  yaxis_title = "Número de Filmes/Programas",
                  barmode = 'stack') 

# Mostra o gráfico
fig.show()

### Gráfico de Barras Facetado
**Objetivo**: Exibe uma visão de diferentes características categóricas em relação a uma única variável numérica.

Qual é a soma da tarifa (variável fare) por sexo dos passageiros em cada classe e seus embarcados no dataset Titanic? 

- Variáveis facetárias: Survived, Pclass
- Barras agrupadas: Embarked
- Numérico único (eixo Y) - Fare)

In [15]:
# Prepara os dados
facet_titanic = titanic[['Sex','Survived','Embarked','Pclass','Fare']].groupby(['Sex','Survived','Embarked','Pclass']).agg('sum').reset_index()

# Cria o facet
fig = px.bar(facet_titanic, 
             x = "Sex", 
             y = "Fare",
             color = "Embarked",
             barmode = "group",
             facet_row = "Survived", 
             facet_col = "Pclass",)

# Layout
fig.update_layout(title_text = 'Vista Facetada da tarifa dos passageiros do Titanic em relação à idade, classe, embarque\n')

# Mostra o gráfico
fig.show()

### Gráfico de Barras Horizontal
**Objetivo**: Exibe a representação quantitativa de uma variável de maneira horizontal.

Quantos aplicativos da Playstore se enquadram em cada categoria?

In [16]:
# Prepara os dados
app_category = google['Category'].value_counts()[:15].reset_index().rename(columns = {'index':'Category','Category':'Count'}).sort_values('Count', ascending = "False")

# Cria a figura com orientação horizontal
fig = go.Figure(go.Bar(y = app_category['Category'], x = app_category['Count'], orientation = "h")) 

# Layout
fig.update_layout(title_text = '15 Principais Categorias de Aplicativos da Google Playstore',
                  xaxis_title = "Total de Apps", 
                  yaxis_title = "Categoria")

# Mostra o gráfico
fig.show()

### Gráfico de Linhas
**Objetivo**: Relação entre variáveis ao longo do tempo.

Quantas mortes por COVID foram observadas ao longo do tempo?

In [17]:
# Prepara os dados
total_confirmed = covid[['ObservationDate','Deaths']].groupby('ObservationDate').sum().reset_index()

# Cria a figura
fig = go.Figure(data = go.Scatter(x = total_confirmed['ObservationDate'],
                                  y = total_confirmed['Deaths'],
                                  mode = 'lines'))

# Layout
fig.update_layout(title = 'Número de Mortes Por COVID ao Longo do Tempo',
                  xaxis_title = "Data",
                  yaxis_title = "Número de Casos")

# Mostra o gráfico
fig.show()

## Gráfico de Pizza
**Objetivo**: Exibe representação quantitativa (contagem) e proporcional de variáveis categóricas.

Qual a proporção de tipos de programas da Netflix?

In [21]:
# Prepara os dados
net_category = netflix['type'].value_counts().to_frame().reset_index().rename(columns = {'index':'type','type':'count'})

# Cria a figura
fig = go.Figure([go.Pie(labels = net_category['type'], values = net_category['count'])])

# Interatividade
fig.update_traces(hoverinfo = 'label+percent', 
                  textinfo = 'value+percent', 
                  textfont_size = 15)
                  #insidetextorientation = 'radial')

# Layout
fig.update_layout(title = "Tipos de Programas na Netflix", title_x = 0.5)

# Gráfico
fig.show()

### Gráfico de Pizza com Cores Customizadas
**Objetivo**: Exibe representação quantitativa em pizza com cores personalizadas para os rótulos.

Qual a proporção de passageiros do Titanic por faixa etária? 

In [25]:
# Prepara os dados
titanic = titanic.dropna()

titanic['age_category'] = np.where((titanic['Age'] < 19), "Abaixo de 19 Anos",
                                   np.where((titanic['Age'] > 18)&(titanic['Age'] <= 30), "19-30 Anos",
                                    np.where((titanic['Age'] > 30)&(titanic['Age']<=50), "31-50 Anos",
                                             np.where(titanic['Age'] > 50, "Acima de 50 Anos","NULL"))))

age = titanic['age_category'].value_counts().to_frame().reset_index().rename(columns = {'index':'age_category','age_category':'Count'})

titanic_age = titanic['age_category'].value_counts().to_frame().reset_index().rename(columns={'index':'age_category','age_category':'count'})

# Lista de cores
colors = ['green', 'violet', 'yellow', 'blue']

# Figura
fig = go.Figure([go.Pie(labels = titanic_age['age_category'], values = titanic_age['count'])])

# Interatividade
fig.update_traces(hoverinfo = 'label+percent', 
                  textinfo = 'percent+label', 
                  textfont_size = 16,
                  marker = dict(colors = colors, line = dict(color = '#000360', width = 2)))

fig.update_layout(title = "Passageiros do Titanic Por Faixa Etária", title_x = 0.5)

fig.show()

### Gráfico de Rosca (Donut)
**Objetivo**: Exibe representação quantitativa em formato de rosca.

Qual é a contagem de distribuição da classificação de conteúdo de aplicativos do google playstore?

In [26]:
# Prepara os dados
content = google['Content Rating'].value_counts().to_frame().reset_index().rename(columns = {'index':'Content Rating','Content Rating':'count'})

# Figura
fig = go.Figure([go.Pie(labels = content['Content Rating'], values = content['count'], hole = 0.3)]) 

# Interatividade
fig.update_traces(hoverinfo = 'label+percent', 
                  textinfo = 'percent', 
                  textfont_size = 12)

# Layout
fig.update_layout(title = "Classificação de Conteúdo do Google Apps", title_x = 0.5)

# Gráfico
fig.show()

# Fim