# <font color='blue'>Data Science Academy</font>
# <font color='blue'>Visualização de Dados e Design de Dashboards</font>
## <font color='blue'>Capítulo 2 - Métodos de Visualização</font>

## Gráficos 3D com Plotly

![title](imagens/cap02.png)

## Pacotes Python Para Manipulação de Dados e Visualização

In [1]:
# Para atualizar um pacote, execute o comando abaixo no terminal ou prompt de comando:
# pip install -U nome_pacote

# Para instalar a versão exata de um pacote, execute o comando abaixo no terminal ou prompt de comando:
# !pip install nome_pacote==versão_desejada

# Depois de instalar ou atualizar o pacote, reinicie o jupyter notebook.

# Instala o pacote watermark. 
# Esse pacote é usado para gravar as versões de outros pacotes usados neste jupyter notebook.
!pip install -q -U watermark

In [2]:
# Manipulação de Dados
import numpy as np
import pandas as pd
import datetime
from datetime import date, timedelta

# Plotly
import plotly.express as px
import plotly.graph_objects as go
import plotly.figure_factory as ff
from plotly.colors import n_colors
from plotly.subplots import make_subplots

## Carregando os Dados

In [3]:
# Carrega os dados
world = pd.read_csv('dados/world-university-rankings-cwurData.csv')
world.head()

Unnamed: 0,world_rank,institution,country,national_rank,quality_of_education,alumni_employment,quality_of_faculty,publications,influence,citations,broad_impact,patents,score,year
0,1,Harvard University,USA,1,7,9,1,1,1,1,,5,100.0,2012
1,2,Massachusetts Institute of Technology,USA,2,9,17,3,12,4,4,,1,91.67,2012
2,3,Stanford University,USA,3,17,11,5,4,2,2,,15,89.5,2012
3,4,University of Cambridge,United Kingdom,1,10,24,4,16,16,11,,50,86.17,2012
4,5,California Institute of Technology,USA,4,2,29,7,37,22,22,,18,85.21,2012


In [4]:
# Carrega os dados
campus = pd.read_csv('dados/factors-affecting-campus-placement-Placement_Data_Full_Class.csv')
campus.head()

Unnamed: 0,sl_no,gender,ssc_p,ssc_b,hsc_p,hsc_b,hsc_s,degree_p,degree_t,workex,etest_p,specialisation,mba_p,status,salary
0,1,M,67.0,Others,91.0,Others,Commerce,58.0,Sci&Tech,No,55.0,Mkt&HR,58.8,Placed,270000.0
1,2,M,79.33,Central,78.33,Others,Science,77.48,Sci&Tech,Yes,86.5,Mkt&Fin,66.28,Placed,200000.0
2,3,M,65.0,Central,68.0,Central,Arts,64.0,Comm&Mgmt,No,75.0,Mkt&Fin,57.8,Placed,250000.0
3,4,M,56.0,Central,52.0,Central,Science,52.0,Sci&Tech,No,66.0,Mkt&HR,59.43,Not Placed,
4,5,M,85.8,Central,73.6,Central,Commerce,73.3,Comm&Mgmt,No,96.8,Mkt&Fin,55.5,Placed,425000.0


### 3D Scatter

**Objetivo**: Exibir relação entre 3 variáveis

Como ssc%, hsc% e degree% estão relacionados entre si para alunos empregados e não empregados?

In [17]:
# Figura
fig = px.scatter_3d(campus, x = 'ssc_p', y = 'hsc_p', z = 'degree_p', color = 'status')

# Layout
fig.update_layout(scene = dict(xaxis_title = 'SSC %',
                               yaxis_title = 'HSC %',
                               zaxis_title = 'Degree %'),
                  title = "Percentual de Candidatos Empregados e Não Empregados")

# Gráfico
fig.show()

### 3D Scatter Colorido

**Objetivo**: Exibir relação entre 3 variáveis com forma e cor diferentes.

Mesmo gráfico anterior com shapes e cores diferentes para as variáveis.

In [20]:
# Figura
fig = px.scatter_3d(campus, 
                    x = 'ssc_p', 
                    y = 'hsc_p', 
                    z = 'degree_p',
                    color = 'etest_p', 
                    size = 'etest_p', 
                    size_max = 18,
                    symbol = 'status', 
                    opacity = 0.7)

# Layout
fig.update_layout(margin = dict(l = 0, r = 0, b = 0, t = 0))

# Gráfico
fig.show()

### 3D Surface

**Objetivo**:  Exibir relação de superfície entre diversos valores.

Como as pontuações estão relacionadas entre as universidades dos 20 principais países? 

In [22]:
# Prepara os dados
top_countries = world['country'].value_counts()[:20].reset_index()['index']

score = []

for i in top_countries:
    score.append(list(world[world['country']==i]['score']))

z_data = np.array(score)

In [24]:
# Figura
fig = go.Figure(data = [go.Surface(z = z_data)])

# Layout
fig.update_layout(title = 'Pontuação das Universidades dos 20 Principais Países', 
                  autosize = False,
                  width = 500, 
                  height = 500,
                  margin = dict(l = 65, r = 50, b = 65, t = 90))

# Gráfico
fig.show()

### 3D Line

**Objetivo**: Exibir relação entre 3 variáveis em linhas.

Como se relacionam a população, o PIB e o ano nos países europeus?

In [26]:
# Prepara os dados
df = px.data.gapminder().query("continent=='Europe'")

In [27]:
# Figura
fig = px.line_3d(df, x = "gdpPercap", y = "pop", z = "year", color = 'country')

# Layout
fig.update_layout(title_text = 'População, PIB e Ano na Europa', title_x = 0.5)

# Gráfico
fig.show()

# Fim