## Introdução

Olá, cientista de dados! Para encerrarmos nosso curso com chave de ouro, iremos deixar dois gráficos prontos para serem utilizados em apresentações, levando em consideração as boas práticas.

## Preparando Ambiente

In [18]:
import pandas as pd
import duckdb as dk
import plotly.express as px

# Importando as extensão para utilizar comandos SQL
%reload_ext sql

# Criando um banco de dados em memória, para otimizar performance
%sql duckdb:///:memory:

## Carregando Dados

In [14]:
salaries = pd.read_csv('https://github.com/labeduc/datasets/blob/main/ds-salaries/ds_salaries.csv?raw=true')

%sql CREATE TABLE IF NOT EXISTS salaries_full AS SELECT * FROM salaries

*  duckdb:///:memory:
Done.


Count


## Gerando os Gráficos com os padrões originais

In [15]:
%%sql
SELECT *
  FROM salaries_full
 WHERE job_title in ('Data Engineer', 'Data Scientist', 'Data Analyst')
 LIMIT 5

*  duckdb:///:memory:
Done.


id,work_year,experience_level,employment_type,job_title,salary,salary_currency,salary_in_usd,employee_residence,remote_ratio,company_location,company_size
16,2020,EN,FT,Data Engineer,4450000,JPY,41689,JP,100,JP,S
22,2020,SE,FT,Data Engineer,42000,EUR,47899,GR,50,GR,L
27,2020,SE,FT,Data Engineer,720000,MXN,33511,MX,0,MX,S
35,2020,MI,FT,Data Engineer,65000,EUR,74130,AT,50,AT,L
43,2020,MI,FT,Data Engineer,106000,USD,106000,US,100,US,L


## Exemplo 01 - Gráfico de Barra

O gráfico de barras deve comparar o salário de três cargos: Data Engineer, Data Scientist, Data Analyst ao longo do tempo.

### Gráfico de Barra Padrão

In [16]:
%%sql 
sal_gb << select work_year, job_title, avg(salary_in_usd) as avg_salary_in_usd 
            from salaries_full
           where job_title in ('Data Engineer', 'Data Scientist', 'Data Analyst') 
        group by work_year, job_title

*  duckdb:///:memory:
Done.


In [22]:
fig = px.bar(sal_gb, x='work_year', y='avg_salary_in_usd', color='job_title')

fig.show()

### Passo 01 - a Forma segue a Função

Nesse primeiro passo de otimização, temos que refletir se o gráfico proposto realmente entrega de maneira clara a informação que foi solicitada. Olhando a tabela de Gráficos X Objetivos da nossa primeira aula, podemos perceber  que sim, o gráfico de barra é o mais indicado.

![Visualização X Objetivo](visualizacao_x_objetivo.png)

No entanto, esse formato de barra empilhada (stacked) não permite uma boa comparação ano a ano de cada série de informação. Talvez seja melhor apenas colocar as barras lado a lado.

In [23]:
fig = px.bar(sal_gb, x='work_year', y='avg_salary_in_usd', color='job_title', barmode="group")

fig.show()

### Gráfico de Pizza

In [20]:
%%sql 
sal_jp << select job_title, avg(salary_in_usd) as avg_salary_in_usd 
            from salaries_full
           where job_title in ('Data Engineer', 'Data Scientist', 'Data Analyst') 
        group by job_title

*  duckdb:///:memory:
Done.


In [21]:
fig = px.pie(sal_jp, values='avg_salary_in_usd', names='job_title', hole=0.45)

fig.show()

## Passo 01 - Conhecendo o Objeto Figure

O objeto Figure é a base para criar gráficos interativos com o Plotly em Python. Ele contém todas as informações necessárias para desenhar um gráfico completo, incluindo dados, layout e opções de estilo. As propriedades do objeto Figure podem ser divididas em três categorias principais: dados (data), layout e opções de estilo (config).

### Categorias
- Dados (data): As propriedades do objeto Figure relacionadas aos dados são usadas para especificar os dados que serão plotados no gráfico. Isso inclui o tipo de gráfico, as séries de dados e as opções de estilo para cada série. 
- Layout: As propriedades do objeto Figure relacionadas ao layout são usadas para especificar a aparência geral do gráfico, como os títulos, as legendas, as escalas e os eixos.
- Opções de estilo (config): As propriedades do objeto Figure relacionadas às opções de estilo são usadas para especificar as opções de estilo gerais para o gráfico, como o tema e a cor de fundo. 

Essas são as principais propriedades do objeto Figure do Plotly. Combinando essas propriedades de acordo com as necessidades do usuário, é possível criar gráficos altamente personalizados e interativos no Python.

## Conclusão