# Aula 3: Storytelling e Visualização de dados

## Objetivos

1. Aprender a estratégia para criar aprensentações eficientes.
1. Perceber o poder do Power BI (e ferramentas similares) no tratamento de dados e criação de visualizações!

# O que é Data Storytelling?

*Data Storytelling é um conjunto de técnicas que orientam uma apresentação de informações e insights de dados para um determinado público.É a forma de contar a história dos seus dados. E essa história auxilia em manter a atenção e compreensão dos dados pelo público.*

![img](https://miro.medium.com/max/2400/1*o-DWXnHOulsRH8yotQB8UQ.png)

Na construção do **Data Storytelling** é importante além de contar história, saber analisar dados, dessa forma essa metodologia nasce de uma demanda da área de **Data Science**.

## Como criar seu próprio Storytelling

Perguntas que precisamos responder para guiar uma apresentação:

+ **PÚBLICO-ALVO**

*Quem têm interesse em visualizar melhor esses dados. Qual perfil. Qual cargo?*

+ **ANÁLISE DOS DADOS**

*Que informações podem ser extraídas desses dados. Os dados possuem credibilidade?*

+ **INSIGHTS**

*Como essas informações podem ajudar o público-alvo?*

![img](https://miro.medium.com/max/2400/1*4iYMqdBL-8-f_-T8FUpBdg.png)

Essas respostas nos ajudam a construir uma história que irá manter a atenção do público-alvo. 

## Desenvolvendo Storytelling 

Para o desenvolvimento dessa história podemos utilizar o conceito adaptado da *Jornada do Herói (Joseph Campbell, 1990)*:

**1. Introdução:** o contexto geral das informações.

**2. Conflito:** qual o problema e o objetivo que queremos alcançar.

**3. Recusa do chamado:** o que está nos dificultando seguir em frente *(falta de dados, o problema parece muito grande, a meta parece muito distante)*.

**4. Ajuda necessária:** Do que preciso. Quais dados nos ajudam a seguir em frente. Quem mais pode nos ajudar.

**5. Superação:** Que informações posso apresentar para poder seguirmos em frente *(que outras informações facilitam atingir as metas)*.

**6. Grande virada:** Alcançando os objetivos (1º insight).

**7. Conclusão da trama:** o que precisa ser feito (2º insight).

![img](https://miro.medium.com/max/2400/1*KjXtA9LEgdt7dBXHtOTwZQ.png)

O processo de desenvolvimento de uma apresentação requer ajustes da história de acordo com o público-alvo e seus objetivos. Treinar e ensaiar, apresentando para outras pessoas também ajuda. E algo que é muito importante é a credibilidade das fontes de dados, que são um dos pontos essenciais para manter a atenção do seu público.

## Storytelling conhecidos

- [FiveThirtyEight.com](https://fivethirtyeight.com/)

*FiveThirtyEight, às vezes representado como 538, é um site americano que se concentra em análises de pesquisas de opinião, política, economia e blogs de esportes.*

![img](https://i2.wp.com/s3.amazonaws.com/s3.nmpoliticalreport.com/wp-content/uploads/2016/08/10210552/538-logo-fivethirtyeight.png?fit=642%2C401&ssl=1)

- O heatmap da [Strava](https://www.strava.com/)

*O Heatmap global mostra o "calor" gerado por atividades públicas e agregadas nos últimos dois anos. Visite strava.com/heatmap para ver o heatmap da sua área. O heatmap não é atualizado em tempo real, ele é uma fotografia de dados históricos.*

![img](https://miro.medium.com/max/2400/1*k7lGAxkKyFp1Y2ncVuBhng.png)

- [R2D3](http://www.r2d3.us/uma-introducao-visual-ao-aprendizado-de-maquina-1/)

*O site ensina Machine Learning utilizando elementos visuais que, inclusive, possui versão traduzida para Português. Embora seja um tutorial, a história está lá sendo contada.*

![img](https://miro.medium.com/max/2400/1*UhTsi8nKPlnjYZPaAxxXug.png)

## Ferramentas para Storytelling

+ **Jupyter Notebook**

+ **RStudio**

+ **Markdown**

+ **Shorthand**

+ **Datawrapper**


### Informações Adicionais
[Storytelling com dados da Cole Nussbaumer](https://www.amazon.com.br/Storytelling-com-Dados-Visualiza%C3%A7%C3%A3o-Profissionais/dp/8550804681/ref=asc_df_8550804681/?tag=googleshopp00-20&linkCode=df0&hvadid=379805395634&hvpos=&hvnetw=g&hvrand=11870350594378386849&hvpone=&hvptwo=&hvqmt=&hvdev=c&hvdvcmdl=&hvlocint=&hvlocphy=1001750&hvtargid=pla-812777209198&psc=1)

[Blog da Cole Nussbaumer](https://www.storytellingwithdata.com/blog)

# Visualização de dados

**Para pensar:** Descreva em poucas palavras o que o Power BI (ou ferramnetas similares como o Tableau) faz.

>Ferramenta que facilita a vizualizção dos dados, facilitador gráfico para construção de queries complexas

## Roteiro

- ~[Instalar](https://powerbi.microsoft.com/pt-br/downloads/) Power BI~
- Conectar aos dados
        - csv / folder
        - Database
- Explorar dados
        - Modelos

- Criar 'visuals' (gráficos e/ou tabelas)
        - importar templates
- Modelagem
        - Nova coluna
        - Nova métrica
- Filtros
- Passeio por um exemplo real (e maluco)
- Integração com Jupyter

# Execício

> 1. Crie uma query que dê o total de itens vendidos, bem como a soma dos valores unitários agrupados pelo nome do vendedor. 
> 2. Crie um filtro de período. 
> 3. Reproduza os resultados em Power BI. 

### Resposta

> 

# Integração com jupyter notebook

Para começar:
- ~pip install jupyter_contrib_nbextensions (também libera outras featues legais)~
- ~!jupyter contrib nbextensions install~
- pip install powerbiclient

## Conectando ao Power BI

In [1]:
from powerbiclient import Report, models

In [2]:
import requests
res = requests.get('https://playgroundbe-bck-1.azurewebsites.net/Reports/SampleReport')

access_token = res.json()['EmbedToken']['Token']
embed_url = res.json()['EmbedUrl']

In [3]:
report=Report(access_token=access_token,embed_url=embed_url, token_type=models.TokenType.EMBED.value)
report

Report()

## Veja [aqui](https://www.analyticsvidhya.com/blog/2021/06/embed-powerbi-report-in-jupyter-notebook-using-powerbiclient/) como acessar Reports que você publicou!

# Exercícios

Enviar para o email filipe.furlan@letscode.com.br até **2021/08/24** um arquivo do power bi (`785_decision_firstname_lastname_aula03.pbix`) com a resolução dos exercicios abaixo.

Cada aba do arquivo deve conter a resolução de um exercício com todos seus subitens.

1. Da tabela territories:
    1. Quantos territórios temos ao todo?
1. Selecione da tabela empolyees:
    1. Quantos empregados reportam para cada chefe?
    1. Quantos empregados em cada cidade?
1. Selecione da tabela order_details:
    1. Quantas unidades forem vendidas por ordem?
    1. Qual o valor total de cada ordem?
    1. Qual o produto mais vendido?
    1. Selecione ordens que tenham menos de três produtos.
1. Selecione da tabels orders:
    1. Qual cliente realizou mais ordens?
    1. Qual cliente realizou menos ordens?
    1. Quantas ordems foram feitas por mês?
    1. Qual o tempo médio de envio por cliente?
    1. Faça uma lista ordenada dos países que receberam mais ordens.
    1. Qual o tempo máximo de envio por cidade?
    1. Quanto cada cliente gastou em frete?
    1. Qual o custo total de cada tipo de frete?
    1. Quanto cada cliente gastou em casa tipo de frete?
1. Selecione da tabela suppliers:
    1. Uma lista com os países que mais tem fornecedores.
1. Selecione da tabela products:
    1. Uma lista com o número de produtos por fornecedore.
    1. Oderne a lista acima em ordem decrescente.
    1. Uma lista com o número de produtos por fornecedors por categoria.
    1. Quantos produtos foram descontinuados.
    1. Fornecedores com estoque baixo (soma de unidades < 20).
    1. A média do valor total de cada categória.
    1. O valor do produto mais barato, mais caro e a média dos valores unitários por fornecedor e categoria. 
1. Uma lista dos 10 clientes que realizaram o maior número de pedidos, bem como o número de pedidos de cada, ordenados em ordem decrescente de nº de pedidos. 
1. Uma tabela com o valor médio das vendas em cada mês, ordenando do mês com mais vendas ao mês com menos vendas.
1. Qual a média dos valores por pedido de cada vendedor?
1. Quantos vendedores tiveram menos de 300 pedidos e média superior a 700 por pedido?
1. Criar uma tabela com: `classe|numero_de_pedidos|valor_total|media_de_valores`  
    Dica: Classificar as ordens de acordo com o preço total (incluindo frete) em:

    - Gold: valor_total >= 5.000
    - Silver: 1.000 <= valor_total < 5.000
    - Bronze: valor_total < 1000
1. Quantas ordens de compra há para cada categoria de produto?