## Este teste será divido em três partes. Serão avaliadas noções de negócios, noções de SQL e noções de construção de dashboards.

Na primeira parte você responderá perguntas sobre noções de negócio. Em seguida responderá perguntas relacionadas ao desenvolvimento de consultas SQL. E por fim você deverá construir um dashboard que responda as perguntas de negócio e traga novos insigths sobre os dados apresentados.

**Você pode entregar até onde conseguir fazer o teste, até mesmo propor outras soluções que achar necessário. Não fique preso apenas ao que é solicitado!** 😀

## Noções de Negócios

Aqui vamos avaliar questões do dia a dia, sobre como lidar com a equipe e o cliente.



1. Você é designado para um cliente com o objetivo de desenvolver um dashboard para a equipe Comercial. Você nunca trabalhou com este cliente e não tem contexto dos dados. Quais seriam seus passos para o desenvolvimento do trabalho?



*Responda aqui*

2. O seu time já teve várias reuniões com o cliente sobre o direcionamento do projeto e finalmente você recebeu os dados para trabalhar. Assim que começou a fazer as análises você encontra várias inconsistências que irão influenciar na qualidade final da entrega. Como você agiria nessa situação?

*Responda aqui*

3. Em uma reunião, o cliente pediu para você adicionar uma visualização completamente nova no dashboard que está desenvolvendo.  Essa demanda, levaria muitas horas e um grande esforço. Você ainda possui muitas tarefas para finalizar e o prazo de entrega está bem apertado. Como você lidaria com essa situação?



*Responda aqui*

# TESTE PRÁTICO DE LINGUAGEM DE CONSULTA ESTRUTURADA (SQL)
Para a realização das atividades, você deverá executar as instruções abaixo para importar as bibliotecas e funções necessárias para criar a base de dados.

Ao final, esperamos que você desenvolva os códigos selecionados e entregue o notebook com as consultas SQL desenvolvidas e o arquivo .db criado.

O teste importará três arquivos cruciais para o desenvolvimento dessa atividade. Todos estão no Githun (não mude as URL's).

*   usuarios.csv
*   produtos.csv
*   vendas.csv

## O teste foi desenvolvido para ser executado com o SQLite3 e no Google Colab (Ubuntu 18.04). Você deverá utilizar consultas no padrão ANSI. Os comandos necessários podem ser encontrados em:

https://www.sqlite.org/docs.html

https://www.tutorialspoint.com/sqlite/index.htm



**Descrição das tabelas**

Usuários

  * cod_usuario: Código único de identificação do usuário
  * data_cadastro: Data de cadastro no site feita pelo usuário
  * faixa_etaria: Faixa etária do usuário
  * cidade: Cidade cadastrada pelo usuário
  * estado: Estado cadastrada pelo usuário

Produtos 

  * cod_produto: Código único de identificação do produto
  * nome_produto: Nome do produto
  * categoria_produto: Categoria do produto
  * valor_produto: Preço em R$ do produto 

Vendas

  * cod_usuario: Código único de identificação do usuário 
  * cod_produto: Código único de identificação do produto 
  * data_compra: Data do pedido  
  * quantidade: Quantidade de itens da compra 
  * valor : Valor total da compra

# AVISO!



1.   Execute o código abaixo para atualizar a biblioteca do SQLite3 utilizada para essa atividade
2.   **Ignore as mensagens de erro sobre perda de conectividade na instrução abaixo (o kernel será reiniciado para atualização do SQLite3)**


In [None]:
import os

# BAIXAR A ÚLTIMA RELEASE DO COLAB, DESCOMPACTAR E INSTALAR NO DIRETÓRIO DO 
# PYTHON 3.7 (VERSÃO USADA PELO COLAB NESSE NOTEBOOK)
!curl https://www.sqlite.org/src/tarball/sqlite.tar.gz?r=release | tar xz
%cd sqlite/
!./configure
!make sqlite3.c
%cd /content/sqlite/
!npx degit coleifer/pysqlite3 -f
!cp sqlite/sqlite3.[ch] .
!python setup.py build_static build
!cp build/lib.linux-x86_64-3.7/pysqlite3/_sqlite3.cpython-37m-x86_64-linux-gnu.so \
     /usr/lib/python3.7/lib-dynload/

# REINICIANDO O KERNEL DO COLAB PARA IMPORTAR A BIBLIOTECA ATUALIZADA
os.kill(os.getpid(), 9)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 11.1M  100 11.1M    0     0   9.9M      0  0:00:01  0:00:01 --:--:--  9.9M
/content/sqlite
checking build system type... x86_64-pc-linux-gnu
checking host system type... x86_64-pc-linux-gnu
checking for gcc... gcc
checking whether the C compiler works... yes
checking for C compiler default output file name... a.out
checking for suffix of executables... 
checking whether we are cross compiling... no
checking for suffix of object files... o
checking whether we are using the GNU C compiler... yes
checking whether gcc accepts -g... yes
checking for gcc option to accept ISO C89... none needed
checking for a sed that does not truncate output... /bin/sed
checking for grep that handles long lines and -e... /bin/grep
checking for egrep... /bin/grep -E
checking for fgrep... /bin/grep -F
checking for ld used by gcc... /usr/bin/ld
checkin

# INSTRUÇÕES PARA REALIZAR AS CONSULTAS
### PARA CONSULTAR DADOS, SIGA OS PASSOS ABAIXO:

#### Abrir conexão:
    conexao_sql = sqlite3.connect(banco)
#### Abrir cursor para executar consulta no banco:
    cursor = conexao_sql.cursor()
#### Criar uma consulta:
    consulta = '''
        Coloque aqui a sua instrução SQL;
    '''
    cursor.execute(consulta)
#### Para visualizar o resultado da sua consulta:
    for linha in cursor:
      print(linha)
#### Para fechar a conexão:
    conexao_sql.close()

### LEMBRE-SE DE QUE PYTHON É SENSÍVEL A IDENTAÇÃO DE CÓDIGO!

# IMPORTANDO BIBLIOTECAS NECESSÁRIAS PARA EXECUTAR OS CÓDIGOS EM SQL

In [None]:
import sqlite3
import csv
import requests
from pathlib import Path
from urllib.parse import urlparse

# DEFINIÇÃO DE VARIÁVEIS FIXAS PARA O PROJETO

In [None]:
banco = "teste_sql.db"

# FUNÇÃO PARA INSERIR REGISTROS NO BANCO DE DADOS

In [None]:



# Recebe como parâmetro
# 1. Nome do banco de dados
# 2. Nome da tabela que receberá os dados
# 3. Lista das colunas da tabela
# 4. Dados que serão inseridos

def inserir_registros(banco, tabela, lista_colunas, arquivo):
  conexao_sql = sqlite3.connect(banco)
  cursor = conexao_sql.cursor()
  dados = open(arquivo)
  conteudo_dados = csv.reader(dados)
  num_colunas = 1 if lista_colunas.count(',') == 1 else lista_colunas.count(',')
  string_insert = 'INSERT INTO ' + tabela + ' (' + lista_colunas + ') VALUES (?' + ('' if num_colunas == 1 else ', ?' * (num_colunas)) + ')'
  cursor.executemany(string_insert, conteudo_dados)
  conexao_sql.commit()
  conexao_sql.close()

# FUNÇÃO PARA BAIXAR A BASE DE DADOS UTILIZADA PARA DESENVOLVIMENTO DAS ATIVIDADES

In [None]:
# Recebe como parâmetro:
# 1. Nome do arquivo com a extensão (Ex: base.csv)
# 2. URL do site onde o dado está localizado (Ex: 'https://drive.google.com/user_teste/folder_dataset/file.csv'):

def baixar_dados(nome_arquivo, url):
  requisicao = requests.get(url)
  conteudo = requisicao.content
  arquivo_csv = open(nome_arquivo, 'wb')
  arquivo_csv.write(conteudo)
  arquivo_csv.close()

# CRIAÇÃO DE CONEXÃO COM O BANCO SQLITE3 PARA DESENVOLVIMENTO DA ATIVIDADE

In [None]:
# Abre conexão com o banco. Se o arquivo não existir, cria a base.
conexao_sql = sqlite3.connect(banco)
conexao_sql.close()

# CRIAÇÃO DAS TABELAS PARA REALIZAÇÃO DAS ATIVIDADES

### TABELA DE USUÁRIOS

In [None]:
url = 'https://raw.githubusercontent.com/A3Data/testes_praticos/main/sql/base_dados/usuarios.csv'
nome_arquivo = Path(urlparse(url).path).name
baixar_dados(nome_arquivo, url)

conexao_sql = sqlite3.connect(banco)
# CRIAR A TABELA
conexao_sql.execute('''
CREATE TABLE IF NOT EXISTS usuarios
(
  cod_usuario INTEGER NOT NULL,
  data_cadastro DATE NOT NULL,
  faixa_etaria TEXT,
  cidade TEXT NOT NULL,
  estado TEXT NOT NULL);'''
)
conexao_sql.commit()

# INSERIR OS REGISTROS NO BANCO DE DADOS
lista_campos = 'cod_usuario, data_cadastro, faixa_etaria, cidade, estado'
inserir_registros(banco, 'usuarios', lista_campos, nome_arquivo)

### TABELA DE PRODUTOS

In [None]:
url = 'https://raw.githubusercontent.com/A3Data/testes_praticos/main/sql/base_dados/produtos.csv'
nome_arquivo = Path(urlparse(url).path).name
baixar_dados(nome_arquivo, url)

conexao_sql = sqlite3.connect(banco)
arquivo_produtos = 'produtos.csv'
# CRIAR A TABELA
conexao_sql.execute('''
CREATE TABLE IF NOT EXISTS produtos
(
  cod_produto INTEGER NOT NULL,
  nome_produto TEXT NOT NULL,
  categoria_produto TEXT,
  valor_produto FLOAT);'''
)
conexao_sql.commit()

# INSERIR OS REGISTROS NO BANCO DE DADOS
lista_campos = 'cod_produto, nome_produto, categoria_produto, valor_produto'
inserir_registros(banco, 'produtos', lista_campos, arquivo_produtos)

### TABELA DE VENDAS

In [None]:
url = 'https://raw.githubusercontent.com/A3Data/testes_praticos/main/sql/base_dados/vendas.csv'
nome_arquivo = Path(urlparse(url).path).name
baixar_dados(nome_arquivo, url)

conexao_sql = sqlite3.connect(banco)
arquivo_vendas = 'vendas.csv'
# CRIAR A TABELA
conexao_sql.execute('''
CREATE TABLE IF NOT EXISTS vendas
(
  cod_usuario INTEGER NOT NULL,
  cod_produto INTEGER NOT NULL,
  data_compra DATE NOT NULL,
  quantidade INT NOT NULL,
  valor FLOAT NOT NULL);'''
)
conexao_sql.commit()

# INSERIR OS REGISTROS NO BANCO DE DADOS
lista_campos = 'cod_usuario, cod_produto, data_compra, quantidade, valor'
inserir_registros(banco, 'vendas', lista_campos, arquivo_vendas)

In [None]:
cursor = conexao_sql.cursor()
consulta = '''
   select * from vendas;

'''
cursor.execute(consulta)
for linha in cursor:
  print(linha)



## Pergunta 1:


 Escreva um comando em SQL que retorne a quantidade de vendas dos estados de Minas Gerais e São Paulo por ano e mês

## Pergunta 2:

Escreva um comando em SQL que retorne a quantidade de compras realizadas dos usuários que fizeram compras entre 2019 e 2020.

## Pergunta 3:

 Escreva um comando em SQL que retorne quais são os 10 produtos mais vendidos em todo o periodo considerado.

## Pergunta 4:

 Escreva um comando em SQL que retorne o ticket médio (valor médio das compras) por faixa etária.



---



# **Construção de dashboard** 


**Seu desafio é desenvolver uma análise dos dados de vendas disponibilizados pela Data Coporation, com o intuito de gerar insights para os gestores responsáveis.**

O dashboard deverá conter apenas uma página e poderá ser desenvolvido na ferramenta que se sentir mais a vontade (ex., Power BI, Qlik, Data Studio, Tableau, Superset).

Segue algumas perguntas feitas pelos gestores que devem ser abordadas:

1. Quais as produto com melhores desempenhos da loja? E quais as produtos 
com piores desempenho?
2. Os produtos com melhor desempanho possuem alguma característica em comum?
3. Onde a loja deve investir mais em marketing pensando em ter mais retorno financeiro?
4. Vale mais a pena invertir em novos usuários ou em campanhas para usuários antigos?
5. Existe um padrão de venda por faixa etária?

**Não fique preso nas perguntas acima, novos insights são sempre bem vindos!**



