# üìä Reposit√≥rio de Consultas SQL para Analistas de Dados: **Departamento Comercial/Vendas**
-  üîç Contribui√ß√µes: Estamos abertos a contribui√ß√µes da comunidade de analistas de dados! Se voc√™ tiver consultas SQL √∫teis que gostaria de compartilhar ou sugest√µes para melhorias, sinta-se √† vontade para enviar um pull request. Juntos, podemos expandir e aprimorar este reposit√≥rio para beneficiar toda a comunidade de an√°lise de dados.
- üéØ Sinta-se √† vontade para explorar, utilizar e contribuir para este reposit√≥rio, e que ele possa ser uma ferramenta valiosa em sua jornada como analista de dados!

# **Volume de Pedidos por Regi√£o**
- O "Volume de Pedidos por Regi√£o" √© uma m√©trica que quantifica o n√∫mero total de pedidos recebidos em diferentes √°reas geogr√°ficas durante um per√≠odo espec√≠fico. Essa m√©trica √© crucial para entender onde a demanda por produtos ou servi√ßos √© mais alta ou mais baixa, permitindo √†s empresas ajustar suas estrat√©gias de oferta, distribui√ß√£o e promo√ß√µes de acordo com as necessidades e comportamentos espec√≠ficos de cada regi√£o. Analisar o volume de pedidos por regi√£o ajuda a otimizar a aloca√ß√£o de recursos, planejar campanhas de marketing localizadas e melhorar a efici√™ncia operacional para atender √†s demandas do mercado de forma mais eficaz.


In [None]:
%%sql
SELECT regiao, COUNT(DISTINCT order_id) AS volume_pedidos
FROM pedidos
GROUP BY regiao
ORDER BY volume_pedidos DESC;

# **Vendas por segmenta√ß√£o de parte do dia**
- "Vendas por segmenta√ß√£o de parte do dia" √© uma an√°lica que divide e avalia as vendas de acordo com diferentes segmentos do dia, como Caf√© da Manh√£, Almo√ßo, Snack (Lanche), e Jantar. Esta abordagem ajuda a entender quais per√≠odos do dia s√£o mais lucrativos ou apresentam maior atividade de vendas, permitindo √†s empresas otimizar suas opera√ß√µes e estrat√©gias promocionais. Por exemplo, se as vendas s√£o maiores no hor√°rio do almo√ßo, uma empresa pode focar em promo√ß√µes ou aumentar o estoque para atender a essa demanda. Isso facilita a aloca√ß√£o de recursos, planejamento de pessoal e estrat√©gias de marketing para maximizar a receita e a satisfa√ß√£o do cliente em cada per√≠odo espec√≠fico.

In [None]:
%%sql
SELECT
    EXTRACT(HOUR FROM hora_venda) AS hora,
    CASE
        WHEN EXTRACT(HOUR FROM hora_venda) BETWEEN 6 AND 10 THEN 'Caf√© da manh√£'
        WHEN EXTRACT(HOUR FROM hora_venda) BETWEEN 11 AND 14 THEN 'Almo√ßo'
        WHEN EXTRACT(HOUR FROM hora_venda) BETWEEN 15 AND 17 THEN 'Snack'
        WHEN EXTRACT(HOUR FROM hora_venda) BETWEEN 18 AND 22 THEN 'Jantar'
        ELSE 'Outro'
    END AS segmento_dia,
    EXTRACT(YEAR FROM hora_venda) AS ano,
    COUNT(DISTINCT order_id) AS num_vendas
FROM vendas
GROUP BY hora, segmento_dia, ano
ORDER BY segmento_dia, hora, ano;

# **Gross Merchandise Volume (GMV)**
- O Gross Merchandise Volume (GMV) √© a m√©trica que representa o total bruto das vendas de produtos ou servi√ßos em uma plataforma durante um per√≠odo espec√≠fico, medido pelo valor total de bens vendidos. Essa m√©trica √© frequentemente usada no com√©rcio eletr√¥nico para avaliar o desempenho de campanhas de marketing ou da plataforma como um todo, indicando o valor monet√°rio total das transa√ß√µes realizadas, antes da dedu√ß√£o de quaisquer descontos, devolu√ß√µes ou custos associados. O GMV √© crucial para medir a sa√∫de financeira e a escala de atividades em marketplaces e plataformas de e-commerce, fornecendo uma vis√£o clara do volume de transa√ß√µes e da capacidade de gerar receita.

In [None]:
%%sql
SELECT
    EXTRACT(MONTH FROM data_venda) AS mes,
    EXTRACT(YEAR FROM data_venda) AS ano,
    SUM(valor_total_pedido) AS gmv
FROM pedidos
GROUP BY mes, ano
ORDER BY ano, mes;

# **Ticket M√©dio de Pedidos**
- O "Ticket M√©dio de Pedidos" √© uma m√©trica financeira que calcula o valor m√©dio que cada cliente gasta por pedido. Ele √© obtido dividindo o total de receitas obtidas com vendas pelo n√∫mero total de pedidos realizados em um determinado per√≠odo. Essa m√©trica √© √∫til para entender o comportamento de compra dos clientes, ajudando as empresas a avaliar a efic√°cia de suas estrat√©gias de pre√ßos e promo√ß√µes, e a planejar a√ß√µes para aumentar o valor m√©dio das compras. Um ticket m√©dio alto pode indicar um poder de compra elevado dos clientes ou uma efic√°cia na oferta de produtos e servi√ßos de maior valor.

In [None]:
%%sql
SELECT
  user_id,
  AVG(receita) AS ticket_medio
FROM (
  SELECT
    order_id,
    user_id,
    ROUND(SUM(sale_price), 2) AS receita
  FROM `bigquery-public-data.thelook_ecommerce.order_items`
  WHERE status = 'Complete'
  GROUP BY 1, 2
)
GROUP BY 1
ORDER BY 2 DESC

# **Pre√ßo m√©dio de Produto - Por Estado**
- O "Pre√ßo M√©dio de Produto - Por Estado" √© uma m√©trica que calcula o valor m√©dio ao qual produtos espec√≠ficos s√£o vendidos em diferentes estados ou regi√µes geogr√°ficas. Essa an√°lise permite identificar varia√ß√µes nos pre√ßos devido a fatores regionais, como diferen√ßas econ√¥micas, prefer√™ncias locais, e concorr√™ncia. Ao entender essas varia√ß√µes, as empresas podem ajustar suas estrat√©gias de precifica√ß√£o, marketing e distribui√ß√£o para melhor atender √†s demandas de cada mercado estadual, maximizando a penetra√ß√£o de mercado e otimizando o desempenho das marcas em diferentes contextos regionais.


In [None]:
%%sql
SELECT
    estado,
    marca,
    AVG(preco) AS preco_medio
FROM tabela_de_vendas
WHERE data_venda BETWEEN '2023-01-01' AND '2023-12-31'
GROUP BY estado, marca;

# **An√°lise de Satisfa√ß√£o dos Clientes**
- A "An√°lise de Satisfa√ß√£o dos Clientes" √© um processo que avalia a experi√™ncia e a percep√ß√£o dos clientes em rela√ß√£o a uma empresa, seus produtos ou servi√ßos. Utiliza-se de avalia√ß√µes, feedbacks, e pesquisas para coletar dados sobre a satisfa√ß√£o dos clientes. Esta an√°lise √© crucial para entender o que os clientes apreciam ou desejam que seja melhorado, permitindo que a empresa fa√ßa ajustes estrat√©gicos para elevar a qualidade do servi√ßo, aperfei√ßoar produtos e fortalecer a rela√ß√£o com o cliente. Al√©m disso, uma alta satisfa√ß√£o do cliente contribui positivamente para a reputa√ß√£o da empresa, atraindo mais neg√≥cios e promovendo lealdade √† marca.

In [None]:
%%sql
SELECT AVG(avaliacao) AS satisfacao_media
FROM feedback_clientes;

# **Taxa de Reten√ß√£o de Clientes**
- A Taxa de Reten√ß√£o de Clientes √© uma m√©trica que mede a porcentagem de clientes que continuam utilizando um servi√ßo ap√≥s fazerem seu primeiro pedido. Essa taxa √© crucial para avaliar a fidelidade e a satisfa√ß√£o do cliente com o servi√ßo oferecido. Uma alta taxa de reten√ß√£o indica que os clientes est√£o satisfeitos e veem valor cont√≠nuo no servi√ßo, sugerindo que a empresa √© bem-sucedida em manter seus clientes engajados e interessados em continuar a rela√ß√£o comercial. Acompanhar essa m√©trica ajuda a empresa a entender a efic√°cia de suas estrat√©gias de engajamento e reten√ß√£o.

In [None]:
%%sql
SELECT
  (COUNT(DISTINCT cliente_id) / (SELECT COUNT(DISTINCT cliente_id) FROM Pedidos WHERE data_pedido < '2024-01-01')) * 100 AS TaxaRetencaoClientes
FROM Pedidos
WHERE cliente_id IN (SELECT DISTINCT cliente_id FROM Pedidos WHERE data_pedido < '2024-01-01')
  AND data_pedido BETWEEN '2024-01-01' AND '2024-03-31';

# **Top 10 clientes que mais compraram, por regi√£o**
- "Top 10 clientes que mais compraram, por regi√£o" √© uma an√°lise que identifica os dez clientes que realizaram os maiores volumes de compras em cada regi√£o geogr√°fica. Esta an√°lise ajuda a empresa a reconhecer seus clientes mais valiosos e fi√©is em diferentes √°reas, fornecendo uma base s√≥lida para campanhas publicit√°rias e estrat√©gias de marketing direcionadas. Ao focar nesses clientes, a empresa pode criar promo√ß√µes personalizadas, ofertas especiais e programas de fidelidade para manter e aumentar o engajamento desses consumidores chave, maximizando a efici√™ncia das campanhas e fortalecendo as rela√ß√µes de longo prazo.

In [None]:
%%sql
SELECT
    regiao,
    cliente_id,
    COUNT(DISTINCT order_id) AS num_compras
FROM vendas
GROUP BY regiao, cliente_id
ORDER BY num_compras DESC
LIMIT 10;

# **Top 10 Produtos Mais Vendidos**
- "Top 10 Produtos Mais Vendidos" √© uma an√°lise que lista os dez produtos que tiveram o maior volume de vendas em um determinado per√≠odo. Esta lista √© crucial para entender quais produtos est√£o desempenhando melhor no mercado, permitindo que a empresa identifique tend√™ncias de consumo, ajuste estrat√©gias de estoque e planeje a√ß√µes de marketing direcionadas. Ao destacar os produtos mais populares, as empresas podem otimizar suas ofertas para maximizar as receitas e melhorar a satisfa√ß√£o do cliente, ao mesmo tempo em que ganham insights valiosos sobre as prefer√™ncias dos consumidores.

In [None]:
%%sql
SELECT produto, COUNT(DISTINCT order_id) AS num_vendas
FROM vendas
GROUP BY produto
ORDER BY num_vendas DESC
LIMIT 10;

# **N√∫mero de clientes por m√™s**
- "N√∫mero de clientes por m√™s" √© uma m√©trica que contabiliza quantos clientes √∫nicos fizeram compras ou utilizaram servi√ßos de uma empresa dentro de cada m√™s espec√≠fico. Esta m√©trica ajuda a entender a atra√ß√£o e a reten√ß√£o de clientes ao longo do tempo, permitindo que a empresa avalie a efic√°cia de suas campanhas de marketing, promo√ß√µes e estrat√©gias operacionais. Acompanhar essa m√©trica √© crucial para medir o crescimento ou decl√≠nio na base de clientes e para adaptar estrat√©gias de neg√≥cio a fim de melhor atender √†s necessidades do mercado e impulsionar o engajamento dos clientes.

In [None]:
%%sql
SELECT
    EXTRACT(MONTH FROM data_registro) AS mes,
    EXTRACT(YEAR FROM data_registro) AS ano,
    COUNT(DISTINCT client_id) AS num_clientes
FROM clientes
GROUP BY mes, ano
ORDER BY ano, mes;

# **N√∫mero de pedidos por m√™s**
- "N√∫mero de pedidos por m√™s" √© uma m√©trica que registra a quantidade total de pedidos feitos pelos clientes em cada m√™s. Essa m√©trica √© fundamental para avaliar a atividade de vendas de uma empresa, permitindo entender as flutua√ß√µes na demanda ao longo do tempo. Analisar o n√∫mero de pedidos mensais ajuda a identificar tend√™ncias sazonais, avaliar o impacto de campanhas promocionais e estrat√©gias de marketing, e planejar melhor a gest√£o de estoque e recursos. Isso tamb√©m pode indicar a efic√°cia das iniciativas de engajamento do cliente e a sa√∫de geral do neg√≥cio.

In [None]:
%%sql
SELECT
    EXTRACT(MONTH FROM data_pedido) AS mes,
    EXTRACT(YEAR FROM data_pedido) AS ano,
    COUNT(DISTINCT order_id) AS num_pedidos
FROM pedidos
GROUP BY mes, ano
ORDER BY ano, mes;

# **Usu√°rios que n√£o tem compra em periodo X (exemplo: dezembro de 2022)**
- "Usu√°rios que n√£o t√™m compra em per√≠odo X" refere-se √† identifica√ß√£o de clientes que n√£o realizaram nenhuma compra durante um per√≠odo espec√≠fico, como, por exemplo, dezembro de 2022. Esta an√°lise √© utilizada para detectar clientes potencialmente inativos ou menos engajados, proporcionando uma oportunidade para que a empresa desenvolva estrat√©gias espec√≠ficas de reengajamento. Ao entender quais clientes n√£o est√£o comprando em determinados per√≠odos, a empresa pode direcionar esfor√ßos de marketing, oferecer promo√ß√µes personalizadas ou realizar pesquisas para entender os motivos da inatividade e tentar recuperar esses clientes, aumentando assim as vendas e a fidelidade √† marca.

In [None]:
%%sql
select distinct
  u.id
from bigquery-public-data.thelook_ecommerce.users u
left join bigquery-public-data.thelook_ecommerce.orders o on u.id = o.user_id and date(o.created_at) between "2022-12-01" and "2022-12-31"
where o.user_id is null;

# **Informa√ß√µes resumidas sobre os usu√°rios (de todos, tendo ou n√£o compras)**
As "informa√ß√µes resumidas sobre os usu√°rios" constituem um conjunto de dados agregados que fornecem uma vis√£o detalhada sobre o comportamento de compra e intera√ß√£o dos clientes com a empresa. Esse resumo inclui:

- **Id do usu√°rio**: Identifica√ß√£o √∫nica de cada cliente.
- **Quantidade de compras realizadas**: N√∫mero total de transa√ß√µes conclu√≠das pelo usu√°rio.
- **Quantidade de itens comprados**: Total de itens adquiridos ao longo de todas as compras.
- **Ticket m√©dio**: Valor m√©dio gasto por compra, calculado dividindo o total gasto pelo n√∫mero de compras.
- **Quantidade de produtos distintos comprados**: N√∫mero de diferentes tipos de produtos adquiridos pelo usu√°rio.
- **Centro de distribui√ß√µes dos quais o usu√°rio recebeu produtos**: Informa√ß√µes sobre de quais centros de distribui√ß√£o os produtos foram enviados para o usu√°rio, indicando a log√≠stica envolvida.
- **Quantidade de cria√ß√µes de carrinho**: N√∫mero de vezes que o usu√°rio adicionou itens ao carrinho de compras, independentemente de concluir a compra.

Essas informa√ß√µes ajudam a empresa a entender melhor cada cliente, permitindo a personaliza√ß√£o de ofertas, a otimiza√ß√£o de estrat√©gias de marketing e a melhoria do servi√ßo ao cliente. Al√©m disso, permitem identificar padr√µes e tend√™ncias no comportamento de compra que podem ser cruciais para o planejamento estrat√©gico e operacional.

In [None]:
%%sql
select
  u.id,
  ticket_medio,
  compras_realizadas,
  itens_comprados,
  produtos_distintos,
  centros_distribuicao,
  count(distinct e.id) as eventos_carrinho
from bigquery-public-data.thelook_ecommerce.users u
left join bigquery-public-data.thelook_ecommerce.events e on e.user_id = u.id and event_type = 'cart'
left join (
  select
    o.user_id,
    sum(sale_price)/count(distinct o.order_id) as ticket_medio,
    count(distinct o.order_id) as compras_realizadas,
    count(distinct oi.id) as itens_comprados,
    count(distinct p.id) as produtos_distintos,
    count(distinct d.id) as centros_distribuicao
  from bigquery-public-data.thelook_ecommerce.orders o
  left join bigquery-public-data.thelook_ecommerce.order_items oi on o.order_id = oi.order_id
  left join bigquery-public-data.thelook_ecommerce.products p on p.id = oi.product_id
  left join bigquery-public-data.thelook_ecommerce.distribution_centers d on d.id = p.distribution_center_id
  group by 1
) as T on T.user_id = u.id
group by 1, 2, 3, 4, 5, 6
order by id;

# **Tempo em dias da data de cadastro at√© a √∫ltima compra de cada usu√°rio**
- "Tempo em dias da data de cadastro at√© a √∫ltima compra de cada usu√°rio" √© uma m√©trica que calcula o n√∫mero de dias entre a data em que um usu√°rio se cadastrou em uma plataforma ou servi√ßo e a data de sua √∫ltima compra. Essa medida fornece insights sobre o envolvimento e a atividade do cliente ao longo do tempo, ajudando a avaliar o qu√£o engajados e leais os usu√°rios s√£o em rela√ß√£o √† empresa. Um intervalo curto entre cadastro e √∫ltima compra pode indicar alta satisfa√ß√£o e envolvimento, enquanto um intervalo longo pode sugerir desengajamento ou oportunidades para reengajar o cliente.

In [None]:
%%sql
select
  u.id,
  max(timestamp_diff(o.created_at, u.created_at, day)) as dias_ate_ultima_compra
from bigquery-public-data.thelook_ecommerce.orders o
join bigquery-public-data.thelook_ecommerce.users u on u.id = o.user_id
group by 1
order by 2 desc;

# **Tempo em dias entre a primeira e a √∫ltima compra de cada usu√°rio**
- "Tempo em dias entre a primeira e a √∫ltima compra de cada usu√°rio" √© uma m√©trica que mede o intervalo de tempo decorrido entre a data da primeira compra de um cliente e a data de sua √∫ltima compra registrada. Esta m√©trica √© √∫til para entender a longevidade e a frequ√™ncia das intera√ß√µes comerciais de um cliente com a empresa, fornecendo uma vis√£o sobre o ciclo de vida do cliente. Um per√≠odo longo entre a primeira e a √∫ltima compra pode indicar fidelidade do cliente, enquanto um per√≠odo curto pode sugerir uma intera√ß√£o pontual ou necessidades de estrat√©gias de reten√ß√£o mais eficazes.

In [None]:
%%sql
select
  user_id,
  timestamp_diff(max(created_at), min(created_at), day) as dias_entre_prim_ult
from bigquery-public-data.thelook_ecommerce.orders
group by 1
order by 2 desc;

# **Receita acumulada dos usu√°rios, a cada pedido**
- "Receita acumulada dos usu√°rios, a cada pedido" refere-se √† soma total de receita que um cliente gera para a empresa a cada nova compra que realiza. Essa m√©trica acompanha e soma todos os valores gastos pelo cliente desde sua primeira compra at√© a mais recente, fornecendo uma vis√£o cont√≠nua do valor financeiro que o cliente traz para a empresa ao longo do tempo. Isso ajuda a entender o impacto econ√¥mico individual de cada cliente e √© crucial para identificar quais clientes s√£o mais valiosos, permitindo a implementa√ß√£o de estrat√©gias de marketing e reten√ß√£o focadas nos usu√°rios de maior valor.

In [None]:
%%sql
select
  o.user_id,
  o.order_id,
  oi.id as item_id,
  o.created_at,
  round(sum(sale_price) over(partition by o.user_id order by o.created_at, oi.id rows between unbounded preceding and current row), 2) as receita_acumulada
from bigquery-public-data.thelook_ecommerce.orders o
join bigquery-public-data.thelook_ecommerce.order_items oi on oi.order_id = o.order_id
order by 1, 4, 3;

# **Tempo em dias entre uma compra e outra para cada usu√°rio**
- √â o intervalo de tempo, em dias, entre duas compras consecutivas feitas por um mesmo usu√°rio. √â a m√©trica que quantifica o intervalo de tempo entre compras sucessivas feitas por cada cliente, crucial para entender o comportamento de compra e identificar padr√µes de fidelidade ou churn. Essa informa√ß√£o √© essencial para otimizar estrat√©gias de reten√ß√£o de clientes, personalizar ofertas e melhorar a experi√™ncia do cliente.

In [None]:
%%sql
select
    user_id,
    order_id,
    created_at,
    timestamp_diff(created_at, lag(created_at) over(partition by user_id order by created_at), day) diferenca_dias
from bigquery-public-data.thelook_ecommerce.orders
order by 1, 3
-- order by 4 desc (para mostrar usuarios com maior diferenca em dias)

# **Forma de retornar os usu√°rios com compras recorrentes dentro do mesmo m√™s (mais de 1 compra)**
- √â o m√©todo para identificar e segmentar usu√°rios que realizam m√∫ltiplas compras dentro do mesmo m√™s, permitindo analisar padr√µes de comportamento de compra recorrente e criar estrat√©gias espec√≠ficas de reten√ß√£o e fideliza√ß√£o.

In [None]:
%%sql
SELECT DISTINCT user_id
FROM (
  SELECT
    user_id,
    order_id,
    created_at,
    ROW_NUMBER() OVER (
      PARTITION BY user_id, EXTRACT(YEAR FROM created_at), EXTRACT(MONTH FROM created_at)
      ORDER BY created_at
    ) AS numero_compra
  FROM bigquery-public-data.thelook_ecommerce.orders
) AS T
WHERE numero_compra > 1
ORDER BY user_id;

# **Produtos mais vendidos por categoria**
- √â a an√°lise que identifica os produtos com maior volume de vendas em cada categoria espec√≠fica, fornecendo insights sobre demanda, prefer√™ncias dos clientes e oportunidades de otimiza√ß√£o do mix de produtos.

In [None]:
%%sql
with cte_sales_qty_data as (
    select
        p.product_name,
        c.category_name,
        sum(od.quantity) as qty,
        rank() over(partition by c.category_name order by sum(od.quantity) desc) as rank
    from order_details od
    join products p on od.product_id = p.product_id
    join categories c on p.category_id = c.category_id
    group by p.product_name, c.category_name
)

select * from cte_sales_qty_data
where rank <= 3
order by category_name, rank