# 📊 Repositório de Consultas SQL para Analistas de Dados: **Departamento de Marketing**
-  🔍 Contribuições: Estamos abertos a contribuições da comunidade de analistas de dados! Se você tiver consultas SQL úteis que gostaria de compartilhar ou sugestões para melhorias, sinta-se à vontade para enviar um pull request. Juntos, podemos expandir e aprimorar este repositório para beneficiar toda a comunidade de análise de dados.
- 🎯 Sinta-se à vontade para explorar, utilizar e contribuir para este repositório, e que ele possa ser uma ferramenta valiosa em sua jornada como analista de dados!

# **Custo por Clique (CPC) de Campanhas**
- O Custo por Clique (CPC) é uma métrica usada em campanhas de publicidade digital para medir quanto custa cada clique recebido em um anúncio. Ele é calculado dividindo o custo total da campanha pelo número total de cliques que o anúncio recebeu. Essa métrica é fundamental para avaliar a eficiência e o custo-benefício de campanhas pagas, especialmente em plataformas como Google Ads e redes sociais.

In [None]:
%sql
SELECT (Valor_Gasto_em_Marketing / Cliques) AS CPC
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';

# **Custo de Aquisição do Cliente (CAC)**
- O Custo de Aquisição do Cliente (CAC) é uma métrica que calcula o custo total incorrido para adquirir um novo cliente. Isso inclui todos os gastos de marketing e vendas divididos pelo número de clientes adquiridos em um determinado período. O CAC é essencial para avaliar a eficácia das estratégias de marketing e vendas de uma empresa e para garantir que o investimento em aquisição de clientes seja sustentável a longo prazo.

In [None]:
%%sql
SELECT (Valor_Gasto_em_Marketing / Novos_Clientes_Adquiridos) AS CAC
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';

# **Retorno sobre o investimento em marketing (ROI)**
- O Retorno sobre o Investimento em Marketing (ROI) é uma métrica usada para avaliar a eficácia e a rentabilidade das despesas em marketing. Ele é calculado pela diferença entre o ganho obtido com as campanhas de marketing e o custo dessas campanhas, dividido pelo custo, geralmente expresso em porcentagem. Esse índice ajuda as empresas a entender quais estratégias de marketing estão gerando mais valor e quais podem precisar de ajustes ou serem descontinuadas.

In [None]:
%%sql
SELECT ((Receita_Gerada - Valor_Gasto_em_Marketing) / Valor_Gasto_em_Marketing) AS ROI
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';

# **Taxa de Cliques (CTR)**
- A Taxa de Cliques (CTR, do inglês "Click-Through Rate") é uma métrica que mede a eficácia de um anúncio ou campanha digital, calculando a proporção de usuários que clicam em um anúncio em relação ao número total de visualizações (impressões) que o anúncio recebe. É expressa em porcentagem e indica quão atraente e relevante o anúncio é para o público-alvo. Um CTR alto geralmente sugere que o anúncio está bem otimizado e é eficaz em atrair a atenção dos usuários.

In [None]:
%%sql
SELECT (Cliques / Impressões) AS CTR
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';

# **Conversão**
- A taxa de conversão é uma métrica crucial em marketing e vendas que mede o percentual de usuários que completam uma ação desejada (como fazer uma compra, se inscrever para um serviço, ou preencher um formulário) em relação ao total de visitantes. Essa taxa é essencial para avaliar a eficiência de campanhas, páginas de destino ou anúncios em converter visitantes em clientes ou leads. Uma alta taxa de conversão indica que as estratégias implementadas estão sendo eficazes em motivar os usuários a realizar ações específicas.

In [None]:
%%sql
SELECT (Pedidos / Cliques) AS Conversão
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';

# **Taxa de Conversão de Cliques em Pedidos (CCR)**
- A Taxa de Conversão de Cliques em Pedidos (CCR, de "Click-to-Conversion Rate") é uma métrica que mede a eficiência com que os cliques em anúncios ou links se convertem em ações concretas, como pedidos de compra ou subscrições. Ela é calculada dividindo o número de conversões (pedidos) pelo número total de cliques. Essa taxa ajuda a entender o quão bem uma campanha digital está performando em termos de gerar resultados efetivos, além de simplesmente atrair cliques.







In [None]:
%%sql
SELECT (COUNT(DISTINCT pedidos) / COUNT(DISTINCT cliques)) AS CCR
FROM cliques_table
WHERE campanha = 'Nome_da_Campanha';

# **Taxa de Retenção de Clientes**
- A Taxa de Retenção de Clientes é uma métrica que mede a porcentagem de clientes que retornam para fazer pedidos novamente ou renovam suas assinaturas em um determinado período. Essencialmente, ela reflete o sucesso de uma empresa em manter seus clientes engajados e satisfeitos ao longo do tempo. Uma alta taxa de retenção é geralmente um indicador de boa saúde do cliente e da eficácia das estratégias de relacionamento e fidelização da empresa.

📋 **Explicação da Query:**

- pedidos_mensais é um CTE (Common Table Expression) que agrupa pedidos por usuário e mês/ano, para identificar em quais meses os usuários estiveram ativos.
- clientes_retidos é outro CTE que junta os dados do mesmo usuário entre dois meses consecutivos, verificando se o cliente que fez um pedido em um mês também fez no seguinte.
- A query final seleciona o ano e mês de início, conta o total de clientes únicos e quantos desses foram retidos no mês seguinte.
- Calcula a taxa de retenção como a proporção de clientes retidos em relação ao total de clientes do mês anterior.

Ajuste as colunas e a lógica conforme necessário para se alinhar com a estrutura e as necessidades específicas de seus dados.

In [None]:
%%sql
%%sql
-- Suponha que temos uma tabela chamada 'pedidos' com colunas 'id_usuario' e 'data_pedido'
WITH pedidos_mensais AS (
    SELECT
        id_usuario,
        EXTRACT(YEAR FROM data_pedido) AS ano,
        EXTRACT(MONTH FROM data_pedido) AS mes
    FROM
        pedidos
    GROUP BY
        id_usuario, ano, mes
),

clientes_retidos AS (
    SELECT
        a.id_usuario,
        a.ano AS ano_inicio,
        a.mes AS mes_inicio,
        b.ano AS ano_retido,
        b.mes AS mes_retido
    FROM
        pedidos_mensais a
    JOIN
        pedidos_mensais b ON a.id_usuario = b.id_usuario
    WHERE
        (b.ano > a.ano OR (b.ano = a.ano AND b.mes = a.mes + 1))
)

SELECT
    ano_inicio,
    mes_inicio,
    COUNT(DISTINCT id_usuario) AS total_clientes,
    COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) AS clientes_retidos,
    ROUND((COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) * 100.0) / COUNT(DISTINCT id_usuario), 2) AS taxa_retencao
FROM
    clientes_retidos
GROUP BY
    ano_inicio, mes_inicio
ORDER BY
    ano_inicio, mes_inicio;

# **Custo por Aquisição (CPA)**
- O Custo por Aquisição (CPA) é uma métrica financeira que mede o custo total associado à aquisição de um novo cliente através de esforços de marketing e vendas. Ele é calculado dividindo todos os custos de campanhas de marketing e vendas pelo número de novos clientes adquiridos durante um determinado período. O CPA é crucial para avaliar a eficiência e rentabilidade das estratégias de marketing, ajudando as empresas a entender quanto estão investindo para ganhar cada cliente.

In [None]:
%%sql
SELECT (Valor_Gasto_em_Marketing / Novos_Clientes_Adquiridos) AS CPA
FROM campanhas_table
WHERE data = '2024-03-01';

# **Lifetime Value (LTV) do Cliente**
- O Lifetime Value (LTV) do Cliente é uma métrica financeira que estima o valor total de receita que uma empresa pode esperar de um único cliente ao longo de toda a sua relação com a empresa. O LTV ajuda a entender quanto um cliente vale em termos de receita e é crucial para tomar decisões sobre quanto investir em aquisição e retenção de clientes. Ele permite que as empresas avaliem a lucratividade a longo prazo de suas relações com os clientes e ajustem suas estratégias de marketing e vendas para otimizar esse valor.

In [None]:
%%sql
SELECT AVG(valor_total_pedidos) AS LTV
FROM pedidos_table
WHERE data BETWEEN '2023-01-01' AND '2024-01-01';

#**Taxa de Engajamento nas Redes Sociais**
- A Taxa de Engajamento nas Redes Sociais é uma métrica que mede a interação dos usuários com o conteúdo publicado em plataformas de mídia social. Ela é calculada com base no número de interações ativas que o conteúdo recebe, como curtidas, comentários, compartilhamentos e visualizações, dividido pelo número total de seguidores ou alcance do post. Essa taxa é um indicador importante da relevância e do impacto do conteúdo, mostrando o quanto ele é capaz de envolver e atrair a atenção dos usuários.

In [None]:
%%sql
SELECT (Interações / Seguidores) AS Engajamento
FROM redes_sociais
WHERE plataforma = 'Instagram'
AND data_postagem BETWEEN '2024-01-01' AND '2024-03-31';

# **Vendas totais por campanha (GMV)**
- O GMV (Gross Merchandise Volume) refere-se ao volume total de vendas gerado por uma campanha ou plataforma durante um período específico, medido pelo valor total de bens vendidos. Essa métrica é frequentemente usada no comércio eletrônico para avaliar o desempenho de campanhas de marketing ou da plataforma como um todo, indicando o valor monetário total das transações realizadas, antes da dedução de quaisquer descontos, devoluções ou custos associados.

In [None]:
%%sql
SELECT campanha, SUM(valor_total_pedidos) AS GMV
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
GROUP BY campanha;

# **Número de pedidos**
- O Número de Pedidos é uma métrica que conta o total de transações ou pedidos concluídos pelos clientes em um período específico. Essa métrica é essencial para negócios de e-commerce, restaurantes, ou qualquer serviço que processa vendas e pedidos, permitindo avaliar a quantidade de atividade comercial e a demanda pelos produtos ou serviços oferecidos pela empresa. É uma medida fundamental para análise de desempenho e planejamento operacional.

In [None]:
%%sql
SELECT campanha, COUNT(DISTINCT order_id) AS Num_Pedidos
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
GROUP BY campanha;

# **Número de Clientes por Campanha**
- O "Número de Clientes por Campanha" é uma métrica que indica quantos clientes distintos fizeram pedidos durante uma campanha promocional específica. Essa métrica é utilizada para avaliar o alcance e a eficácia de uma campanha em atrair clientes diferentes, ajudando a entender a capacidade da campanha de engajar novos ou retornar clientes e gerar vendas. É particularmente útil para medir a penetração de mercado e a resposta do cliente às iniciativas de marketing.

In [None]:
%%sql
SELECT COUNT(DISTINCT cliente_id) AS Num_Clientes
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha';

# **Vendas por segmentação de parte do dia**
- "Vendas por segmentação de parte do dia" é uma métrica que divide e calcula as vendas de acordo com diferentes segmentos do dia, como Manhã, Meio-dia, Anoitecer/Final da Tarde, Noite e De manhã cedo. Essa análise ajuda a identificar quais períodos do dia são mais lucrativos ou têm maior atividade de vendas, permitindo às empresas otimizar suas operações, promoções e estratégias de marketing com base nos padrões de compra dos clientes durante esses horários específicos.

In [None]:
%%sql
SELECT
    CASE
        WHEN hora > 4 AND hora <= 8 THEN 'Early Morning'
        WHEN hora > 8 AND hora <= 12 THEN 'Morning'
        WHEN hora > 12 AND hora <= 16 THEN 'Afternoon'
        WHEN hora > 16 AND hora <= 20 THEN 'Evening'
        WHEN hora > 20 AND hora <= 24 THEN 'Night'
        WHEN hora <= 4 THEN 'Late Night'
    END AS part_of_day,
    COUNT(DISTINCT order_id) AS Num_Pedidos
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
AND data_pedido BETWEEN '2024-01-01' AND '2024-03-31'
GROUP BY part_of_day;

# **Usuários que não tem compra em dezembro de 2022**
- Usuários cujos IDs não aparecem em nenhum pedido neste período são selecionados, indicando que não fizeram compras durante esse mês. Esta consulta é útil para identificar clientes inativos ou menos engajados durante um período específico, permitindo estratégias direcionadas para reengajá-los.

In [None]:
%%sql
select distinct
  u.id
from bigquery-public-data.thelook_ecommerce.users u
left join bigquery-public-data.thelook_ecommerce.orders o on u.id = o.user_id and date(o.created_at) between "2022-12-01" and "2022-12-31"
where o.user_id is null;

# **Ticket Médio de Pedidos**
- O Ticket Médio de Pedidos é uma métrica financeira que representa o valor médio gasto por cliente em cada compra. É calculado dividindo o total de receitas obtidas com vendas pelo número total de pedidos realizados em um determinado período. Essa métrica é útil para entender o comportamento de compra dos clientes, ajudando as empresas a avaliar a eficácia de suas estratégias de preços e promoções, e a planejar ações para aumentar o valor médio das compras.
- Marketing pode selecionar usuários com uma certa faixa especifica para uma campanha especifica.

In [None]:
%%sql
SELECT
  user_id,
  AVG(receita) AS ticket_medio
FROM (
  SELECT
    order_id,
    user_id,
    ROUND(SUM(sale_price), 2) AS receita
  FROM `bigquery-public-data.thelook_ecommerce.order_items`
  WHERE status = 'Complete'
  GROUP BY 1, 2
)
GROUP BY 1
ORDER BY 2 DESC

# **Tempo em dias da data de cadastro até a última compra de cada usuário**
- "Tempo em dias da data de cadastro até a última compra de cada usuário" é uma métrica que calcula o intervalo de tempo entre a data em que um usuário se cadastrou em uma plataforma ou serviço e a data de sua última compra. Essa métrica ajuda a entender o engajamento e a lealdade do cliente ao longo do tempo. Ao identificar usuários que têm longos períodos de atividade ou grandes intervalos entre o cadastro e a última compra, o time de marketing pode direcionar ações ou campanhas para reengajar esses clientes ou recompensar a fidelidade dos que continuam ativos por longos períodos.

In [None]:
%%sql
SELECT
  u.id,
  MAX(timestamp_diff(o.created_at, u.created_at, DAY)) AS dias_ate_ultima_compra
FROM bigquery-public-data.thelook_ecommerce.orders o
JOIN bigquery-public-data.thelook_ecommerce.users u ON u.id = o.user_id
GROUP BY 1
ORDER BY 2 DESC;

# **Tempo em dias entre a primeira e a última compra de cada usuário.**
-
"Tempo em dias entre a primeira e a última compra de cada usuário" é uma métrica que mede o intervalo de tempo decorrido entre a primeira e a última compra realizada por cada cliente. Esta métrica é útil para avaliar o ciclo de vida de compra do cliente dentro de uma empresa. Identificar os clientes com longos períodos entre compras pode ajudar o time de marketing a desenvolver estratégias específicas para aumentar a frequência de compras, reter clientes ativos por mais tempo ou reengajar aqueles que podem estar se distanciando.

In [None]:
%%sql
SELECT
  user_id,
  timestamp_diff(MAX(created_at), MIN(created_at), DAY) AS dias_entre_prim_ult
FROM bigquery-public-data.thelook_ecommerce.orders
GROUP BY 1
ORDER BY 2 DESC;

# **Indentificar usuários com compras recorrentes dentro do mesmo mês (mais de 1 compra).**
- Este indicativo de lealdade e engajamento frequentes pode ser crucial para campanhas de marketing focadas em usuários que demonstram um padrão de compra consistente. Ao segmentar esses clientes, o time de marketing pode criar campanhas personalizadas que incentivem ainda mais compras, aumentando a previsibilidade e eficácia das ações promocionais.

In [None]:
%%sql
SELECT DISTINCT user_id
FROM (
  SELECT
    user_id,
    order_id,
    created_at,
    ROW_NUMBER() OVER (
      PARTITION BY user_id, EXTRACT(YEAR FROM created_at), EXTRACT(MONTH FROM created_at)
      ORDER BY created_at
    ) AS numero_compra
  FROM bigquery-public-data.thelook_ecommerce.orders
) AS T
WHERE numero_compra > 1
ORDER BY user_id;

## **Análise RFM - Segmentação de Clientes:**
A análise RFM é uma técnica de marketing usada para quantificar o valor de um cliente com base em três aspectos específicos do seu comportamento de compra. RFM significa:

- Recência (R): Há quanto tempo o cliente fez a última compra. Clientes que compraram recentemente são mais propensos a comprar novamente em comparação com aqueles que não compram há muito tempo.
- Frequência (F): Com que frequência o cliente compra dentro de um determinado período. Clientes que compram com frequência são considerados mais engajados e valiosos.
- Monetário (M): O valor monetário total gasto pelo cliente. Clientes que gastam mais são vistos como mais valiosos.

A combinação desses três indicadores ajuda as empresas a identificar quais clientes são mais valiosos e a personalizar as estratégias de marketing para diferentes segmentos de clientes, de acordo com suas características de compra.
Por exemplo, um cliente que fez uma compra recentemente, compra com frequência e gasta muito é idealmente o mais valioso para a empresa e provavelmente será o foco de campanhas de marketing intensivas.

**Aqui está um exemplo de query SQL que calcula os scores de Recência, Frequência e Monetário para cada cliente:**

In [None]:
%%sql
WITH Recency AS (
    SELECT
        customer_id,
        MAX(order_date) AS last_purchase
    FROM sales
    GROUP BY customer_id
),

Frequency AS (
    SELECT
        customer_id,
        COUNT(*) AS total_purchases
    FROM sales
    GROUP BY customer_id
),

Monetary AS (
    SELECT
        customer_id,
        SUM(order_value) AS total_spent
    FROM sales
    GROUP BY customer_id
)

SELECT
    R.customer_id,
    R.last_purchase AS recency,
    F.total_purchases AS frequency,
    M.total_spent AS monetary
FROM Recency R
JOIN Frequency F ON R.customer_id = F.customer_id
JOIN Monetary M ON R.customer_id = M.customer_id;

### **Explicação:**

1. Recency: A CTE (Common Table Expression) `Recency` calcula a data mais recente de compra para cada cliente.
2. Frequency: A CTE `Frequency` conta o número total de compras feitas por cada cliente.
3. Monetary: A CTE `Monetary` soma o valor total gasto por cada cliente.
4. Join Final: Essas três CTEs são então combinadas para fornecer um único resultado com `customer_id`, recência (data da última compra), frequência (total de compras) e monetário (total gasto).

Esse SQL te dá uma tabela básica de RFM que você pode usar para segmentar seus clientes e desenvolver estratégias de marketing personalizadas com base em seus comportamentos de compra.

A partir da tabela básica de RFM que criamos anteriormente, podemos segmentar os clientes com base em critérios definidos para Recência, Frequência e Monetário. Aqui está uma abordagem simples para categorizar cada um dos aspectos em três níveis: Alto, Médio e Baixo.

Vamos supor que você tenha calculado ou definido alguns limites para cada categoria com base em sua distribuição de dados ou necessidades de negócios. Por exemplo:

- Recência: Menos dias desde a última compra = mais recente = melhor
  - Alto: até 30 dias
  - Médio: 31 a 90 dias
  - Baixo: mais de 90 dias

- Frequência: Mais compras = melhor
  - Alto: 10 ou mais compras
  - Médio: 4 a 9 compras
  - Baixo: menos de 4 compras

- Monetário: Mais gasto = melhor
  - Alto: mais de R\$500
  - Médio: R\$200 a R\$500
  - Baixo: menos de R\$200

Aqui está uma query SQL que utiliza esses critérios para segmentar os clientes:

### **Explicação:**
- Recency_Score, Frequency_Score, Monetary_Score: Calcula a pontuação de Recência, Frequência e Monetário para cada cliente.
- RFM_Class: Concatena as pontuações de Recência, Frequência e Monetário para criar uma classificação RFM combinada, que pode ser usada para identificar segmentos de clientes de alto valor, médio e baixo.

Essa segmentação ajuda você a entender melhor seus clientes e a otimizar suas estratégias de marketing e comunicação com base no comportamento de compra dos clientes.
Ela permite desenvolver estratégias de marketing personalizadas para cada segmento, como oferecer promoções específicas para aumentar a frequência de compras dos clientes esporádicos ou manter o engajamento dos clientes mais valiosos.

In [None]:
%%sql
WITH RFM AS (
    SELECT
        customer_id,
        MAX(order_date) AS last_purchase,
        COUNT(*) AS total_purchases,
        SUM(order_value) AS total_spent
    FROM sales
    GROUP BY customer_id
),

RFM_Segmentation AS (
    SELECT
        customer_id,
        last_purchase,
        total_purchases,
        total_spent,
        -- Recency Score
        CASE
            WHEN last_purchase >= CURRENT_DATE - INTERVAL '30' DAY THEN 'Alto'
            WHEN last_purchase < CURRENT_DATE - INTERVAL '30' DAY AND last_purchase >= CURRENT_DATE - INTERVAL '90' DAY THEN 'Médio'
            ELSE 'Baixo'
        END AS Recency_Score,
        -- Frequency Score
        CASE
            WHEN total_purchases >= 10 THEN 'Alto'
            WHEN total_purchases >= 4 AND total_purchases < 10 THEN 'Médio'
            ELSE 'Baixo'
        END AS Frequency_Score,
        -- Monetary Score
        CASE
            WHEN total_spent > 500 THEN 'Alto'
            WHEN total_spent BETWEEN 200 AND 500 THEN 'Médio'
            ELSE 'Baixo'
        END AS Monetary_Score
    FROM RFM
)

SELECT
    *,
    Recency_Score,
    Frequency_Score,
    Monetary_Score,
    -- Overall RFM Score
    CONCAT(Recency_Score, Frequency_Score, Monetary_Score) AS RFM_Class
FROM RFM_Segmentation;