# 📊 Repositório de Consultas SQL para Analistas de Dados: **Departamento de Marketing**
- O Departamento de Marketing é essencial em qualquer organização, focando em criar, comunicar, entregar e trocar ofertas que têm valor para clientes, parceiros e a sociedade em geral.Ele é um pilar central para o sucesso de uma empresa, envolvendo-se em quase todos os aspectos que conectam a empresa ao seu cliente final.   
- 🔍 Contribuições: Estamos abertos a contribuições da comunidade de analistas de dados! Se você tiver consultas SQL úteis que gostaria de compartilhar ou sugestões para melhorias, sinta-se à vontade para enviar um pull request. Juntos, podemos expandir e aprimorar este repositório para beneficiar toda a comunidade de análise de dados.
- 🎯 Sinta-se à vontade para explorar, utilizar e contribuir para este repositório, e que ele possa ser uma ferramenta valiosa em sua jornada como analista de dados!

# 📌 **Custo por Clique (CPC) de Campanhas**
- O Custo por Clique (CPC) é uma métrica usada em campanhas de publicidade digital para medir quanto custa cada clique recebido em um anúncio. Ele é calculado dividindo o custo total da campanha pelo número total de cliques que o anúncio recebeu. Essa métrica é fundamental para avaliar a eficiência e o custo-benefício de campanhas pagas, especialmente em plataformas como Google Ads e redes sociais.

```sql
SELECT (Valor_Gasto_em_Marketing / Cliques) AS CPC
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';
```

# 📌 **CPM (Custo por Mil Impressões)**

**CPM (Custo por Mil Impressões)** é um KPI fundamental para medir a eficiência das campanhas de marketing digital. Representa o custo que o anunciante paga por cada mil impressões de um anúncio. Este KPI é crucial porque ajuda a equipe de marketing a entender o custo de alcançar potenciais clientes e a eficácia de suas estratégias de anúncios pagos.

### Importância do CPM para o Time de Marketing

- **Eficiência de Custo**: Permite avaliar se os investimentos em campanhas estão sendo bem aproveitados.
- **Comparação de Campanhas**: Facilita a comparação de desempenho entre diferentes campanhas.
- **Ajustes Estratégicos**: Ajuda a tomar decisões informadas sobre onde alocar o orçamento de marketing.
- **Monitoramento de Performance**: Oferece insights sobre a eficácia das estratégias de alcance e visibilidade.

### Query SQL para Calcular o CPM

Suponha que você tenha uma tabela `ad_campaigns` com as seguintes colunas:
- `campaign_id` (INT): Identificador da campanha
- `impressions` (INT): Número de impressões do anúncio
- `cost` (DECIMAL): Custo total da campanha

A query SQL para calcular o CPM para cada campanha seria:

```sql
SELECT
    campaign_id,                              -- Identificador único da campanha
    campaign_name,                            -- Nome da campanha (supondo que a coluna exista)
    impressions,                              -- Número de impressões do anúncio
    cost,                                     -- Custo total da campanha
    ROUND((cost / NULLIF(impressions, 0)) * 1000, 2) AS CPM, -- Calcula o Custo por Mil Impressões (CPM) e arredonda para 2 casas decimais
    start_date,                               -- Data de início da campanha (supondo que a coluna exista)
    end_date                                  -- Data de término da campanha (supondo que a coluna exista)
FROM
    ad_campaigns
WHERE
    impressions > 0                           -- Garante que apenas campanhas com impressões sejam consideradas
ORDER BY
    CPM ASC                                   -- Ordena os resultados pelo CPM em ordem crescente

```

### Explicação da Query SQL

- **Selecionar Colunas**: Seleciona as colunas `campaign_id`, `impressions` e `cost` diretamente da tabela `ad_campaigns`.
- **Cálculo do CPM**: O cálculo do CPM é feito dividindo o custo total da campanha pelo número de impressões e multiplicando o resultado por 1000.
- **Filtragem**: A cláusula `WHERE impressions > 0` garante que não haja divisão por zero, evitando erros na query.

### Benefícios da Query

- **Simples e Eficaz**: Fornece um cálculo direto do CPM, facilitando o monitoramento.
- **Escalável**: Pode ser ajustada para incluir mais métricas ou filtros conforme necessário.
- **Informação Acessível**: Permite que o time de marketing obtenha rapidamente insights sobre o custo de suas campanhas em relação ao número de impressões geradas.

Esta query é uma ferramenta essencial para ajudar os profissionais de marketing a otimizar suas campanhas e tomar decisões baseadas em dados, garantindo um melhor retorno sobre o investimento em publicidade.

# 📌 **Custo de Aquisição do Cliente (CAC)**
- O Custo de Aquisição do Cliente (CAC) é uma métrica que calcula o custo total incorrido para adquirir um novo cliente. Isso inclui todos os gastos de marketing e vendas divididos pelo número de clientes adquiridos em um determinado período. O CAC é essencial para avaliar a eficácia das estratégias de marketing e vendas de uma empresa e para garantir que o investimento em aquisição de clientes seja sustentável a longo prazo.

```sql
SELECT (Valor_Gasto_em_Marketing / Novos_Clientes_Adquiridos) AS CAC
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';
```

# 📌 **Retorno sobre o investimento em marketing (ROI)**
- O Retorno sobre o Investimento em Marketing (ROI) é uma métrica usada para avaliar a eficácia e a rentabilidade das despesas em marketing. Ele é calculado pela diferença entre o ganho obtido com as campanhas de marketing e o custo dessas campanhas, dividido pelo custo, geralmente expresso em porcentagem. Esse índice ajuda as empresas a entender quais estratégias de marketing estão gerando mais valor e quais podem precisar de ajustes ou serem descontinuadas.

```sql
SELECT ((Receita_Gerada - Valor_Gasto_em_Marketing) / Valor_Gasto_em_Marketing) AS ROI
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';
```

# 📌 **Taxa de Cliques (CTR)**
- A Taxa de Cliques (CTR, do inglês "Click-Through Rate") é uma métrica que mede a eficácia de um anúncio ou campanha digital, calculando a proporção de usuários que clicam em um anúncio em relação ao número total de visualizações (impressões) que o anúncio recebe. É expressa em porcentagem e indica quão atraente e relevante o anúncio é para o público-alvo. Um CTR alto geralmente sugere que o anúncio está bem otimizado e é eficaz em atrair a atenção dos usuários.

```sql
SELECT (Cliques / Impressões) AS CTR
FROM campanhas_table
WHERE campanha = 'Nome_da_Campanha';
```

# 📌 **Conversão**
- A taxa de conversão é uma métrica crucial em marketing e vendas que mede o percentual de usuários que completam uma ação desejada (como fazer uma compra, se inscrever para um serviço, ou preencher um formulário) em relação ao total de visitantes. Essa taxa é essencial para avaliar a eficiência de campanhas, páginas de destino ou anúncios em converter visitantes em clientes ou leads. Uma alta taxa de conversão indica que as estratégias implementadas estão sendo eficazes em motivar os usuários a realizar ações específicas.

```sql
SELECT
    campanha,                                                    -- Nome da campanha
    COALESCE(pedidos, 0) AS pedidos,                             -- Número de pedidos, substitui nulo por 0
    COALESCE(cliques, 0) AS cliques,                             -- Número de cliques, substitui nulo por 0
    ROUND((COALESCE(pedidos, 0) / NULLIF(COALESCE(cliques, 0), 0)) * 100, 2) AS Conversão -- Calcula a taxa de conversão
FROM
    campanhas_table
WHERE
    campanha = 'Nome_da_Campanha';                               -- Filtra pela campanha específica
```

# 📌 **Taxa de Conversão de Cliques em Pedidos (CCR)**
- A Taxa de Conversão de Cliques em Pedidos (CCR, de "Click-to-Conversion Rate") é uma métrica que mede a eficiência com que os cliques em anúncios ou links se convertem em ações concretas, como pedidos de compra ou subscrições. Ela é calculada dividindo o número de conversões (pedidos) pelo número total de cliques. Essa taxa ajuda a entender o quão bem uma campanha digital está performando em termos de gerar resultados efetivos, além de simplesmente atrair cliques.

```sql
SELECT (COUNT(DISTINCT pedidos) / COUNT(DISTINCT cliques)) AS CCR
FROM cliques_table
WHERE campanha = 'Nome_da_Campanha';
```







# 📌 **Taxa de Retenção de Clientes**
- A Taxa de Retenção de Clientes é uma métrica que mede a porcentagem de clientes que retornam para fazer pedidos novamente ou renovam suas assinaturas em um determinado período. Essencialmente, ela reflete o sucesso de uma empresa em manter seus clientes engajados e satisfeitos ao longo do tempo. Uma alta taxa de retenção é geralmente um indicador de boa saúde do cliente e da eficácia das estratégias de relacionamento e fidelização da empresa.

📋 **Explicação da Query:**

- pedidos_mensais é um CTE (Common Table Expression) que agrupa pedidos por usuário e mês/ano, para identificar em quais meses os usuários estiveram ativos.
- clientes_retidos é outro CTE que junta os dados do mesmo usuário entre dois meses consecutivos, verificando se o cliente que fez um pedido em um mês também fez no seguinte.
- A query final seleciona o ano e mês de início, conta o total de clientes únicos e quantos desses foram retidos no mês seguinte.
- Calcula a taxa de retenção como a proporção de clientes retidos em relação ao total de clientes do mês anterior.

Ajuste as colunas e a lógica conforme necessário para se alinhar com a estrutura e as necessidades específicas de seus dados.

```sql
-- Suponha que temos uma tabela chamada 'pedidos' com colunas 'id_usuario' e 'data_pedido'
WITH pedidos_mensais AS (
    SELECT
        id_usuario,
        EXTRACT(YEAR FROM data_pedido) AS ano,
        EXTRACT(MONTH FROM data_pedido) AS mes
    FROM
        pedidos
    GROUP BY
        id_usuario, ano, mes
),

clientes_retidos AS (
    SELECT
        a.id_usuario,
        a.ano AS ano_inicio,
        a.mes AS mes_inicio,
        b.ano AS ano_retido,
        b.mes AS mes_retido
    FROM
        pedidos_mensais a
    JOIN
        pedidos_mensais b ON a.id_usuario = b.id_usuario
    WHERE
        (b.ano > a.ano OR (b.ano = a.ano AND b.mes = a.mes + 1))
)

SELECT
    ano_inicio,
    mes_inicio,
    COUNT(DISTINCT id_usuario) AS total_clientes,
    COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) AS clientes_retidos,
    ROUND((COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) * 100.0) / COUNT(DISTINCT id_usuario), 2) AS taxa_retencao
FROM
    clientes_retidos
GROUP BY
    ano_inicio, mes_inicio
ORDER BY
    ano_inicio, mes_inicio;
```

# 📌 **Custo por Aquisição (CPA)**
- O Custo por Aquisição (CPA) é uma métrica financeira que mede o custo total associado à aquisição de um novo cliente através de esforços de marketing e vendas. Ele é calculado dividindo todos os custos de campanhas de marketing e vendas pelo número de novos clientes adquiridos durante um determinado período. O CPA é crucial para avaliar a eficiência e rentabilidade das estratégias de marketing, ajudando as empresas a entender quanto estão investindo para ganhar cada cliente.

### Importância do CPA para o Time de Marketing

- **Eficiência de Custo**: Permite avaliar se o investimento em campanhas está gerando aquisições de maneira econômica.
- **Avaliação de Desempenho**: Facilita a comparação do desempenho entre diferentes campanhas.
- **Otimização de Orçamento**: Ajuda a decidir onde alocar o orçamento para obter melhores resultados.
- **Decisões Estratégicas**: Oferece insights sobre a eficácia das estratégias de marketing em converter leads em clientes.

### Query SQL para Calcular o CPA

Suponha que você tenha uma tabela `campanhas_table` com as seguintes colunas:
- `campaign_id` (INT): Identificador da campanha
- `cost` (DECIMAL): Custo total da campanha
- `orders` (INT): Número de pedidos ou aquisições

A query SQL para calcular o CPA para cada campanha seria:

```sql
SELECT
    campaign_id,                  -- Identificador único da campanha
    campaign_name,                -- Nome da campanha (supondo que a coluna exista)
    cost,                         -- Custo total da campanha
    orders,                       -- Número de pedidos ou aquisições
    (cost / NULLIF(orders, 0)) AS CPA,  -- Calcula o Custo por Aquisição (CPA), evitando divisão por zero
    start_date,                   -- Data de início da campanha (supondo que a coluna exista)
    end_date                      -- Data de término da campanha (supondo que a coluna exista)
FROM
    campanhas_table
WHERE
    orders > 0                     -- Garante que apenas campanhas com pedidos sejam consideradas
ORDER BY
    CPA ASC                        -- Ordena os resultados pelo CPA em ordem crescente

```

### Explicação da Query SQL

- **Selecionar Colunas**: Seleciona as colunas `campaign_id`, `cost` e `orders` diretamente da tabela `campanhas_table`.
- **Cálculo do CPA**: O cálculo do CPA é feito dividindo o custo total da campanha pelo número de pedidos.
- **Filtragem**: A cláusula `WHERE orders > 0` garante que não haja divisão por zero, evitando erros na query.

### Benefícios da Query

- **Simples e Eficaz**: Fornece um cálculo direto do CPA, facilitando o monitoramento.
- **Escalável**: Pode ser ajustada para incluir mais métricas ou filtros conforme necessário.
- **Informação Acessível**: Permite que o time de marketing obtenha rapidamente insights sobre o custo de suas campanhas em relação ao número de aquisições geradas.

Esta query é uma ferramenta essencial para ajudar os profissionais de marketing a otimizar suas campanhas e tomar decisões baseadas em dados, garantindo um melhor retorno sobre o investimento em publicidade.

# 📌 **CPV (Custo por Visualização)**

**CPV (Custo por Visualização)** é um KPI que mede o custo de cada visualização de um vídeo publicitário. Esse indicador é crucial para campanhas de marketing que utilizam vídeos como principal forma de conteúdo, como anúncios em plataformas de vídeo ou redes sociais. O CPV ajuda a determinar a eficácia e o custo das campanhas de vídeo em atingir e engajar o público-alvo.

### Importância do CPV para o Time de Marketing

- **Eficiência de Custo**: Permite avaliar se o investimento em campanhas de vídeo está sendo bem aproveitado.
- **Engajamento do Público**: Mede o interesse do público-alvo nos vídeos publicitários.
- **Otimização de Campanhas**: Ajuda a identificar quais vídeos estão performando melhor e quais precisam de ajustes.
- **Decisões Informadas**: Facilita a alocação de orçamento para campanhas de vídeo com melhor desempenho.

### Query SQL para Calcular o CPV

Suponha que você tenha uma tabela `video_campaigns` com as seguintes colunas:
- `campaign_id` (INT): Identificador da campanha
- `views` (INT): Número de visualizações do vídeo
- `cost` (DECIMAL): Custo total da campanha

A query SQL para calcular o CPV para cada campanha seria:

```sql
SELECT
    campaign_id,                              -- Identificador único da campanha
    campaign_name,                            -- Nome da campanha (supondo que a coluna exista)
    views,                                    -- Número de visualizações do vídeo
    cost,                                     -- Custo total da campanha
    ROUND((cost / NULLIF(views, 0)), 2) AS CPV, -- Calcula o Custo por Visualização (CPV) e arredonda para 2 casas decimais
    start_date,                               -- Data de início da campanha (supondo que a coluna exista)
    end_date                                  -- Data de término da campanha (supondo que a coluna exista)
FROM
    video_campaigns
WHERE
    views > 0                                 -- Garante que apenas campanhas com visualizações sejam consideradas
ORDER BY
    CPV ASC                                   -- Ordena os resultados pelo CPV em ordem crescente
```

### Explicação da Query SQL

- **Selecionar Colunas**: Seleciona as colunas `campaign_id`, `views` e `cost` diretamente da tabela `video_campaigns`.
- **Cálculo do CPV**: O cálculo do CPV é feito dividindo o custo total da campanha pelo número de visualizações.
- **Filtragem**: A cláusula `WHERE views > 0` garante que não haja divisão por zero, evitando erros na query.

### Benefícios da Query

- **Simples e Eficaz**: Fornece um cálculo direto do CPV, facilitando o monitoramento.
- **Escalável**: Pode ser ajustada para incluir mais métricas ou filtros conforme necessário.
- **Informação Acessível**: Permite que o time de marketing obtenha rapidamente insights sobre o custo de suas campanhas de vídeo em relação ao número de visualizações geradas.

Esta query é uma ferramenta essencial para ajudar os profissionais de marketing a otimizar suas campanhas de vídeo e tomar decisões baseadas em dados, garantindo um melhor retorno sobre o investimento em publicidade de vídeo.

# 📌 **Lifetime Value (LTV) do Cliente**
- O Lifetime Value (LTV) do Cliente é uma métrica financeira que estima o valor total de receita que uma empresa pode esperar de um único cliente ao longo de toda a sua relação com a empresa. O LTV ajuda a entender quanto um cliente vale em termos de receita e é crucial para tomar decisões sobre quanto investir em aquisição e retenção de clientes. Ele permite que as empresas avaliem a lucratividade a longo prazo de suas relações com os clientes e ajustem suas estratégias de marketing e vendas para otimizar esse valor.

```sql
SELECT AVG(valor_total_pedidos) AS LTV
FROM pedidos_table
WHERE data BETWEEN '2023-01-01' AND '2024-01-01';
```

# 📌 **Participação de Produtos Promocionais nas Vendas Totais**
🔍 **Participação de Produtos Promocionais nas Vendas Totais** é um KPI que mede a proporção das vendas totais que é gerada por produtos que estão sendo vendidos como parte de promoções. Este indicador ajuda a entender o impacto de promoções e descontos no volume total de vendas e na geração de receita.

### Importância deste KPI:
- **Avaliação de Estratégias Promocionais:** Ajuda a determinar a eficácia das campanhas promocionais em atrair compras e gerar receita.
- **Impacto na Receita:** Permite analisar como as vendas promocionais contribuem para a receita total, ajudando a avaliar se as promoções estão diluindo a margem de lucro ou efetivamente aumentando o fluxo de caixa.
- **Comportamento do Consumidor:** Fornece insights sobre a resposta dos consumidores às promoções, crucial para ajustar futuras ações de marketing e vendas.

### Exemplo de Query SQL para Analisar a Participação de Produtos Promocionais:
Suponha que você tenha uma tabela `vendas` onde cada venda registra se foi ou não uma venda promocional. Aqui está como você poderia estruturar a query para calcular este KPI:

```sql
SELECT
    EXTRACT(YEAR FROM data_venda) AS ano,
    EXTRACT(MONTH FROM data_venda) AS mes,
    SUM(CASE WHEN promocional THEN preco_venda * quantidade ELSE 0 END) AS receita_promocional,
    SUM(preco_venda * quantidade) AS receita_total,
    (SUM(CASE WHEN promocional THEN preco_venda * quantidade ELSE 0 END) / SUM(preco_venda * quantidade)) * 100 AS percentual_promocional
FROM vendas
GROUP BY ano, mes
ORDER BY ano, mes;
```

### Explicação da Query:
- **EXTRACT(YEAR FROM data_venda)** e **EXTRACT(MONTH FROM data_venda)**: Extraem o ano e o mês da data de venda para agrupar os resultados mensalmente.
- **SUM(CASE WHEN promocional THEN preco_venda * quantidade ELSE 0 END)**: Calcula a receita total gerada por vendas promocionais. O `CASE` é utilizado para somente considerar as vendas marcadas como promocionais.
- **SUM(preco_venda * quantidade)**: Calcula a receita total de todas as vendas no período.
- **(SUM(CASE WHEN promocional THEN preco_venda * quantidade ELSE 0 END) / SUM(preco_venda * quantidade)) * 100**: Calcula a porcentagem da receita total que provém de vendas promocionais.

Este cálculo proporciona uma visão clara sobre o impacto das vendas promocionais na receita total, permitindo que gestores avaliem a eficácia das promoções e ajustem as estratégias conforme necessário.

# 📌 **Taxa de Engajamento nas Redes Sociais**
- A Taxa de Engajamento nas Redes Sociais é uma métrica que mede a interação dos usuários com o conteúdo publicado em plataformas de mídia social. Ela é calculada com base no número de interações ativas que o conteúdo recebe, como curtidas, comentários, compartilhamentos e visualizações, dividido pelo número total de seguidores ou alcance do post. Essa taxa é um indicador importante da relevância e do impacto do conteúdo, mostrando o quanto ele é capaz de envolver e atrair a atenção dos usuários.

```sql
SELECT (Interações / Seguidores) AS Engajamento
FROM redes_sociais
WHERE plataforma = 'Instagram'
AND data_postagem BETWEEN '2024-01-01' AND '2024-03-31';
```

# 📌 **Vendas totais por campanha (GMV)**
- O GMV (Gross Merchandise Volume) refere-se ao volume total de vendas gerado por uma campanha ou plataforma durante um período específico, medido pelo valor total de bens vendidos. Essa métrica é frequentemente usada no comércio eletrônico para avaliar o desempenho de campanhas de marketing ou da plataforma como um todo, indicando o valor monetário total das transações realizadas, antes da dedução de quaisquer descontos, devoluções ou custos associados.

```sql
SELECT campanha, SUM(valor_total_pedidos) AS GMV
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
GROUP BY campanha;
```

# 📌 **Número de pedidos**
- O Número de Pedidos é uma métrica que conta o total de transações ou pedidos concluídos pelos clientes em um período específico. Essa métrica é essencial para negócios de e-commerce, restaurantes, ou qualquer serviço que processa vendas e pedidos, permitindo avaliar a quantidade de atividade comercial e a demanda pelos produtos ou serviços oferecidos pela empresa. É uma medida fundamental para análise de desempenho e planejamento operacional.

```sql
SELECT campanha, COUNT(DISTINCT order_id) AS Num_Pedidos
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
GROUP BY campanha;
```

# 📌 **Número de Clientes por Campanha**
- O "Número de Clientes por Campanha" é uma métrica que indica quantos clientes distintos fizeram pedidos durante uma campanha promocional específica. Essa métrica é utilizada para avaliar o alcance e a eficácia de uma campanha em atrair clientes diferentes, ajudando a entender a capacidade da campanha de engajar novos ou retornar clientes e gerar vendas. É particularmente útil para medir a penetração de mercado e a resposta do cliente às iniciativas de marketing.

```sql
SELECT COUNT(DISTINCT cliente_id) AS Num_Clientes
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha';
```

# 📌 **Vendas por segmentação de parte do dia**
- "Vendas por segmentação de parte do dia" é uma métrica que divide e calcula as vendas de acordo com diferentes segmentos do dia, como Manhã, Meio-dia, Anoitecer/Final da Tarde, Noite e De manhã cedo. Essa análise ajuda a identificar quais períodos do dia são mais lucrativos ou têm maior atividade de vendas, permitindo às empresas otimizar suas operações, promoções e estratégias de marketing com base nos padrões de compra dos clientes durante esses horários específicos.

```sql
SELECT
    CASE
        WHEN hora > 4 AND hora <= 8 THEN 'Early Morning'
        WHEN hora > 8 AND hora <= 12 THEN 'Morning'
        WHEN hora > 12 AND hora <= 16 THEN 'Afternoon'
        WHEN hora > 16 AND hora <= 20 THEN 'Evening'
        WHEN hora > 20 AND hora <= 24 THEN 'Night'
        WHEN hora <= 4 THEN 'Late Night'
    END AS part_of_day,
    COUNT(DISTINCT order_id) AS Num_Pedidos
FROM pedidos_table
WHERE campanha = 'Nome_da_Campanha'
AND data_pedido BETWEEN '2024-01-01' AND '2024-03-31'
GROUP BY part_of_day;
```

# 📌 **Usuários que não tem compra em dezembro de 2022**
- Usuários cujos IDs não aparecem em nenhum pedido neste período são selecionados, indicando que não fizeram compras durante esse mês. Esta consulta é útil para identificar clientes inativos ou menos engajados durante um período específico, permitindo estratégias direcionadas para reengajá-los.

```sql
select distinct
  u.id
from bigquery-public-data.thelook_ecommerce.users u
left join bigquery-public-data.thelook_ecommerce.orders o on u.id = o.user_id and date(o.created_at) between "2022-12-01" and "2022-12-31"
where o.user_id is null;
```

# 📌 **Ticket Médio de Pedidos**
- O Ticket Médio de Pedidos é uma métrica financeira que representa o valor médio gasto por cliente em cada compra. É calculado dividindo o total de receitas obtidas com vendas pelo número total de pedidos realizados em um determinado período. Essa métrica é útil para entender o comportamento de compra dos clientes, ajudando as empresas a avaliar a eficácia de suas estratégias de preços e promoções, e a planejar ações para aumentar o valor médio das compras.
- Marketing pode selecionar usuários com uma certa faixa especifica para uma campanha especifica.

```sql
SELECT
  user_id,
  AVG(receita) AS ticket_medio
FROM (
  SELECT
    order_id,
    user_id,
    ROUND(SUM(sale_price), 2) AS receita
  FROM `bigquery-public-data.thelook_ecommerce.order_items`
  WHERE status = 'Complete'
  GROUP BY 1, 2
)
GROUP BY 1
ORDER BY 2 DESC
```

# 📌 **Tempo em dias da data de cadastro até a última compra de cada usuário**
- "Tempo em dias da data de cadastro até a última compra de cada usuário" é uma métrica que calcula o intervalo de tempo entre a data em que um usuário se cadastrou em uma plataforma ou serviço e a data de sua última compra. Essa métrica ajuda a entender o engajamento e a lealdade do cliente ao longo do tempo. Ao identificar usuários que têm longos períodos de atividade ou grandes intervalos entre o cadastro e a última compra, o time de marketing pode direcionar ações ou campanhas para reengajar esses clientes ou recompensar a fidelidade dos que continuam ativos por longos períodos.

```sql
SELECT
  u.id,
  MAX(timestamp_diff(o.created_at, u.created_at, DAY)) AS dias_ate_ultima_compra
FROM bigquery-public-data.thelook_ecommerce.orders o
JOIN bigquery-public-data.thelook_ecommerce.users u ON u.id = o.user_id
GROUP BY 1
ORDER BY 2 DESC;
```

# 📌 **Tempo em dias entre a primeira e a última compra de cada usuário.**
-
"Tempo em dias entre a primeira e a última compra de cada usuário" é uma métrica que mede o intervalo de tempo decorrido entre a primeira e a última compra realizada por cada cliente. Esta métrica é útil para avaliar o ciclo de vida de compra do cliente dentro de uma empresa. Identificar os clientes com longos períodos entre compras pode ajudar o time de marketing a desenvolver estratégias específicas para aumentar a frequência de compras, reter clientes ativos por mais tempo ou reengajar aqueles que podem estar se distanciando.

```sql
SELECT
  user_id,
  timestamp_diff(MAX(created_at), MIN(created_at), DAY) AS dias_entre_prim_ult
FROM bigquery-public-data.thelook_ecommerce.orders
GROUP BY 1
ORDER BY 2 DESC;
```

# 📌 **Campanha de Aniversário**
-
**Descrição:** O sistema de campanha de aniversário envia comunicações personalizadas aos clientes em momentos estratégicos relacionados ao seu aniversário: 10 dias antes, no dia do aniversário e no final do mês para quem ainda não utilizou seu voucher de desconto. Cada comunicação oferece um voucher especial "parabens20" que incentiva o cliente a celebrar seu aniversário realizando uma compra.

**Importância para o Departamento Comercial e Marketing:**
- **Marketing:** Permite criar um momento de conexão emocional com o cliente, aumentando o engajamento e fortalecendo o relacionamento, além de incentivar compras através do voucher de desconto.
- **Empresa:** Aumenta a frequência de compras, gera receita adicional e melhora a percepção da marca ao demonstrar atenção personalizada com seus clientes.

**Explicação das Queries SQL**

**Objetivo das Queries:** Identificar clientes para receber comunicações de aniversário em três momentos distintos:

- Dez dias antes do aniversário
- No dia do aniversário
- No final do mês para quem não utilizou o voucher de aniversário

As queries utilizam dados de clientes como nome, email e data de nascimento para personalizar as comunicações e rastrear conversões específicas de cada campanha.

**1) Query: "10 dias antes do aniversário do cliente"**
```sql
SELECT
    ClientId,
    email,
    'Campanha_Aniversario10DiasAntes' AS campaign_name,
    BirthDate,
    INITCAP(FirstName) AS first_name,
    CONCAT(INITCAP(FirstName), ' ', INITCAP(LastName)) AS name
FROM Customers
WHERE BirthDate IS NOT NULL
  AND (FirstName <> '' AND FirstName IS NOT NULL)
  AND (
    TO_DATE(CONCAT(EXTRACT(YEAR FROM CURRENT_DATE)::TEXT, '-',
    EXTRACT(MONTH FROM BirthDate)::TEXT, '-',
    EXTRACT(DAY FROM BirthDate)::TEXT), 'YYYY-MM-DD')
    = CURRENT_DATE + INTERVAL '10 days'
  );
```

**2) Query: "Dia do aniversário do cliente"**
```sql
SELECT
    ClientId,
    email,
    'Campanha_Aniversario' AS campaign_name,
    BirthDate,
    INITCAP(FirstName) AS first_name,
    CONCAT(INITCAP(FirstName), ' ', INITCAP(LastName)) AS name
FROM Customers
WHERE BirthDate IS NOT NULL
  AND (FirstName <> '' AND FirstName IS NOT NULL)
  AND EXTRACT(MONTH FROM BirthDate) = EXTRACT(MONTH FROM CURRENT_DATE)
  AND EXTRACT(DAY FROM BirthDate) = EXTRACT(DAY FROM CURRENT_DATE);
```

**3) Query: "No fim do mês para todos os aniversariantes daquele mês, em caso de voucher não usado"**
```sql
SELECT
    ClientId,
    email,
    'Campanha_AniversarioMes' AS campaign_name,
    BirthDate,
    INITCAP(FirstName) AS cf_first_name,
    CONCAT(INITCAP(FirstName), ' ', INITCAP(LastName)) AS name
FROM Customers
WHERE BirthDate IS NOT NULL
  AND (FirstName <> '' AND FirstName IS NOT NULL)
  AND EXTRACT(MONTH FROM BirthDate) = EXTRACT(MONTH FROM CURRENT_DATE)
  AND UserId NOT IN (
    SELECT DISTINCT UserId FROM Orders
    WHERE insert_date >= CURRENT_DATE - INTERVAL '40 days'
    AND LOWER((Extras->>'coupon')) LIKE '%parabens20%'
);
```


# 📌 **Indentificar clientes com compras recorrentes dentro do mesmo mês (mais de 1 compra).**
- Este indicativo de lealdade e engajamento frequentes pode ser crucial para campanhas de marketing focadas em clientes que demonstram um padrão de compra consistente. Ao segmentar esses clientes, o time de marketing pode criar campanhas personalizadas que incentivem ainda mais compras, aumentando a previsibilidade e eficácia das ações promocionais.

```sql
SELECT DISTINCT user_id
FROM (
  SELECT
    user_id,
    order_id,
    created_at,
    ROW_NUMBER() OVER (
      PARTITION BY user_id, EXTRACT(YEAR FROM created_at), EXTRACT(MONTH FROM created_at)
      ORDER BY created_at
    ) AS numero_compra
  FROM bigquery-public-data.thelook_ecommerce.orders
) AS T
WHERE numero_compra > 1
ORDER BY user_id;
```


# 📌 **Identificar clientes que fizeram pedidos acima da média**
**Objetivo:**
- A estratégia de identificar clientes que realizaram pedidos com valores acima da média envolve analisar os dados de compra para encontrar os consumidores que gastam mais do que a média geral. Esse grupo de clientes é considerado de alto valor, pois eles contribuem de forma significativa para a receita da empresa. Ao focar nesses clientes, as empresas podem desenvolver campanhas de marketing personalizadas, criar programas de fidelidade exclusivos e oferecer promoções especiais para incentivar a repetição de compras e aumentar a lealdade. Esta abordagem não apenas maximiza o retorno sobre investimento (ROI), mas também ajuda a compreender melhor os padrões de comportamento de consumo, permitindo decisões estratégicas mais informadas e eficazes.

**Importância para o Departamento Comercial e Marketing:**

- **🎯 Identificação de Clientes Valiosos:**
  - A query permite que o departamento comercial identifique clientes que gastam mais do que a média. Esses clientes são frequentemente os mais valiosos para a empresa, representando uma parcela significativa da receita.

- **📈 Estratégias de Retenção:**
  - Com esses dados, o departamento de marketing pode criar estratégias de retenção específicas para esses clientes, como programas de fidelidade, ofertas exclusivas e promoções especiais, visando manter e aumentar a satisfação e lealdade desses consumidores.

- **💡 Personalização de Campanhas:**
  - Ao entender quem são os clientes que fazem pedidos de maior valor, a empresa pode personalizar suas campanhas de marketing, direcionando mensagens mais relevantes e ofertas especiais para esse público específico.

- **🚀 Aumento da Receita:**
  - Focar nos clientes que já demonstram um alto valor de vida útil pode ser uma maneira eficaz de aumentar a receita. Oferecendo produtos premium ou serviços adicionais para esses clientes pode maximizar o valor de cada cliente.

- **📊 Análise de Comportamento:**
  - A análise desses dados permite que a empresa compreenda melhor o comportamento de compra dos clientes que gastam mais, ajudando a identificar padrões e tendências que podem ser explorados para otimizar a estratégia de negócios.

```sql
WITH AvgOrderAmount AS (
    SELECT AVG(orders_amount) AS avg_amount
    FROM orders
),
HighValueOrders AS (
    SELECT customer_id
    FROM orders
    WHERE orders_amount > (SELECT avg_amount FROM AvgOrderAmount)
)
SELECT id, name, email
FROM customers
WHERE id IN (SELECT customer_id FROM HighValueOrders);

```

Utilizar essa query regularmente pode ajudar a empresa a manter um relacionamento próximo com seus melhores clientes, impulsionar as vendas e garantir uma vantagem competitiva no mercado.

# 📌 **Segmentação de Clientes em Quintis**

**Objetivo:**
- A "Segmentação de Clientes em Quintis" é uma técnica analítica usada para dividir a base de clientes de uma empresa em cinco grupos (quintis) com base no valor econômico que cada cliente traz para a empresa. Essa segmentação ajuda a entender melhor a distribuição dos clientes em termos de valor gerado.

#### Importância da Segmentação de Clientes em Quintis:

🎯 **Alocação Eficiente de Recursos:** Permite que as empresas concentrem seus recursos e esforços de marketing nos clientes mais valiosos. Isso ajuda a maximizar o retorno sobre investimento (ROI) em campanhas de marketing e outras iniciativas de engajamento de clientes.

🚀 **Personalização de Estratégias de Comunicação:** Compreender o valor de diferentes segmentos de clientes possibilita a criação de mensagens e ofertas personalizadas. Por exemplo, clientes de alto valor podem receber tratamento VIP e ofertas exclusivas, enquanto novos clientes com alto potencial podem ser alvo de esforços intensivos de aquisição e retenção.

🔍 **Detecção de Oportunidades de Upselling e Cross-selling:** Clientes que já demonstram um alto valor são muitas vezes mais receptivos a ofertas de produtos ou serviços adicionais, o que pode aumentar ainda mais seu valor para a empresa.

⚖️ **Gerenciamento de Riscos e Retenção:** Identificar clientes com alto valor mas alta propensidade ao churn (cancelamento) permite ações proativas para reter esses clientes, equilibrando assim o risco de perder importantes fontes de receita.

📊 **Otimização de Produtos e Serviços:** O entendimento de quais clientes geram mais valor pode influenciar decisões de desenvolvimento e ajuste de produtos ou serviços, assegurando que as ofertas estejam alinhadas com as necessidades e preferências dos segmentos mais lucrativos.

🔄 **Melhoria Contínua:** A segmentação por valor do cliente oferece uma base para análises contínuas. À medida que os dados sobre o comportamento do cliente são atualizados, as empresas podem ajustar suas estratégias para refletir mudanças no mercado ou nas preferências dos clientes.

Em resumo, a segmentação por valor do cliente é crucial para maximizar a eficiência das operações comerciais, personalizar a experiência do cliente, e direcionar estratégias de crescimento de forma mais informada e eficaz.

### Query SQL para Segmentação de Clientes em Quintis

```sql
WITH customer_total_purchases AS (
    SELECT
        c.customer_id,
        c.company_name,
        SUM(od.unit_price * od.quantity * (1.0 - od.discount)) AS total_purchases
    FROM
        customers c
    INNER JOIN
        orders o ON c.customer_id = o.customer_id
    INNER JOIN
        order_details od ON od.order_id = o.order_id
    GROUP BY
        c.customer_id, c.company_name
)

SELECT
    customer_id,
    company_name,
    total_purchases,
    NTILE(5) OVER (ORDER BY total_purchases DESC) AS customer_segment
FROM
    customer_total_purchases
ORDER BY
    customer_segment, total_purchases DESC;
```

### Explicação da Query SQL

1. **CTE (Common Table Expression) - `customer_total_purchases`:**
   - **Seleciona:** IDs e nomes das empresas dos clientes.
   - **Calcula:** O valor total das compras (soma do preço unitário multiplicado pela quantidade e pelo desconto) para cada cliente.
   - **Agrupa:** Os resultados pelo ID e nome da empresa do cliente.

2. **Query Principal:**
   - **Seleciona:** O ID do cliente, nome da empresa e total de compras da CTE.
   - **Segmenta:** Utiliza a função `NTILE(5)` para dividir os clientes em 5 grupos baseados no total de compras, ordenando de forma decrescente.
   - **Ordena:** Os resultados pelo segmento do cliente e pelo total de compras em ordem decrescente.

Essa abordagem permite visualizar os clientes segmentados em quintis com base no valor total de compras, proporcionando insights valiosos para a equipe de marketing.

## 📌 **Análise RFM - Segmentação de Clientes:**
A análise RFM é uma técnica de marketing usada para quantificar o valor de um cliente com base em três aspectos específicos do seu comportamento de compra. RFM significa:

- Recência (R): Há quanto tempo o cliente fez a última compra. Clientes que compraram recentemente são mais propensos a comprar novamente em comparação com aqueles que não compram há muito tempo.
- Frequência (F): Com que frequência o cliente compra dentro de um determinado período. Clientes que compram com frequência são considerados mais engajados e valiosos.
- Monetário (M): O valor monetário total gasto pelo cliente. Clientes que gastam mais são vistos como mais valiosos.

A combinação desses três indicadores ajuda as empresas a identificar quais clientes são mais valiosos e a personalizar as estratégias de marketing para diferentes segmentos de clientes, de acordo com suas características de compra.
Por exemplo, um cliente que fez uma compra recentemente, compra com frequência e gasta muito é idealmente o mais valioso para a empresa e provavelmente será o foco de campanhas de marketing intensivas.

**Aqui está um exemplo de query SQL que calcula os scores de Recência, Frequência e Monetário para cada cliente:**

```sql
WITH Recency AS (
    SELECT
        customer_id,
        MAX(order_date) AS last_purchase
    FROM sales
    GROUP BY customer_id
),

Frequency AS (
    SELECT
        customer_id,
        COUNT(*) AS total_purchases
    FROM sales
    GROUP BY customer_id
),

Monetary AS (
    SELECT
        customer_id,
        SUM(order_value) AS total_spent
    FROM sales
    GROUP BY customer_id
)

SELECT
    R.customer_id,
    R.last_purchase AS recency,
    F.total_purchases AS frequency,
    M.total_spent AS monetary
FROM Recency R
JOIN Frequency F ON R.customer_id = F.customer_id
JOIN Monetary M ON R.customer_id = M.customer_id;
```

### **Explicação:**

1. Recency: A CTE (Common Table Expression) `Recency` calcula a data mais recente de compra para cada cliente.
2. Frequency: A CTE `Frequency` conta o número total de compras feitas por cada cliente.
3. Monetary: A CTE `Monetary` soma o valor total gasto por cada cliente.
4. Join Final: Essas três CTEs são então combinadas para fornecer um único resultado com `customer_id`, recência (data da última compra), frequência (total de compras) e monetário (total gasto).

Esse SQL te dá uma tabela básica de RFM que você pode usar para segmentar seus clientes e desenvolver estratégias de marketing personalizadas com base em seus comportamentos de compra.

A partir da tabela básica de RFM que criamos anteriormente, podemos segmentar os clientes com base em critérios definidos para Recência, Frequência e Monetário. Aqui está uma abordagem simples para categorizar cada um dos aspectos em três níveis: Alto, Médio e Baixo.

Vamos supor que você tenha calculado ou definido alguns limites para cada categoria com base em sua distribuição de dados ou necessidades de negócios. Por exemplo:

- Recência: Menos dias desde a última compra = mais recente = melhor
  - Alto: até 30 dias
  - Médio: 31 a 90 dias
  - Baixo: mais de 90 dias

- Frequência: Mais compras = melhor
  - Alto: 10 ou mais compras
  - Médio: 4 a 9 compras
  - Baixo: menos de 4 compras

- Monetário: Mais gasto = melhor
  - Alto: mais de `R$500`
  - Médio: `R$200` a `R$500`
  - Baixo: menos de `R$200`

Aqui está uma query SQL que utiliza esses critérios para segmentar os clientes:

### **Explicação:**
- Recency_Score, Frequency_Score, Monetary_Score: Calcula a pontuação de Recência, Frequência e Monetário para cada cliente.
- RFM_Class: Concatena as pontuações de Recência, Frequência e Monetário para criar uma classificação RFM combinada, que pode ser usada para identificar segmentos de clientes de alto valor, médio e baixo.

Essa segmentação ajuda você a entender melhor seus clientes e a otimizar suas estratégias de marketing e comunicação com base no comportamento de compra dos clientes.
Ela permite desenvolver estratégias de marketing personalizadas para cada segmento, como oferecer promoções específicas para aumentar a frequência de compras dos clientes esporádicos ou manter o engajamento dos clientes mais valiosos.

```sql
WITH RFM AS (
    SELECT
        customer_id,
        MAX(order_date) AS last_purchase,
        COUNT(*) AS total_purchases,
        SUM(order_value) AS total_spent
    FROM sales
    GROUP BY customer_id
),

RFM_Segmentation AS (
    SELECT
        customer_id,
        last_purchase,
        total_purchases,
        total_spent,
        -- Recency Score
        CASE
            WHEN last_purchase >= CURRENT_DATE - INTERVAL '30' DAY THEN 'Alto'
            WHEN last_purchase < CURRENT_DATE - INTERVAL '30' DAY AND last_purchase >= CURRENT_DATE - INTERVAL '90' DAY THEN 'Médio'
            ELSE 'Baixo'
        END AS Recency_Score,
        -- Frequency Score
        CASE
            WHEN total_purchases >= 10 THEN 'Alto'
            WHEN total_purchases >= 4 AND total_purchases < 10 THEN 'Médio'
            ELSE 'Baixo'
        END AS Frequency_Score,
        -- Monetary Score
        CASE
            WHEN total_spent > 500 THEN 'Alto'
            WHEN total_spent BETWEEN 200 AND 500 THEN 'Médio'
            ELSE 'Baixo'
        END AS Monetary_Score
    FROM RFM
)

SELECT
    *,
    Recency_Score,
    Frequency_Score,
    Monetary_Score,
    -- Overall RFM Score
    CONCAT(Recency_Score, Frequency_Score, Monetary_Score) AS RFM_Class
FROM RFM_Segmentation;
```

## 📌 **Segmentação por Valor do Cliente**
A "Segmentação por Valor do Cliente" é uma técnica analítica usada para dividir a base de clientes de uma empresa em grupos com base no valor econômico que cada cliente traz para a empresa. Essa segmentação geralmente envolve o cálculo do Lifetime Value (LTV) de cada cliente, que estima o valor total que um cliente é esperado gerar para a empresa durante o tempo de relacionamento.

### Importância da Segmentação por Valor do Cliente:

🎯 **Alocação Eficiente de Recursos:** Permite que as empresas concentrem seus recursos e esforços de marketing nos clientes mais valiosos. Isso ajuda a maximizar o retorno sobre investimento (ROI) em campanhas de marketing e outras iniciativas de engajamento de clientes.

🚀 **Personalização de Estratégias de Comunicação:** Compreender o valor de diferentes segmentos de clientes possibilita a criação de mensagens e ofertas personalizadas. Por exemplo, clientes de alto valor podem receber tratamento VIP e ofertas exclusivas, enquanto novos clientes com alto potencial podem ser alvo de esforços intensivos de aquisição e retenção.

🔍 **Detecção de Oportunidades de Upselling e Cross-selling:** Clientes que já demonstram um alto LTV são muitas vezes mais receptivos a ofertas de produtos ou serviços adicionais, o que pode aumentar ainda mais seu valor para a empresa.

⚖️ **Gerenciamento de Riscos e Retenção:** Identificar clientes com alto valor mas alta propensidade ao churn (cancelamento) permite ações proativas para reter esses clientes, equilibrando assim o risco de perder importantes fontes de receita.

📊 **Otimização de Produtos e Serviços:** O entendimento de quais clientes geram mais valor pode influenciar decisões de desenvolvimento e ajuste de produtos ou serviços, assegurando que as ofertas estejam alinhadas com as necessidades e preferências dos segmentos mais lucrativos.

🔄 **Melhoria Contínua:** A segmentação por valor do cliente oferece uma base para análises contínuas. À medida que os dados sobre o comportamento do cliente são atualizados, as empresas podem ajustar suas estratégias para refletir mudanças no mercado ou nas preferências dos clientes.

Em resumo, a segmentação por valor do cliente é crucial para maximizar a eficiência das operações comerciais, personalizar a experiência do cliente, e direcionar estratégias de crescimento de forma mais informada e eficaz.

**Abaixo está um exemplo de como você poderia escrever uma query SQL para calcular o LTV e segmentar clientes com base nesse valor:**

```sql
-- Calcular o LTV dos clientes e segmentar com base no valor
WITH historico_compras AS (
    SELECT
        cliente_id,
        SUM(valor_pedido) AS valor_total,
        COUNT(DISTINCT pedido_id) AS total_pedidos_unicos,
        MIN(data_pedido) AS primeira_compra,
        MAX(data_pedido) AS ultima_compra
    FROM
        pedidos
    WHERE
        data_pedido IS NOT NULL
    GROUP BY
        cliente_id
),
ltv_estimado AS (
    SELECT
        cliente_id,
        valor_total,
        total_pedidos_unicos,
        EXTRACT(year FROM AGE(ultima_compra, primeira_compra)) + 1 AS anos_ativos,
        -- Supondo uma margem de lucro de 20% e taxa de desconto de 10% ao ano
        (valor_total * 0.20) / 0.10 AS ltv,
        CASE
            WHEN total_pedidos_unicos / (EXTRACT(year FROM AGE(ultima_compra, primeira_compra)) + 1) > 12 THEN 'Alto Engajamento'
            ELSE 'Engajamento Baixo'
        END AS engajamento
    FROM
        historico_compras
)
SELECT
    cliente_id,
    ltv,
    engajamento,
    CASE
        WHEN ltv > 1000 THEN 'VIP'
        WHEN ltv BETWEEN 500 AND 1000 THEN 'Preferencial'
        WHEN ltv BETWEEN 100 AND 500 THEN 'Padrão'
        ELSE 'Baixo Valor'
    END AS segmento_cliente
FROM
    ltv_estimado
ORDER BY
    ltv DESC;    
```
Aqui está a explicação detalhada da última query SQL, com a segmentação por valor do cliente:

### 1. **historico_compras**
- **Objetivo:** Esta Common Table Expression (CTE) serve como a base para coletar e resumir as informações essenciais sobre as compras de cada cliente. Aqui, consolidamos dados fundamentais que serão utilizados para calcular o Lifetime Value (LTV).
- **Detalhes:** Calculamos o valor total gasto por cliente (`valor_total`), contamos o número de pedidos únicos (`total_pedidos_unicos`), e registramos a data da primeira (`primeira_compra`) e da última compra (`ultima_compra`). Esses dados fornecem uma visão compreensiva da atividade de compra de cada cliente ao longo do tempo.

### 2. **ltv_estimado**
- **Objetivo:** Esta CTE é dedicada ao cálculo do LTV, que é uma estimativa do valor financeiro total que um cliente pode gerar durante seu período de relacionamento com a empresa.
- **Detalhes:**
  - `valor_total`: Utilizamos o total gasto por cada cliente.
  - `total_pedidos_unicos`: A quantidade de pedidos únicos, indicando o engajamento do cliente.
  - `anos_ativos`: Calculamos o número de anos durante os quais o cliente esteve ativo, baseado na diferença entre a primeira e a última compra. Isso ajuda a entender a longevidade do engajamento do cliente.
  - `ltv`: Calculado como `(valor_total * 0.20) / 0.10`, usando uma margem de lucro de 20% e uma taxa de desconto de 10%. Este cálculo transforma o valor total em um valor presente líquido, considerando a margem de lucro e descontando futuras receitas esperadas ao valor presente.
  - `engajamento`: Classifica os clientes como 'Alto Engajamento' ou 'Engajamento Baixo' com base na frequência média de pedidos por ano.
  - \> 12: A condição verifica se a média de pedidos por ano é maior que 12. Se um cliente faz mais de 12 pedidos por ano, ele é classificado como 'Alto Engajamento'. O número 12 aqui pode representar uma política interna da empresa que considera um cliente altamente engajado se ele faz pelo menos um pedido por mês.

### 3. **segmento_cliente**
- **Objetivo:** Esta parte da query categoriza cada cliente em um segmento baseado no seu LTV, permitindo à empresa identificar e diferenciar os tratamentos e estratégias de marketing.
- **Detalhes:**
  - Os clientes são classificados em 'VIP', 'Preferencial', 'Padrão', ou 'Baixo Valor' dependendo do seu LTV calculado. Esta categorização é crucial para direcionar esforços de marketing e vendas de forma eficaz, garantindo que os recursos sejam focados nos clientes de maior valor.
  - `ltv`: Usado como base para a segmentação.
  - A ordem dos clientes por `ltv DESC` ajuda na rápida identificação dos clientes de maior valor no topo da lista.

Essa estrutura de query não só fornece uma métrica valiosa (LTV) para avaliar o valor dos clientes, mas também integra insights comportamentais (engajamento) para uma segmentação mais rica e ação estratégica direcionada.

Esta query é um exemplo básico e pode ser adaptada com critérios mais complexos e específicos, dependendo das necessidades do negócio e da disponibilidade de dados.

# 📌 **Segmentação de Clientes por Classe Social**

- A Segmentação de Clientes por Classe Social é uma análise que categoriza os clientes em diferentes classes sociais (A, B, C, D) com base no modelo de celular que eles utilizam. Essa segmentação é feita com o objetivo de entender melhor o perfil dos clientes e personalizar campanhas de marketing, produtos e serviços de acordo com o poder de compra e preferências de cada segmento.

Para construir uma query de segmentação de clientes por classe social utilizando o modelo do celular do cliente, precisamos seguir alguns passos:

Vamos supor que temos uma tabela `clientes` com as seguintes colunas relevantes:
- `cliente_id`
- `nome`
- `modelo_celular`

Aqui está um exemplo de como essa segmentação pode ser feita:

### Definição das Classes Sociais por Modelo de Celular

- **Classe A:** Modelos mais recentes e caros, como iPhone 15, iPhone 14, Samsung Galaxy S22, etc.
- **Classe B:** Modelos de média-alta, como iPhone 13, Samsung Galaxy S21, etc.
- **Classe C:** Modelos intermediários, como iPhone 12, Samsung Galaxy S20, etc.
- **Classe D:** Modelos antigos e mais baratos, como iPhone 8, Samsung Galaxy S8, etc.

### Query SQL

```sql
WITH class_social AS (
    SELECT
        cliente_id,
        nome,
        modelo_celular,
        CASE
            WHEN modelo_celular IN ('iPhone 15', 'iPhone 14', 'Samsung Galaxy S22', 'Samsung Galaxy S21 Ultra') THEN 'A'
            WHEN modelo_celular IN ('iPhone 13', 'Samsung Galaxy S21', 'Samsung Galaxy S20 Ultra') THEN 'B'
            WHEN modelo_celular IN ('iPhone 12', 'Samsung Galaxy S20', 'Samsung Galaxy S10') THEN 'C'
            WHEN modelo_celular IN ('iPhone 8', 'Samsung Galaxy S8', 'Samsung Galaxy S7') THEN 'D'
            ELSE 'Desconhecida'
        END AS classe_social
    FROM clientes
)
SELECT * FROM class_social;
```

### Importância para o Time de Data Insights e Marketing

🚀 **Segmentação e Personalização:**
- Permite criar campanhas de marketing mais direcionadas e personalizadas para diferentes segmentos de clientes.
- Ajuda a entender melhor o perfil do cliente e adaptar as ofertas e comunicações de acordo com suas preferências e poder de compra.

📊 **Análise de Mercado:**
- Fornece insights valiosos sobre a distribuição de clientes em diferentes classes sociais, ajudando na tomada de decisões estratégicas.
- Permite identificar tendências de consumo e adaptar a estratégia de produto e preços.

💼 **Eficiência Operacional:**
- Melhora a eficiência das campanhas de marketing, aumentando a taxa de conversão e reduzindo custos com publicidade.
- Facilita a alocação de recursos e investimentos para áreas com maior potencial de retorno.

🌐 **Planejamento Estratégico:**
- Contribui para o planejamento de lançamentos de novos produtos e serviços, baseando-se nas necessidades e preferências dos diferentes segmentos de clientes.
- Ajuda a empresa a se posicionar melhor no mercado, atendendo de forma mais eficaz seus consumidores.

Essa segmentação, além de aumentar a efetividade das ações de marketing, também melhora o entendimento do perfil dos clientes, permitindo que a empresa ofereça produtos e serviços mais alinhados às expectativas e necessidades do seu público.

## 📌 **Sistema de Fidelidade: Pontos por Compra**

**Descrição:**
O sistema de fidelidade "Pontos por Compra" é uma estratégia de retenção de clientes onde cada compra realizada pelos clientes acumula pontos que podem ser trocados por descontos, produtos gratuitos ou outros benefícios. Este sistema incentiva os clientes a realizar compras repetidas para acumular mais pontos, aumentando a frequência de compra e o valor gasto por cliente.

**Importância para o Marketing e para a Empresa:**
- **Marketing:** Permite criar campanhas que incentivem a acumulação de pontos, como promoções especiais onde os pontos são dobrados em determinadas datas ou produtos.
- **Empresa:** Aumenta a lealdade e retenção de clientes, elevando o valor de vida do cliente (Customer Lifetime Value - CLV). Clientes fidelizados tendem a comprar mais frequentemente e gastar mais.

### Explicação da Query SQL

**Objetivo da Query:**
Calcular os pontos acumulados por cada cliente em cada mês, permitindo uma análise detalhada da acumulação de pontos ao longo do tempo.

**Query SQL:**
```sql
-- Query para calcular pontos acumulados por cliente por mês
SELECT
    c.customer_id,
    c.customer_name,
    date_trunc('month', o.order_date) AS month,
    SUM(o.order_value) * 10 AS total_points -- supondo que 1 real gasto equivale a 10 pontos
FROM
    customers c
JOIN
    orders o ON c.customer_id = o.customer_id
GROUP BY
    c.customer_id, c.customer_name, month
ORDER BY
    month DESC, total_points DESC;
```

**Componentes da Query:**

1. **Seleção de Colunas:**
   - `c.customer_id`: Identificador único do cliente.
   - `c.customer_name`: Nome do cliente.
   - `date_trunc('month', o.order_date) AS month`: Agrupamento das datas de pedido por mês. A função `date_trunc('month', o.order_date)` retorna o primeiro dia do mês para cada data de pedido, permitindo o agrupamento por mês.
   - `SUM(o.order_value) * 10 AS total_points`: Cálculo dos pontos acumulados por cada cliente em um determinado mês. Neste exemplo, estamos assumindo que cada real gasto equivale a 10 pontos.

2. **Junção das Tabelas:**
   - `JOIN orders o ON c.customer_id = o.customer_id`: Une a tabela `customers` com a tabela `orders` com base no identificador do cliente.

3. **Agrupamento:**
   - `GROUP BY c.customer_id, c.customer_name, month`: Agrupa os dados por cliente e mês, permitindo calcular o total de pontos acumulados por cada cliente em cada mês.

4. **Ordenação:**
   - `ORDER BY month DESC, total_points DESC`: Ordena os resultados primeiro pelo mês em ordem decrescente e depois pelo total de pontos acumulados em ordem decrescente.

### Regra de `total_points`

- **Cálculo dos Pontos:**
  - A regra de `total_points` na query é baseada na suposição de que cada real gasto equivale a 10 pontos.
  - `SUM(o.order_value) * 10` acumula o valor total das compras do cliente em um determinado mês e multiplica por 10 para converter o valor gasto em pontos.

**Exemplo com Dados Fictícios:**

| customer_id | customer_name | order_date  | order_value |
|-------------|---------------|-------------|-------------|
| 1           | João Silva    | 2023-05-14  | 100         |
| 1           | João Silva    | 2023-05-20  | 50          |
| 2           | Maria Souza   | 2023-05-18  | 200         |
| 2           | Maria Souza   | 2023-04-10  | 150         |
| 3           | Pedro Lima    | 2023-05-05  | 300         |
| 3           | Pedro Lima    | 2023-04-25  | 100         |

**Resultado da Query:**

| customer_id | customer_name | month      | total_points |
|-------------|---------------|------------|--------------|
| 3           | Pedro Lima    | 2023-05-01 | 3000         |
| 2           | Maria Souza   | 2023-05-01 | 2000         |
| 1           | João Silva    | 2023-05-01 | 1500         |
| 2           | Maria Souza   | 2023-04-01 | 1500         |
| 3           | Pedro Lima    | 2023-04-01 | 1000         |

Neste exemplo, Pedro Lima acumulou 3000 pontos em maio de 2023, Maria Souza acumulou 2000 pontos no mesmo mês, e João Silva acumulou 1500 pontos. A análise mensal permite entender o comportamento de compra e a acumulação de pontos ao longo do tempo, ajudando a ajustar estratégias de marketing e fidelização.

## 📌 **Segmentação Comportamental**

A segmentação comportamental é uma estratégia de marketing que divide os consumidores em grupos distintos com base em seus comportamentos, como padrões de compra, interações com produtos, uso de serviços, preferências e feedbacks. Essa abordagem permite que as empresas entendam melhor as necessidades e interesses dos clientes, criando campanhas mais personalizadas e eficazes.

**Importância da Segmentação Comportamental para o Marketing Digital**:
- **Personalização de Campanhas**: Permite a criação de campanhas altamente personalizadas que ressoam mais com os clientes, aumentando a relevância das mensagens e a probabilidade de conversão.
- **Melhoria da Experiência do Cliente**: Ao entender os comportamentos e preferências dos clientes, as empresas podem melhorar a experiência do usuário, oferecendo produtos e serviços que atendam às suas expectativas.
- **Aumento da Fidelidade**: Clientes que recebem comunicações e ofertas relevantes são mais propensos a permanecer fiéis à marca, resultando em uma maior retenção de clientes.
- **Otimização de Recursos**: Focar em segmentos específicos permite uma melhor alocação de recursos de marketing, garantindo que os esforços e investimentos sejam direcionados aos clientes com maior potencial de resposta positiva.
- **Aperfeiçoamento das Estratégias de Marketing**: A análise comportamental fornece insights valiosos que podem ser utilizados para aprimorar continuamente as estratégias de marketing, tornando-as mais eficazes ao longo do tempo.

**Exemplos de Segmentação Comportamental**:
1. **Por Categoria de Produto**: Identificação de clientes que compram regularmente determinadas categorias de produtos, permitindo campanhas específicas para esses grupos.
2. **Por Departamento**: Segmentação de clientes com base nos departamentos onde fazem compras, útil em grandes varejistas com múltiplos departamentos.
3. **Por Preferência de Produto**: Identificação de clientes com base nas suas preferências dentro de cada categoria de produto, permitindo uma abordagem ainda mais personalizada.

**Como Funciona na Prática**:
- **Coleta de Dados**: Utiliza dados de compras, navegação no site, interações em redes sociais e feedbacks dos clientes.
- **Análise de Dados**: Ferramentas analíticas são usadas para identificar padrões de comportamento e agrupar clientes com base em critérios específicos.
- **Criação de Segmentos**: Os clientes são agrupados em segmentos distintos com base em seus comportamentos.
- **Implementação de Campanhas**: Campanhas personalizadas são desenvolvidas e direcionadas para cada segmento, utilizando mensagens e ofertas específicas que atendem às necessidades e interesses de cada grupo.

A segmentação comportamental é uma ferramenta poderosa no arsenal do marketing digital, permitindo uma abordagem mais estratégica e focada no cliente, o que pode levar a um aumento significativo na eficácia das campanhas e na satisfação do cliente.

### 1. Segmentação por Categoria de Produto

**Descrição da Segmentação**:
A segmentação por categoria de produto agrupa clientes com base nas categorias de produtos que costumam comprar. Isso permite ao departamento de marketing direcionar campanhas específicas para grupos de clientes com interesses comuns, aumentando a relevância das ofertas e a taxa de conversão.

**Importância para o Departamento de Marketing**:
Essa segmentação é crucial para criar campanhas mais personalizadas e relevantes, o que pode aumentar a lealdade do cliente, melhorar a experiência do cliente e, eventualmente, aumentar as vendas e o ROI das campanhas de marketing.

**Query SQL**:
```sql
-- Query para obter a lista de clientes e as categorias de produtos que compraram
SELECT
    c.customer_id,
    c.customer_name,
    p.category_name,
    COUNT(DISTINCT o.order_id) AS total_purchases
FROM
    customers c
JOIN
    orders o ON c.customer_id = o.customer_id
JOIN
    products p ON o.product_id = p.product_id
WHERE
    o.order_date >= DATEADD(MONTH, -3, CURRENT_DATE)
GROUP BY
    c.customer_id, c.customer_name, p.category_name
HAVING
    COUNT(DISTINCT o.order_id) >= 3
ORDER BY
    total_purchases DESC;
```

**Explicação da Query**:
- A query seleciona clientes, seus nomes, as categorias de produtos que compraram e o número total de compras distintas feitas em cada categoria nos últimos 3 meses.
- Utiliza `JOIN` para combinar tabelas de clientes, pedidos e produtos.
- Filtra os pedidos com `WHERE` para incluir apenas os últimos 3 meses (`order_date >= DATEADD(MONTH, -3, CURRENT_DATE)`).
- Agrupa os resultados por cliente e categoria de produto.
- Utiliza `HAVING` para filtrar clientes que compraram pelo menos 3 vezes (`COUNT(DISTINCT o.order_id) >= 3`).
- Ordena os resultados pelo número total de compras em ordem decrescente.

### 2. Segmentação por Departamento

**Descrição da Segmentação**:
A segmentação por departamento agrupa clientes com base nos departamentos onde realizam suas compras. Isso é útil em grandes lojas de varejo com vários departamentos, permitindo campanhas mais focadas e otimizadas para diferentes seções da loja.

**Importância para o Departamento de Marketing**:
Permite a criação de campanhas específicas para cada departamento, maximizando a relevância das promoções e potencializando o aumento das vendas em departamentos específicos que possam precisar de um impulso de marketing.

**Query SQL**:
```sql
-- Query para obter a lista de clientes e os departamentos onde compraram
SELECT
    c.customer_id,
    c.customer_name,
    d.department_name,
    COUNT(DISTINCT o.order_id) AS total_purchases
FROM
    customers c
JOIN
    orders o ON c.customer_id = o.customer_id
JOIN
    products p ON o.product_id = p.product_id
JOIN
    departments d ON p.department_id = d.department_id
WHERE
    o.order_date >= DATEADD(MONTH, -3, CURRENT_DATE)
GROUP BY
    c.customer_id, c.customer_name, d.department_name
HAVING
    COUNT(DISTINCT o.order_id) >= 3
ORDER BY
    total_purchases DESC;
```

**Explicação da Query**:
- A query seleciona clientes, seus nomes, os departamentos onde compraram e o número total de compras distintas feitas em cada departamento nos últimos 3 meses.
- Utiliza `JOIN` para combinar tabelas de clientes, pedidos, produtos e departamentos.
- Filtra os pedidos com `WHERE` para incluir apenas os últimos 3 meses (`order_date >= DATEADD(MONTH, -3, CURRENT_DATE)`).
- Agrupa os resultados por cliente e departamento.
- Utiliza `HAVING` para filtrar clientes que compraram pelo menos 3 vezes (`COUNT(DISTINCT o.order_id) >= 3`).
- Ordena os resultados pelo número total de compras em ordem decrescente.

### 3. Segmentação por Preferência de Produto

**Descrição da Segmentação**:
A segmentação por preferência de produto identifica clientes com base nas suas preferências dentro de cada categoria de produto. Isso permite um marketing ainda mais refinado, oferecendo produtos específicos que são do interesse dos clientes.

**Importância para o Departamento de Marketing**:
Ajuda a criar campanhas altamente personalizadas, melhorar a precisão das recomendações de produtos e aumentar a satisfação e a fidelidade do cliente, resultando em uma maior taxa de conversão.

**Query SQL**:
```sql
-- Query para obter a lista de clientes e suas preferências de produto
SELECT
    c.customer_id,
    c.customer_name,
    p.product_name,
    p.category_name,
    COUNT(DISTINCT o.order_id) AS total_purchases
FROM
    customers c
JOIN
    orders o ON c.customer_id = o.customer_id
JOIN
    products p ON o.product_id = p.product_id
WHERE
    o.order_date >= DATEADD(MONTH, -3, CURRENT_DATE)
GROUP BY
    c.customer_id, c.customer_name, p.product_name, p.category_name
HAVING
    COUNT(DISTINCT o.order_id) >= 3
ORDER BY
    total_purchases DESC;
```

**Explicação da Query**:
- A query seleciona clientes, seus nomes, os produtos específicos que compraram, as categorias dos produtos e o número total de compras distintas feitas para cada produto nos últimos 3 meses.
- Utiliza `JOIN` para combinar tabelas de clientes, pedidos e produtos.
- Filtra os pedidos com `WHERE` para incluir apenas os últimos 3 meses (`order_date >= DATEADD(MONTH, -3, CURRENT_DATE)`).
- Agrupa os resultados por cliente, produto e categoria de produto.
- Utiliza `HAVING` para filtrar clientes que compraram pelo menos 3 vezes (`COUNT(DISTINCT o.order_id) >= 3`).
- Ordena os resultados pelo número total de compras em ordem decrescente.

---

Essas queries permitem ao departamento de marketing obter uma visão detalhada do comportamento de compra dos clientes, possibilitando a criação de campanhas de marketing mais eficazes e direcionadas.


## 📌 **Sistema de Fidelidade: Nível VIP**

**Descrição:**
O sistema de fidelidade "Nível VIP" categoriza os clientes em diferentes níveis (como bronze, prata e ouro) com base na frequência de compras ou no valor gasto. Cada nível oferece benefícios crescentes, como descontos exclusivos, entregas grátis ou acesso antecipado a promoções. Esse sistema incentiva os clientes a comprarem mais frequentemente e a gastarem mais para alcançar níveis mais altos e obter mais benefícios.

**Importância para o Marketing e para a Empresa:**
- **Marketing:** Permite segmentar os clientes e criar campanhas específicas para cada nível, incentivando os clientes a subir de nível e aumentar a lealdade.
- **Empresa:** Aumenta o engajamento e a satisfação dos clientes, além de promover um aumento nas vendas e no valor médio dos pedidos.

### Explicação da Query SQL

**Objetivo da Query:**
Classificar os clientes nos diferentes níveis VIP com base na frequência de compras e no valor gasto por mês.

**Query SQL:**
```sql
-- Query para classificar clientes nos níveis VIP por mês
WITH purchase_frequency AS (
    SELECT
        customer_id,
        date_trunc('month', order_date) AS month,
        COUNT(order_id) AS total_orders,
        SUM(order_value) AS total_spent
    FROM
        orders
    GROUP BY
        customer_id, month
),
vip_levels AS (
    SELECT
        customer_id,
        month,
        CASE
            WHEN total_orders >= 50 OR total_spent >= 5000 THEN 'Ouro'
            WHEN total_orders >= 30 OR total_spent >= 3000 THEN 'Prata'
            WHEN total_orders >= 10 OR total_spent >= 1000 THEN 'Bronze'
            ELSE 'Regular'
        END AS vip_level
    FROM
        purchase_frequency
)
SELECT
    c.customer_id,
    c.customer_name,
    v.month,
    v.vip_level
FROM
    customers c
JOIN
    vip_levels v ON c.customer_id = v.customer_id
ORDER BY
    v.month DESC, v.vip_level DESC, v.total_spent DESC;
```

**Componentes da Query:**

1. **Subquery purchase_frequency:**
   - Agrupa os dados de pedidos por cliente e mês, calculando o total de pedidos (`total_orders`) e o total gasto (`total_spent`).

2. **Subquery vip_levels:**
   - Classifica os clientes nos níveis VIP (Ouro, Prata, Bronze, Regular) com base no número de pedidos e no valor gasto.

3. **Seleção de Colunas:**
   - `c.customer_id`: Identificador único do cliente.
   - `c.customer_name`: Nome do cliente.
   - `v.month`: Mês de referência.
   - `v.vip_level`: Nível VIP do cliente.

4. **Junção das Tabelas:**
   - `JOIN vip_levels v ON c.customer_id = v.customer_id`: Une a tabela `customers` com a tabela resultante `vip_levels` com base no identificador do cliente.

5. **Ordenação:**
   - `ORDER BY v.month DESC, v.vip_level DESC, v.total_spent DESC`: Ordena os resultados primeiro pelo mês em ordem decrescente, depois pelo nível VIP e finalmente pelo total gasto.

### Dados Fictícios:

| customer_id | customer_name | order_date  | order_value |
|-------------|---------------|-------------|-------------|
| 1           | João Silva    | 2023-05-14  | 100         |
| 1           | João Silva    | 2023-05-20  | 50          |
| 1           | João Silva    | 2023-05-25  | 200         |
| 2           | Maria Souza   | 2023-05-18  | 200         |
| 2           | Maria Souza   | 2023-04-10  | 150         |
| 2           | Maria Souza   | 2023-04-20  | 100         |
| 3           | Pedro Lima    | 2023-05-05  | 300         |
| 3           | Pedro Lima    | 2023-04-25  | 100         |
| 3           | Pedro Lima    | 2023-04-30  | 200         |

**Resultado Final:**

| customer_id | customer_name | month      | vip_level |
|-------------|---------------|------------|-----------|
| 3           | Pedro Lima    | 2023-05-01 | Bronze    |
| 2           | Maria Souza   | 2023-05-01 | Bronze    |
| 1           | João Silva    | 2023-05-01 | Bronze    |
| 2           | Maria Souza   | 2023-04-01 | Bronze    |
| 3           | Pedro Lima    | 2023-04-01 | Bronze    |

**Regras de Nível VIP:**
- **Ouro:** 50 ou mais pedidos ou mais de 5000 reais gastos no mês.
- **Prata:** 30 ou mais pedidos ou mais de 3000 reais gastos no mês.
- **Bronze:** 10 ou mais pedidos ou mais de 1000 reais gastos no mês.
- **Regular:** Menos de 10 pedidos e menos de 1000 reais gastos no mês.

Neste exemplo, todos os clientes alcançaram o nível Bronze em seus respectivos meses devido ao total de pedidos e ao valor gasto. A análise mensal ajuda a entender como os clientes se movem entre os níveis VIP ao longo do tempo, permitindo ajustar as estratégias de marketing e fidelização.