# 📊 Repositório de Consultas SQL para Analistas de Dados: **Departamento Data Insights**
O departamento de data insights, também conhecido como inteligência de dados, é crucial para empresas orientadas por dados. Aqui estão algumas de suas funções principais:

- **Análise de Dados**: Transformar grandes volumes de dados brutos em informações úteis através de técnicas estatísticas e analíticas.
- **Suporte à Decisão**: Fornecer insights que ajudam na tomada de decisões estratégicas, otimizando operações e maximizando resultados.
- **Previsão de Tendências**: Utilizar modelos preditivos para antecipar tendências de mercado, comportamento do consumidor e potenciais riscos ou oportunidades.
- **Personalização**: Ajudar na personalização de produtos e serviços conforme os padrões e preferências identificados nos dados dos clientes.
- **Relatórios e Dashboards**: Desenvolver relatórios interativos e dashboards que facilitam o entendimento dos dados em tempo real para stakeholders diversos.
- **Colaboração Interdepartamental**: Trabalhar em conjunto com outros departamentos, como marketing, vendas e operações, para garantir que os insights de dados sejam integrados em todas as áreas da empresa.

📊 Em resumo, esse departamento é essencial para alavancar dados como um ativo estratégico, apoiando a empresa a se manter competitiva e inovadora no mercado.

- 🔍 Contribuições: Estamos abertos a contribuições da comunidade de analistas de dados! Se você tiver consultas SQL úteis que gostaria de compartilhar ou sugestões para melhorias, sinta-se à vontade para enviar um pull request. Juntos, podemos expandir e aprimorar este repositório para beneficiar toda a comunidade de análise de dados.
- 🎯 Sinta-se à vontade para explorar, utilizar e contribuir para este repositório, e que ele possa ser uma ferramenta valiosa em sua jornada como analista de dados!

# 📌 **Análise IPCA por Período (semanal, mensal e anual)**

**Objetivo**: A query SQL a seguir visa coletar e organizar dados históricos da inflação (IPCA) para análises semanais, mensais e anuais. Esses dados serão utilizados pelo departamento de Data Insights para entender as tendências de inflação, avaliar seu impacto no poder de compra dos consumidores e, consequentemente, na demanda por serviços de entrega de alimentos.

**Importância**:
- **Para o Departamento de Data Insights**: Permite uma análise detalhada das variações de inflação, ajudando a prever mudanças no comportamento do consumidor e ajustar estratégias de marketing e preços.
- **Para a Empresa**: A compreensão das tendências de inflação ajuda a empresa a se preparar para flutuações no mercado, ajustando ofertas e promoções para manter a competitividade e maximizar a receita.

### O que é o IPCA?

**Índice de Preços ao Consumidor Amplo (IPCA)**: O IPCA é o indicador oficial de inflação do Brasil, medido pelo IBGE. Ele reflete a variação dos preços de um conjunto de produtos e serviços consumidos pelas famílias brasileiras, abrangendo itens como alimentação, transporte, habitação, saúde, entre outros. O IPCA é uma medida importante para avaliar o poder de compra dos consumidores, sendo utilizado pelo Banco Central para definir as metas de inflação e ajustar a política monetária do país.

### Estrutura da Query SQL

#### Suposições:
- Os dados da API do IBGE foram carregados em uma tabela `ipca_data` no banco de dados, com as seguintes colunas:
  - `data_referencia` (DATE): Data da medição do IPCA.
  - `valor` (DECIMAL): Valor do IPCA.
  - `localidade` (VARCHAR): Código do município.

### Query SQL

```sql
-- Criação de CTE para calcular as médias semanais
WITH semanal_ipca AS (
    SELECT
        localidade,
        DATE_TRUNC('week', data_referencia) AS semana,
        AVG(valor) AS ipca_semanal
    FROM
        ipca_data
    GROUP BY
        localidade,
        DATE_TRUNC('week', data_referencia)
),

-- Criação de CTE para calcular as médias mensais
mensal_ipca AS (
    SELECT
        localidade,
        DATE_TRUNC('month', data_referencia) AS mes,
        AVG(valor) AS ipca_mensal
    FROM
        ipca_data
    GROUP BY
        localidade,
        DATE_TRUNC('month', data_referencia)
),

-- Criação de CTE para calcular as médias anuais
anual_ipca AS (
    SELECT
        localidade,
        DATE_TRUNC('year', data_referencia) AS ano,
        AVG(valor) AS ipca_anual
    FROM
        ipca_data
    GROUP BY
        localidade,
        DATE_TRUNC('year', data_referencia)
)

-- Unindo os resultados semanais, mensais e anuais
SELECT
    s.localidade,
    s.semana,
    s.ipca_semanal,
    m.mes,
    m.ipca_mensal,
    a.ano,
    a.ipca_anual
FROM
    semanal_ipca s
    LEFT JOIN mensal_ipca m ON s.localidade = m.localidade AND DATE_TRUNC('month', s.semana) = m.mes
    LEFT JOIN anual_ipca a ON s.localidade = a.localidade AND DATE_TRUNC('year', s.semana) = a.ano
ORDER BY
    s.localidade,
    s.semana;
```

### Explicação da Query

1. **Criação de Tabelas Temporárias**:
   - **semanal_ipca**: Calcula a média semanal do IPCA por localidade. Agrupa os dados por localidade e semana, truncando a data para o início da semana.
   - **mensal_ipca**: Calcula a média mensal do IPCA por localidade. Agrupa os dados por localidade e mês, truncando a data para o início do mês.
   - **anual_ipca**: Calcula a média anual do IPCA por localidade. Agrupa os dados por localidade e ano, truncando a data para o início do ano.

2. **Seleção Final**:
   - A query final seleciona os dados das tabelas temporárias, unindo-as pela localidade e correspondência das semanas com os meses e anos truncados. Isso garante que os dados semanais, mensais e anuais sejam combinados corretamente.

3. **Ordenação**:
   - Os resultados são ordenados por localidade e semana, facilitando a análise temporal contínua.

### Importância das Etapas da Query

- **Cálculo das Médias**: Agrupar e calcular as médias semanais, mensais e anuais permite uma análise granular das tendências de inflação em diferentes períodos.
- **Unificação dos Resultados**: Combinar os dados em uma única consulta facilita a visualização e comparação das variações de inflação em diferentes escalas temporais.
- **Preparação para Análises**: Os dados resultantes podem ser utilizados para criar dashboards e relatórios que auxiliem na tomada de decisões estratégicas, como ajustes de preços e campanhas de marketing.

# 📌 **Rendimento Médio Real por Período de Tempo (trimestral, anual)**

**Objetivo**: A query SQL a seguir visa coletar e organizar dados históricos do rendimento médio real habitual das pessoas ocupadas para análises trimestrais e anuais. Esses dados serão utilizados pelo departamento de Data Insights para entender o poder aquisitivo dos consumidores em diferentes regiões, avaliando seu impacto no comportamento de consumo e na demanda por serviços de entrega de alimentos.

**Importância**:
- **Para o Departamento de Data Insights**: Permite uma análise detalhada das variações de rendimento médio real, ajudando a prever mudanças no comportamento do consumidor e ajustar estratégias de marketing e preços.
- **Para a Empresa**: A compreensão das tendências de rendimento médio real ajuda a empresa a se preparar para flutuações no mercado, ajustando ofertas e promoções para manter a competitividade e maximizar a receita.

### Estrutura da Query SQL

#### Suposições:
- Os dados da API do IBGE foram carregados em uma tabela `rendimento_data` no banco de dados, com as seguintes colunas:
  - `data_referencia` (DATE): Data da medição do rendimento.
  - `valor` (DECIMAL): Valor do rendimento médio real.
  - `localidade` (VARCHAR): Código do município.

### Query SQL

```sql
-- Criação de tabela temporária para calcular as médias trimestrais
WITH trimestral_rendimento AS (
    SELECT
        localidade,
        DATE_TRUNC('quarter', data_referencia) AS trimestre,
        AVG(valor) AS rendimento_trimestral
    FROM
        rendimento_data
    GROUP BY
        localidade,
        DATE_TRUNC('quarter', data_referencia)
),

-- Criação de tabela temporária para calcular as médias anuais
anual_rendimento AS (
    SELECT
        localidade,
        DATE_TRUNC('year', data_referencia) AS ano,
        AVG(valor) AS rendimento_anual
    FROM
        rendimento_data
    GROUP BY
        localidade,
        DATE_TRUNC('year', data_referencia)
)

-- Seleção final unindo os resultados trimestrais e anuais
SELECT
    t.localidade,
    t.trimestre,
    t.rendimento_trimestral,
    a.ano,
    a.rendimento_anual
FROM
    trimestral_rendimento t
    LEFT JOIN anual_rendimento a ON t.localidade = a.localidade AND DATE_TRUNC('year', t.trimestre) = a.ano
ORDER BY
    t.localidade,
    t.trimestre;
```

### Explicação da Query

1. **Criação de Tabelas Temporárias**:
   - **trimestral_rendimento**: Calcula a média trimestral do rendimento médio real por localidade. Agrupa os dados por localidade e trimestre, truncando a data para o início do trimestre.
   - **anual_rendimento**: Calcula a média anual do rendimento médio real por localidade. Agrupa os dados por localidade e ano, truncando a data para o início do ano.

2. **Seleção Final**:
   - A query final seleciona os dados das tabelas temporárias, unindo-as pela localidade e correspondência dos trimestres com os anos truncados. Isso garante que os dados trimestrais e anuais sejam combinados corretamente.

3. **Ordenação**:
   - Os resultados são ordenados por localidade e trimestre, facilitando a análise temporal contínua.

### Importância das Etapas da Query

- **Cálculo das Médias**: Agrupar e calcular as médias trimestrais e anuais permite uma análise granular das tendências de rendimento em diferentes períodos.
- **Unificação dos Resultados**: Combinar os dados em uma única consulta facilita a visualização e comparação das variações de rendimento em diferentes escalas temporais.
- **Preparação para Análises**: Os dados resultantes podem ser utilizados para criar dashboards e relatórios que auxiliem na tomada de decisões estratégicas, como ajustes de preços e campanhas de marketing.



# 📌 **Market Basket Analysis - Crossbasket (Análise de Cesta de Compras)**
- A Market Basket Analysis, ou Análise de Cesta de Compras, especialmente no contexto de "Crossbasket", é uma técnica estatística utilizada para entender as relações entre diferentes produtos comprados pelos clientes durante suas compras. Esta análise examina padrões e tendências de compra, determinando quais itens são frequentemente comprados juntos.

### **Explicação da Query:**
- Paired_Products: Esta CTE cria pares de produtos que foram comprados juntos no mesmo pedido. A condição oi1.product_id < oi2.product_id garante que cada combinação seja contada apenas uma vez e evita duplicidade.
- Product_Combinations: Agrupa esses pares para contar quantas vezes cada par de produtos foi pedido.
- Total_Orders_Per_Product: Conta quantos pedidos contêm cada produto individualmente.
- Consulta Final: Calcula a porcentagem de pedidos contendo o produto menos frequente no par que também inclui o outro produto do par. Isso é feito dividindo o número de pedidos que contêm ambos os produtos pela quantidade total de pedidos do produto menos comum no par. Os resultados são ordenados por order_count para destacar os pares mais comuns.

💡 Essa análise ajuda a identificar oportunidades para promoções cruzadas ou recomendações de produtos baseadas em padrões de compra observados, aumentando potencialmente as vendas e a satisfação do cliente ao antecipar suas necessidades.

### **Cálculo da Porcentagem:**
Na consulta SQL que preparamos, a porcentagem é calculada da seguinte forma:

Primeiro, identificamos todos os pedidos que contêm cada par possível de produtos (Produto1 e Produto2) que foram comprados juntos.
Em seguida, contamos o número total de pedidos que contêm cada um desses produtos individualmente.
A porcentagem é calculada usando o número de pedidos que contêm ambos os produtos dividido pelo número total de pedidos que contêm o produto menos comum no par. Isso é feito para destacar a força da associação entre os dois produtos.

### **Explicação da "Porcentagem":**
"Produto menos comum no par": Este é o produto que aparece em menos pedidos entre os dois produtos que estamos comparando. Por exemplo, se o Produto A está em 100 pedidos e o Produto B em 150, então o Produto A é o "produto menos comum".
Cálculo da porcentagem: A porcentagem mostra qual fração dos pedidos que contêm o produto menos comum também contêm o outro produto. Se a porcentagem é alta, isso indica uma forte associação entre os dois produtos no contexto de compras conjuntas.

### **Exemplo Prático**
*Imagine que:*

- Produto A está em 100 pedidos.
- Produto B está em 150 pedidos.
- Ambos, Produto A e B, estão juntos em 50 pedidos.

*Neste caso:*

Produto A é o menos comum (100 pedidos vs. 150 pedidos de Produto B).
A porcentagem será (50 / 100) * 100 = 50%.
Isso significa que, dos pedidos que incluem Produto A, 50% também incluem Produto B. Esta é uma métrica crucial para entender quão dependente é a compra do Produto B quando o Produto A é comprado, indicando uma possível recomendação de Produto B para os compradores de Produto A.

💡 Essa análise ajuda a identificar oportunidades para promoções cruzadas ou recomendações de produtos baseadas em padrões de compra observados, aumentando potencialmente as vendas e a satisfação do cliente ao antecipar suas necessidades.

```sql
WITH Paired_Products AS (
    SELECT
        oi1.order_id,
        oi1.product_id AS product_id1,
        oi2.product_id AS product_id2
    FROM
        `bigquery-public-data.thelook_ecommerce.order_items` oi1
    JOIN
        `bigquery-public-data.thelook_ecommerce.order_items` oi2
        ON oi1.order_id = oi2.order_id AND oi1.product_id < oi2.product_id
    WHERE
        oi1.status = 'Complete' AND oi2.status = 'Complete'
),
Product_Combinations AS (
    SELECT
        product_id1,
        product_id2,
        COUNT(DISTINCT order_id) AS order_count
    FROM
        Paired_Products
    GROUP BY
        product_id1, product_id2
),
Total_Orders_Per_Product AS (
    SELECT
        product_id,
        COUNT(DISTINCT order_id) AS total_orders
    FROM
        `bigquery-public-data.thelook_ecommerce.order_items`
    WHERE
        status = 'Complete'
    GROUP BY
        product_id
)

SELECT
    pc.product_id1,
    pc.product_id2,
    pc.order_count,
    ROUND((CAST(pc.order_count AS FLOAT64) / MIN(tp.total_orders)) * 100, 2) AS percentage
FROM
    Product_Combinations pc
JOIN
    Total_Orders_Per_Product tp ON pc.product_id1 = tp.product_id OR pc.product_id2 = tp.product_id
GROUP BY
    pc.product_id1, pc.product_id2, pc.order_count
ORDER BY
    pc.order_count DESC;
```

# 📌 **Monitoramento de Disponibilidade de SKUs/EANs no catálogo de lojas**
A query tem como objetivo permitir que os gerentes comerciais/operacionais (ou outro profissional) monitorem a disponibilidade de SKUs/EANs no catálogo das lojas. Através desta query SQL, será possível visualizar a porcentagem diária de EANs ativos e não ativos por região, estado, cidade e por categoria de produtos (ex: frios, carnes, águas, refrigerantes).


**Importância dos Dados e Insights:**

- **Monitoramento de Disponibilidade:** A disponibilidade dos produtos no catálogo é crucial para assegurar que os clientes possam encontrar e comprar os produtos desejados. A ausência de produtos pode levar a perda de vendas e insatisfação dos clientes.
  
- **Identificação de Problemas:** Através da análise da disponibilidade dos EANs, os gerentes podem identificar rapidamente problemas na cadeia de suprimentos ou falhas de reposição em lojas específicas, permitindo ações corretivas rápidas.

- **Relacionamento com Vendas:** A análise utilizando esta query permite correlacionar a queda de pedidos de uma indústria com a indisponibilidade de seus produtos. Esta análise ajuda a entender se a diminuição nas vendas está diretamente ligada à falta de produtos no catálogo, permitindo que ações sejam tomadas para resolver a situação.

- **Planejamento Estratégico:** Com insights detalhados sobre quais categorias de produtos estão frequentemente indisponíveis, a empresa pode planejar melhor sua logística, otimizar o estoque e melhorar as negociações com fornecedores.

- **Segmentação Regional:** Analisar a disponibilidade por região, estado e cidade permite entender melhor as necessidades específicas de cada área, ajudando a personalizar estratégias comerciais e de marketing para diferentes mercados.

Esta query fornecerá uma visão clara e detalhada da disponibilidade dos produtos, permitindo aos gerentes tomarem decisões informadas e rápidas para garantir a satisfação dos clientes e otimizar as vendas.

```sql
WITH product_availability AS (
    SELECT
        region,
        state,
        city,
        category,
        sku,
        ean,
        date,
        item_id, -- Supondo que haja um identificador único para cada item
        CASE
            WHEN availability_status = 'in stock' THEN 'active'
            ELSE 'inactive'
        END AS status
    FROM
        product_catalog
    WHERE
        date BETWEEN '2024-01-01' AND '2024-12-31'
),

availability_summary AS (
    SELECT
        region,
        state,
        city,
        category,
        date,
        SUM(CASE WHEN status = 'active' THEN 1 ELSE 0 END) AS active_count,
        SUM(CASE WHEN status = 'inactive' THEN 1 ELSE 0 END) AS inactive_count,
        COUNT(DISTINCT item_id) AS total_count
    FROM
        product_availability
    GROUP BY
        region, state, city, category, date
)

SELECT
    region,
    state,
    city,
    category,
    date,
    ROUND((active_count::decimal / total_count) * 100, 2) AS active_percentage,
    ROUND((inactive_count::decimal / total_count) * 100, 2) AS inactive_percentage
FROM
    availability_summary
ORDER BY
    date, region, state, city, category;
```

### Explicação da Query:

1. **CTE `product_availability`:** Seleciona os dados relevantes do catálogo de produtos, incluindo a região, estado, cidade, categoria, SKU, EAN, data e o identificador único do item (`item_id`). O status é categorizado como 'active' (ativo) se o produto está em estoque e 'inactive' (inativo) caso contrário.

2. **CTE `availability_summary`:** Agrupa os dados por região, estado, cidade, categoria e data, e calcula a contagem de EANs ativos, inativos e o total de EANs distintos (`item_id`) para cada grupo.

3. **Consulta Final:** A consulta final seleciona os dados da CTE `availability_summary` e calcula as porcentagens de EANs ativos e inativos para cada grupo, arredondando os valores para duas casas decimais. Os resultados são ordenados por data, região, estado, cidade e categoria.

# 📌 **Lifetime Value (LTV) dos Clientes**
- O Lifetime Value (LTV) dos Clientes é uma métrica financeira que estima o valor total de receita ou lucro que um cliente contribui para uma empresa ao longo de todo o seu relacionamento com ela. O LTV calcula não apenas as vendas imediatas, mas também incorpora a projeção de todas as futuras transações que o cliente pode realizar. Esta métrica é crucial para empresas entenderem o valor a longo prazo de manter relacionamentos com clientes, auxiliando na decisão de quanto investir em aquisição e retenção de clientes. Um LTV alto indica um cliente altamente valioso, que justifica investimentos maiores em marketing e serviços para garantir sua satisfação e fidelidade.

```sql
SELECT
    cliente_id,
    AVG(valor_total) AS ltv
FROM pedidos
GROUP BY cliente_id;
```

# 📌 **Custo de Aquisição de Clientes (CAC)**
- O Custo de Aquisição de Clientes (CAC) é uma métrica financeira que calcula o custo médio envolvido na aquisição de um novo cliente. Ele inclui todos os custos de marketing e vendas divididos pelo número de clientes adquiridos durante um período específico. O CAC é essencial para avaliar a eficácia das estratégias de marketing e vendas de uma empresa, ajudando a entender quanto está sendo efetivamente investido para ganhar cada novo cliente. Uma gestão eficiente do CAC é crucial para garantir que a empresa não esteja gastando excessivamente para atrair clientes, mantendo a rentabilidade.

```sql
SELECT
    DATE_TRUNC('month', data_cadastro) AS mes,
    SUM(custo_campanhas + custo_vendas) / COUNT(DISTINCT cliente_id) AS cac_mensal
FROM clientes
GROUP BY mes
ORDER BY mes;
```

# 📌 **Taxa de Engajamento nas Redes Sociais**
- A Taxa de Engajamento nas Redes Sociais é uma métrica que mede a interação dos usuários com o conteúdo publicado em plataformas de mídia social. Ela é calculada com base no número de interações ativas que o conteúdo recebe, como curtidas, comentários, compartilhamentos e visualizações, dividido pelo número total de seguidores ou alcance do post. Essa taxa é um indicador importante da relevância e do impacto do conteúdo, mostrando o quanto ele é capaz de envolver e atrair a atenção dos usuários.

```sql
SELECT (Interações / Seguidores) AS Engajamento
FROM redes_sociais
WHERE plataforma = 'Instagram'
AND data_postagem BETWEEN '2024-01-01' AND '2024-03-31';
```

# 📌 **Tempo Médio de Resposta (MTTR)**
- Tempo Médio de Resposta (MTTR) é uma métrica que indica o tempo médio que leva para resolver problemas técnicos ou responder a solicitações dos clientes após eles serem identificados. É essencial para avaliar a eficiência de equipes de suporte e manutenção.

```sql
SELECT AVG(TIMESTAMPDIFF(MINUTE, created_at, resolved_at)) AS tempo_medio_resolucao
FROM tickets_suporte
WHERE resolved_at IS NOT NULL AND data BETWEEN '2024-04-01' AND '2024-04-30';
```

# 📌 **Taxa de Retenção de Usuários**
- A Taxa de Retenção de Clientes é uma métrica que mede a porcentagem de clientes que retornam para fazer pedidos novamente ou renovam suas assinaturas em um determinado período. Essencialmente, ela reflete o sucesso de uma empresa em manter seus clientes engajados e satisfeitos ao longo do tempo. Uma alta taxa de retenção é geralmente um indicador de boa saúde do cliente e da eficácia das estratégias de relacionamento e fidelização da empresa.

📋 **Explicação da Query:**

- pedidos_mensais é um CTE (Common Table Expression) que agrupa pedidos por usuário e mês/ano, para identificar em quais meses os usuários estiveram ativos.
- clientes_retidos é outro CTE que junta os dados do mesmo usuário entre dois meses consecutivos, verificando se o cliente que fez um pedido em um mês também fez no seguinte.
- A query final seleciona o ano e mês de início, conta o total de clientes únicos e quantos desses foram retidos no mês seguinte.
- Calcula a taxa de retenção como a proporção de clientes retidos em relação ao total de clientes do mês anterior.

Ajuste as colunas e a lógica conforme necessário para se alinhar com a estrutura e as necessidades específicas de seus dados.

```sql
-- Suponha que temos uma tabela chamada 'pedidos' com colunas 'id_usuario' e 'data_pedido'
WITH pedidos_mensais AS (
    SELECT
        id_usuario,
        EXTRACT(YEAR FROM data_pedido) AS ano,
        EXTRACT(MONTH FROM data_pedido) AS mes
    FROM
        pedidos
    GROUP BY
        id_usuario, ano, mes
),

clientes_retidos AS (
    SELECT
        a.id_usuario,
        a.ano AS ano_inicio,
        a.mes AS mes_inicio,
        b.ano AS ano_retido,
        b.mes AS mes_retido
    FROM
        pedidos_mensais a
    JOIN
        pedidos_mensais b ON a.id_usuario = b.id_usuario
    WHERE
        (b.ano > a.ano OR (b.ano = a.ano AND b.mes = a.mes + 1))
)

SELECT
    ano_inicio,
    mes_inicio,
    COUNT(DISTINCT id_usuario) AS total_clientes,
    COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) AS clientes_retidos,
    ROUND((COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) * 100.0) / COUNT(DISTINCT id_usuario), 2) AS taxa_retencao
FROM
    clientes_retidos
GROUP BY
    ano_inicio, mes_inicio
ORDER BY
    ano_inicio, mes_inicio;
```

# 📌 **Segmentação de Clientes por Classe Social**

- A Segmentação de Clientes por Classe Social é uma análise que categoriza os clientes em diferentes classes sociais (A, B, C, D) com base no modelo de celular que eles utilizam. Essa segmentação é feita com o objetivo de entender melhor o perfil dos clientes e personalizar campanhas de marketing, produtos e serviços de acordo com o poder de compra e preferências de cada segmento.

Para construir uma query de segmentação de clientes por classe social utilizando o modelo do celular do cliente, precisamos seguir alguns passos:

Vamos supor que temos uma tabela `clientes` com as seguintes colunas relevantes:
- `cliente_id`
- `nome`
- `modelo_celular`

Aqui está um exemplo de como essa segmentação pode ser feita:

### Definição das Classes Sociais por Modelo de Celular

- **Classe A:** Modelos mais recentes e caros, como iPhone 15, iPhone 14, Samsung Galaxy S22, etc.
- **Classe B:** Modelos de média-alta, como iPhone 13, Samsung Galaxy S21, etc.
- **Classe C:** Modelos intermediários, como iPhone 12, Samsung Galaxy S20, etc.
- **Classe D:** Modelos antigos e mais baratos, como iPhone 8, Samsung Galaxy S8, etc.

### Query SQL

```sql
WITH class_social AS (
    SELECT
        cliente_id,
        nome,
        modelo_celular,
        CASE
            WHEN modelo_celular IN ('iPhone 15', 'iPhone 14', 'Samsung Galaxy S22', 'Samsung Galaxy S21 Ultra') THEN 'A'
            WHEN modelo_celular IN ('iPhone 13', 'Samsung Galaxy S21', 'Samsung Galaxy S20 Ultra') THEN 'B'
            WHEN modelo_celular IN ('iPhone 12', 'Samsung Galaxy S20', 'Samsung Galaxy S10') THEN 'C'
            WHEN modelo_celular IN ('iPhone 8', 'Samsung Galaxy S8', 'Samsung Galaxy S7') THEN 'D'
            ELSE 'Desconhecida'
        END AS classe_social
    FROM clientes
)
SELECT * FROM class_social;
```

### Importância para o Time de Data Insights e Marketing

🚀 **Segmentação e Personalização:**
- Permite criar campanhas de marketing mais direcionadas e personalizadas para diferentes segmentos de clientes.
- Ajuda a entender melhor o perfil do cliente e adaptar as ofertas e comunicações de acordo com suas preferências e poder de compra.

📊 **Análise de Mercado:**
- Fornece insights valiosos sobre a distribuição de clientes em diferentes classes sociais, ajudando na tomada de decisões estratégicas.
- Permite identificar tendências de consumo e adaptar a estratégia de produto e preços.

💼 **Eficiência Operacional:**
- Melhora a eficiência das campanhas de marketing, aumentando a taxa de conversão e reduzindo custos com publicidade.
- Facilita a alocação de recursos e investimentos para áreas com maior potencial de retorno.

🌐 **Planejamento Estratégico:**
- Contribui para o planejamento de lançamentos de novos produtos e serviços, baseando-se nas necessidades e preferências dos diferentes segmentos de clientes.
- Ajuda a empresa a se posicionar melhor no mercado, atendendo de forma mais eficaz seus consumidores.

Essa segmentação, além de aumentar a efetividade das ações de marketing, também melhora o entendimento do perfil dos clientes, permitindo que a empresa ofereça produtos e serviços mais alinhados às expectativas e necessidades do seu público.

# 📌 **Análise de Cohort**
- Agrupa os clientes com base em características semelhantes para analisar seu comportamento ao longo do tempo.

```sql
-- Em Desenvolvimento
```

# 📌 **Taxa de Churn**
- Mede a proporção de clientes que cancelam ou não renovam seus serviços em um determinado período de tempo.

```sql
-- Em Desenvolvimento
```