# üìä Reposit√≥rio de Consultas SQL para Analistas de Dados: **Departamento Data Insights**
-  üîç Contribui√ß√µes: Estamos abertos a contribui√ß√µes da comunidade de analistas de dados! Se voc√™ tiver consultas SQL √∫teis que gostaria de compartilhar ou sugest√µes para melhorias, sinta-se √† vontade para enviar um pull request. Juntos, podemos expandir e aprimorar este reposit√≥rio para beneficiar toda a comunidade de an√°lise de dados.
- üéØ Sinta-se √† vontade para explorar, utilizar e contribuir para este reposit√≥rio, e que ele possa ser uma ferramenta valiosa em sua jornada como analista de dados!

# **Market Basket Analysis - Crossbasket (An√°lise de Cesta de Compras)**
- A Market Basket Analysis, ou An√°lise de Cesta de Compras, especialmente no contexto de "Crossbasket", √© uma t√©cnica estat√≠stica utilizada para entender as rela√ß√µes entre diferentes produtos comprados pelos clientes durante suas compras. Esta an√°lise examina padr√µes e tend√™ncias de compra, determinando quais itens s√£o frequentemente comprados juntos.

### **Explica√ß√£o da Query:**
- Paired_Products: Esta CTE cria pares de produtos que foram comprados juntos no mesmo pedido. A condi√ß√£o oi1.product_id < oi2.product_id garante que cada combina√ß√£o seja contada apenas uma vez e evita duplicidade.
- Product_Combinations: Agrupa esses pares para contar quantas vezes cada par de produtos foi pedido.
- Total_Orders_Per_Product: Conta quantos pedidos cont√™m cada produto individualmente.
- Consulta Final: Calcula a porcentagem de pedidos contendo o produto menos frequente no par que tamb√©m inclui o outro produto do par. Isso √© feito dividindo o n√∫mero de pedidos que cont√™m ambos os produtos pela quantidade total de pedidos do produto menos comum no par. Os resultados s√£o ordenados por order_count para destacar os pares mais comuns.

üí° Essa an√°lise ajuda a identificar oportunidades para promo√ß√µes cruzadas ou recomenda√ß√µes de produtos baseadas em padr√µes de compra observados, aumentando potencialmente as vendas e a satisfa√ß√£o do cliente ao antecipar suas necessidades.

### **C√°lculo da Porcentagem:**
Na consulta SQL que preparamos, a porcentagem √© calculada da seguinte forma:

Primeiro, identificamos todos os pedidos que cont√™m cada par poss√≠vel de produtos (Produto1 e Produto2) que foram comprados juntos.
Em seguida, contamos o n√∫mero total de pedidos que cont√™m cada um desses produtos individualmente.
A porcentagem √© calculada usando o n√∫mero de pedidos que cont√™m ambos os produtos dividido pelo n√∫mero total de pedidos que cont√™m o produto menos comum no par. Isso √© feito para destacar a for√ßa da associa√ß√£o entre os dois produtos.

### **Explica√ß√£o da "Porcentagem":**
"Produto menos comum no par": Este √© o produto que aparece em menos pedidos entre os dois produtos que estamos comparando. Por exemplo, se o Produto A est√° em 100 pedidos e o Produto B em 150, ent√£o o Produto A √© o "produto menos comum".
C√°lculo da porcentagem: A porcentagem mostra qual fra√ß√£o dos pedidos que cont√™m o produto menos comum tamb√©m cont√™m o outro produto. Se a porcentagem √© alta, isso indica uma forte associa√ß√£o entre os dois produtos no contexto de compras conjuntas.

### **Exemplo Pr√°tico**
*Imagine que:*

- Produto A est√° em 100 pedidos.
- Produto B est√° em 150 pedidos.
- Ambos, Produto A e B, est√£o juntos em 50 pedidos.

*Neste caso:*

Produto A √© o menos comum (100 pedidos vs. 150 pedidos de Produto B).
A porcentagem ser√° (50 / 100) * 100 = 50%.
Isso significa que, dos pedidos que incluem Produto A, 50% tamb√©m incluem Produto B. Esta √© uma m√©trica crucial para entender qu√£o dependente √© a compra do Produto B quando o Produto A √© comprado, indicando uma poss√≠vel recomenda√ß√£o de Produto B para os compradores de Produto A.

üí° Essa an√°lise ajuda a identificar oportunidades para promo√ß√µes cruzadas ou recomenda√ß√µes de produtos baseadas em padr√µes de compra observados, aumentando potencialmente as vendas e a satisfa√ß√£o do cliente ao antecipar suas necessidades.

In [None]:
%%sql
WITH Paired_Products AS (
    SELECT
        oi1.order_id,
        oi1.product_id AS product_id1,
        oi2.product_id AS product_id2
    FROM
        `bigquery-public-data.thelook_ecommerce.order_items` oi1
    JOIN
        `bigquery-public-data.thelook_ecommerce.order_items` oi2
        ON oi1.order_id = oi2.order_id AND oi1.product_id < oi2.product_id
    WHERE
        oi1.status = 'Complete' AND oi2.status = 'Complete'
),
Product_Combinations AS (
    SELECT
        product_id1,
        product_id2,
        COUNT(DISTINCT order_id) AS order_count
    FROM
        Paired_Products
    GROUP BY
        product_id1, product_id2
),
Total_Orders_Per_Product AS (
    SELECT
        product_id,
        COUNT(DISTINCT order_id) AS total_orders
    FROM
        `bigquery-public-data.thelook_ecommerce.order_items`
    WHERE
        status = 'Complete'
    GROUP BY
        product_id
)

SELECT
    pc.product_id1,
    pc.product_id2,
    pc.order_count,
    ROUND((CAST(pc.order_count AS FLOAT64) / MIN(tp.total_orders)) * 100, 2) AS percentage
FROM
    Product_Combinations pc
JOIN
    Total_Orders_Per_Product tp ON pc.product_id1 = tp.product_id OR pc.product_id2 = tp.product_id
GROUP BY
    pc.product_id1, pc.product_id2, pc.order_count
ORDER BY
    pc.order_count DESC;

# **Lifetime Value (LTV) dos Clientes**
- O Lifetime Value (LTV) dos Clientes √© uma m√©trica financeira que estima o valor total de receita ou lucro que um cliente contribui para uma empresa ao longo de todo o seu relacionamento com ela. O LTV calcula n√£o apenas as vendas imediatas, mas tamb√©m incorpora a proje√ß√£o de todas as futuras transa√ß√µes que o cliente pode realizar. Esta m√©trica √© crucial para empresas entenderem o valor a longo prazo de manter relacionamentos com clientes, auxiliando na decis√£o de quanto investir em aquisi√ß√£o e reten√ß√£o de clientes. Um LTV alto indica um cliente altamente valioso, que justifica investimentos maiores em marketing e servi√ßos para garantir sua satisfa√ß√£o e fidelidade.

In [None]:
%%sql
SELECT
    cliente_id,
    AVG(valor_total) AS ltv
FROM pedidos
GROUP BY cliente_id;

# **Custo de Aquisi√ß√£o de Clientes (CAC)**
- O Custo de Aquisi√ß√£o de Clientes (CAC) √© uma m√©trica financeira que calcula o custo m√©dio envolvido na aquisi√ß√£o de um novo cliente. Ele inclui todos os custos de marketing e vendas divididos pelo n√∫mero de clientes adquiridos durante um per√≠odo espec√≠fico. O CAC √© essencial para avaliar a efic√°cia das estrat√©gias de marketing e vendas de uma empresa, ajudando a entender quanto est√° sendo efetivamente investido para ganhar cada novo cliente. Uma gest√£o eficiente do CAC √© crucial para garantir que a empresa n√£o esteja gastando excessivamente para atrair clientes, mantendo a rentabilidade.

In [None]:
%%sql
SELECT
    DATE_TRUNC('month', data_cadastro) AS mes,
    SUM(custo_campanhas + custo_vendas) / COUNT(DISTINCT cliente_id) AS cac_mensal
FROM clientes
GROUP BY mes
ORDER BY mes;

# **Taxa de Engajamento nas Redes Sociais**
- A Taxa de Engajamento nas Redes Sociais √© uma m√©trica que mede a intera√ß√£o dos usu√°rios com o conte√∫do publicado em plataformas de m√≠dia social. Ela √© calculada com base no n√∫mero de intera√ß√µes ativas que o conte√∫do recebe, como curtidas, coment√°rios, compartilhamentos e visualiza√ß√µes, dividido pelo n√∫mero total de seguidores ou alcance do post. Essa taxa √© um indicador importante da relev√¢ncia e do impacto do conte√∫do, mostrando o quanto ele √© capaz de envolver e atrair a aten√ß√£o dos usu√°rios.

In [None]:
%%sql
SELECT (Intera√ß√µes / Seguidores) AS Engajamento
FROM redes_sociais
WHERE plataforma = 'Instagram'
AND data_postagem BETWEEN '2024-01-01' AND '2024-03-31';

# **Tempo M√©dio de Resposta (MTTR)**
- Tempo M√©dio de Resposta (MTTR) √© uma m√©trica que indica o tempo m√©dio que leva para resolver problemas t√©cnicos ou responder a solicita√ß√µes dos clientes ap√≥s eles serem identificados. √â essencial para avaliar a efici√™ncia de equipes de suporte e manuten√ß√£o.

In [None]:
%%sql
SELECT AVG(TIMESTAMPDIFF(MINUTE, created_at, resolved_at)) AS tempo_medio_resolucao
FROM tickets_suporte
WHERE resolved_at IS NOT NULL AND data BETWEEN '2024-04-01' AND '2024-04-30';

# **Taxa de Reten√ß√£o de Usu√°rios**
- A Taxa de Reten√ß√£o de Clientes √© uma m√©trica que mede a porcentagem de clientes que retornam para fazer pedidos novamente ou renovam suas assinaturas em um determinado per√≠odo. Essencialmente, ela reflete o sucesso de uma empresa em manter seus clientes engajados e satisfeitos ao longo do tempo. Uma alta taxa de reten√ß√£o √© geralmente um indicador de boa sa√∫de do cliente e da efic√°cia das estrat√©gias de relacionamento e fideliza√ß√£o da empresa.

üìã **Explica√ß√£o da Query:**

- pedidos_mensais √© um CTE (Common Table Expression) que agrupa pedidos por usu√°rio e m√™s/ano, para identificar em quais meses os usu√°rios estiveram ativos.
- clientes_retidos √© outro CTE que junta os dados do mesmo usu√°rio entre dois meses consecutivos, verificando se o cliente que fez um pedido em um m√™s tamb√©m fez no seguinte.
- A query final seleciona o ano e m√™s de in√≠cio, conta o total de clientes √∫nicos e quantos desses foram retidos no m√™s seguinte.
- Calcula a taxa de reten√ß√£o como a propor√ß√£o de clientes retidos em rela√ß√£o ao total de clientes do m√™s anterior.

Ajuste as colunas e a l√≥gica conforme necess√°rio para se alinhar com a estrutura e as necessidades espec√≠ficas de seus dados.

In [None]:
%%sql
-- Suponha que temos uma tabela chamada 'pedidos' com colunas 'id_usuario' e 'data_pedido'
WITH pedidos_mensais AS (
    SELECT
        id_usuario,
        EXTRACT(YEAR FROM data_pedido) AS ano,
        EXTRACT(MONTH FROM data_pedido) AS mes
    FROM
        pedidos
    GROUP BY
        id_usuario, ano, mes
),

clientes_retidos AS (
    SELECT
        a.id_usuario,
        a.ano AS ano_inicio,
        a.mes AS mes_inicio,
        b.ano AS ano_retido,
        b.mes AS mes_retido
    FROM
        pedidos_mensais a
    JOIN
        pedidos_mensais b ON a.id_usuario = b.id_usuario
    WHERE
        (b.ano > a.ano OR (b.ano = a.ano AND b.mes = a.mes + 1))
)

SELECT
    ano_inicio,
    mes_inicio,
    COUNT(DISTINCT id_usuario) AS total_clientes,
    COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) AS clientes_retidos,
    ROUND((COUNT(DISTINCT id_usuario) FILTER (WHERE ano_retido IS NOT NULL AND mes_retido IS NOT NULL) * 100.0) / COUNT(DISTINCT id_usuario), 2) AS taxa_retencao
FROM
    clientes_retidos
GROUP BY
    ano_inicio, mes_inicio
ORDER BY
    ano_inicio, mes_inicio;

# **An√°lise de Cohort**
- Agrupa os clientes com base em caracter√≠sticas semelhantes para analisar seu comportamento ao longo do tempo.

In [None]:
%%sql
-- Em Desenvolvimento

# **Taxa de Churn**
- Mede a propor√ß√£o de clientes que cancelam ou n√£o renovam seus servi√ßos em um determinado per√≠odo de tempo.

In [None]:
%%sql
-- Em Desenvolvimento