## Neste notebook, será feita a análise dos dados do modelo previamente criado.


_Serão dispostas as perguntas e, em seguida, será feita a análise dos dados nas células de modo a respondê-las._ 

_Em seguida, caso seja pertinente, serão feitos comentário sobre os resultados encontrados._

_Obs: Todas as análises feitas sobre os entrevistados cuja idade está entre 15 e 25 anos._


# Sumário das perguntas respondidas neste notebook

###  **1. Percentual de Católicos Romanos em relação às outras religiões declaradas.**

 _1.1  Houve crescimento percentual de Católicos Romanos, ao longo das waves analisadas?_

_1.2 Qual a variação percentual de Católicos Romanos, entre as waves analisadas? Houve crescimento percentual recente (entre as waves 6 e 7)?_

### **2. Percentual de Católicos Romanos em relação percentual de Protestantes.**

 _2.1 Houve crescimento percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", ao longo das waves analisadas?_

 _2.2 Qual a variação percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", entre as waves analisadas? Houve crescimento percentual recente (entre as waves 6 e 7)?_

### **3. Países em que houve maior crescimento percentual de Católicos Romanos em relação às outras religiões declaradas**

  _3.1 Quais são os 10 países em que houve maior crescimento percentual de Católicos Romanos, ao longo das waves analisadas?_

  _3.2 Quais são os 10 países em que houve maior crescimento percentual recente (entre as waves 6 e 7) de Católicos Romanos?_

### **4. Países em que houve maior crescimento percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes"**

_4.1 Quais são os 10 países em que houve maior crescimento percentual recente (entre as waves 6 e 7) de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", ao longo das waves analisadas?_

## 1. Percentual de Católicos Romanos em relação às outras religiões declaradas.

### 1.1 Houve crescimento percentual de Católicos Romanos, ao longo das waves analisadas?

In [0]:
-- O código abaixo retorna a inclinação da linha de tendência em relação ao crescimento percentual de Católicos Romanos ao longo das waves analisadas, considerando os entrevistados cuja idade está entre 15 e 25 anos.
WITH wave_catholic_pct AS (
  SELECT
    f.wave_chronology,
    COUNT(CASE WHEN f.religion_major_group = 'Roman Catholic' THEN 1 END) * 100.0 / COUNT(*) AS percent_roman_catholic
  FROM mvp_wvs.gold.fact_wave_all f
  LEFT JOIN mvp_wvs.gold.dim_age da
    ON f.age = da.age
  LEFT JOIN mvp_wvs.gold.dim_age_range dar
    ON da.age_range = dar.age_range
  WHERE dar.age_range = '15 - 25 years old'
  GROUP BY f.wave_chronology
)
SELECT
  REGR_SLOPE(percent_roman_catholic, wave_chronology) AS catholic_trend_slope
FROM wave_catholic_pct

**1.1 Comentário**: 

_Uma vez que o resultado obtido foi um número negativo, conclui-se que houve **decrescimento percentual** de Católicos Romanos, cuja idade está entre 15 e 25 anos, ao longo das waves analisadas._

### 1.2 Qual a variação percentual de Católicos Romanos, entre as waves analisadas?

### Houve crescimento percentual recente (entre as waves 6 e 7)?

In [0]:
-- O código abaixo retorna o percentual de Católicos Romanos ao longo das waves analisadas.

  SELECT
  f.wave_chronology,
  COUNT(CASE WHEN f.religion_major_group = 'Roman Catholic' THEN 1 END) AS roman_catholic_count,
  COUNT(*) AS total_count,
  ROUND(
    COUNT(CASE WHEN f.religion_major_group = 'Roman Catholic' THEN 1 END) * 100.0 / COUNT(*), 
    2
  ) AS percent_roman_catholic
FROM mvp_wvs.gold.fact_wave_all f
LEFT JOIN mvp_wvs.gold.dim_age da
  ON f.age = da.age
LEFT JOIN mvp_wvs.gold.dim_age_range dar
  ON da.age_range = dar.age_range
WHERE dar.age_range = '15 - 25 years old'
GROUP BY f.wave_chronology
ORDER BY f.wave_chronology

Databricks visualization. Run in Databricks to view.

**1.2 Comentário:**

_Entre as waves 3 e 4 : decrescimento percentual._

_Entre as waves 4 e 5: crescimento percentual._

_Entre as waves 5 e 6: decrescimento percentual._

_Entre as waves 6 e 7: crescimento percentual._

_Houve **crescimento percentual recente** (entre as waves 6 e 7)_

_O gráfico de linha criado ilustra **visualmente** estas variações._

## 2. Percentual de Católicos Romanos em relação percentual de Protestantes.

### 2.1 Houve crescimento percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", ao longo das waves analisadas?

In [0]:
-- O código abaixo retorna a inclinação da linha de tendência em relação ao crescimento percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes" ao longo das waves analisadas.
WITH wave_catholic_pct AS (
  SELECT
    f.wave_chronology,
    ROUND(
      COUNT(CASE WHEN f.religion_major_group = 'Roman Catholic' THEN 1 END) * 100.0
      / COUNT(CASE WHEN f.religion_major_group IN ('Roman Catholic', 'Protestant') THEN 1 END),
      2
    ) AS percent_catholic
  FROM mvp_wvs.gold.fact_wave_all f
  LEFT JOIN mvp_wvs.gold.dim_age da
    ON f.age = da.age
  LEFT JOIN mvp_wvs.gold.dim_age_range dar
    ON da.age_range = dar.age_range
  WHERE dar.age_range = '15 - 25 years old'
  GROUP BY f.wave_chronology
)
SELECT
  REGR_SLOPE(percent_catholic, wave_chronology) AS catholic_trend_slope
FROM wave_catholic_pct

**2.1 Comentário**: 

_Uma vez que o resultado obtido foi um número negativo, conclui-se que houve **decrescimento percentual** de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes, cuja idade está entre 15 e 25 anos, ao longo das waves analisadas._


### 2.2 Qual a variação percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", entre as waves analisadas?

### Houve crescimento percentual recente (entre as waves 6 e 7)?

In [0]:
-- O código abaixo retorna o percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes" ao longo das waves analisadas.

SELECT
  f.wave_chronology,
  COUNT(CASE 
          WHEN f.religion_major_group = 'Protestant' 
          THEN 1 
        END) AS catholic_count,
  COUNT(CASE 
          WHEN f.religion_major_group IN ('Roman Catholic', 'Protestant') 
          THEN 1 
        END) AS total_count,
  ROUND(
    COUNT(CASE 
            WHEN f.religion_major_group = 'Roman Catholic' 
            THEN 1 
          END) * 100.0 
    / COUNT(CASE 
              WHEN f.religion_major_group IN ('Roman Catholic', 'Protestant') 
              THEN 1 
            END),
    2
  ) AS percent_catholic
FROM mvp_wvs.gold.fact_wave_all f
LEFT JOIN mvp_wvs.gold.dim_age da
  ON f.age = da.age
LEFT JOIN mvp_wvs.gold.dim_age_range dar
  ON da.age_range = dar.age_range
WHERE dar.age_range = '15 - 25 years old'
GROUP BY f.wave_chronology
ORDER BY f.wave_chronology;


Databricks visualization. Run in Databricks to view.

**2.2 Comentário:**

_Entre as waves 3 e 6: decrescimento percentual._

_Entre as waves 6 e 7: crescimento percentual._

_Houve **crescimento percentual recente** (entre as waves 6 e 7)_

_O gráfico de linha criado ilustra **visualmente** estas variações._

## 3. Países em que houve maior crescimento percentual de Católicos Romanos em relação às outras religiões declaradas

### 3.1 Quais são os 10 países em que houve maior crescimento percentual de Católicos Romanos, ao longo das waves analisadas?

In [0]:
-- O código abaixo cria uma visão que ranqueia os 10 países que tiveram maior crescimento percentual de Catolicos Romanos, ao longo das waves analisadas, cujos entrevistados tem idade entre 15 e 25 anos.
CREATE OR REPLACE VIEW mvp_wvs.gold.v_countries_growth_catholicism AS
WITH catholic_pct AS (
    SELECT
        f.country_code,
        f.wave_chronology,
        AVG(
            CASE 
                WHEN f.religion_major_group = 'Roman Catholic' THEN 1 
                ELSE 0 
            END
        ) * 100 AS pct_catholic_15_25
    FROM mvp_wvs.gold.fact_wave_all f
    INNER JOIN mvp_wvs.gold.dim_age da
        ON f.age = da.age
    WHERE
        da.age_range = '15 - 25 years old'
        AND f.wave_chronology IN (3, 4, 5, 6, 7)
    GROUP BY
        f.country_code,
        f.wave_chronology
)
SELECT
    dc.country,
    c.country_code,
    REGR_SLOPE(
        c.pct_catholic_15_25,
        c.wave_chronology
    ) AS catholic_growth_slope
FROM catholic_pct c
INNER JOIN mvp_wvs.gold.dim_country dc
    ON c.country_code = dc.country_code
GROUP BY
    dc.country,
    c.country_code
HAVING COUNT(*) >= 3
ORDER BY catholic_growth_slope DESC
LIMIT 10;

--Por fins estatísticos, o código considera países que participaram pelo menos 3 waves.

In [0]:
-- O código abaixo seleciona os países em questão
select country from mvp_wvs.gold.v_countries_growth_catholicism

### 3.2 Quais são os 10 países em que houve maior crescimento percentual recente ( entre as waves 6 e 7) de Católicos Romanos?

In [0]:
-- O código abaixo cria uma visão que ranqueia os 10 países que tiveram maior crescimento percentual de Catolicos Romanos, entre as waves 6 e 7, cujos entrevistados tem idade entre 15 e 25 anos.
CREATE OR REPLACE VIEW mvp_wvs.gold.countries_growth_catholicism_waves_6_to_7 AS
WITH catholic_pct AS (
    SELECT
        f.country_code,
        f.wave_chronology,
        AVG(
            CASE 
                WHEN f.religion_major_group = 'Roman Catholic' THEN 1 
                ELSE 0 
            END
        ) * 100 AS pct_catholic_15_25
    FROM mvp_wvs.gold.fact_wave_all f
    INNER JOIN mvp_wvs.gold.dim_age da
        ON f.age = da.age
    WHERE
        da.age_range = '15 - 25 years old'
        AND f.wave_chronology >= 5
    GROUP BY
        f.country_code,
        f.wave_chronology
)
SELECT
    dc.country,
    c.country_code,
    REGR_SLOPE(
        c.pct_catholic_15_25,
        c.wave_chronology
    ) AS catholic_growth_slope
FROM catholic_pct c
INNER JOIN mvp_wvs.gold.dim_country dc
    ON c.country_code = dc.country_code
GROUP BY
    dc.country,
    c.country_code
HAVING COUNT(*) >= 3
ORDER BY catholic_growth_slope DESC
LIMIT 10;

In [0]:
-- o código abaixo seleciona os países em questão.
select country from mvp_wvs.gold.countries_growth_catholicism_waves_6_to_7

## 4. Países em que houve maior crescimento percentual de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes"

### 4.1 Quais são os 10 países em que houve maior crescimento percentual recente (entre as waves 6 e 7) de Católicos Romanos em relação ao montante "Católicos Romanos + Protestantes", ao longo das waves analisadas?

In [0]:
-- O código abaixo cria uma visão que ranqueia os 10 países que tiveram maior crescimento percentual de Catolicos Romanos em relação ao montante "Católicos Romanos + Protestantes", entre as waves 6 e 7, cujos entrevistados tem idade entre 15 e 25 anos.

CREATE OR REPLACE VIEW mvp_wvs.gold.view_top_catholicXProtestants AS
WITH catholic_pct AS (
    SELECT
        f.country_code,
        f.wave_chronology,
        SUM(
            CASE 
                WHEN f.religion_major_group = 'Roman Catholic' THEN 1 
                ELSE 0 
            END
        ) * 1.0
        /
        NULLIF(
            SUM(
                CASE 
                    WHEN f.religion_major_group IN ('Roman Catholic', 'Protestant') THEN 1
                    ELSE 0
                END
            ), 0
        ) * 100 AS pct_catholic_15_25
    FROM mvp_wvs.gold.fact_wave_all f
    INNER JOIN mvp_wvs.gold.dim_age da
        ON f.age = da.age
    WHERE
        da.age_range = '15 - 25 years old'
        AND f.wave_chronology >= 5
    GROUP BY
        f.country_code,
        f.wave_chronology
),
top_countries AS (
    SELECT
        dc.country,
        c.country_code,
        REGR_SLOPE(c.pct_catholic_15_25, c.wave_chronology) AS trend_slope,
        COUNT(*) AS n_waves
    FROM catholic_pct c
    INNER JOIN mvp_wvs.gold.dim_country dc
        ON c.country_code = dc.country_code
    GROUP BY
        dc.country,
        c.country_code
    HAVING COUNT(*) >= 3
)
SELECT country
FROM top_countries
ORDER BY trend_slope DESC
LIMIT 10

In [0]:
-- O código abaixo seleciona os países em questão.
select country from mvp_wvs.gold.view_top_catholicXProtestants