%md

# üé¨ Projeto de An√°lise de Dados - IMDB

## üìä Notebook 5 ‚Äî An√°lise dos Dados e Respostas √†s Perguntas

Neste notebook, realizamos a etapa de **an√°lise explorat√≥ria final** da base de dados tratada. Com os dados j√° estruturados, limpos e organizados em camadas (bronze, silver e gold), aqui buscamos **responder √†s perguntas principais definidas no projeto**.

Cada pergunta ser√° respondida com seu respectivo contexto, ap√≥s a consulta SQL.

------

##Ser√£o 10 t√≥picos abordados. S√£o eles:

- 1 - Os 10 T√≠tulos de Cinema Mais Votados e com Melhores Avalia√ß√µes
- 2 - Diretores com mais Votos e com as Melhores M√©dias de Avalia√ß√£o
- 3 - Os pa√≠ses com o maior n√∫mero de lan√ßamentos de filmes nos √∫ltimos 30 anos
- 4 - Evolu√ß√£o de Lan√ßamentos (Cinema) por D√©cada
- 5 - N√∫mero de Atrizes (√∫nicas) por D√©cada (at√© 2019)
- 6 - Propor√ß√£o Entre Atores (√∫nicos) e Atrizes (√∫nicas) ao Longo das D√©cadas
- 7 - M√©dia de Dura√ß√£o de Tempo dos Filmes ao Longo das D√©cadas 
- 8 - Diretores menos prol√≠ficos com alta m√©dia de avalia√ß√£o
- 9 - G√™neros de Cinema ao Longo das D√©cadas
- 10 - Evolu√ß√£o da Produ√ß√£o de S√©ries de TV (2010‚Äì2024)

## üé¨‚≠ê 1 - Os 10 T√≠tulos de Cinema Mais Votados e com Melhores Avalia√ß√µes


In [0]:
%sql
SELECT
  tb.primaryTitle AS titulo,
  tb.startYear AS ano,
  tr.numVotes AS total_votos,
  tr.averageRating AS avaliacao_media
FROM gold_title_ratings tr
JOIN gold_title_basics tb ON tr.tconst = tb.tconst
WHERE tb.titleType = 'movie'
  AND tr.numVotes IS NOT NULL
  AND tr.averageRating IS NOT NULL
ORDER BY tr.numVotes DESC, tr.averageRating DESC
LIMIT 10;



titulo,ano,total_votos,avaliacao_media
The Shawshank Redemption,1994,3029407,9.3
The Dark Knight,2008,3005759,9.0
Inception,2010,2670355,8.8
Fight Club,1999,2450435,8.8
Forrest Gump,1994,2367616,8.8
Interstellar,2014,2326479,8.7
Pulp Fiction,1994,2324367,8.9
The Matrix,1999,2145889,8.7
The Godfather,1972,2114342,9.2
The Lord of the Rings: The Fellowship of the Ring,2001,2098666,8.9


*An√°lise da consulta SQL estar√° ap√≥s a an√°lise SQL da pergunta 3.

## üé•‚≠ê 2 - Diretores com mais Votos e com as Melhores M√©dias de Avalia√ß√£o


*An√°lise da consulta SQL estar√° ap√≥s a an√°lise SQL da pergunta 3.

In [0]:
%sql
SELECT
  nb.primaryName AS diretor,
  COUNT(tb.tconst) AS total_filmes,
  SUM(tr.numVotes) AS total_votos,
  ROUND(AVG(tr.averageRating), 2) AS media_avaliacao
FROM gold_title_crew tc
JOIN gold_title_basics tb ON tc.tconst = tb.tconst
JOIN gold_title_ratings tr ON tb.tconst = tr.tconst
JOIN gold_name_basics nb ON split(tc.directors, ',')[0] = nb.nconst
WHERE tb.titleType = 'movie'
GROUP BY nb.primaryName
HAVING total_votos > 0
ORDER BY total_votos DESC
LIMIT 10;

diretor,total_filmes,total_votos,media_avaliacao
Christopher Nolan,12,17135654,8.17
Steven Spielberg,35,15049279,7.31
Quentin Tarantino,12,11313974,7.87
Martin Scorsese,38,11102632,7.45
Ridley Scott,29,9558774,6.96
David Fincher,12,9508005,7.58
Peter Jackson,15,9289624,7.7
Robert Zemeckis,22,7843561,6.99
James Cameron,11,6796318,7.28
Tim Burton,20,5963403,6.99


## üé¨üåç 3 - Os pa√≠ses com o maior n√∫mero de lan√ßamentos de filmes nos √∫ltimos 30 anos
Lan√ßamentos gerais, e n√£o propriamente produ√ß√µes originais de cada pa√≠s

In [0]:
%sql
SELECT
  ta.region AS pais,
  COUNT(DISTINCT tb.tconst) AS total_filmes
FROM gold_title_basics tb
JOIN gold_title_akas ta ON tb.tconst = ta.titleId
WHERE tb.titleType = 'movie'
  AND ta.region IS NOT NULL
  AND ta.region NOT IN ('\\N', 'XWW')
  AND tb.startYear >= 1995
GROUP BY ta.region
ORDER BY total_filmes DESC
LIMIT 10;


pais,total_filmes
US,181073
GB,114636
CA,64183
IN,59983
DE,58761
AU,47717
RU,46800
FR,46436
JP,45444
ES,37313


## üåç A Influ√™ncia Internacional no Cinema

A julgar pelos t√≠tulos e pelos nomes dos diretores levantados, as duas primeiras perguntas mostram um predom√≠nio √≥bvio ‚Äî e j√° esperado ‚Äî do cinema americano na produ√ß√£o audiovisual mundial.

Tentei portanto explorar os dados em busca de um entendimento sobre a carga cultural e a participa√ß√£o dos pa√≠ses na ind√∫stria cinematogr√°fica: **Quem produz mais cinema no mundo, depois dos EUA?**

O problema:
> ‚ùå N√£o h√° dados sobre o pa√≠s de origem da produ√ß√£o dos filmes  
> ‚ùå Nem sobre o local de nascimento dos diretores ou profissionais

O campo `region`, presente na base de t√≠tulos alternativos (`title.akas`), **n√£o representa o pa√≠s de origem da obra**, mas sim o **pa√≠s onde o t√≠tulo foi lan√ßado**. Por isso, um mesmo filme pode aparecer associado a m√∫ltiplas regi√µes.

---

## üîé Estrat√©gia alternativa

Para contornar essa limita√ß√£o e ainda assim mensurar a presen√ßa global no circuito cinematogr√°fico, a abordagem adotada foi:

‚û°Ô∏è Medir a quantidade de t√≠tulos lan√ßados por regi√£o a partir de 1995. 

‚û°Ô∏è Usar isso como indicador de consumo e inser√ß√£o internacional no mercado audiovisual.

---

## üìä Conclus√µes preliminares

- H√° um predom√≠nio massivo do Ocidente: dos 10 pa√≠ses com mais lan√ßamentos, apenas  **√çndia** e **Jap√£o** representam o Oriente.

- A **popula√ß√£o n√£o √© um fator determinante**: a √çndia, o pa√≠s mais populoso do mundo e com forte presen√ßa cinematogr√°fica via Bollywood, aparece apenas na **√∫ltima posi√ß√£o**.

A tabela abaixo mostra uma raz√£o entre filmes por milh√£o de habitantes, por pa√≠s:

## üé¨ Produ√ß√£o de Filmes por Milh√£o de Habitantes

A tabela abaixo apresenta os **10 pa√≠ses com maior n√∫mero absoluto de filmes lan√ßados** segundo a base do IMDB, acompanhada da **popula√ß√£o estimada** de cada pa√≠s e a taxa proporcional de **filmes por milh√£o de habitantes**.

| Pa√≠s                    | Popula√ß√£o Estimada | Total de Filmes (1995‚Äì2024) | Filmes por Milh√£o de Habitantes |
|-------------------------|---------------------|------------------------------|----------------------------------|
| üá¶üá∫ Austr√°lia (AU)       | 26.000.000           | 47.717                       | **1.835**                        |
| üá¨üáß Reino Unido (GB)     | 67.000.000           | 114.636                      | **1.711**                        |
| üá®üá¶ Canad√° (CA)          | 38.000.000           | 64.183                       | **1.689**                        |
| üá™üá∏ Espanha (ES)         | 47.000.000           | 37.313                       | **793**                          |
| üá´üá∑ Fran√ßa (FR)          | 65.000.000           | 46.436                       | **714**                          |
| üá©üá™ Alemanha (DE)        | 83.000.000           | 58.761                       | **708**                          |
| üá∫üá∏ Estados Unidos (US)  | 331.000.000          | 181.073                      | **547**                          |
| üáØüáµ Jap√£o (JP)           | 125.000.000          | 45.444                       | **363**                          |
| üá∑üá∫ R√∫ssia (RU)          | 144.000.000          | 46.800                       | **325**                          |
| üáÆüá≥ √çndia (IN)           | 1.400.000.000        | 59.983                       | **43**                           |


---

Apesar de os Estados Unidos liderarem em n√∫mero absoluto de filmes lan√ßados desde 1995, pa√≠ses com popula√ß√µes significativamente menores, como **Austr√°lia**, **Reino Unido** e **Canad√°**, apresentam uma inser√ß√£o proporcionalmente maior quando pensamos em filmes por milh√£o de habitantes. A capacidade de produ√ß√£o cultural est√° mais ligada √† infraestrutura e investimento na ind√∫stria do que ao tamanho da popula√ß√£o.


### üåç Rela√ß√£o entre Produ√ß√£o Cultural e Indicadores Sociais (1995‚Äì2024)

Nesta etapa da an√°lise, buscamos entender se existe rela√ß√£o entre o **n√≠vel de desenvolvimento social dos pa√≠ses** e a **densidade de produ√ß√£o audiovisual**, medida aqui pela quantidade de filmes lan√ßados por milh√£o de habitantes.

| Pa√≠s                    | üé¨ Filmes por milh√£o | üß† IDH | üí∞ PIB per capita (USD) | ‚úèÔ∏è Alfabetiza√ß√£o (%) | üåê Acesso √† Internet (%) |
|-------------------------|----------------------|--------|--------------------------|-----------------------|---------------------------|
| üá¶üá∫ Austr√°lia (AU)       | 1.835                | 0.951  | 62.000                   | 99%                   | 96%                       |
| üá¨üáß Reino Unido (GB)     | 1.711                | 0.929  | 47.000                   | 99%                   | 97%                       |
| üá®üá¶ Canad√° (CA)          | 1.689                | 0.936  | 52.000                   | 99%                   | 96%                       |
| üá™üá∏ Espanha (ES)         |   793                | 0.905  | 34.000                   | 98%                   | 95%                       |
| üá´üá∑ Fran√ßa (FR)          |   714                | 0.903  | 44.000                   | 99%                   | 95%                       |
| üá©üá™ Alemanha (DE)        |   708                | 0.942  | 51.000                   | 99%                   | 97%                       |
| üá∫üá∏ Estados Unidos (US)  |   547                | 0.921  | 76.000                   | 99%                   | 98%                       |
| üáØüáµ Jap√£o (JP)           |   363                | 0.925  | 40.000                   | 99%                   | 94%                       |
| üá∑üá∫ R√∫ssia (RU)          |   325                | 0.822  | 12.000                   | 99%                   | 85%                       |
| üáÆüá≥ √çndia (IN)           |    43                | 0.633  |  2.500                   | 77%                   | 50%                       |

---

Ao cruzar os dados de filmes por milh√£o com indicadores sociais como **IDH**, **PIB per capita** e **acesso √† internet**, percebe-se que pa√≠ses com melhores indicadores socioecon√¥micos tendem a apresentar maior produ√ß√£o inser√ß√£o na ind√∫stria audiovisual proporcionalmente falando. Por outro lado, pa√≠ses como **√çndia** e **R√∫ssia**, mesmo com grandes popula√ß√µes e relev√¢ncia cultural, ficam atr√°s no ranking.



## üéûÔ∏è 4 - Evolu√ß√£o de Lan√ßamentos (Cinema) por D√©cada

In [0]:
%sql
SELECT
  FLOOR(startYear / 10) * 10 AS decada,
  COUNT(*) AS total_lancamentos
FROM gold_title_basics
WHERE titleType = 'movie'
  AND startYear IS NOT NULL
  AND startYear >= 1910
GROUP BY FLOOR(startYear / 10) * 10
ORDER BY decada;

decada,total_lancamentos
1910,12991
1920,22121
1930,20580
1940,14714
1950,23866
1960,31804
1970,40443
1980,44156
1990,45922
2000,78190


### üîé O que observamos?

Ao agrupar os dados por d√©cada a partir de 1910, identificamos um crescimento cont√≠nuo no n√∫mero de filmes lan√ßados em quase todas as d√©cadas. No entanto, **duas exce√ß√µes importantes** se destacam:

- üìâ A **d√©cada de 1940** teve o **segundo menor n√∫mero de lan√ßamentos** desde 1910 ‚Äî ficando √† frente apenas da pr√≥pria d√©cada de 1910.
- üìâ A **d√©cada de 1930** tamb√©m registrou n√∫meros baixos em compara√ß√£o com o ritmo crescente observado em outras d√©cadas.

---

Essas quedas **n√£o s√£o aleat√≥rias** e refletem o impacto de eventos hist√≥ricos de grande escala:

## - Segunda Guerra Mundial (1939‚Äì1945)
## - Grande Depress√£o (1929‚Äì1939)
---

### üìà A retomada

A partir da d√©cada de 1950, com o fim do conflito e a reconstru√ß√£o econ√¥mica mundial, a ind√∫stria do cinema retomou seu crescimento e seguiu o padr√£o de crescimento d√©cada ap√≥s decada.

---

### üß† Conclus√£o

A an√°lise da evolu√ß√£o por d√©cadas **refor√ßa a sensibilidade da ind√∫stria audiovisual a fatores hist√≥ricos e geopol√≠ticos**. 


##5 - üé¨ N√∫mero de Atrizes (√∫nicas) por D√©cada (at√© 2019)

In [0]:
%sql
SELECT 
  FLOOR(tb.startYear / 10) * 10 AS decada,
  COUNT(DISTINCT nb.primaryName) AS total_atrizes
FROM gold_title_principals tp
JOIN gold_name_basics nb ON tp.nconst = nb.nconst
JOIN gold_title_basics tb ON tp.tconst = tb.tconst
WHERE tp.category = 'actress'
  AND tb.startYear IS NOT NULL
  AND tb.startYear >= 1910
  AND tb.startYear < 2020
GROUP BY FLOOR(tb.startYear / 10) * 10
ORDER BY decada;





decada,total_atrizes
1910,10361
1920,12351
1930,13244
1940,12852
1950,26652
1960,44199
1970,59007
1980,79893
1990,120296
2000,271262



![Gr√°fico da Pergunta 5](https://github.com/plemos66/projeto_mvp_eng_de_dados/raw/main/img/5.png)


## üë©‚Äçüé¨ Participa√ß√£o de Atrizes ao Longo das D√©cadas

Esta an√°lise traz uma perspectiva hist√≥rica da presen√ßa de atrizes nas produ√ß√µes cinematogr√°ficas entre as d√©cadas de 1910 e 2010,

O nome da atriz √© contabilizado apenas uma vez por d√©cada, mesmo que ela tenha participado de mais de uma produ√ß√£o no mesmo per√≠odo.

## Observa√ß√µes:

- **Crescimento consistente**: o n√∫mero de atrizes cresce consistentemente ao longo das d√©cadas, assim como a produ√ß√£o dos filmes.

- **Explos√£o nos anos 2000**: As d√©cadas de 1990 e 2000 mostram saltos significativos nessa an√°lise, indicando uma ind√∫stria mais diversificada e com mais oportunidades de atua√ß√£o feminina, inclusive em produ√ß√µes seriadas. 

- **Relev√¢ncia social**: a guinada nos anos 90/2000 reflete a concord√¢ncia entre os dados expostos e as tend√™ncias sociais, que discutem e exigem cada vez mais a participa√ß√£o feminina no mercado de trabalho, independente da √°rea de atua√ß√£o.

##6 - üë®üë©‚Äçüé¨ Propor√ß√£o Entre Atores (√∫nicos) e Atrizes (√∫nicas) ao Longo das D√©cadas

In [0]:
%sql
WITH totais_por_decada AS (
  SELECT 
    FLOOR(tb.startYear / 10) * 10 AS decada,
    COUNT(DISTINCT nb.primaryName) AS total_decada
  FROM gold_title_principals tp
  JOIN gold_name_basics nb ON tp.nconst = nb.nconst
  JOIN gold_title_basics tb ON tp.tconst = tb.tconst
  WHERE tp.category IN ('actor', 'actress')
    AND tb.startYear IS NOT NULL
    AND tb.startYear >= 1910
    AND tb.startYear < 2020
  GROUP BY FLOOR(tb.startYear / 10) * 10
),

atores_e_atrizes AS (
  SELECT 
    FLOOR(tb.startYear / 10) * 10 AS decada,
    tp.category,
    COUNT(DISTINCT nb.primaryName) AS total_categoria
  FROM gold_title_principals tp
  JOIN gold_name_basics nb ON tp.nconst = nb.nconst
  JOIN gold_title_basics tb ON tp.tconst = tb.tconst
  WHERE tp.category IN ('actor', 'actress')
    AND tb.startYear IS NOT NULL
    AND tb.startYear >= 1910
    AND tb.startYear < 2020
  GROUP BY FLOOR(tb.startYear / 10) * 10, tp.category
)

SELECT 
  a.decada,
  a.category,
  a.total_categoria,
  ROUND((a.total_categoria / t.total_decada) * 100, 2) AS percentual
FROM atores_e_atrizes a
JOIN totais_por_decada t ON a.decada = t.decada
ORDER BY a.decada, a.category;




decada,category,total_categoria,percentual
1910,actor,15562,60.05
1910,actress,10361,39.98
1920,actor,21076,63.14
1920,actress,12351,37.0
1930,actor,23256,63.85
1930,actress,13244,36.36
1940,actor,21669,62.81
1940,actress,12852,37.25
1950,actor,45824,63.28
1950,actress,26652,36.8



![Gr√°fico da Pergunta 6](https://github.com/plemos66/projeto_mvp_eng_de_dados/raw/main/img/6.png)


##üîé O que observei
Apesar do crescimento progressivo do n√∫mero de atrizes trabalhando nas produ√ß√µes audiovisuais, a varia√ß√£o percentual entre homens e mulheres √© pequena ao longo do tempo. Mas ela existe e diminui a dist√†ncia proporcional entre g√™neros!


A partir da d√©cada de 90, o percentual feminino de presen√ßa nos filmes √© maior em rela√ß√£o ao per√≠odo entre 1920 e 1989, o que indica sim um movimento pautado por privilegiar a figura feminina dentro da ind√∫stria cinematogr√°fica. 

### üß† Conclus√£o
Os homens ainda s√£o muito mais presentes quando o assunto √© ganhar o papel em um filme, mas as mulheres vem n√£o s√≥ crescendo sua presen√ßa d√©cada ap√≥s d√©cada, mas tamb√©m diminuindo a dist√¢ncia proporcional entre g√™neros.

##Obs:
Aqui eu tamb√©m queria fazer um recorte entre as outras √°reas de atua√ß√£o, como diretores, roteiristas e etc, mas n√£o h√° nenhum dado qualificando-os por g√™nero. Para poder dividir assertivamente, s√≥ usando as categorias de Actor e Actress, e por isso a an√°lise foi fechada apenas nessa ramo de atua√ß√£o.

##üïí 7 - M√©dia de Dura√ß√£o de Tempo dos Filmes ao Longo das D√©cadas 

In [0]:
%sql
SELECT
  FLOOR(startYear / 10) * 10 AS decada,
  ROUND(AVG(runtimeMinutes), 1) AS duracao_media_minutos
FROM gold_title_basics
WHERE titleType = 'movie'
  AND runtimeMinutes IS NOT NULL
  AND runtimeMinutes > 0
  AND startYear IS NOT NULL
  AND startYear >= 1910
GROUP BY FLOOR(startYear / 10)
ORDER BY decada;


decada,duracao_media_minutos
1910,61.6
1920,71.6
1930,80.3
1940,85.8
1950,90.3
1960,92.9
1970,90.5
1980,91.7
1990,92.1
2000,89.2



![Gr√°fico da Pergunta 7](https://github.com/plemos66/projeto_mvp_eng_de_dados/raw/main/img/7.png)


## üïí O Tempo dos Filmes

At√© chegar no padr√£o "moderno" dos filmes, que se deu na d√©cada de 50, os filmes tinham uma outra caracter√≠stica, mais curtos, e foram aumentando a minutagem ao longo do tempo.

A partir dos anos 50, os filmes ganham mais ou menos o mesmo padr√£o de minutagem, tendo o seu pico na d√©cada de 60. 

### üß† Reflex√£o

Na era da fugacidade, em que a produ√ß√£o de conte√∫do em plataformas como o Tik Tok se limitam a apenas 1 minuto de v√≠deo, e 8 minutos no Youtube j√° √© muito longo, como estar√° esse gr√°fico daqui a 2 d√©cadas? Os filmes acompanhar√£o a tend√™ncia das redes sociais e o ritmo da vida social? 


## üé¨ 8 - Diretores menos prol√≠ficos com alta m√©dia de avalia√ß√£o

Quem s√£o os que t√™m menos t√≠tulos, por√©m com m√©dia de avalia√ß√£o alta?

In [0]:
%sql
SELECT 
  nb.primaryName AS diretor,
  COUNT(DISTINCT tr.tconst) AS total_filmes,
  SUM(tr.numVotes) AS total_votos,
  ROUND(AVG(tr.averageRating), 2) AS media_avaliacao
FROM gold_title_crew tc
JOIN gold_title_ratings tr ON tc.tconst = tr.tconst
JOIN gold_name_basics nb ON SPLIT(tc.directors, ',')[0] = nb.nconst
JOIN gold_title_basics tb ON tc.tconst = tb.tconst
WHERE tb.titleType = 'movie'
  AND tr.averageRating IS NOT NULL
  AND tr.numVotes >= 10000
  AND tc.directors IS NOT NULL
GROUP BY nb.primaryName
HAVING total_filmes BETWEEN 2 AND 5
ORDER BY media_avaliacao DESC
LIMIT 10;


diretor,total_filmes,total_votos,media_avaliacao
Slobodan Sijan,2,34845,8.75
Atif Yilmaz,2,35473,8.55
C. Prem Kumar,2,54490,8.45
Ron Fricke,2,80978,8.45
Zeki √ñkten,2,36376,8.4
Dragan Bjelogrlic,2,26316,8.4
Moustapha Akkad,3,81883,8.4
Lee Unkrich,2,1572720,8.35
Jeethu Joseph,2,88453,8.35
Mari Selvaraj,2,43785,8.35


##üîé O que observei
A tabela acima mostra as melhores avalia√ß√µes entre os diretores com o menor n√∫mero de filmes produzidos.

Fiz um filtro para considerar apenas diretores com ao menos 2 filmes produzidos, e no m√°ximo 5. Tamb√©m tinham que ter o m√≠nimo de 10 mil avalia√ß√µes recebidas.

Essa an√°lise pode complementar tamb√©m o estudo das 3 primeiras perguntas, j√° que mostra um circuito "off" de cinema, de diretores que est√£o fora do mainstream, mas produzindo filmes aclamados.

- Obs: esses diretores n√£o necessariamente trabalharam apenas nesses filmes, mas √© o que consta na base de dados, nos filtros praticados.

### üß† Conclus√£o
S√£o diretores S√©rvios, Turcos e Indianos que n√£o v√£o estar em qualquer cinema, mas que produziram filmes bem avaliados, e avaliados por muita gente. 

##9 - G√™neros de Cinema ao Longo das D√©cadas
Quais g√™neros tiveram o maior n√∫mero de t√≠tulos produzidos por d√©cada

In [0]:
%sql
WITH generos_por_decada AS (
  SELECT
    FLOOR(startYear / 10) * 10 AS decada,
    TRIM(genero) AS genero,
    COUNT(*) AS total_titulos
  FROM gold_title_basics
  LATERAL VIEW explode(split(genres, ',')) AS genero
  WHERE startYear >= 1910
    AND startYear <= 2020
    AND genres IS NOT NULL
    AND genres != '\\N'
    AND titleType = 'movie'
  GROUP BY FLOOR(startYear / 10) * 10, TRIM(genero)
),
ranking_generos AS (
  SELECT *,
         ROW_NUMBER() OVER (PARTITION BY decada ORDER BY total_titulos DESC) AS posicao
  FROM generos_por_decada
)
SELECT decada, genero
FROM ranking_generos
WHERE posicao = 1
ORDER BY decada;


decada,genero
1910,Drama
1920,Drama
1930,Drama
1940,Drama
1950,Drama
1960,Drama
1970,Drama
1980,Drama
1990,Drama
2000,Drama


## üé≠ G√™neros Cinematogr√°ficos Predominantes por D√©cada

## üîé Observa√ß√µes:

**Drama** reina absoluto por mais de um s√©culo como o g√™nero mais produzido, o que demonstra sua versatilidade e profundidade para abordar temas humanos, sociais e existenciais.

üé¨ A primeira mudan√ßa s√≥ ocorre em **2020**, com o **Document√°rio** assumindo o posto. Isso pode estar relacionado ao crescimento de produ√ß√µes independentes, plataformas de streaming e um maior interesse por conte√∫dos informativos e reais, especialmente em um contexto p√≥s-pandemia.

- obs: A perman√™ncia do drama como g√™nero dominante tamb√©m pode indicar uma poss√≠vel limita√ß√£o na categoriza√ß√£o dos dados, j√° que muitos t√≠tulos s√£o classificados como "Drama" junto com outros g√™neros.

##10 - üì∫ Produ√ß√£o de S√©ries de TV nos √öltimos 15 anos

In [0]:
%sql
SELECT
  startYear AS ano,
  COUNT(*) AS total_titulos
FROM gold_title_basics
WHERE titleType = 'tvSeries'
  AND startYear >= 2010
  AND startYear <= 2024
  AND startYear IS NOT NULL
GROUP BY startYear
ORDER BY startYear;


ano,total_titulos
2010,7086
2011,8558
2012,9351
2013,9750
2014,10192
2015,11167
2016,11393
2017,11611
2018,11641
2019,11484



![Gr√°fico da Pergunta 10](https://github.com/plemos66/projeto_mvp_eng_de_dados/raw/main/img/10.png)


## üì∫ 10. Evolu√ß√£o da Produ√ß√£o de S√©ries de TV (2010‚Äì2024)

---


- Entre **2010 e 2020**, o n√∫mero de produ√ß√µes de s√©ries cresceu de forma consistente, passando de cerca de **7 mil** para mais de **12 mil t√≠tulos por ano** ‚Äî um crescimento de quase 80%.

- O pico ocorreu em **2020**, com **12.617** novas s√©ries ‚Äî possivelmente impulsionado pelo aumento de demanda por conte√∫do digital durante a pandemia!

- A partir de **2021**, observa-se uma **queda progressiva**, chegando a **7.738 s√©ries em 2024**, n√∫mero compar√°vel ao de 2010.

- Essa desacelera√ß√£o pode estar relacionada √† **satura√ß√£o de mercado**, **conten√ß√£o or√ßament√°ria de grandes est√∫dios**, ou mudan√ßas no comportamento do consumidor com a diversifica√ß√£o de formatos (miniss√©ries, podcasts, canais curtos como TikTok etc.).

