Projeto de análise de dados com base nos filmes passados na Sessão da Tarde (Globo)
Sessão da Tarde fez parte da minha infância e até hoje é um dos meus programas preferidos por sempre ter filmes clássicos, o que me apresentou a diversos aspectos da cultura e da arte. Também é algo que eu acredito estar enraizado no brasileiro, hoje em dia quem não sabe o que é Sessão da Tarde? Ou a sensação de ligar sua TV à tarde e estar passando um filme que toda a família possa assistir? Por isso me surgiu a vontade de fazer uma análise de dados utilizando esses filmes e explorar os diferentes aspectos desse programa.
- Qual filme mais se repetiu na exibição?
- Quantas vezes {X ator} apareceu na Sessão da Tarde? (Adam Sandler, Nicolas Cage, Will Smith, Jackie Chan, ...)
- Historicamente, quais foram os melhores e os piores filmes passados na Sessão da Tarde?
- Dataset de Filmes passados na Sessão da Tarde
- Criação (Scraping)
- Limpeza do Dataset
- Enriquecimento de informações adicionais
- Informações sobre os filmes
- Nota média
- Data de lançamento
- id para consulta posterior
- Título em inglês
- Principais atores
- Gênero e público alvo
- Estudo utilizando o dataset
- Qual o gênero e o público alvo da maioria dos filmes?
- Qual ator foi estrela mais vezes? (qual mais apareceu)
- Quais são o melhor e o pior filme já passado?
- Tentar prever futuros filmes que passarão.
Os dados foram coletados a partir do TV Globo Wiki - Filmes exibidos na Sessão da Tarde, que é mantido por usuários e abriga a coleção de filmes que são exibidos desde 1984 até a data de hoje. As informações sobre os filmes coletados foram disponibilizados pelo The Movie Database.