Dans ce projet on étudiera les données des films provenant du site TMDB : The Movie Database. Ce dataset contient des données liées aux acteurs, réalisateurs, budget, revenu, date de réalisation...
Les questions dont on s'interessent sont les suivantes:
- Est ce qu'il y a une relation entre la popularité et la moyenne des votes?
- Est ce qu'il y'a des acteurs commun dans les films les plus populaires?
- Est ce que la présence de ces acteurs permet d'augmenter la popularité du film?
- Quels sont les genres de films qui ont eu le plus de popularité?
- Quel est la société de production ayant produit les films les plus populaires?
- Quels sont les mots clés qui se répètent dans les films les plus populaires?
- Est ce que la tendance des genres des films populaires change selon les années?
- Quel est le réalisateur ayant produit les films les plus populaires?
Le dataset se trouve au niveau du dossier data.