###  Análise API
---

In [None]:
import requests
import pandas as pd
import time
import os
from dotenv import load_dotenv

load_dotenv()
bearer_token = os.getenv("TMDB_BEARER_TOKEN")

headers = {
    "Authorization": f"Bearer {bearer_token}",
    "Content-Type": "application/json;charset=utf-8"
}

def buscar_filmes_guerra_com_filtros():
    url_base = "https://api.themoviedb.org/3/discover/movie"
    pagina = 1
    filmes = []

    while True:
        params = {
            "language": "pt-BR",
            "with_genres": 10752,            
            "sort_by": "popularity.desc",
            "vote_count.gte": 100,
            "vote_average.gte": 6.0,
            "page": pagina,
            "primary_release_date.gte": "1950-01-01"     
        }

        response = requests.get(url_base, headers=headers, params=params)

        if response.status_code != 200:
            print(f"Erro ao buscar página {pagina}: {response.status_code}")
            break

        dados = response.json()
        resultados = dados.get("results", [])
        if not resultados:
            break

        filmes.extend(resultados)
        print(f"Página {pagina} coletada com {len(resultados)} filmes.")
        pagina += 1

        if pagina > dados.get("total_pages", 1):
            break

        time.sleep(0.25)  

    return [filme['id'] for filme in filmes]

def buscar_detalhes_filme(id_tmdb):
    url = f"https://api.themoviedb.org/3/movie/{id_tmdb}?language=pt-BR&append_to_response=credits,keywords,release_dates"
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.json()
    else:
        print(f"Erro ao buscar detalhes do filme ID {id_tmdb}")
        return None

print("Buscando filmes de guerra a partir de 1950 com filtros de nota e votos...")
ids_filmes = buscar_filmes_guerra_com_filtros()
print(f" Total de filmes encontrados: {len(ids_filmes)}")

dados_completos = []
for idx, id_filme in enumerate(ids_filmes):
    print(f" Buscando detalhes do filme {idx+1}/{len(ids_filmes)} - ID: {id_filme}")
    dados = buscar_detalhes_filme(id_filme)
    if dados:
        dados_completos.append(dados)
    time.sleep(0.25)

df_filmes = pd.json_normalize(dados_completos)
df_filmes.to_csv("filmes_guerra_detalhes.csv", index=False, encoding='utf-8-sig')

print(" Arquivo salvo como 'filmes_guerra_detalhes.csv'")


🔎 Buscando filmes de guerra a partir de 1950 com filtros de nota e votos...
Página 1 coletada com 20 filmes.
Página 2 coletada com 20 filmes.
Página 3 coletada com 20 filmes.
Página 4 coletada com 20 filmes.
Página 5 coletada com 20 filmes.
Página 6 coletada com 20 filmes.
Página 7 coletada com 20 filmes.
Página 8 coletada com 20 filmes.
Página 9 coletada com 20 filmes.
Página 10 coletada com 20 filmes.
Página 11 coletada com 20 filmes.
Página 12 coletada com 20 filmes.
Página 13 coletada com 20 filmes.
Página 14 coletada com 20 filmes.
Página 15 coletada com 20 filmes.
Página 16 coletada com 20 filmes.
Página 17 coletada com 20 filmes.
Página 18 coletada com 20 filmes.
Página 19 coletada com 20 filmes.
Página 20 coletada com 20 filmes.
Página 21 coletada com 20 filmes.
Página 22 coletada com 20 filmes.
Página 23 coletada com 20 filmes.
Página 24 coletada com 20 filmes.
Página 25 coletada com 20 filmes.
Página 26 coletada com 20 filmes.
Página 27 coletada com 20 filmes.
Página 28 colet

- Carregando o CSV completo com os dados detalhados dos filmes, observando o nome, tipo da coluna e as primeiras linhas

In [None]:
df = pd.read_csv("filmes_guerra_detalhes.csv")

print(df.dtypes)

df.head(3)

adult                                     bool
backdrop_path                           object
belongs_to_collection                  float64
budget                                   int64
genres                                  object
homepage                                object
id                                       int64
imdb_id                                 object
origin_country                          object
original_language                       object
original_title                          object
overview                                object
popularity                             float64
poster_path                             object
production_companies                    object
production_countries                    object
release_date                            object
revenue                                  int64
runtime                                  int64
spoken_languages                        object
status                                  object
tagline      

Unnamed: 0,adult,backdrop_path,belongs_to_collection,budget,genres,homepage,id,imdb_id,origin_country,original_language,...,vote_average,vote_count,credits.cast,credits.crew,keywords.keywords,release_dates.results,belongs_to_collection.id,belongs_to_collection.name,belongs_to_collection.poster_path,belongs_to_collection.backdrop_path
0,False,/cJvUJEEQ86LSjl4gFLkYpdCJC96.jpg,,20000000,"[{'id': 10752, 'name': 'Guerra'}, {'id': 28, '...",https://www.primevideo.com/detail/0HNFQXGDR0N8...,1241436,tt31434639,['US'],en,...,7.291,522,"[{'adult': False, 'gender': 2, 'id': 2710333, ...","[{'adult': False, 'gender': 2, 'id': 2036, 'kn...","[{'id': 11219, 'name': 'u.s. navy seal'}, {'id...","[{'iso_3166_1': 'AS', 'release_dates': [{'cert...",,,,
1,False,/ulMscezy9YX0bhknvJbZoUgQxO5.jpg,,150000000,"[{'id': 18, 'name': 'Drama'}, {'id': 878, 'nam...",,281338,tt3450958,['US'],en,...,7.207,9269,"[{'adult': False, 'gender': 2, 'id': 1333, 'kn...","[{'adult': False, 'gender': 1, 'id': 1275224, ...","[{'id': 236, 'name': 'suicide'}, {'id': 393, '...","[{'iso_3166_1': 'AE', 'release_dates': [{'cert...",173710.0,Planeta dos Macacos (Reboot): Coleção,/g4RGKFHOKCWrPXncwHdmzMv1RdU.jpg,/iMhm0g555HgQNIXAMvnlgOiW5Rz.jpg
2,False,/lTyikzfGgRX5ZqIfVeT26APYfRL.jpg,,14000000,"[{'id': 35, 'name': 'Comédia'}, {'id': 10752, ...",http://www.foxsearchlight.com/jojorabbit,515001,tt2584384,['US'],en,...,8.005,9826,"[{'adult': False, 'gender': 2, 'id': 2054851, ...","[{'adult': False, 'gender': 0, 'id': 584902, '...","[{'id': 818, 'name': 'based on novel or book'}...","[{'iso_3166_1': 'AU', 'release_dates': [{'cert...",,,,


- Quais colunas têm muitos valores faltantes

In [8]:
df.isnull().sum().sort_values(ascending=False).head(20)


belongs_to_collection                  574
homepage                               562
belongs_to_collection.backdrop_path    515
belongs_to_collection.poster_path      507
belongs_to_collection.name             503
belongs_to_collection.id               503
tagline                                324
overview                                33
vote_count                               0
title                                    0
video                                    0
vote_average                             0
credits.crew                             0
credits.cast                             0
spoken_languages                         0
keywords.keywords                        0
release_dates.results                    0
status                                   0
adult                                    0
runtime                                  0
dtype: int64

- Exemplo do elenco de um dos filmes


In [None]:
import ast
exemplo_cast = ast.literal_eval(df.loc[0, "credits.cast"])
exemplo_cast[:3]  

[{'adult': False,
  'gender': 2,
  'id': 2710333,
  'known_for_department': 'Acting',
  'name': "D'Pharaoh Woon-A-Tai",
  'original_name': "D'Pharaoh Woon-A-Tai",
  'popularity': 0.8848,
  'profile_path': '/ozEGeNK9r2EFn4rNU0DSuNQaia0.jpg',
  'cast_id': 14,
  'character': 'Ray',
  'credit_id': '65dff11c880c920186270dcb',
  'order': 0},
 {'adult': False,
  'gender': 2,
  'id': 93491,
  'known_for_department': 'Acting',
  'name': 'Will Poulter',
  'original_name': 'Will Poulter',
  'popularity': 4.3004,
  'profile_path': '/9blYMaj79VGC6BHTLmJp3V5S8r3.jpg',
  'cast_id': 17,
  'character': 'Erik',
  'credit_id': '660595f2ecaef50161afb31e',
  'order': 1},
 {'adult': False,
  'gender': 2,
  'id': 1363054,
  'known_for_department': 'Acting',
  'name': 'Cosmo Jarvis',
  'original_name': 'Cosmo Jarvis',
  'popularity': 3.2687,
  'profile_path': '/1kgghZ558CxZCJip5ufO6BAqUGp.jpg',
  'cast_id': 16,
  'character': 'Elliott',
  'credit_id': '660595ececaef5017ab055e5',
  'order': 2}]

- Países presentes

In [12]:
exemplo_paises = ast.literal_eval(df.loc[0, "production_countries"])
exemplo_paises

[{'iso_3166_1': 'GB', 'name': 'United Kingdom'},
 {'iso_3166_1': 'US', 'name': 'United States of America'}]

Verificando como estão os dados de elenco

In [None]:
import ast


elenco_exemplo = df.loc[0, "credits.cast"]
elenco_df = pd.DataFrame(elenco_exemplo)
elenco_df[["name", "character", "gender", "order"]].head(10)

Unnamed: 0,name,character,gender,order
0,D'Pharaoh Woon-A-Tai,Ray,2,0
1,Will Poulter,Erik,2,1
2,Cosmo Jarvis,Elliott,2,2
3,Kit Connor,Tommy,2,3
4,Finn Bennett,John,2,4
5,Taylor John Smith,Frank,2,5
6,Michael Gandolfini,Lt. MacDonald,2,6
7,Adain Bradley,Sgt Laerrus,2,7
8,Noah Centineo,Brian,2,8
9,Evan Holtzman,Brock,2,9


 Verificando os diretores dos filmes

In [None]:

df = pd.read_csv("filmes_guerra_detalhes.csv")

def extrair_diretores(crew_str):
    try:
        crew = ast.literal_eval(crew_str)  
    except:
        return []
    diretores = [p['name'] for p in crew if p.get('job') == 'Director']
    return diretores

df['diretores'] = df['credits.crew'].apply(extrair_diretores)

diretores_visao = df[['title', 'release_date', 'diretores']].head(10)
print(diretores_visao)

diretores_visao

                           title release_date                    diretores
0                Tempo de Guerra   2025-04-09  [Ray Mendoza, Alex Garland]
1  Planeta dos Macacos: A Guerra   2017-07-11                [Matt Reeves]
2                    Jojo Rabbit   2019-10-18              [Taika Waititi]
3             Até o Último Homem   2016-10-07                 [Mel Gibson]
4                  Major Imortal   2024-10-31         [Rajkumar Periasamy]
5                   Dirty Angels   2024-12-11            [Martin Campbell]
6            Bastardos Inglórios   2009-08-02          [Quentin Tarantino]
7                   Guerra Civil   2024-04-10               [Alex Garland]
8                        Platoon   1986-12-19               [Oliver Stone]
9              Corações de Ferro   2014-10-15                 [David Ayer]


Unnamed: 0,title,release_date,diretores
0,Tempo de Guerra,2025-04-09,"[Ray Mendoza, Alex Garland]"
1,Planeta dos Macacos: A Guerra,2017-07-11,[Matt Reeves]
2,Jojo Rabbit,2019-10-18,[Taika Waititi]
3,Até o Último Homem,2016-10-07,[Mel Gibson]
4,Major Imortal,2024-10-31,[Rajkumar Periasamy]
5,Dirty Angels,2024-12-11,[Martin Campbell]
6,Bastardos Inglórios,2009-08-02,[Quentin Tarantino]
7,Guerra Civil,2024-04-10,[Alex Garland]
8,Platoon,1986-12-19,[Oliver Stone]
9,Corações de Ferro,2014-10-15,[David Ayer]


verificando as diretoras de filmes

In [None]:

df = pd.read_csv("filmes_guerra_detalhes.csv")

def extrair_diretoras(crew_str):
    try:
        crew = ast.literal_eval(crew_str)
    except:
        return []
    diretoras = [p['name'] for p in crew if p.get('job') == 'Director' and p.get('gender') == 1]
    return diretoras

df['diretoras'] = df['credits.crew'].apply(extrair_diretoras)

df_diretoras = df[df['diretoras'].apply(lambda x: len(x) > 0)]

df_diretoras[['title', 'release_date', 'diretoras']].head(10)






Unnamed: 0,title,release_date,diretoras
80,Guerra ao Terror,2008-10-10,[Kathryn Bigelow]
110,Lee,2024-09-12,[Ellen Kuras]
120,Invencível,2014-12-25,[Angelina Jolie]
190,A Ganha-Pão,2017-11-17,[Nora Twomey]
208,Amor e Ódio,2010-03-10,[Roselyne Bosch]
237,O Porteiro da Noite,1974-04-03,[Liliana Cavani]
241,O Zoológico de Varsóvia,2017-03-24,[Niki Caro]
247,Halo: Lendas,2010-02-16,[清水恵]
251,K19,2002-07-19,[Kathryn Bigelow]
264,"Quo Vadis, Aida?",2021-02-26,[Jasmila Žbanić]


Personagem femininas em destaque

In [None]:
df = pd.read_csv("filmes_guerra_detalhes.csv")

def extrair_personagens_femininas(cast_str):
    try:
        cast_list = ast.literal_eval(cast_str)
        mulheres_principais = [
            {
                'name': pessoa.get('name'),
                'character': pessoa.get('character'),
                'order': pessoa.get('order')
            }
            for pessoa in cast_list
            if pessoa.get('gender') == 1 and pessoa.get('order') is not None and pessoa.get('order') < 5
        ]
        return mulheres_principais
    except:
        return []

df['personagens_femininas_destaque'] = df['credits.cast'].apply(extrair_personagens_femininas)

df_filtrado = df[df['personagens_femininas_destaque'].apply(len) > 0][['title', 'release_date', 'personagens_femininas_destaque']]
df_filtrado.head(10)

Unnamed: 0,title,release_date,personagens_femininas_destaque
1,Planeta dos Macacos: A Guerra,2017-07-11,"[{'name': 'Karin Konoval', 'character': 'Mauri..."
2,Jojo Rabbit,2019-10-18,"[{'name': 'Thomasin McKenzie', 'character': 'E..."
3,Até o Último Homem,2016-10-07,"[{'name': 'Teresa Palmer', 'character': 'Dorot..."
4,Major Imortal,2024-10-31,"[{'name': 'Sai Pallavi', 'character': 'Indhu R..."
5,Dirty Angels,2024-12-11,"[{'name': 'Eva Green', 'character': 'Jake', 'o..."
6,Bastardos Inglórios,2009-08-02,"[{'name': 'Mélanie Laurent', 'character': 'Sho..."
7,Guerra Civil,2024-04-10,"[{'name': 'Kirsten Dunst', 'character': 'Lee',..."
10,A Lista de Schindler,1993-12-15,"[{'name': 'Caroline Goodall', 'character': 'Em..."
13,Cruzada,2005-05-03,"[{'name': 'Eva Green', 'character': 'Sibylla',..."
14,Napoleão,2023-11-22,"[{'name': 'Vanessa Kirby', 'character': 'Josep..."
