In [None]:
# A TMDB (The Movie Database" é unha base de datos sobre películas e TV creada pola comunidade
# https://www.themoviedb.org/about

In [None]:
# Info da API 
# https://developers.themoviedb.org/3/getting-started/introduction

In [None]:
import requests

In [None]:
# É importante manter as chaves fóra de ficheiros que se suben a repositorios públicos

# https://towardsdatascience.com/keeping-credentials-safe-in-jupyter-notebooks-fbd215a8e311
from configparser import ConfigParser

In [None]:
parser = ConfigParser()
_ = parser.read('notebook.cfg')

API_KEY = parser.get('api_tmdb', 'auth_key')

In [None]:
API_KEY

In [None]:
# API_KEY = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'

In [None]:
# sample: https://api.themoviedb.org/3/movie/76341?api_key=<<api_key>> 
url_base = 'https://api.themoviedb.org/3/movie/'

In [None]:
# 1. Consulta a información sobre a película 551 utilizando a autenticación simple (v3)
# As películas están identificadas por un número
# Título, xéneros, duración, puntuación media

In [None]:
movie = 551

In [None]:
url = url_base+str(movie)
url

In [None]:
response = requests.get(url,params = { 'api_key' : API_KEY })
response

In [None]:
response.json()

In [None]:
# Título, xéneros, duración, puntuación media
titulo = response.json()['original_title']
xeneros = ''
for xenero in response.json()['genres']:
    xeneros += xenero['name']+','
xeneros = xeneros.rstrip(',')
duracion = response.json()['runtime']
puntuacion = response.json()['vote_average']
print(f'Título: {titulo}')
print(f'Xéneros: {xeneros}')
print(f'Duración: {duracion}')
print(f'Puntuación: {puntuacion}')

In [None]:
# 2. Repite a consulta utilizando a autenticación (v4), con API Read Token
# Título, xéneros, duración, puntuación media

In [None]:
parser = ConfigParser()
_ = parser.read('notebook.cfg')

API_TOKEN = parser.get('api_tmdb', 'read_token')

In [None]:
API_TOKEN

In [None]:
# API_TOKEN = 'YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY'

In [None]:
headers = { 'Authorization' : 'Bearer ' + API_TOKEN }
response = requests.get(url, headers = headers)
response

In [None]:
# Título, xéneros, duración, puntuación media
titulo = response.json()['original_title']
xeneros = ''
for xenero in response.json()['genres']:
    xeneros += xenero['name']+','
xeneros = xeneros.rstrip(',')
duracion = response.json()['runtime']
puntuacion = response.json()['vote_average']
print(f'Título: {titulo}')
print(f'Xéneros: {xeneros}')
print(f'Duración: {duracion}')
print(f'Puntuación: {puntuacion}')

In [None]:
# 3. Busca información da película: Matrix
# Responde ás seguintes preguntas:
# 3.1 Cantas películas devolve a búsqueda
# 3.2 Mostra cales son os seus títulos, data de estrea e puntuación
# 3.3 Mostra a información das películas ordenada por data de estrea (ascendente)
# 3.4 Mostra a información das películas ordenadas por puntuación (descendente)

In [None]:
url = 'https://api.themoviedb.org/3/search/movie/'

In [None]:
movie = 'matrix'

In [None]:
payload = {
    'api_key' : API_KEY,
    'query' : movie
}

In [None]:
response = requests.get(url, params = payload)
response

In [None]:
response.json()

In [None]:
import pandas as pd
pelis = pd.DataFrame(response.json()['results'])


In [None]:
pelis

In [None]:
# 3.1 Número de resultados
len(response.json()['results'])

In [None]:
pelis.title.count()

In [None]:
# 3.2 Títulos, data de estrea e puntuación
for peli in response.json()['results']:
    titulo = peli['title']
    release = peli['release_date']
    puntuacion = peli['vote_average']
    print(f'{titulo}, {release} - {puntuacion}')

In [None]:
pelis[['title','release_date','vote_average']]

In [None]:
# Mostra a información das películas ordenadas por data de estrea (ascendente)

In [None]:
import pandas as pd

In [None]:
lista_pelis = []
for peli in response.json()['results']:
    titulo = peli['title']
    release = peli['release_date']
    puntuacion = peli['vote_average']
    #print(f'{titulo}, {release} - {puntuacion}')
    lista_pelis.append([titulo, release, puntuacion])
df_pelis = pd.DataFrame(lista_pelis,columns=['titulo','estrea','puntuacion'])
df_pelis

In [None]:
df_pelis.sort_values('estrea')

In [None]:
# Mostra a información das películas ordenadas por puntuación (descendente)

In [None]:
df_pelis.sort_values('puntuacion',ascending=False)

In [None]:
# 4. Mostra a información da película de Matrix mellor puntuada
# (título, duración, puntuación, ano de estrea, páxina web, sinopse (overview) e imaxe)

In [None]:
lista_pelis = []
for peli in response.json()['results']:
    titulo = peli['title']
    release = peli['release_date']
    puntuacion = peli['vote_average']
    id = peli['id']
    #print(f'{titulo}, {release} - {puntuacion}')
    lista_pelis.append([id,titulo, release, puntuacion])
df_pelis = pd.DataFrame(lista_pelis,columns=['id','titulo','estrea','puntuacion'])
id_peli_mellor_valorada = df_pelis.sort_values('puntuacion',ascending=False).iloc[0]['id']
id_peli_mellor_valorada

In [None]:
url_base = 'https://api.themoviedb.org/3/movie/'
url = url_base+str(id_peli_mellor_valorada)
response = requests.get(url,params = { 'api_key' : API_KEY })
response.json()

In [None]:
#título, duración, puntuación, ano de estrea, páxina web, sinopse (overview) e imaxe
titulo = response.json()['title']
puntuacion = response.json()['vote_average']
ano = response.json()['release_date'].split('-')[0]
webpage = response.json()['homepage']
sinopse = response.json()['overview']
poster_path = response.json()['poster_path']
print(f'{titulo} ({ano})')
print(f'Puntuacion: {puntuacion}')
print(f'{sinopse}')
print(webpage)

In [None]:
from IPython import display
display.Image('https://image.tmdb.org/t/p/w300'+poster_path)

In [None]:
# 5. Busca información das películas de Star Wars
# Salva a información en formato CSV
# Salva a información en formato JSON

In [None]:
# API_TOKEN = 'YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY'

In [None]:
import requests
import pandas as pd

url = 'https://api.themoviedb.org/3/search/movie/'
movie = 'Star Wars'
payload = {'query' : movie, 'page':1}
headers = { 'Authorization' : 'Bearer ' + API_TOKEN }
response = requests.get(url, headers = headers, params = payload)
paxinas = response.json()['total_pages']

#response.json()['results']

lista_pelis_SW = []
for paxina in range(1,paxinas+1):
    payload = {'query' : movie, 'page':paxina}
    response = requests.get(url, headers = headers, params = payload)
    lista_pelis_SW += response.json()['results']

df_SW = pd.DataFrame(lista_pelis_SW)
df_SW


In [None]:
df_SW.to_csv('output/lista_pelis_SW.csv')

In [None]:
df_SW.to_json('output/lista_pelis_SW.json',orient='records')

In [None]:
# 6. Busca información sobre o teu actor/actriz favorito (ou sobre un calquera)
# Busca información sobrea as películas nas que participou
# Exporta a formato JSON a información do teu actor/actriz
# Exporta a formato JSON a información das películas nas que participou

In [None]:
# API_TOKEN = 'YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY'

In [None]:
import requests
import pandas as pd

url = 'https://api.themoviedb.org/3/search/person/'
movie = 'Bill Murray'
payload = {'query' : movie, 'page':1}
headers = { 'Authorization' : 'Bearer ' + API_TOKEN }
response = requests.get(url, headers = headers, params = payload)
response.json()

In [None]:
print('xénero:',response.json()['results'][0]['gender'])
print('nome:',response.json()['results'][0]['name'])
print('popularidade:',response.json()['results'][0]['popularity'])

In [None]:
df_actor = pd.DataFrame({'nome' : [response.json()['results'][0]['name']], 
                          'xenero' : [response.json()['results'][0]['gender']],
                          'popularidade' : [response.json()['results'][0]['popularity']]
                        })
df_actor

In [None]:
df_actor.to_json('output/datos_actor.json',orient='records')

In [None]:
from IPython import display
profile_path = response.json()['results'][0]['profile_path']
display.Image('https://image.tmdb.org/t/p/w300'+profile_path)

In [None]:
response.json()['results'][0]['known_for']

In [None]:
df_pelis_actor = pd.DataFrame(response.json()['results'][0]['known_for'])
df_pelis_actor

In [None]:
df_pelis_actor.to_json('output/pelis_de_actor.json',orient='records', lines=True)