Antes de empezar: un poco de documentación para enterder ligeramente cómo funciona HTML:

https://www.w3schools.com/html/html_intro.asp

# Web Scraping: Selenium

En este notebook veremos cómo automatizar la extracción de datos de una página web simulando la navegación. Para ello utilizaremos la librería Selenium:
https://selenium-python.readthedocs.io/

El software libre Selenium es un **framework** para realizar test automatizados de software a aplicaciones web. En principio, fue desarrollado para poner a prueba páginas y apps web, pero el **WebDriver** de Selenium también puede usarse con Python para realizar scraping. Si bien Selenium en sí no está escrito en Python, con este lenguaje de programación es posible acceder a las funciones del software.

A diferencia de Scrapy y de BeautifulSoup, Selenium no trabaja con el texto fuente en HTML de la web en cuestión, sino que carga la página en un navegador sin interfaz de usuario. El navegador interpreta entonces el código fuente de la página y crea, a partir de él, un **Document Object Model** (modelo de objetos de documento o DOM). Esta interfaz estandarizada permite poner a prueba las interacciones de los usuarios. De esta forma se consigue, por ejemplo, simular clics y rellenar formularios automáticamente. Los cambios en la web que resultan de dichas acciones se reflejan en el DOM. La estructura del proceso de web scraping con Selenium es la siguiente:

URL → Solicitud HTTP → HTML → Selenium → DOM

In [1]:
# Imports
import pandas as pd
from selenium import webdriver 


Deberemos descargar un archivo Chrome driver para selenium en https://chromedriver.chromium.org/downloads, es importante que compruebes la versión de Chrome que utilizas y descargaues el driver correspondiente.
Una vez descargado crearemos una variable con la dirección completa del path al chromedriver 

El objeto driver es con el que trabajaremos a partir de ahora

In [2]:
# especificamos el path hasta nuestro driver recién descargado:

chrome_driver_path = "C:\\Users\\Administrator\\Desktop\\TheBridge\\Bootcamp-DataScience-2021\\week6_EDA_streamlit\\day3_webscraping\\chromedriver.exe"

options = webdriver.ChromeOptions()

# options.add_argument('headless')

# headless nos permite no tener que ver la navegación en la ventana de Chrome

In [3]:
# Creamos el driver con el que nos vamos a manejar en la sesión de scrapeo:

driver = webdriver.Chrome(executable_path=chrome_driver_path, options=options)

In [4]:
# indicamos la URL de la página web a la que queremos acceder:
url = 'https://www.filmaffinity.com/es/main.html'
# el objeto driver nos va a permitir alterar el estado del la página
driver.get(url)

¡Vaya! Nos hemos encontrado con un pop-up que nos pide aceptar cookies o algo po el estilo, si nos lo queremos saltar, para poder automatizar el proceso deberemos:

1. Buscamos el botón
2. Hacemos click en el botón

Selenium nos permite buscar elementos por etiqueteas de html: https://selenium-python.readthedocs.io/locating-elements.html

CUIDADO! Los metodos de busqueda de elementos estan "duplicados". Tenemos *find_element_by_tag_name* y *find_elements_by_tag_name* el primero nos devolverá el primer elemento que encuentre (aunque haya más), el segundo nos devolverá una lista con todos los elementos que encuentre (aunque solo sea uno)

In [5]:
# Navegando en filmaffinity, en el pop-up:
element_by_tag = driver.find_elements_by_tag_name('button')
element_by_class_name = driver.find_element_by_class_name("css-47sehv")
element_by_xpath = driver.find_element_by_xpath('//*[@id="qc-cmp2-ui"]/div[2]/div/button[2]')
element_by_tag

[<selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="22b88ddc-1df2-4aab-ace0-dc817936614e")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="270a9a82-4fc3-4bb6-bc84-8a762c16df21")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="7310bee7-1a33-4335-99ad-0e6d48fef272")>]

Una vez tenemos los elementos podemos hacer varias cosas con ellos

In [6]:
dir(element_by_tag)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [7]:
element_by_xpath.size

{'height': 40, 'width': 340}

In [8]:
element_by_xpath.get_attribute('size')

'large'

Podemos extraer todos los atributos que tenga

In [9]:

# obtenemos todos sus métodos y atributos:

In [10]:
dir(element_by_xpath)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_execute',
 '_id',
 '_parent',
 '_upload',
 '_w3c',
 'clear',
 'click',
 'find_element',
 'find_element_by_class_name',
 'find_element_by_css_selector',
 'find_element_by_id',
 'find_element_by_link_text',
 'find_element_by_name',
 'find_element_by_partial_link_text',
 'find_element_by_tag_name',
 'find_element_by_xpath',
 'find_elements',
 'find_elements_by_class_name',
 'find_elements_by_css_selector',
 'find_elements_by_id',
 'find_elements_by_link_text',
 'find_elements_by_name',
 'find_elements_by_partial_link_text',
 'find_elements_by_tag_name',
 'find_elements_by_xpath',
 'get_attribute',
 'get_property',
 'id',
 

Podemos evaluar que tipo de elemento es (tag)

In [11]:
type(element_by_tag)

list

Podemos sacar el valor que tiene (el texto)

In [12]:
for i in range(0, len(element_by_tag)):
    print(element_by_tag[i].text)

socios
MÁS OPCIONES
ACEPTO


In [13]:
type(element_by_xpath)

selenium.webdriver.remote.webelement.WebElement

Incluso podemos guardar una imagen del elemento

In [14]:
element_by_xpath.screenshot('mi_imagen.png')

True

In [15]:
# Vemos que es tipo 'WebElement' y en la documentación podremos encontrar sus métodos

In [16]:
# guardamos como 'mi_imagen.png' la imagen asociada al xpath


Evaluamos que elementos hemos encontrado por el tag:

In [17]:
for index, element in enumerate(element_by_tag):
    print('Elemento:', index)
    print('Texto del elemento:', index, 'es', element.text)
    print('El tag del elemento', index, 'es', element.tag_name)
    element.screenshot('mi_imagen' + str(index) + '.png')
    

Elemento: 0
Texto del elemento: 0 es socios
El tag del elemento 0 es button
Elemento: 1
Texto del elemento: 1 es MÁS OPCIONES
El tag del elemento 1 es button
Elemento: 2
Texto del elemento: 2 es ACEPTO
El tag del elemento 2 es button


Nos quedamos con el botón que nos interesa

In [18]:
boton_aceptar = element_by_tag[2] #
print(boton_aceptar.text)
boton_aceptar

ACEPTO


<selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="7310bee7-1a33-4335-99ad-0e6d48fef272")>

In [19]:
boton_aceptar.click() #te acepta el pop up de film

Si el elemento es interactivo podremos hacer más cosas además de las anteriores. Por ejemplo: hacer click

Buscamos una película por título

In [20]:
from selenium.webdriver.common.keys import Keys

In [21]:
buscador=driver.find_element_by_xpath("/html/body/div[2]/div[1]/div/div[2]/form/input[1]")

In [22]:
buscador.send_keys("Interstellar") #aparece en la pagina que se busca 

In [23]:
# una vez escrita la búsqueda deberíamos poder activarla:
buscador.send_keys(Keys.ENTER) # es el boton de buscar 

In [24]:
# volvemos a la página anterior
driver.back()

### Vamos a buscar todas las películas que se estrenan el próximo viernes

1. Cogemos los containers que hay en la zona central

In [25]:
menu_lateral= driver.find_element_by_id("lsmenu")
menu_lateral

<selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="5418003c-c7d8-4d3d-8b35-b44483c17f5a")>

In [26]:
selecciones_menu=menu_lateral.find_elements_by_tag_name("a")


2. Vemos con cuál nos tenemos que quedar

In [27]:
for a in selecciones_menu:
    if a.text=="Próximos estrenos":
        a.click()
        break


Accedemos al container central, en el que aparecen los estrenos por semana que queremos ver, exactamente igual que hemos hecho antes

In [28]:
cajon_central=driver.find_elements_by_id("main-wrapper-rdcat")
cajon_central

[<selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="f56ed92a-3d2f-43ba-9469-a9f2ff358b75")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="bb4e3b6d-23a5-475e-8ce2-bf92324c9315")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="d90ee5b8-df7a-4836-a4d8-5125c66e2331")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="f8df5d81-bbcc-4dc2-b1a6-76520cbfdcaa")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="f45921c3-4dcd-412d-9af7-6056d5d51d0f")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="60c7fe70-5dce-4f2a-b589-06632c663640")>,
 <selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="7b5c3389-1d83-4f5d-b4dd-9d

In [29]:
for semana in cajon_central:
    print(semana.find_element_by_tag_name("div").text) 
    print(semana.find_element_by_tag_name("div").get_attribute("id"))#fechas de extreno #elements para que nos enceuntre TODOS LOS ELEMENTOS si queremos el primeor ponemos element

21 de mayo de 2021
2021-05-21
28 de mayo de 2021
2021-05-28
3 de junio de 2021
2021-06-03
4 de junio de 2021
2021-06-04
11 de junio de 2021
2021-06-11
16 de junio de 2021
2021-06-16
18 de junio de 2021
2021-06-18
25 de junio de 2021
2021-06-25


In [30]:
for semana in cajon_central:     
    fecha = semana.find_element_by_tag_name("div").get_attribute("id")     
    if fecha == "2021-05-21":         
        break

In [31]:
caratulas = semana.find_elements_by_class_name("mc-poster")
lista_pelis = []    
for peli in caratulas:
    lista_pelis.append(peli.find_element_by_tag_name("a").get_attribute("href"))
lista_pelis

['https://www.filmaffinity.com/es/film637149.html',
 'https://www.filmaffinity.com/es/film478891.html',
 'https://www.filmaffinity.com/es/film713795.html',
 'https://www.filmaffinity.com/es/film112106.html',
 'https://www.filmaffinity.com/es/film329087.html',
 'https://www.filmaffinity.com/es/film950177.html',
 'https://www.filmaffinity.com/es/film388427.html',
 'https://www.filmaffinity.com/es/film132801.html',
 'https://www.filmaffinity.com/es/film759533.html',
 'https://www.filmaffinity.com/es/film407520.html',
 'https://www.filmaffinity.com/es/film452148.html',
 'https://www.filmaffinity.com/es/film158082.html',
 'https://www.filmaffinity.com/es/film108823.html']

Buscamos cómo acceder a las películas

Una vez tenemos todas las urls vamos a ver qué hacemos con cada una de ellas

In [32]:
# Accedemos a la página de la primera pelicula
driver.get(lista_pelis[0])

Vamos a ver el proceso que deberíamos hacer con cada una de las películas:

1. Sacamos toda la información que nos interesa

In [33]:
driver.get(lista_pelis[0])

In [34]:
# titulo, nota, numero de votos y ficha técnica -> primreo sacamos de una pelicula 

titulo=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/h1/span").text
nota=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[2]/div[2]/div[1]/div[2]/div[1]").text
votos=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[2]/div[2]/div[1]/div[2]/div[2]/span").text
ficha=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[3]/dl[1]") #este sin text para pder iterar

In [35]:
titulo

'Spiral: Saw'

In [36]:
nota

'4,9'

In [37]:
votos

'40'

In [38]:
ficha


<selenium.webdriver.remote.webelement.WebElement (session="3907d77630c1ee0801b00182dfd50cdf", element="6943d653-397f-45d3-beda-0392ed930318")>

2. Creamos una lista a partir de la ficha técnica

In [39]:
# Los nombres estan con tag  = 'dt' y los valores con 'dd'
ficha_claves=[]
ficha_valores=[]
for name in ficha.find_elements_by_tag_name("dt"):
    ficha_claves.append(name.text)
for name in ficha.find_elements_by_tag_name("dd"):
    ficha_valores.append(name.text)
ficha_valores

['Spiral: From the Book of Saw',
 '2021',
 '93 min.',
 ' Estados Unidos',
 'Darren Lynn Bousman',
 'Josh Stolberg, Pete Goldfinger. Historia: Pete Goldfinger, Chris Rock, Josh Stolberg',
 'Charlie Clouser',
 'Jordan Oram',
 'Chris Rock, Samuel L. Jackson, Max Minghella, Marisol Nichols, Zoie Palmer, Nazneen Contractor, Dan Petronijevic, Morgan David Jones, Edie Inksetter, K.C. Collins, Josh Stolberg, Ali Johnson, Brian Cook, ver 6 más',
 'Serendipity Productions, Twisted Pictures, Burg/Koules Productions, Dahlstar. Distribuidora: Lionsgate',
 'Terror. Thriller | Policíaco. Crimen. Asesinos en serie',
 'Saw',
 'Trabajando a la sombra de un policía veterano (Samuel L. Jackson), el intrépido detective Ezekiel “Zeke” Banks (Chris Rock) y su compañero novato (Max Minghella) toman las riendas de una investigación relacionada con una serie de asesinatos que albergan ciertos paralelismos con el sangriento pasado de la ciudad. A medida que profundiza en el misterio, Zeke descubre que él mismo s

3. Creamos un dataframe con la info

In [40]:
columns = ["Titulo", "Nota", "Votos"]
columns.extend(ficha_claves)
len(columns)
values = [titulo, nota, votos]
values.extend(ficha_valores)
len(values)


16

In [41]:
pd.DataFrame([values], columns = columns)

Unnamed: 0,Titulo,Nota,Votos,Título original,Año,Duración,País,Dirección,Guion,Música,Fotografía,Reparto,Productora,Género,Grupos,Sinopsis
0,Spiral: Saw,49,40,Spiral: From the Book of Saw,2021,93 min.,Estados Unidos,Darren Lynn Bousman,"Josh Stolberg, Pete Goldfinger. Historia: Pete...",Charlie Clouser,Jordan Oram,"Chris Rock, Samuel L. Jackson, Max Minghella, ...","Serendipity Productions, Twisted Pictures, Bur...",Terror. Thriller | Policíaco. Crimen. Asesinos...,Saw,Trabajando a la sombra de un policía veterano ...


Ahora vamos a crear una función que nos haga todo esto para cada una de las películas:

In [52]:
def sacar_info(driver):
    titulo=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/h1/span").text
    try:
        nota=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[2]/div[2]/div[1]/div[2]/div[1]").text
        votos=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[2]/div[2]/div[1]/div[2]/div[2]/span").text
    except:
        nota=None
        votos=None 
    ficha=driver.find_element_by_xpath("/html/body/div[4]/table/tbody/tr/td[2]/div[1]/div[4]/div/div[3]/dl[1]")
    return titulo, nota, votos, ficha

def sacar_ficha(ficha):
    ficha_claves=[]
    ficha_valores=[]
    for name in ficha.find_elements_by_tag_name("dt"):
        ficha_claves.append(name.text)
    for name in ficha.find_elements_by_tag_name("dd"):
        ficha_valores.append(name.text)
    ficha_valores
    return ficha_claves, ficha_valores

def montar_df(ficha_claves,ficha_valores,titulo,notas,votos):
    columns=["Título","Nota","Votos"]
    columns.extend(ficha_claves)
    values = [titulo, nota, votos]
    values.extend(ficha_valores)
    return pd.DataFrame([values],columns=columns)

def nueva_peli(driver): #esta agrupa las otras 3 funciones independientes 
    titulo,nota,votos,ficha=sacar_info(driver)
    ficha_claves, ficha_valores=sacar_ficha(ficha)
    df_peli=montar_df(ficha_claves,ficha_valores,titulo, nota,votos)
    return df_peli

## Modo Dios: moviendonos entre ventanas

Vamos a ver cómo nos podemos mover entre ventanas del navegador

Abrir nueva ventana:

In [43]:
driver.execute_script("window.open('');") #nueva ventana

Movernos a otra ventana

In [44]:
driver.switch_to.window(driver.window_handles[0]) #volver a la pagina 1 el -1 es a la ultima que abre

Cerrar ventana

In [45]:
driver.close()#cierrate una ventana, para que luego cierre otra tengo que decirle primero que se mueva a otra y luego que la cierre

Una vez cerramos la ventana tenemos que indicarle a qué ventana tiene que ir

In [46]:
driver.switch_to.window(driver.window_handles[0])

Sabiendo cómo podemos movernos por entre las ventanas y sabiendo cómo extraer de cada página toda la información que necesitamos vamos a crear nuestro dataframe:

In [47]:
# para abrir todos los links en lista_pelis

for link in lista_pelis:
    driver.execute_script('window.open("+link+");') #abre las ventanas 
    driver.switch_to.window(driver.window_handles[-1])#vete a la ultima ventana 
    driver.get(link) #ejecutame el link

In [48]:
# Creamos un dataframe con todas las pelis que se estrenan la próxima semana:


In [54]:
df_peliculas=pd.DataFrame()
for link in lista_pelis:
    driver.execute_script('window.open("'+link+'");') #abre las ventanas 
    driver.switch_to.window(driver.window_handles[-1])#vete a la ultima ventana 
    driver.get(link)
    nueva_pelicula=nueva_peli(driver)
    df_peliculas=df_peliculas.append(nueva_pelicula) 


Unnamed: 0,Título,Nota,Votos,Título original,Año,Duración,País,Dirección,Guion,Música,Fotografía,Reparto,Productora,Género,Grupos,Sinopsis,Unnamed: 17
0,Spiral: Saw,49,40.0,Spiral: From the Book of Saw,2021,93 min.,Estados Unidos,Darren Lynn Bousman,"Josh Stolberg, Pete Goldfinger. Historia: Pete...",Charlie Clouser,Jordan Oram,"Chris Rock, Samuel L. Jackson, Max Minghella, ...","Serendipity Productions, Twisted Pictures, Bur...",Terror. Thriller | Policíaco. Crimen. Asesinos...,Saw,Trabajando a la sombra de un policía veterano ...,
0,Poliamor para principiantes,49,26.0,Poliamor para principiantes,2021,97 min.,España,Fernando Colomo,"Fernando Colomo, Casandra Macías Gago, Marina ...",Fernando Furones,Ángel Iguacel,"Karra Elejalde, Toni Acosta, Quim Àvila Conde,...","Coproducción España-Francia; Morena Films, Ran...",Comedia. Romance | Comedia romántica,,Satur (Karra Elejalde) y Tina (Toni Acosta) so...,
0,Érase una vez en Queens,49,,Boogie,2021,89 min.,Estados Unidos,Eddie Huang,Eddie Huang,"Ali Shaheed Muhammad, Adrian Younge",Brett Jutkiewicz,"Taylor Takahashi, Domenick Lombardozzi, Taylou...","Immersive Pictures, Wink Productions. Distribu...",Drama | Baloncesto. Inmigración,,"En la Nueva York contemporánea, un joven fenóm...",
0,First Cow,49,1.396,First Cow,2019,121 min.,Estados Unidos,Kelly Reichardt,"Jonathan Raymond, Kelly Reichardt. Novela: Jon...",William Tyler,Christopher Blauvelt,"John Magaro, Orion Lee, Toby Jones, Ewen Bremn...","Film Science, A24, IAC Films. Distribuidora: A24",Drama. Western | Siglo XIX. Amistad,,Narra la historia de un cocinero (John Magaro)...,
0,Mía y Moi,49,67.0,Mía y Moi,2021,,España,Borja de la Vega,Borja de la Vega,,Álvaro Ruiz,"Bruna Cusí, Ricardo Gómez, Eneko Sagardoy, Joe...","Paciencia y Baraja, Toned Media",Drama,,"Tras perder a su madre, Mía y Moi se refugian ...",
0,Pequeño país,49,30.0,Petit pays aka,2020,111 min.,Francia,Eric Barbier,Eric Barbier. Novela: Gaël Faye,Renaud Barbier,Antoine Sanier,"Jean-Paul Rouve, Djibril Vancoppenolle, Dayla ...","Coproducción Francia-Bélgica; Jerico, Super 8 ...",Drama,,Gabriel tiene 10 años y vive en un cómodo veci...,
0,Sweat,49,44.0,Sweat,2020,100 min.,Polonia,Magnus von Horn,Magnus von Horn,Piotr Kurek,Michal Dymek,"Magdalena Kolesnik, Julian Swiezewski, Aleksan...","Coproducción Polonia-Suecia; Lava Films, Zentr...",Drama | Internet/Informática,,Describe tres días en la vida de la motivadora...,
0,Félix y el tesoro de Morgäa,49,,Félix et le trésor de Morgäa aka,2021,90 min.,Canadá,Nicola Lemay,Marc Robitaille,,Animación,"Animación, Gabriel Lessard, Guy Nadon, Marc La...",10e Ave,Animación. Aventuras | Adolescencia,,Félix es un niño de 12 años que está convencid...,
0,El viaje de Chihiro,49,109.289,Sen to Chihiro no kamikakushi aka,2001,124 min.,Japón,Hayao Miyazaki,Hayao Miyazaki,Joe Hisaishi,"Animación, Atsushi Okui",Animación,"Studio Ghibli, Tokuma Shoten, Dentsu Inc. Dist...",Animación. Fantástico. Aventuras | Dragones. P...,Studio Ghibli (y obras relacionadas),Chihiro es una niña de diez años que viaja en ...,
0,Cascarrabias,49,,Here Comes the Grump (Ahí viene Cascarrabias),2018,97 min.,México,Andrés Couturier,"Jim Hecht, Piers Clifton, Ricardo Hernández Du...",James Seymour Brett,Animación,Animación,Coproducción México-Estados Unidos; Anima Estu...,Animación. Aventuras. Comedia. Fantástico. Inf...,,Pasar las vacaciones de verano en el increíble...,


In [55]:
df_peliculas

Unnamed: 0,Título,Nota,Votos,Título original,Año,Duración,País,Dirección,Guion,Música,Fotografía,Reparto,Productora,Género,Grupos,Sinopsis,Unnamed: 17
0,Spiral: Saw,49,40.0,Spiral: From the Book of Saw,2021,93 min.,Estados Unidos,Darren Lynn Bousman,"Josh Stolberg, Pete Goldfinger. Historia: Pete...",Charlie Clouser,Jordan Oram,"Chris Rock, Samuel L. Jackson, Max Minghella, ...","Serendipity Productions, Twisted Pictures, Bur...",Terror. Thriller | Policíaco. Crimen. Asesinos...,Saw,Trabajando a la sombra de un policía veterano ...,
0,Poliamor para principiantes,49,26.0,Poliamor para principiantes,2021,97 min.,España,Fernando Colomo,"Fernando Colomo, Casandra Macías Gago, Marina ...",Fernando Furones,Ángel Iguacel,"Karra Elejalde, Toni Acosta, Quim Àvila Conde,...","Coproducción España-Francia; Morena Films, Ran...",Comedia. Romance | Comedia romántica,,Satur (Karra Elejalde) y Tina (Toni Acosta) so...,
0,Érase una vez en Queens,49,,Boogie,2021,89 min.,Estados Unidos,Eddie Huang,Eddie Huang,"Ali Shaheed Muhammad, Adrian Younge",Brett Jutkiewicz,"Taylor Takahashi, Domenick Lombardozzi, Taylou...","Immersive Pictures, Wink Productions. Distribu...",Drama | Baloncesto. Inmigración,,"En la Nueva York contemporánea, un joven fenóm...",
0,First Cow,49,1.396,First Cow,2019,121 min.,Estados Unidos,Kelly Reichardt,"Jonathan Raymond, Kelly Reichardt. Novela: Jon...",William Tyler,Christopher Blauvelt,"John Magaro, Orion Lee, Toby Jones, Ewen Bremn...","Film Science, A24, IAC Films. Distribuidora: A24",Drama. Western | Siglo XIX. Amistad,,Narra la historia de un cocinero (John Magaro)...,
0,Mía y Moi,49,67.0,Mía y Moi,2021,,España,Borja de la Vega,Borja de la Vega,,Álvaro Ruiz,"Bruna Cusí, Ricardo Gómez, Eneko Sagardoy, Joe...","Paciencia y Baraja, Toned Media",Drama,,"Tras perder a su madre, Mía y Moi se refugian ...",
0,Pequeño país,49,30.0,Petit pays aka,2020,111 min.,Francia,Eric Barbier,Eric Barbier. Novela: Gaël Faye,Renaud Barbier,Antoine Sanier,"Jean-Paul Rouve, Djibril Vancoppenolle, Dayla ...","Coproducción Francia-Bélgica; Jerico, Super 8 ...",Drama,,Gabriel tiene 10 años y vive en un cómodo veci...,
0,Sweat,49,44.0,Sweat,2020,100 min.,Polonia,Magnus von Horn,Magnus von Horn,Piotr Kurek,Michal Dymek,"Magdalena Kolesnik, Julian Swiezewski, Aleksan...","Coproducción Polonia-Suecia; Lava Films, Zentr...",Drama | Internet/Informática,,Describe tres días en la vida de la motivadora...,
0,Félix y el tesoro de Morgäa,49,,Félix et le trésor de Morgäa aka,2021,90 min.,Canadá,Nicola Lemay,Marc Robitaille,,Animación,"Animación, Gabriel Lessard, Guy Nadon, Marc La...",10e Ave,Animación. Aventuras | Adolescencia,,Félix es un niño de 12 años que está convencid...,
0,El viaje de Chihiro,49,109.289,Sen to Chihiro no kamikakushi aka,2001,124 min.,Japón,Hayao Miyazaki,Hayao Miyazaki,Joe Hisaishi,"Animación, Atsushi Okui",Animación,"Studio Ghibli, Tokuma Shoten, Dentsu Inc. Dist...",Animación. Fantástico. Aventuras | Dragones. P...,Studio Ghibli (y obras relacionadas),Chihiro es una niña de diez años que viaja en ...,
0,Cascarrabias,49,,Here Comes the Grump (Ahí viene Cascarrabias),2018,97 min.,México,Andrés Couturier,"Jim Hecht, Piers Clifton, Ricardo Hernández Du...",James Seymour Brett,Animación,Animación,Coproducción México-Estados Unidos; Anima Estu...,Animación. Aventuras. Comedia. Fantástico. Inf...,,Pasar las vacaciones de verano en el increíble...,


¡Tachán! Ya tenemos un dataframe con todas las películas que se van a estrenar el próximo viernes