# Beautiful Soup Tutorial

Como científico de datos, tarde o temprano llegarás a un punto en el que tendrás que recopilar grandes cantidades de datos. Ya sea un proyecto o por pasatiempo y no siempre podremos contar con las API, pero tranquilo tenemos el web scraping... ¡Y una de las mejores herramientas de web scraping es Beautiful Soup!

## ¿Pero.... qué es el web scraping?

En pocas palabras, el web scraping es la recopilación automatizada de datos de sitios web (para ser más precisos, del contenido HTML de los sitios web).

En este Jupyter, aprenderás los conceptos básicos sobre cómo extraer datos de HTML. 

Lo harás extrayendo datos de la página animeseries.io, y para lograr esto, también tendrá que hacer uso de un poco de pandas principalmente..

### Conoce a tus nuevos mejores amigos: 

- Beautiful Soup
- Requests

In [None]:
# !pip install beautifulsoup4

Para obtener la experiencia completa de Beautiful Soup, también deberás instalar un parser, dentro de ellos tenemos..

- html.parser
- lxml
- html5lib


Vamos a utilizar el lxml ya que es el mas rápido 

In [None]:
# !pip install lxml

Se necesita una cosa más para que podamos comenzar a hacer web scraping, y es la biblioteca de ```requests```. Con ```requests``` podemos solicitar páginas web de sitios web.

In [None]:
# !pip install requests

Ahora asi manos a la obra..

## Mi primer scraping

Como siempre lo primero es importar las librerías 

In [1]:
from bs4 import BeautifulSoup as bs
from string import ascii_uppercase
import requests
import pandas as pd
import numpy as np
import re

Ahora, estamos listos para solicitar nuestra primera página web. No es nada complicado: guardamos la URL que queremos raspar en la variable URL, luego solicitamos la URL (requests.get (url)) y guardamos la respuesta en la variable de respuesta:

In [2]:
url = "https://animeseries.so/popular-anime"
response = requests.get(url)

Cómo saber si se guardo correctamente el sitio web?

In [3]:
print(response.status_code)

200


Posibles respuestas:

- [Respuestas informativas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#information_responses) (100–199)
- [Respuestas exitosas](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#successful_responses) (200–299)
- [Mensajes de redirección](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#redirection_messages) (300–399)
- [Respuestas de error del cliente](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#client_error_responses) (400–499)
- [Respuestas de error del servidor](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#server_error_responses) (500–599)

Pero necesitamos el contenido HTML de la página web solicitada, así que como siguiente paso guardamos el contenido de la respuesta a html:

In [4]:
html = response.content

Lo podemos imprimir para ver su estructura

In [5]:
html

b'<!DOCTYPE html>\n<html lang="en-US" xmlns="http://www.w3.org/1999/xhtml" itemscope itemtype="http://schema.org/WebPage">\n  <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb# article: http://ogp.me/ns/article#">\n    <meta charset="UTF-8"/>\n<meta name="viewport"\n      content="width=device-width, initial-scale=1.0, minimum-scale=1.0, user-scalable=no"/>\n\n<link rel="profile" href="https://gmpg.org/xfn/11">\n\n<link rel="shortcut icon" href="https://animeseries.so/favicon.png">\n<meta name="google-site-verification" content="F64RcKpc425o569H2C1hLW7A9ZObUdTf0AHIDEa4dL4"/>\n\n<title>List Most Popular Anime Of All Time at Anime Series</title>\n\n<meta name="robots" content="noodp, noydir" />\n<meta name="description" content="List Most Popular Anime Of All Time at Anime Series">\n<meta name="keywords" content="Most Popular Anime">\n<meta itemprop="image" content="https://animeseries.so/images/logo.png"/>\n\n<meta property="og:site_name" content="Anime TV"/>\n<meta property="

Este es el resultado obtenido en HTML de la página, pero es realmente difícil de leer...

Pero para eso usamos BeautifulSoup

Cómo lo hacemos?..

Creamos un objeto BeautifulSoup llamado soup con la siguiente línea de código:

In [6]:
soup = bs(html, "html.parser")

bs?

> from bs4 import BeautifulSoup as bs

El primer parámetro del método bs() es html (que fue la variable en la que guardamos ese contenido HTML difícil de leer de la URL de los libros más vendidos)

El segundo parámetro ('html.parser'), es el parser que se usa en html 

Ahora vamos a ver el cambio

In [7]:
print(soup)

<!DOCTYPE html>

<html itemscope="" itemtype="http://schema.org/WebPage" lang="en-US" xmlns="http://www.w3.org/1999/xhtml">
<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb# article: http://ogp.me/ns/article#">
<meta charset="utf-8"/>
<meta content="width=device-width, initial-scale=1.0, minimum-scale=1.0, user-scalable=no" name="viewport"/>
<link href="https://gmpg.org/xfn/11" rel="profile"/>
<link href="https://animeseries.so/favicon.png" rel="shortcut icon"/>
<meta content="F64RcKpc425o569H2C1hLW7A9ZObUdTf0AHIDEa4dL4" name="google-site-verification"/>
<title>List Most Popular Anime Of All Time at Anime Series</title>
<meta content="noodp, noydir" name="robots"/>
<meta content="List Most Popular Anime Of All Time at Anime Series" name="description"/>
<meta content="Most Popular Anime" name="keywords"/>
<meta content="https://animeseries.so/images/logo.png" itemprop="image">
<meta content="Anime TV" property="og:site_name">
<meta content="en_US" property="og:locale"/>
<meta

## Cómo navegar por un objeto de Beautiful Soup

HTML consta de elementos como enlaces, párrafos, encabezados, bloques, etc. Estos elementos están envueltos entre etiquetas; dentro de la etiqueta de apertura y cierre se puede encontrar el contenido del elemento.

![image](img\html-content-web-scraping.png)

Los elementos HTML también pueden tener atributos que contienen información adicional sobre el elemento. Los atributos se definen en las etiquetas de apertura con la siguiente sintaxis: nombre del atributo = "valor del atributo".

![image](img\attribute-example-for-web-scraping-1536x386.png)

Ahora que hemos aprendido algo de HTML básico, finalmente podemos comenzar a extraer datos de soup. Simplemente escriba un nombre de etiqueta después de soup y un punto (como soup.title), y observe cómo se desarrolla la magia:

In [8]:
soup.title

<title>List Most Popular Anime Of All Time at Anime Series</title>

In [9]:
soup.h1

<h1 class="search-title">Most Popular</h1>

In [10]:
print(soup.h1)

<h1 class="search-title">Most Popular</h1>


Y sí queremos solo el texto?..

In [17]:
soup.h1.get_text() #es lo mismo
soup.h1.text

'Most Popular'

¿Qué sucede si solo necesita el atributo de un elemento? Tampoco hay problema:

In [12]:
soup.a

<a class="up-down" href="javascript:void(0)"><img alt="up-dow" src="https://animeseries.so/img/mobi/up_down.png"/> </a>

In [13]:
soup.img['src']

'https://animeseries.so/img/mobi/up_down.png'

In [14]:
soup.img.get('src') #el get nos permite que no entre en error el codigo porque tiene los mismo atributos del get de los diccionarios

'https://animeseries.so/img/mobi/up_down.png'

También podemos..
> soup.a.get("href")

La sintaxis de soup.```cualquier_etiqueta``` devuelve solo el primer elemento con ese nombre de etiqueta. En lugar de soup.```cualquier_etiqueta```, también puedes usar el método .find() y obtendrás exactamente el mismo resultado:

In [18]:
print("Sin utilizar .find()")
print(soup.h1)
print("Utilizando .find()")
print(soup.find("h1"))

Sin utilizar .find()
<h1 class="search-title">Most Popular</h1>
Utilizando .find()
<h1 class="search-title">Most Popular</h1>


A menudo, no solo necesitas uno, sino todos los elementos (por ejemplo, cada enlace en una página). Para eso es bueno el método .find_all():

In [19]:
soup.find_all('a')

[<a class="up-down" href="javascript:void(0)"><img alt="up-dow" src="https://animeseries.so/img/mobi/up_down.png"/> </a>,
 <a href="/"><img alt="animetv" src="https://animeseries.so/img/icon/logo.png"/> </a>,
 <a href="https://animeseries.so/" title="Home">Home</a>,
 <a href="https://animeseries.so/list.html" title="Anime list">Anime List</a>,
 <a href="https://animeseries.so/anime-movies" title="Anime Movies">Anime Movies</a>,
 <a href="https://animeseries.so/fall-2023-anime.html" title="Fall 2023 Anime">Fall 2023 Anime</a>,
 <a href="https://animeseries.so/calendar.html" title="Anime Calendar">Anime Calendar</a>,
 <a href="https://animeseries.so/popular-anime" title="Popular Anime">Popular</a>,
 <a href="/login.html" title="login animetv">Login</a>,
 <a href="/register.html" title="register animetv">Sign up</a>,
 <a href="/list.html" title="Anime List">All</a>,
 <a href="/search/character=special" title="Anime List With Special Character">#</a>,
 <a href="/search/character=A" title="

Si nos fijamos podemos ver que lo que nos devuelve es una lista..

Qué podemos hacer con una lista?..

In [20]:
all_a = soup.find_all('a')
for a in all_a[2:5]:
    print(a.text)

Home
Anime List
Anime Movies


Ahora vamos a tomar el grid principal para buscar los animes en toda la página

In [22]:
grid = soup.find_all('div', class_ = 'content_episode revent datagrild')

Cantidad de paginas

In [33]:
soup.find('li', class_='last').find('a')

<a data-page="1" href="?page=215">&gt;&gt;</a>

In [24]:
href_valor = soup.find_all('li', class_='last')[0].find('a').get('href')

numero_pagina = re.search(r'page=(\d+)', href_valor)

if numero_pagina:
    numero_pagina = numero_pagina.group(1)
numero_pagina

'215'

Se itera sobre la lista de elementos contenidos en el grid

In [25]:
for items in grid[:1]:
    animes = items.find_all('div', class_ = 'name')
    url_anime = items.find_all('a')
    
anime = animes[0].text
anime_link = url_anime[0].get('href')

Se obtiene el la lista de animes y urls pero no esta completa

In [34]:
print('Titulo: ', anime)
print('--*--'*20)
print('Link parcial: ', anime_link)

Titulo:  Tate no Yuusha no Nariagari Season 3
--*----*----*----*----*----*----*----*----*----*----*----*----*----*----*----*----*----*----*----*--
Link parcial:  /anime/tate-no-yuusha-no-nariagari-season-3.html


Para construir la url completa se necesita la url base

In [35]:
base = 'https://animeseries.so'

Uniendo la url base con la obtenida anteriormente se completa la url de cada anime

In [36]:
new_url = base + anime_link
new_url

'https://animeseries.so/anime/tate-no-yuusha-no-nariagari-season-3.html'

Es necesario repetir los pasos anteriores para la nueva url

Se crea una Sopa nueva

In [37]:
response = requests.get(new_url)
soup2 = bs(response.content, "html.parser")

Estando dentro de esta nueva página se vuelve a inspeccionar

Se tomara el recuadro mas externo porque es el que contiene toda la información

In [38]:
main_body = soup2.find_all('div', class_ = 'main_body')

Para la imagen necesitamos el recuadro de la izquierda

In [53]:
recuadro_izq = main_body[0].find_all('div', class_ = 'left')
recuadro_izq

[<div class="left">
 <img alt="Tate no Yuusha no Nariagari Season 3" class="img-responsive" src="https://gogocdn.net/cover/tate-no-yuusha-no-nariagari-season-3-1698302959.png"/>
 </div>,
 <div class="left">View more video</div>]

Para la información el de la derecha

In [54]:
recuadro_der = main_body[0].find_all('div', class_ = 'right')
recuadro_der

[<div class="right">
 <h1>Tate no Yuusha no Nariagari Season 3</h1>
 <a class="bookmark bookmark-manage" href="javascript:void(0)">Click to manage book marks</a>
 <a class="chrome-notify" onclick="openWindow('https://notify.animetv.to/?name=Tate+no+Yuusha+no+Nariagari+Season+3&amp;id=MTAxNDM=', '_blank', 'Battle Spirits: Double Drive Episode 29')" style="display: none; position: absolute; right: 10px">
 <img alt="chrome" src="https://animeseries.so/chrome/icon.png" style="position: relative; top: 3px"> Subscribe
               </img></a>
 <div><span>Description</span></div>
 <p>Third season of Tate no Yuusha no Nariagari.</p>
 <p class="des"><span>Other name:</span>The Rising of the Shield Hero Season 3, 盾の勇者の成り上がり Season 3</p>
 <p class="des"><span>Country:</span>Japanese</p>
 <p class="des"><span>Status:</span>
 <a href="/ongoing.html" title="Ongoing Anime">Ongoing</a>
 </p>
 <p class="des"><span>Released </span><a href="/released-in-2023.html" title="Anime in 2023">2023</a></p>
 <p 

Obtenemos la url de la imagen primero

In [55]:
imagen = recuadro_izq[0].find('img').get('src')
imagen

'https://gogocdn.net/cover/tate-no-yuusha-no-nariagari-season-3-1698302959.png'

Ahora con el recuadro derecho obtenemos la informacion:

- Descripción
- Otros nombres
- Pais
- Status
- Fecha
- Genero
- Tipo
- Temporada
- Episodios

Etiqueta

In [42]:
etiqueta = recuadro_der[0]

Descripción

In [43]:
descripcion = etiqueta.find('p').text
print('Descripcion: ',descripcion)

Descripcion:  Third season of Tate no Yuusha no Nariagari.


Otros Titulos

In [61]:
elementos_p = etiqueta.find_all('p', class_='des')

texto_deseado = elementos_p[0].get_text(separator=' ', strip=True)

span_text = elementos_p[0].find('span').get_text(strip=True)
otros_titulos = texto_deseado.replace(span_text, '', 1).strip()
otros_titulos

'The Rising of the Shield Hero Season 3, 盾の勇者の成り上がり Season 3'

Pais

In [45]:
elementos_p = etiqueta.find_all('p', class_='des')

texto_deseado = elementos_p[1].get_text(separator=' ', strip=True)

span_text = elementos_p[1].find('span').get_text(strip=True)
pais = texto_deseado.replace(span_text, '', 1).strip()
pais

'Japanese'

Status, Fecha, Generos

In [68]:
temporada = list()
genero = list()
for i in etiqueta.find_all('a')[2:]:
    temporada.append(i.text)

In [69]:
status, fecha = temporada[:2]
genero = temporada[2:]
genero = ', '.join(genero)

print('Status: ',status)
print('Fecha: ', fecha)
print('Generos: ',genero)

Status:  Ongoing
Fecha:  2023
Generos:  Action, Adventure, Drama, Fantasy, Isekai


Episodios, Tipo

In [70]:
listaEpisodios = main_body[0].find_all('div',class_='list_episode')

try:
    texto = listaEpisodios[0].find('span',class_='name').text
    texto = re.search(r'Episode [0-9]+',texto)
    episodios = re.search('[0-9]+', texto[0])[0]
    if int(episodios) > 0 and int(episodios) < 2:
        tipo = 'Pelicula'
    else:
        tipo = 'Serie'
except:
    episodios = None
    tipo = None

Temporada

In [71]:
def season_word_to_number(word):
    word_to_number = {
        'first': '1',
        'second': '2',
        'third': '3',
        'fourth': '4',
        'fifth': '5',
    }
    return word_to_number.get(word.lower())

In [72]:
match = re.search(r"Season (\d+)", anime)
if match:
    temporada = match.group(1)
else:
    temporada = None

if temporada is None:
    match_descripcion = re.search(r"(first|second|third|fourth|fifth) season", descripcion, re.IGNORECASE)
    if match_descripcion:
        temporada_palabra = match_descripcion.group(1)
        temporada = season_word_to_number(temporada_palabra)

In [73]:
anime_dicc = {
    'Titulo': anime,
    'Alternativos': otros_titulos,
    'Descripcion': descripcion,
    'Status': status,
    'Genre': genero,
    'Tipo': tipo,  
    'Episodes': episodios,
    'Temporada': temporada,
    'Fecha': fecha,
    'Pais': pais,
    'Imagen': imagen,
    'URL': new_url
}

In [74]:
pd.DataFrame([anime_dicc])

Unnamed: 0,Titulo,Alternativos,Descripcion,Status,Genre,Tipo,Episodes,Temporada,Fecha,Pais,Imagen,URL
0,Tate no Yuusha no Nariagari Season 3,"The Rising of the Shield Hero Season 3, 盾の勇者の成...",Third season of Tate no Yuusha no Nariagari.,Ongoing,"Action, Adventure, Drama, Fantasy, Isekai",Serie,9,3,2023,Japanese,https://gogocdn.net/cover/tate-no-yuusha-no-na...,https://animeseries.so/anime/tate-no-yuusha-no...


Teniendo todos los elementos realizamos al automatización

In [75]:
anime_dicc = {
    'Titulo': [],
    'Alternativos': [],
    'Descripcion': [],
    'Status': [],
    'Genre': [],
    'Tipo': [],  
    'Episodios': [],
    'Temporada': [],
    'Fecha': [],
    'Pais': [],
    'Imagen': [],
    'URL': []
}

base = 'https://animeseries.so'


def season_word_to_number(word):
    word_to_number = {
        'first': '1',
        'second': '2',
        'third': '3',
        'fourth': '4',
        'fifth': '5',
    }
    return word_to_number.get(word.lower())

url = f"https://animeseries.so/popular-anime"
response = requests.get(url)
soup = bs(response.content, "html.parser")

href_valor = soup.find_all('li', class_='last')[0].find('a').get('href')

numero_pagina = re.search(r'page=(\d+)', href_valor)

if numero_pagina:
    numero_pagina = numero_pagina.group(1)

# for page in range(1,int(numero_pagina)+1):
for page in range(1,3):
    
    print(f"\rProcessing page {page}/{len(range(1, 3))}..")
    
    url = f"https://animeseries.so/popular-anime?page={page}"
    response = requests.get(url)
    soup = bs(response.content, "html.parser")

    grid = soup.find_all('div', class_ = 'content_episode revent datagrild')

    animes = [anime.text for anime in grid[0].find_all('div', class_ = 'name')]
    enlaces_filtrados = [a for a in grid[0].find_all('a') if a.has_attr('title')]
    animes_url = [base+a.get('href') for a in enlaces_filtrados]

    for ind,anime_url in enumerate(animes_url):
        
        print(f"\rProcessing {ind+1}/{len(animes_url)}..")
        
        response = requests.get(anime_url)
        soup2 = bs(response.content, "html.parser")
        main_body = soup2.find_all('div', class_ = 'main_body')
        
        recuadro_izq = main_body[0].find_all('div', class_ = 'left')
        imagen = recuadro_izq[0].find('img').get('src')
        
        recuadro_der = main_body[0].find_all('div', class_ = 'right')
        etiqueta = recuadro_der[0]
        descripcion = etiqueta.find('p').text
        elementos_p = etiqueta.find_all('p', class_='des')
        resultados = [(p.get_text(separator=' ', strip=True).replace(p.find('span').get_text(strip=True), '', 1).strip()) for p in elementos_p]
        otros_titulos = resultados[0]
        pais = resultados[1]
        enlaces = etiqueta.find_all('a')[2:]
        temporada = [i.text for i in enlaces]
        status, fecha, *generos = temporada
        genero = ', '.join(generos)
        listaEpisodios = main_body[0].find_all('div',class_='list_episode')
        try:
            texto = listaEpisodios[0].find('span',class_='name').text
            texto = re.search(r'Episode [0-9]+',texto)
            episodios = re.search('[0-9]+', texto[0])[0]
            if int(episodios) > 0 and int(episodios) < 2:
                tipo = 'Pelicula'
            else:
                tipo = 'Serie'
        except:
            episodios = None
            tipo = None
        
        anime_dicc['Titulo'].append(animes[ind])
        anime_dicc['Alternativos'].append(otros_titulos)
        anime_dicc['Descripcion'].append(descripcion)
        anime_dicc['Status'].append(status)
        anime_dicc['Genre'].append(genero)
        anime_dicc['Tipo'].append(tipo)  
        anime_dicc['Episodios'].append(episodios)
        anime_dicc['Temporada'].append(temporada)
        anime_dicc['Fecha'].append(fecha)
        anime_dicc['Pais'].append(pais)
        anime_dicc['Imagen'].append(imagen)
        anime_dicc['URL'].append(anime_url)
    
df = pd.DataFrame(anime_dicc)
print('\rWeb Scraping Complete')

Processing page 1/2..
Processing 1/60..
Processing 2/60..
Processing 3/60..
Processing 4/60..
Processing 5/60..
Processing 6/60..
Processing 7/60..
Processing 8/60..
Processing 9/60..
Processing 10/60..
Processing 11/60..
Processing 12/60..
Processing 13/60..
Processing 14/60..
Processing 15/60..
Processing 16/60..
Processing 17/60..
Processing 18/60..
Processing 19/60..
Processing 20/60..
Processing 21/60..
Processing 22/60..
Processing 23/60..
Processing 24/60..
Processing 25/60..
Processing 26/60..
Processing 27/60..
Processing 28/60..
Processing 29/60..
Processing 30/60..
Processing 31/60..
Processing 32/60..
Processing 33/60..
Processing 34/60..
Processing 35/60..
Processing 36/60..
Processing 37/60..
Processing 38/60..
Processing 39/60..
Processing 40/60..
Processing 41/60..
Processing 42/60..
Processing 43/60..
Processing 44/60..
Processing 45/60..
Processing 46/60..
Processing 47/60..
Processing 48/60..
Processing 49/60..
Processing 50/60..
Processing 51/60..
Processing 52/60..

In [77]:
df.shape

(120, 12)

In [None]:
anime_dicc = {
    'Titulo': [],
    'Alternativos': [],
    'Descripcion': [],
    'Status': [],
    'Genre': [],
    'Tipo': [],  
    'Episodios': [],
    'Temporada': [],
    'Fecha': [],
    'Pais': [],
    'Imagen': [],
    'URL': []
}

base = 'https://animeseries.so'


def season_word_to_number(word):
    word_to_number = {
        'first': '1',
        'second': '2',
        'third': '3',
        'fourth': '4',
        'fifth': '5',
    }
    return word_to_number.get(word.lower())

letras = list(ascii_uppercase)
letras.insert(0,"special")

# for alphabet in letras:
for page in [letras[0]]:
    
    print(f"\rProcessing page {page}/{len([letras[0]])}..")
    
    url = f"https://animeseries.so/search/character={page}"
    response = requests.get(url)
    soup = bs(response.content, "html.parser")

    grid = soup.find_all('div', class_ = 'content_episode revent datagrild')

    animes = [anime.text for anime in grid[0].find_all('div', class_ = 'name')]
    enlaces_filtrados = [a for a in grid[0].find_all('a') if a.has_attr('title')]
    animes_url = [base+a.get('href') for a in enlaces_filtrados]

    for ind,anime_url in enumerate(animes_url):
        
        print(f"\rProcessing {ind+1}/{len(animes_url)}..")
        
        response = requests.get(anime_url)
        soup2 = bs(response.content, "html.parser")
        main_body = soup2.find_all('div', class_ = 'main_body')
        
        recuadro_izq = main_body[0].find_all('div', class_ = 'left')
        imagen = recuadro_izq[0].find('img').get('src')
        
        recuadro_der = main_body[0].find_all('div', class_ = 'right')
        etiqueta = recuadro_der[0]
        descripcion = etiqueta.find('p').text
        elementos_p = etiqueta.find_all('p', class_='des')
        resultados = [(p.get_text(separator=' ', strip=True).replace(p.find('span').get_text(strip=True), '', 1).strip()) for p in elementos_p]
        otros_titulos = resultados[0]
        pais = resultados[1]
        enlaces = etiqueta.find_all('a')[2:]
        temporada = [i.text for i in enlaces]
        status, fecha, *generos = temporada
        genero = ', '.join(generos)
        listaEpisodios = main_body[0].find_all('div',class_='list_episode')
        try:
            texto = listaEpisodios[0].find('span',class_='name').text
            texto = re.search(r'Episode [0-9]+',texto)
            episodios = re.search('[0-9]+', texto[0])[0]
            if int(episodios) > 0 and int(episodios) < 2:
                tipo = 'Pelicula'
            else:
                tipo = 'Serie'
        except:
            episodios = None
            tipo = None
        
        anime_dicc['Titulo'].append(animes[ind])
        anime_dicc['Alternativos'].append(otros_titulos)
        anime_dicc['Descripcion'].append(descripcion)
        anime_dicc['Status'].append(status)
        anime_dicc['Genre'].append(genero)
        anime_dicc['Tipo'].append(tipo)  
        anime_dicc['Episodios'].append(episodios)
        anime_dicc['Temporada'].append(temporada)
        anime_dicc['Fecha'].append(fecha)
        anime_dicc['Pais'].append(pais)
        anime_dicc['Imagen'].append(imagen)
        anime_dicc['URL'].append(anime_url)
    
df = pd.DataFrame(anime_dicc)
print('\rWeb Scraping Complete')