In [45]:
import requests

def get_content(url):
    response = requests.get(url)
    if response.status_code == 200:
        return response.text

In [46]:
from bs4 import BeautifulSoup


def get_basic_info(soup):
    div_page = soup.find('div', class_ = 'td-page-content')
    paragrafo = div_page.findAll('p')[1]
    ems = paragrafo.findAll('em')
    data = {}
    for i in ems:
        chave, valor, *_ = i.text.split(':')
        chave = chave.strip(' ')
        data[chave] = valor.strip(' ')
    return data 

In [47]:
def get_appearances(soup):
    lis =  soup.find('div', class_ = 'td-page-content').find('h4').findNext().findAll('li')
    return [i.text for i in lis]

In [48]:
def get_character_data(url):
    response = requests.get(url)
    if response.status_code != 200:
        return {}
    else:
        soup = BeautifulSoup(response.text)

        data = get_basic_info(soup)
        data['Aparições'] = get_appearances(soup)

        return  data

In [49]:
def getAllCharacters():
    url = 'https://www.residentevildatabase.com/personagens/'
    soup_charachters = BeautifulSoup(get_content(url))
    anchors = soup_charachters.find('div', class_ = 'td-page-content').findAll('a')

    links = [i.get('href') for i in anchors]  
    return links

In [50]:
from tqdm import tqdm

links = getAllCharacters()

data = []

for i in tqdm(links):
    d = get_character_data(i)
    d["Link"] = i
    name = i.strip('/').split('/')[-1].replace('-', ' ').title()
    d['Nome'] = name
    data.append(d)

100%|██████████| 164/164 [00:27<00:00,  5.92it/s]


In [51]:
data

[{'Ano de nascimento': '1974 (24 anos em 1998)',
  'Tipo sanguíneo': 'AB',
  'Altura': 'Desconhecida.',
  'Peso': 'Desconhecido.',
  'Aparições': ['Biohazard / Resident Evil 2 (1998)',
   'Biohazard / Resident Evil 4 (2005)',
   'Biohazard / Resident Evil: The Umbrella Chronicles (2007)',
   'Biohazard / Resident Evil: The Darkside Chronicles (2009)',
   'Biohazard / Resident Evil: Operation Raccoon City (2012)',
   'Biohazard / Resident Evil: Damnation (2012)',
   'Biohazard / Resident Evil 6 (2012)',
   'Biohazard RE:2 / Resident Evil 2 (2019)',
   'Biohazard RE:4 / Resident Evil 4 (2023)'],
  'link': 'https://www.residentevildatabase.com/ada-wong/',
  'nome': 'Ada Wong'},
 {'Ano de nascimento': 'Desconhecido.',
  'Tipo sanguíneo': 'Desconhecido.',
  'Altura': 'Desconhecida.',
  'Peso': 'Desconhecido.',
  'Aparições': ['Biohazard / Resident Evil 6 (2012)'],
  'link': 'https://www.residentevildatabase.com/adam-benford/',
  'nome': 'Adam Benford'},
 {'Ano de nascimento': 'Desconhecido.

In [53]:
import pandas as pd

df = pd.DataFrame(data)
df

Unnamed: 0,Ano de nascimento,Tipo sanguíneo,Altura,Peso,Aparições,link,nome,de nascimento
0,1974 (24 anos em 1998),AB,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 2 (1998), Biohazard...",https://www.residentevildatabase.com/ada-wong/,Ada Wong,
1,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,[Biohazard / Resident Evil 6 (2012)],https://www.residentevildatabase.com/adam-benf...,Adam Benford,
2,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 7 (2017), Biohazard...",https://www.residentevildatabase.com/alan-doug...,Alan Douglas,
3,1960,O,"1,83cm (em jogos antigos); 1,90cm (em RE5)","84,5kg (em jogos antigos); 90kg (em RE5)","[Biohazard / Resident Evil Clássico (1996), Bi...",https://www.residentevildatabase.com/albert-we...,Albert Wesker,
4,Desconhecido.,Desconhecido.,"2,90m (aprox.)",Desconhecido.,[Biohazard / Resident Evil Village (2021)],https://www.residentevildatabase.com/alcina-di...,Alcina Dimitrescu,
...,...,...,...,...,...,...,...,...
159,1962 (não confirmado).,O,"1,78cm","66,7kg","[Biohazard / Resident Evil 0 (2003), Biohazard...",https://www.residentevildatabase.com/william-b...,William Birkin,
160,desconhecido.,desconhecido.,desconhecida.,desconhecido.,[Biohazard / Resident Evil: Operation Raccoon ...,https://www.residentevildatabase.com/willow-ca...,Willow Caroline Floyd,
161,Desconhecido.,Desconhecido.,Desconhecido.,Desconhecido.,[BIOHAZARD / RESIDENT EVIL: Infinite Darkness ...,https://www.residentevildatabase.com/wilson-se...,Wilson Secretario Seguranca,
162,1978 (20 anos em 1998),Desconhecido.,"1,63m",58kg,"[Biohazard / Resident Evil Outbreak (2003), Bi...",https://www.residentevildatabase.com/yoko-suzuki/,Yoko Suzuki,


In [54]:
df[~df['de nascimento'].isna()]

Unnamed: 0,Ano de nascimento,Tipo sanguíneo,Altura,Peso,Aparições,link,nome,de nascimento
101,,A,"1,78cm (em jogos antigos); 1,80cm (em RE4)","70,2kg (em jogos antigos); desconhecido (em RE4)","[Biohazard / Resident Evil 2 (1998), Biohazard...",https://www.residentevildatabase.com/leon-s-ke...,Leon S Kennedy,1977 (não confirmado)


In [58]:
df.to_json('re_data.json', index=False)

In [61]:
df.to_parquet('re_data.parquet', index=False)

In [62]:
df_parquet = pd.read_parquet('re_data.parquet')
df_parquet

Unnamed: 0,Ano de nascimento,Tipo sanguíneo,Altura,Peso,Aparições,link,nome,de nascimento
0,1974 (24 anos em 1998),AB,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 2 (1998), Biohazard...",https://www.residentevildatabase.com/ada-wong/,Ada Wong,
1,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,[Biohazard / Resident Evil 6 (2012)],https://www.residentevildatabase.com/adam-benf...,Adam Benford,
2,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 7 (2017), Biohazard...",https://www.residentevildatabase.com/alan-doug...,Alan Douglas,
3,1960,O,"1,83cm (em jogos antigos); 1,90cm (em RE5)","84,5kg (em jogos antigos); 90kg (em RE5)","[Biohazard / Resident Evil Clássico (1996), Bi...",https://www.residentevildatabase.com/albert-we...,Albert Wesker,
4,Desconhecido.,Desconhecido.,"2,90m (aprox.)",Desconhecido.,[Biohazard / Resident Evil Village (2021)],https://www.residentevildatabase.com/alcina-di...,Alcina Dimitrescu,
...,...,...,...,...,...,...,...,...
159,1962 (não confirmado).,O,"1,78cm","66,7kg","[Biohazard / Resident Evil 0 (2003), Biohazard...",https://www.residentevildatabase.com/william-b...,William Birkin,
160,desconhecido.,desconhecido.,desconhecida.,desconhecido.,[Biohazard / Resident Evil: Operation Raccoon ...,https://www.residentevildatabase.com/willow-ca...,Willow Caroline Floyd,
161,Desconhecido.,Desconhecido.,Desconhecido.,Desconhecido.,[BIOHAZARD / RESIDENT EVIL: Infinite Darkness ...,https://www.residentevildatabase.com/wilson-se...,Wilson Secretario Seguranca,
162,1978 (20 anos em 1998),Desconhecido.,"1,63m",58kg,"[Biohazard / Resident Evil Outbreak (2003), Bi...",https://www.residentevildatabase.com/yoko-suzuki/,Yoko Suzuki,


In [64]:
# Binary that python understands. Objects serializer
# Saves the object state in the HD
# Other python scripts may read and deserialize the object to use
df.to_pickle('re_data.pkl')

In [65]:
df_pickle = pd.read_pickle('re_data.pkl')
df_pickle

Unnamed: 0,Ano de nascimento,Tipo sanguíneo,Altura,Peso,Aparições,link,nome,de nascimento
0,1974 (24 anos em 1998),AB,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 2 (1998), Biohazard...",https://www.residentevildatabase.com/ada-wong/,Ada Wong,
1,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,[Biohazard / Resident Evil 6 (2012)],https://www.residentevildatabase.com/adam-benf...,Adam Benford,
2,Desconhecido.,Desconhecido.,Desconhecida.,Desconhecido.,"[Biohazard / Resident Evil 7 (2017), Biohazard...",https://www.residentevildatabase.com/alan-doug...,Alan Douglas,
3,1960,O,"1,83cm (em jogos antigos); 1,90cm (em RE5)","84,5kg (em jogos antigos); 90kg (em RE5)","[Biohazard / Resident Evil Clássico (1996), Bi...",https://www.residentevildatabase.com/albert-we...,Albert Wesker,
4,Desconhecido.,Desconhecido.,"2,90m (aprox.)",Desconhecido.,[Biohazard / Resident Evil Village (2021)],https://www.residentevildatabase.com/alcina-di...,Alcina Dimitrescu,
...,...,...,...,...,...,...,...,...
159,1962 (não confirmado).,O,"1,78cm","66,7kg","[Biohazard / Resident Evil 0 (2003), Biohazard...",https://www.residentevildatabase.com/william-b...,William Birkin,
160,desconhecido.,desconhecido.,desconhecida.,desconhecido.,[Biohazard / Resident Evil: Operation Raccoon ...,https://www.residentevildatabase.com/willow-ca...,Willow Caroline Floyd,
161,Desconhecido.,Desconhecido.,Desconhecido.,Desconhecido.,[BIOHAZARD / RESIDENT EVIL: Infinite Darkness ...,https://www.residentevildatabase.com/wilson-se...,Wilson Secretario Seguranca,
162,1978 (20 anos em 1998),Desconhecido.,"1,63m",58kg,"[Biohazard / Resident Evil Outbreak (2003), Bi...",https://www.residentevildatabase.com/yoko-suzuki/,Yoko Suzuki,
