# Util Functions
---

- ### Formatar uma saída.

In [23]:
def get_formatted_message(poke_info):
    type_label = 'Types' if len(poke_info['types']) > 1 else 'Type'

    return """\
########################################################################################
# Index: %d
# Name: %s / %s (%s)
# Caregory: %s
# %s: %s
########################################################################################
    """ % (
        poke_info['core']['index'],
        poke_info['core']['name'],
        poke_info['core']['jp_name'],
        poke_info['core']['jp_rom_name'],
        poke_info['core']['category'],
        type_label,
        ' / '.join(poke_info['types'])
    )


---
&nbsp;
- ### Recriar arquivos dado o nome.

In [24]:
import os

def recreate_file(file_name):
    if (os.path.exists(file_name)):
        os.remove(file_name)

    open(file_name, 'x')



# Core Functions
---

- ### Carregar a página destino e retornar o soup.

In [25]:
from urllib.request import urlopen as uOpen, Request as uReq
from bs4 import BeautifulSoup as soup

def get_poke_soup(link):
    uClient         = uReq(link, headers={'User-Agent': 'Magic Browser'})
    uCon            = uOpen(uClient)
    poke_page_html  = uCon.read()
    uCon.close()
    
    return soup(poke_page_html, 'html.parser')

---
&nbsp;
- ### Checar se é a última página a ser verificada.
    - Em alguns casos, quando tá perto do lançamento de um novo jogo e só se tem informação de um ou mais pokémons, às vezes o Bulbapédia coloca informações não oficiais com um layout diferente.

In [26]:
def check_last_page(poke_soup):
    return poke_soup.find(id='mw-content-text').table.a['href'] == "/wiki/File:BulbaShadow.png"

---
&nbsp;
- ### Pegar informações do Pokémon
    - Essa é a função core, todas as funções de extração de dados são chamadas aqui.

In [27]:
def get_poke_info(poke_soup):
    info_table = poke_soup                      \
                    .find(id='mw-content-text') \
                    .find_all('table', recursive=False)[1]

    core  = get_core_poke_info(info_table)
    types = get_poke_types(info_table)
    
    return {
        'core': {
            'index':       core[0],
            'name':        core[1],
            'category':    core[2],
            'jp_name':     core[3],
            'jp_rom_name': core[4]
        },
        'types': types
    }

# Data Extraction Functions
---

- ### Pegar o link do próximo pokémon
    - Nessa parte da página, o Bulbapédia pode colocar trs a mais pra informar algo (geralmente relacionado ao Pokemon Go), por isso esse tratamento.

In [28]:
def get_next_pokemon_link(poke_soup):
    npl = poke_soup.find(id='mw-content-text').table
    try:
        npl = npl.findChildren('tr', recursive=False)[1]    \
                 .findChildren('td', recursive=False)[2]
    except IndexError:
        npl = npl.findChildren('tr', recursive=False)[0]    \
                 .findChildren('td', recursive=False)[2]
    finally:
        return npl.find('a')['href']            

---
&nbsp;
- ### Pegar informações core do pokémon:
    - Index (número na NationalDex)
    - Nome
    - Categoria
    - Nome (JP)
    - Nome (JP/Romaji)

In [29]:
def get_core_poke_info(info_table):
    base_info_container = info_table.tr.td.table.tr

    info_container = base_info_container.td.table.tr      \
                        .find_all('td', recursive=False)
    
    return (
        int(base_info_container.th.find('a').text.replace('#', '')), # index

        info_container[0].big.text,                                  # name
        info_container[0].a.text,                                    # category
        info_container[1].span.text,                                 # jp_name
        info_container[1].i.text                                     # jp_rom_name
    )

---
&nbsp;
- ### Pegar tipos do pokémon.

In [30]:
def get_poke_types(info_table):
    types = info_table.find_all('tr', recursive=False)[1]           \
                        .table.find('td', attrs={'style': None})    \
                        .find_all('a')
    
    return [t.text for t in types if t.text != 'Unknown']


# Main Cycle
---

- ### Constantes

In [31]:
    BASE_URL  = 'https://bulbapedia.bulbagarden.net'
    END_URL   = '/wiki/%3F%3F%3F_(Pok%C3%A9mon)'
    FILE_NAME = 'pokemon_list.txt'

---
&nbsp;
- ### Main

In [32]:
    recreate_file(FILE_NAME)

    with open(FILE_NAME, 'w') as f:
        next_pokemon_link = '/wiki/Bulbasaur_%28Pok%C3%A9mon%29'

        while(True):
            poke_soup = get_poke_soup(f'{BASE_URL}{next_pokemon_link}')
            if check_last_page(poke_soup):
                break
            
            poke_info = get_poke_info(poke_soup)
            message   = get_formatted_message(poke_info)

            f.write(message + '\n')
            print(message)

            next_pokemon_link = get_next_pokemon_link(poke_soup)
            if (next_pokemon_link == END_URL):
                break
            

        print("\n\n########## FINISHED ##########\n\n")


########################################################################################
# Index: 1
# Name: Bulbasaur / フシギダネ (Fushigidane)
# Caregory: Seed Pokémon
# Types: Grass / Poison
########################################################################################
    
########################################################################################
# Index: 2
# Name: Ivysaur / フシギソウ (Fushigisou)
# Caregory: Seed Pokémon
# Types: Grass / Poison
########################################################################################
    
########################################################################################
# Index: 3
# Name: Venusaur / フシギバナ (Fushigibana)
# Caregory: Seed Pokémon
# Types: Grass / Poison
########################################################################################
    
########################################################################################
# Index: 4
# Name: Charmander / ヒトカゲ (Hitokage)
# Caregory: Lizard

########################################################################################
# Index: 31
# Name: Nidoqueen / ニドクイン (Nidoqueen)
# Caregory: Drill Pokémon
# Types: Poison / Ground
########################################################################################
    
########################################################################################
# Index: 32
# Name: Nidoran♂ / ニドラン♂ (Nidoran♂)
# Caregory: Poison Pin Pokémon
# Type: Poison
########################################################################################
    
########################################################################################
# Index: 33
# Name: Nidorino / ニドリーノ (Nidorino)
# Caregory: Poison Pin Pokémon
# Type: Poison
########################################################################################
    
########################################################################################
# Index: 34
# Name: Nidoking / ニドキング (Nidoking)
# Caregory: Drill Pokémon

########################################################################################
# Index: 61
# Name: Poliwhirl / ニョロゾ (Nyorozo)
# Caregory: Tadpole Pokémon
# Type: Water
########################################################################################
    
########################################################################################
# Index: 62
# Name: Poliwrath / ニョロボン (Nyorobon)
# Caregory: Tadpole Pokémon
# Types: Water / Fighting
########################################################################################
    
########################################################################################
# Index: 63
# Name: Abra / ケーシィ (Casey)
# Caregory: Psi Pokémon
# Type: Psychic
########################################################################################
    
########################################################################################
# Index: 64
# Name: Kadabra / ユンゲラー (Yungerer)
# Caregory: Psi Pokémon
# Type: Psychic
###

########################################################################################
# Index: 91
# Name: Cloyster / パルシェン (Parshen)
# Caregory: Bivalve Pokémon
# Types: Water / Ice
########################################################################################
    
########################################################################################
# Index: 92
# Name: Gastly / ゴース (Ghos)
# Caregory: Gas Pokémon
# Types: Ghost / Poison
########################################################################################
    
########################################################################################
# Index: 93
# Name: Haunter / ゴースト (Ghost)
# Caregory: Gas Pokémon
# Types: Ghost / Poison
########################################################################################
    
########################################################################################
# Index: 94
# Name: Gengar / ゲンガー (Gangar)
# Caregory: Shadow Pokémon
# Types: Ghost / 

########################################################################################
# Index: 121
# Name: Starmie / スターミー (Starmie)
# Caregory: Mysterious Pokémon
# Types: Water / Psychic
########################################################################################
    
########################################################################################
# Index: 122
# Name: Mr. Mime / バリヤード (Barrierd)
# Caregory: Barrier Pokémon
# Types: Psychic / Fairy
########################################################################################
    
########################################################################################
# Index: 123
# Name: Scyther / ストライク (Strike)
# Caregory: Mantis Pokémon
# Types: Bug / Flying
########################################################################################
    
########################################################################################
# Index: 124
# Name: Jynx / ルージュラ (Rougela)
# Caregory: Human 

########################################################################################
# Index: 151
# Name: Mew / ミュウ (Mew)
# Caregory: New Species Pokémon
# Type: Psychic
########################################################################################
    
########################################################################################
# Index: 152
# Name: Chikorita / チコリータ (Chicorita)
# Caregory: Leaf Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 153
# Name: Bayleef / ベイリーフ (Bayleaf)
# Caregory: Leaf Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 154
# Name: Meganium / メガニウム (Meganium)
# Caregory: Herb Pokémon
# Type: Grass
#############

########################################################################################
# Index: 181
# Name: Ampharos / デンリュウ (Denryu)
# Caregory: Light Pokémon
# Type: Electric
########################################################################################
    
########################################################################################
# Index: 182
# Name: Bellossom / キレイハナ (Kireihana)
# Caregory: Flower Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 183
# Name: Marill / マリル (Maril)
# Caregory: Aqua Mouse Pokémon
# Types: Water / Fairy
########################################################################################
    
########################################################################################
# Index: 184
# Name: Azumarill / マリルリ (Marilli)
# Caregory: Aqua Rabbit Pokémon
# Ty

########################################################################################
# Index: 211
# Name: Qwilfish / ハリーセン (Harysen)
# Caregory: Balloon Pokémon
# Types: Water / Poison
########################################################################################
    
########################################################################################
# Index: 212
# Name: Scizor / ハッサム (Hassam)
# Caregory: Pincer Pokémon
# Types: Bug / Steel
########################################################################################
    
########################################################################################
# Index: 213
# Name: Shuckle / ツボツボ (Tsubotsubo)
# Caregory: Mold Pokémon
# Types: Bug / Rock
########################################################################################
    
########################################################################################
# Index: 214
# Name: Heracross / ヘラクロス (Heracros)
# Caregory: Single Horn Po

########################################################################################
# Index: 241
# Name: Miltank / ミルタンク (Miltank)
# Caregory: Milk Cow Pokémon
# Type: Normal
########################################################################################
    
########################################################################################
# Index: 242
# Name: Blissey / ハピナス (Happinas)
# Caregory: Happiness Pokémon
# Type: Normal
########################################################################################
    
########################################################################################
# Index: 243
# Name: Raikou / ライコウ (Raikou)
# Caregory: Thunder Pokémon
# Type: Electric
########################################################################################
    
########################################################################################
# Index: 244
# Name: Entei / エンテイ (Entei)
# Caregory: Volcano Pokémon
# Type: Fire
#######

########################################################################################
# Index: 271
# Name: Lombre / ハスブレロ (Hasubrero)
# Caregory: Jolly Pokémon
# Types: Water / Grass
########################################################################################
    
########################################################################################
# Index: 272
# Name: Ludicolo / ルンパッパ (Runpappa)
# Caregory: Carefree Pokémon
# Types: Water / Grass
########################################################################################
    
########################################################################################
# Index: 273
# Name: Seedot / タネボー (Taneboh)
# Caregory: Acorn Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 274
# Name: Nuzleaf / コノハナ (Konohana)
# Caregory: Wily Pokémon
# Types

########################################################################################
# Index: 301
# Name: Delcatty / エネコロロ (Enekororo)
# Caregory: Prim Pokémon
# Type: Normal
########################################################################################
    
########################################################################################
# Index: 302
# Name: Sableye / ヤミラミ (Yamirami)
# Caregory: Darkness Pokémon
# Types: Dark / Ghost
########################################################################################
    
########################################################################################
# Index: 303
# Name: Mawile / クチート (Kucheat)
# Caregory: Deceiver Pokémon
# Types: Steel / Fairy
########################################################################################
    
########################################################################################
# Index: 304
# Name: Aron / ココドラ (Cokodora)
# Caregory: Iron Armor Pokémon
# 

########################################################################################
# Index: 331
# Name: Cacnea / サボネア (Sabonea)
# Caregory: Cactus Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 332
# Name: Cacturne / ノクタス (Noctus)
# Caregory: Scarecrow Pokémon
# Types: Grass / Dark
########################################################################################
    
########################################################################################
# Index: 333
# Name: Swablu / チルット (Tyltto)
# Caregory: Cotton Bird Pokémon
# Types: Normal / Flying
########################################################################################
    
########################################################################################
# Index: 334
# Name: Altaria / チルタリス (Tyltalis)
# Caregory: Humming Pokémon
#

########################################################################################
# Index: 361
# Name: Snorunt / ユキワラシ (Yukiwarashi)
# Caregory: Snow Hat Pokémon
# Type: Ice
########################################################################################
    
########################################################################################
# Index: 362
# Name: Glalie / オニゴーリ (Onigohri)
# Caregory: Face Pokémon
# Type: Ice
########################################################################################
    
########################################################################################
# Index: 363
# Name: Spheal / タマザラシ (Tamazarashi)
# Caregory: Clap Pokémon
# Types: Ice / Water
########################################################################################
    
########################################################################################
# Index: 364
# Name: Sealeo / トドグラー (Todoggler)
# Caregory: Ball Roll Pokémon
# Types: Ice

########################################################################################
# Index: 391
# Name: Monferno / モウカザル (Moukazaru)
# Caregory: Playful Pokémon
# Types: Fire / Fighting
########################################################################################
    
########################################################################################
# Index: 392
# Name: Infernape / ゴウカザル (Goukazaru)
# Caregory: Flame Pokémon
# Types: Fire / Fighting
########################################################################################
    
########################################################################################
# Index: 393
# Name: Piplup / ポッチャマ (Pochama)
# Caregory: Penguin Pokémon
# Type: Water
########################################################################################
    
########################################################################################
# Index: 394
# Name: Prinplup / ポッタイシ (Pottaishi)
# Caregory: Penguin

########################################################################################
# Index: 421
# Name: Cherrim / チェリム (Cherrim)
# Caregory: Blossom Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 422
# Name: Shellos / カラナクシ (Karanakushi)
# Caregory: Sea Slug Pokémon
# Type: Water
########################################################################################
    
########################################################################################
# Index: 423
# Name: Gastrodon / トリトドン (Tritodon)
# Caregory: Sea Slug Pokémon
# Types: Water / Ground
########################################################################################
    
########################################################################################
# Index: 424
# Name: Ambipom / エテボース (Eteboth)
# Caregory: Long Tail Pokémon


########################################################################################
# Index: 451
# Name: Skorupi / スコルピ (Scorupi)
# Caregory: Scorpion Pokémon
# Types: Poison / Bug
########################################################################################
    
########################################################################################
# Index: 452
# Name: Drapion / ドラピオン (Dorapion)
# Caregory: Ogre Scorpion Pokémon
# Types: Poison / Dark
########################################################################################
    
########################################################################################
# Index: 453
# Name: Croagunk / グレッグル (Gureggru)
# Caregory: Toxic Mouth Pokémon
# Types: Poison / Fighting
########################################################################################
    
########################################################################################
# Index: 454
# Name: Toxicroak / ドクロッグ (Dokurog)
# C

########################################################################################
# Index: 481
# Name: Mesprit / エムリット (Emrit)
# Caregory: Emotion Pokémon
# Type: Psychic
########################################################################################
    
########################################################################################
# Index: 482
# Name: Azelf / アグノム (Agnome)
# Caregory: Willpower Pokémon
# Type: Psychic
########################################################################################
    
########################################################################################
# Index: 483
# Name: Dialga / ディアルガ (Dialga)
# Caregory: Temporal Pokémon
# Types: Steel / Dragon
########################################################################################
    
########################################################################################
# Index: 484
# Name: Palkia / パルキア (Palkia)
# Caregory: Spatial Pokémon
# Types: Water

########################################################################################
# Index: 511
# Name: Pansage / ヤナップ (Yanappu)
# Caregory: Grass Monkey Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 512
# Name: Simisage / ヤナッキー (Yanakkie)
# Caregory: Thorn Monkey Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 513
# Name: Pansear / バオップ (Baoppu)
# Caregory: High Temp Pokémon
# Type: Fire
########################################################################################
    
########################################################################################
# Index: 514
# Name: Simisear / バオッキー (Baokkie)
# Caregory: Ember Pokémon
# Type: Fir

########################################################################################
# Index: 541
# Name: Swadloon / クルマユ (Kurumayu)
# Caregory: Leaf-Wrapped Pokémon
# Types: Bug / Grass
########################################################################################
    
########################################################################################
# Index: 542
# Name: Leavanny / ハハコモリ (Hahakomori)
# Caregory: Nurturing Pokémon
# Types: Bug / Grass
########################################################################################
    
########################################################################################
# Index: 543
# Name: Venipede / フシデ (Fushide)
# Caregory: Centipede Pokémon
# Types: Bug / Poison
########################################################################################
    
########################################################################################
# Index: 544
# Name: Whirlipede / ホイーガ (Wheega)
# Caregory: 

########################################################################################
# Index: 571
# Name: Zoroark / ゾロアーク (Zoroark)
# Caregory: Illusion Fox Pokémon
# Type: Dark
########################################################################################
    
########################################################################################
# Index: 572
# Name: Minccino / チラーミィ (Chillarmy)
# Caregory: Chinchilla Pokémon
# Type: Normal
########################################################################################
    
########################################################################################
# Index: 573
# Name: Cinccino / チラチーノ (Chillaccino)
# Caregory: Scarf Pokémon
# Type: Normal
########################################################################################
    
########################################################################################
# Index: 574
# Name: Gothita / ゴチム (Gothimu)
# Caregory: Fixation Pokémon
# Type

########################################################################################
# Index: 601
# Name: Klinklang / ギギギアル (Gigigiaru)
# Caregory: Gear Pokémon
# Type: Steel
########################################################################################
    
########################################################################################
# Index: 602
# Name: Tynamo / シビシラス (Shibishirasu)
# Caregory: EleFish Pokémon
# Type: Electric
########################################################################################
    
########################################################################################
# Index: 603
# Name: Eelektrik / シビビール (Shibibeel)
# Caregory: EleFish Pokémon
# Type: Electric
########################################################################################
    
########################################################################################
# Index: 604
# Name: Eelektross / シビルドン (Shibirudon)
# Caregory: EleFish Pokémon

########################################################################################
# Index: 631
# Name: Heatmor / クイタラン (Kuitaran)
# Caregory: Anteater Pokémon
# Type: Fire
########################################################################################
    
########################################################################################
# Index: 632
# Name: Durant / アイアント (Aiant)
# Caregory: Iron Ant Pokémon
# Types: Bug / Steel
########################################################################################
    
########################################################################################
# Index: 633
# Name: Deino / モノズ (Monozu)
# Caregory: Irate Pokémon
# Types: Dark / Dragon
########################################################################################
    
########################################################################################
# Index: 634
# Name: Zweilous / ジヘッド (Dihead)
# Caregory: Hostile Pokémon
# Types: Dark

########################################################################################
# Index: 661
# Name: Fletchling / ヤヤコマ (Yayakoma)
# Caregory: Tiny Robin Pokémon
# Types: Normal / Flying
########################################################################################
    
########################################################################################
# Index: 662
# Name: Fletchinder / ヒノヤコマ (Hinoyakoma)
# Caregory: Ember Pokémon
# Types: Fire / Flying
########################################################################################
    
########################################################################################
# Index: 663
# Name: Talonflame / ファイアロー (Fiarrow)
# Caregory: Scorching Pokémon
# Types: Fire / Flying
########################################################################################
    
########################################################################################
# Index: 664
# Name: Scatterbug / コフキムシ (Kofukimu

########################################################################################
# Index: 691
# Name: Dragalge / ドラミドロ (Dramidoro)
# Caregory: Mock Kelp Pokémon
# Types: Poison / Dragon
########################################################################################
    
########################################################################################
# Index: 692
# Name: Clauncher / ウデッポウ (Udeppou)
# Caregory: Water Gun Pokémon
# Type: Water
########################################################################################
    
########################################################################################
# Index: 693
# Name: Clawitzer / ブロスター (Bloster)
# Caregory: Howitzer Pokémon
# Type: Water
########################################################################################
    
########################################################################################
# Index: 694
# Name: Helioptile / エリキテル (Erikiteru)
# Caregory: Generato

########################################################################################
# Index: 721
# Name: Volcanion / ボルケニオン (Volcanion)
# Caregory: Steam Pokémon
# Types: Fire / Water
########################################################################################
    
########################################################################################
# Index: 722
# Name: Rowlet / モクロー (Mokuroh)
# Caregory: Grass Quill Pokémon
# Types: Grass / Flying
########################################################################################
    
########################################################################################
# Index: 723
# Name: Dartrix / フクスロー (Fukuthrow)
# Caregory: Blade Quill Pokémon
# Types: Grass / Flying
########################################################################################
    
########################################################################################
# Index: 724
# Name: Decidueye / ジュナイパー (Junaiper)
# Car

########################################################################################
# Index: 751
# Name: Dewpider / シズクモ (Shizukumo)
# Caregory: Water Bubble Pokémon
# Types: Water / Bug
########################################################################################
    
########################################################################################
# Index: 752
# Name: Araquanid / オニシズクモ (Onishizukumo)
# Caregory: Water Bubble Pokémon
# Types: Water / Bug
########################################################################################
    
########################################################################################
# Index: 753
# Name: Fomantis / カリキリ (Karikiri)
# Caregory: Sickle Grass Pokémon
# Type: Grass
########################################################################################
    
########################################################################################
# Index: 754
# Name: Lurantis / ラランテス (Lalantes)
# Care

########################################################################################
# Index: 780
# Name: Drampa / ジジーロン (Jijilong)
# Caregory: Placid Pokémon
# Types: Normal / Dragon
########################################################################################
    
########################################################################################
# Index: 781
# Name: Dhelmise / ダダリン (Dadarin)
# Caregory: Sea Creeper Pokémon
# Types: Ghost / Grass
########################################################################################
    
########################################################################################
# Index: 782
# Name: Jangmo-o / ジャラコ (Jyarako)
# Caregory: Scaly Pokémon
# Type: Dragon
########################################################################################
    
########################################################################################
# Index: 783
# Name: Hakamo-o / ジャランゴ (Jyarango)
# Caregory: Scaly Pokémo

########################################################################################
# Index: 809
# Name: Melmetal / メルメタル (Melmetal)
# Caregory: Hex Nut Pokémon
# Type: Steel
########################################################################################
    


########## FINISHED ##########


