In [4]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

In [5]:


url = "https://pokemondb.net/pokedex/all"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")

# 1) Tabelle mit id="pokedex" heraussuchen
table = soup.find("table", {"id": "pokedex"})

# 2) Pandas DataFrame daraus erzeugen
df = pd.read_html(str(table))[0]

# 3) Ersten Zeilen und Spaltennamen anzeigen
print(df.head())
print(df.columns)



   #                     Name           Type  Total  HP  Attack  Defense  \
0  1                Bulbasaur  Grass  Poison    318  45      49       49   
1  2                  Ivysaur  Grass  Poison    405  60      62       63   
2  3                 Venusaur  Grass  Poison    525  80      82       83   
3  3  Venusaur  Mega Venusaur  Grass  Poison    625  80     100      123   
4  4               Charmander           Fire    309  39      52       43   

   Sp. Atk  Sp. Def  Speed  
0       65       65     45  
1       80       80     60  
2      100      100     80  
3      122      120     80  
4       60       50     65  
Index(['#', 'Name', 'Type', 'Total', 'HP', 'Attack', 'Defense', 'Sp. Atk',
       'Sp. Def', 'Speed'],
      dtype='object')


  df = pd.read_html(str(table))[0]


In [6]:
# Wir suchen den Zeilen-Index, bei dem "Total" maximal ist
idx_strongest = df["Total"].astype(int).idxmax()

# Dann können wir z.B. die gesamte Zeile anzeigen
strongest_pokemon = df.loc[idx_strongest]
print("Stärkstes Pokémon (basierend auf Total):")
print(strongest_pokemon)


Stärkstes Pokémon (basierend auf Total):
#                           890
Name       Eternatus  Eternamax
Type             Poison  Dragon
Total                      1125
HP                          255
Attack                      115
Defense                     250
Sp. Atk                     125
Sp. Def                     250
Speed                       130
Name: 1058, dtype: object


In [7]:
idx_best_attack = df["Attack"].astype(int).idxmax()
best_attack_pokemon = df.loc[idx_best_attack]
print("\nPokémon mit höchstem Attack-Wert:")
print(best_attack_pokemon)



Pokémon mit höchstem Attack-Wert:
#                            150
Name       Mewtwo  Mega Mewtwo X
Type           Psychic  Fighting
Total                        780
HP                           106
Attack                       190
Defense                      100
Sp. Atk                      154
Sp. Def                      100
Speed                        130
Name: 201, dtype: object


In [8]:
import numpy as np

# Liste der Zahlen-Spalten
stat_columns = ["HP", "Attack", "Defense", "Sp. Atk", "Sp. Def", "Speed", "Total"]

# Stellen wir sicher, dass sie alle in Integer/Floats konvertierbar sind
for col in stat_columns:
    df[col] = df[col].astype(int)

# Durchschnitt aller gewünschten Spalten berechnen
averages = df[stat_columns].mean(numeric_only=True)

print("\nDurchschnittswerte (HP, Attack, Defense, Sp. Atk, Sp. Def, Speed, Total):")
print(averages)



Durchschnittswerte (HP, Attack, Defense, Sp. Atk, Sp. Def, Speed, Total):
HP          71.244444
Attack      81.152263
Defense     75.007407
Sp. Atk     73.224691
Sp. Def     72.441152
Speed       70.034568
Total      443.104527
dtype: float64


In [11]:
# BONUS: Die Häufigkeit aller Pokemon Typen zählen




# 1) Jeden Zellen-Eintrag aufsplitten in einzelne Typen
types_series = df["Type"].str.split()  # ["Grass", "Poison"] etc. pro Pokémon

# 2) "Explode" erzeugt aus Listen einzelne Zeilen
types_exploded = types_series.explode()  
# Jetzt hat jedes Pokémon mit 2 Typen zwei Zeilen: 
#   z. B. "Grass" in einer Zeile, "Poison" in einer anderen

# 3) Häufigkeitsauszählung
type_counts = types_exploded.value_counts()
print("Häufigkeiten aller Typen:")
print(type_counts)

# 4) Häufigster Typ
most_common_type = type_counts.idxmax()
print("\nDer häufigste Typ ist:", most_common_type)


Häufigkeiten aller Typen:
Type
Water       176
Normal      153
Grass       146
Psychic     134
Flying      132
Bug         100
Fire         97
Poison       96
Dragon       93
Fighting     92
Ground       90
Dark         89
Rock         88
Electric     87
Ghost        87
Steel        85
Fairy        74
Ice          65
Name: count, dtype: int64

Der häufigste Typ ist: Water
