In [14]:
 # Import the required modules
import pandas as pd
pd.set_option('display.max_columns', None)
import numpy as np

# visualization
import matplotlib.pyplot as plt
import seaborn as sns

# Machine Learning
from sklearn.model_selection import train_test_split, cross_val_score, StratifiedKFold

# Metrics
from sklearn.metrics import confusion_matrix, classification_report, roc_auc_score, roc_curve, RocCurveDisplay

# Pre-Processing
from sklearn.preprocessing import StandardScaler, OneHotEncoder, OrdinalEncoder
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer

# Models
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier, ExtraTreesClassifier, GradientBoostingClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier

# suppress warnings
import warnings
warnings.filterwarnings('ignore')

In [27]:
# The path to the CSV file
filepath = "Clean_Data/clean_hero_info.csv"

#reading the csv file
df1 = pd.read_csv(filepath)

df1.head(15)

Unnamed: 0.1,Unnamed: 0,name,Gender,Height,Publisher,Alignment,Weight
0,0,A-Bomb,Male,203.0,Marvel Comics,good,441.0
1,1,Abe Sapien,Male,191.0,Dark Horse Comics,good,65.0
2,2,Abin Sur,Male,185.0,DC Comics,good,90.0
3,3,Abomination,Male,203.0,Marvel Comics,bad,441.0
4,4,Abraxas,Male,-99.0,Marvel Comics,bad,-99.0
5,5,Absorbing Man,Male,193.0,Marvel Comics,bad,122.0
6,6,Adam Monroe,Male,-99.0,NBC - Heroes,good,-99.0
7,7,Adam Strange,Male,185.0,DC Comics,good,88.0
8,8,Agent 13,Female,173.0,Marvel Comics,good,61.0
9,9,Agent Bob,Male,178.0,Marvel Comics,good,81.0


In [28]:
# The path to the CSV file
filepath2 = "Clean_Data/clean_hero_powers.csv"

#reading the csv file
df = pd.read_csv(filepath2)

df.head(15)

Unnamed: 0,hero_names,Agility,Accelerated Healing,Lantern Power Ring,Dimensional Awareness,Cold Resistance,Durability,Stealth,Energy Absorption,Flight,Danger Sense,Underwater breathing,Marksmanship,Weapons Master,Power Augmentation,Animal Attributes,Longevity,Intelligence,Super Strength,Cryokinesis,Telepathy,Energy Armor,Energy Blasts,Duplication,Size Changing,Density Control,Stamina,Astral Travel,Audio Control,Dexterity,Omnitrix,Super Speed,Possession,Animal Oriented Powers,Weapon-based Powers,Electrokinesis,Darkforce Manipulation,Death Touch,Teleportation,Enhanced Senses,Telekinesis,Energy Beams,Magic,Hyperkinesis,Jump,Clairvoyance,Dimensional Travel,Power Sense,Shapeshifting,Peak Human Condition,Immortality,Camouflage,Element Control,Phasing,Astral Projection,Electrical Transport,Fire Control,Projection,Summoning,Enhanced Memory,Reflexes,Invulnerability,Energy Constructs,Force Fields,Self-Sustenance,Anti-Gravity,Empathy,Power Nullifier,Radiation Control,Psionic Powers,Elasticity,Substance Secretion,Elemental Transmogrification,Technopath/Cyberpath,Photographic Reflexes,Seismic Power,Animation,Precognition,Mind Control,Fire Resistance,Power Absorption,Enhanced Hearing,Nova Force,Insanity,Hypnokinesis,Animal Control,Natural Armor,Intangibility,Enhanced Sight,Molecular Manipulation,Heat Generation,Adaptation,Gliding,Power Suit,Mind Blast,Probability Manipulation,Gravity Control,Regeneration,Light Control,Echolocation,Levitation,Toxin and Disease Control,Banish,Energy Manipulation,Heat Resistance,Natural Weapons,Time Travel,Enhanced Smell,Illusions,Thirstokinesis,Hair Manipulation,Illumination,Omnipotent,Cloaking,Changing Armor,Power Cosmic,Biokinesis,Water Control,Radiation Immunity,Vision - Telescopic,Toxin and Disease Resistance,Spatial Awareness,Energy Resistance,Telepathy Resistance,Molecular Combustion,Omnilingualism,Portal Creation,Magnetism,Mind Control Resistance,Plant Control,Sonar,Sonic Scream,Time Manipulation,Enhanced Touch,Magic Resistance,Invisibility,Sub-Mariner,Radiation Absorption,Intuitive aptitude,Vision - Microscopic,Melting,Wind Control,Super Breath,Wallcrawling,Vision - Night,Vision - Infrared,Grim Reaping,Matter Absorption,The Force,Resurrection,Terrakinesis,Vision - Heat,Vitakinesis,Radar Sense,Qwardian Power Ring,Weather Control,Vision - X-Ray,Vision - Thermal,Web Creation,Reality Warping,Odin Force,Symbiote Costume,Speed Force,Phoenix Force,Molecular Dissipation,Vision - Cryo,Omnipresent,Omniscient
0,3-D Man,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
1,A-Bomb,False,True,False,False,False,True,False,False,False,False,False,False,False,False,False,True,False,True,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
2,Abe Sapien,True,True,False,False,True,True,False,False,False,False,True,True,True,False,False,True,True,True,False,True,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
3,Abin Sur,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
4,Abomination,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,True,False,False,False,False,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
5,Abraxas,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,True,True,False,False,False,False,False,True,False,False,False,False,False,False,True,False,False,False,False,False,False,True,False,False,False,True,False,False,False,True,False,False,False,True,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
6,Absorbing Man,False,False,False,False,True,True,False,True,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,True,False,False,False,False,False,False,True,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
7,Adam Monroe,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
8,Adam Strange,False,False,False,False,False,True,True,False,True,False,False,True,True,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
9,Agent Bob,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False


In [37]:
print(df1.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 719 entries, 0 to 718
Data columns (total 7 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   Unnamed: 0  719 non-null    int64  
 1   name        719 non-null    object 
 2   Gender      719 non-null    object 
 3   Height      719 non-null    float64
 4   Publisher   719 non-null    object 
 5   Alignment   719 non-null    object 
 6   Weight      719 non-null    float64
dtypes: float64(2), int64(1), object(4)
memory usage: 39.4+ KB
None


In [38]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 667 entries, 0 to 666
Data columns (total 15 columns):
 #   Column                         Non-Null Count  Dtype 
---  ------                         --------------  ----- 
 0   hero_names                     667 non-null    object
 1   Physical Attributes            667 non-null    bool  
 2   Energy Related                 667 non-null    bool  
 3   Elemental Powers               667 non-null    bool  
 4   Magic/Cosmic Powers            667 non-null    bool  
 5   Healing/Survival Powers        667 non-null    bool  
 6   Sensory Awareness              667 non-null    bool  
 7   Movement/Travel Powers         667 non-null    bool  
 8   Weapon/Combat Skills           667 non-null    bool  
 9   Manipulation/Control Powers    667 non-null    bool  
 10  Vision/Perception Powers       667 non-null    bool  
 11  Technology Powers              667 non-null    bool  
 12  Illusions/Mental Manipulation  667 non-null    bool  
 13  Speci

In [34]:
# Group the columns into lists as per the categories you defined
physical_attributes = ['Agility', 'Super Strength', 'Dexterity', 'Stamina', 'Reflexes', 
                       'Peak Human Condition', 'Enhanced Senses', 'Enhanced Hearing', 
                       'Enhanced Sight', 'Enhanced Smell', 'Enhanced Touch', 'Super Speed', 'Jump']

energy_related = ['Lantern Power Ring', 'Energy Absorption', 'Energy Armor', 'Energy Blasts', 
                  'Energy Beams', 'Energy Constructs', 'Energy Manipulation', 'Energy Resistance']

elemental_powers = ['Fire Control', 'Water Control', 'Wind Control', 'Terrakinesis', 
                    'Weather Control', 'Cryokinesis', 'Heat Resistance', 'Heat Generation', 
                    'Element Control', 'Elemental Transmogrification', 'Seismic Power']

magic_cosmic = ['Magic', 'Darkforce Manipulation', 'Power Cosmic', 'Odin Force', 'Phoenix Force', 
                'Symbiote Costume']

healing_survival = ['Accelerated Healing', 'Regeneration', 'Self-Sustenance', 'Immortality', 
                    'Invulnerability', 'Longevity', 'Adaptation', 'Toxin and Disease Control', 
                    'Toxin and Disease Resistance', 'Radiation Immunity', 'Fire Resistance', 'Cold Resistance', 
                    'Natural Armor']

sensory_awareness = ['Dimensional Awareness', 'Danger Sense', 'Clairvoyance', 'Telepathy', 
                     'Telepathy Resistance', 'Spatial Awareness', 'Precognition', 'Empathy', 'Psionic Powers']

movement_travel = ['Flight', 'Gliding', 'Levitation', 'Teleportation', 'Dimensional Travel', 
                   'Time Travel', 'Phasing', 'Astral Travel', 'Astral Projection', 'Portal Creation', 
                   'Sub-Mariner']

weapon_combat = ['Weapons Master', 'Weapon-based Powers', 'Marksmanship', 'Power Suit', 'Natural Weapons']

manipulation_control = ['Telekinesis', 'Power Absorption', 'Power Augmentation', 'Power Nullifier', 
                        'Probability Manipulation', 'Gravity Control', 'Molecular Manipulation', 
                        'Size Changing', 'Density Control', 'Duplication', 'Shapeshifting', 'Possession', 
                        'Animal Control', 'Animal Oriented Powers', 'Mind Control', 'Mind Control Resistance']

vision_perception = ['Vision - Telescopic', 'Vision - Microscopic', 'Vision - Night', 'Vision - Infrared', 
                     'Vision - Heat', 'Vision - Thermal', 'Vision - X-Ray', 'Vision - Cryo', 'Echolocation', 
                     'Sonar', 'Radar Sense']

technology_powers = ['Technopath/Cyberpath', 'Omnitrix', 'Qwardian Power Ring', 'Speed Force']

illusions_mental = ['Illusions', 'Hypnokinesis', 'Insanity', 'Mind Blast']

special_abilities = ['Intangibility', 'Cloaking', 'Camouflage', 'Invisibility', 'Wallcrawling', 
                     'Sub-Mariner', 'Web Creation']

unique_abilities = ['Resurrection', 'The Force', 'Reality Warping', 'Odin Force', 'Phoenix Force', 
                    'Grim Reaping']

# Define a function to create the new group column by checking if any column in the group is TRUE
def create_group_column(df, group_columns, group_name):
    df[group_name] = df[group_columns].any(axis=1)

# Apply the function to each group
create_group_column(df, physical_attributes, 'Physical Attributes')
create_group_column(df, energy_related, 'Energy Related')
create_group_column(df, elemental_powers, 'Elemental Powers')
create_group_column(df, magic_cosmic, 'Magic/Cosmic Powers')
create_group_column(df, healing_survival, 'Healing/Survival Powers')
create_group_column(df, sensory_awareness, 'Sensory Awareness')
create_group_column(df, movement_travel, 'Movement/Travel Powers')
create_group_column(df, weapon_combat, 'Weapon/Combat Skills')
create_group_column(df, manipulation_control, 'Manipulation/Control Powers')
create_group_column(df, vision_perception, 'Vision/Perception Powers')
create_group_column(df, technology_powers, 'Technology Powers')
create_group_column(df, illusions_mental, 'Illusions/Mental Manipulation')
create_group_column(df, special_abilities, 'Special Abilities')
create_group_column(df, unique_abilities, 'Unique Abilities')

# Check the updated dataframe
df.head()


Unnamed: 0,hero_names,Agility,Accelerated Healing,Lantern Power Ring,Dimensional Awareness,Cold Resistance,Durability,Stealth,Energy Absorption,Flight,Danger Sense,Underwater breathing,Marksmanship,Weapons Master,Power Augmentation,Animal Attributes,Longevity,Intelligence,Super Strength,Cryokinesis,Telepathy,Energy Armor,Energy Blasts,Duplication,Size Changing,Density Control,Stamina,Astral Travel,Audio Control,Dexterity,Omnitrix,Super Speed,Possession,Animal Oriented Powers,Weapon-based Powers,Electrokinesis,Darkforce Manipulation,Death Touch,Teleportation,Enhanced Senses,Telekinesis,Energy Beams,Magic,Hyperkinesis,Jump,Clairvoyance,Dimensional Travel,Power Sense,Shapeshifting,Peak Human Condition,Immortality,Camouflage,Element Control,Phasing,Astral Projection,Electrical Transport,Fire Control,Projection,Summoning,Enhanced Memory,Reflexes,Invulnerability,Energy Constructs,Force Fields,Self-Sustenance,Anti-Gravity,Empathy,Power Nullifier,Radiation Control,Psionic Powers,Elasticity,Substance Secretion,Elemental Transmogrification,Technopath/Cyberpath,Photographic Reflexes,Seismic Power,Animation,Precognition,Mind Control,Fire Resistance,Power Absorption,Enhanced Hearing,Nova Force,Insanity,Hypnokinesis,Animal Control,Natural Armor,Intangibility,Enhanced Sight,Molecular Manipulation,Heat Generation,Adaptation,Gliding,Power Suit,Mind Blast,Probability Manipulation,Gravity Control,Regeneration,Light Control,Echolocation,Levitation,Toxin and Disease Control,Banish,Energy Manipulation,Heat Resistance,Natural Weapons,Time Travel,Enhanced Smell,Illusions,Thirstokinesis,Hair Manipulation,Illumination,Omnipotent,Cloaking,Changing Armor,Power Cosmic,Biokinesis,Water Control,Radiation Immunity,Vision - Telescopic,Toxin and Disease Resistance,Spatial Awareness,Energy Resistance,Telepathy Resistance,Molecular Combustion,Omnilingualism,Portal Creation,Magnetism,Mind Control Resistance,Plant Control,Sonar,Sonic Scream,Time Manipulation,Enhanced Touch,Magic Resistance,Invisibility,Sub-Mariner,Radiation Absorption,Intuitive aptitude,Vision - Microscopic,Melting,Wind Control,Super Breath,Wallcrawling,Vision - Night,Vision - Infrared,Grim Reaping,Matter Absorption,The Force,Resurrection,Terrakinesis,Vision - Heat,Vitakinesis,Radar Sense,Qwardian Power Ring,Weather Control,Vision - X-Ray,Vision - Thermal,Web Creation,Reality Warping,Odin Force,Symbiote Costume,Speed Force,Phoenix Force,Molecular Dissipation,Vision - Cryo,Omnipresent,Omniscient,Physical Attributes,Energy Related,Elemental Powers,Magic/Cosmic Powers,Healing/Survival Powers,Sensory Awareness,Movement/Travel Powers,Weapon/Combat Skills,Manipulation/Control Powers,Vision/Perception Powers,Technology Powers,Illusions/Mental Manipulation,Special Abilities,Unique Abilities
0,3-D Man,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False
1,A-Bomb,False,True,False,False,False,True,False,False,False,False,False,False,False,False,False,True,False,True,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,True,False,False,False,False,False,False,False,True,False
2,Abe Sapien,True,True,False,False,True,True,False,False,False,False,True,True,True,False,False,True,True,True,False,True,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,True,True,True,True,False,False,False,False,True,False
3,Abin Sur,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False
4,Abomination,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,True,False,False,False,False,False,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,True,False,False,False,False,False,False,False,False,False


In [35]:
# Create a list of columns to keep (new group columns + any other important ones)
columns_to_keep = ['hero_names', 'Physical Attributes', 'Energy Related', 'Elemental Powers', 
                   'Magic/Cosmic Powers', 'Healing/Survival Powers', 'Sensory Awareness', 
                   'Movement/Travel Powers', 'Weapon/Combat Skills', 'Manipulation/Control Powers', 
                   'Vision/Perception Powers', 'Technology Powers', 'Illusions/Mental Manipulation', 
                   'Special Abilities', 'Unique Abilities']

# Drop all columns except the ones we want to keep
df = df[columns_to_keep]

# Verify the updated DataFrame
df.info()  # Should show only the columns we want to keep

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 667 entries, 0 to 666
Data columns (total 15 columns):
 #   Column                         Non-Null Count  Dtype 
---  ------                         --------------  ----- 
 0   hero_names                     667 non-null    object
 1   Physical Attributes            667 non-null    bool  
 2   Energy Related                 667 non-null    bool  
 3   Elemental Powers               667 non-null    bool  
 4   Magic/Cosmic Powers            667 non-null    bool  
 5   Healing/Survival Powers        667 non-null    bool  
 6   Sensory Awareness              667 non-null    bool  
 7   Movement/Travel Powers         667 non-null    bool  
 8   Weapon/Combat Skills           667 non-null    bool  
 9   Manipulation/Control Powers    667 non-null    bool  
 10  Vision/Perception Powers       667 non-null    bool  
 11  Technology Powers              667 non-null    bool  
 12  Illusions/Mental Manipulation  667 non-null    bool  
 13  Speci

In [36]:
df.head()

Unnamed: 0,hero_names,Physical Attributes,Energy Related,Elemental Powers,Magic/Cosmic Powers,Healing/Survival Powers,Sensory Awareness,Movement/Travel Powers,Weapon/Combat Skills,Manipulation/Control Powers,Vision/Perception Powers,Technology Powers,Illusions/Mental Manipulation,Special Abilities,Unique Abilities
0,3-D Man,True,False,False,False,False,False,False,False,False,False,False,False,False,False
1,A-Bomb,True,False,False,False,True,False,False,False,False,False,False,False,True,False
2,Abe Sapien,True,False,False,False,True,True,True,True,False,False,False,False,True,False
3,Abin Sur,False,True,False,False,False,False,False,False,False,False,False,False,False,False
4,Abomination,True,False,False,False,True,False,False,False,False,False,False,False,False,False


In [39]:
# Rename the 'hero_names' column in df to 'name' to match with df1 for merging
df = df.rename(columns={'hero_names': 'name'})

# Perform a merge on the 'name' column
merged_df = pd.merge(df1, df, on='name', how='inner')  # 'inner' keeps only matching rows

# Verify the merged DataFrame
merged_df.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 647 entries, 0 to 646
Data columns (total 21 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   Unnamed: 0                     647 non-null    int64  
 1   name                           647 non-null    object 
 2   Gender                         647 non-null    object 
 3   Height                         647 non-null    float64
 4   Publisher                      647 non-null    object 
 5   Alignment                      647 non-null    object 
 6   Weight                         647 non-null    float64
 7   Physical Attributes            647 non-null    bool   
 8   Energy Related                 647 non-null    bool   
 9   Elemental Powers               647 non-null    bool   
 10  Magic/Cosmic Powers            647 non-null    bool   
 11  Healing/Survival Powers        647 non-null    bool   
 12  Sensory Awareness              647 non-null    boo

In [46]:
# Drop the 'Unnamed: 0' colum
merged_df = merged_df.drop(columns=['Unnamed: 0'])

# Verify the column has been dropped
merged_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 647 entries, 0 to 646
Data columns (total 20 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   name                           647 non-null    object 
 1   Gender                         647 non-null    object 
 2   Height                         647 non-null    float64
 3   Publisher                      647 non-null    object 
 4   Alignment                      647 non-null    object 
 5   Weight                         647 non-null    float64
 6   Physical Attributes            647 non-null    bool   
 7   Energy Related                 647 non-null    bool   
 8   Elemental Powers               647 non-null    bool   
 9   Magic/Cosmic Powers            647 non-null    bool   
 10  Healing/Survival Powers        647 non-null    bool   
 11  Sensory Awareness              647 non-null    bool   
 12  Movement/Travel Powers         647 non-null    boo

In [47]:
merged_df.head(15)

Unnamed: 0,name,Gender,Height,Publisher,Alignment,Weight,Physical Attributes,Energy Related,Elemental Powers,Magic/Cosmic Powers,Healing/Survival Powers,Sensory Awareness,Movement/Travel Powers,Weapon/Combat Skills,Manipulation/Control Powers,Vision/Perception Powers,Technology Powers,Illusions/Mental Manipulation,Special Abilities,Unique Abilities
0,A-Bomb,Male,203.0,Marvel Comics,good,441.0,True,False,False,False,True,False,False,False,False,False,False,False,True,False
1,Abe Sapien,Male,191.0,Dark Horse Comics,good,65.0,True,False,False,False,True,True,True,True,False,False,False,False,True,False
2,Abin Sur,Male,185.0,DC Comics,good,90.0,False,True,False,False,False,False,False,False,False,False,False,False,False,False
3,Abomination,Male,203.0,Marvel Comics,bad,441.0,True,False,False,False,True,False,False,False,False,False,False,False,False,False
4,Abraxas,Male,-99.0,Marvel Comics,bad,-99.0,True,True,False,True,True,True,True,False,True,False,False,False,False,False
5,Absorbing Man,Male,193.0,Marvel Comics,bad,122.0,True,True,True,False,True,False,False,False,True,False,False,False,False,False
6,Adam Monroe,Male,-99.0,NBC - Heroes,good,-99.0,False,False,False,False,True,False,False,False,False,False,False,False,False,False
7,Adam Strange,Male,185.0,DC Comics,good,88.0,True,False,False,False,True,False,True,True,False,False,False,False,False,False
8,Agent Bob,Male,178.0,Marvel Comics,good,81.0,False,False,False,False,False,False,False,False,False,False,False,False,False,False
9,Agent Zero,Male,191.0,Marvel Comics,good,104.0,True,True,False,False,True,False,False,True,False,False,False,False,False,False


In [48]:
# Count unique values for Height
unique_height_count = merged_df['Height'].nunique()

# Count unique values for Weight
unique_weight_count = merged_df['Weight'].nunique()

# Print the results
print(f"Number of unique values for Height: {unique_height_count}")
print(f"Number of unique values for Weight: {unique_weight_count}")


Number of unique values for Height: 51
Number of unique values for Weight: 132


In [58]:
weight_distribution = merged_df['Weight'].value_counts()

# Convert the Series to a DataFrame
weight_distribution_df = weight_distribution.reset_index()
weight_distribution_df.columns = ['Weight', 'Count']  # Rename columns for clarity

# Print the DataFrame
weight_distribution_df.head(30)

Unnamed: 0,Weight,Count
0,-99.0,180
1,81.0,22
2,79.0,21
3,54.0,20
4,90.0,19
5,52.0,15
6,86.0,15
7,59.0,14
8,77.0,13
9,56.0,13


In [64]:
# Calculate mean and median of the Weight column (excluding -99)
mean_weight = merged_df[merged_df['Weight'] != -99]['Weight'].mean()
median_weight = merged_df[merged_df['Weight'] != -99]['Weight'].median()

# Print the results
print(f"Mean Weight (excluding -99): {mean_weight}")
print(f"Median Weight (excluding -99): {median_weight}")

Mean Weight (excluding -99): 104.61514683153014
Median Weight (excluding -99): 81.0


In [62]:
# Replace -99 with the median value
merged_df['Weight']= merged_df['Weight'].replace(-99, median_weight)

# Verify the replacement
print(merged_df['Weight'].value_counts())

Weight
81.0     202
79.0      21
54.0      20
90.0      19
52.0      15
        ... 
268.0      1
16.0       1
167.0      1
45.0       1
17.0       1
Name: count, Length: 131, dtype: int64


In [63]:
height_distribution = merged_df['Height'].value_counts()

# Convert the Series to a DataFrame
height_distribution_df = height_distribution.reset_index()
height_distribution_df.columns = ['Height', 'Count']  # Rename columns for clarity

# Print the DataFrame
height_distribution_df.head(30)

Unnamed: 0,Height,Count
0,-99.0,163
1,183.0,58
2,188.0,47
3,180.0,37
4,185.0,35
5,178.0,33
6,175.0,32
7,168.0,27
8,165.0,26
9,170.0,22


In [65]:
# Calculate mean and median of the Weight column (excluding -99)
mean_height = merged_df[merged_df['Height'] != -99]['Height'].mean()
median_height = merged_df[merged_df['Height'] != -99]['Height'].median()

# Print the results
print(f"Mean Height (excluding -99): {mean_height}")
print(f"Median Height (excluding -99): {median_height}")

Mean Height (excluding -99): 187.79132231404958
Median Height (excluding -99): 183.0


In [66]:
# Replace -99 with the median value
merged_df['Height']= merged_df['Height'].replace(-99, median_height)

# Verify the replacement
print(merged_df['Height'].value_counts())

Height
183.0    221
188.0     47
180.0     37
185.0     35
178.0     33
175.0     32
168.0     27
165.0     26
170.0     22
193.0     19
191.0     18
198.0     18
173.0     16
196.0     10
201.0     10
163.0      8
213.0      7
203.0      5
157.0      5
211.0      4
244.0      4
229.0      3
218.0      3
155.0      3
226.0      3
137.0      2
366.0      2
206.0      2
305.0      2
122.0      2
279.0      2
297.0      1
234.0      1
15.2       1
160.0      1
304.8      1
64.0       1
259.0      1
287.0      1
71.0       1
61.0       1
701.0      1
62.5       1
876.0      1
142.0      1
975.0      1
267.0      1
257.0      1
30.5       1
66.0       1
Name: count, dtype: int64


In [67]:
merged_df.head(15)

Unnamed: 0,name,Gender,Height,Publisher,Alignment,Weight,Physical Attributes,Energy Related,Elemental Powers,Magic/Cosmic Powers,Healing/Survival Powers,Sensory Awareness,Movement/Travel Powers,Weapon/Combat Skills,Manipulation/Control Powers,Vision/Perception Powers,Technology Powers,Illusions/Mental Manipulation,Special Abilities,Unique Abilities
0,A-Bomb,Male,203.0,Marvel Comics,good,441.0,True,False,False,False,True,False,False,False,False,False,False,False,True,False
1,Abe Sapien,Male,191.0,Dark Horse Comics,good,65.0,True,False,False,False,True,True,True,True,False,False,False,False,True,False
2,Abin Sur,Male,185.0,DC Comics,good,90.0,False,True,False,False,False,False,False,False,False,False,False,False,False,False
3,Abomination,Male,203.0,Marvel Comics,bad,441.0,True,False,False,False,True,False,False,False,False,False,False,False,False,False
4,Abraxas,Male,183.0,Marvel Comics,bad,81.0,True,True,False,True,True,True,True,False,True,False,False,False,False,False
5,Absorbing Man,Male,193.0,Marvel Comics,bad,122.0,True,True,True,False,True,False,False,False,True,False,False,False,False,False
6,Adam Monroe,Male,183.0,NBC - Heroes,good,81.0,False,False,False,False,True,False,False,False,False,False,False,False,False,False
7,Adam Strange,Male,185.0,DC Comics,good,88.0,True,False,False,False,True,False,True,True,False,False,False,False,False,False
8,Agent Bob,Male,178.0,Marvel Comics,good,81.0,False,False,False,False,False,False,False,False,False,False,False,False,False,False
9,Agent Zero,Male,191.0,Marvel Comics,good,104.0,True,True,False,False,True,False,False,True,False,False,False,False,False,False
