## LEGENDA 'Conservation Status'
Least Concern (LC): Indica che una specie non è attualmente a rischio di estinzione. Queste specie sono considerate relativamente sicure in natura.

Vulnerable (VU): Indica che una specie è a rischio di estinzione in natura, ma non è ancora considerata in pericolo critico. Le specie vulnerabili potrebbero avere una popolazione ridotta o affrontare minacce significative nell'ambiente circostante.

Endangered (EN): Indica che una specie è a rischio di estinzione imminente in natura. Queste specie hanno una popolazione molto bassa e/o affrontano minacce gravi che mettono a rischio la loro sopravvivenza.

Not Evaluated (NE): Indica che lo stato di conservazione di una specie non è stato ancora valutato o non è disponibile alcuna informazione sulla sua popolazione o sulle minacce che affronta.

Near Threatened (NT): Indica che una specie non è ancora classificata come vulnerabile, ma potrebbe diventarlo in futuro se le minacce che affronta non vengono affrontate o se la popolazione continua a diminuire.

Critically Endangered (CR): Indica che una specie è in grave pericolo di estinzione in natura. Le specie classificate come criticamente in pericolo hanno una popolazione estremamente bassa e/o affrontano minacce estreme che mettono a rischio la loro sopravvivenza nel breve termine.

Varies: Indica che lo stato di conservazione di una specie varia, a seconda delle diverse popolazioni o sotto-specie che possono essere classificate in modi diversi.

Data Deficient (DD): Indica che non ci sono dati sufficienti per valutare lo stato di conservazione di una specie. Questo può essere dovuto alla mancanza di informazioni sulla popolazione, sulle minacce o sulla distribuzione della specie.

In [106]:
import pandas as pd
import numpy as np
import networkx as nx
import inflect

df = pd.DataFrame(pd.read_csv('datasetAnimali/Animal Dataset.csv'))
df['index'] = range(len(df))
df.columns

Index(['Animal', 'Height (cm)', 'Weight (kg)', 'Color', 'Lifespan (years)',
       'Diet', 'Habitat', 'Predators', 'Average Speed (km/h)',
       'Countries Found', 'Conservation Status', 'Family',
       'Gestation Period (days)', 'Top Speed (km/h)', 'Social Structure',
       'Offspring per Birth', 'index'],
      dtype='object')

In [None]:
df.isna().sum()

In [None]:
def uniqueValues(column_name):
    return df[column_name].unique()

In [None]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 50)

In [None]:
uniqueValues('Conservation Status')

## Droppare animali estinti, i predatori Not Applicable e quelli che non hanno una area geografica

In [None]:
def contaValoriUnici(dataset,colonna):
    for i in dataset[colonna].unique():
        print("Valore ",i,"counts: ",(dataset[colonna] ==i).sum())

In [None]:
def addPredators(nome_preda, arr_predators):
    for nome_predatore in arr_predators:
        df.loc[df['Animal'] == nome_preda, 'Predators'] = df.loc[df['Animal'] == nome_preda, 'Predators'] + ', ' + nome_predatore
def replacePreators(nome_preda, arr_predators):
    df.loc[df['Animal'] == nome_preda, 'Predators'] = arr_predators[0]
    for nome_predatore in arr_predators:
        if nome_predatore != arr_predators[0]:
            df.loc[df['Animal'] == nome_preda, 'Predators'] = df.loc[df['Animal'] == nome_preda, 'Predators'] + ', ' + nome_predatore

In [None]:
# Elimino gli animali duplicati nella colonna Animal
indici_righe_da_eliminare = [82, 85, 106, 110, 124, 131]
df.drop(indici_righe_da_eliminare, inplace=True)

In [None]:
addPredators('African Elephant', ['Crocodile'])
replacePreators('Alpine Ibex', ['Mountain Tigers','Wolves', 'Lynxes', 'Bears', 'Foxes'])
replacePreators('Amazon Rainforest Frog', ['leimadophis epinephelus'])
replacePreators('Arabian Oryx', ['Striped Hyenas', 'Arabian Wolves', 'Lions'])
replacePreators('Arctic Fox', ['Polar Bears', 'Wolves', 'Golden Eagles', 'Grizzly Bears', 'Bald Eagles'])
replacePreators('Asian Elephant', ['Tigres'])
replacePreators('Atlantic Puffin', ['Great Skua', 'Great Black-backed Gull', 'Foxes'])
addPredators('Aye-Aye', ['Fossas'])
addPredators('Baird\'s Tapir', ['Pumas'])
replacePreators('Bald Eagle', ['Owls', 'Raccoons', 'Wolverines', 'Crows', 'Hawks'])
addPredators('Banded Palm Civet', ['Owls', 'Snakes'])
addPredators('Barbary Macaque', ['Domestic Dogs'])
addPredators('Bearded Dragon', ['Foxes'])
replacePreators('Blue Jay', ['Hawks', 'Owls', 'Falcons', 'Snakes'])
addPredators('Blue-Footed Booby	', ['Galapagos Hawk'])
replacePreators('Bornean Orangutan', ['Leopards', 'Bearded Pigs', 'Crocodiles', 'Pythons', 'Black Eagles'])
replacePreators('Bottlenose Dolphin', ['Tiger Sharks', 'Dusky Sharks', 'Bull Sharks', 'Great White Sharks'])
replacePreators('Brown Bear', ['Wolves', 'Cougars'])
replacePreators('Burmese Python', ['Asian Tigres', 'Leopards'])
addPredators('Capybara', ['Caimans'])
addPredators('Cheetah', ['Leopards'])
replacePreators('Chinese Giant Salamander', ['Otters', 'Foxes', 'Weasels', 'Badgers'])
replacePreators('Common Snapping Turtle', ['Foxes', 'Coyotes', 'Skunks', 'Minks', 'Fishers', 'Raccoons', 'Crows', 'Herons', 'Hawks', 'Owls', 'Bullfrogs', 'Fish', 'Snakes'])
replacePreators('Dhole', ['Not Applicable'])
replacePreators('Dingo', ['Crocodiles', 'Canid Species'])
addPredators('Dugong', ['Saltwater Crocodiles'])
addPredators('Eastern Gorilla', ['Crocodiles'])
addPredators('Echidna', ['Feral Cats', 'Foxes', 'Goannas'])
addPredators('Emperor Penguin', ['Sea Lions', 'Orcas'])
addPredators('Emperor Tamarin', ['Wild Cats', 'Dogs', 'Snakes', 'Birds of Prey'])
addPredators('Fennec Fox', ['Large Mammals'])
replacePreators('Flying Fox', ['Eagles', 'Owls', 'Pythons'])
addPredators('Galápagos Penguin', ['Sea Lions', 'Snakes', 'Owls', 'Hawks'])
replacePreators('Galápagos Tortoise', ['Galápagos hawk'])
addPredators('Gaur', ['Dhole', 'Saltwater Crocodiles'])
addPredators('Gerenuk', ['African Wild Dogs', 'Cheetahs', 'Hyenas'])
addPredators('Giant Panda', ['Yellow-Throated Martens', 'Eagles', 'Feral Dogs', 'Asian Black Bear'])
addPredators('Gila Monster', ['Hawks', 'Owls', 'Snakes'])
addPredators('Golden Lion Tamarin', ['Wild Cats'])
addPredators('Green Anaconda', ['Crab-eating Foxes', 'Tegu Lizards', 'Crested Caracaras'])
addPredators('Grevy\'s Zebra', ['Leopards', 'Hunting Dogs', 'Cheetah'])
addPredators('Harp Seal', ['Large Sharks'])
replacePreators('Hummingbird', ['Owls', 'Grackles', 'Blue Jays', 'Herons', 'Tanagers', 'Loggerhead Shrikes', 'Gulls'])
replacePreators('Japanese Macaque', ['Mountain Hawk Eagles', 'Feral Dogs', 'Raccoon Dogs'])
replacePreators('Kangaroo Rat', ['Swift Foxes', 'Badgers', 'Bobcats',  'Coyotes', 'Snakes', 'Rattlesnakes', 'Raptors', 'Owls'])
replacePreators('King Cobra', ['Birds', 'Mongooses'])
addPredators('Lemur', ['Boas'])
addPredators('Lion-tailed Macaque', ['Snakes', 'Raptors'])
addPredators('Lyrebird', ['Quolls', 'Dogs', 'Feral Cats', 'Foxes'])
addPredators('Mandrill', ['African Rock Pythons', 'Crowned Eagles'])
replacePreators('Markhor', ['Eurasian Lynxs', 'Snow Leopards','Himalayan Wolfes', 'Brown Beas'])
addPredators('Meerkat', ['Snakes'])
replacePreators('Okapi', ['Leopards', 'Servals', 'Golden Cats'])
addPredators('Orangutan', ['Large Pythons'])
addPredators('Pangolin', ['Leopards', 'Hyenas', 'Pythons'])
addPredators('Patagonian Mara', ['Felids', 'Grisons'])
replacePreators('Pink Fairy Armadillo', ['Foxes', 'Birds of Prey', 'Birds', 'Canids'])
replacePreators('Platypus', ['Snakes', 'Water Rats', 'Goannas', 'Foxes', 'Cats', 'Dogs'])
replacePreators('Praying Mantis', ['Frogs', 'Lizards', 'Spiders', 'Hornets', 'Ants', 'Birds', 'Bats'])
addPredators('Proboscis Monkey', ['Crocodiles', 'Pythons'])
replacePreators('Pronghorn', ['Wolves', 'Foxes', 'Coyotes', 'Bobcats', 'Golden Eagles'])
replacePreators('Rottweiler', ['Not Applicable'])
addPredators('Serval', ['Wild Dogs'])
replacePreators('Shoebill', ['Crocodiles'])
replacePreators('Siberian Husky', ['Not Applicable'])
addPredators('Sloth', ['Ocelots'])
addPredators('Slow Loris', ['Orangutans', 'Hawk Eagles'])
replacePreators('Snow Leopard', ['Humans'])
replacePreators('Spider Monkey', ['Jaguars', 'Eagles', 'Snakes'])
replacePreators('Spotted Hyena', ['Lions'])
replacePreators('Star-Nosed Mole', ['Raptors', 'Screech', 'Great Horned', 'Long-Eared', 'Barred', 'Barn Owls', 'Red-Tailed Hawks'])
addPredators('Sumatran Orangutan', ['Clouded Leopards', 'Large Pythons', 'Crocodiles'])
addPredators('Tarsier', ['Monitor Lizards', 'Raptors'])
replacePreators('Termite', ['Echidnas', 'Foxes', 'Galagos', 'Numbats', 'Mongooses', 'Mice', 'Pangolins', 'Genets', 'Civits', 'Bats', 'Echidnas', 'Moles', 'Shrews', 'Bibbies'])
addPredators('Three-Toed Sloth', ['Ocelots', 'Jaguars'])
replacePreators('Toco Toucan', ['Forest Eagles', 'Hawks', 'Owls', 'Boas', 'Jaguars', 'Margays'])
addPredators('Tuatara', ['Birds of Pray'])
replacePreators('Tufted Puffin', ['Bald Eagles', 'Peregrine Falcons', 'Snowy Owls', 'Eagle Owls', 'Sharks', 'Artic foxes', 'Red Foxes'])
addPredators('Uakari', ['Birds of Pray'])
addPredators('Vampire Bat', ['Eagles'])
addPredators('Vaquita', ['Orcas'])
replacePreators('Vulture', ['Hawks', 'Snakes', 'Wild Cats'])
addPredators('Warthog', ['Spotted Hyenas', 'Cheetahs', 'African Wild Dogs'])
addPredators('Water Buffalo', ['Lions'])
replacePreators('Wild Boar', ['Wolves'])
addPredators('Wildebeest', ['Hyenas', 'Cheetahs', 'Wild Dogs'])
addPredators('Wolverine', ['Mountain Lions'])
replacePreators('Wombat', ['Foxes', 'Dingoes', 'Wild Dogs', 'Eagles', 'Tasmanian Devils'])
addPredators('Woodpecker', ['Feral Cats', 'Foxes', 'Hawks', 'Coyotes'])
addPredators('Yellow-Eyed Penguin', ['Cats', 'Stoats', 'Dogs', 'Ferrets', 'Barracoota', 'Sharks', 'Sea Lions'])
addPredators('Zebra', ['Wild dogs', 'Cheetahs'])

In [None]:
df.Predators.unique()
df = df.rename(columns={'Predators': 'AllPredators'})

In [None]:
# Droppo animali estinti
df = df.loc[(df['Conservation Status'] != 'Extinct (around 4,000 years ago)') &
             (df['Conservation Status'] != 'Extinct (around 58 million years ago)') &
               (df['Conservation Status'] != 'Extinct')]

# Deroppo gli animali che non hanno predatori e che non hanno uno stato di conservazione definito
df = df.loc[(df['AllPredators'] != 'Not Applicable') & (df['Conservation Status'] != 'Not Applicable')]

In [None]:
# Estraiamo gli animali e i predatori in un unico elenco
animals = df['Animal'].tolist()
predators = df['AllPredators'].str.split(', ').explode().unique().tolist()

In [None]:
animali_duplicati = df[df.duplicated(subset=['Animal'], keep=False)]
animali_duplicati

In [None]:
def plural_to_singular(plural_words):
    p = inflect.engine()
    singular_words = []
    for word in plural_words:
        singular_word = p.singular_noun(word)
        if singular_word:
            singular_words.append(singular_word)
        else:
            singular_words.append(word)
    return singular_words

def plural_to_singular_word(word):
    p = inflect.engine()
    singular = p.singular_noun(word)
    if singular:
        return singular
    else:
        return word

sing_predators = plural_to_singular(predators)

animali_comuni = set(sing_predators).intersection(set(animals))
animali_comuni

In [None]:
G = nx.DiGraph()

# Aggiungere nodi al grafo con lo stato di conservazione, se presente
for animal in animals:
    status = df[df['Animal'] == animal]['Conservation Status'].iloc[0]
    height = df[df['Animal'] == animal]['Height (cm)'].iloc[0]
    weight = df[df['Animal'] == animal]['Weight (kg)'].iloc[0]
    lifespan = df[df['Animal'] == animal]['Lifespan (years)'].iloc[0]
    habitat = df[df['Animal'] == animal]['Habitat'].iloc[0]
    family = df[df['Animal'] == animal]['Family'].iloc[0]
    gestation_period = df[df['Animal'] == animal]['Gestation Period (days)'].iloc[0]
    offspring_per_birth = df[df['Animal'] == animal]['Offspring per Birth'].iloc[0]
    countries = df[df['Animal'] == animal]['Countries Found'].iloc[0]
    pray = 'Yes'
    if animal in animali_comuni:
        pray = 'Not Only'
    G.add_node(animal, conservation_status = status, pray = pray, height = height, weight = weight, lifespan = lifespan, habitat = habitat,
               family = family, gestation_period = gestation_period, offspring_per_birth = offspring_per_birth, countries = countries)

# Aggiungere nodi predatori al grafo solo se non sono presenti in animali_comuni
for predator in sing_predators:
    if predator not in animali_comuni:
        G.add_node(predator, conservation_status = 'Not Have', pray = 'No')

for _, row in df.iterrows():
    animal = row['Animal']

    for predator in row['AllPredators'].split(', '):
        sing_predator = plural_to_singular_word(predator)
        G.add_edge(sing_predator, animal)


In [None]:
def find_nodes_containing_keyword(G, keyword):
    matching_nodes = []
    for node in G.nodes():
        if keyword.lower() in node.lower():
            matching_nodes.append(node)
    return matching_nodes

keyword = "orangutan"
matching_nodes = find_nodes_containing_keyword(G, keyword)
if matching_nodes:
    print(f"I nodi che contengono la parola '{keyword}' nel loro nome sono:")
    for node in matching_nodes:
        print(node)
else:
    print(f"Nessun nodo trovato contenente la parola '{keyword}'.")


In [None]:
def visualize_node_edges(G, node_name):
    if node_name in G.nodes():
        successors = list(G.successors(node_name))
        predecessors = list(G.predecessors(node_name))
        
        print(f"Gli archi uscenti dal nodo {node_name} sono:")
        for successor in successors:
            print(f"{node_name} -> {successor}")
        
        print(f"\nGli archi entranti nel nodo {node_name} sono:")
        for predecessor in predecessors:
            print(f"{predecessor} -> {node_name}")
    else:
        print(f"Il nodo {node_name} non esiste nel grafo.")

node_name = "Wolf"
visualize_node_edges(G, node_name)


In [None]:
df['Weight (kg)'] = df['Weight (kg)'].str.replace(',', '.')

In [None]:
import re

def transform_weight(weight_str):
    if "Up to" in weight_str:
        return float(re.findall(r'\d*\.?\d+', weight_str)[0])
    else:
        if weight_str == 'Varies':
            return -1
        min_weight, max_weight = map(float, re.findall(r'\d*\.?\d+', weight_str))
        return (min_weight + max_weight) / 2

In [None]:
df['Weight (kg)'] = df['Weight (kg)'].apply(transform_weight)

In [None]:
#Adesso voglio raggruppare gli animali in leggeri, medi, grandi

def label_weight(weight):
    if weight == -1:
        return 'Not Applicable'
    elif weight < 30:
        return 'Small'
    elif 30 <= weight <= 60:
        return 'Medium'
    else:
        return 'Heavy'
    
df['weight_labeled'] = df['Weight (kg)'].apply(label_weight)

In [None]:
#nx.write_gexf(G, 'new_animals_cleared.gexf')

In [107]:
df['Habitat'].unique()

array(['Savannas, Grasslands', 'Grasslands, Savannas', 'Savannah, Forest',
       'Savannahs', 'Mountains, Alpine', 'Amazon Rainforest',
       'Grasslands, Plains', 'Grasslands, Forests',
       'Middle East, North Africa', 'Desert', 'Tundra',
       'Freshwater Rivers, Lakes', 'North Atlantic, Arctic',
       'Oceans, Coastal Areas', 'Coastal Waters', 'Lakes, Canals',
       'Rainforests', 'Rainforests, Grasslands', 'Forests, Lakes, Coasts',
       'Forests', 'Forests, Mountains', 'Oceans', 'Deserts, Woodlands',
       'Grasslands', 'Grasslands, Mangroves', 'Deep-sea',
       'Forests, Urban Areas', 'Coastal Areas', 'Coral Reefs, Tide Pools',
       'Human Dwellings', 'Grasslands, Swamps', 'Freshwater',
       'Coral Reefs', 'Deep-sea, Caves', 'Rainforests, Madagascar',
       'Worldwide', 'Forests, Grasslands', 'Coastal Waters, Seagrass',
       'Amazon Basin', 'Antarctic', 'Gardens, Grasslands',
       'Sahara Desert', 'Forests, Caves', 'Northern Australia',
       'Galápagos Islan