# 1° PROGETTO DI SOCIAL COMPUTING
## Andrea Antonutti, Marco Venir, Francesco Zigotti, Michele Marchi

In [1]:
import pprint
import json
import pandas as pd
import numpy as np
import scipy as sp
import os
import re
import random
import networkx as nx
import matplotlib.pyplot as plt
import tweepy
from tweepy.error import TweepError
import time
import datetime
from copy import deepcopy
pp = pprint.PrettyPrinter(indent=4)

#Legge un file JSON da un path
def read_JSON(path):
    if os.path.exists(path):
        with open(path, "r", encoding='utf-8') as file:
            data = json.load(file)
        print(f"Data read from path: {path}")
        return data
    else:
        print(f"NO Data read from path: {path}")
        return {}
        
#Crea un file JSON nel path scelto
def serialize_JSON(folder, filename, data):
    if not os.path.exists(folder):
        os.makedirs(folder, exist_ok=True)
    with open(f"{folder}/{filename}", "w", encoding='utf-8') as f:
        json.dump(data, f, ensure_ascii=False ,indent=4)
    print(f"Data serialized to path: {folder}/{filename}")

Nel seguente blocco è presente la versione non ottimizzata delle due classi da utilizzare per elaborare i dati degli utenti di Twitter. In fondo al notebook è invece presente la versione ottimizzata da eseguire in alternativa a questa.

In [None]:
class TwitterUserNetwork:
    """
    La classe TwitterUserNetwork implemente metodi per recuperare le relazioni tra utenti correlati e generare il grafo della rete sociale.
    """

    __API = None
    __users = []
    __social_graph = None
    
    def __init__(self, consumer_key, consumer_secret, access_token, access_secret):
        self.__social_graph = nx.DiGraph()
        self.__users = []
        auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
        auth.set_access_token(access_token, access_secret)
        self.__API = tweepy.API(auth, wait_on_rate_limit = True, wait_on_rate_limit_notify = True)
        if(self.__API.verify_credentials):
            print("Autenticazione completata")
    
    def __new_social_graph(self, direct=False):
        if(direct):
            return nx.DiGraph(authors = "Andrea Antonutti, Marco Venir, Michele Marchi, Francesco Zigotti")
        else:
            return nx.Graph(authors = "Andrea Antonutti, Marco Venir, Michele Marchi, Francesco Zigotti")
    
    def __get_all_users_unique(self):
        """
        Restituisce un array di tutti gli utenti presenti nella rete (utenti correlati compresi) 
        restituiti univocamente.
            :return: [TwitterUser]
        """
        all_users = []
        for user in self.__users:
            for retrieved_user in user.get_all_retrieved_users():
                if not any(user.get_profile_data()['screen_name'] == 
                           retrieved_user.get_profile_data()["screen_name"] for user in all_users):
                    all_users.append(retrieved_user)
        return all_users
    
    def __generate_nodes_from_users(self, users):
        """
        Per ogni utente passato nell'array users genera un nodo nella rete.
            :param users: array di utenti da aggiungere come nodo della rete
            :return: None
        """
        print("\u2022   Generazione dei nodi in corso...")
        for user in users:
            user_data = deepcopy(user.get_profile_data())
            user_data["follower_individuati"] = len(user.get_followers_list())
            self.__social_graph.add_nodes_from([(user.get_user_id(), user_data)])
        print("\u2022   Generazione dei nodi completata!")
    
    def add_user(self, screen_name = None, json_data = None):
        """
        Aggiunge un utente alla rete.
            :param screen_name: nome dell'utente
            :param json_data: dati serializzati di un utente che verranno usati per generarlo
            :return: TwitterUser
        """
        if(screen_name != None and json_data == None):
            user = TwitterUser(self.__API, screen_name)
        elif(screen_name == None and json_data != None):
            user = TwitterUser(self.__API, None, json_data)
        else:
            raise ValueError("Error creating object: screen_name or json_data must be None")
        self.__users.append(user)
        return user
    
    def get_users(self):
        return self.__users
    
    def generate_partial_social_graph(self, direct=True):
        """
        Genera un grafo con le relazioni di follower e following tra tutti i nodi della rete e 
        gli utenti principali.
            :param direct: True se il grafo deve essere diretto e False se deve essere indiretto.
            :return: [networkx.Graph]
        """
        print("Generazione del grafo in corso...")
        all_users = self.__get_all_users_unique()
        self.__social_graph = self.__new_social_graph(direct)
        self.__generate_nodes_from_users(all_users)
        index = 0
        total_relations = len(self.__users)*len(self.__social_graph.nodes())
        print("\u2022   Creazione degli archi in corso...")
        for user in self.__users:
            for user2 in all_users:
                if(user.get_user_id() != user2.get_user_id()):
                    relationship = self.show_friendship(user.get_user_id(), user2.get_user_id())
                    if(relationship[0].following):
                        #user segue user2
                        self.__social_graph.add_edge(user.get_user_id(), 
                                                     user2.get_user_id(), 
                                                     rel="follows")                 
                    if(relationship[0].followed_by):
                        #user2 segue user
                        self.__social_graph.add_edge(user2.get_user_id(), 
                                                     user.get_user_id(),
                                                     rel="follows")
                index += 1
                print(f"\u2022   Recuperate {index} relazioni su {total_relations} ({int((index/total_relations)*100)}%)", end="\r")
        print("\u2022   Generazione delle relazioni in completata!")
        print("\u2022   Generazione del grafo completata!")
        return self.__social_graph  
    
    def generate_complete_social_graph(self, direct=True):
        """
        Genera un grafo con le relazioni di follower e following tra tutti i nodi della rete.
            :param direct: True se il grafo deve essere diretto e False se deve essere indiretto.
            :return: networkx.Graph
        """
        print("Generazione del grafo in corso...")
        self.__social_graph = self.__new_social_graph(direct)
        ts = time.time()
        users = self.__get_all_users_unique()
        users2 = deepcopy(users)
        self.__generate_nodes_from_users(users)
        print("\u2022   Creazione degli archi in corso...")
        for user in users:
            for user2 in users2:
                if(user.get_user_id() != user2.get_user_id()):
                    relationship = self.show_friendship(user.get_user_id(), user2.get_user_id())
                    if(relationship[0].following):
                        #node segue node2
                        self.__social_graph.add_edge(user.get_user_id(),
                                                     user2.get_user_id(),
                                                     rel="follows")
                    if(relationship[0].followed_by):
                        #node2 segue node
                        self.__social_graph.add_edge(user2.get_user_id(),
                                                     user.get_user_id(),
                                                     rel="follows")
            users2 = [entry for entry in users2 if entry.get_user_id() != user.get_user_id()]
        print("\u2022   Generazione delle relazioni in completata!")
        print("\u2022   Generazione del grafo completata!")
        return self.__social_graph
    
    def show_friendship(self, source, target):
        return self.__API.show_friendship(source_id = source, target_id = target)
    
    def get_json_data(self):
        """
        Genera una serializzazione dei dati di tutti gli utenti della rete (utenti correlati compresi)
        restituiti univocamente.
            :return: {}
        """
        data_json = []
        for user in self.__get_all_users_unique():
            data_json.append(user.get_profile_data())
        return {"users" : data_json}
    
    def load_data_from_snapshot(self, json_data):
        """
        Ricostruisce la rete con tutti gli utenti e i loro dati da uno snapshot salvato.
            :param data: snapshot serializzato in JSON
            :return None
        """
        self.__users = []
        for user_data in json_data["users"]:
            self.add_user(None, user_data)
        print("\u2022   Caricamento dei dati completato!", end="\n")
    
    def generate_json_snapshot(self):
        """
        Genera una serializzazione di tutti i dati della rete.
        Se i dati vengono caricati con la funzione TwitterUserNetwork.load_data() l'intera rete può essere ricostruita a come si trovava
        al momento dello snapshot.
            :return: {}
        """
        snapshot = []
        for user in self.__users:
            snapshot.append(user.generate_json_snapshot())
        return {"users" : snapshot}

    def save_data_snapshot(self, folder, filename, verbose=True):
        """
        Salva uno snapshot della rete con il nome e nella cartella specificati.
            :param folder: path della cartella dove salvare il file
            :param filename: nome con il quale il file verrà salvato
            :param verbose: indica se mostrare in console l'avvenuto salvataggio del file mediante 
            una stringa di testo
            :return: None
        """
        if not os.path.exists(folder):
            os.makedirs(folder, exist_ok=True)
        with open(f"{folder}/{filename}", "w", encoding='utf-8') as f:
            json.dump(self.generate_json_snapshot(), f, ensure_ascii=False ,indent=4)
            if(verbose):
                print(f"\u2022   Snapshot salvato in: {folder}/{filename} {[datetime.datetime.now().strftime('%H:%M:%S')]}")



class TwitterUser:
    """
    La classe implementa metodi per scaricare, salvare ed elaborare dati di utenti di Twitter.
    """

    __API = None
    __data = {}
    __followers = []
    __following = []
    
    def __init__(self, API, screen_name = None, json_data = None):
        self.__API = API
        self.__followers = []
        self.__following = []
        if(screen_name != None and json_data == None):
            self.__data = self.__get_profile_data_from_api(screen_name)
        elif(screen_name == None and json_data != None):
            if("followers_list" in json_data and "following_list" in json_data):
                self.__load_user_from_snapshot(json_data)
            else:
                #Utente generato tramite get_followers()/get_following()
                self.__data = json_data
        else:
            raise ValueError("Error creating object: screen_name or json_data must be None")

    def __get_profile_data_from_api(self, screen_name):
        return self.__API.get_user(screen_name)._json
    
    def get_followers(self, n = 0):
        """
        Recupera i dati di n followers dell'utente.
            :param n: numero di followers di cui recuperare i dati.
            :return: TwitterUser
        """
        print(f"\u2022   Recuperando i followers di '{self.__data['screen_name']}'")
        if(self.__data["friends_count"] > 0 and not self.__data["protected"]):
            quantity = self.__data["followers_count"] if n == 0 else n
            followers_list = []
            for item in tweepy.Cursor(
                self.__API.followers, 
                screen_name=self.__data["screen_name"], 
                skip_status=True,
                include_user_entities=False
            ).items(quantity):
                print(f"--- Recuperati {len(followers_list)} di {quantity}", end="\r")
                followers_list.append(TwitterUser(self.__API, item._json["screen_name"]))
            print(f"--- Recuperati {len(followers_list)} di {quantity}")
            self.__followers = followers_list
        else:
            if(self.__data["friends_count"] == 0):
                print("L'utente non è seguito da nessun profilo.")
            else:
                print("L'utente ha il profilo privato.")
        return self
    
    def get_following(self, n = 0):
        """
        Recupera i dati di n following dell'utente.
            :param n: numero di following di cui recuperare i dati.
            :return: TwitterUser
        """
        print(f"\u2022   Recuperando i following di '{self.__data['screen_name']}'")
        if(self.__data["friends_count"] > 0 and not self.__data["protected"]):
            quantity = self.__data["friends_count"] if n == 0 else n
            following_list = []
            for item in tweepy.Cursor(
                self.__API.friends, 
                screen_name=self.__data["screen_name"], 
                skip_status=True, 
                include_user_entities=False
            ).items(quantity):
                print(f"--- Recuperati {len(following_list)} di {quantity}", end="\r")
                following_list.append(TwitterUser(self.__API, item._json["screen_name"]))
            print(f"--- Recuperati {len(following_list)} di {quantity}")
            self.__following = following_list
        else:
            if(self.__data["friends_count"] == 0):
                print("L'utente non segue nessun profilo.")
            else:
                print("L'utente ha il profilo privato.")
        return self
    
    def get_user_id(self):
        return self.__data["id"]
    
    def get_screen_name(self):
        return self.__data["screen_name"]
    
    def get_followers_list(self):
        return self.__followers
    
    def get_following_list(self):
        return self.__following
    
    def get_profile_data(self):
        return self.__data
    
    def get_all_retrieved_users(self):
        """
        Ritorna una lista di tutte le istanze TwitterUser (utenti correlati) recuperate tramite 
        l'istanza corrente .
            return: [TwitterUser]
        """
        retrieved_profiles = [self]
        if(len(self.__followers) > 0):
            for follower in self.__followers:
                retrieved_profiles.append(follower)
                retrieved_profiles += follower.get_all_retrieved_users()
        if(len(self.__following) > 0):
            for following in self.__following:
                retrieved_profiles.append(following)
                retrieved_profiles += following.get_all_retrieved_users()
        return retrieved_profiles
    
    def __load_user_from_snapshot(self, json_data):
        """
        Genera un utente mediante uno snapshot passato tramite il parametro json_data.
            :param json_data: dati dell'utente da generare.
            :return: TwitterUser
        """
        user_data = json_data
        followers = []
        following = []
        for follower_data in json_data["followers_list"]:
            followers.append(TwitterUser(self.__API, None, follower_data))
        for following_data in json_data["following_list"]:
            following.append(TwitterUser(self.__API, None, following_data))
        self.__followers = followers
        self.__following = following
        del user_data["followers_list"]
        del user_data["following_list"]
        user_data.pop("followers_ids", None)
        user_data.pop("following_ids", None)
        self.__data = user_data
        return self
    
    def generate_json_snapshot(self):
        """
        Genera uno snapshot dell'utente corrente.
            return {}
        """
        data = deepcopy(self.get_profile_data())
        followers_list = []
        following_list = []
        
        if(len(self.__followers) > 0):
            for follower in self.__followers:
                followers_list.append(follower.generate_json_snapshot())
        if(len(self.__following) > 0):
            for friend in self.__following:
                following_list.append(friend.generate_json_snapshot())
        data["followers_list"] = followers_list
        data["following_list"] = following_list
        return data

    def save_data_snapshot(self, folder, filename, verbose = True):
        """
        Salva, nella cartella specificata, lo snapshot generato dell'utente corrente
        """
        if not os.path.exists(folder):
            os.makedirs(folder, exist_ok=True)
        with open(f"{folder}/{filename}", "w", encoding='utf-8') as f:
            json.dump(self.generate_json_snapshot(), f, ensure_ascii=False ,indent=4)
            if(verbose):
                print(f"Snapshot salvato in: {folder}/{filename}", end="\r")
    

In [3]:
consumer_key = "LKhrFHGamz9A4UKvz0qA65u1p"
consumer_secret = "WDRUvUquXqeFpgBiFvCkB5NDuozQLFpgYsU3bK0TBO4FRiTslL"
access_token = "757533205792694272-TTnexUtzf6eX6zbHgOGGEp7AxKVWskJ"
access_secret = "vDrEyeTApntRc474VW7r5IpfnO7LOLWUIxHjrCjDzSk4w"

TUN = TwitterUserNetwork(consumer_key, consumer_secret, access_token, access_secret)

Autenticazione completata


In questo blocco è possibile ripristinare i dati della rete da uno snapshot effettuato in precedenza e passare direttamente alla creazione del grafo. Se non ne si possiede uno proseguire con lo scaricamento dei dati dal blocco successivo a questo.

In [4]:
snapshot = read_JSON("data/data_snapshot.json")
if(snapshot):
    TUN.load_data_from_snapshot(snapshot)

Data read from path: data/data_snapshot.json
•   Caricamento dei dati completato!


In questo blocco vengono aggiunti alla rete i 5 utenti principali. Per ognuno di essi vengono successivamente scaricati tutti i follower e i following, in seguito, sempre da ciascuno degli utenti principali, vengono scelti casualmente 5 followers da cui verranno scaricati ulteriori 10 followers e 5 following da cui verranno scaricati ulteriori 10 following.

Togliendo il commento da TUN.save_snapshot() è possibile generare uno snapshot della rete per poter lavorare sui dati in un momento successivo senza riscaricarli.

In [None]:
users = ["mizzaro","damiano10","Miccighel_","eglu81","KevinRoitero"]
for user in users:
    TUN.add_user(user)

print("Aggiunti",len(TUN.get_users()),"utenti.", sep=" ", end="\n")

print("Recupero dei dati in corso...", end="\n\n")
ts = time.time()
for user in TUN.get_users():
    user.get_followers()
    user.get_following()
    for i in range(5):
        rnd_follower = random.randint(0, len(user.get_followers_list()) - 1)
        rnd_following = random.randint(0, len(user.get_following_list()) - 1)
        user.get_followers_list()[rnd_follower].get_followers(10)
        user.get_following_list()[rnd_following].get_following(10)
    print("\n")

#TUN.save_snapshot("data", "data_snapshot.json", True)
print("Recupero dei dati completato!")
print("Tempo di recupero totale: ", str(datetime.timedelta(seconds=(time.time() - ts))), end="\n\n")

In [None]:
serialize_JSON("data", "data_serialization.json", TUN.get_json_data())

Il seguente blocco genera il grafo parziale della relazione follows tra gli utenti principali e il resto degli utenti scaricati. Alternativamente il blocco successivo genera il grafo completo con le relazioni tra tutti gli utenti della rete.

In [None]:
#GRAFO PARZIALE

social_graph = TUN.generate_partial_social_graph()
nx.write_gpickle(social_graph, "data/partial_social_graph.gpickle")
nx.draw(social_graph, with_labels=True, font_weight='bold')
plt.show()
plt.close()

In [5]:
#GRAFO COMPLETO

social_graph = TUN.generate_complete_social_graph()
# nx.write_gpickle(social_graph, "data/complete_social_graph.gpickle")
# nx.draw(social_graph, with_labels=True, font_weight='bold')
# plt.show()
# plt.close()

Generazione del grafo in corso...
•   Generazione dei nodi in corso...
•   Generazione dei nodi completata!
•   Recupero delle relazioni degli utenti in corso... (max 60/h)
•   Impossibile recuperare i dati: la pagina utente richiesta non esiste.
•   Recuperati i dati di 3083 profili su 3084 (99%)
•   Snapshot salvato in: data/data_snapshot.json ['12:03:28']
•   Creazione degli archi in corso...
Percentuale completamento: 100%
•   Creazione degli archi completata!
Generazione del grafo completata!
Tempo di generazione del grafo:  0:03:55.657773



Il seguente blocco genera un file html per la visualizzazione interattiva del grafo.

In [None]:
from pyvis.network import Network

nt = Network(
    height="100%",
    width="100%",
    bgcolor="#222222",
    font_color="white",
    heading="Grafo Sociale",
    directed=True
)
nt.barnes_hut()
nt.from_nx(social_graph)
neighbor_map = nt.get_adj_list()
for node in nt.nodes:
    node["value"] = len(neighbor_map[node["id"]])
nt.show("data/social_graph.html")

Il seguente blocco verifica se il grafo è connesso e bipartito

In [None]:
from networkx.algorithms import bipartite
social_graph_undirect = social_graph.to_undirected()

is_connected = nx.is_connected(social_graph_undirect)
is_bipartite = bipartite.is_bipartite(social_graph_undirect)

print(is_connected)
print(is_bipartite)

In questo blocco vengono misurate le distanze sul grafo.
Per fare ciò vengono rimossi i nodi isolati.

In [None]:
no_isolates_social_graph_undirect = deepcopy(social_graph_undirect)
for node in list(nx.isolates(no_isolates_social_graph_undirect)):
    no_isolates_social_graph_undirect.remove_node(node)

center = nx.center(no_isolates_social_graph_undirect)
diameter = nx.diameter(no_isolates_social_graph_undirect)
radius = nx.radius(no_isolates_social_graph_undirect)

print(center, diameter, radius)

Il seguente blocco calcola le varie misure di centralità sul grafo.

In [None]:
betwennes_centrality = []
for item in nx.betweenness_centrality(social_graph).items():
    betwennes_centrality.append(item[1])
#print(betwennes_centrality)

closeness_centrality = []
for item in nx.closeness_centrality(social_graph).items():
    closeness_centrality.append(item[1])
#print(closeness_centrality)

degree_centrality = []
for item in nx.degree_centrality(social_graph).items():
    degree_centrality.append(item[1])
#print(degree_centrality)

in_degree = []
for item in nx.in_degree_centrality(social_graph).items():
    in_degree.append(item[1])
#print(in_degree)

out_degree = []
for item in nx.out_degree_centrality(social_graph).items():
    out_degree.append(item[1])
#print(out_degree)

page_rank = []
for item in nx.pagerank(social_graph).items():
    page_rank.append(item[1])
#print(page_rank)

hits_hubs = []
for item in nx.hits(social_graph, max_iter=1000)[0].items():
    hits_hubs.append(item[1])
#print(hits_hubs)

hits_aut = []
for item in nx.hits(social_graph, max_iter=1000)[1].items():
    hits_aut.append(item[1])
#print(hits_aut)

print("OK!")

Il seguente blocco genera un sottografo indotto dal nodo "132646210" (damiano10) e calcola la cricca massima e la relativa dimensione.

In [None]:
ego_graph_damiano10 = nx.ego_graph(social_graph, 132646210)

max_clique = nx.algorithms.approximation.clique.max_clique(ego_graph_damiano10) 
print(max_clique)

large_clique_size = nx.algorithms.approximation.clique.large_clique_size(ego_graph_damiano10)
print(large_clique_size)

Nel seguente blocco viene calcolata la copertura minima degli archi del grafo.

In [None]:
min_edge_cover = nx.min_edge_cover(no_isolates_social_graph_undirect)
print(min_edge_cover)

Nel seguente blocco vengono calcolati i due coefficenti omega e sigma.

In [None]:
small_world_omega = nx.omega(no_isolates_social_graph_undirect, 1)
print(small_world_omega)

small_world_sigma = nx.sigma(no_isolates_social_graph_undirect)
print(small_world_sigma)

Nel seguente blocco vengono calcolate la correlazione di Pearson e Kendall tra le misure di centralità.
I risultati vengono riportati un due tabelle che vengono automaticamente generate nel file  "centrality_measures.xlsx" tramite la libreria "openpyxl"

In [None]:
from openpyxl import Workbook
from scipy import stats  

centrality_measures = [betwennes_centrality, closeness_centrality, degree_centrality, in_degree, 
         out_degree, page_rank, hits_hubs, hits_aut]

header = [" ","BETWENNESS CENTRALITY", "CLOSENESS CENTRALITY", "DEGREE",
           "IN DEGREE", "OUT DEGREE", "PAGERANK", "HITS HUB", "HITS AUT"]
           
wb = Workbook()
ws = wb.active

#TABELLA CORRELAZIONE DI PEARSON RHO
ws.append(["Pearson"])
ws.append(header)
for i in range(len(header[1:])):
        row_values = []
        row_values.append(header[i + 1])
        for y in range(len(centrality_measures)):
            row_values.append(stats.pearsonr(centrality_measures[i], centrality_measures[y])[0])
        ws.append(row_values)

#TABELLA CORRELAZIONE DI KENDALL TAU
ws.append([])
ws.append(["Kendall"])
ws.append(header)
for i in range(len(header[1:])):
        row_values = []
        row_values.append(header[i + 1])
        for y in range(len(centrality_measures)):
            row_values.append(stats.kendalltau(centrality_measures[i], centrality_measures[y])[0])
        ws.append(row_values)

save_folder = "data/centrality_measures_correlations.xlsx"
wb.save(save_folder)
print (f"Tabella dei dati salvata in '{save_folder}'")

Il seguente blocco verifica la reciprocità delle relazioni del grafo.

In [None]:
from networkx.algorithms.reciprocity import reciprocity
reciprocity = reciprocity(social_graph)
print(reciprocity)

Versione ottimizzata delle classi TwitterUserNetwork e TwitterUser da eseguire alternativamente alla versione non ottimizzata.

In [2]:
class TwitterUserNetwork:
    __API = None
    __users = []
    __social_graph = None

    def __init__(self, consumer_key, consumer_secret, access_token, access_secret):
        self.__users = []
        auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
        auth.set_access_token(access_token, access_secret)
        self.__API = tweepy.API(auth, wait_on_rate_limit = True, wait_on_rate_limit_notify = True, retry_count=2, compression=True)
        if(self.__API.verify_credentials):
            print("Autenticazione completata")

    def __new_social_graph(self, direct=False):
        if(direct):
            return nx.DiGraph(authors = "Andrea Antonutti, Marco Venir, Michele Marchi, Francesco Zigotti")
        else:
            return nx.Graph(authors = "Andrea Antonutti, Marco Venir, Michele Marchi, Francesco Zigotti")

    def add_user(self, screen_name = None, json_data = None):
        """
        Aggiunge un utente alla rete.
            :param screen_name: nome dell'utente
            :param json_data: dati serializzati di un utente che verranno usati per generarlo
            :return: TwitterUser
        """
        if(screen_name != None and json_data == None):
            user = TwitterUser(self.__API, screen_name)
        elif(screen_name == None and json_data != None):
            user = TwitterUser(self.__API, None, json_data)
        else:
            raise ValueError("Error creating object: screen_name or json_data must be None")
        self.__users.append(user)
        return user

    def __refresh_api(self):
        auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
        auth.set_access_token(access_token, access_secret)
        self.__API = tweepy.API(auth, wait_on_rate_limit = True, wait_on_rate_limit_notify = False, retry_count=2, compression=True)
        if(self.__API.verify_credentials):
            print("\u2022   Refresh API completato!")

    def get_users(self):
        """
        Restituisce un array di utenti aggiunti alla rete corrente.
            :return: [TwitterUser]
        """
        return self.__users

    def load_data_from_snapshot(self, json_data):
        """
        Ricostruisce la rete con tutti gli utenti e i loro dati da uno snapshot salvato.
            :param data: snapshot serializzato in JSON
            :return None
        """
        self.__users = []
        for user_data in json_data["users"]:
            self.add_user(None, user_data)
        print("\u2022   Caricamento dei dati completato!", end="\n")

    def __get_all_users_unique(self):
        """
        Restituisce un array di tutti gli utenti presenti nella rete (utenti correlati compresi) 
        riportati univocamente.
            :return: [TwitterUser]
        """
        all_users = []
        for user in self.__users:
            for retrieved_user in user.get_all_retrieved_users():
                if not any(user.get_profile_data()['screen_name'] == 
                           retrieved_user.get_profile_data()["screen_name"] for user in all_users):
                    all_users.append(retrieved_user)
        return all_users

    def __generate_nodes_from_users(self, users):
        """
        Per ogni utente passato nell'array users genera un nodo nella rete.
            :param users: array di utenti da aggiungere come nodo della rete
            :return: None
        """
        print("\u2022   Generazione dei nodi in corso...")
        for user in users:
            user_data = deepcopy(user.get_profile_data())
            user_data["follower_individuati"] = len(user.get_followers_list())
            self.__social_graph.add_nodes_from([(user.get_user_id(), user_data)])
        print("\u2022   Generazione dei nodi completata!")

    def __retrieve_users_relationships(self, users):
        """
        Recupera da twitter gli id di tutti i followers e following degli utenti.
        Ogni 15 utenti a cui vengono recuperati i dati viene eseguto uno snapshot nella cartella 
        "data" con nome "snapshot_full.json".
            :param users: array di utenti a cui recuperare gli id dei followers e following
            :return: None
        """
        print("\u2022   Recupero delle relazioni degli utenti in corso... (max 60/h)")
        index = 0
        total_users = len(users)
        for user in users:
            try:
                cur_followers = deepcopy(user.get_followers_ids())
                cur_following = deepcopy(user.get_following_ids())
                retrieved_followers = user.retrieve_followers_ids().get_followers_ids()
                retrieved_following = user.retrieve_following_ids().get_following_ids()
                index += 1
                if(cur_followers != retrieved_followers or cur_following != retrieved_following):
                    if(index % 15 == 0):
                        self.save_data_snapshot("data", "data_snpashot.json", True)
                print(f"--- Recuperati i dati di {index} profili su {total_users} ({int((index/total_users)*100)}%)", end="\r")
            except TweepError as e:
                if(e.api_code == 34):
                    print("\u2022   Impossibile recuperare i dati: la pagina utente richiesta non esiste.")
                    pass
                else:
                    print("\u2022   C'è stato un problema nel recupero dei dati. Riprovo.")
                    self.__refresh_api()
                    self.__retrieve_users_relationships(users)
        print(f"\u2022   Recuperati i dati di {index} profili su {total_users} ({int((index/total_users)*100)}%)", end="\n")
        self.save_data_snapshot("data", "data_snapshot.json")

    def __generate_edges(self, users, complete=True):
        index = 0
        total_checks = 0
        if(complete):
            users2 = deepcopy(users)[1:]
            total_checks = (len(users)*(len(users)-1))/2
        else:
            total_checks = len(self.__users)*len(users)
            users2 = deepcopy(users)
            users = self.__users
            
        print("\u2022   Creazione degli archi in corso...")
        for user in users:
            user_followers_ids = user.get_followers_ids()
            user_following_ids = user.get_following_ids()
            for user2 in users2:
                if(user2.get_user_id() in user_followers_ids):
                    #user_2 segue user
                    self.__social_graph.add_edge(user2.get_user_id(),
                                                 user.get_user_id(),
                                                 rel="follows")
                if (user2.get_user_id() in user_following_ids):
                    #user segue user_2
                    self.__social_graph.add_edge(user.get_user_id(),
                                                 user2.get_user_id(),
                                                 rel="follows")
                index += 1
                if(index % 10 == 0):
                    print(f"\u2022   Percentuale completamento: {int((index/total_checks)*100)}%", end="\r")
            users2 = users2[1:]
        print("\u2022   Percentuale completamento: 100%")
        print("\u2022   Creazione degli archi completata!")
    
    def generate_partial_social_graph(self, direct=True):
        """
        Genera un grafo con le relazioni di follower e following tra tutti i nodi della rete e 
        gli utenti principali.
            :param direct: True se il grafo deve essere diretto e False se deve essere indiretto.
            :return: [networkx.Graph]
        """
        print("Generazione del grafo in corso...")
        all_users = self.__get_all_users_unique()
        self.__social_graph = self.__new_social_graph(direct)
        self.__generate_nodes_from_users(all_users)
        print("\u2022   Creazione degli archi in corso...")
        for user in self.__users:
            user_followers_ids = user.retrieve_followers_ids().get_followers_ids()
            user_following_ids = user.retrieve_following_ids().get_following_ids()
            for user2 in all_users:
                if(user.get_user_id() != user2.get_user_id()):
                    if(user2.get_user_id() in user_following_ids):
                        #user segue user2
                        self.__social_graph.add_edge(user.get_user_id(),
                                                     user2.get_user_id(),
                                                     rel="follows")
                    if(user2.get_user_id() in user_followers_ids):
                        #user2 segue user
                        self.__social_graph.add_edge(user2.get_user_id(),
                                                     user.get_user_id(),
                                                     rel="follows")
        print("\u2022   Creazione degli archi completata!")
        print("Generazione del grafo completata!")
        return self.__social_graph
    
    def generate_complete_social_graph(self, direct=True):
        """
        Genera un grafo con le relazioni di follower e following tra tutti i nodi della rete.
            :param direct: True se il grafo deve essere diretto e False se deve essere indiretto.
            :return: networkx.Graph
        """
        print("Generazione del grafo in corso...")
        self.__social_graph = self.__new_social_graph(direct)
        ts = time.time()
        all_users = self.__get_all_users_unique()
        self.__generate_nodes_from_users(all_users)
        self.__retrieve_users_relationships(all_users)
        self.__generate_edges(all_users)
        print("Generazione del grafo completata!")
        print("Tempo di generazione del grafo: ", str(datetime.timedelta(seconds=(time.time() - ts))), end="\n\n")
        return self.__social_graph

    def get_json_data(self):
        """
        Genera una serializzazione dei dati di tutti gli utenti della rete (utenti correlati compresi) 
        riportati univocamente.
            :return: {}
        """
        data_json = []
        for user in self.__get_all_users_unique():
            data_json.append(user.get_profile_data())
        return {"users" : data_json}
    
    def generate_json_snapshot(self):
        """
        Genera una serializzazione di tutti i dati della rete.
        Se i dati vengono caricati con la funzione TwitterUserNetwork.load_data() 
        l'intera rete può essere ricostruita nello stato nel quale si trovava al momento dello snapshot.
            :return: {}
        """
        snapshot = []
        for user in self.__users:
            snapshot.append(user.generate_json_snapshot())
        return {"users" : snapshot}

    def save_data_snapshot(self, folder, filename, verbose=True):
        """
        Salva uno snapshot della rete con il nome e nella cartella specificati.
            :param folder: path della cartella dove salvare il file
            :param filename: nome con il quale il file verrà salvato
            :param verbose: indica se mostrare in console l'avvenuto salvataggio del file 
            mediante una stringa di testo
            :return: None
        """
        if not os.path.exists(folder):
            os.makedirs(folder, exist_ok=True)
        with open(f"{folder}/{filename}", "w", encoding='utf-8') as f:
            json.dump(self.generate_json_snapshot(), f, ensure_ascii=False ,indent=4)
            if(verbose):
                print(f"\u2022   Snapshot salvato in: {folder}/{filename} {[datetime.datetime.now().strftime('%H:%M:%S')]}")

                
                
class TwitterUser:
    __API = None
    __data = {}
    __followers = []
    __following = []
    __followers_ids = []
    __following_ids = []
    
    def __init__(self, API, screen_name = None, json_data = None):
        self.__API = API
        self.__data = {}
        self.__followers = []
        self.__following = []
        self.__followers_ids = []
        self.__following_ids = []
        if(screen_name != None and json_data == None):
            self.__data = self.__get_profile_data_from_api(screen_name)
        elif(screen_name == None and json_data != None):
            if("followers_list" in json_data and "following_list" in json_data):
                self.__load_user_from_snapshot(json_data)
            else:
                #Utente generato tramite get_followers()/get_following()
                self.__data = json_data
        else:
            raise ValueError("Error creating object: screen_name or json_data must be None")

    def __get_profile_data_from_api(self, screen_name):
        """
        Recupera i dati dell'utente mediante le api di twitter.
            :param screen_name: nome dell'utente a cui si vogliono recuperare i dati.
            :return: None
        """
        try:
            return self.__API.get_user(screen_name)._json
        except TweepError:
            print("Errore nel recupero dei dati utente.")
            pass

    def __chunk_ids(self, list, n):
        """
        Divide gli id passati nella lista list in liste multiple di n elementi.
            :param list: lista di id da dividere in liste multiple.
            :param n: elementi da inserire in ogni lista.
            :return: [[Integer]]
        """
        return [list[i:i + n] for i in range(0, len(list), n)]

    def get_followers(self, n = 0):
        """
        Recupera i dati di n followers dell'utente.
            :param n: numero di followers di cui recuperare i dati.
            :return: TwitterUser
        """
        print(f"\u2022   Recuperando i followers di '{self.__data['screen_name']}'")
        quantity = self.__data["followers_count"] if n == 0 else n
        followers_list = []
        followers_ids = self.retrieve_followers_ids().get_followers_ids()
        for list in self.__chunk_ids(followers_ids, 100):
            users_list = self.__API.lookup_users(user_ids = list, include_entities = False)
            for user in users_list:
                followers_list.append(TwitterUser(self.__API, None, user._json))
                print(f"--- Recuperati {len(followers_list)} di {quantity}", end="\r")
                if(len(followers_list) == quantity):
                    print(f"--- Recuperati {len(followers_list)} di {quantity}")
                    self.__followers = followers_list
                    return self
        if(self.__data["followers_count"] == 0):
            print("--- L'utente non è seguito nessun profilo.")
            return self

    def get_following(self, n = 0):
        """
        Recupera i dati di n following dell'utente.
            :param n: numero di following di cui recuperare i dati.
            :return: TwitterUser
        """
        print(f"\u2022   Recuperando i following di '{self.__data['screen_name']}'")
        quantity = self.__data["friends_count"] if n == 0 else n
        following_list = []
        following_ids = self.retrieve_following_ids().get_following_ids()
        for list in self.__chunk_ids(following_ids, 100):
            users_list = self.__API.lookup_users(user_ids = list, include_entities = False)
            for user in users_list:
                following_list.append(TwitterUser(self.__API, None, user._json))
                print(f"--- Recuperati {len(following_list)} di {quantity}", end="\r")
                if(len(following_list) == quantity):
                    print(f"--- Recuperati {len(following_list)} di {quantity}")
                    self.__following = following_list
                    return self
        if(self.__data["friends_count"] == 0):
            print("--- L'utente non segue nessun profilo.")
            return self
    
    def retrieve_followers_ids(self):
        """
        Recupera gli id di tutti i followers dell'utente.
            :return: [Integer]
        """
        if(len(self.__followers_ids) == 0 and self.__data["followers_count"] != 0):
            if(not self.__data["protected"]):
                self.__followers_ids = self.__API.followers_ids(screen_name = self.__data["screen_name"])
        return self

    def retrieve_following_ids(self):
        """
        Recupera gli id di tutti i following dell'utente.
            :return: [Integer]
        """
        if(len(self.__following_ids) == 0 and self.__data["friends_count"] != 0):
            if(not self.__data["protected"]):
                self.__following_ids = self.__API.friends_ids(screen_name = self.__data["screen_name"])
        return self

    def get_user_id(self):
        return self.__data["id"]

    def get_screen_name(self):
        return self.__data["screen_name"]

    def get_followers_list(self):
        return self.__followers

    def get_following_list(self):
        return self.__following
    
    def get_followers_ids(self):
        return self.__followers_ids
    
    def get_following_ids(self):
        return self.__following_ids
    
    def get_profile_data(self):
        return self.__data

    def get_all_retrieved_users(self):
        """
        Ritorna una lista di tutte le istanze TwitterUser (utenti correlati) recuperate tramite 
        l'istanza corrente .
            return: [TwitterUser]
        """
        retrieved_profiles = [self]
        if(len(self.__followers) > 0):
            for follower in self.__followers:
                retrieved_profiles.append(follower)
                retrieved_profiles += follower.get_all_retrieved_users()
        if(len(self.__following) > 0):
            for following in self.__following:
                retrieved_profiles.append(following)
                retrieved_profiles += following.get_all_retrieved_users()
        return retrieved_profiles
    
    def __load_user_from_snapshot(self, json_data):
        """
        Genera un utente mediante uno snapshot passato tramite il parametro json_data.
            :param json_data: snapshot dei dati dell'utente da generare.
            :return: TwitterUser
        """
        user_data = json_data
        followers = []
        following = []
        for follower_data in json_data["followers_list"]:
            followers.append(TwitterUser(self.__API, None, follower_data))
        for following_data in json_data["following_list"]:
            following.append(TwitterUser(self.__API, None, following_data))
        self.__followers = followers
        self.__following = following
        self.__followers_ids = json_data["followers_ids"]
        self.__following_ids = json_data["following_ids"]
        del user_data["followers_list"]
        del user_data["following_list"]
        del user_data["followers_ids"]
        del user_data["following_ids"]
        self.__data = user_data
        return self
    
    def generate_json_snapshot(self):
        """
        Genera uno snapshot dell'utente corrente.
            return {}
        """
        data = deepcopy(self.get_profile_data())
        data["followers_ids"] = self.__followers_ids
        data["following_ids"] = self.__following_ids
        followers_list = []
        following_list = []

        if(len(self.__followers) > 0):
            for follower in self.__followers:
                followers_list.append(follower.generate_json_snapshot())
        if(len(self.__following) > 0):
            for friend in self.__following:
                following_list.append(friend.generate_json_snapshot())
        
        data["followers_list"] = followers_list
        data["following_list"] = following_list
        return data

    def save_data_snapshot(self, folder, filename, verbose = True):
        """
        Salva, nella cartella specificata, lo snapshot generato dell'utente corrente
        """
        if not os.path.exists(folder):
            os.makedirs(folder, exist_ok=True)
        with open(f"{folder}/{filename}", "w", encoding='utf-8') as f:
            json.dump(self.generate_json_snapshot(), f, ensure_ascii=False ,indent=4)
            if(verbose):
                print(f"Snapshot salvato in: {folder}/{filename}", end="\r")