In [2]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# Carica il dataset dei tweet
tweets_df = pd.read_csv("./datasets/twitter/twitter_tweets.csv")

# Definisci pesi per like, quote, reply e retweet
peso_like = 1
peso_reply = 2
peso_retweet = 3
peso_quote = 3


# Normalizza i valori dei vari aspetti
scaler = MinMaxScaler()
tweet_features = scaler.fit_transform(tweets_df[['like_count', 'quote_count', 'reply_count', 'retweet_count']])

# Calcola il punteggio totale per ciascun tweet
tweets_df['punteggio_totale'] = (
    tweet_features[:, 0] * peso_like + 
    tweet_features[:, 1] * peso_reply + 
    tweet_features[:, 2] * peso_retweet + 
    tweet_features[:, 3] * peso_quote 
)

# Ordina il DataFrame in base al punteggio totale in ordine decrescente (più influenti)
tweets_df_sorted_desc = tweets_df.sort_values(by='punteggio_totale', ascending=False)

# Seleziona i primi n tweet più influenti
n = 400
top_tweets = tweets_df_sorted_desc.head(n)

# Stampa i tweet più influenti
print("Tweet più influenti:")
print(top_tweets[['tweet_id', 'like_count', 'quote_count', 'reply_count', 'retweet_count', 'punteggio_totale']])

#print(top_tweets)


Tweet più influenti:
                    tweet_id  like_count  quote_count  reply_count  \
871365   1454653822849011713       42682         2219        13137   
2218350  1484230264293318663      192137        10642        12575   
1639231  1474743503393628164       11027          243        17238   
765175   1459164143626424321       33156         5759         8598   
2116372  1486482496883625984       20161         7196         7281   
...                      ...         ...          ...          ...   
2070201  1487274305624973317        1305           32         1173   
3539470  1468247323436322824        1089          137         1313   
4737085  1490742993841758215       12530           65          994   
225084   1473715610886582278         925          649          704   
2869758  1434911045231857665        2335            7           35   

         retweet_count  punteggio_totale  
871365           76411          5.882075  
2218350          13270          5.514192  
1639231  

In [3]:
from textblob import TextBlob

# Funzione per l'analisi del sentiment
def analyze_sentiment(text):
    # Crea un oggetto TextBlob dal testo del tweet
    blob = TextBlob(text)
    # Restituisce la polarità del sentiment
    return blob.sentiment.polarity

# Applica la funzione di analisi del sentiment al contenuto dei tweet
tweets_df['sentiment_polarity'] = tweets_df['content'].apply(analyze_sentiment)

# Stampa i tweet con la polarità del sentiment
print("Sentiment Analysis dei tweet:")
print(tweets_df[['tweet_id', 'content', 'sentiment_polarity']])

Sentiment Analysis dei tweet:
                    tweet_id  \
0        1471266741087055872   
1        1471262376796336128   
2        1471262187633135617   
3        1471261469278834688   
4        1471261026050093059   
...                      ...   
4792259  1496333455000768517   
4792260  1496332316079431680   
4792261  1496326805380345857   
4792262  1496309759972048896   
4792263  1496295005874446344   

                                                   content  sentiment_polarity  
0            The Hashies are here. https://t.co/bkkspANbaH            0.000000  
1        #HashMasks 12279 changed name to: "CatinaBot" ...            0.000000  
2        Hashmask #8270 - “Unnamed” was purchased by ht...            0.133333  
3        His name is Atom. Can we get him a fight?\n- R...            0.200000  
4        @mskDAO #NameYourHashmask \nFree speech now an...            0.400000  
...                                                    ...                 ...  
4792259  @NftTrade