# Petite analyse des paroles de rap : Une solution pour explorer les textes de rap à grande échelle

Le genre musical du **rap** est connu pour ses paroles riches et expressives qui reflètent souvent des réalités sociales et des émotions profondes. Comprendre et analyser les paroles de rap peut fournir des informations précieuses sur les thèmes abordés par les rappeurs, l'évolution des tendances et même la perception sociale. Cependant, analyser manuellement un grand nombre de textes de rap peut être fastidieux et chronophage. Grâce à l'utilisation de la bibliothèque **pandas** et d'un code simple, nous vous offrons une méthode automatisée pour explorer et analyser les paroles de rap à grande échelle.

### Pourquoi?

Les paroles de rap sont souvent un reflet authentique des expériences et des préoccupations des rappeurs. Leur analyse peut aider à identifier les thèmes récurrents, les styles d'écriture distincts et les influences culturelles. Cependant, avec une quantité importante de textes de rap disponibles, il devient difficile d'extraire des informations significatives de manière manuelle et efficace. Il est donc essentiel de disposer d'une solution automatisée pour analyser les paroles de rap à grande échelle, offrant ainsi une compréhension plus approfondie de ce genre musical.

In [3]:
import pandas as pd
import glob

file_list = glob.glob('/work/rap-lyrics/*.txt')
names = [f.split('/')[-1].split('_')[0] for f in file_list]

rapper_text = []

for i, file_path in enumerate(file_list):
    with open(file_path, 'r', encoding='ISO-8859-1') as f:
        lyrics = f.read()
        rapper_text.append((names[i], lyrics))

df = pd.DataFrame(rapper_text, columns=['rapper', 'text'])
print(df.head())


              rapper                                               text
0         Mac Miller  \nYeah, yeah, yeah, yo\nYeah, yeah, yeah, yo\n...
1           ASAP Ant  \nChickens in the sink\nCrack on the stove\nTr...
2              Big L  \nYo, I got slugs for snitches, no love for bi...
3                 NF  \nFeels like we're on the edge right now\nI wi...
4  Chance The Rapper  \nYou don't want zero problems, big fella!\nYe...


In [4]:
df

Unnamed: 0,rapper,text
0,Mac Miller,"\nYeah, yeah, yeah, yo\nYeah, yeah, yeah, yo\n..."
1,ASAP Ant,\nChickens in the sink\nCrack on the stove\nTr...
2,Big L,"\nYo, I got slugs for snitches, no love for bi..."
3,NF,\nFeels like we're on the edge right now\nI wi...
4,Chance The Rapper,"\nYou don't want zero problems, big fella!\nYe..."
5,Bas,\nDo you still believe in love?\nOr do you lik...
6,Isaiah Rashad,"\nAh, ah, ah, ah\nAh, ah, ah, ah\n\nI cut my h..."
7,Eazy-E,"\n""Yeah, Gangsta Dresta done stepped in this, ..."
8,Lupe Fiasco,"\nYeah, I say, bitch bad\nWoman good, lady bet..."
9,Kendrick Lamar,\nNobody pray for me\nIt's been that day for m...


In [5]:
file_list = glob.glob('/work/rap-lyrics/*.txt')
names = [f.split('/')[-1].split('_')[0] for f in file_list]

rapper_text = []

for i, file_path in enumerate(file_list):
    with open(file_path, 'r', encoding='ISO-8859-1') as f:
        lyrics = f.read()
        rapper = names[i]
        words = lyrics.split()
        n_words = len(words)
        rapper_text.append((rapper, lyrics, n_words))

df2 = pd.DataFrame(rapper_text, columns=['rapper', 'text', 'n_words'])
df2['rapper'] = df2['rapper'].replace({'Tupac1': 'Tupac', 'Tupac2': 'Tupac'})
df2.to_csv('rap_all.csv', index=False)

Cette solution automatisée permet d'explorer et d'analyser un grand nombre de textes de rap en utilisant des outils de traitement de données familiers. On pourra ainsi utiliser ce DataFrame pour effectuer différentes analyses, telles que l'identification des mots les plus couramment utilisés par chaque rappeur, la détection des thèmes récurrents ou même la création de visualisations pour représenter graphiquement les tendances dans les paroles de rap.

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=73a2d827-cb40-472a-ae56-dc40ef4b18bd' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>