In [17]:
import pandas as pd

In [18]:
df = pd.read_csv("spotify_chart.csv")

In [19]:
def count_songs_per_week(df, artist):
    """
    Conta quantas músicas de um artista apareceram em cada semana no ranking.
    
    Parâmetros:
    df (pd.DataFrame): DataFrame original contendo as colunas 'artist_names' e 'week'.
    artist (str): Nome (ou parte do nome) do artista a ser filtrado.
    
    Retorna:
    pd.DataFrame: DataFrame com a contagem de músicas do artista por semana.
    """
    # Filtrar semanas únicas
    weeks = df['week'].unique()
    
    # Filtrar linhas onde o nome do artista aparece em 'artist_names'
    artist_df = df[df['artist_names'].str.contains(artist, case=False, na=False)]
    
    # Contar quantas músicas apareceram em cada semana
    weekly_count = artist_df.groupby('week').size().reset_index(name='song_count')
    
    # Criar DataFrame com todas as semanas e preencher com zero onde necessário
    all_weeks_df = pd.DataFrame({'week': weeks})
    result_df = all_weeks_df.merge(weekly_count, on='week', how='left').fillna(0)
    
    # Converter contagem para inteiro
    result_df['song_count'] = result_df['song_count'].astype(int)

    # Adicionar a coluna do artista
    result_df['artist_name'] = artist

    # Salvar os dados em um arquivo csv
    result_df.to_csv(f'{artist.replace(" ","")}_spotify_chart.csv', index=False)
    
    return result_df

In [20]:
count_songs_per_week(df,"Taylor Swift")

Unnamed: 0,week,song_count,artist_name
0,2020-01-02,2,Taylor Swift
1,2020-01-09,1,Taylor Swift
2,2020-01-23,0,Taylor Swift
3,2020-02-06,3,Taylor Swift
4,2020-02-13,2,Taylor Swift
...,...,...,...
193,2024-08-15,5,Taylor Swift
194,2024-08-22,5,Taylor Swift
195,2024-08-29,5,Taylor Swift
196,2024-09-05,4,Taylor Swift
