In [1]:
from nba_api.stats.endpoints import leaguegamefinder
import pandas as pd
from datetime import datetime
import time

# Étendue des saisons NBA (données disponibles depuis 1946, mais on se limite à 1990-91)
seasons = [
    '1990-91', '1991-92', '1992-93', '1993-94', '1994-95',
    '1996-97', '1997-98', '1998-99', '1999-00',
    '2000-01', '2001-02', '2002-03', '2003-04', '2004-05',
    '2005-06', '2006-07', '2007-08', '2008-09', '2009-10',
    '2010-11', '2011-12', '2012-13', '2013-14', '2014-15',
    '2015-16', '2016-17', '2017-18', '2018-19', '2019-20',
    '2020-21', '2021-22', '2022-23', '2023-24', '2024-25'
]

# Liste pour stocker les dataframes de chaque saison
all_games_dfs = []

# Récupérer les données pour chaque saison
for season in seasons:
    print(f"Récupération des données pour la saison {season}...")
    try:
        gamefinder = leaguegamefinder.LeagueGameFinder(season_nullable=season)
        games_df = gamefinder.get_data_frames()[0]
        all_games_dfs.append(games_df)
        print(f"  {len(games_df)} matchs récupérés")
        # Pause pour éviter de surcharger l'API
        time.sleep(0.2)
    except Exception as e:
        print(f"  Erreur lors de la récupération de la saison {season}: {e}")

# Concaténer tous les dataframes en un seul
historical_games_df = pd.concat(all_games_dfs, ignore_index=True)

print(f"Total: {len(historical_games_df)} matchs")


Récupération des données pour la saison 1990-91...
  2352 matchs récupérés
  2352 matchs récupérés
Récupération des données pour la saison 1991-92...
Récupération des données pour la saison 1991-92...
  2362 matchs récupérés
  2362 matchs récupérés
Récupération des données pour la saison 1992-93...
Récupération des données pour la saison 1992-93...
  2368 matchs récupérés
  2368 matchs récupérés
Récupération des données pour la saison 1993-94...
  2370 matchs récupérés
Récupération des données pour la saison 1993-94...
  2370 matchs récupérés
Récupération des données pour la saison 1994-95...
Récupération des données pour la saison 1994-95...
  2362 matchs récupérés
  2362 matchs récupérés
Récupération des données pour la saison 1996-97...
  2524 matchs récupérés
Récupération des données pour la saison 1996-97...
  2524 matchs récupérés
Récupération des données pour la saison 1997-98...
  2522 matchs récupérés
Récupération des données pour la saison 1997-98...
  2522 matchs récupérés
R

  historical_games_df = pd.concat(all_games_dfs, ignore_index=True)


In [2]:
historical_games_df

Unnamed: 0,SEASON_ID,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,WL,MIN,PTS,...,FT_PCT,OREB,DREB,REB,AST,STL,BLK,TOV,PF,PLUS_MINUS
0,41990,1610612741,CHI,Chicago Bulls,0049000068,1991-06-12,CHI @ LAL,W,240,108,...,0.786,10,27,37,28,14,6,18,23,
1,41990,1610612747,LAL,Los Angeles Lakers,0049000068,1991-06-12,LAL vs. CHI,L,240,101,...,0.800,12,24,36,29,6,7,22,22,
2,41990,1610612747,LAL,Los Angeles Lakers,0049000067,1991-06-09,LAL vs. CHI,L,240,82,...,0.846,18,24,42,14,4,3,9,23,
3,41990,1610612741,CHI,Chicago Bulls,0049000067,1991-06-09,CHI @ LAL,W,240,97,...,0.857,9,29,38,27,4,8,5,22,
4,41990,1610612747,LAL,Los Angeles Lakers,0049000066,1991-06-07,LAL vs. CHI,L,265,96,...,0.640,9,20,29,19,9,7,14,20,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
109859,12024,1610612762,UTA,Utah Jazz,0012400002,2024-10-04,UTA vs. NZB,W,238,116,...,0.727,9,35,44,27,11,5,21,19,29.0
109860,12024,50011,KMB,Mega MIS,2012400002,2024-09-06,KMB @ GLU,L,238,66,...,0.846,6,30,36,9,3,3,26,18,-32.4
109861,12024,50012,GLU,G League United,2012400002,2024-09-06,GLU vs. KMB,W,240,99,...,0.750,4,28,32,23,20,8,12,22,34.2
109862,12024,50011,KMB,Mega MIS,2012400001,2024-09-04,KMB @ GLU,L,240,81,...,0.813,6,25,31,17,8,1,24,16,-18.0


--------------
Joueurs

In [None]:
from nba_api.stats.endpoints import playergamelog, leaguedashplayerstats
import pandas as pd
import time

print("Récupération des données pour la saison 2023-24...")

# Définir la saison à analyser
season = '2023-24'  # Saison la plus récente complète

# Liste pour stocker toutes les statistiques
all_player_stats = []

try:
    # Récupérer tous les joueurs ayant joué lors de cette saison
    player_stats = leaguedashplayerstats.LeagueDashPlayerStats(season=season)
    season_players = player_stats.get_data_frames()[0]
    
    print(f"Nombre de joueurs pour la saison {season}: {len(season_players)}")
    
    # Pour chaque joueur de cette saison
    for i, player in season_players.iterrows():
        player_id = player['PLAYER_ID']
        player_name = player['PLAYER_NAME']
        
        print(f"[{i+1}/{len(season_players)}] Récupération des données pour {player_name}...")
        
        try:
            # Récupérer le game log complet du joueur pour cette saison
            gamelog = playergamelog.PlayerGameLog(player_id=player_id, season=season)
            stats = gamelog.get_data_frames()[0]
            
            if not stats.empty:
                # Ajouter des informations supplémentaires
                stats['PLAYER_NAME'] = player_name
                stats['PLAYER_ID'] = player_id
                stats['SEASON'] = season
                
                all_player_stats.append(stats)
                print(f"  {len(stats)} matchs trouvés")
            else:
                print(f"  Aucun match trouvé")
                
            # Pause pour éviter de surcharger l'API
            time.sleep(0.5)
            
        except Exception as e:
            print(f"  Erreur: {e}")
        
        # Sauvegarde tous les 20 joueurs
        if (i+1) % 20 == 0:
            temp_df = pd.concat(all_player_stats, ignore_index=True)
            temp_df.to_csv(f"nba_players_2023_24_temp_{i+1}.csv", index=False)
            print(f"Sauvegarde intermédiaire effectuée ({len(temp_df)} entrées)")
            
except Exception as e:
    print(f"Erreur lors de la récupération des joueurs: {e}")

# Combiner toutes les statistiques des joueurs
if all_player_stats:
    players_stats_df = pd.concat(all_player_stats, ignore_index=True)
    print(f"Total: {len(players_stats_df)} entrées de matchs de joueurs")
    print(f"Nombre total de joueurs uniques: {players_stats_df['PLAYER_ID'].nunique()}")
    
    # Enregistrer les données finales
    players_stats_df.to_csv("nba_players_2023_24.csv", index=False)
    print("Données sauvegardées dans nba_players_2023_24.csv")
else:
    print("Aucune donnée de joueur récupérée")

Nombre de joueurs sélectionnés: 300
Récupération des données pour Precious Achiuwa (ID: 1630173)...
  Saison 2018-19...
    Aucun match trouvé
  Saison 2019-20...
    Aucun match trouvé
  Saison 2019-20...
    Aucun match trouvé
  Saison 2020-21...
    61 matchs trouvés
  Saison 2020-21...
    61 matchs trouvés
  Saison 2021-22...
    73 matchs trouvés
  Saison 2021-22...
    73 matchs trouvés
  Saison 2022-23...
    55 matchs trouvés
  Saison 2022-23...
    55 matchs trouvés
  Saison 2023-24...
    74 matchs trouvés
  Saison 2023-24...
    74 matchs trouvés
  Saison 2024-25...
    54 matchs trouvés
  Saison 2024-25...
    54 matchs trouvés
Récupération des données pour Steven Adams (ID: 203500)...
  Saison 2018-19...
Récupération des données pour Steven Adams (ID: 203500)...
  Saison 2018-19...
    80 matchs trouvés
    80 matchs trouvés
  Saison 2019-20...
  Saison 2019-20...
    63 matchs trouvés
    63 matchs trouvés
  Saison 2020-21...
    58 matchs trouvés
  Saison 2020-21...
   

KeyboardInterrupt: 

In [9]:
from nba_api.stats.endpoints import playergamelog, commonallplayers
import pandas as pd
import time

# Récupérer la liste des joueurs actifs
players_data = commonallplayers.CommonAllPlayers(is_only_current_season=0)
players_df = players_data.get_data_frames()[0]
active_players = players_df[players_df['ROSTERSTATUS'] == 1]

# Sélectionner un nombre limité de joueurs pour l'exemple
sample_players = active_players.head(5)  # Limité à 5 joueurs pour l'exemple

# Récupérer les statistiques de match pour chaque joueur
all_player_stats = []

for index, player in sample_players.iterrows():
    player_id = player['PERSON_ID']
    player_name = player['DISPLAY_FIRST_LAST']
    
    print(f"Récupération des données pour {player_name} (ID: {player_id})...")
    
    # Récupérer les statistiques du joueur pour la saison 2023-24
    try:
        gamelog = playergamelog.PlayerGameLog(player_id=player_id, season='2023-24')
        stats = gamelog.get_data_frames()[0]
        
        # Ajouter le nom du joueur
        stats['PLAYER_NAME'] = player_name
        
        all_player_stats.append(stats)
        print(f"  {len(stats)} matchs trouvés")
        
        # Pause pour éviter de surcharger l'API
        time.sleep(1)
        
    except Exception as e:
        print(f"  Erreur: {e}")

# Combiner toutes les statistiques des joueurs
if all_player_stats:
    players_stats_df = pd.concat(all_player_stats, ignore_index=True)
    print(f"Total: {len(players_stats_df)} entrées de matchs de joueurs")

Récupération des données pour Precious Achiuwa (ID: 1630173)...
  74 matchs trouvés
Récupération des données pour Steven Adams (ID: 203500)...
  0 matchs trouvés
Récupération des données pour Bam Adebayo (ID: 1628389)...
  71 matchs trouvés
Récupération des données pour Ochai Agbaji (ID: 1630534)...
  78 matchs trouvés
Récupération des données pour Santi Aldama (ID: 1630583)...
  61 matchs trouvés
Total: 284 entrées de matchs de joueurs


  players_stats_df = pd.concat(all_player_stats, ignore_index=True)


In [10]:
players_df

Unnamed: 0,PERSON_ID,DISPLAY_LAST_COMMA_FIRST,DISPLAY_FIRST_LAST,ROSTERSTATUS,FROM_YEAR,TO_YEAR,PLAYERCODE,PLAYER_SLUG,TEAM_ID,TEAM_CITY,TEAM_NAME,TEAM_ABBREVIATION,TEAM_CODE,TEAM_SLUG,GAMES_PLAYED_FLAG,OTHERLEAGUE_EXPERIENCE_CH
0,76001,"Abdelnaby, Alaa",Alaa Abdelnaby,0,1990,1994,HISTADD_alaa_abdelnaby,alaa_abdelnaby,0,,,,,,Y,00
1,76002,"Abdul-Aziz, Zaid",Zaid Abdul-Aziz,0,1968,1977,HISTADD_zaid_abdul-aziz,zaid_abdul-aziz,0,,,,,,Y,00
2,76003,"Abdul-Jabbar, Kareem",Kareem Abdul-Jabbar,0,1969,1988,HISTADD_kareem_abdul-jabbar,kareem_abdul-jabbar,0,,,,,,Y,00
3,51,"Abdul-Rauf, Mahmoud",Mahmoud Abdul-Rauf,0,1990,2000,mahmoud_abdul-rauf,mahmoud_abdul-rauf,0,,,,,,Y,00
4,1505,"Abdul-Wahad, Tariq",Tariq Abdul-Wahad,0,1997,2003,tariq_abdul-wahad,tariq_abdul-wahad,0,,,,,,Y,00
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5020,1627826,"Zubac, Ivica",Ivica Zubac,1,2016,2024,ivica_zubac,ivica_zubac,1610612746,LA,Clippers,LAC,clippers,clippers,Y,01
5021,78650,"Zunic, Matt",Matt Zunic,0,1948,1948,HISTADD_matt_zunic,matt_zunic,0,,,,,,Y,00
5022,1641783,"da Silva, Tristan",Tristan da Silva,1,2024,2024,tristan_da_silva,tristan_da_silva,1610612753,Orlando,Magic,ORL,magic,magic,Y,00
5023,1628427,"Čančar, Vlatko",Vlatko Čančar,1,2019,2024,vlatko_cancar,vlatko_čančar,1610612743,Denver,Nuggets,DEN,nuggets,nuggets,Y,01


In [11]:
print(players_df.head())

   PERSON_ID DISPLAY_LAST_COMMA_FIRST   DISPLAY_FIRST_LAST  ROSTERSTATUS  \
0      76001          Abdelnaby, Alaa       Alaa Abdelnaby             0   
1      76002         Abdul-Aziz, Zaid      Zaid Abdul-Aziz             0   
2      76003     Abdul-Jabbar, Kareem  Kareem Abdul-Jabbar             0   
3         51      Abdul-Rauf, Mahmoud   Mahmoud Abdul-Rauf             0   
4       1505       Abdul-Wahad, Tariq    Tariq Abdul-Wahad             0   

  FROM_YEAR TO_YEAR                   PLAYERCODE          PLAYER_SLUG  \
0      1990    1994       HISTADD_alaa_abdelnaby       alaa_abdelnaby   
1      1968    1977      HISTADD_zaid_abdul-aziz      zaid_abdul-aziz   
2      1969    1988  HISTADD_kareem_abdul-jabbar  kareem_abdul-jabbar   
3      1990    2000           mahmoud_abdul-rauf   mahmoud_abdul-rauf   
4      1997    2003            tariq_abdul-wahad    tariq_abdul-wahad   

   TEAM_ID TEAM_CITY TEAM_NAME TEAM_ABBREVIATION TEAM_CODE TEAM_SLUG  \
0        0                      