#### Planteamiento del Problema

Se desea predecir la cantidad de puntos que pueda hacer un jugador en un partido, 
a partir de estadísticas personales (del jugador) y colectivas (del equipo en donde juega). 

Imports

In [1]:
#Se importan todas las dependencias necesarias
import pandas as pd
import sqlalchemy
import psycopg2
import csv
import os
from sqlalchemy import create_engine
from dotenv import load_dotenv
from nba_api.stats.endpoints import playergamelogs, teamgamelogs, teamgamelog

ModuleNotFoundError: No module named 'pandas'

Obtenemos las estadísticas de los jugadores por partidos en las temporadas 2020-21, 2021-22 y 2022-23

In [2]:
season0_players = playergamelogs.PlayerGameLogs(season_nullable='2020-21') #Consulta para temporada 2020-21
season1_players = playergamelogs.PlayerGameLogs(season_nullable='2021-22') #Consulta para temporada 2021-22
season2_players = playergamelogs.PlayerGameLogs(season_nullable='2022-23') #Consulta para temporada 2022-23
players = pd.concat([season0_players.get_data_frames()[0],season1_players.get_data_frames()[0],season2_players.get_data_frames()[0]], ignore_index=True) #Dataframe de estadísticas de jugadores por partido en las tres temporadas
players.head()

Unnamed: 0,SEASON_YEAR,PLAYER_ID,PLAYER_NAME,NICKNAME,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,...,BLKA_RANK,PF_RANK,PFD_RANK,PTS_RANK,PLUS_MINUS_RANK,NBA_FANTASY_PTS_RANK,DD2_RANK,TD3_RANK,WNBA_FANTASY_PTS_RANK,AVAILABLE_FLAG
0,2020-21,1629020,Jarred Vanderbilt,Jarred,1610612750,MIN,Minnesota Timberwolves,22001071,2021-05-16T00:00:00,MIN vs. DAL,...,20949,4919,6289,12975,4365,5088,1849,143,6966,1
1,2020-21,204060,Joe Ingles,Joe,1610612762,UTA,Utah Jazz,22001077,2021-05-16T00:00:00,UTA @ SAC,...,1,10833,6289,9732,2707,6937,1849,143,6966,1
2,2020-21,1629234,Drew Eubanks,Drew,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,1,1,10308,16353,4365,19129,1849,143,18556,1
3,2020-21,1629014,Anfernee Simons,Anfernee,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,...,1,4919,6289,9732,3454,16547,1849,143,14865,1
4,2020-21,203476,Gorgui Dieng,Gorgui,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,1,4919,16020,12975,14475,15094,1849,143,14865,1


Obtenemos las estadísticas de los equipos por partidos en las temporadas 2020-21, 2021-22 y 2022-23

In [3]:
season0_teams = teamgamelogs.TeamGameLogs(season_nullable='2020-21') #Consulta para temporada 2020-21
season1_teams = teamgamelogs.TeamGameLogs(season_nullable='2021-22') #Consulta para temporada 2021-22
season2_teams = teamgamelogs.TeamGameLogs(season_nullable='2022-23') #Consulta para temporada 2022-23
teams = pd.concat([season0_teams.get_data_frames()[0],season1_teams.get_data_frames()[0],season2_teams.get_data_frames()[0]], ignore_index=True) #Dataframe de estadísticas de equipos por partido en las tres temporadas
teams.head()

Unnamed: 0,SEASON_YEAR,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,WL,MIN,FGM,...,AST_RANK,TOV_RANK,STL_RANK,BLK_RANK,BLKA_RANK,PF_RANK,PFD_RANK,PTS_RANK,PLUS_MINUS_RANK,AVAILABLE_FLAG
0,2020-21,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,W,48.0,46,...,1099,1048,2016,490,141,376,786,115,280,1
1,2020-21,1610612753,ORL,Orlando Magic,22001075,2021-05-16T00:00:00,ORL @ PHI,L,48.0,36,...,1276,1636,1867,1499,1024,1927,61,714,1644,1
2,2020-21,1610612761,TOR,Toronto Raptors,22001079,2021-05-16T00:00:00,TOR vs. IND,L,48.0,39,...,1619,641,751,1499,332,49,1002,960,1693,1
3,2020-21,1610612737,ATL,Atlanta Hawks,22001066,2021-05-16T00:00:00,ATL vs. HOU,W,48.0,49,...,146,826,348,155,1024,376,1220,354,60,1
4,2020-21,1610612763,MEM,Memphis Grizzlies,22001070,2021-05-16T00:00:00,MEM @ GSW,L,48.0,40,...,938,826,126,801,663,1376,1002,1723,1693,1


Agregamos la columna PTSR (Puntos recibidos) por el equipo en cada partido, temporadas 2020-21, 2021-22 y 2022-23. 

Sería restar los puntos realizados menos la diferencia final de puntaje respecto al otro equipo una vez finalizado el partido.

In [4]:
teams['PTSR'] = (teams['PTS'] - teams['PLUS_MINUS']).astype(int)
teams.head()

Unnamed: 0,SEASON_YEAR,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,WL,MIN,FGM,...,TOV_RANK,STL_RANK,BLK_RANK,BLKA_RANK,PF_RANK,PFD_RANK,PTS_RANK,PLUS_MINUS_RANK,AVAILABLE_FLAG,PTSR
0,2020-21,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,W,48.0,46,...,1048,2016,490,141,376,786,115,280,1,116
1,2020-21,1610612753,ORL,Orlando Magic,22001075,2021-05-16T00:00:00,ORL @ PHI,L,48.0,36,...,1636,1867,1499,1024,1927,61,714,1644,1,128
2,2020-21,1610612761,TOR,Toronto Raptors,22001079,2021-05-16T00:00:00,TOR vs. IND,L,48.0,39,...,641,751,1499,332,49,1002,960,1693,1,125
3,2020-21,1610612737,ATL,Atlanta Hawks,22001066,2021-05-16T00:00:00,ATL vs. HOU,W,48.0,49,...,826,348,155,1024,376,1220,354,60,1,95
4,2020-21,1610612763,MEM,Memphis Grizzlies,22001070,2021-05-16T00:00:00,MEM @ GSW,L,48.0,40,...,826,126,801,663,1376,1002,1723,1693,1,113


Hacemos una nueva consulta a la API con otro endpoint para poder obtener el W_PCT o % de Victorias del equipo

In [5]:
teams_list = teams.TEAM_ID.unique().tolist() #El for será para encontrar el W_PCT de todos los equipos para cada partido de la temporada
teamLog = pd.DataFrame() #inicializamos para que no quede basura

for team in teams_list:
    teamLog0 = teamgamelog.TeamGameLog(season='2020-21',team_id=team) #Consulta para temporada 2020-21
    teamLog1 = teamgamelog.TeamGameLog(season='2021-22',team_id=team) #Consulta para temporada 2021-22
    teamLog2 = teamgamelog.TeamGameLog(season='2022-23',team_id=team) #Consulta para temporada 2022-23
    teamLog3 = pd.concat([teamLog0.get_data_frames()[0], teamLog1.get_data_frames()[0], teamLog2.get_data_frames()[0]],ignore_index=True) #En cada ciclo se forma el dataframe por equipo por partido en las tres temporadas 
    teamLog  = pd.concat([teamLog, teamLog3]) #Se van consolidando en un dataframe las consultas para todos los equipos


In [6]:
#Se renombran las columnas de con el mismo titulo que en el dataframe de teams, para poder hacer el merge deseado (filtrando por las columnas GAME_ID y TEAM_ID)
teamLog = teamLog.rename(columns={'Game_ID': 'GAME_ID'})
teamLog = teamLog.rename(columns={'Team_ID': 'TEAM_ID'})

In [8]:
#Se hace el merge deseado de W_PCT (% Victorias) filtrando por las columnas GAME_ID y TEAM_ID
merged_df = pd.merge(teams,teamLog, on=['GAME_ID','TEAM_ID'], how='left')
teams['W_PCT'] = merged_df['W_PCT']
teams.head()

Unnamed: 0,SEASON_YEAR,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,WL,MIN,FGM,...,STL_RANK,BLK_RANK,BLKA_RANK,PF_RANK,PFD_RANK,PTS_RANK,PLUS_MINUS_RANK,AVAILABLE_FLAG,PTSR,W_PCT
0,2020-21,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,W,48.0,46,...,2016,490,141,376,786,115,280,1,116,0.583
1,2020-21,1610612753,ORL,Orlando Magic,22001075,2021-05-16T00:00:00,ORL @ PHI,L,48.0,36,...,1867,1499,1024,1927,61,714,1644,1,128,0.292
2,2020-21,1610612761,TOR,Toronto Raptors,22001079,2021-05-16T00:00:00,TOR vs. IND,L,48.0,39,...,751,1499,332,49,1002,960,1693,1,125,0.375
3,2020-21,1610612737,ATL,Atlanta Hawks,22001066,2021-05-16T00:00:00,ATL vs. HOU,W,48.0,49,...,348,155,1024,376,1220,354,60,1,95,0.569
4,2020-21,1610612763,MEM,Memphis Grizzlies,22001070,2021-05-16T00:00:00,MEM @ GSW,L,48.0,40,...,126,801,663,1376,1002,1723,1693,1,113,0.528


In [10]:
#Para comprobar que no hayan quedado valores que no hayan hecho math entre columna GAME_ID y TEAM_ID
#Si fuese el caso, se hubiese rellenado con NaN
teams.W_PCT.isna().any()

False

Obtenemos un solo DataFrame con las columnas que necesitamos, se va a consolidar todo en el Dataframe de estadísticas de los jugadores "players"

In [12]:
#Del Dataframe "teams" se obtienen las columnas de Puntos recibidos por el equipo 'PTSR', 'PTS' Puntos realizados por el equipo y W_PCT (%Victorias)
#Se hace el merge deseado de Puntos recibidos por el equipo 'PTSR', 'PTS' Puntos realizados por el equipo y W_PCT (%Victorias); filtrando por las columnas GAME_ID y TEAM_ID
teams = teams.rename(columns={'PTS': 'PTSTeam'}) #Porque en el Dataframe players tambien hay una columna PTS

merged_df2 = pd.merge(players,teams, on=['GAME_ID','TEAM_ID'], how='left')

players[['PTSRTeam','PTSTeam','W_PCTTeam']] = merged_df2[['PTSR','PTSTeam','W_PCT']] #Se crean las nuevas columnas en el Dataframe players de acuerdo al merge realizado.

players.head()

Unnamed: 0,SEASON_YEAR,PLAYER_ID,PLAYER_NAME,NICKNAME,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,...,PTS_RANK,PLUS_MINUS_RANK,NBA_FANTASY_PTS_RANK,DD2_RANK,TD3_RANK,WNBA_FANTASY_PTS_RANK,AVAILABLE_FLAG,PTSRTeam,PTSTeam,W_PCTTeam
0,2020-21,1629020,Jarred Vanderbilt,Jarred,1610612750,MIN,Minnesota Timberwolves,22001071,2021-05-16T00:00:00,MIN vs. DAL,...,12975,4365,5088,1849,143,6966,1,121,136,0.319
1,2020-21,204060,Joe Ingles,Joe,1610612762,UTA,Utah Jazz,22001077,2021-05-16T00:00:00,UTA @ SAC,...,9732,2707,6937,1849,143,6966,1,99,121,0.722
2,2020-21,1629234,Drew Eubanks,Drew,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,16353,4365,19129,1849,143,18556,1,123,121,0.458
3,2020-21,1629014,Anfernee Simons,Anfernee,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,...,9732,3454,16547,1849,143,14865,1,116,132,0.583
4,2020-21,203476,Gorgui Dieng,Gorgui,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,12975,14475,15094,1849,143,14865,1,123,121,0.458


In [14]:
#Para comprobar que no hayan quedado valores que no hayan hecho math entre columna GAME_ID y TEAM_ID
#Si fuese el caso, se hubiese rellenado con NaN
print(players.PTSRTeam.isna().any())
print(players.PTSTeam.isna().any())
print(players.W_PCTTeam.isna().any())

False
False
False


Se agrega una nueva columna para determinar si un equipo es local o visitante

In [15]:
def determinar_tipo(data):
    if '@' in data:
        return 'A'  # Si hay '@', entonces es visitante
    elif 'vs' in data:
        return 'H'  # Si hay 'vs', entonces es local
    
players['HOME_AWAY'] = players['MATCHUP'].apply(determinar_tipo) #Nueva columna Home (H), Away (A)



Cargamos los datos en un .CSV

In [36]:
players.to_csv('/workspace/ProyectoDS/data/raw/data_raw.csv', index=False)

Tomamos el promedio de los últimos 5 partidos para las estadísticas por jugador

Removemos las columnas que no se utilizarán en la generación del modelo predictivo.

In [20]:
players = players.drop(['WNBA_FANTASY_PTS', 'GP_RANK', 'W_RANK', 'L_RANK', 'W_PCT_RANK',
       'MIN_RANK', 'FGM_RANK', 'FGA_RANK', 'FG_PCT_RANK', 'FG3M_RANK',
       'FG3A_RANK', 'FG3_PCT_RANK', 'FTM_RANK', 'FTA_RANK', 'FT_PCT_RANK',
       'OREB_RANK', 'DREB_RANK', 'REB_RANK', 'AST_RANK', 'TOV_RANK',
       'STL_RANK', 'BLK_RANK', 'BLKA_RANK', 'PF_RANK', 'PFD_RANK', 'PTS_RANK',
       'PLUS_MINUS_RANK', 'NBA_FANTASY_PTS_RANK', 'DD2_RANK', 'TD3_RANK',
       'WNBA_FANTASY_PTS_RANK','NBA_FANTASY_PTS', 'DD2',
       'TD3'], axis = 1)

players.head()

Unnamed: 0,SEASON_YEAR,PLAYER_ID,PLAYER_NAME,NICKNAME,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,...,BLKA,PF,PFD,PTS,PLUS_MINUS,AVAILABLE_FLAG,PTSRTeam,PTSTeam,W_PCTTeam,HOME_AWAY
0,2020-21,1629020,Jarred Vanderbilt,Jarred,1610612750,MIN,Minnesota Timberwolves,22001071,2021-05-16T00:00:00,MIN vs. DAL,...,2,1,2,7,9,1,121,136,0.319,H
1,2020-21,204060,Joe Ingles,Joe,1610612762,UTA,Utah Jazz,22001077,2021-05-16T00:00:00,UTA @ SAC,...,0,2,2,10,13,1,99,121,0.722,A
2,2020-21,1629234,Drew Eubanks,Drew,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,0,0,1,4,9,1,123,121,0.458,H
3,2020-21,1629014,Anfernee Simons,Anfernee,1610612757,POR,Portland Trail Blazers,22001076,2021-05-16T00:00:00,POR vs. DEN,...,0,1,2,10,11,1,116,132,0.583,H
4,2020-21,203476,Gorgui Dieng,Gorgui,1610612759,SAS,San Antonio Spurs,22001078,2021-05-16T00:00:00,SAS vs. PHX,...,0,1,0,7,-4,1,123,121,0.458,H


In [21]:
players.columns

Index(['SEASON_YEAR', 'PLAYER_ID', 'PLAYER_NAME', 'NICKNAME', 'TEAM_ID',
       'TEAM_ABBREVIATION', 'TEAM_NAME', 'GAME_ID', 'GAME_DATE', 'MATCHUP',
       'WL', 'MIN', 'FGM', 'FGA', 'FG_PCT', 'FG3M', 'FG3A', 'FG3_PCT', 'FTM',
       'FTA', 'FT_PCT', 'OREB', 'DREB', 'REB', 'AST', 'TOV', 'STL', 'BLK',
       'BLKA', 'PF', 'PFD', 'PTS', 'PLUS_MINUS', 'AVAILABLE_FLAG', 'PTSRTeam',
       'PTSTeam', 'W_PCTTeam', 'HOME_AWAY'],
      dtype='object')

In [32]:
players = players.sort_values(by=['SEASON_YEAR', 'PLAYER_ID','GAME_DATE'], ascending=[True,True,True])

In [50]:
players = players.reset_index(drop=True)
players.head(10)

Unnamed: 0,SEASON_YEAR,PLAYER_ID,PLAYER_NAME,NICKNAME,TEAM_ID,TEAM_ABBREVIATION,TEAM_NAME,GAME_ID,GAME_DATE,MATCHUP,...,BLKA,PF,PFD,PTS,PLUS_MINUS,AVAILABLE_FLAG,PTSRTeam,PTSTeam,W_PCTTeam,HOME_AWAY
0,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000002,2020-12-22T00:00:00,LAL vs. LAC,...,1,2,6,22,2,1,116,109,0.0,H
1,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000008,2020-12-25T00:00:00,LAL vs. DAL,...,1,0,4,22,16,1,115,138,0.5,H
2,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000040,2020-12-27T00:00:00,LAL vs. MIN,...,0,1,6,18,16,1,91,127,0.667,H
3,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000045,2020-12-28T00:00:00,LAL vs. POR,...,2,2,3,29,0,1,115,107,0.5,H
4,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000060,2020-12-30T00:00:00,LAL @ SAS,...,3,1,4,26,-1,1,107,121,0.6,A
5,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000075,2021-01-01T00:00:00,LAL @ SAS,...,3,0,6,26,18,1,103,109,0.667,A
6,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000087,2021-01-03T00:00:00,LAL @ MEM,...,0,2,4,22,19,1,94,108,0.714,A
7,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000103,2021-01-05T00:00:00,LAL @ MEM,...,0,0,3,26,20,1,92,94,0.75,A
8,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000121,2021-01-07T00:00:00,LAL vs. SAS,...,0,3,6,27,-10,1,118,109,0.667,H
9,2020-21,2544,LeBron James,LeBron,1610612747,LAL,Los Angeles Lakers,22000131,2021-01-08T00:00:00,LAL vs. CHI,...,0,1,8,28,9,1,115,117,0.7,H


In [33]:
jugadores_ID = players.PLAYER_ID.unique().tolist()
juegos_ID = players.GAME_ID.unique().tolist()

In [39]:
lista_columnas_para_promedio = ['MIN', 'FGM', 'FGA', 'FG_PCT', 'FG3M', 'FG3A', 'FG3_PCT', 'FTM',
       'FTA', 'FT_PCT', 'OREB', 'DREB', 'REB', 'AST', 'TOV', 'STL', 'BLK',
       'BLKA', 'PF', 'PFD', 'PTS', 'PLUS_MINUS', 'PTSRTeam',
       'PTSTeam', 'W_PCTTeam']

In [73]:
def calcular_promedio_puntos(dataframe, game_id, player_id, n_partidos, columna):
  """
  Calcula el promedio de puntos de un jugador en los N partidos anteriores, excluyendo el partido actual.
  Parámetros:
    dataframe: El dataframe con los datos de los jugadores.
    game_id: El GAME_ID del partido actual.
    player_id: El PLAYER_ID del jugador para el que se quiere calcular el promedio.
    n_partidos: El número de partidos anteriores a considerar.
  Devuelve:
    El promedio de puntos del jugador en los N partidos anteriores.
  """

  # Filtrar el dataframe para los partidos anteriores al actual
  partidos_anteriores = dataframe[dataframe['GAME_ID'] < game_id]
  # Filtrar el dataframe para el jugador en cuestión
  partidos_jugador = partidos_anteriores[partidos_anteriores['PLAYER_ID'] == player_id]
  # Si no hay suficientes partidos anteriores para el jugador, devolver 0
  puntos_jugador = partidos_jugador[columna]
  
  if len(partidos_jugador) < n_partidos:

    if len(partidos_jugador)==4:

      promedio_puntos = puntos_jugador.tail(4).mean()

      return promedio_puntos

    if len(partidos_jugador)==3:

      promedio_puntos = puntos_jugador.tail(3).mean()

      return promedio_puntos

    if len(partidos_jugador)==2:

      promedio_puntos = puntos_jugador.tail(2).mean()

      return promedio_puntos

    if len(partidos_jugador)==1:

      #promedio_puntos = puntos_jugador.tail(1).mean()

      return 1

    if len(partidos_jugador)==0:

      promedio_puntos = dataframe[(dataframe['GAME_ID']==game_id) & (dataframe['PLAYER_ID']==player_id)][columna]

      return promedio_puntos.iloc[0]

  # Obtener los puntos del jugador en los partidos anteriores
  
  # Calcular el promedio de puntos
  promedio_puntos = puntos_jugador.tail(n_partidos).mean()
  # Devolver el promedio de puntos
  return promedio_puntos
  
n_partidos = 5
for columna in lista_columnas_para_promedio:
  for jugador in jugadores_ID:
      for juego in juegos_ID:
        
        indice = players.index[(players['GAME_ID']==juego) & (players['PLAYER_ID']==jugador)]
        promedio = calcular_promedio_puntos(players, juego, jugador, n_partidos,columna)
        players.loc[indice,columna+'PROM'] = promedio
        
players.head()

IndexError: single positional indexer is out-of-bounds

In [41]:
jugador_anterior = 0
for columna in lista_columnas_para_promedio:
    for jugador in jugadores_ID:
        for juego in juegos_ID:
            
            longitud = len(players[['PLAYER_ID']==jugador])

            if longitud > 5:

                for i in range(0,longitud)

                    if i == 0:

                        promedio = players[columna].[indice-5:indice-1].mean()
                        players.loc[indice,columna+'PROM'] = promedio
                        
            for i in range()
            if jugador != jugador_anterior: 

                if longitud > 5:

                    indice = players.index[players['GAME_ID']==juego & players['PLAYER_ID']==jugador]
                    promedio = players[columna].[indice-5:indice-1].mean()
                    players.loc[indice,columna+'PROM'] = promedio

                elif
            

            jugador_anterior = jugador

TypeError: Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool]

Enviamos los registros a una DB.

In [77]:
load_dotenv()
dbname = os.getenv("DB_NAME")
user = os.getenv("DB_USER")
password = os.getenv("DB_PASSWORD")
host = os.getenv("DB_HOST")
port = os.getenv("DB_PORT")

In [78]:
port

'3306'

In [79]:
engine = create_engine("postgresql://gitpod:postgres@localhost:3306/estadisticasNBA")
engine.connect()

OperationalError: (psycopg2.OperationalError) connection to server at "localhost" (::1), port 3306 failed: Connection refused
	Is the server running on that host and accepting TCP/IP connections?
connection to server at "localhost" (127.0.0.1), port 3306 failed: Connection refused
	Is the server running on that host and accepting TCP/IP connections?

(Background on this error at: https://sqlalche.me/e/20/e3q8)

In [74]:
conn = psycopg2.connect(
    dbname='estadisticasNBA',
    user='gitpod',
    password='postgres',
    host='localhost',
    port='5432'
)


OperationalError: connection to server at "localhost" (::1), port 5432 failed: Connection refused
	Is the server running on that host and accepting TCP/IP connections?
connection to server at "localhost" (127.0.0.1), port 5432 failed: Connection refused
	Is the server running on that host and accepting TCP/IP connections?
