# Bases de datos en Python

<a id="sql"></a>
## Acceso a bases de datos relacionales

Podemos acceder a bases de datos SQL con la librería `pymysql`. Para instalarla escribimos en Anaconda Prompt:  
`conda install -c anaconda pymysql`

#### Ejemplo 1
Vamos a conectarnos a la base de datos NBA, que contiene estadísticas de partidos de una temporada.  
Utilizaremos los siguientes parámetros:  
* servidor: relational.fit.cvut.cz
* usuario: guest
* contraseña: relational  
* base de datos: NBA  

<img src="https://relational.fit.cvut.cz/assets/img/datasets-generated/NBA.svg" width="400">  

Vamos a crear una conexión con la base de datos

In [34]:
data_base_host = 'relational.fit.cvut.cz'
username = 'guest'
password = 'relational'
database_name = 'NBA'

# conexión con la base de datos
db = pymysql.connect( host = data_base_host, user = username, password=  password, database = database_name )

# abrimos el archivo
cursor = db.cursor()

La función `connect()` crea una conexión a la base de datos. Un *cursor* nos permite realizar operaciones con los datos almacenados en la base de datos. Al ejecutar `cursor()` es como si estuviésemos utilizando `open()` cuando trabajábamos con archivos.  

<img src='https://i.ibb.co/L8HH0G5/cursor.png'>  

Una vez creado el cursor, podemos empezar a ejecutar comandos sobre el contenido de la base de datos utilizando el métido `execute()`,

Al ejecutar queries, utilizamos los métodos `fetchone()` (primera fila) o `fectchall()` (todas las filas) para visizar los resultados de las consultas. Para cerrar la conexión, utilizamso el método `close()`

In [15]:
cursor.execute(' SELECT * FROM Player ')
cursor.fetchone()

(1, 'Nicolas Batum')

Podemos ver las tablas de la base de datos con la query `SHOW TABLES`

In [18]:
cursor.execute('SHOW TABLES')
cursor.fetchall()

(('Actions',),
 ('Game',),
 ('Player',),
 ('Team',),
 ('joined_drafted_all_players_original',))

In [20]:
cursor.close()

El método `read_sql()` de pandas nos permite crear dataframes a partir de queries. Con este método no es necesario crear un cursor

In [26]:
import pandas as pd

In [36]:
query = 'SELECT * FROM Actions'
df = pd.read_sql(query, db)
df



Unnamed: 0,GameId,TeamId,PlayerId,Minutes,FieldGoalsMade,FieldGoalAttempts,3PointsMade,3PointAttempts,FreeThrowsMade,FreeThrowAttempts,...,DefensiveRebounds,TotalRebounds,Assists,PersonalFouls,Steals,Turnovers,BlockedShots,BlocksAgainst,Points,Starter
0,1,7,78,2605,5,14,3,3,0,0,...,3,3,4,2,1,1,0,0,13,1
1,1,7,79,2359,11,19,3,3,8,8,...,8,8,3,2,3,3,1,0,34,1
2,1,7,80,2104,6,7,3,3,3,8,...,7,9,1,3,1,1,2,0,15,1
3,1,7,81,1392,1,5,3,3,0,0,...,2,2,0,4,1,0,0,0,2,1
4,1,7,82,2124,5,8,3,3,1,2,...,3,3,6,1,1,4,0,0,12,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
762,30,25,316,0,0,0,3,3,0,0,...,0,0,0,0,0,0,0,0,0,0
763,30,25,317,0,0,0,3,3,0,0,...,0,0,0,0,0,0,0,0,0,0
764,30,25,318,0,0,0,3,3,0,0,...,0,0,0,0,0,0,0,0,0,0
765,30,17,344,0,0,0,3,3,0,0,...,0,0,0,0,0,0,0,0,0,0


Obtenemos los jugadores con más de 5 asistencias en algún partido

In [45]:
query = '''SELECT  PlayerName,Assists
         FROM Actions
         JOIN Player
         ON Actions.PlayerId = Player.PlayerId
'''

cursor.execute(query)
cursor.fetchall()

(('Nicolas Batum', 7),
 ('LaMarcus Aldridge', 6),
 ('Robin Lopez', 1),
 ('Wesley Matthews', 6),
 ('Damian Lillard', 8),
 ('Thomas Robinson', 0),
 ('Maurice Williams', 3),
 ('Will Barton', 1),
 ('Dorell Wright', 0),
 ('Earl Watson', 0),
 ('CJ McCollum', 0),
 ('Meyers Leonard', 0),
 ('Victor Claver', 0),
 ('Kent Bazemore', 1),
 ('Kent Bazemore', 6),
 ('Pau Gasol', 7),
 ('Pau Gasol', 0),
 ('Chris Kaman', 2),
 ('Chris Kaman', 0),
 ('Jodie Meeks', 2),
 ('Jodie Meeks', 1),
 ('Kendall Marshall', 5),
 ('Kendall Marshall', 10),
 ('Steve Nash', 10),
 ('Steve Nash', 0),
 ('Xavier Henry', 0),
 ('Xavier Henry', 0),
 ('Robert Sacre', 1),
 ('Robert Sacre', 3),
 ('Ryan Kelly', 2),
 ('Ryan Kelly', 2),
 ('Nick Young', 1),
 ('Nick Young', 1),
 ('Marshon Brooks', 0),
 ('Marshon Brooks', 0),
 ('Jordan Hill', 0),
 ('Jordan Hill', 0),
 ('Wesley Johnson', 0),
 ('Wesley Johnson', 3),
 ('Andre Iguodala', 7),
 ('Andre Iguodala', 0),
 ('Draymond Green', 6),
 ('Draymond Green', 4),
 ("Jermaine O'Neal", 0),
 ("Jerm

In [44]:
query = '''SELECT  PlayerName,Assists
         FROM Actions
         JOIN Player
         ON Actions.PlayerId = Player.PlayerId
         WHERE Assists > 5
'''

pd.read_sql(query,db)



Unnamed: 0,PlayerName,Assists
0,Raymond Felton,6
1,Ty Lawson,6
2,Aaron Brooks,6
3,Ray McCallum,10
4,Austin Rivers,9
...,...,...
64,Chris Paul,9
65,Blake Griffin,11
66,Kemba Walker,10
67,Jameer Nelson,7


Obtenemos el TOP 10 jugadores con más asistencias en la temporada

In [49]:
query = ''' SELECT PlayerName, SUM(Assists) AS TotalAssists

            FROM Actions
            JOIN Player
            ON Actions.PlayerId = Player.PlayerId
            GROUP BY PlayerName
            ORDER BY TotalAssists DESC
            LIMIT 10
    
'''

Asistencias = pd.read_sql(query, db)
Asistencias



Unnamed: 0,PlayerName,TotalAssists
0,Chris Paul,27.0
1,Kemba Walker,25.0
2,Brandon Jennings,22.0
3,Ty Lawson,21.0
4,Demar DeRozan,20.0
5,Ramon Sessions,17.0
6,Andre Miller,17.0
7,DJ Augustin,16.0
8,John Wall,16.0
9,Lebron James,16.0


Obtenemos el TOP 10 Equipos con más puntuación media por partido

In [66]:
# sumas los puntos de todos los jugadores de un equipo por partido,
# haces la media de puntos de todos los jugadores de un equipo en todos los partidos
# comparas con la media de otros equipo

query =''' 
    SELECT TeamName, AVG(PointsMatch) as AvgPoints

    FROM (

          SELECT TeamName, GameId, SUM(Points) as PointsMatch

          FROM Actions
          JOIN Team
          ON Actions.TeamId = Team.TeamId
          GROUP BY TeamName,GameId
       ) TABLA

    GROUP BY TeamName
    ORDER BY AvgPoints DESC
    LIMIT 10

'''

pd.read_sql(query, db)

Unnamed: 0,TeamName,AvgPoints
0,Portland Trail Blazers,124.0
1,Cleveland Cavaliers,119.0
2,Dallas Mavericks,116.5
3,Golden State Warriors,112.5
4,Los Angeles Clippers,111.0
5,Charlotte Bobcats,108.3333
6,Phoenix Suns,108.0
7,Denver Nuggets,107.0
8,Los Angeles Lakers,107.0
9,Oklahoma City Thunder,106.0
