# Módulo 4: APIs
## Spotify
<img src="https://developer.spotify.com/assets/branding-guidelines/logo@2x.png" width=400></img>

En este módulo utilizaremos APIs para obtener información sobre artistas, discos y tracks disponibles en Spotify. Pero primero.. ¿Qué es una **API**?<br>
Por sus siglas en inglés, una API es una interfaz para programar aplicaciones (*Application Programming Interface*). Es decir que es un conjunto de funciones, métodos, reglas y definiciones que nos permitirán desarrollar aplicaciones (en este caso un scraper) que se comuniquen con los servidores de Spotify. Las APIs son diseñadas y desarrolladas por las empresas que tienen interés en que se desarrollen aplicaciones (públicas o privadas) que utilicen sus servicios. Spotify tiene APIs públicas y bien documentadas que estaremos usando en el desarrollo de este proyecto.
#### REST
Un término se seguramente te vas a encontrar cuando estés buscando información en internet es **REST** o *RESTful*. Significa *representational state transfer* y si una API es REST o RESTful, implica que respeta unos determinados principios de arquitectura, como por ejemplo un protocolo de comunicación cliente/servidor (que será HTTP) y (entre otras cosas) un conjunto de operaciones definidas que conocemos como **métodos**. Ya veníamos usando el método GET para hacer solicitudes a servidores web.
#### Documentación
Como mencioné antes, las APIs son diseñadas por las mismas empresas que tienen interés en que se desarrollen aplicaciones (públicas o privadas) que consuman sus servicios o información. Es por eso que la forma de utilizar las APIs variará dependiendo del servicio que querramos consumir. No es lo mismo utilizar las APIs de Spotify que las APIs de Twitter. Por esta razón es de suma importancia leer la documentación disponible, generalmente en la sección de desarrolladores de cada sitio. Te dejo el [link a la de Spotify](https://developer.spotify.com/documentation/)
#### JSON
Json significa *JavaScript Object Notation* y es un formato para describir objetos que ganó tanta popularidad en su uso que ahora se lo considera independiente del lenguaje. De hecho, lo utilizaremos en este proyecto por más que estemos trabajando en Python, porque es la forma en la que obtendremos las respuestas a las solicitudes que realicemos utilizando las APIs. Para nosotros, no será ni más ni menos que un diccionario con algunas particularidades que iremos viendo a lo largo del curso.



## Clase 2

Links útiles para la clase:
- [Documentación de Spotify - Artistas](https://developer.spotify.com/documentation/web-api/reference/artists/)
- [Iron Maiden en Spotify](https://open.spotify.com/artist/6mdiAmATAx73kdxrNrnlao)
- [Registrá tu aplicación](https://developer.spotify.com/documentation/general/guides/app-settings/#register-your-app)

¿Cómo se compone la URL?
¿Qué es un Endpoint?
¿Cómo se utiliza la documentación?


In [1]:
import requests

In [2]:
url_base = 'https://api.spotify.com/v1'

In [3]:
id_badb = '4q3ewBCX7sLwd24euuV69X'

In [4]:
ep_artist = '/artists/{artist_id}'

In [5]:
url_base+ep_artist.format(artist_id=id_badb)

'https://api.spotify.com/v1/artists/4q3ewBCX7sLwd24euuV69X'

In [6]:
r = requests.get(url_base+ep_artist.format(artist_id=id_badb))

In [7]:
r.status_code

401

In [8]:
r.json()

{'error': {'status': 401, 'message': 'No token provided'}}

## Clase 3
https://developer.spotify.com/dashboard/applications/44b7b36ec145467f9a9eeaf7e417cf8b

Links útiles para la clase:
- [Guía de autorización de Spotify](https://developer.spotify.com/documentation/general/guides/authorization-guide/)
- https://www.base64encode.org/
- [Endpoint de búsqueda de Spotify](https://developer.spotify.com/documentation/web-api/reference/search/search/)

In [9]:
token_url = 'https://accounts.spotify.com/api/token'

In [10]:
params = {'grant_type': 'client_credentials'}

In [11]:
headers = {'Authorization' : 'Basic M2VkMDcwMGNhM2MxNDFmZDhmNGEwNTQxMGE4NTVjZDA6MDViOWE4ZDI3YTM3NDhjMDhjZTQ5ZTIwMDZhMDIzMWU='}

In [12]:
r = requests.post(token_url, data=params, headers=headers)

In [13]:
r.status_code

200

In [14]:
r.json()

{'access_token': 'BQDewy0eChkb_0ekHwUHXvYyVINdFwTur2i9MLdOxjnyZ5vcLtUNhlC4o5scQtmtLMZfF3TrwtQL5YcxOVmllV-ke5TFYGMMVDXC5B5ydftDamTElf8',
 'token_type': 'Bearer',
 'expires_in': 3600}

In [15]:
token = r.json()['access_token']
token

'BQDewy0eChkb_0ekHwUHXvYyVINdFwTur2i9MLdOxjnyZ5vcLtUNhlC4o5scQtmtLMZfF3TrwtQL5YcxOVmllV-ke5TFYGMMVDXC5B5ydftDamTElf8'

In [16]:
header = {"Authorization": "Bearer {}".format(token)}

In [17]:
r = requests.get(url_base+ep_artist.format(artist_id=id_badb), headers=header)

In [18]:
r.status_code

200

In [19]:
r.json()

{'external_urls': {'spotify': 'https://open.spotify.com/artist/4q3ewBCX7sLwd24euuV69X'},
 'followers': {'href': None, 'total': 60678382},
 'genres': ['reggaeton', 'trap latino', 'urbano latino'],
 'href': 'https://api.spotify.com/v1/artists/4q3ewBCX7sLwd24euuV69X',
 'id': '4q3ewBCX7sLwd24euuV69X',
 'images': [{'height': 640,
   'url': 'https://i.scdn.co/image/ab6761610000e5eb8ee9a6f54dcbd4bc95126b14',
   'width': 640},
  {'height': 320,
   'url': 'https://i.scdn.co/image/ab676161000051748ee9a6f54dcbd4bc95126b14',
   'width': 320},
  {'height': 160,
   'url': 'https://i.scdn.co/image/ab6761610000f1788ee9a6f54dcbd4bc95126b14',
   'width': 160}],
 'name': 'Bad Bunny',
 'popularity': 99,
 'type': 'artist',
 'uri': 'spotify:artist:4q3ewBCX7sLwd24euuV69X'}

In [20]:
url_busqueda = 'https://api.spotify.com/v1/search'

In [21]:
search_params = {'q': "Bad+Bunny", 'type':'artist', 'market':'CO'}

In [22]:
busqueda = requests.get(url_busqueda, headers=header, params=search_params)

In [23]:
busqueda.status_code

200

In [24]:
busqueda.json()

{'artists': {'href': 'https://api.spotify.com/v1/search?query=Bad%2BBunny&type=artist&market=CO&offset=0&limit=20',
  'items': [{'external_urls': {'spotify': 'https://open.spotify.com/artist/4q3ewBCX7sLwd24euuV69X'},
    'followers': {'href': None, 'total': 60678382},
    'genres': ['reggaeton', 'trap latino', 'urbano latino'],
    'href': 'https://api.spotify.com/v1/artists/4q3ewBCX7sLwd24euuV69X',
    'id': '4q3ewBCX7sLwd24euuV69X',
    'images': [{'height': 640,
      'url': 'https://i.scdn.co/image/ab6761610000e5eb8ee9a6f54dcbd4bc95126b14',
      'width': 640},
     {'height': 320,
      'url': 'https://i.scdn.co/image/ab676161000051748ee9a6f54dcbd4bc95126b14',
      'width': 320},
     {'height': 160,
      'url': 'https://i.scdn.co/image/ab6761610000f1788ee9a6f54dcbd4bc95126b14',
      'width': 160}],
    'name': 'Bad Bunny',
    'popularity': 99,
    'type': 'artist',
    'uri': 'spotify:artist:4q3ewBCX7sLwd24euuV69X'},
   {'external_urls': {'spotify': 'https://open.spotify.com/

In [25]:
import pandas as pd

In [26]:
df = pd.DataFrame(busqueda.json()['artists']['items'])
df.head()

Unnamed: 0,external_urls,followers,genres,href,id,images,name,popularity,type,uri
0,{'spotify': 'https://open.spotify.com/artist/4...,"{'href': None, 'total': 60678382}","[reggaeton, trap latino, urbano latino]",https://api.spotify.com/v1/artists/4q3ewBCX7sL...,4q3ewBCX7sLwd24euuV69X,"[{'height': 640, 'url': 'https://i.scdn.co/ima...",Bad Bunny,99,artist,spotify:artist:4q3ewBCX7sLwd24euuV69X
1,{'spotify': 'https://open.spotify.com/artist/6...,"{'href': None, 'total': 19}",[],https://api.spotify.com/v1/artists/6T9RjD2s7RX...,6T9RjD2s7RXsA6SxwFQpcg,"[{'height': 640, 'url': 'https://i.scdn.co/ima...",Bad Bunny Imperio,9,artist,spotify:artist:6T9RjD2s7RXsA6SxwFQpcg
2,{'spotify': 'https://open.spotify.com/artist/3...,"{'href': None, 'total': 17}",[],https://api.spotify.com/v1/artists/3JAKWLBL9jZ...,3JAKWLBL9jZ5Ad3KWc04eU,"[{'height': 640, 'url': 'https://i.scdn.co/ima...",Bad Bunny Zombie,4,artist,spotify:artist:3JAKWLBL9jZ5Ad3KWc04eU
3,{'spotify': 'https://open.spotify.com/artist/3...,"{'href': None, 'total': 773}",[],https://api.spotify.com/v1/artists/3LSkCPMcNIb...,3LSkCPMcNIbOscoVhky6ce,"[{'height': 640, 'url': 'https://i.scdn.co/ima...",Bad Bunny Trap,0,artist,spotify:artist:3LSkCPMcNIbOscoVhky6ce
4,{'spotify': 'https://open.spotify.com/artist/3...,"{'href': None, 'total': 5588}",[],https://api.spotify.com/v1/artists/3dJzwISoDye...,3dJzwISoDyeRgflMly1EcE,"[{'height': 640, 'url': 'https://i.scdn.co/ima...",Dead Bad Bunny,2,artist,spotify:artist:3dJzwISoDyeRgflMly1EcE


1. Ordenar el df por popularidad
2. Quedarse con la primera fila
3. Quedarse con la columna id

In [27]:
df.sort_values(by='popularity', ascending=False).iloc[0]['id']

'4q3ewBCX7sLwd24euuV69X'

In [28]:
import base64

In [29]:
def get_token(client_id, client_secret):
    encoded = base64.b64encode(bytes(client_id+':'+client_secret, 'utf-8'))
    params = {'grant_type':'client_credentials'}
    header={'Authorization': 'Basic ' + str(encoded, 'utf-8')}
    r = requests.post('https://accounts.spotify.com/api/token', headers=header, data=params)
    if r.status_code != 200:
        print('Error en la request.', r.json())
        return None
    print('Token válido por {} segundos.'.format(r.json()['expires_in']))
    return r.json()['access_token']

In [30]:
client_id = '3ed0700ca3c141fd8f4a05410a855cd0'
client_secret = '05b9a8d27a3748c08ce49e2006a0231e'

In [31]:
token = get_token(client_id, client_secret)
token

Token válido por 3600 segundos.


'BQAyYtpRTJ57eX0LcX-wDikmzf0xGdphjGBKnqdWe0dglKKJK1Xtqv3FyCBVT_mLSMIEVY0iWerFBaVjuXq5KOcvFhJ0qkuhIURNJbqVjRddB8pl4xU'

In [32]:
header = {"Authorization": "Bearer {}".format(token)}

In [33]:
id_badb

'4q3ewBCX7sLwd24euuV69X'

In [34]:
ep_albums = '/artists/{artist_id}/albums'

In [35]:
params = {'country': 'CO'}

In [36]:
albums_badb = requests.get(url_base+ep_albums.format(artist_id=id_badb), headers=header, params=params)

In [37]:
albums_badb.status_code

200

In [38]:
albums_badb.json()["items"][0]

{'album_group': 'album',
 'album_type': 'album',
 'artists': [{'external_urls': {'spotify': 'https://open.spotify.com/artist/4q3ewBCX7sLwd24euuV69X'},
   'href': 'https://api.spotify.com/v1/artists/4q3ewBCX7sLwd24euuV69X',
   'id': '4q3ewBCX7sLwd24euuV69X',
   'name': 'Bad Bunny',
   'type': 'artist',
   'uri': 'spotify:artist:4q3ewBCX7sLwd24euuV69X'}],
 'external_urls': {'spotify': 'https://open.spotify.com/album/3RQQmkQEvNCY4prGKE6oc5'},
 'href': 'https://api.spotify.com/v1/albums/3RQQmkQEvNCY4prGKE6oc5',
 'id': '3RQQmkQEvNCY4prGKE6oc5',
 'images': [{'height': 640,
   'url': 'https://i.scdn.co/image/ab67616d0000b27349d694203245f241a1bcaa72',
   'width': 640},
  {'height': 300,
   'url': 'https://i.scdn.co/image/ab67616d00001e0249d694203245f241a1bcaa72',
   'width': 300},
  {'height': 64,
   'url': 'https://i.scdn.co/image/ab67616d0000485149d694203245f241a1bcaa72',
   'width': 64}],
 'name': 'Un Verano Sin Ti',
 'release_date': '2022-05-06',
 'release_date_precision': 'day',
 'total_t

In [45]:
def get_album_info(id_album, country = 'CO'):
    url_base = 'https://api.spotify.com/v1'
    ep_album = '/albums/{id_album}'.format(id_album=id_album)
    token = get_token(client_id,client_secret)
    header = {'Authorization': 'Bearer {}'.format(token)}
    params = {'country':country}
    info_album = requests.get(url_base+ep_album+'/tracks',
									headers=header,
									params=params)
    return [(track['id'], track['name'], track['preview_url']) for track in info_album.json()['items']] 

In [46]:
get_album_info('3RQQmkQEvNCY4prGKE6oc5')

Token válido por 3600 segundos.


[('6Xom58OOXk2SoU711L2IXO',
  'Moscow Mule',
  'https://p.scdn.co/mp3-preview/585736d2d4dba1eef13b6d63c54dd4c16a3275fb?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('1dm6z1fWB0cErMszU25dy2',
  'Después de la Playa',
  'https://p.scdn.co/mp3-preview/9dddf0cfb0bd4f88b4ec64bf547cd66e569fbf96?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('6Sq7ltF9Qa7SNFBsV5Cogx',
  'Me Porto Bonito',
  'https://p.scdn.co/mp3-preview/8513b15fb5b39966d8eccaa7b8c050c7a570e6e8?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('1IHWl5LamUGEuP4ozKQSXZ',
  'Tití Me Preguntó',
  'https://p.scdn.co/mp3-preview/a174cca3a21422be508f4e108ea1c04114e42538?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('5CzixCxDkRXX9mScCmah8O',
  'Un Ratito',
  'https://p.scdn.co/mp3-preview/62c5c24c4264ce0788d1655686a4eca459c82b11?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('5kVZxyMY1gfdCLiChsfjn1',
  'Yo No Soy Celoso',
  'https://p.scdn.co/mp3-preview/8b867e2dbbeb7af42c1efbc76d29d186a8ca4a61?cid=3ed0700ca3c141fd8f4a05410a855cd0'),
 ('41oY4WCTj5kccfesTVFnvN'

In [41]:
lista_albums = [(album['id'], album['name']) for album in albums_badb.json()['items']]
lista_albums

[('3RQQmkQEvNCY4prGKE6oc5', 'Un Verano Sin Ti'),
 ('2d9BCZeAAhiZWPpbX9aPCW', 'EL ÚLTIMO TOUR DEL MUNDO'),
 ('4gvQO5mEuhbMSrLIuwXkmz', 'LAS QUE NO IBAN A SALIR'),
 ('5lJqux7orBlA1QzyiBGti1', 'YHLQMDLG'),
 ('6ylFfzx32ICw4L1A7YWNLN', 'OASIS'),
 ('7CjJb2mikwAWA1V6kewFBF', 'X 100PRE'),
 ('6LOhj1aK7vkGHJXtKU16PN', 'La Jumpa'),
 ('4589OIFRZp41qbsp7TWFCx',
  'Lo Siento BB:/ (with Bad Bunny & Julieta Venegas)'),
 ('23zzZlUiABIg4ftZbJ7peK', 'Volví'),
 ('4MCZWUKxkvdMITh4KapBKX', 'Volando (Remix)'),
 ('27ei92dKdKhBVhEVA2ziRR', 'De Museo'),
 ('1jTRS4KS666BesH1GUHyEV', 'AM Remix'),
 ('6VSOIs13DaSG2IPilNviX5', 'Yonaguni'),
 ('5nqsQ0kfgdhrN8is8FR2rP', '100 MILLONES'),
 ('43dl8hP5uNN9s6YeeJA5fv', 'DÁKITI'),
 ('5PnvXVpTYKTgaSOGF5DGjL', 'Yo Perreo Sola (Remix)'),
 ('6aqSlutLYNpzSsK4dV5jTr', 'UN DIA (ONE DAY) (Feat. Tainy)'),
 ('0VLl6NV05DjwNE2lZFdCEI', 'CÓMO SE SIENTE (Remix)'),
 ('7Hw9RJbQPN0gUx4xjgFLhj', 'Ignorantes'),
 ('3fxzSn0ObgCjLadyR53ohN', 'Vete')]

In [42]:
def obtener_discografia(artist_id, token, return_name=False, page_limit=50, country="CO"):
    url = f'https://api.spotify.com/v1/artists/{artist_id}/albums'
    header = {'Authorization': f'Bearer {token}'}
    params = {'limit': page_limit, 
              'offset': 0,
              'country': country}
    lista = []
    r = requests.get(url, params=params, headers=header)
    
    if r.status_code != 200:
        print('Error en request.', r.json())
        return None
    
    if return_name:
        lista += [(item['id'], item['name']) for item in r.json()['items']]
    else:
        lista += [item['id'] for item in r.json()['items']]
        
    while r.json()['next']:
        r = requests.get(r.json()['next'], headers=header) # El resto de los parámetros están dentro de la URL
        if return_name:
            lista += [(item['id'], item['name']) for item in r.json()['items']]
        else:
            lista += [item['id'] for item in r.json()['items']]
    
    return lista

In [43]:
def obtener_tracks(album_id, token, return_name=False, page_limit=50, market=None):
    url=f'https://api.spotify.com/v1/albums/{album_id}/tracks'
    header = {'Authorization': f'Bearer {token}'}
    params = {'limit': page_limit, 
              'offset': 0,
              'market': market}
    lista = []
    r = requests.get(url, params=params, headers=header)
    
    if r.status_code != 200:
        print('Error en request.', r.json())
        return None
    
    if return_name:
        lista += [(item['id'], item['name']) for item in r.json()['items']]
    else:
        lista += [item['id'] for item in r.json()['items']]
        
    while r.json()['next']:
        r = requests.get(r.json()['next'], headers=header) # El resto de los parámetros están dentro de la URL
        if return_name:
            lista += [(item['id'], item['name']) for item in r.json()['items']]
        else:
            lista += [item['id'] for item in r.json()['items']]
    
    return lista

Utilizando estas funciones podemos obtener todos las canciones que tiene un artista publicadas en Spotify

In [44]:
for album in obtener_discografia(id_badb, token, return_name=True, country='CO'):
    print(album[1])
    for track in obtener_tracks(album[0], token, return_name=True, market='CO'):
        print('\t', track[1])
    break

Un Verano Sin Ti
	 Moscow Mule
	 Después de la Playa
	 Me Porto Bonito
	 Tití Me Preguntó
	 Un Ratito
	 Yo No Soy Celoso
	 Tarot
	 Neverita
	 La Corriente
	 Efecto
	 Party
	 Aguacero
	 Enséñame a Bailar
	 Ojitos Lindos
	 Dos Mil 16
	 El Apagón
	 Otro Atardecer
	 Un Coco
	 Andrea
	 Me Fui de Vacaciones
	 Un Verano Sin Ti
	 Agosto
	 Callaita


In [51]:
preview_url = 'https://p.scdn.co/mp3-preview/585736d2d4dba1eef13b6d63c54dd4c16a3275fb?cid=3ed0700ca3c141fd8f4a05410a855cd0'

In [52]:
preview = requests.get(preview_url)
preview.status_code

200

In [53]:
import IPython.display as ipd

In [54]:
import IPython.display as ipd
ipd.Audio(preview.content)