# Music Analysis

In [1]:
import re
import sys
import time
import math
import random
import spotipy
import requests
import itertools
import collections
import pandas as pd
from tqdm import tqdm
import spotipy.util as util
from bs4 import BeautifulSoup
from collections import defaultdict
from spotipy.oauth2 import SpotifyClientCredentials

In [2]:
def get_track_features(client_id = None, client_secret = None):
    if not client_id or not client_secret:
        print("Please add your client_id and client_secret")
        print("For more information, please visit ")
        print("https://developer.spotify.com/my-applications/#!/applications")
        return 
    client_credentials_manager = SpotifyClientCredentials(client_id=client_id, \
                                   client_secret = client_secret)
    sp = spotipy.Spotify(client_credentials_manager=client_credentials_manager)
    # Get track info
    artist_name = []
    track_name = []
    track_id = []
    popularity = []
    years = []

    for year in tqdm(range(1960, 2020)):
        try:
            track_results = sp.search(q='year:{0}'.format(year), type='track', limit=50)
        except:
            break
        while track_results:
            for i, t in enumerate(track_results['tracks']['items']):
                artist_name.append(t['artists'][0]['name'])
                track_name.append(t['name'])
                track_id.append(t['id'])
                popularity.append(t['popularity'])
                years.append(str(year))
            if track_results['tracks']['next']:
                try:
                    track_results = sp.next(track_results['tracks'])
                except:
                    break
            else:
                track_results = None
    print("Get {0} songs from spotify".format(len(track_id)))
    # Get featrues
    feature_keys = ['danceability', 'energy', 'key', 'loudness', 'mode', 'speechiness', 'acousticness', \
                      'instrumentalness', 'liveness', 'valence', 'tempo','duration_ms', 'time_signature']

    audio_features = {key:[] for key in feature_keys}
    audio_features['artist_name'] = artist_name
    audio_features['track_name'] = track_name
    audio_features['track_id'] = track_id
    audio_features['popularity'] = popularity
    audio_features['year'] = years # list(itertools.chain(*[[i] * 10000 for i in range(1960, 2020)])) # years

    for i in tqdm(range(0, len(track_id), 50)):
        features = sp.audio_features(track_id[i: i + 50])  
        for feature in features:
            for key in feature_keys:
                if feature and key in feature:
                    audio_features[key].append(feature[key])
                else:
                    audio_features[key].append(None)
    
    # Save to csv file
    df_tracks = pd.DataFrame(audio_features)
    df_tracks.head()
    df_tracks.to_csv(r'audio_features.csv')

In [3]:
# We've already fetch all the data and corresponding features,
# and saved it in "./audio_features.csv"
# no need to run this function again
client_id = None
client_secret = None
get_track_features(client_id, client_secret)

Please add your client_id and client_secret
For more information, please visit 
https://developer.spotify.com/my-applications/#!/applications


In [4]:
df_tracks = pd.read_csv('audio_features.csv', index_col=0)
df_tracks.head()

Unnamed: 0,danceability,energy,key,loudness,mode,speechiness,acousticness,instrumentalness,liveness,valence,tempo,duration_ms,time_signature,artist_name,track_name,track_id,popularity,year
0,0.171,0.33,5.0,-9.699,1.0,0.0329,0.707,0.00381,0.302,0.315,174.431,182400.0,3.0,Etta James,At Last,4Hhv2vrOTy89HFRcjU3QOx,75,1960
1,0.508,0.287,1.0,-12.472,1.0,0.0523,0.764,0.0,0.153,0.644,154.759,175987.0,4.0,Ella Fitzgerald,Sleigh Ride,4ukUoXLuFzMixyZyabSGc4,70,1960
2,0.579,0.502,8.0,-7.57,1.0,0.0513,0.733,0.0,0.281,0.836,76.816,131733.0,4.0,Ella Fitzgerald,Frosty The Snowman,65irrLqfCMRiO3p87P4C0D,69,1960
3,0.553,0.291,4.0,-10.426,0.0,0.0301,0.878,0.0,0.129,0.407,96.217,165560.0,4.0,Sam Cooke,You Send Me,0BFEyqJ9DJXS7gKg0Kj46R,66,1960
4,0.482,0.569,0.0,-5.897,1.0,0.0328,0.617,0.0,0.155,0.609,70.843,165280.0,4.0,Sam Cooke,Bring It On Home To Me,4yjz1aazw6R8ZURpGbCAkp,64,1960


In [5]:
df_by_year = df_tracks.dropna().groupby('year').mean().reset_index()
df_by_year.head()

Unnamed: 0,year,danceability,energy,key,loudness,mode,speechiness,acousticness,instrumentalness,liveness,valence,tempo,duration_ms,time_signature,popularity
0,1960,0.464192,0.313453,5.0053,-14.693014,0.7152,0.100909,0.80923,0.253353,0.222327,0.494803,110.969244,215520.8149,3.7509,5.4481
1,1961,0.474276,0.320147,4.948585,-14.829432,0.720816,0.107911,0.799795,0.258537,0.218472,0.493421,110.856446,222618.542363,3.752826,5.115635
2,1962,0.463054,0.330539,5.049005,-14.832738,0.719772,0.10038,0.782238,0.254475,0.225328,0.484301,111.21002,214440.192719,3.749175,6.244124
3,1963,0.478339,0.35719,5.0907,-13.994034,0.7426,0.078978,0.758253,0.238693,0.220458,0.526543,112.315946,202682.4428,3.7692,7.717
4,1964,0.478219,0.37129,5.084208,-13.754991,0.747575,0.080756,0.746077,0.217783,0.228598,0.528866,113.116872,198727.756076,3.767377,8.243324


In [6]:
import plotly.graph_objects as go
from ipywidgets import widgets
from ipywidgets import interactive
import plotly.express as px

In [7]:
virtualize_features = ['danceability', 'energy', 'key', 'loudness', 'mode', 'speechiness', 'acousticness', \
                      'instrumentalness', 'liveness', 'valence', 'tempo','duration_ms', 'time_signature', 'popularity']

feature_box = widgets.Dropdown(options=virtualize_features,
                          value=virtualize_features[0],
                          description='Feature: ')

trace1 = go.Scatter(x=df_by_year['year'], y=df_by_year['danceability'])

g = go.FigureWidget(data=[trace1],
                   layout=go.Layout(
                        title=dict(
                            text='Music Features Over Years'
                        ),
                        xaxis=dict(
                            title="Year"
                        ),
                        yaxis=dict(
                            title="danceability"
                        ),
                    ))

def response(change):
    new_feature = change['new']
    g.layout.yaxis.title = new_feature
    g.data[0].y = df_by_year[new_feature]

feature_box.observe(response, names="value")

widgets.VBox([feature_box, g])

VBox(children=(Dropdown(description='Feature: ', options=('danceability', 'energy', 'key', 'loudness', 'mode',…

In [8]:
all_musicians = list(df_tracks['artist_name'].unique())
print(len(all_musicians))

53981


In [9]:
# pip install sparqlwrapper
# https://rdflib.github.io/sparqlwrapper/
# https://stackoverflow.com/questions/45171646/how-to-get-birth-location-using-wikipedia-api
def search_birthlocation(musician):
    from SPARQLWrapper import SPARQLWrapper, JSON
    endpoint_url = "https://query.wikidata.org/sparql"
    query = """SELECT DISTINCT ?item ?itemLabel ?birthLocation ?birthLocationLabel WHERE {{
              ?item (wdt:P31|wdt:P101|wdt:P106)/wdt:P279* wd:Q639669 ;
            rdfs:label "{0}"@en ;wdt:P19 ?birthLocation
            SERVICE wikibase:label {{ bd:serviceParam wikibase:language "en". }}
            }}""".format(musician)
    sparql = SPARQLWrapper(endpoint_url)
    sparql.setQuery(query)
    sparql.setReturnFormat(JSON)
    try:
        query_result = sparql.query().convert()
    except:
        musician_birth['birthplace'].append("NaN")
        return
    if not query_result["results"]["bindings"]:
        musician_birth['birthplace'].append("NaN")
    else:
        result = query_result["results"]["bindings"][0]
        if 'birthLocationLabel' in result:
            musician_birth['birthplace'].append(result['birthLocationLabel']['value'])
        else:
            musician_birth['birthplace'].append("NaN")

def get_musician_birth_by_wikisql(run = False):
    if not run:
        return 
    musician_birth = {key:[] for key in ['name', 'birthplace']}

    for i in tqdm(all_musicians):
        time.sleep(0.1)
        musician_birth['name'].append(i)
        search_birthlocation(i)

    print(musician_birth)
    df_musician = pd.DataFrame(musician_birth)
    df_musician.head()
    df_musician.to_csv(r'musician_birth.csv', index=[0])
    
get_musician_birth_by_wikisql()

In [10]:
df_musician = pd.read_csv('musician_birth.csv', index_col=0)
df_musician.head()

Unnamed: 0,name,birthplace
0,Etta James,Los Angeles
1,Ella Fitzgerald,Newport News
2,Sam Cooke,
3,Neil Sedaka,Brooklyn
4,Dean Martin,Steubenville


In [11]:
def get_musician_birth_by_wiki(run = False):
    if not run:
        return 
    null = 0
    find = 0
    for i, name in enumerate(df_musician.name):
        if i != 0 and i % 1000 == 0:
            print(i)
            print(find)
            print(null)
        if i < 34369:
            continue
        if type(df_musician.loc[i, "birthplace"]) != float or not math.isnan(df_musician.loc[i, "birthplace"]):
            continue
        null += 1
        url = "https://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xmlfm&titles={0}&rvsection=0".format(name)
        r = requests.get(url)
        soup = BeautifulSoup(r._content, 'html.parser')
        all_matches = re.findall(r"birth_place [^\n]+\n\|", soup.prettify())
        if len(all_matches) == 0:
            all_matches = re.findall(r"origin [^\n]+\n\|", soup.prettify())
        if len(all_matches):
            df_musician.loc[i, "birthplace"] = all_matches[0].strip('\n|').replace('[', '').replace(']', '').split('=')[1].strip()
            find += 1
        time.sleep(random.uniform(0.1, 0.4))
        df_musician.to_csv(r'musician_birth1.csv', index=[0])

get_musician_birth_by_wiki()

In [52]:
df_musician = pd.read_csv('musician_birth1.csv', index_col=0)
df_musician.head()

Unnamed: 0,name,birthplace
0,Etta James,Los Angeles
1,Ella Fitzgerald,Newport News
2,Sam Cooke,"Clarksdale, Mississippi, U.S."
3,Neil Sedaka,Brooklyn
4,Dean Martin,Steubenville


In [13]:
print(len(df_musician[df_musician['birthplace'].isnull()]))

33403


In [14]:
df_musician.head()

Unnamed: 0,name,birthplace
0,Etta James,Los Angeles
1,Ella Fitzgerald,Newport News
2,Sam Cooke,"Clarksdale, Mississippi, U.S."
3,Neil Sedaka,Brooklyn
4,Dean Martin,Steubenville


In [20]:
new_df = df_musician[df_musician['birthplace'].isnull()]
l = set(list(new_df.name))
print(len(df_tracks[df_tracks['artist_name'].apply(lambda x : x not in l)]))
df_tracks[df_tracks['artist_name'].apply(lambda x : x not in l)].dropna().groupby('year').count()

400205


Unnamed: 0_level_0,danceability,energy,key,loudness,mode,speechiness,acousticness,instrumentalness,liveness,valence,tempo,duration_ms,time_signature,artist_name,track_name,track_id,popularity
year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
1960,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652,6652
1961,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533,6533
1962,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971,6971
1963,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991,6991
1964,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850,6850
1965,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083,7083
1966,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095,7095
1967,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464,7464
1968,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198,7198
1969,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191,7191


In [68]:
df = df_tracks[df_tracks['artist_name'].apply(lambda x : x in l)]
df = df.groupby('artist_name').size().sort_values()

In [69]:
df = df > 10

df = df[df]

In [79]:
print(len(df.index))

names = ([name for name in df.index if name not in res])
print(len(names))

3633
2962


In [83]:
singer_res = {}
def get_musician_birth_by_wiki(run = False):
    if not run:
        return 
    null = 0
    find = 0
    for name in tqdm(names):
        null += 1
        url = "https://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xmlfm&titles={0}&rvsection=0".format(name + " (singer)")
        r = requests.get(url)
        soup = BeautifulSoup(r._content, 'html.parser')
        all_matches = re.findall(r"birth_place [^\n]+\n\|", soup.prettify())
        if len(all_matches) == 0:
            all_matches = re.findall(r"origin [^\n]+\n\|", soup.prettify())
        if len(all_matches):
            singer_res[name] = all_matches[0].strip('\n|').replace('[', '').replace(']', '').split('=')[1].strip()
            find += 1
            if find % 10 == 0:
                print(find)
                print(null)
        time.sleep(random.uniform(0.1, 0.4))
                                                                                                                                        
get_musician_birth_by_wiki(run = True)                                                                                                                         



  0%|                                                                                         | 0/2962 [00:00<?, ?it/s]

  0%|                                                                                 | 1/2962 [00:00<31:43,  1.56it/s]

  0%|                                                                                 | 2/2962 [00:01<32:36,  1.51it/s]

  0%|                                                                                 | 3/2962 [00:02<32:30,  1.52it/s]

  0%|                                                                                 | 4/2962 [00:02<30:34,  1.61it/s]

  0%|▏                                                                                | 5/2962 [00:03<30:01,  1.64it/s]

  0%|▏                                                                                | 6/2962 [00:03<29:10,  1.69it/s]

  0%|▏                                                                                | 7/2962 [00:04<33:40,  1.46it/s]

  0%|▏                        

  2%|█▊                                                                              | 67/2962 [00:57<41:30,  1.16it/s]

  2%|█▊                                                                              | 68/2962 [00:58<38:41,  1.25it/s]

  2%|█▊                                                                              | 69/2962 [00:59<42:21,  1.14it/s]

  2%|█▉                                                                              | 70/2962 [01:00<43:45,  1.10it/s]

  2%|█▉                                                                              | 71/2962 [01:01<45:28,  1.06it/s]

  2%|█▉                                                                              | 72/2962 [01:02<42:27,  1.13it/s]

  2%|█▉                                                                              | 73/2962 [01:02<40:04,  1.20it/s]

  2%|█▉                                                                              | 74/2962 [01:03<40:30,  1.19it/s]

  3%|██                         

  5%|███▌                                                                           | 134/2962 [01:56<39:40,  1.19it/s]

  5%|███▌                                                                           | 135/2962 [01:57<38:32,  1.22it/s]

  5%|███▋                                                                           | 136/2962 [01:58<38:55,  1.21it/s]

  5%|███▋                                                                           | 137/2962 [01:58<41:15,  1.14it/s]

  5%|███▋                                                                           | 138/2962 [01:59<40:31,  1.16it/s]

  5%|███▋                                                                           | 139/2962 [02:00<40:09,  1.17it/s]

  5%|███▋                                                                           | 140/2962 [02:01<37:44,  1.25it/s]

  5%|███▊                                                                           | 141/2962 [02:02<42:30,  1.11it/s]

  5%|███▊                       

  7%|█████▎                                                                         | 201/2962 [02:58<41:52,  1.10it/s]

  7%|█████▍                                                                         | 202/2962 [02:59<41:58,  1.10it/s]

  7%|█████▍                                                                         | 203/2962 [03:00<42:50,  1.07it/s]

  7%|█████▍                                                                         | 204/2962 [03:01<40:56,  1.12it/s]

  7%|█████▍                                                                         | 205/2962 [03:02<45:04,  1.02it/s]

  7%|█████▍                                                                         | 206/2962 [03:03<43:11,  1.06it/s]

  7%|█████▌                                                                         | 207/2962 [03:04<43:14,  1.06it/s]

  7%|█████▌                                                                         | 208/2962 [03:05<43:47,  1.05it/s]

  7%|█████▌                     

  9%|███████▏                                                                       | 268/2962 [03:56<37:07,  1.21it/s]

  9%|███████▏                                                                       | 269/2962 [03:57<36:44,  1.22it/s]

  9%|███████▏                                                                       | 270/2962 [03:58<34:54,  1.29it/s]

  9%|███████▏                                                                       | 271/2962 [03:59<34:55,  1.28it/s]

  9%|███████▎                                                                       | 272/2962 [04:00<36:59,  1.21it/s]

  9%|███████▎                                                                       | 273/2962 [04:00<37:23,  1.20it/s]

  9%|███████▎                                                                       | 274/2962 [04:01<37:49,  1.18it/s]

  9%|███████▎                                                                       | 275/2962 [04:02<38:35,  1.16it/s]

  9%|███████▎                   

 11%|████████▉                                                                      | 335/2962 [04:53<39:26,  1.11it/s]

 11%|████████▉                                                                      | 336/2962 [04:54<38:39,  1.13it/s]

 11%|████████▉                                                                      | 337/2962 [04:55<37:29,  1.17it/s]

 11%|█████████                                                                      | 338/2962 [04:56<38:16,  1.14it/s]

 11%|█████████                                                                      | 339/2962 [04:57<41:55,  1.04it/s]

 11%|█████████                                                                      | 340/2962 [04:58<41:54,  1.04it/s]

 12%|█████████                                                                      | 341/2962 [04:59<41:14,  1.06it/s]

 12%|█████████                                                                      | 342/2962 [04:59<37:41,  1.16it/s]

 12%|█████████▏                 

 14%|██████████▋                                                                    | 402/2962 [05:51<34:16,  1.25it/s]

 14%|██████████▋                                                                    | 403/2962 [05:52<35:28,  1.20it/s]

 14%|██████████▊                                                                    | 404/2962 [05:53<37:01,  1.15it/s]

 14%|██████████▊                                                                    | 405/2962 [05:54<38:12,  1.12it/s]

 14%|██████████▊                                                                    | 406/2962 [05:55<36:58,  1.15it/s]

 14%|██████████▊                                                                    | 407/2962 [05:55<34:45,  1.23it/s]

 14%|██████████▉                                                                    | 408/2962 [05:56<34:06,  1.25it/s]

 14%|██████████▉                                                                    | 409/2962 [05:57<36:33,  1.16it/s]

 14%|██████████▉                

 16%|████████████▌                                                                  | 469/2962 [06:48<36:11,  1.15it/s]

 16%|████████████▌                                                                  | 470/2962 [06:49<34:13,  1.21it/s]

 16%|████████████▌                                                                  | 471/2962 [06:50<37:39,  1.10it/s]

 16%|████████████▌                                                                  | 472/2962 [06:51<36:00,  1.15it/s]

 16%|████████████▌                                                                  | 473/2962 [06:52<34:26,  1.20it/s]

 16%|████████████▋                                                                  | 474/2962 [06:53<35:02,  1.18it/s]

 16%|████████████▋                                                                  | 475/2962 [06:54<35:39,  1.16it/s]

 16%|████████████▋                                                                  | 476/2962 [06:55<37:27,  1.11it/s]

 16%|████████████▋              

 18%|██████████████▎                                                                | 536/2962 [07:48<35:22,  1.14it/s]

 18%|██████████████▎                                                                | 537/2962 [07:49<36:23,  1.11it/s]

 18%|██████████████▎                                                                | 538/2962 [07:49<34:41,  1.16it/s]

 18%|██████████████▍                                                                | 539/2962 [07:51<38:10,  1.06it/s]

 18%|██████████████▍                                                                | 540/2962 [07:52<39:52,  1.01it/s]

 18%|██████████████▍                                                                | 541/2962 [07:53<39:16,  1.03it/s]

 18%|██████████████▍                                                                | 542/2962 [07:54<39:35,  1.02it/s]

 18%|██████████████▍                                                                | 543/2962 [07:55<39:31,  1.02it/s]

 18%|██████████████▌            

 20%|████████████████                                                               | 603/2962 [08:49<33:58,  1.16it/s]

 20%|████████████████                                                               | 604/2962 [08:50<33:05,  1.19it/s]

 20%|████████████████▏                                                              | 605/2962 [08:51<32:42,  1.20it/s]

 20%|████████████████▏                                                              | 606/2962 [08:52<37:57,  1.03it/s]

 20%|████████████████▏                                                              | 607/2962 [08:53<38:09,  1.03it/s]

 21%|████████████████▏                                                              | 608/2962 [08:54<38:21,  1.02it/s]

 21%|████████████████▏                                                              | 609/2962 [08:56<44:35,  1.14s/it]

 21%|████████████████▎                                                              | 610/2962 [08:56<40:59,  1.05s/it]

 21%|████████████████▎          

 23%|█████████████████▊                                                             | 670/2962 [09:50<30:40,  1.25it/s]

 23%|█████████████████▉                                                             | 671/2962 [09:51<30:21,  1.26it/s]

 23%|█████████████████▉                                                             | 672/2962 [09:52<33:08,  1.15it/s]

 23%|█████████████████▉                                                             | 673/2962 [09:53<32:48,  1.16it/s]

 23%|█████████████████▉                                                             | 674/2962 [09:54<33:34,  1.14it/s]

 23%|██████████████████                                                             | 675/2962 [09:55<33:06,  1.15it/s]

 23%|██████████████████                                                             | 676/2962 [09:56<31:36,  1.21it/s]

 23%|██████████████████                                                             | 677/2962 [09:57<32:37,  1.17it/s]

 23%|██████████████████         

 25%|███████████████████▋                                                           | 737/2962 [10:48<29:53,  1.24it/s]

 25%|███████████████████▋                                                           | 738/2962 [10:49<28:53,  1.28it/s]

 25%|███████████████████▋                                                           | 739/2962 [10:50<30:58,  1.20it/s]

 25%|███████████████████▋                                                           | 740/2962 [10:50<30:20,  1.22it/s]

 25%|███████████████████▊                                                           | 741/2962 [10:51<31:30,  1.18it/s]

 25%|███████████████████▊                                                           | 742/2962 [10:52<32:50,  1.13it/s]

 25%|███████████████████▊                                                           | 743/2962 [10:53<30:30,  1.21it/s]

 25%|███████████████████▊                                                           | 744/2962 [10:54<30:59,  1.19it/s]

 25%|███████████████████▊       

 27%|█████████████████████▍                                                         | 804/2962 [11:46<32:19,  1.11it/s]

 27%|█████████████████████▍                                                         | 805/2962 [11:47<32:26,  1.11it/s]

 27%|█████████████████████▍                                                         | 806/2962 [11:48<29:43,  1.21it/s]

 27%|█████████████████████▌                                                         | 807/2962 [11:49<33:11,  1.08it/s]

 27%|█████████████████████▌                                                         | 808/2962 [11:50<31:53,  1.13it/s]

 27%|█████████████████████▌                                                         | 809/2962 [11:51<29:58,  1.20it/s]

 27%|█████████████████████▌                                                         | 810/2962 [11:52<32:21,  1.11it/s]

 27%|█████████████████████▋                                                         | 811/2962 [11:53<33:23,  1.07it/s]

 27%|█████████████████████▋     

10
863




 29%|███████████████████████                                                        | 863/2962 [12:37<29:16,  1.20it/s]

 29%|███████████████████████                                                        | 864/2962 [12:38<29:18,  1.19it/s]

 29%|███████████████████████                                                        | 865/2962 [12:39<29:31,  1.18it/s]

 29%|███████████████████████                                                        | 866/2962 [12:40<29:18,  1.19it/s]

 29%|███████████████████████                                                        | 867/2962 [12:41<27:51,  1.25it/s]

 29%|███████████████████████▏                                                       | 868/2962 [12:41<26:45,  1.30it/s]

 29%|███████████████████████▏                                                       | 869/2962 [12:42<25:59,  1.34it/s]

 29%|███████████████████████▏                                                       | 870/2962 [12:43<26:57,  1.29it/s]

 29%|███████████████████████▏ 

 31%|████████████████████████▊                                                      | 930/2962 [13:33<28:42,  1.18it/s]

 31%|████████████████████████▊                                                      | 931/2962 [13:34<28:14,  1.20it/s]

 31%|████████████████████████▊                                                      | 932/2962 [13:34<27:18,  1.24it/s]

 31%|████████████████████████▉                                                      | 933/2962 [13:35<26:06,  1.30it/s]

 32%|████████████████████████▉                                                      | 934/2962 [13:36<25:17,  1.34it/s]

 32%|████████████████████████▉                                                      | 935/2962 [13:37<26:40,  1.27it/s]

 32%|████████████████████████▉                                                      | 936/2962 [13:38<26:36,  1.27it/s]

 32%|████████████████████████▉                                                      | 937/2962 [13:38<27:35,  1.22it/s]

 32%|█████████████████████████  

 34%|██████████████████████████▌                                                    | 997/2962 [14:44<31:25,  1.04it/s]

 34%|██████████████████████████▌                                                    | 998/2962 [14:45<29:34,  1.11it/s]

 34%|██████████████████████████▋                                                    | 999/2962 [14:46<29:23,  1.11it/s]

 34%|██████████████████████████▎                                                   | 1000/2962 [14:48<39:54,  1.22s/it]

 34%|██████████████████████████▎                                                   | 1001/2962 [14:48<35:50,  1.10s/it]

 34%|██████████████████████████▍                                                   | 1002/2962 [14:49<32:36,  1.00it/s]

 34%|██████████████████████████▍                                                   | 1003/2962 [14:50<31:18,  1.04it/s]

 34%|██████████████████████████▍                                                   | 1004/2962 [14:51<31:36,  1.03it/s]

 34%|██████████████████████████▍

 36%|████████████████████████████                                                  | 1064/2962 [15:42<29:35,  1.07it/s]

 36%|████████████████████████████                                                  | 1065/2962 [15:43<28:28,  1.11it/s]

 36%|████████████████████████████                                                  | 1066/2962 [15:44<27:04,  1.17it/s]

 36%|████████████████████████████                                                  | 1067/2962 [15:45<26:28,  1.19it/s]

 36%|████████████████████████████                                                  | 1068/2962 [15:46<25:48,  1.22it/s]

 36%|████████████████████████████▏                                                 | 1069/2962 [15:46<26:35,  1.19it/s]

 36%|████████████████████████████▏                                                 | 1070/2962 [15:47<26:51,  1.17it/s]

 36%|████████████████████████████▏                                                 | 1071/2962 [15:48<25:47,  1.22it/s]

 36%|███████████████████████████

 38%|█████████████████████████████▊                                                | 1131/2962 [16:42<27:20,  1.12it/s]

 38%|█████████████████████████████▊                                                | 1132/2962 [16:43<26:41,  1.14it/s]

 38%|█████████████████████████████▊                                                | 1133/2962 [16:43<25:06,  1.21it/s]

 38%|█████████████████████████████▊                                                | 1134/2962 [16:44<25:54,  1.18it/s]

 38%|█████████████████████████████▉                                                | 1135/2962 [16:45<24:30,  1.24it/s]

 38%|█████████████████████████████▉                                                | 1136/2962 [16:46<23:28,  1.30it/s]

 38%|█████████████████████████████▉                                                | 1137/2962 [16:46<24:18,  1.25it/s]

 38%|█████████████████████████████▉                                                | 1138/2962 [16:47<24:00,  1.27it/s]

 38%|███████████████████████████

 40%|███████████████████████████████▌                                              | 1198/2962 [17:38<23:27,  1.25it/s]

 40%|███████████████████████████████▌                                              | 1199/2962 [17:39<24:19,  1.21it/s]

 41%|███████████████████████████████▌                                              | 1200/2962 [17:40<24:38,  1.19it/s]

 41%|███████████████████████████████▋                                              | 1201/2962 [17:40<24:23,  1.20it/s]

 41%|███████████████████████████████▋                                              | 1202/2962 [17:41<24:26,  1.20it/s]

 41%|███████████████████████████████▋                                              | 1203/2962 [17:42<23:55,  1.23it/s]

 41%|███████████████████████████████▋                                              | 1204/2962 [17:43<23:57,  1.22it/s]

 41%|███████████████████████████████▋                                              | 1205/2962 [17:43<22:49,  1.28it/s]

 41%|███████████████████████████

 43%|█████████████████████████████████▎                                            | 1265/2962 [18:35<24:41,  1.15it/s]

 43%|█████████████████████████████████▎                                            | 1266/2962 [18:35<23:34,  1.20it/s]

 43%|█████████████████████████████████▎                                            | 1267/2962 [18:36<24:19,  1.16it/s]

 43%|█████████████████████████████████▍                                            | 1268/2962 [18:37<23:10,  1.22it/s]

 43%|█████████████████████████████████▍                                            | 1269/2962 [18:38<24:23,  1.16it/s]

 43%|█████████████████████████████████▍                                            | 1270/2962 [18:39<25:05,  1.12it/s]

 43%|█████████████████████████████████▍                                            | 1271/2962 [18:40<27:47,  1.01it/s]

 43%|█████████████████████████████████▍                                            | 1272/2962 [18:41<29:49,  1.06s/it]

 43%|███████████████████████████

 45%|███████████████████████████████████                                           | 1332/2962 [19:33<23:14,  1.17it/s]

 45%|███████████████████████████████████                                           | 1333/2962 [19:34<22:28,  1.21it/s]

 45%|███████████████████████████████████▏                                          | 1334/2962 [19:35<23:22,  1.16it/s]

 45%|███████████████████████████████████▏                                          | 1335/2962 [19:35<23:08,  1.17it/s]

 45%|███████████████████████████████████▏                                          | 1336/2962 [19:36<24:22,  1.11it/s]

 45%|███████████████████████████████████▏                                          | 1337/2962 [19:37<24:22,  1.11it/s]

 45%|███████████████████████████████████▏                                          | 1338/2962 [19:38<23:07,  1.17it/s]

 45%|███████████████████████████████████▎                                          | 1339/2962 [19:39<23:47,  1.14it/s]

 45%|███████████████████████████

 47%|████████████████████████████████████▊                                         | 1399/2962 [20:32<22:44,  1.15it/s]

 47%|████████████████████████████████████▊                                         | 1400/2962 [20:33<22:50,  1.14it/s]

 47%|████████████████████████████████████▉                                         | 1401/2962 [20:33<21:08,  1.23it/s]

 47%|████████████████████████████████████▉                                         | 1402/2962 [20:34<23:01,  1.13it/s]

 47%|████████████████████████████████████▉                                         | 1403/2962 [20:35<23:49,  1.09it/s]

 47%|████████████████████████████████████▉                                         | 1404/2962 [20:36<24:24,  1.06it/s]

 47%|████████████████████████████████████▉                                         | 1405/2962 [20:37<24:26,  1.06it/s]

 47%|█████████████████████████████████████                                         | 1406/2962 [20:38<24:04,  1.08it/s]

 48%|███████████████████████████

 49%|██████████████████████████████████████▌                                       | 1466/2962 [21:29<22:17,  1.12it/s]

 50%|██████████████████████████████████████▋                                       | 1467/2962 [21:29<21:13,  1.17it/s]

 50%|██████████████████████████████████████▋                                       | 1468/2962 [21:30<20:22,  1.22it/s]

 50%|██████████████████████████████████████▋                                       | 1469/2962 [21:31<20:32,  1.21it/s]

 50%|██████████████████████████████████████▋                                       | 1470/2962 [21:32<20:21,  1.22it/s]

 50%|██████████████████████████████████████▋                                       | 1471/2962 [21:33<21:39,  1.15it/s]

 50%|██████████████████████████████████████▊                                       | 1472/2962 [21:34<21:30,  1.15it/s]

 50%|██████████████████████████████████████▊                                       | 1473/2962 [21:34<20:51,  1.19it/s]

 50%|███████████████████████████

 52%|████████████████████████████████████████▎                                     | 1533/2962 [22:28<21:03,  1.13it/s]

 52%|████████████████████████████████████████▍                                     | 1534/2962 [22:29<21:29,  1.11it/s]

 52%|████████████████████████████████████████▍                                     | 1535/2962 [22:30<20:07,  1.18it/s]

 52%|████████████████████████████████████████▍                                     | 1536/2962 [22:30<20:28,  1.16it/s]

 52%|████████████████████████████████████████▍                                     | 1537/2962 [22:31<20:33,  1.16it/s]

 52%|████████████████████████████████████████▌                                     | 1538/2962 [22:32<20:41,  1.15it/s]

 52%|████████████████████████████████████████▌                                     | 1539/2962 [22:33<20:05,  1.18it/s]

 52%|████████████████████████████████████████▌                                     | 1540/2962 [22:34<21:13,  1.12it/s]

 52%|███████████████████████████

 54%|██████████████████████████████████████████▏                                   | 1600/2962 [23:27<19:35,  1.16it/s]

 54%|██████████████████████████████████████████▏                                   | 1601/2962 [23:28<21:11,  1.07it/s]

 54%|██████████████████████████████████████████▏                                   | 1602/2962 [23:29<20:47,  1.09it/s]

 54%|██████████████████████████████████████████▏                                   | 1603/2962 [23:30<19:45,  1.15it/s]

 54%|██████████████████████████████████████████▏                                   | 1604/2962 [23:31<20:36,  1.10it/s]

 54%|██████████████████████████████████████████▎                                   | 1605/2962 [23:32<20:02,  1.13it/s]

 54%|██████████████████████████████████████████▎                                   | 1606/2962 [23:33<19:11,  1.18it/s]

 54%|██████████████████████████████████████████▎                                   | 1607/2962 [23:33<19:23,  1.16it/s]

 54%|███████████████████████████

 56%|███████████████████████████████████████████▉                                  | 1667/2962 [24:27<19:56,  1.08it/s]

 56%|███████████████████████████████████████████▉                                  | 1668/2962 [24:28<19:04,  1.13it/s]

 56%|███████████████████████████████████████████▉                                  | 1669/2962 [24:29<18:47,  1.15it/s]

 56%|███████████████████████████████████████████▉                                  | 1670/2962 [24:30<19:26,  1.11it/s]

 56%|████████████████████████████████████████████                                  | 1671/2962 [24:30<19:02,  1.13it/s]

 56%|████████████████████████████████████████████                                  | 1672/2962 [24:31<18:46,  1.15it/s]

 56%|████████████████████████████████████████████                                  | 1673/2962 [24:32<17:57,  1.20it/s]

 57%|████████████████████████████████████████████                                  | 1674/2962 [24:33<18:20,  1.17it/s]

 57%|███████████████████████████

 59%|█████████████████████████████████████████████▋                                | 1734/2962 [25:28<18:10,  1.13it/s]

 59%|█████████████████████████████████████████████▋                                | 1735/2962 [25:29<18:45,  1.09it/s]

 59%|█████████████████████████████████████████████▋                                | 1736/2962 [25:30<18:12,  1.12it/s]

 59%|█████████████████████████████████████████████▋                                | 1737/2962 [25:30<17:20,  1.18it/s]

 59%|█████████████████████████████████████████████▊                                | 1738/2962 [25:31<18:24,  1.11it/s]

 59%|█████████████████████████████████████████████▊                                | 1739/2962 [25:32<17:50,  1.14it/s]

 59%|█████████████████████████████████████████████▊                                | 1740/2962 [25:33<18:12,  1.12it/s]

 59%|█████████████████████████████████████████████▊                                | 1741/2962 [25:34<18:44,  1.09it/s]

 59%|███████████████████████████

 61%|███████████████████████████████████████████████▍                              | 1801/2962 [26:30<18:40,  1.04it/s]

 61%|███████████████████████████████████████████████▍                              | 1802/2962 [26:31<19:04,  1.01it/s]

 61%|███████████████████████████████████████████████▍                              | 1803/2962 [26:32<17:11,  1.12it/s]

 61%|███████████████████████████████████████████████▌                              | 1804/2962 [26:33<19:02,  1.01it/s]

 61%|███████████████████████████████████████████████▌                              | 1805/2962 [26:34<18:26,  1.05it/s]

 61%|███████████████████████████████████████████████▌                              | 1806/2962 [26:35<19:01,  1.01it/s]

 61%|███████████████████████████████████████████████▌                              | 1807/2962 [26:36<18:28,  1.04it/s]

 61%|███████████████████████████████████████████████▌                              | 1808/2962 [26:37<18:37,  1.03it/s]

 61%|███████████████████████████

20
1845




 62%|████████████████████████████████████████████████▌                             | 1845/2962 [27:10<16:40,  1.12it/s]

 62%|████████████████████████████████████████████████▌                             | 1846/2962 [27:10<16:37,  1.12it/s]

 62%|████████████████████████████████████████████████▋                             | 1847/2962 [27:11<16:58,  1.09it/s]

 62%|████████████████████████████████████████████████▋                             | 1848/2962 [27:12<17:10,  1.08it/s]

 62%|████████████████████████████████████████████████▋                             | 1849/2962 [27:13<16:43,  1.11it/s]

 62%|████████████████████████████████████████████████▋                             | 1850/2962 [27:14<15:47,  1.17it/s]

 62%|████████████████████████████████████████████████▋                             | 1851/2962 [27:15<17:29,  1.06it/s]

 63%|████████████████████████████████████████████████▊                             | 1852/2962 [27:16<17:39,  1.05it/s]

 63%|█████████████████████████

 65%|██████████████████████████████████████████████████▎                           | 1912/2962 [28:10<15:24,  1.14it/s]

 65%|██████████████████████████████████████████████████▍                           | 1913/2962 [28:11<15:13,  1.15it/s]

 65%|██████████████████████████████████████████████████▍                           | 1914/2962 [28:12<14:42,  1.19it/s]

 65%|██████████████████████████████████████████████████▍                           | 1915/2962 [28:13<14:57,  1.17it/s]

 65%|██████████████████████████████████████████████████▍                           | 1916/2962 [28:13<15:00,  1.16it/s]

 65%|██████████████████████████████████████████████████▍                           | 1917/2962 [28:14<15:12,  1.14it/s]

 65%|██████████████████████████████████████████████████▌                           | 1918/2962 [28:15<14:55,  1.17it/s]

 65%|██████████████████████████████████████████████████▌                           | 1919/2962 [28:16<15:10,  1.15it/s]

 65%|███████████████████████████

 67%|████████████████████████████████████████████████████                          | 1979/2962 [29:10<14:10,  1.16it/s]

 67%|████████████████████████████████████████████████████▏                         | 1980/2962 [29:11<14:55,  1.10it/s]

 67%|████████████████████████████████████████████████████▏                         | 1981/2962 [29:12<14:11,  1.15it/s]

 67%|████████████████████████████████████████████████████▏                         | 1982/2962 [29:13<15:28,  1.06it/s]

 67%|████████████████████████████████████████████████████▏                         | 1983/2962 [29:14<15:09,  1.08it/s]

 67%|████████████████████████████████████████████████████▏                         | 1984/2962 [29:15<14:36,  1.12it/s]

 67%|████████████████████████████████████████████████████▎                         | 1985/2962 [29:16<14:16,  1.14it/s]

 67%|████████████████████████████████████████████████████▎                         | 1986/2962 [29:17<14:03,  1.16it/s]

 67%|███████████████████████████

 69%|█████████████████████████████████████████████████████▉                        | 2046/2962 [30:10<13:30,  1.13it/s]

 69%|█████████████████████████████████████████████████████▉                        | 2047/2962 [30:11<13:48,  1.10it/s]

 69%|█████████████████████████████████████████████████████▉                        | 2048/2962 [30:12<14:58,  1.02it/s]

 69%|█████████████████████████████████████████████████████▉                        | 2049/2962 [30:13<14:10,  1.07it/s]

 69%|█████████████████████████████████████████████████████▉                        | 2050/2962 [30:14<13:31,  1.12it/s]

 69%|██████████████████████████████████████████████████████                        | 2051/2962 [30:15<13:23,  1.13it/s]

 69%|██████████████████████████████████████████████████████                        | 2052/2962 [30:16<13:31,  1.12it/s]

 69%|██████████████████████████████████████████████████████                        | 2053/2962 [30:17<13:20,  1.14it/s]

 69%|███████████████████████████

 71%|███████████████████████████████████████████████████████▋                      | 2113/2962 [31:09<13:24,  1.05it/s]

 71%|███████████████████████████████████████████████████████▋                      | 2114/2962 [31:10<14:23,  1.02s/it]

 71%|███████████████████████████████████████████████████████▋                      | 2115/2962 [31:12<14:41,  1.04s/it]

 71%|███████████████████████████████████████████████████████▋                      | 2116/2962 [31:12<13:10,  1.07it/s]

 71%|███████████████████████████████████████████████████████▋                      | 2117/2962 [31:13<13:30,  1.04it/s]

 72%|███████████████████████████████████████████████████████▊                      | 2118/2962 [31:14<13:44,  1.02it/s]

 72%|███████████████████████████████████████████████████████▊                      | 2119/2962 [31:15<13:11,  1.06it/s]

 72%|███████████████████████████████████████████████████████▊                      | 2120/2962 [31:16<12:11,  1.15it/s]

 72%|███████████████████████████

 74%|█████████████████████████████████████████████████████████▍                    | 2180/2962 [32:10<10:51,  1.20it/s]

 74%|█████████████████████████████████████████████████████████▍                    | 2181/2962 [32:11<10:21,  1.26it/s]

 74%|█████████████████████████████████████████████████████████▍                    | 2182/2962 [32:12<11:04,  1.17it/s]

 74%|█████████████████████████████████████████████████████████▍                    | 2183/2962 [32:13<11:20,  1.15it/s]

 74%|█████████████████████████████████████████████████████████▌                    | 2184/2962 [32:14<11:50,  1.09it/s]

 74%|█████████████████████████████████████████████████████████▌                    | 2185/2962 [32:15<10:51,  1.19it/s]

 74%|█████████████████████████████████████████████████████████▌                    | 2186/2962 [32:16<10:59,  1.18it/s]

 74%|█████████████████████████████████████████████████████████▌                    | 2187/2962 [32:16<10:30,  1.23it/s]

 74%|███████████████████████████

 76%|███████████████████████████████████████████████████████████▏                  | 2247/2962 [33:08<10:05,  1.18it/s]

 76%|███████████████████████████████████████████████████████████▏                  | 2248/2962 [33:09<10:26,  1.14it/s]

 76%|███████████████████████████████████████████████████████████▏                  | 2249/2962 [33:09<10:26,  1.14it/s]

 76%|███████████████████████████████████████████████████████████▎                  | 2250/2962 [33:10<10:33,  1.12it/s]

 76%|███████████████████████████████████████████████████████████▎                  | 2251/2962 [33:11<10:06,  1.17it/s]

 76%|███████████████████████████████████████████████████████████▎                  | 2252/2962 [33:12<10:15,  1.15it/s]

 76%|███████████████████████████████████████████████████████████▎                  | 2253/2962 [33:13<09:50,  1.20it/s]

 76%|███████████████████████████████████████████████████████████▎                  | 2254/2962 [33:14<10:24,  1.13it/s]

 76%|███████████████████████████

 78%|████████████████████████████████████████████████████████████▉                 | 2314/2962 [34:05<08:55,  1.21it/s]

 78%|████████████████████████████████████████████████████████████▉                 | 2315/2962 [34:06<09:23,  1.15it/s]

 78%|████████████████████████████████████████████████████████████▉                 | 2316/2962 [34:07<09:41,  1.11it/s]

 78%|█████████████████████████████████████████████████████████████                 | 2317/2962 [34:08<09:53,  1.09it/s]

 78%|█████████████████████████████████████████████████████████████                 | 2318/2962 [34:09<09:36,  1.12it/s]

 78%|█████████████████████████████████████████████████████████████                 | 2319/2962 [34:09<09:05,  1.18it/s]

 78%|█████████████████████████████████████████████████████████████                 | 2320/2962 [34:10<09:10,  1.17it/s]

 78%|█████████████████████████████████████████████████████████████                 | 2321/2962 [34:11<09:04,  1.18it/s]

 78%|███████████████████████████

30
2348




 79%|█████████████████████████████████████████████████████████████▊                | 2348/2962 [34:35<08:56,  1.15it/s]

 79%|█████████████████████████████████████████████████████████████▊                | 2349/2962 [34:36<09:11,  1.11it/s]

 79%|█████████████████████████████████████████████████████████████▉                | 2350/2962 [34:36<09:20,  1.09it/s]

 79%|█████████████████████████████████████████████████████████████▉                | 2351/2962 [34:37<09:00,  1.13it/s]

 79%|█████████████████████████████████████████████████████████████▉                | 2352/2962 [34:38<09:10,  1.11it/s]

 79%|█████████████████████████████████████████████████████████████▉                | 2353/2962 [34:39<08:48,  1.15it/s]

 79%|█████████████████████████████████████████████████████████████▉                | 2354/2962 [34:40<08:57,  1.13it/s]

 80%|██████████████████████████████████████████████████████████████                | 2355/2962 [34:41<09:19,  1.08it/s]

 80%|█████████████████████████

 82%|███████████████████████████████████████████████████████████████▌              | 2415/2962 [35:35<07:48,  1.17it/s]

 82%|███████████████████████████████████████████████████████████████▌              | 2416/2962 [35:36<07:37,  1.19it/s]

 82%|███████████████████████████████████████████████████████████████▋              | 2417/2962 [35:37<07:45,  1.17it/s]

 82%|███████████████████████████████████████████████████████████████▋              | 2418/2962 [35:38<07:55,  1.14it/s]

 82%|███████████████████████████████████████████████████████████████▋              | 2419/2962 [35:38<07:30,  1.21it/s]

 82%|███████████████████████████████████████████████████████████████▋              | 2420/2962 [35:40<08:36,  1.05it/s]

 82%|███████████████████████████████████████████████████████████████▊              | 2421/2962 [35:40<08:03,  1.12it/s]

 82%|███████████████████████████████████████████████████████████████▊              | 2422/2962 [35:41<07:49,  1.15it/s]

 82%|███████████████████████████

 84%|█████████████████████████████████████████████████████████████████▎            | 2482/2962 [36:33<07:13,  1.11it/s]

 84%|█████████████████████████████████████████████████████████████████▍            | 2483/2962 [36:34<07:02,  1.13it/s]

 84%|█████████████████████████████████████████████████████████████████▍            | 2484/2962 [36:35<06:54,  1.15it/s]

 84%|█████████████████████████████████████████████████████████████████▍            | 2485/2962 [36:35<06:21,  1.25it/s]

 84%|█████████████████████████████████████████████████████████████████▍            | 2486/2962 [36:37<08:09,  1.03s/it]

 84%|█████████████████████████████████████████████████████████████████▍            | 2487/2962 [36:38<07:51,  1.01it/s]

 84%|█████████████████████████████████████████████████████████████████▌            | 2488/2962 [36:39<08:02,  1.02s/it]

 84%|█████████████████████████████████████████████████████████████████▌            | 2489/2962 [36:40<09:23,  1.19s/it]

 84%|███████████████████████████

 86%|███████████████████████████████████████████████████████████████████           | 2549/2962 [37:35<06:11,  1.11it/s]

 86%|███████████████████████████████████████████████████████████████████▏          | 2550/2962 [37:36<05:44,  1.19it/s]

 86%|███████████████████████████████████████████████████████████████████▏          | 2551/2962 [37:36<05:26,  1.26it/s]

 86%|███████████████████████████████████████████████████████████████████▏          | 2552/2962 [37:37<05:49,  1.17it/s]

 86%|███████████████████████████████████████████████████████████████████▏          | 2553/2962 [37:38<06:01,  1.13it/s]

 86%|███████████████████████████████████████████████████████████████████▎          | 2554/2962 [37:39<06:03,  1.12it/s]

 86%|███████████████████████████████████████████████████████████████████▎          | 2555/2962 [37:40<06:03,  1.12it/s]

 86%|███████████████████████████████████████████████████████████████████▎          | 2556/2962 [37:41<05:42,  1.18it/s]

 86%|███████████████████████████

 88%|████████████████████████████████████████████████████████████████████▉         | 2616/2962 [38:35<05:20,  1.08it/s]

 88%|████████████████████████████████████████████████████████████████████▉         | 2617/2962 [38:35<05:13,  1.10it/s]

 88%|████████████████████████████████████████████████████████████████████▉         | 2618/2962 [38:36<05:08,  1.11it/s]

 88%|████████████████████████████████████████████████████████████████████▉         | 2619/2962 [38:37<04:51,  1.18it/s]

 88%|████████████████████████████████████████████████████████████████████▉         | 2620/2962 [38:38<04:44,  1.20it/s]

 88%|█████████████████████████████████████████████████████████████████████         | 2621/2962 [38:39<04:55,  1.15it/s]

 89%|█████████████████████████████████████████████████████████████████████         | 2622/2962 [38:40<04:37,  1.22it/s]

 89%|█████████████████████████████████████████████████████████████████████         | 2623/2962 [38:41<04:54,  1.15it/s]

 89%|███████████████████████████

 91%|██████████████████████████████████████████████████████████████████████▋       | 2683/2962 [39:33<04:07,  1.13it/s]

 91%|██████████████████████████████████████████████████████████████████████▋       | 2684/2962 [39:34<03:56,  1.18it/s]

 91%|██████████████████████████████████████████████████████████████████████▋       | 2685/2962 [39:35<03:38,  1.27it/s]

 91%|██████████████████████████████████████████████████████████████████████▋       | 2686/2962 [39:36<03:34,  1.29it/s]

 91%|██████████████████████████████████████████████████████████████████████▊       | 2687/2962 [39:37<03:46,  1.21it/s]

 91%|██████████████████████████████████████████████████████████████████████▊       | 2688/2962 [39:37<03:57,  1.15it/s]

 91%|██████████████████████████████████████████████████████████████████████▊       | 2689/2962 [39:38<03:51,  1.18it/s]

 91%|██████████████████████████████████████████████████████████████████████▊       | 2690/2962 [39:39<03:49,  1.18it/s]

 91%|███████████████████████████

 93%|████████████████████████████████████████████████████████████████████████▍     | 2750/2962 [40:38<04:26,  1.26s/it]

 93%|████████████████████████████████████████████████████████████████████████▍     | 2751/2962 [40:40<05:19,  1.52s/it]

 93%|████████████████████████████████████████████████████████████████████████▍     | 2752/2962 [40:42<04:53,  1.40s/it]

 93%|████████████████████████████████████████████████████████████████████████▍     | 2753/2962 [40:42<04:11,  1.21s/it]

 93%|████████████████████████████████████████████████████████████████████████▌     | 2754/2962 [40:43<03:46,  1.09s/it]

 93%|████████████████████████████████████████████████████████████████████████▌     | 2755/2962 [40:44<03:42,  1.08s/it]

 93%|████████████████████████████████████████████████████████████████████████▌     | 2756/2962 [40:45<03:20,  1.03it/s]

 93%|████████████████████████████████████████████████████████████████████████▌     | 2757/2962 [40:46<03:49,  1.12s/it]

 93%|███████████████████████████

 95%|██████████████████████████████████████████████████████████████████████████▏   | 2817/2962 [41:47<02:08,  1.13it/s]

 95%|██████████████████████████████████████████████████████████████████████████▏   | 2818/2962 [41:48<02:05,  1.14it/s]

 95%|██████████████████████████████████████████████████████████████████████████▏   | 2819/2962 [41:49<02:09,  1.10it/s]

 95%|██████████████████████████████████████████████████████████████████████████▎   | 2820/2962 [41:49<01:59,  1.19it/s]

 95%|██████████████████████████████████████████████████████████████████████████▎   | 2821/2962 [41:50<01:55,  1.22it/s]

 95%|██████████████████████████████████████████████████████████████████████████▎   | 2822/2962 [41:51<01:53,  1.23it/s]

 95%|██████████████████████████████████████████████████████████████████████████▎   | 2823/2962 [41:52<01:49,  1.28it/s]

 95%|██████████████████████████████████████████████████████████████████████████▎   | 2824/2962 [41:52<01:48,  1.28it/s]

 95%|███████████████████████████

 97%|███████████████████████████████████████████████████████████████████████████▉  | 2884/2962 [42:42<01:07,  1.15it/s]

 97%|███████████████████████████████████████████████████████████████████████████▉  | 2885/2962 [42:43<01:01,  1.25it/s]

 97%|███████████████████████████████████████████████████████████████████████████▉  | 2886/2962 [42:43<00:57,  1.31it/s]

 97%|████████████████████████████████████████████████████████████████████████████  | 2887/2962 [42:44<00:57,  1.31it/s]

 98%|████████████████████████████████████████████████████████████████████████████  | 2888/2962 [42:45<00:57,  1.29it/s]

 98%|████████████████████████████████████████████████████████████████████████████  | 2889/2962 [42:46<00:55,  1.31it/s]

 98%|████████████████████████████████████████████████████████████████████████████  | 2890/2962 [42:47<00:59,  1.21it/s]

 98%|████████████████████████████████████████████████████████████████████████████▏ | 2891/2962 [42:47<00:55,  1.28it/s]

 98%|███████████████████████████

100%|█████████████████████████████████████████████████████████████████████████████▋| 2951/2962 [43:39<00:09,  1.18it/s]

100%|█████████████████████████████████████████████████████████████████████████████▋| 2952/2962 [43:40<00:08,  1.11it/s]

100%|█████████████████████████████████████████████████████████████████████████████▊| 2953/2962 [43:41<00:07,  1.15it/s]

100%|█████████████████████████████████████████████████████████████████████████████▊| 2954/2962 [43:42<00:07,  1.12it/s]

100%|█████████████████████████████████████████████████████████████████████████████▊| 2955/2962 [43:42<00:05,  1.20it/s]

100%|█████████████████████████████████████████████████████████████████████████████▊| 2956/2962 [43:43<00:05,  1.18it/s]

100%|█████████████████████████████████████████████████████████████████████████████▊| 2957/2962 [43:44<00:04,  1.17it/s]

100%|█████████████████████████████████████████████████████████████████████████████▉| 2958/2962 [43:45<00:03,  1.20it/s]

100%|███████████████████████████

In [84]:
print(len(singer_res))
import json
with open('singer_res.json', 'w') as outfile:
    json.dump(singer_res, outfile)

38


In [88]:
with open('band_res.json', 'r') as outfile:
    res = json.load(outfile)
print(len(res))

671


In [89]:
res.update(singer_res)

In [90]:
print(len(res))

709


In [92]:
df_musician = pd.read_csv('musician_birth1.csv', index_col=0)
df_musician.head()

Unnamed: 0,name,birthplace
0,Etta James,Los Angeles
1,Ella Fitzgerald,Newport News
2,Sam Cooke,"Clarksdale, Mississippi, U.S."
3,Neil Sedaka,Brooklyn
4,Dean Martin,Steubenville


In [96]:
for i, name in enumerate(df_musician.name):
    if name in res:
        df_musician.loc[i, 'birthplace'] = res[name]

In [101]:
print(len(df_musician[df_musician['birthplace'].isnull()]))

32694


In [98]:
new_df = df_musician[df_musician['birthplace'].isnull()]
l = set(list(new_df.name))
print(len(df_tracks[df_tracks['artist_name'].apply(lambda x : x not in l)]))
df_tracks[df_tracks['artist_name'].apply(lambda x : x not in l)].dropna().groupby('year').count()

432396


Unnamed: 0_level_0,danceability,energy,key,loudness,mode,speechiness,acousticness,instrumentalness,liveness,valence,tempo,duration_ms,time_signature,artist_name,track_name,track_id,popularity
year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
1960,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758,6758
1961,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678,6678
1962,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011,7011
1963,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143,7143
1964,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972,6972
1965,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202,7202
1966,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165,7165
1967,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598,7598
1968,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525,7525
1969,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644,7644


In [102]:
df_musician.to_csv(r'musician_birth_final.csv', index=[0])