In [290]:
import requests
import urllib.request
import time
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import urllib.parse as up
from tqdm import tqdm
from time import sleep
import re

%matplotlib notebook

In [4]:
#GOALS

    #Data Cleaning and Retrieval
        #1. Retrieve Squad list from transfermarkt (of a particular season)
        #2. Injury data of all players from that season.

## Data Retrieval

In [34]:
#parameter to control season
SAISON_ID = '2018'

#BASE_URL
BASE_URL = 'https://www.transfermarkt.com'

#TEAM BASE URL
TEAM_URL = 'https://www.transfermarkt.com/manchester-united/startseite/verein/985?'
#TEAM_URL = 'https://www.transfermarkt.com/tottenham-hotspur/startseite/verein/148?'


SORT_LINKS = {
    'class' : 'spielprofil_tooltip'
}

INJURY_URL = 'verletzungen'

HEADERS = {
    'User-Agent': 'Mozilla/5.0',
    'Accept': 'Accept: application/json, text/javascript, */*; q=0.01',
    'Accept-Encoding': 'gzip, deflate, br',
    'Connection': 'keep-alive',
}

MUFC_DATA = 'mufc_curent_squad_injury_history'

PL_URL = 'https://www.transfermarkt.co.uk/premier-league/startseite/wettbewerb/GB1'

In [235]:
def get_player_links(url, season):

    TEAM_SEASON_URL = url + up.urlencode({'saison_id': season})

    response = requests.get(TEAM_SEASON_URL, headers=HEADERS)
    soup = BeautifulSoup(response.text, "html.parser")
    
    #Find only those with links to profile
    player_links = soup.find_all('a', SORT_LINKS)
    
    links = {}
    #Create a dictionary
    for link in player_links:
        links[link['title']] = BASE_URL + link['href']
    
    
    response.connection.close()
    return links

def get_injury_links(links):
    
    injury_links = links.copy()
    
    #modify links of players
    for player in injury_links.keys():
        
        link = injury_links[player]
        
        #Get the url containing path
        part_url = up.urlsplit(link)[2]
        part_vals = part_url.split('/')
        
        #modify to injury stats page
        part_vals[2] = INJURY_URL
        
        injury_links[player] = BASE_URL + '/'.join(part_vals)
        
    return injury_links

def get_season_format(val):
    start = val[-2:]
    end = str(int(val[-2:]) + 1)
    
    return start + '/' + end

def get_player_df(link, name , team):
    
    response = ''
    while response == '':
        try:
            response = requests.get(link, headers = HEADERS)
        except:
            sleep(0.2)
            continue
    soup = BeautifulSoup(response.text, "html.parser")
    
    #Get injury for all seasons, the date it occured and date of returning to action
    #no. of days out, #no. of games missed
    
    #season, dates
    date_links = soup.find_all(lambda tag: tag.name == 'td' and tag.get('class') == ['zentriert'])
    injury_links = soup.findAll(lambda tag: tag.name == 'td' and tag.get('class') == ['hauptlink'])
    days_links = soup.findAll(lambda tag: tag.name == 'td' and tag.get('class') == ['rechts'])
    #games_links = soup.find_all(lambda tag: tag.name == 'td' 
     #                           and tag.get('class') == ['rechts hauptlink wappen_verletzung'])
    
    games_links = soup.find_all('td', class_ = ['rechts hauptlink wappen_verletzung'])
    
    
    season_list = []
    from_list = []
    to_list = []
    injuries = []
    days_out = []
    games_out = []
    
    for i in range(0,len(date_links), 3):
        season_list = season_list + [str(date_links[i].string)]
        from_list = from_list + [str(date_links[i+1].string)]
        to_list = to_list + [str(date_links[i+2].string)]
            
    injuries = [str(elem.string) for elem in injury_links]
    days_out = [int(''.join(p for p in str(elem.string) if p.isdigit())) for elem in days_links]
    
    for elem in games_links:
        text = elem.get_text()
        if text == '-':
            games_out = games_out + [0]
        else:
            games_out = games_out + [int(elem.get_text())]
    
    
    #print(games_links, games_out)
    df = pd.DataFrame({
        
        'Team': [team]*len(season_list),
        'Name': [name]*len(season_list),
        'Season' :season_list,
        'Injury' : injuries,
        'Date Injured':from_list,
        'Date Return':to_list,
        'Days Out':days_out,
        'Matches Out':games_out
        
    })
    
    season = get_season_format(SAISON_ID)
    response.connection.close()
    return df

def get_complete_df(links, team_name):
    
    players = list(links.keys())
    
    data = []
    for i in tqdm(range(len(players))):
        
        print(players[i])
        df = get_player_df(links[players[i]], str(players[i]), team_name)
        data = data + [df]
        
        
    return pd.concat(data, axis = 0)


def get_data(url, name, season):
    player_links = get_player_links(url, season)
    injury_links = get_injury_links(player_links)
    df = get_complete_df(injury_links, name)
    return df


def get_seasons_data(seasons_num, base_url, name):
    
    curr_season = int(SAISON_ID)
    seasons = [str(curr_season -i) for i in range(seasons_num)]
    
    data = []
    for season in seasons:
        df = get_data(base_url, name, season)
        
        data = data + [df]
        
    return pd.concat(data, axis = 0)
        
    

In [245]:
df = get_data(TEAM_URL, 'Manchester United', SAISON_ID)

  0%|                                                                                           | 0/31 [00:00<?, ?it/s]

David de Gea


  3%|██▋                                                                                | 1/31 [00:02<01:10,  2.37s/it]

Sergio Romero


  6%|█████▎                                                                             | 2/31 [00:04<01:08,  2.36s/it]

Lee Grant


 10%|████████                                                                           | 3/31 [00:06<01:03,  2.27s/it]

Victor Lindelöf


 13%|██████████▋                                                                        | 4/31 [00:09<01:00,  2.25s/it]

Eric Bailly


 16%|█████████████▍                                                                     | 5/31 [00:11<00:58,  2.25s/it]

Phil Jones


 19%|████████████████                                                                   | 6/31 [00:13<00:55,  2.21s/it]

Chris Smalling


 23%|██████████████████▋                                                                | 7/31 [00:15<00:54,  2.26s/it]

Marcos Rojo


 26%|█████████████████████▍                                                             | 8/31 [00:18<00:53,  2.32s/it]

Axel Tuanzebe


 29%|████████████████████████                                                           | 9/31 [00:20<00:51,  2.32s/it]

Luke Shaw


 32%|██████████████████████████▍                                                       | 10/31 [00:23<00:50,  2.38s/it]

Ashley Young


 35%|█████████████████████████████                                                     | 11/31 [00:26<00:48,  2.42s/it]

Cameron Borthwick-Jackson


 39%|███████████████████████████████▋                                                  | 12/31 [00:29<00:46,  2.43s/it]

Diogo Dalot


 42%|██████████████████████████████████▍                                               | 13/31 [00:31<00:43,  2.40s/it]

Matteo Darmian


 45%|█████████████████████████████████████                                             | 14/31 [00:33<00:41,  2.42s/it]

Timothy Fosu-Mensah


 48%|███████████████████████████████████████▋                                          | 15/31 [00:36<00:38,  2.43s/it]

Antonio Valencia


 52%|██████████████████████████████████████████▎                                       | 16/31 [00:38<00:36,  2.43s/it]

Nemanja Matic


 55%|████████████████████████████████████████████▉                                     | 17/31 [00:41<00:34,  2.44s/it]

Paul Pogba


 58%|███████████████████████████████████████████████▌                                  | 18/31 [00:44<00:32,  2.47s/it]

Fred


 61%|██████████████████████████████████████████████████▎                               | 19/31 [00:46<00:29,  2.47s/it]

Ander Herrera


 65%|████████████████████████████████████████████████████▉                             | 20/31 [00:49<00:27,  2.48s/it]

Scott McTominay


 68%|███████████████████████████████████████████████████████▌                          | 21/31 [00:52<00:24,  2.50s/it]

Juan Mata


 71%|██████████████████████████████████████████████████████████▏                       | 22/31 [00:54<00:22,  2.47s/it]

Andreas Pereira


 74%|████████████████████████████████████████████████████████████▊                     | 23/31 [00:57<00:19,  2.50s/it]

Anthony Martial


 77%|███████████████████████████████████████████████████████████████▍                  | 24/31 [01:00<00:17,  2.51s/it]

Alexis Sánchez


 81%|██████████████████████████████████████████████████████████████████▏               | 25/31 [01:02<00:15,  2.52s/it]

Jesse Lingard


 84%|████████████████████████████████████████████████████████████████████▊             | 26/31 [01:05<00:12,  2.51s/it]

Romelu Lukaku


 87%|███████████████████████████████████████████████████████████████████████▍          | 27/31 [01:07<00:10,  2.50s/it]

Marcus Rashford


 90%|██████████████████████████████████████████████████████████████████████████        | 28/31 [01:09<00:07,  2.50s/it]

James Wilson


 94%|████████████████████████████████████████████████████████████████████████████▋     | 29/31 [01:12<00:04,  2.48s/it]

James Garner


 97%|███████████████████████████████████████████████████████████████████████████████▎  | 30/31 [01:14<00:02,  2.47s/it]

Angel Gomes


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [01:16<00:00,  2.46s/it]


In [161]:
df.to_csv(MUFC_DATA+SAISON_ID+'.csv')

## MUFC 2018/19 Analysis

In [212]:
SEASON_ORDER = [
    'July',
    'August',
    'September',
    'October',
    'November',
    'December',
    'January',
    'February',
    'March',
    'April',
    'May',
    'June'
]

FONT_TITLE = "Impact"
FONT_LABEL = "Franklin Gothic Medium"
FONT_TICK_LABELS = "Courier New"


In [213]:
def stylize_plot(ax, x_label, y_label, title):
    
    ax.set_xticklabels(ax.get_xticklabels(), rotation = 90, family = FONT_TICK_LABELS)
    #ax.set_yticklabels(ax.get_yticklabels())
    
    ax.set_xlabel(x_label, family = FONT_LABEL , fontsize = 13)
    ax.set_ylabel(y_label, rotation = 90, family = FONT_LABEL, fontsize = 13)
    ax.set_title(title, family = FONT_TITLE)
    
    plt.tight_layout()
    
def init_plot(figsize, back):
    sns.set(rc={'figure.figsize':figsize})
    sns.set_style("darkgrid", {"axes.facecolor": back})
    sns.set_palette(sns.dark_palette("purple"))

In [216]:
#To find out most injured player in 2018 Season

injury_series = df[df['Season'] == '18/19'].groupby(by = 'Name')['Days Out'].sum()
injury_series = injury_series.sort_values(ascending = False)

fig = plt.figure()


init_plot((10, 10), "#b3e5fc")
ax = sns.barplot(injury_series.index, injury_series.values, palette= sns.light_palette("navy", reverse=True))
stylize_plot(ax, "Name" , "Days Injured", "Injury History Of MUFC Players 2018/19 Season")

<IPython.core.display.Javascript object>

In [88]:
#Most number of injuries
#Graph is pointless

ij_count = df[df['Season'] == '18/19'].groupby('Name')['Injury'].count()
ij_count = ij_count.sort_values(ascending = False)

ij_count.head()
#fig = plt.figure()
#ax = sns.barplot(ij_count.index, ij_count.values)

Name
Alexis Sánchez      3
Antonio Valencia    3
Marcos Rojo         2
Ander Herrera       2
Anthony Martial     2
Name: Injury, dtype: int64

In [218]:
#Calculating months in which most injured

df['Date Injured'] = pd.to_datetime(df['Date Injured'])
df['Date Return'] = pd.to_datetime(df['Date Return'])

month_series = df[df['Season'] == '18/19'].reset_index()['Date Injured'].dt.month_name()
cnts = month_series.value_counts()

plt.figure()

init_plot((10, 10), "#b3e5fc")
ax = sns.barplot(cnts.index, cnts.values, order= SEASON_ORDER, palette = sns.light_palette("navy", reverse=True))
stylize_plot(ax, "Name" , "Days Injured", "Months in which most injuries occurred (2018/19 Season)")

<IPython.core.display.Javascript object>

In [252]:
pl = get_player_links(TEAM_URL, '2018')
il = get_injury_links(pl)

In [255]:
il

{'Alexis Sánchez': 'https://www.transfermarkt.com/alexis-sanchez/verletzungen/spieler/40433',
 'Ander Herrera': 'https://www.transfermarkt.com/ander-herrera/verletzungen/spieler/99343',
 'Andreas Pereira': 'https://www.transfermarkt.com/andreas-pereira/verletzungen/spieler/203394',
 'Angel Gomes': 'https://www.transfermarkt.com/angel-gomes/verletzungen/spieler/392770',
 'Anthony Martial': 'https://www.transfermarkt.com/anthony-martial/verletzungen/spieler/182877',
 'Antonio Valencia': 'https://www.transfermarkt.com/antonio-valencia/verletzungen/spieler/33544',
 'Ashley Young': 'https://www.transfermarkt.com/ashley-young/verletzungen/spieler/14086',
 'Axel Tuanzebe': 'https://www.transfermarkt.com/axel-tuanzebe/verletzungen/spieler/342046',
 'Cameron Borthwick-Jackson': 'https://www.transfermarkt.com/cameron-borthwick-jackson/verletzungen/spieler/258879',
 'Chris Smalling': 'https://www.transfermarkt.com/chris-smalling/verletzungen/spieler/103427',
 'David de Gea': 'https://www.transfer

In [285]:
link = il['Phil Jones']

response = requests.get(link, headers = HEADERS)
soup = BeautifulSoup(response.text, "html.parser")

In [286]:
games_links = soup.find_all('td', class_ = ['rechts hauptlink wappen_verletzung'])

In [288]:
str(games_links[1]).find('Manchester United')

162

In [291]:
games_links[1]

<td class="rechts hauptlink wappen_verletzung">5<a class="vereinprofil_tooltip" href="/manchester-united/startseite/verein/985/saison_id/2018" id="985"><img alt="Manchester United" class="tiny_wappen" src="https://tmssl.akamaized.net//images/wappen/tiny/985.png?lm=1457975903" title=" "/></a></td>

In [304]:
pattern = r'"alt="'
m = re.search(pattern, str(games_links[1]))

In [305]:
m.group()

AttributeError: 'NoneType' object has no attribute 'group'

In [289]:
str(games_links[1])[162]

'M'

In [None]:
str(games_links[1]).find

## MUFC Past Seasons Analysis

In [236]:
season_df = get_seasons_data(5, TEAM_URL, 'Manchester United')

  0%|                                                                                           | 0/31 [00:00<?, ?it/s]

David de Gea


  3%|██▋                                                                                | 1/31 [00:02<01:10,  2.36s/it]

Sergio Romero


  6%|█████▎                                                                             | 2/31 [00:04<01:08,  2.35s/it]

Lee Grant


 10%|████████                                                                           | 3/31 [00:06<00:56,  2.03s/it]

Victor Lindelöf


 13%|██████████▋                                                                        | 4/31 [00:08<00:56,  2.08s/it]

Eric Bailly


 16%|█████████████▍                                                                     | 5/31 [00:09<00:50,  1.96s/it]

Phil Jones


 19%|████████████████                                                                   | 6/31 [00:12<00:50,  2.01s/it]

Chris Smalling


 23%|██████████████████▋                                                                | 7/31 [00:14<00:48,  2.04s/it]

Marcos Rojo


 26%|█████████████████████▍                                                             | 8/31 [00:16<00:47,  2.07s/it]

Axel Tuanzebe


 29%|████████████████████████                                                           | 9/31 [00:18<00:46,  2.09s/it]

Luke Shaw


 32%|██████████████████████████▍                                                       | 10/31 [00:21<00:45,  2.16s/it]

Ashley Young


 35%|█████████████████████████████                                                     | 11/31 [00:23<00:42,  2.13s/it]

Cameron Borthwick-Jackson


 39%|███████████████████████████████▋                                                  | 12/31 [00:25<00:40,  2.12s/it]

Diogo Dalot


 42%|██████████████████████████████████▍                                               | 13/31 [00:27<00:38,  2.12s/it]

Matteo Darmian


 45%|█████████████████████████████████████                                             | 14/31 [00:29<00:36,  2.12s/it]

Timothy Fosu-Mensah


 48%|███████████████████████████████████████▋                                          | 15/31 [00:31<00:34,  2.13s/it]

Antonio Valencia


 52%|██████████████████████████████████████████▎                                       | 16/31 [00:34<00:32,  2.14s/it]

Nemanja Matic


 55%|████████████████████████████████████████████▉                                     | 17/31 [00:36<00:30,  2.15s/it]

Paul Pogba


 58%|███████████████████████████████████████████████▌                                  | 18/31 [00:38<00:28,  2.16s/it]

Fred


 61%|██████████████████████████████████████████████████▎                               | 19/31 [00:40<00:25,  2.12s/it]

Ander Herrera


 65%|████████████████████████████████████████████████████▉                             | 20/31 [00:42<00:23,  2.13s/it]

Scott McTominay


 68%|███████████████████████████████████████████████████████▌                          | 21/31 [00:44<00:21,  2.12s/it]

Juan Mata


 71%|██████████████████████████████████████████████████████████▏                       | 22/31 [00:46<00:19,  2.12s/it]

Andreas Pereira


 74%|████████████████████████████████████████████████████████████▊                     | 23/31 [00:48<00:16,  2.12s/it]

Anthony Martial


 77%|███████████████████████████████████████████████████████████████▍                  | 24/31 [00:50<00:14,  2.12s/it]

Alexis Sánchez


 81%|██████████████████████████████████████████████████████████████████▏               | 25/31 [00:53<00:12,  2.14s/it]

Jesse Lingard


 84%|████████████████████████████████████████████████████████████████████▊             | 26/31 [00:55<00:10,  2.14s/it]

Romelu Lukaku


 87%|███████████████████████████████████████████████████████████████████████▍          | 27/31 [00:57<00:08,  2.14s/it]

Marcus Rashford


 90%|██████████████████████████████████████████████████████████████████████████        | 28/31 [00:59<00:06,  2.14s/it]

James Wilson


 94%|████████████████████████████████████████████████████████████████████████████▋     | 29/31 [01:02<00:04,  2.15s/it]

James Garner


 97%|███████████████████████████████████████████████████████████████████████████████▎  | 30/31 [01:04<00:02,  2.16s/it]

Angel Gomes


100%|██████████████████████████████████████████████████████████████████████████████████| 31/31 [01:06<00:00,  2.15s/it]
  0%|                                                                                           | 0/35 [00:00<?, ?it/s]

David de Gea


  3%|██▎                                                                                | 1/35 [00:02<01:12,  2.14s/it]

Sergio Romero


  6%|████▋                                                                              | 2/35 [00:04<01:15,  2.27s/it]

Sam Johnstone


  9%|███████                                                                            | 3/35 [00:06<01:12,  2.28s/it]

Joel Pereira


 11%|█████████▍                                                                         | 4/35 [00:08<01:09,  2.23s/it]

Eric Bailly


 14%|███████████▊                                                                       | 5/35 [00:11<01:08,  2.30s/it]

Victor Lindelöf


 17%|██████████████▏                                                                    | 6/35 [00:13<01:07,  2.31s/it]

Daley Blind


 20%|████████████████▌                                                                  | 7/35 [00:16<01:06,  2.37s/it]

Marcos Rojo


 23%|██████████████████▉                                                                | 8/35 [00:18<01:03,  2.37s/it]

Chris Smalling


 26%|█████████████████████▎                                                             | 9/35 [00:20<00:59,  2.29s/it]

Phil Jones


 29%|███████████████████████▍                                                          | 10/35 [00:23<00:57,  2.31s/it]

Axel Tuanzebe


 31%|█████████████████████████▊                                                        | 11/35 [00:25<00:54,  2.29s/it]

Luke Shaw


 34%|████████████████████████████                                                      | 12/35 [00:27<00:52,  2.28s/it]

Ashley Young


 37%|██████████████████████████████▍                                                   | 13/35 [00:29<00:49,  2.27s/it]

Cameron Borthwick-Jackson


 40%|████████████████████████████████▊                                                 | 14/35 [00:31<00:47,  2.28s/it]

Matteo Darmian


 43%|███████████████████████████████████▏                                              | 15/35 [00:34<00:45,  2.28s/it]

Antonio Valencia


 46%|█████████████████████████████████████▍                                            | 16/35 [00:36<00:43,  2.28s/it]

Timothy Fosu-Mensah


 49%|███████████████████████████████████████▊                                          | 17/35 [00:37<00:40,  2.23s/it]

Nemanja Matic


 51%|██████████████████████████████████████████▏                                       | 18/35 [00:40<00:37,  2.23s/it]

Michael Carrick


 54%|████████████████████████████████████████████▌                                     | 19/35 [00:42<00:35,  2.23s/it]

Paul Pogba


 57%|██████████████████████████████████████████████▊                                   | 20/35 [00:44<00:33,  2.23s/it]

Ander Herrera


 60%|█████████████████████████████████████████████████▏                                | 21/35 [00:46<00:31,  2.22s/it]

Marouane Fellaini


 63%|███████████████████████████████████████████████████▌                              | 22/35 [00:49<00:29,  2.24s/it]

Ethan Hamilton


 66%|█████████████████████████████████████████████████████▉                            | 23/35 [00:51<00:26,  2.23s/it]

Scott McTominay


 69%|████████████████████████████████████████████████████████▏                         | 24/35 [00:53<00:24,  2.24s/it]

Henrikh Mkhitaryan


 71%|██████████████████████████████████████████████████████████▌                       | 25/35 [00:55<00:22,  2.24s/it]

Juan Mata


 74%|████████████████████████████████████████████████████████████▉                     | 26/35 [00:57<00:19,  2.20s/it]

Angel Gomes


 77%|███████████████████████████████████████████████████████████████▎                  | 27/35 [00:58<00:17,  2.17s/it]

Alexis Sánchez


 80%|█████████████████████████████████████████████████████████████████▌                | 28/35 [01:00<00:15,  2.18s/it]

Anthony Martial


 83%|███████████████████████████████████████████████████████████████████▉              | 29/35 [01:03<00:13,  2.18s/it]

Jesse Lingard


 86%|██████████████████████████████████████████████████████████████████████▎           | 30/35 [01:05<00:10,  2.18s/it]

Romelu Lukaku


 89%|████████████████████████████████████████████████████████████████████████▋         | 31/35 [01:07<00:08,  2.18s/it]

Marcus Rashford


 91%|██████████████████████████████████████████████████████████████████████████▉       | 32/35 [01:09<00:06,  2.18s/it]

Wayne Rooney


 94%|█████████████████████████████████████████████████████████████████████████████▎    | 33/35 [01:11<00:04,  2.16s/it]

Zlatan Ibrahimovic


 97%|███████████████████████████████████████████████████████████████████████████████▋  | 34/35 [01:13<00:02,  2.17s/it]

James Wilson


100%|██████████████████████████████████████████████████████████████████████████████████| 35/35 [01:15<00:00,  2.16s/it]
  0%|                                                                                           | 0/42 [00:00<?, ?it/s]

David de Gea


  2%|█▉                                                                                 | 1/42 [00:02<01:30,  2.21s/it]

Sergio Romero


  5%|███▉                                                                               | 2/42 [00:04<01:34,  2.36s/it]

Sam Johnstone


  7%|█████▉                                                                             | 3/42 [00:06<01:27,  2.25s/it]

Joel Pereira


 10%|███████▉                                                                           | 4/42 [00:08<01:23,  2.19s/it]

Dean Henderson


 12%|█████████▉                                                                         | 5/42 [00:10<01:19,  2.16s/it]

Kieran O'Hara


 14%|███████████▊                                                                       | 6/42 [00:12<01:16,  2.11s/it]

Chris Smalling


 17%|█████████████▊                                                                     | 7/42 [00:14<01:13,  2.10s/it]

Daley Blind


 19%|███████████████▊                                                                   | 8/42 [00:16<01:11,  2.09s/it]

Marcos Rojo


 21%|█████████████████▊                                                                 | 9/42 [00:19<01:09,  2.11s/it]

Phil Jones


 24%|███████████████████▌                                                              | 10/42 [00:21<01:08,  2.15s/it]

Eric Bailly


 26%|█████████████████████▍                                                            | 11/42 [00:23<01:06,  2.16s/it]

Axel Tuanzebe


 29%|███████████████████████▍                                                          | 12/42 [00:25<01:04,  2.15s/it]

Luke Shaw


 31%|█████████████████████████▍                                                        | 13/42 [00:28<01:02,  2.16s/it]

Ashley Young


 33%|███████████████████████████▎                                                      | 14/42 [00:30<01:00,  2.15s/it]

Cameron Borthwick-Jackson


 36%|█████████████████████████████▎                                                    | 15/42 [00:32<00:58,  2.15s/it]

Demetri Mitchell


 38%|███████████████████████████████▏                                                  | 16/42 [00:34<00:56,  2.15s/it]

Matteo Darmian


 40%|█████████████████████████████████▏                                                | 17/42 [00:36<00:53,  2.16s/it]

Antonio Valencia


 43%|███████████████████████████████████▏                                              | 18/42 [00:38<00:51,  2.16s/it]

Guillermo Varela


 45%|█████████████████████████████████████                                             | 19/42 [00:40<00:49,  2.16s/it]

Timothy Fosu-Mensah


 48%|███████████████████████████████████████                                           | 20/42 [00:43<00:47,  2.15s/it]

Morgan Schneiderlin


 50%|█████████████████████████████████████████                                         | 21/42 [00:45<00:45,  2.15s/it]

Michael Carrick


 52%|██████████████████████████████████████████▉                                       | 22/42 [00:47<00:42,  2.14s/it]

Paul Pogba


 55%|████████████████████████████████████████████▉                                     | 23/42 [00:48<00:40,  2.11s/it]

Ander Herrera


 57%|██████████████████████████████████████████████▊                                   | 24/42 [00:50<00:37,  2.11s/it]

Marouane Fellaini


 60%|████████████████████████████████████████████████▊                                 | 25/42 [00:52<00:36,  2.12s/it]

Bastian Schweinsteiger


 62%|██████████████████████████████████████████████████▊                               | 26/42 [00:55<00:34,  2.14s/it]

Matty Willock


 64%|████████████████████████████████████████████████████▋                             | 27/42 [00:58<00:32,  2.15s/it]

Scott McTominay


 67%|██████████████████████████████████████████████████████▋                           | 28/42 [01:00<00:30,  2.15s/it]

Juan Mata


 69%|████████████████████████████████████████████████████████▌                         | 29/42 [01:02<00:27,  2.15s/it]

Henrikh Mkhitaryan


 71%|██████████████████████████████████████████████████████████▌                       | 30/42 [01:04<00:25,  2.16s/it]

Andreas Pereira


 74%|████████████████████████████████████████████████████████████▌                     | 31/42 [01:06<00:23,  2.14s/it]

Josh Harrop


 76%|██████████████████████████████████████████████████████████████▍                   | 32/42 [01:08<00:21,  2.13s/it]

Angel Gomes


 79%|████████████████████████████████████████████████████████████████▍                 | 33/42 [01:09<00:18,  2.11s/it]

Anthony Martial


 81%|██████████████████████████████████████████████████████████████████▍               | 34/42 [01:11<00:16,  2.11s/it]

Adnan Januzaj


 83%|████████████████████████████████████████████████████████████████████▎             | 35/42 [01:13<00:14,  2.11s/it]

Jesse Lingard


 86%|██████████████████████████████████████████████████████████████████████▎           | 36/42 [01:15<00:12,  2.10s/it]

Zak Dearnley


 88%|████████████████████████████████████████████████████████████████████████▏         | 37/42 [01:17<00:10,  2.10s/it]

Wayne Rooney


 90%|██████████████████████████████████████████████████████████████████████████▏       | 38/42 [01:19<00:08,  2.08s/it]

Memphis Depay


 93%|████████████████████████████████████████████████████████████████████████████▏     | 39/42 [01:21<00:06,  2.09s/it]

Zlatan Ibrahimovic


 95%|██████████████████████████████████████████████████████████████████████████████    | 40/42 [01:23<00:04,  2.09s/it]

Marcus Rashford


 98%|████████████████████████████████████████████████████████████████████████████████  | 41/42 [01:26<00:02,  2.11s/it]

James Wilson


100%|██████████████████████████████████████████████████████████████████████████████████| 42/42 [01:28<00:00,  2.11s/it]
  0%|                                                                                           | 0/44 [00:00<?, ?it/s]

David de Gea


  2%|█▉                                                                                 | 1/44 [00:02<01:33,  2.17s/it]

Sergio Romero


  5%|███▊                                                                               | 2/44 [00:04<01:29,  2.14s/it]

Víctor Valdés


  7%|█████▋                                                                             | 3/44 [00:06<01:26,  2.12s/it]

Sam Johnstone


  9%|███████▌                                                                           | 4/44 [00:08<01:23,  2.09s/it]

Joel Pereira


 11%|█████████▍                                                                         | 5/44 [00:10<01:21,  2.09s/it]

Dean Henderson


 14%|███████████▎                                                                       | 6/44 [00:12<01:18,  2.06s/it]

Marcos Rojo


 16%|█████████████▏                                                                     | 7/44 [00:14<01:18,  2.12s/it]

Daley Blind


 18%|███████████████                                                                    | 8/44 [00:16<01:16,  2.12s/it]

Phil Jones


 20%|████████████████▉                                                                  | 9/44 [00:19<01:15,  2.16s/it]

Chris Smalling


 23%|██████████████████▋                                                               | 10/44 [00:21<01:13,  2.16s/it]

Ro-Shaun Williams


 25%|████████████████████▌                                                             | 11/44 [00:23<01:11,  2.17s/it]

Regan Poole


 27%|██████████████████████▎                                                           | 12/44 [00:26<01:09,  2.17s/it]

Axel Tuanzebe


 30%|████████████████████████▏                                                         | 13/44 [00:27<01:05,  2.11s/it]

Luke Shaw


 32%|██████████████████████████                                                        | 14/44 [00:29<01:02,  2.10s/it]

Ashley Young


 34%|███████████████████████████▉                                                      | 15/44 [00:31<01:01,  2.10s/it]

Tyler Blackett


 36%|█████████████████████████████▊                                                    | 16/44 [00:33<00:58,  2.10s/it]

Cameron Borthwick-Jackson


 39%|███████████████████████████████▋                                                  | 17/44 [00:35<00:56,  2.10s/it]

Antonio Valencia


 41%|█████████████████████████████████▌                                                | 18/44 [00:37<00:54,  2.08s/it]

Matteo Darmian


 43%|███████████████████████████████████▍                                              | 19/44 [00:39<00:51,  2.08s/it]

Guillermo Varela


 45%|█████████████████████████████████████▎                                            | 20/44 [00:41<00:49,  2.06s/it]

Donald Love


 48%|███████████████████████████████████████▏                                          | 21/44 [00:43<00:47,  2.06s/it]

Joe Riley


 50%|█████████████████████████████████████████                                         | 22/44 [00:45<00:45,  2.06s/it]

Timothy Fosu-Mensah


 52%|██████████████████████████████████████████▊                                       | 23/44 [00:47<00:43,  2.07s/it]

Morgan Schneiderlin


 55%|████████████████████████████████████████████▋                                     | 24/44 [00:50<00:41,  2.09s/it]

Michael Carrick


 57%|██████████████████████████████████████████████▌                                   | 25/44 [00:52<00:39,  2.10s/it]

Paddy McNair


 59%|████████████████████████████████████████████████▍                                 | 26/44 [00:54<00:37,  2.08s/it]

Bastian Schweinsteiger


 61%|██████████████████████████████████████████████████▎                               | 27/44 [00:56<00:35,  2.10s/it]

Ander Herrera


 64%|████████████████████████████████████████████████████▏                             | 28/44 [00:58<00:33,  2.10s/it]

Marouane Fellaini


 66%|██████████████████████████████████████████████████████                            | 29/44 [01:01<00:31,  2.12s/it]

Joe Rothwell


 68%|███████████████████████████████████████████████████████▉                          | 30/44 [01:04<00:29,  2.14s/it]

Sean Goss


 70%|█████████████████████████████████████████████████████████▊                        | 31/44 [01:06<00:27,  2.14s/it]

James Weir


 73%|███████████████████████████████████████████████████████████▋                      | 32/44 [01:08<00:25,  2.14s/it]

Juan Mata


 75%|█████████████████████████████████████████████████████████████▌                    | 33/44 [01:10<00:23,  2.14s/it]

Nick Powell


 77%|███████████████████████████████████████████████████████████████▎                  | 34/44 [01:12<00:21,  2.15s/it]

Andreas Pereira


 80%|█████████████████████████████████████████████████████████████████▏                | 35/44 [01:15<00:19,  2.15s/it]

Anthony Martial


 82%|███████████████████████████████████████████████████████████████████               | 36/44 [01:17<00:17,  2.15s/it]

Adnan Januzaj


 84%|████████████████████████████████████████████████████████████████████▉             | 37/44 [01:19<00:15,  2.15s/it]

Jesse Lingard


 86%|██████████████████████████████████████████████████████████████████████▊           | 38/44 [01:21<00:12,  2.15s/it]

Wayne Rooney


 89%|████████████████████████████████████████████████████████████████████████▋         | 39/44 [01:24<00:10,  2.16s/it]

Memphis Depay


 91%|██████████████████████████████████████████████████████████████████████████▌       | 40/44 [01:26<00:08,  2.16s/it]

Chicharito


 93%|████████████████████████████████████████████████████████████████████████████▍     | 41/44 [01:28<00:06,  2.16s/it]

James Wilson


 95%|██████████████████████████████████████████████████████████████████████████████▎   | 42/44 [01:30<00:04,  2.17s/it]

Will Keane


 98%|████████████████████████████████████████████████████████████████████████████████▏ | 43/44 [01:32<00:02,  2.15s/it]

Marcus Rashford


100%|██████████████████████████████████████████████████████████████████████████████████| 44/44 [01:34<00:00,  2.15s/it]
  0%|                                                                                           | 0/43 [00:00<?, ?it/s]

David de Gea


  2%|█▉                                                                                 | 1/43 [00:02<01:52,  2.69s/it]

Víctor Valdés


  5%|███▊                                                                               | 2/43 [00:05<01:52,  2.74s/it]

Anders Lindegaard


  7%|█████▊                                                                             | 3/43 [00:08<01:52,  2.82s/it]

Ben Amos


  9%|███████▋                                                                           | 4/43 [00:10<01:47,  2.75s/it]

Sam Johnstone


 12%|█████████▋                                                                         | 5/43 [00:13<01:43,  2.73s/it]

Phil Jones


 14%|███████████▌                                                                       | 6/43 [00:15<01:38,  2.66s/it]

Jonny Evans


 16%|█████████████▌                                                                     | 7/43 [00:17<01:30,  2.50s/it]

Chris Smalling


 19%|███████████████▍                                                                   | 8/43 [00:19<01:27,  2.49s/it]

Daley Blind


 21%|█████████████████▎                                                                 | 9/43 [00:21<01:21,  2.39s/it]

Marcos Rojo


 23%|███████████████████                                                               | 10/43 [00:23<01:16,  2.33s/it]

Michael Keane


 26%|████████████████████▉                                                             | 11/43 [00:26<01:15,  2.37s/it]

Tom Thorpe


 28%|██████████████████████▉                                                           | 12/43 [00:27<01:11,  2.29s/it]

Ashley Young


 30%|████████████████████████▊                                                         | 13/43 [00:29<01:08,  2.28s/it]

Luke Shaw


 33%|██████████████████████████▋                                                       | 14/43 [00:31<01:06,  2.28s/it]

Reece James


 35%|████████████████████████████▌                                                     | 15/43 [00:33<01:03,  2.26s/it]

Tyler Blackett


 37%|██████████████████████████████▌                                                   | 16/43 [00:36<01:00,  2.25s/it]

Antonio Valencia


 40%|████████████████████████████████▍                                                 | 17/43 [00:37<00:57,  2.21s/it]

Rafael


 42%|██████████████████████████████████▎                                               | 18/43 [00:39<00:55,  2.21s/it]

Marnick Vermijl


 44%|████████████████████████████████████▏                                             | 19/43 [00:41<00:52,  2.21s/it]

Saidy Janko


 47%|██████████████████████████████████████▏                                           | 20/43 [00:43<00:49,  2.17s/it]

Michael Carrick


 49%|████████████████████████████████████████                                          | 21/43 [00:45<00:47,  2.15s/it]

Paddy McNair


 51%|█████████████████████████████████████████▉                                        | 22/43 [00:47<00:45,  2.15s/it]

Marouane Fellaini


 53%|███████████████████████████████████████████▊                                      | 23/43 [00:49<00:43,  2.15s/it]

Ander Herrera


 56%|█████████████████████████████████████████████▊                                    | 24/43 [00:51<00:40,  2.16s/it]

Tom Cleverley


 58%|███████████████████████████████████████████████▋                                  | 25/43 [00:54<00:39,  2.18s/it]

Anderson


 60%|█████████████████████████████████████████████████▌                                | 26/43 [00:57<00:37,  2.20s/it]

Darren Fletcher


 63%|███████████████████████████████████████████████████▍                              | 27/43 [00:59<00:35,  2.20s/it]

Juan Mata


 65%|█████████████████████████████████████████████████████▍                            | 28/43 [01:01<00:32,  2.20s/it]

Shinji Kagawa


 67%|███████████████████████████████████████████████████████▎                          | 29/43 [01:03<00:30,  2.18s/it]

Nick Powell


 70%|█████████████████████████████████████████████████████████▏                        | 30/43 [01:05<00:28,  2.18s/it]

Andreas Pereira


 72%|███████████████████████████████████████████████████████████                       | 31/43 [01:07<00:26,  2.19s/it]

Nani


 74%|█████████████████████████████████████████████████████████████                     | 32/43 [01:10<00:24,  2.19s/it]

Ángel Di María


 77%|██████████████████████████████████████████████████████████████▉                   | 33/43 [01:12<00:22,  2.20s/it]

Wilfried Zaha


 79%|████████████████████████████████████████████████████████████████▊                 | 34/43 [01:14<00:19,  2.20s/it]

Adnan Januzaj


 81%|██████████████████████████████████████████████████████████████████▋               | 35/43 [01:16<00:17,  2.18s/it]

Jesse Lingard


 84%|████████████████████████████████████████████████████████████████████▋             | 36/43 [01:18<00:15,  2.19s/it]

Falcao


 86%|██████████████████████████████████████████████████████████████████████▌           | 37/43 [01:21<00:13,  2.19s/it]

Wayne Rooney


 88%|████████████████████████████████████████████████████████████████████████▍         | 38/43 [01:23<00:10,  2.19s/it]

Robin van Persie


 91%|██████████████████████████████████████████████████████████████████████████▎       | 39/43 [01:25<00:08,  2.20s/it]

Danny Welbeck


 93%|████████████████████████████████████████████████████████████████████████████▎     | 40/43 [01:28<00:06,  2.20s/it]

Chicharito


 95%|██████████████████████████████████████████████████████████████████████████████▏   | 41/43 [01:30<00:04,  2.20s/it]

Will Keane


 98%|████████████████████████████████████████████████████████████████████████████████  | 42/43 [01:31<00:02,  2.18s/it]

James Wilson


100%|██████████████████████████████████████████████████████████████████████████████████| 43/43 [01:33<00:00,  2.19s/it]


In [241]:
season_df.shape

(1200, 8)

In [249]:
s_df = main_df.copy()

injury_series = s_df.groupby(by = 'Name')['Days Out'].sum()
injury_series = injury_series.sort_values(ascending = False)

fig = plt.figure()


init_plot((10, 10), "#b3e5fc")
ax = sns.barplot(injury_series[:20].index, injury_series[:20].values, palette= sns.light_palette("navy", reverse=True))
stylize_plot(ax, "Name" , "Days Injured", "Injury History Of MUFC Players 2018/19 Season")

<IPython.core.display.Javascript object>

In [247]:
main_df = season_df.drop_duplicates()
s_df = main_df.copy()

#Calculating months in which most injured

s_df['Date Injured'] = pd.to_datetime(s_df['Date Injured'])
s_df['Date Return'] = pd.to_datetime(s_df['Date Return'])

month_series = s_df.reset_index()['Date Injured'].dt.month_name()
cnts = month_series.value_counts()

plt.figure()

init_plot((10, 10), "#b3e5fc")
ax = sns.barplot(cnts.index, cnts.values, order= SEASON_ORDER, palette = sns.light_palette("navy", reverse=True))
stylize_plot(ax, "Name" , "Days Injured", "Months in which most injuries occurred (2018/19 Season)")

<IPython.core.display.Javascript object>

In [251]:
main_df[main_df['Name'] == 'Danny Welbeck']

Unnamed: 0,Team,Name,Season,Injury,Date Injured,Date Return,Days Out,Matches Out
0,Manchester United,Danny Welbeck,18/19,Ankle Injury,"Nov 9, 2018","May 28, 2019",200.0,41.0
1,Manchester United,Danny Welbeck,17/18,Groin Strain,"Oct 16, 2017","Nov 18, 2017",33.0,7.0
2,Manchester United,Danny Welbeck,17/18,Hip Injury,"Sep 18, 2017","Oct 12, 2017",24.0,4.0
3,Manchester United,Danny Welbeck,16/17,Toe Injury,"Apr 17, 2017","Apr 20, 2017",3.0,1.0
4,Manchester United,Danny Welbeck,15/16,Cartilage Damage,"May 9, 2016","Jan 2, 2017",238.0,29.0
5,Manchester United,Danny Welbeck,15/16,Knee Surgery,"Sep 3, 2015","Feb 4, 2016",154.0,30.0
6,Manchester United,Danny Welbeck,14/15,Patella problems,"May 4, 2015","Sep 3, 2015",122.0,11.0
7,Manchester United,Danny Welbeck,14/15,Knee Problems,"Mar 30, 2015","Apr 2, 2015",3.0,0.0
8,Manchester United,Danny Welbeck,11/12,Torn Muscle Fibre,"Aug 29, 2011","Sep 19, 2011",21.0,3.0
9,Manchester United,Danny Welbeck,10/11,Thigh Problems,"Jan 6, 2011","Jan 27, 2011",21.0,3.0
