In [252]:
import pandas as pd
import time
import re
import tweepy
import requests
from bs4 import BeautifulSoup
from types import MappingProxyType
import datetime
import math
import random

### 定数定義
# 2022-23のプレミアリーグ20クラブ
EPL_CODE = [
    'brentford-fc','liverpool-fc','everton-fc','brighton-hove-albion','leicester-city','fulham-fc','arsenal-fc','newcastle-united-fc',
    'manchester-united-fc','afc-bournemouth','southampton-fc','nottingham-forest-fc','leeds-united-fc','west-ham-united-fc','aston-villa-fc',
    'wolverhampton-wanderers-fc','crystal-palace','tottenham-hotspur-fc','chelsea-fc','manchester-city-fc'
]

# 2022-23のプレミアリーグ20クラブ（英語 ⇒ 日本語）
EPL_CODE_DICT: dict = MappingProxyType({
        'brentford-fc':'ブレントフォード',
        'liverpool-fc':'リヴァプール',
        'everton-fc':'エヴァートン',
        'brighton-hove-albion':'ブライトン',
        'leicester-city':'レスター',
        'fulham-fc':'フラム',
        'arsenal-fc':'アーセナル',
        'newcastle-united-fc':'ニューカッスル',
        'manchester-united-fc':'マンチェスター・U',
        'afc-bournemouth':'ボーンマス',
        'southampton-fc':'サウサンプトン',
        'nottingham-forest-fc':'フォレスト',
        'leeds-united-fc':'リーズ',
        'west-ham-united-fc':'ウェストハム',
        'aston-villa-fc':'アストン・ヴィラ',
        'wolverhampton-wanderers-fc':'ウルヴァーハンプトン',
        'crystal-palace':'クリスタル・パレス',
        'tottenham-hotspur-fc':'トッテナム',
        'chelsea-fc':'チェルシー',
        'manchester-city-fc':'マンチェスター・C'
})
    
# 1ツイートの出走馬情報数
MAX_PLAYER_INFO = 8

In [258]:
def scrapeSportsNaviPage(en_team_name: str):
    df = pd.DataFrame()

    # 1秒スリープ
    time.sleep(1)

    # スクレイピング対象のURLを生成する
    url = 'https://www.spotrac.com/epl/' + en_team_name + '/contracts/'
    df = pd.read_html(url)[0]
    # マルチインデックスを解消する
    df = df.T.reset_index(level=0, drop=True).T

    html = requests.get(url)
    html.encoding = "EUC-JP"
    # HTMLを解析する
    soup = BeautifulSoup(html.text, "lxml")

    # 選手の契約情報を取得
    player_name_list = []
    avg_salary_list = []
    expired_year_list = []

    for num in range(len(df)):
        # 選手
        player_name_list.append(df[0][num])

        # 契約期間
        expired_year = str(df[6][num]) + '年6月'
        expired_year_list.append(expired_year)

        # 年俸
        # £:スターリング・ポンド⇒円変換(1£=160円)
        # https://yuis-programming.com/?p=511　※moduleをレイヤー追加するのが手間
        if df[4][num] == '-':
            df[4][num] = '£0,0'

        salary = df[4][num].replace('£', '').replace(',', '')
        salary_yen = 160 * int(salary)
        salary_yen = str(salary_yen) + '円'
        avg_salary_list.append(salary_yen)
        
        # horse_idと、jockey_id、trainer_idをデータフレームに設定（引数にdfを渡すとすっきりするはずなので次回以降は注意が必要）
        #         df['player_name'] = player_name_list
        #         df['expired_year'] = expired_year_list
        #         df['avg_salary'] = avg_salary_list

    return player_name_list, expired_year_list, avg_salary_list

In [259]:
EPL_CODE_NUM = random.randint(0, 19)
print(EPL_CODE_NUM)
en_team_name = EPL_CODE[EPL_CODE_NUM]
print(en_team_name)

team_info_list = scrapeSportsNaviPage(en_team_name)
print(team_info_list)



7
newcastle-united-fc
(['Alexander Isak', 'Bruno Guimarães', 'Joelinton Cassio Apolinário de Lira', 'Sven Botman', 'Matt Targett', 'Kieran Trippier', 'Jonjo Shelvey', 'Nick Pope', 'Allan Saint-Maximin', 'Emil Krafth', 'Martin Dubravka', 'Miguel Almiron', 'Ryan Fraser', 'Jamaal Lascelles', 'Chris Wood', 'Jamal Lewis', 'Callum Wilson', 'Matt Ritchie', 'Elliot Anderson', 'Ciaran Clark', 'Jeff Hendrick', 'Jacob Murphy', 'Sean Longstaff', 'Javier Manquillo', 'Isaac Hayden', 'Karl Darlow', 'Joe Willock', 'Fabian Schar', 'Dan Burn', 'Dan Burn', 'Paul Dummett', 'Mark Gillespie', 'Matthew Longstaff', 'Santiago Munoz', 'Garang Kuol', 'Kell Watts'], ['2028年6月', '2026年6月', '2025年6月', '2026年6月', '2026年6月', '2024年6月', '2023年6月', '2026年6月', '2026年6月', '2024年6月', '2025年6月', '2024年6月', '2025年6月', '2024年6月', '2024年6月', '2025年6月', '2024年6月', '2023年6月', '2026年6月', '2023年6月', '2024年6月', '2027年6月', '2025年6月', '2024年6月', '2026年6月', '2025年6月', '2027年6月', '2024年6月', '2023年6月', '2024年6月', '2023年6月', '2023年6月', 

MSG = createTweetMsg(player_name_list, expired_year_list, avg_salary_list)
print(MSG)

In [263]:
# tweet_bot

# [クラブ名]所属選手の契約期間と年棒
## manchester-city-fc所属選手の契約期間と年棒

# [所属選手] [契約期間] [年棒]
## Kevin De Bruyne 2025年6月 3328000000円
## Erling Haaland 2027年6月 3120000000円
## Jack Grealish 2025年6月 2496000000円

# MAX_PLAYER_INFO = 8
# func_typeはなしでOK

def _tweetBot(msg : str, parentTweetID: str):
    """
    指定されたメッセージをTwitterする関数。
    """
    print('tweetBot start')

    if parentTweetID == '':
        # tweetを実施
        tweet_response = client.create_tweet(
            text=msg
        )
    else:
        # スレッド機能のtweetを実施
        tweet_response = client.create_tweet(
            text=msg,
            in_reply_to_tweet_id=parentTweetID
        )
    print(tweet_response)

    print('tweetBot end')
    return tweet_response.data['id']

def createTweetMsg(en_team_name, player_name_list, expired_year_list, avg_salary_list):
    """
    tweetするメッセージを生成する関数。

    Parameters
    ----------
    en_team_name
        チーム名（英語）
    player_name_list
        選手名
    expired_year_list
        契約終了年月
    avg_salary_list
        年俸
    """
    print('createTweetMsg start')
    
    # listが空の場合
    if len(player_name_list) == 0 or len(expired_year_list) == 0 or len(avg_salary_list) == 0:
        text = 'データがありません。'
        # ツイートする
        print('何もありません')
        _tweetBot(text)
    else:
        
        # チームの英語 ⇒ 日本語へ変換
        ja_team_name = EPL_CODE_DICT.get(en_team_name)
        print(ja_team_name)
        top_text = ja_team_name + '所属選手の契約期間と年棒' +'\n\n'
        
        # 変数を初期化
        text = top_text
        tweetID = ''
        player_count = 0
        tweet_count = 0

        # match_listを分解して1行ずつ整理
        for num in range(len(player_name_list)):
            text += player_name_list[num] + ' ' + expired_year_list[num] + ' ' + avg_salary_list[num] + '\n'
            
            player_count += 1

            # tweet情報がたまった場合
            if MAX_PLAYER_INFO <= player_count:
                # ツイートする
                print('tweet1')
                tweetID = _tweetBot(text, tweetID)
                tweet_count += 1

               # テキスト、カウンタを初期化
                text = ''
                player_count = 0
                
        if player_count > 0:
            # ツイートする
            print('tweet2')
            _tweetBot(text, tweetID)
        
        # ツイートする
        print('tweetだあ！')
        print(text)
        _tweetBot(text)
    
    print('createTweetMsg end')

In [264]:
MSG = createTweetMsg(en_team_name, team_info_list[0], team_info_list[1], team_info_list[2])
print(MSG)

createTweetMsg start
ニューカッスル
tweet1
tweetBot start


NameError: name 'client' is not defined

In [255]:
# df[i][j] ※i=列, j=行
df

Unnamed: 0,0,1,2,3,4,5,6
0,Kevin De Bruyne,M,31.0,"5 yr £104,000,000","£20,800,000","£62,900,000",2025
1,Erling Haaland,F,22.0,"5 yr £97,500,000","£19,500,000","£66,000,000",2027
2,Jack Grealish,M,27.0,"6 yr £93,600,000","£15,600,000","£129,250,000",2027
3,John Stones,D,28.0,"5 yr £65,000,000","£13,000,000","£47,260,000",2026
4,Phil Foden,M,,"5 yr £58,500,000","£11,700,000",-,2027
5,Rodrigo Hernández Cascante,M,26.0,"5 yr £57,200,000","£11,440,000","£79,800,000",2027
6,Ruben Dias,D,,"6 yr £54,080,000","£9,013,333","£74,800,000",2027
7,Bernardo Silva,M,28.0,"6 yr £46,800,000","£7,800,000","£43,800,000",2025
8,Kalvin Phillips,M,27.0,"6 yr £46,800,000","£7,800,000","£53,620,000",2028
9,Manuel Akanji,D,27.0,"5 yr £46,800,000","£9,360,000","£19,250,000",2027


In [265]:

# for num in range(len(df)):
#     print(avg_salary_list[num])
#     salary = avg_salary_list[num].replace('£', '').replace(',', '')
#     print(salary)
#     avg_salary_list[num] = 160 * int(salary)

# print(avg_salary_list[0])

# avg_salary_list[0] = avg_salary_list[0].replace('£', '').replace(',', '')

# print(avg_salary_list[0])

# avg_salary_list[0] = 160 * int(avg_salary_list[0])

# print(avg_salary_list[0])

# avg_salary_list[0] = 2 * int(avg_salary_list[0])


# 対象ページ
url = 'https://fbref.com/en/players/c1242d4e/Stefan-Ortega'

# スクレイピング
top_r = requests.get(url)

# HTMLを解析する
top_soup = BeautifulSoup(top_r.content, "html.parser")

# 選手情報を取得
td_list = top_soup.find\
        ('div', id='meta').find_all('p')

# print(td_list)

t_search_key = 'Expires'
expires_list = []

for p in td_list:
    if t_search_key in p.text:
        if re.search(r'Expires', p.text) is not None:
            expires_list.append(p.text)
            
print(expires_list)


# 契約期間と年棒・週休をスレッド形式で配信する。
# 対象ページ
url = 'https://www.spotrac.com/epl/manchester-city-fc/contracts/'

# スクレイピング
top_r = requests.get(url)

# HTMLを解析する
top_soup = BeautifulSoup(top_r.content, "html.parser")

# テーブル情報を取得
td_list = top_soup.find\
        ('table').find_all('td')

for td in td_list:
    work_td = td.text.split('\n')
    # アルファベット    
    # 2桁の数値
    # £が含まれている
    # 4桁の数値
    

[' Wages: \n    \n£ 55,000 Weekly\n\n        Expires June 2025. Via Capology.\n    ']
