In [1]:
# coding: UTF-8
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
import numpy as np
import pandas as pd
from datetime import datetime, timedelta
import sys
from tqdm import tqdm

In [2]:
#現在の最大表示行数の出力
pd.set_option("display.max_columns", 30)

#最大表示行数の指定（ここでは50行を指定）
pd.set_option('display.max_rows', 500)

In [3]:
def get_game_data(url):
    """
    情報を格納するデータフレームの作成と、
    試合ごとに共通するカラムを取得する関数
    """
    
    #試合ごとに変化するカラム
    game_columns = ['GameDate', 'GameID', 'HomeTeam', 'AwayTeam']

    
    #打席ごとに変化するカラム
    batterbox_columns = [ 'PitcherName', 'PitcherThrows', 'PitcherTeam',\
                                             'BatterName', 'BatterSide', 'BatterTeam',\
                                             'Inning', 'TopBottom', 'InningBatterCount', 'AfterOutCount']
    #InningBatterCount → そのイニングの何人目のバッターか
    #AfterOutCount → その打席が終わった時のアウトカウント数

    #1球ごとに変化するカラム
    ball_columns = ['PitchNo', 'BallCount', 'StrikeCount','RelSpeed', 'PitchType', 'PosX', 'PosY', 'Event']

    #1試合分の情報を格納するデータフレームを宣言
    df = pd.DataFrame(columns = game_columns + batterbox_columns + ball_columns)
    
    #ChromeDriverのパス
    driver_path = '/Users/Taira/chromedriver'
    options = Options()
    options.add_argument('--headless')
    # ブラウザを起動する
    driver = webdriver.Chrome(executable_path=driver_path, options=options)

    #先頭打者のページにアクセス
    driver.get(url)
    # 文字コードをUTF-8に変換してからHTMLを取得
    html = driver.page_source.encode('utf-8')
    # 打席ページをパースする
    bsObj = BeautifulSoup(html, "html.parser")

    
    #試合ごとに変化する情報の取得
    #試合ごとに変化する値のカラム
    game_columns = ['GameDate', 'GameID', 'HomeTeam', 'AwayTeam']
    #値を格納するSeriesの宣言
    se_game = pd.Series(index = game_columns)

    
    try:
        #スクレイピング(試合の先頭打者の時点で1度だけ取得)
        #試合日
        game_ID = url.split('_')[1]
        game_date = game_ID[:8]
        se_game.GameDate = datetime.strptime(game_date, "%Y%m%d").strftime('%Y-%m-%d')
        #ゲームID
        se_game.GameID = game_ID
        #ホームチーム(表に守備をするチーム)
        se_game.HomeTeam = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[0].findAll("p")[1].get_text()
        #アウェーチーム(表に攻撃をするチーム)
        se_game.AwayTeam = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[1].findAll("p")[1].get_text()

        return df, se_game
    
    except IndexError:
        return df, se_game

In [4]:
def get_batterbox_data(url, df, se_game):
    """
    指定の試合の全投球データを出力する関数
    """
    
    #ChromeDriverのパス
    driver_path = '/Users/Taira/chromedriver'
    options = Options()
    options.add_argument('--headless')
    # ブラウザを起動する
    driver = webdriver.Chrome(executable_path=driver_path, options=options)
    

    #同じページに2度アクセスする

    #1度目のアクセス → その打席の投球数(pitch_num)を取得
    # ブラウザで打席ページにアクセスする
    driver.get(url)
    # HTMLを文字コードをUTF-8に変換してから取得
    html = driver.page_source.encode('utf-8')
    #その打席での球数を取得
    pitch_num = len(BeautifulSoup(html, "html.parser").find("table", {"class": "pitch_archive_table"}).findAll("tr"))
    

    #2度目のアクセス → pitch_numに応じて全投球のxy座標を取得するために、打席の最後に投げられた球が表示されるまでwaitする
    driver.get(url)
    
    #1球以上投げていれば(申告敬遠でなければ) → 申告敬遠の場合は行が作られないので注意
    if pitch_num != 0:
        # ID指定したページ上の要素が読み込まれるまで待機（15秒でタイムアウト判定）
        WebDriverWait(driver, 15).until(EC.presence_of_element_located((By.ID, 'pitching_chart_icon_'+str(pitch_num))))
        
        

    # HTMLを文字コードをUTF-8に変換してから取得
    html = driver.page_source.encode('utf-8')
    # 打席ページをパースする
    bsObj = BeautifulSoup(html, "html.parser")
    
    
    
    #打席ごとに変化する情報の取得
    #打席ごとに変化する値のカラム
    batterbox_columns = [ 'PitcherName', 'PitcherThrows', 'PitcherTeam',\
                                             'BatterName', 'BatterSide', 'BatterTeam',\
                                             'Inning', 'TopBottom', 'InningBatterCount', 'AfterOutCount']
    #値を格納するSeriesの宣言
    se_batterbox = pd.Series(index = batterbox_columns)
    


    #スクレイピング(各打席が始まる時に取得)
    #ピッチャーの名前、利き腕、所属チーム
    se_batterbox.PitcherName = bsObj.findAll("div", {"class": "name"})[0].get_text()
    se_batterbox.PitcherThrows = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[0].findAll("div")[10].get_text()
    se_batterbox.PitcherTeam = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[0].findAll("p")[1].get_text()
    #バッターの名前、打席の左右、所属チーム
    se_batterbox.BatterName = bsObj.findAll("div", {"class": "name"})[1].get_text()
    se_batterbox.BatterSide = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[1].findAll("div")[9].get_text()
    se_batterbox.BatterTeam = bsObj.findAll("div", {"class": "wrapper_player clearfix"})[1].findAll("p")[1].get_text()
    #イニング、表裏
    se_batterbox.Inning = int(bsObj.find("div", {"class": "inning"}).get_text().split('回')[0])
    se_batterbox.TopBottom = 1 if (bsObj.find("div", {"class": "inning"}).get_text().split('回')[1] == '表') else 2 #表だったら1、裏だったら2
    #その回の何人目のバッターか
    se_batterbox.InningBatterCount = int(url.split('_')[2].split('.')[0][3:5])
    
    #アウトカウント(この打席が終了した時のアウトカウント)
    out_count = bsObj.find("table", {"class": "inning_count"}).find("tr",{"class": "out"}).findAll("td")
    if len(out_count[3].get("class")) == 2:
        se_batterbox.AfterOutCount = 3
    elif len(out_count[2].get("class")) == 2:
        se_batterbox.AfterOutCount = 2
    elif len(out_count[1].get("class")) == 2:
        se_batterbox.AfterOutCount = 1
    else:
        se_batterbox.AfterOutCount = 0
    
    
    #1球ごとに変化する情報の取得
    
    #1球ごとに変化するカラム
    ball_columns = ['PitchNo', 'BallCount', 'StrikeCount','RelSpeed', 'PitchType', 'PosX', 'PosY', 'Event']

    # ピッチナンバー(その打席での球数)、球速、球種、結果が書いてあるテーブルを取得
    rows = bsObj.find("table", {"class": "pitch_archive_table"}).findAll("tr")

    #投げられた順に並ぶように、行を反転させる
    rows_reverse = [[] for i in range(len(rows))]
    for i in range(len(rows)):
        row = rows[-(i+1)]
        rows_reverse[i] = row.find_all("td")

    #コースの取得(とりあえず、%表示のまま)
    courses = bsObj.select_one("#pitching_chart_icon").find_all("span")
    pos_xy = [[] for i in range(len(courses))]
    for i, course in enumerate(courses):
        y = float(course['style'].split(" ")[1].split("%")[0])
        x = float(course['style'].split(" ")[3].split("%")[0])
        pos_xy[i] = [x, y]


    strike_count = 0
    ball_count = 0

    #スクレイピング
    for i, ball in enumerate(rows_reverse):
        #値を格納するSeriesの宣言
        se_ball = pd.Series(index=ball_columns)

        #ボールカウント、ストライクカウント
        se_ball.StrikeCount = int(strike_count)
        se_ball.BallCount = int(ball_count)

        #x座標、y座標
        se_ball.PosX = pos_xy[i][0]
        se_ball.PosY = pos_xy[i][1]

        #ピッチナンバー、球速、球種、結果
        se_ball.PitchNo = int(ball[0].get_text())
        se_ball.RelSpeed = 0 if (ball[1].get_text() == '不明') else int(ball[1].get_text().split('km/h')[0])
        se_ball.PitchType = ball[2].get_text()
        result =  ball[3].get_text()
        se_ball.Event = result

        #結果が[空振り、見逃し、ファウル]ならストライクカウントを増やし
        #[ボール]ならボールカウントを増やす
        if result in ['空振り', '見逃し', 'ファウル']:
            strike_count += 1
        elif result == 'ボール':
            ball_count += 1    

        #3種類のSeriesをくっつけ、DataFrameに加える
        se = pd.concat([se_game, se_batterbox, se_ball])
        df = df.append(se, ignore_index=True)
    
    #次の打者が存在すれば、そのページへ
    #存在しなければ試合終了とみなし、データフレームを出力して終了
    is_next = bsObj.findAll("p", {"class": "next"})
    
    return df, is_next

In [5]:
def zone_n_cut(N, df):
    
    """
    ストライクゾーンを　N^2 個のゾーンに分割、
    ボールゾーンを含めると (N+2)^2 個のゾーンに分割し
    それぞれのゾーンに番号と名前を割り当てます
    
    入力  N : ストライクゾーンの分割数
             df : ['PlateLocHeight', 'PlateLocSide']の2つのカラムを含んだトラックマンデータのDF
             
    出力: df_zone_concat : 入力されたDFに['VertCut', 'HorzCut', 'ZoneNum', 'ZoneName']の4つのカラムを追加する
            <カラム詳細>
            VertCut : 縦方向にN分割した時、何番目のゾーンに属しているか。1〜(N+2)の値をとる
            HorzCut : 横方向にN分割した時、何番目のゾーンに属しているか。1〜(N+2)の値をとる
            ZoneNum : 右打者の内角高めから外角低めに向かって順に番号をつける。1〜(N+2)^2をとる。ストライクとボールの区別はつけない。(int型)
            ZoneName : ボールゾーンはB、ストライクゾーンはSを数字の前につけて区別した。
                                 それぞれ右打者の内角高めから外角低めに向かって順に番号が振られる(str型)
            
            
    ※注意 :  'PlateLocHeight', 'PlateLocSide'のどちらかがNaNの行は削除しています。
    """
    
    #ストライクゾーンの縦横閾値
    vert_stmin, vert_stmax = 20.0, 80.0
    horz_stmin, horz_stmax = 20.0, 80.0
    
    #ストライクゾーンの縦横長さ
    vert_length = vert_stmax - vert_stmin
    horz_length = horz_stmax - horz_stmin
    
    #長さをN分割し、１つのゾーンの縦横長さを求める
    vert_length_unit = vert_length / N
    horz_length_unit = horz_length / N
    
    #縦横ストライクゾーンの下限から1ゾーン分だけボールゾーンにずらしたものを、ボールゾーンの下限とする
    vert_min = vert_stmin - vert_length_unit
    horz_min = horz_stmin - horz_length_unit
    
    #縦横ストライクゾーンの上限から1ゾーン分だけボールゾーンにずらしたものを、ボールゾーンの上限とする
    vert_max = vert_stmax + vert_length_unit
    horz_max = horz_stmax + horz_length_unit
    
    #'PlateLocHeight', 'PlateLocSide'のいずれかに欠損値が含まれていたら、その行を削除
    df = df.dropna(subset=['PosY', 'PosX'], axis=0, how="any")
    
    #bin分割のため、座標を反転させる
    df_zone = pd.DataFrame()
    df_zone['PosYY'] = df['PosY']
    df_zone['PosXX'] = df['PosX']
    
    #縦横それぞれビン分割 → 作ってから気づいたけど、labelを反転させれば済む話だった。。
    df_zone['VertCut'] = pd.cut(df_zone['PosYY'], np.linspace(vert_min, vert_max, N+3), labels=[i for i in range(1, N+3)])
    df_zone['HorzCut'] = pd.cut(df_zone['PosXX'], np.linspace(horz_min, horz_max, N+3), labels=[i for i in range(1, N+3)])
    
    #'VertCut', 'HorzCut'のいずれかがNaNの行は削除
    df_zone_concat = pd.concat([df, df_zone], axis=1)
    df_zone_concat = df_zone_concat.dropna(subset=['VertCut', 'HorzCut'], axis=0, how="any")
    
    #VertCut, HorzCutのカテゴリ値をint型に変換
    df_zone_concat.VertCut = df_zone_concat.VertCut.astype(int)
    df_zone_concat.HorzCut = df_zone_concat.HorzCut.astype(int)
    
    #ゾーンナンバーをつける(型はintです, 右上から1〜(N+2)^2まで番号を振りました)
    df_zone_concat['ZoneNum'] = (df_zone_concat.VertCut - 1) * (N+2) + df_zone_concat.HorzCut
    
    #ストライクゾーンに名前をつける(型はstrです)
    query_str = '(VertCut not in [1, @N+2]) and (HorzCut not in [1, @N+2])'
    df_subset = df_zone_concat.query(query_str)
    strike_num = df_zone_concat['ZoneNum'] - (2 * df_zone_concat['VertCut'] + 2)
    df_zone_concat.loc[df_subset.index, 'ZoneName'] = "S" + strike_num.astype(str)
    
    #ボールゾーンに名前をつける(型はstrです)
    #高め
    query_str = 'VertCut == 1'
    df_subset = df_zone_concat.query(query_str)
    ball_high_num = df_zone_concat['ZoneNum']
    df_zone_concat.loc[df_subset.index, 'ZoneName'] = "B" + ball_high_num.astype(str)
    
    #右打者の内角側
    side_range = [i for i in range(2, N+2)]
    df_subset = df_zone_concat.query('(VertCut == @side_range) and (HorzCut == 1)')
    ball_in_num = df_zone_concat['ZoneNum'] - (3*(df_zone_concat['VertCut'] - 2))
    df_zone_concat.loc[df_subset.index, 'ZoneName'] = "B" + ball_in_num.astype(str)
    
    #右打者の外角側
    df_subset = df_zone_concat.query('(VertCut == @side_range) and (HorzCut == @N+2)')
    ball_out_num = df_zone_concat['ZoneNum'] - (3*(df_zone_concat['VertCut'] - 1))
    df_zone_concat.loc[df_subset.index, 'ZoneName'] = "B" + ball_out_num.astype(str)
    
    #低め
    df_subset = df_zone_concat.query('VertCut == @N+2')
    ball_low_num = df_zone_concat['ZoneNum'] - N*2
    df_zone_concat.loc[df_subset.index, 'ZoneName'] = "B" + ball_low_num.astype(str)
    
    

    #不必要なカラムを削除
    df_zone_concat = df_zone_concat.drop(['PosXX', 'PosYY'], axis=1)
    
    return df_zone_concat

In [6]:
"""# 指定した試合の全投球データを取得するプログラム

#取得したい試合のURL 
#start_page = '01101' #その試合の、一人目の打者のページ
start_url = 'https://baseball.sports.smt.docomo.ne.jp/result/games/live_' + date + game_num + '_' + '01101' + '.html#liveArea'


print('-------------------------------------------------------------------------------------------')
print('gameID : ' + str(date) + str(game_num) + ' の投球データを取得します。')

#試合情報の取得
df, se_game = get_game_data(start_url)
if df == -1:
    print('ページがありません。次の試合に移ります。')
    print('-------------------------------------------------------------------------------------------')
    continue

is_next = [start_url]
batterbox_count = 1

while True:
    if is_next:
        print(str(batterbox_count) + '打席目のデータを取得しています')
        if batterbox_count == 1:
            df, is_next = get_batterbox_data(start_url, df, se_game)
        else:
            next_url = 'https://baseball.sports.smt.docomo.ne.jp/result/games/' + is_next[0].find("a").get("href")
            df, is_next = get_batterbox_data(next_url, df, se_game)
        print('取得完了！')
        batterbox += 1
    else:
        #floatをintに変換
        df = df.astype({'AfterOutCount': int, 'PitchNo': int, 'BallCount': int, 'StrikeCount': int, 'RelSpeed': int})
        #ゾーン位置を計算
        df = zone_n_cut(3, df)
        #csvとして保存
        df.to_csv('/gamedata/' + str(se_game.GameDate) + '_' + str(se_game.HomeTeam) + '-' + str(se_game.AwayTeam) + '.csv'
                  
        #sql文に変換し、seriesに格納
        se_output = se_output.append("INSERT INTO ballinfo VALUES (" +     "'" + df.GameDate.astype(str) +  "', " + df.GameID.astype(str) + ", '" + df.HomeTeam.astype(str) + "', '" + df.AwayTeam.astype(str) + "', '" + df.PitcherName.astype(str) + "', '" + df.PitcherThrows.astype(str) + "', '" + df.PitcherTeam.astype(str) + "', '" + df.BatterName.astype(str) + "', '" + df.BatterSide.astype(str) + "', '" + df.BatterTeam.astype(str) + "', " + df.Inning.astype(str) + ", " + df.TopBottom.astype(str) + ", " + df.InningBatterCount.astype(str) + ", " + df.AfterOutCount.astype(str) + ", " + df.PitchNo.astype(str) + ", " + df.BallCount.astype(str) + ", " + df.StrikeCount.astype(str) + ", " + df.RelSpeed.astype(str) + ", '" + df.PitchType.astype(str) + "', " + df.PosX.astype(str) + ", " + df.PosY.astype(str) + ", '" + df.Event.astype(str) + "', " + df.VertCut.astype(str) +  ", " + df.HorzCut.astype(str) + ", " + df.ZoneNum.astype(str) + ", '" + df.ZoneName.astype(str) + "');" )
        print('gameID : ' + str(date) + str(game_num) + ' の全ての投球データの取得が完了しました。次の試合に移ります。')
        print('-------------------------------------------------------------------------------------------')
        break"""

'# 指定した試合の全投球データを取得するプログラム\n\n#取得したい試合のURL \n#start_page = \'01101\' #その試合の、一人目の打者のページ\nstart_url = \'https://baseball.sports.smt.docomo.ne.jp/result/games/live_\' + date + game_num + \'_\' + \'01101\' + \'.html#liveArea\'\n\n\nprint(\'-------------------------------------------------------------------------------------------\')\nprint(\'gameID : \' + str(date) + str(game_num) + \' の投球データを取得します。\')\n\n#試合情報の取得\ndf, se_game = get_game_data(start_url)\nif df == -1:\n    print(\'ページがありません。次の試合に移ります。\')\n    print(\'-------------------------------------------------------------------------------------------\')\n    continue\n\nis_next = [start_url]\nbatterbox_count = 1\n\nwhile True:\n    if is_next:\n        print(str(batterbox_count) + \'打席目のデータを取得しています\')\n        if batterbox_count == 1:\n            df, is_next = get_batterbox_data(start_url, df, se_game)\n        else:\n            next_url = \'https://baseball.sports.smt.docomo.ne.jp/result/games/\' + is_next[0].find("a").get("href")

In [7]:
#他に欲しいカラムは、打席に入った時のアウトカウント(前の打者とのアウトカウントの差、イベントの種類から求められそう)、ピッチャーの投げた球数 とか

In [8]:
#2019040205の28打席目でエラー
#→ macbookで、2019040205, 2019040206を個別で取得する

In [26]:
#取得したい試合日と試合No.(ここをいじる)
start_date = '20190418' #開幕戦から
end_date = '20190419' #現在(2019年9月09日)まで
game_num_list = ['01', '02', '03', '04', '05', '06'] #試合No.(01-06)
#game_num_list = ['05', '06']

In [27]:
#日付のイテレータを作る関数
def daterange(start_date, end_date):
    for n in range((end_date - start_date).days):
        yield start_date + timedelta(n)

In [28]:
start = datetime.strptime(start_date, '%Y%m%d')
end = datetime.strptime(end_date, '%Y%m%d')

In [29]:
#日付をリスト化する
date_list = []
for date in daterange(start, end):
    date_list.append(date.strftime('%Y%m%d')) 

In [30]:
#確認
date_list, game_num_list

(['20190416', '20190417', '20190418'], ['01', '02', '03', '04', '05', '06'])

In [31]:
#出力するseriesの生成 (できればヘッダーはカラム名に入れたい)
#se_output = pd.Series(["CREATE TABLE ballinfo(GameDate DATE, GameID INTEGER, HomeTeam TEXT, VisitorTeam TEXT, PitcherName TEXT, PitcherSide TEXT, PitcherTeam TEXT, BatterName TEXT, BatterSide TEXT, BatterTeam TEXT, Inning INTEGER, TopBottom INTEGER, InningBatterCount INTEGER, AfterOutCount INTEGER, PitchNo INTEGER, BallCount INTEGER, StrikeCount INTEGER, BallSpeed INTEGER, BallType TEXT, PosX FLOAT, PosY FLOAT, Result TEXT, VertCut INTEGER, HorzCut INTEGER, ZoneNum INTEGER, ZoneName TEXT);"])

In [32]:
#全ての試合の全投球データを取得
for date in date_list:
    #df_date = pd.DataFrame()
    #se_date = pd.Series()
    game_count = 0
    for game_num in game_num_list:
        game_count += 1
        # 指定した試合の全投球データを取得するプログラム

        #取得したい試合のURL 
        #start_page = '01101' #その試合の、一人目の打者のページ
        start_url = 'https://baseball.sports.smt.docomo.ne.jp/result/games/live_' + date + game_num + '_' + '01101' + '.html#liveArea'


        print('-------------------------------------------------------------------------------------------')
        print('gameID : ' + str(date) + str(game_num) + ' の投球データを取得します。')

        #試合情報の取得
        df, se_game = get_game_data(start_url)
        #ページがなければ、次の試合へ
        if type(se_game.HomeTeam) != str:
            game_count -= 1
            print('ページがありません。次の試合に移ります。')
            print('-------------------------------------------------------------------------------------------')
            continue

        is_next = [start_url]
        batterbox_count = 1

        while True:
            if is_next:
                print(str(batterbox_count) + '打席目のデータを取得しています')
                if batterbox_count == 1:
                    df, is_next = get_batterbox_data(start_url, df, se_game)
                else:
                    try:
                        next_url = 'https://baseball.sports.smt.docomo.ne.jp/result/games/' + is_next[0].find("a").get("href")
                        df, is_next = get_batterbox_data(next_url, df, se_game)
                    except AttributeError:
                        is_next = [] 
                        
                print('取得完了！')
                batterbox_count += 1
            else:
                #floatをintに変換
                df = df.astype({'AfterOutCount': int, 'PitchNo': int, 'BallCount': int, 'StrikeCount': int, 'RelSpeed': int})
                #ゾーン位置を計算
                df = zone_n_cut(3, df)
                #１試合のデータをcsvに保存
                print('試合データをCSVに書き出しています')
                df.to_csv('./game_csv/' + str(se_game.GameDate) + '_' + str(se_game.HomeTeam) + '-' + str(se_game.AwayTeam) + '.csv')
                #日にちごとのデータフレームに格納
                #df_date = df_date.append(df).reset_index(drop=True)
                print('書き出し完了!')

                #１試合のデータをsql文に変換し、csvに保存
                se = pd.Series( "INSERT INTO ballinfo VALUES (" + "'" + df.GameDate.astype(str) +  "', " + df.GameID.astype(str)\
                                                                         + ", '" + df.HomeTeam.astype(str) + "', '" + df.AwayTeam.astype(str)\
                                                                         + "', '" + df.PitcherName.astype(str) + "', '" + df.PitcherThrows.astype(str)\
                                                                         + "', '" + df.PitcherTeam.astype(str) + "', '" + df.BatterName.astype(str)\
                                                                         + "', '" + df.BatterSide.astype(str) + "', '" + df.BatterTeam.astype(str)\
                                                                         + "', " + df.Inning.astype(str) + ", " + df.TopBottom.astype(str)\
                                                                         + ", " + df.InningBatterCount.astype(str) + ", " + df.AfterOutCount.astype(str)\
                                                                         + ", " + df.PitchNo.astype(str) + ", " + df.BallCount.astype(str)\
                                                                         + ", " + df.StrikeCount.astype(str) + ", " + df.RelSpeed.astype(str)\
                                                                         + ", '" + df.PitchType.astype(str) + "', " + df.PosX.astype(str)\
                                                                         + ", " + df.PosY.astype(str) + ", '" + df.Event.astype(str)\
                                                                         + "', " + df.VertCut.astype(str) +  ", " + df.HorzCut.astype(str)\
                                                                         + ", " + df.ZoneNum.astype(str) + ", '" + df.ZoneName.astype(str) + "');")
                se.to_csv('./game_sql/' + str(se_game.GameDate) + '_' + str(se_game.HomeTeam) + '-' + str(se_game.AwayTeam) + '.csv', header=False, index=False)
                
                #日にちごとのseriesに格納
                #se_date = se_date.append(se).reset_index(drop=True)
                
                print('gameID : ' + str(date) + str(game_num) + ' の全ての投球データの取得が完了しました。次の試合に移ります。')
                print('-------------------------------------------------------------------------------------------')
                break
                
    #print(str(se_game.GameDate) + 'の全ての試合のデータを書き出しています。')
    #df_date.to_csv('./date_csv/' + se_game.GameDate + '_' + str(game_count) + '.csv')
    #se_date.to_csv('./date_sql/' + se_game.GameDate + '_' + str(game_count) + '.csv', header=False, index=False)
    #print('書き出し完了!')

-------------------------------------------------------------------------------------------
gameID : 2019041601 の投球データを取得します。
1打席目のデータを取得しています
取得完了！
2打席目のデータを取得しています
取得完了！
3打席目のデータを取得しています
取得完了！
4打席目のデータを取得しています
取得完了！
5打席目のデータを取得しています
取得完了！
6打席目のデータを取得しています
取得完了！
7打席目のデータを取得しています
取得完了！
8打席目のデータを取得しています
取得完了！
9打席目のデータを取得しています
取得完了！
10打席目のデータを取得しています
取得完了！
11打席目のデータを取得しています
取得完了！
12打席目のデータを取得しています
取得完了！
13打席目のデータを取得しています
取得完了！
14打席目のデータを取得しています
取得完了！
15打席目のデータを取得しています
取得完了！
16打席目のデータを取得しています
取得完了！
17打席目のデータを取得しています
取得完了！
18打席目のデータを取得しています
取得完了！
19打席目のデータを取得しています
取得完了！
20打席目のデータを取得しています
取得完了！
21打席目のデータを取得しています
取得完了！
22打席目のデータを取得しています
取得完了！
23打席目のデータを取得しています
取得完了！
24打席目のデータを取得しています
取得完了！
25打席目のデータを取得しています
取得完了！
26打席目のデータを取得しています
取得完了！
27打席目のデータを取得しています
取得完了！
28打席目のデータを取得しています
取得完了！
29打席目のデータを取得しています
取得完了！
30打席目のデータを取得しています
取得完了！
31打席目のデータを取得しています
取得完了！
32打席目のデータを取得しています
取得完了！
33打席目のデータを取得しています
取得完了！
34打席目のデータを取得しています
取得完了！
35打席目のデータを取得しています
取得完了！
36打席目のデータを取得しています
取得完了！
37打席目のデータを取得しています
取

取得完了！
71打席目のデータを取得しています
取得完了！
72打席目のデータを取得しています
取得完了！
73打席目のデータを取得しています
取得完了！
74打席目のデータを取得しています
取得完了！
75打席目のデータを取得しています
取得完了！
76打席目のデータを取得しています
取得完了！
77打席目のデータを取得しています
取得完了！
78打席目のデータを取得しています
取得完了！
79打席目のデータを取得しています
取得完了！
80打席目のデータを取得しています
取得完了！
81打席目のデータを取得しています
取得完了！
82打席目のデータを取得しています
取得完了！
83打席目のデータを取得しています
取得完了！
84打席目のデータを取得しています
取得完了！
85打席目のデータを取得しています
取得完了！
試合データをCSVに書き出しています
書き出し完了!
gameID : 2019041604 の全ての投球データの取得が完了しました。次の試合に移ります。
-------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------
gameID : 2019041605 の投球データを取得します。
1打席目のデータを取得しています
取得完了！
2打席目のデータを取得しています
取得完了！
3打席目のデータを取得しています
取得完了！
4打席目のデータを取得しています
取得完了！
5打席目のデータを取得しています
取得完了！
6打席目のデータを取得しています
取得完了！
7打席目のデータを取得しています
取得完了！
8打席目のデータを取得しています
取得完了！
9打席目のデータを取得しています
取得完了！
10打席目のデータを取得しています
取得完了！
11打席目のデータを取得しています
取得完了！
12打席目のデータを取得しています
取得完了！
13打席目のデータを取得しています
取得完了！
14打席目のデータを取得しています
取得完了！
15打席目のデータを取

取得完了！
74打席目のデータを取得しています
取得完了！
75打席目のデータを取得しています
取得完了！
76打席目のデータを取得しています
取得完了！
77打席目のデータを取得しています
取得完了！
78打席目のデータを取得しています
取得完了！
79打席目のデータを取得しています
取得完了！
80打席目のデータを取得しています
取得完了！
81打席目のデータを取得しています
取得完了！
82打席目のデータを取得しています
取得完了！
83打席目のデータを取得しています
取得完了！
84打席目のデータを取得しています
取得完了！
85打席目のデータを取得しています
取得完了！
86打席目のデータを取得しています
取得完了！
87打席目のデータを取得しています
取得完了！
88打席目のデータを取得しています
取得完了！
89打席目のデータを取得しています
取得完了！
90打席目のデータを取得しています
取得完了！
91打席目のデータを取得しています
取得完了！
92打席目のデータを取得しています
取得完了！
試合データをCSVに書き出しています
書き出し完了!
gameID : 2019041702 の全ての投球データの取得が完了しました。次の試合に移ります。
-------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------
gameID : 2019041703 の投球データを取得します。
1打席目のデータを取得しています
取得完了！
2打席目のデータを取得しています
取得完了！
3打席目のデータを取得しています
取得完了！
4打席目のデータを取得しています
取得完了！
5打席目のデータを取得しています
取得完了！
6打席目のデータを取得しています
取得完了！
7打席目のデータを取得しています
取得完了！
8打席目のデータを取得しています
取得完了！
9打席目のデータを取得しています
取得完了！
10打席目のデータを取得しています
取得完了！
11打席目のデータを取

取得完了！
69打席目のデータを取得しています
取得完了！
70打席目のデータを取得しています
取得完了！
71打席目のデータを取得しています
取得完了！
72打席目のデータを取得しています
取得完了！
73打席目のデータを取得しています
取得完了！
74打席目のデータを取得しています
取得完了！
75打席目のデータを取得しています
取得完了！
76打席目のデータを取得しています
取得完了！
77打席目のデータを取得しています
取得完了！
試合データをCSVに書き出しています
書き出し完了!
gameID : 2019041706 の全ての投球データの取得が完了しました。次の試合に移ります。
-------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------
gameID : 2019041801 の投球データを取得します。
1打席目のデータを取得しています
取得完了！
2打席目のデータを取得しています
取得完了！
3打席目のデータを取得しています
取得完了！
4打席目のデータを取得しています


Exception ignored in: <function Service.__del__ at 0x105f97710>
Traceback (most recent call last):
  File "/Users/Taira/Python_venv/analytics/lib/python3.7/site-packages/selenium/webdriver/common/service.py", line 171, in __del__
    def __del__(self):
KeyboardInterrupt


MaxRetryError: HTTPConnectionPool(host='127.0.0.1', port=52634): Max retries exceeded with url: /session/17704bf30c761be6aa91bfa9dd76ebc9/url (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x41c51a810>: Failed to establish a new connection: [Errno 61] Connection refused'))