<a href="https://colab.research.google.com/github/Re14m/training/blob/master/2022-0628_recipie322.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# [Pythonのスクレイピングにより定期的にソフトバンクの株価を取得するレシピ](https://axross-recipe.com/recipes/322)

## 環境準備

In [None]:
from google.colab import drive
drive.mount("/content/drive/")

## Pythonのウォーミングアップ2 requests, BeautifulSoup, time library

In [None]:
# requests
import requests 
URL = 'https://finance.yahoo.co.jp/' 
response = requests.get(URL) 
#200ならok,404なら存在しないページなど
print(response.status_code)
#実際に送られてきたデータ
print(response.text)

In [None]:
# BeautiflSoup
import requests 
from bs4 import BeautifulSoup
URL = 'https://finance.yahoo.co.jp/' 
html = requests.get(URL).text
soup = BeautifulSoup(html,"html5lib")

tag = soup.find_all("a")

print(tag[0])
print(tag[1])
print(tag[2].text)

In [None]:
# time library
import time
time.sleep(5)
print(time.localtime(time.time()))

## Pythonのウォーミングアップ3 - yfinance module

In [None]:
# パッケージのインストール
!pip install yfinance

## 手順1 共通

In [None]:
# パッケージのインストール
import requests
from bs4 import BeautifulSoup
from time import sleep

## 手順2 idの特定が可能な場合

In [None]:
# URLの概要detailを取得
import requests
from bs4 import BeautifulSoup
from time import sleep

if __name__ == '__main__':
    #ソフトバンクの株価を表すURL
    url = "https://finance.yahoo.co.jp/quote/9434.T"
    #htmlのみを取り入れるために、.textを追加
    html = requests.get(url).text
    #BeautifulSoupでデータのparsing
    soup = BeautifulSoup(html,"html5lib")
    #'detail'のidを持っているtag全てをリストの形式で返還する.select()関数を利用。[0]は最初の要素を意味する。
    detail = soup.select('#detail')[0]
    print(detail)
    #データの中で、tagをなくして、テキストのみを確認する場合
    print(detail.text)

## 手順3 idの特定不可能=一般的な場合

In [None]:
# URLの概要detailを取得
import requests
from bs4 import BeautifulSoup
from time import sleep

if __name__ == '__main__':
    #ソフトバンクの株価を表すURL
    url = "https://finance.yahoo.co.jp/quote/9434.T"
    #htmlのみを取り入れるために、.textを追加
    html = requests.get(url).text
    #BeautifulSoupでデータのparsing
    soup = BeautifulSoup(html,"html5lib")
    #条件を満たすtag全てをリストの形式で返還する.select()関数を利用。[0]は最初の要素を意味する。
    closingprice = soup.select("#detail > section._2Yx3YP9V._3v4W38Hq > div > ul > li:nth-of-type(1) > dl > dd > span._1fofaCjs._2aohzPlv._1DMRub9m > span")[0]

    print("ソフトバンク")
    #データの中で、tagをなくして、テキストのみを確認する場合
    print("前日終値　" +closingprice.text)

## 手順4 定期的に株価を確認したい場合

In [None]:
import requests
from bs4 import BeautifulSoup
from time import sleep

def get_current_price(url):
    html = requests.get(url).text
    soup = BeautifulSoup(html,"html5lib")
    #"#detail > section._2Yx3YP9V._3v4W38Hq > div > ul > li:nth-child(1) > dl > dd > span._1fofaCjs._2aohzPlv._1DMRub9m > span"
    realtimeprice = soup.select("#root > main > div > div > div.XuqDlHPN > div:nth-of-type(2) > section._1zZriTjI._2l2sDX5w > div._1nb3c4wQ > header > div.nOmR5zWz > span > span")[0]
    return realtimeprice

def get_closing_price(url):
    html = requests.get(url).text
    soup = BeautifulSoup(html,"html5lib")
    #"#detail > section._2Yx3YP9V._3v4W38Hq > div > ul > li:nth-child(1) > dl > dd > span._1fofaCjs._2aohzPlv._1DMRub9m > span"
    closingprice = soup.select("#detail > section._2Yx3YP9V._3v4W38Hq > div > ul > li:nth-of-type(1) > dl > dd > span._1fofaCjs._2aohzPlv._1DMRub9m > span")[0]
    return closingprice

if __name__ == '__main__':
    url = "https://finance.yahoo.co.jp/quote/9434.T"
    closingprice = get_closing_price(url)
    print("ソフトバンク")
    print("前日終値　" +closingprice.text)

    while(True):
        realtimeprice = get_current_price(url)
        print("リアルタイム株価　" +realtimeprice.text)
        sleep(10)

## おまけ apiの活用

In [None]:
import requests
from bs4 import BeautifulSoup
import yfinance as yf
from time import sleep

#最後に更新されたデータを提供
def get_current_price(symbol):
    ticker = yf.Ticker(symbol)
    todays_data = ticker.history(period='1d')
    return todays_data['Close'][0]

#https://finance.yahoo.com/
#ソフトバンクグループSFTBY
#ソフトバンクSOBKY
msft = yf.Ticker("SOBKY")

while(True):
    realtimeprice = get_current_price('SOBKY')
    print("リアルタイム株価（$）　" +str(realtimeprice))
    sleep(10)