# import

In [None]:
import numpy as np
import pandas as pd
import pandas.tseries.offsets as offsets
import datetime as dt
import time
import importlib
import logging
from retry import retry
#import traceback
#from retrying import retry
from sqlalchemy import create_engine
from sqlalchemy.types import Date, Integer, Float, Text
# from sqlalchemy.types import Integer
# from sqlalchemy.types import Text

import stock

In [None]:
importlib.reload(stock)

In [None]:
# pandas の最大表示列数を設定 (max_rows で表示行数の設定も可能)
pd.set_option('display.max_columns', 30)

# MySQLに接続

In [None]:
sql = stock.sql()

In [None]:
help(sql)

# 上場一覧から各種テーブルを作成 (メインはyahoo_stock_table)

In [None]:
file_month = 1712

In [None]:
# 東証のエクセルファイルを読み込む # http://www.jpx.co.jp/markets/statistics-equities/misc/01.html
all_stock_table = pd.read_excel('/Users/Really/Stockyard/_dl_data/data_j_{0}.xls'.format(file_month))
all_stock_table.columns = ['date', 'code', 'name', 'market', 'code_33', 'category_33', 'code_17', 'category_17', 'code_scale', 'scale'] # 列名を変更

In [None]:
all_stock_table

In [None]:
# marketの種別で集計
all_stock_table.groupby('market').count()

In [None]:
# 上場一覧のテーブル保存
all_stock_table.to_csv('/Users/Really/Stockyard/_csv/all_stock_table.csv')
sql.write_table('all_stock_table', all_stock_table)
# all_stock_table.to_sql('all_stock_table', engine, if_exists='replace')

In [None]:
# PRO Marketを除いたテーブルの作成 (YahooにはPRO Marketのデータはない)
yahoo_stock_table = all_stock_table.ix[~all_stock_table['market'].str.contains('PRO Market')].reset_index(drop=True)

In [None]:
yahoo_stock_table

In [None]:
# PRO Marketを除いたテーブルの保存
yahoo_stock_table.to_csv('/Users/Really/Stockyard/_csv/yahoo_stock_table.csv')
sql.write_table('yahoo_stock_table', yahoo_stock_table)
# yahoo_stock_table.to_sql('yahoo_stock_table', engine, if_exists='replace')

In [None]:
# 内国株のテーブル作成
domestic_stock_table = all_stock_table.ix[all_stock_table['market'].str.contains('内国株')].reset_index(drop=True)

In [None]:
domestic_stock_table

In [None]:
# 内国株のテーブル保存
domestic_stock_table.to_csv('/Users/Really/Stockyard/_csv/domestic_stock_table.csv')
sql.write_table('domestic_stock_table', domestic_stock_table)
# domestic_stock_table.to_sql('domestic_stock_table', engine, if_exists='replace')

In [None]:
# 内国株, PRO Market 以外のテーブル作成
ex_stock_table = yahoo_stock_table[~yahoo_stock_table['code'].isin(domestic_stock_table['code'])].reset_index(drop=True)

# 正規表現を使った書き方の例。
# ex_stock_table = all_stock_table.ix[all_stock_table['market'].str.contains('[^内国株）PRO Market]...$')].reset_index(drop=True)
# 文字列末尾の合致検索では、'$' の前の '.' の数で検索する文字数 ('.' * n + '$') が決定されているっぽい。
# つまりこの場合だと 'PRO Market' で実際に合致が確認されているのは末尾4文字の 'rket' 。
# '内国株）', 'PRO Market' をそれぞれグループ化するために' ()' で括る必要はないみたい。(ただし括っても同じ結果になる) 

# 下の書き方だと最後の1文字しか見ないことになるので、外国株も除外されてしまう。
# ex_stock_table = all_stock_table.ix[all_stock_table['market'].str.contains('[^内国株）PRO Market]$')].reset_index(drop=True)
# 上はつまり下の書き方と同じこと。
# ex_stock_table = all_stock_table.ix[all_stock_table['market'].str.contains('[^）t]$')].reset_index(drop=True)

In [None]:
ex_stock_table

In [None]:
# marketの種別で集計
ex_stock_table.groupby('market').count()

In [None]:
# 内国株, PRO Market 以外のテーブル保存
ex_stock_table.to_csv('/Users/Really/Stockyard/_csv/ex_stock_table.csv')
sql.write_table('ex_stock_table', ex_stock_table)
# ex_stock_table.to_sql('ex_stock_table', engine, if_exists='replace')

In [None]:
# 外国株のテーブル作成
foreign_stock_table = all_stock_table.ix[all_stock_table['market'].str.contains('外国株')].reset_index(drop=True)

In [None]:
foreign_stock_table

In [None]:
# 外国株のテーブル保存
foreign_stock_table.to_csv('/Users/Really/Stockyard/_csv/foreign_stock_table.csv')
sql.write_table('foreign_stock_table', foreign_stock_table)

In [None]:
# 型の確認
pd.DataFrame([
    sql.read_table('all_stock_table').dtypes,
    sql.read_table('yahoo_stock_table').dtypes,
    sql.read_table('domestic_stock_table').dtypes,
    sql.read_table('ex_stock_table').dtypes,
    sql.read_table('foreign_stock_table').dtypes],
    index=['all', 'yahoo', 'domestic', 'ex', 'foreign'])

# 上場一覧の更新

## 新旧ファイルの読み込み

In [None]:
file_month = 1712

In [None]:
# 東証のエクセルファイルを読み込む # http://www.jpx.co.jp/markets/statistics-equities/misc/01.html
new_stock_table = pd.read_excel('/Users/Really/Stockyard/_dl_data/data_j_{0}.xls'.format(file_month))
new_stock_table.columns = ['date', 'code', 'name', 'market', 'code_33', 'category_33', 'code_17', 'category_17', 'code_scale', 'scale'] # 列名を変更

In [None]:
new_stock_table

In [None]:
new_stock_table.dtypes

In [None]:
# 旧テーブルの読み込み # http://www.jpx.co.jp/markets/statistics-equities/misc/01.html
old_stock_table = pd.read_excel('/Users/Really/Stockyard/_dl_data/data_j_{0}.xls'.format(file_month - 1))
old_stock_table.columns = ['date', 'code', 'name', 'market', 'code_33', 'category_33', 'code_17', 'category_17', 'code_scale', 'scale'] # 列名を変更

In [None]:
old_stock_table

In [None]:
old_stock_table.dtypes

## 新規上場銘柄

In [None]:
# 新規上場銘柄のテーブル作成
new_added = new_stock_table[~new_stock_table['code'].isin(old_stock_table['code'])].reset_index(drop=True)

In [None]:
new_added

In [None]:
# 新規上場銘柄のテーブル保存
new_added.to_csv('/Users/Really/Stockyard/_csv/new_added_stock_table.csv')
sql.write_table('new_added_stock_table', new_added)
# new_added.to_sql('new_added', engine, if_exists='replace')

In [None]:
# 新規上場銘柄の履歴テーブルの読み込み
saved_added = sql.read_table('added_stock_table')

In [None]:
saved_added

In [None]:
saved_added.dtypes

In [None]:
# 新旧テーブルの連結
added_stock_table = saved_added.append(new_added).reset_index(drop=True)

In [None]:
added_stock_table

In [None]:
added_stock_table.dtypes

In [None]:
# 新規上場銘柄の履歴テーブル保存
added_stock_table.to_csv('/Users/Really/Stockyard/_csv/added_stock_table.csv')
sql.write_table('added_stock_table', added_stock_table)
# added_stock_table.to_sql('added_stock_table', engine, if_exists='replace')

## 上場廃止銘柄

In [None]:
# 上場廃止銘柄のテーブル作成
new_discontinued = old_stock_table[~old_stock_table['code'].isin(new_stock_table['code'])].reset_index(drop=True)

In [None]:
new_discontinued

In [None]:
# 上場廃止銘柄の履歴テーブルの読み込み
saved_discontinued = sql.read_table('discontinued_stock_table')

In [None]:
saved_discontinued

In [None]:
saved_discontinued.dtypes

In [None]:
# 新旧テーブルの連結
discontinued_stock_table = saved_discontinued.append(new_discontinued).reset_index(drop=True)

In [None]:
discontinued_stock_table

In [None]:
discontinued_stock_table.dtypes

In [None]:
# 上場廃止銘柄のテーブル保存
discontinued_stock_table.to_csv('/Users/Really/Stockyard/_csv/discontinued_stock_table.csv')
sql.write_table('discontinued_stock_table', discontinued_stock_table)
# discontinued_stock_table.to_sql('discontinued_stock_table', engine, if_exists='replace')

# 連続読み込み用コードリストの作成例

## yahoo 連続読み込み用コードリスト作成

In [None]:
start_index = 3100
increase_number = 100
end_index = start_index + increase_number

reading_code = sql.get_yahoo_stock_code(start_index, end_index)
print(reading_code[-10:])
print('Next start from {0}'.format(start_index + increase_number))

## 新規銘柄読み込み用コードリスト作成

In [None]:
reading_code = sql.get_new_added_stock_code()
reading_code

# クラス不使用版コード

## MySQLに接続

In [None]:
db_settings = {
    "host": 'localhost',
    "database": 'StockPrice_Yahoo_1',
    "user": 'user',
    "password": 'password',
    "port":'3306'
}
engine = create_engine('mysql://{user}:{password}@{host}:{port}/{database}'.format(**db_settings))

## 読み込む内国株のコードリスト作成 (クラス不使用版)

In [None]:
# 内国株だけにする
# MySQLに保存済みの内国株テーブルから作成。今後はこちらを使用する
yahoo_stock_table = pd.read_sql_table('yahoo_stock_table', engine, index_col=None).drop('index', axis=1)

start_index = 2810
increase_number = 10
end_index = start_index + increase_number

reading_code = list(yahoo_stock_table['code'][start_index : end_index])
print(reading_code[-10:])
print('Next start from {0}'.format(start_index + increase_number))