In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np
import time
import re
import camelot
import tabula
import warnings
import codecs
import math

warnings.simplefilter('ignore', UserWarning)
pd.set_option('display.max_rows', 100)
codecs.register_error('none', lambda e: ('', e.end))

Duplicate key in file WindowsPath('C:/ProgramData/Anaconda3/lib/site-packages/matplotlib/mpl-data/matplotlibrc'), line 250 ('font.family: IPAexGothic')



# 全銘柄PDFデータ抽出の流れ

各銘柄のバランスシート上のデータ（流動資産など）をPDFから、PDF表抽出ライブラリーにより抽出する。<br>
※バランスシートのデータを記載しているWebページが存在しないため、各企業の決算短信のPDFからバランスシートの表を抽出してスクレイピングするしかない。<br><br>


PDF表抽出ライブラリーは、camelotとtabulaの2種類がある。それぞれ抽出できない銘柄がいくつか存在する。<br>
camelotの方が抽出できる銘柄が多いので、camelotで抽出後、残りをtabulaで抽出する。<br>
手順1：camelotで抽出（取込エラーが出た銘柄は全て③tabulaでの抽出にまわす）<br>
　　　→取込が出来た銘柄一覧の表を作成<br>
　　　→余分な文字が多数含まれているので、値の加工を行う<br>
　　　→取込エラーが出ずにPDFの読み込みには成功したものの、十分なデータが抽出できなかった銘柄に対して、<br>
　　　　<b>削除銘柄</b>(十分にデータが抽出できていない銘柄)と<br>
　　　　<b>再抽出銘柄</b>(取込時のコードを変えればうまく抽出できそうな銘柄)の選別<br>
　　　→削除銘柄と再抽出銘柄を表から削除する（再抽出銘柄は②で再抽出する）<br>
手順2：camelotで再抽出銘柄のデータを再抽出<br>
　　　→取込が出来た銘柄一覧の表を作成<br>
　　　→余分な文字が多数含まれているので、値の加工を行う<br>
　　　→十分にデータが抽出できていない銘柄を表から削除する<br>
手順3：tabulaで抽出<br>
　　　→取込が出来た銘柄一覧の表を作成<br>
　　　→余分な文字が多数含まれているので、値の加工を行う<br>
　　　→十分にデータが抽出できていない銘柄を表から削除する<br>
手順4：以上で抽出した手順1、手順2、手順3のデータを結合して完成<br>
手順5：結合したデータのMySQLへの取込み

In [2]:
#手順1：camelotで抽出
def get_pdf_camelot(start_url, code):
    #time.sleep(1)
    response = requests.get(start_url)
    soup = BeautifulSoup(response.content, 'html.parser')
    if 'リクエストされたページがみつかりませんでした' in soup.text:
        print('東証以外の銘柄のため、PDF見つからず')
        pass
    else:
        table = soup.find('table', attrs={'class': 'Quote'})
        try:
            #訂正があった場合でも、訂正前のPDFを取得する
            for i in range(0, 5):
                if '訂正' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text\
                or '補足' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text:
                    pass
                else:
                    target_pdf = table.find_all('td', text = re.compile('.*決算短信.*'))[i].find('a').get('href')
                    break
        #最近上場した企業は、決算短信がまだ存在しない
        except Exception as e:
                print('決算短信が存在しない')
                print(e)
                print('\n')
                return 
        try:
            tables = camelot.read_pdf(target_pdf, flavor='stream', pages = '4-end', table_areas=['0,800,700,0'])
            get_features_camelot(tables, code)

        except Exception as e:
            tabula_dict[code] = e
            print('取込エラー')
            print(e)
            print('\n')
            pass

def get_features_camelot(tables, code):
    feature_list = ['流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', '投資有価証券', 
                '投資その他の資産合計', '流動負債合計', '固定負債合計']
    df_elements = []
    feature_remove_list = []
    count_tables = 0
    for table in tables:
        df_tbl = table.df
        for feature in feature_list:
            if len(df_tbl[df_tbl.iloc[:,0] == feature]) == 1:
                #資産と負債が違うテーブルのため、df_element1の列がずれる場合がある
                #特徴量と値だけの1行2列のデータフレームを作成
                df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-1]]
                #後のconcatで列がずれないようにするため、値の列の名前が違うため1に統一する
                df_element2 = df_element1.rename(columns={df_element1.columns[1]: 1})
                df_elements.append(df_element2)
                #資産と負債のテーブルが2つある銘柄がある（連結と単独のテーブル）
                #同じ特徴量を2回取得することを避けるため、一度入れた特徴量は削除リストに登録
                feature_remove_list.append(feature)
        #テーブル処理が1つ終わったら、削除リストに登録された特徴量を元のリストから削除する
        if len(feature_remove_list) != 0:
            for feature_remove in feature_remove_list:
                feature_list.remove(feature_remove)
            feature_remove_list = []

    df_all1 = pd.concat(df_elements).T
    df_all2 = pd.DataFrame([list(df_all1.iloc[1,:])], columns=df_all1.iloc[0,:],)  
    df_all2['code'] = code
    dfs_concat_camelot(df_all2)
    
    
def dfs_concat_camelot(df_all2):
    global df_camelot1
    df_camelot1 = pd.concat([df_camelot1, df_all2], axis=0)

In [3]:
#手順1：camelotで取り込む銘柄コードと、空データフレームの作成
codes = pd.read_csv('全銘柄Webデータ（完成）.csv', encoding=("cp932"), header=0).iloc[:, 0]
df_camelot1 = pd.DataFrame()
tabula_dict = {}

In [4]:
#手順1：camelotでPDFから特徴量をDataFrameへ記入　※8時間くらいかかる
'''
・取込エラー
    Invalid dictionary construct: [/'Type', ...　→　camelotではデータ抽出できないのが、tabulaで抽出できる可能性が高い
    only algorithm code 1 and 2 are supported　→　データ抽出できないPDFである可能性が非常に高い
    No objects to concatenate　→　データ抽出できないPDFである可能性が高い
・決算短信が存在しない
    'NoneType' object has no attribute 'find'　→　上場したてで、決算短信のPDFがまだ存在しない
・東証以外の銘柄のため、PDF見つからず
    東証(東証1部・東証2部・JSQ・マザーズ)以外はPDFが取得できない
'''

for i in range(0, len(codes)):
    code = codes[i]
    start_url = 'http://ke.kabupro.jp/code/{}.htm'.format(code)
    print(start_url, 'i=', i)
    get_pdf_camelot(start_url, code)

http://ke.kabupro.jp/code/1301.htm i= 0
http://ke.kabupro.jp/code/1332.htm i= 1
http://ke.kabupro.jp/code/1333.htm i= 2
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/1352.htm i= 3
http://ke.kabupro.jp/code/1375.htm i= 4
http://ke.kabupro.jp/code/1376.htm i= 5
http://ke.kabupro.jp/code/1377.htm i= 6
http://ke.kabupro.jp/code/1379.htm i= 7
http://ke.kabupro.jp/code/1380.htm i= 8
http://ke.kabupro.jp/code/1381.htm i= 9
http://ke.kabupro.jp/code/1382.htm i= 10
http://ke.kabupro.jp/code/1383.htm i= 11
http://ke.kabupro.jp/code/1384.htm i= 12
http://ke.kabupro.jp/code/1400.htm i= 13
http://ke.kabupro.jp/code/1401.htm i= 14
http://ke.kabupro.jp/code/1407.htm i= 15
http://ke.kabupro.jp/code/1413.htm i= 16
http://ke.kabupro.jp/code/1414.htm i= 17
http://ke.kabupro.jp/code/1417.htm i= 18
http://ke.kabupro.jp/co

http://ke.kabupro.jp/code/1850.htm i= 115
http://ke.kabupro.jp/code/1852.htm i= 116
http://ke.kabupro.jp/code/1853.htm i= 117
http://ke.kabupro.jp/code/1860.htm i= 118
http://ke.kabupro.jp/code/1861.htm i= 119
http://ke.kabupro.jp/code/1866.htm i= 120
http://ke.kabupro.jp/code/1867.htm i= 121
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:16>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/1869.htm i= 122
http://ke.kabupro.jp/code/1870.htm i= 123
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:17>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/1871.htm i= 124
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObj

http://ke.kabupro.jp/code/2173.htm i= 234
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2174.htm i= 235
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/2175.htm i= 236
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/2176.htm i= 237
http://ke.kabupro.jp/code/2178.htm i= 238
http://ke.kabupro.jp/code/2179.htm i= 239
http://ke.kabupro.jp/code/2180.htm i= 240
http://ke.kabupro.jp/code/2181.htm i= 241
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2183.htm i= 242
http://ke.kabupro.jp/code/2185.htm i= 243
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFon

http://ke.kabupro.jp/code/2398.htm i= 334
http://ke.kabupro.jp/code/2402.htm i= 335
http://ke.kabupro.jp/code/2404.htm i= 336
http://ke.kabupro.jp/code/2406.htm i= 337
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/2408.htm i= 338
http://ke.kabupro.jp/code/2410.htm i= 339
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2411.htm i= 340
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/2412.htm i= 341
http://ke.kabupro.jp/code/2413.htm i= 342
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:17>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2415.htm i= 343
http://ke.kabupro.jp/code/2418.htm i= 344
http://ke.kabupro.jp/c

http://ke.kabupro.jp/code/2692.htm i= 430
http://ke.kabupro.jp/code/2693.htm i= 431
http://ke.kabupro.jp/code/2694.htm i= 432
http://ke.kabupro.jp/code/2695.htm i= 433
http://ke.kabupro.jp/code/2698.htm i= 434
http://ke.kabupro.jp/code/2700.htm i= 435
http://ke.kabupro.jp/code/2702.htm i= 436
http://ke.kabupro.jp/code/2705.htm i= 437
http://ke.kabupro.jp/code/2706.htm i= 438
http://ke.kabupro.jp/code/2708.htm i= 439
http://ke.kabupro.jp/code/2715.htm i= 440
http://ke.kabupro.jp/code/2721.htm i= 441
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2722.htm i= 442
http://ke.kabupro.jp/code/2726.htm i= 443
http://ke.kabupro.jp/code/2729.htm i= 444
http://ke.kabupro.jp/code/2730.htm i= 445
http://ke.kabupro.jp/code/2733.htm i= 446
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"

取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2932.htm i= 539
http://ke.kabupro.jp/code/2933.htm i= 540
http://ke.kabupro.jp/code/2970.htm i= 541
http://ke.kabupro.jp/code/2974.htm i= 542
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/2975.htm i= 543
http://ke.kabupro.jp/code/2976.htm i= 544
http://ke.kabupro.jp/code/2978.htm i= 545
http://ke.kabupro.jp/code/2980.htm i= 546
http://ke.kabupro.jp/code/2981.htm i= 547
http://ke.kabupro.jp/code/2982.htm i= 548
http://ke.kabupro.jp/code/2983.htm i= 549
http://ke.kabupro.jp/code/2986.htm i= 550
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\

http://ke.kabupro.jp/code/3191.htm i= 672
http://ke.kabupro.jp/code/3192.htm i= 673
http://ke.kabupro.jp/code/3193.htm i= 674
http://ke.kabupro.jp/code/3195.htm i= 675
http://ke.kabupro.jp/code/3196.htm i= 676
http://ke.kabupro.jp/code/3197.htm i= 677
http://ke.kabupro.jp/code/3198.htm i= 678
http://ke.kabupro.jp/code/3199.htm i= 679
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3201.htm i= 680
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3202.htm i= 681
http://ke.kabupro.jp/code/3204.htm i= 682
http://ke.kabupro.jp/code/3205.htm i= 683
http://ke.kabupro.jp/code/3221.htm i= 684
http://ke.kabupro.jp/code/3222.htm i= 

http://ke.kabupro.jp/code/3442.htm i= 794
http://ke.kabupro.jp/code/3443.htm i= 795
http://ke.kabupro.jp/code/3444.htm i= 796
http://ke.kabupro.jp/code/3445.htm i= 797
http://ke.kabupro.jp/code/3446.htm i= 798
http://ke.kabupro.jp/code/3447.htm i= 799
http://ke.kabupro.jp/code/3449.htm i= 800
http://ke.kabupro.jp/code/3452.htm i= 801
http://ke.kabupro.jp/code/3454.htm i= 802
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3457.htm i= 803
http://ke.kabupro.jp/code/3458.htm i= 804
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3461.htm i= 805
http://ke.kabupro.jp/code/3464.htm i= 806
http://ke.kabupro.jp/code/3465.htm i= 

取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3608.htm i= 875
http://ke.kabupro.jp/code/3611.htm i= 876
http://ke.kabupro.jp/code/3612.htm i= 877
http://ke.kabupro.jp/code/3622.htm i= 878
http://ke.kabupro.jp/code/3623.htm i= 879
http://ke.kabupro.jp/code/3624.htm i= 880
http://ke.kabupro.jp/code/3625.htm i= 881
http://ke.kabupro.jp/code/3626.htm i= 882
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3627.htm i= 883
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3768.htm i= 963
http://ke.kabupro.jp/code/3769.htm i= 964
http://ke.kabupro.jp/code/3770.htm i= 965
http://ke.kabupro.jp/code/3771.htm i= 966
http://ke.kabupro.jp/code/3772.htm i= 967
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3773.htm i= 968
http://ke.kabupro.jp/code/3774.htm i= 969
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/3775.htm i= 970
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3776.htm i= 971
http://ke.kabupro.jp/code/3777.htm i= 972
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/3778.htm i= 973
http://ke.kabupro.jp/code/3779.htm i= 

http://ke.kabupro.jp/code/3917.htm i= 1050
http://ke.kabupro.jp/code/3918.htm i= 1051
http://ke.kabupro.jp/code/3919.htm i= 1052
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3920.htm i= 1053
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3921.htm i= 1054
http://ke.kabupro.jp/code/3922.htm i= 1055
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/3923.htm i= 1056
http://ke.kabupro.jp/code/3924.htm i= 1057
http://ke.kabupro.jp/code/3925.h

http://ke.kabupro.jp/code/4023.htm i= 1136
http://ke.kabupro.jp/code/4025.htm i= 1137
http://ke.kabupro.jp/code/4026.htm i= 1138
http://ke.kabupro.jp/code/4027.htm i= 1139
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4028.htm i= 1140
http://ke.kabupro.jp/code/4031.htm i= 1141
http://ke.kabupro.jp/code/4041.htm i= 1142
http://ke.kabupro.jp/code/4042.htm i= 1143
http://ke.kabupro.jp/code/4043.htm i= 1144
http://ke.kabupro.jp/code/4044.htm i= 1145
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:15>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4045.htm i= 1146
http://ke.kabupro.jp/code/4046.htm i= 1147
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:14>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.

http://ke.kabupro.jp/code/4249.htm i= 1245
http://ke.kabupro.jp/code/4251.htm i= 1246
http://ke.kabupro.jp/code/4272.htm i= 1247
http://ke.kabupro.jp/code/4274.htm i= 1248
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4275.htm i= 1249
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4282.htm i= 1250
http://ke.kabupro.jp/code/4284.htm i= 1251
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4286.htm i= 1252
http://ke.kabupro.jp/code/4287.h

http://ke.kabupro.jp/code/4432.htm i= 1338
http://ke.kabupro.jp/code/4433.htm i= 1339
http://ke.kabupro.jp/code/4434.htm i= 1340
http://ke.kabupro.jp/code/4435.htm i= 1341
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4436.htm i= 1342
http://ke.kabupro.jp/code/4437.htm i= 1343
http://ke.kabupro.jp/code/4438.htm i= 1344
http://ke.kabupro.jp/code/4439.htm i= 1345
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4440.htm i= 1346
http://ke.kabupro.jp/code/4441.htm i= 1347
http://ke.kabupro.jp/code/4442.htm i= 1348
http://ke.kabupro.jp/code/4443.htm i= 1349
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4444.htm i= 1350
http://ke.kabupro.jp/code/4445.htm i= 1351
http://ke.kabupro.jp/code/4446.htm i= 1352
取込エラー
Invalid dictionary construct: [/'Type', /

http://ke.kabupro.jp/code/4576.htm i= 1433
http://ke.kabupro.jp/code/4577.htm i= 1434
http://ke.kabupro.jp/code/4578.htm i= 1435
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4579.htm i= 1436
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4581.htm i= 1437
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4582.htm i= 1438
http://ke.kabupro.jp/code/4583.htm i= 1439
http://ke.kabupro.jp/code/4584.htm i= 1440
http://ke.kabupro.jp/code/4586.htm i= 1441
http://ke.kabupro.jp/code/4587.htm i= 1442
http://ke.kabupro.jp/code/4588.htm i= 1443
http://ke.kabupro.jp/code/4591.htm i= 1444
http://ke.kabupro.

http://ke.kabupro.jp/code/4755.htm i= 1540
http://ke.kabupro.jp/code/4760.htm i= 1541
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4761.htm i= 1542
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4762.htm i= 1543
http://ke.kabupro.jp/code/4763.htm i= 1544
http://ke.kabupro.jp/code/4764.htm i= 1545
http://ke.kabupro.jp/code/4765.htm i= 1546
http://ke.kabupro.jp/code/4766.htm i= 1547
http://ke.kabupro.jp/code/4767.htm i= 1548
http://ke.kabupro.jp/code/4768.htm i= 1549
http://ke.kabupro.jp/code/4769.htm i= 1550
http://ke.kabupro.jp/code/4770.htm i= 1551
http://ke.kabupro.jp/code/4771.htm i= 1552
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encodin

取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4987.htm i= 1642
http://ke.kabupro.jp/code/4990.htm i= 1643
http://ke.kabupro.jp/code/4992.htm i= 1644
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/4994.htm i= 1645
http://ke.kabupro.jp/code/4995.htm i= 1646
http://ke.kabupro.jp/code/4996.htm i= 1647
http://ke.kabupro.jp/code/4997.htm i= 1648
http://ke.kabupro.jp/code/4998.htm i= 1649
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/4999.htm i= 1650
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/5008.htm i= 1651
http://ke.kabupro.jp/code/5009.htm i= 1652
http://ke.k

http://ke.kabupro.jp/code/5449.htm i= 1756
http://ke.kabupro.jp/code/5451.htm i= 1757
http://ke.kabupro.jp/code/5458.htm i= 1758
http://ke.kabupro.jp/code/5461.htm i= 1759
http://ke.kabupro.jp/code/5463.htm i= 1760
http://ke.kabupro.jp/code/5464.htm i= 1761
http://ke.kabupro.jp/code/5471.htm i= 1762
http://ke.kabupro.jp/code/5476.htm i= 1763
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/5480.htm i= 1764
http://ke.kabupro.jp/code/5481.htm i= 1765
http://ke.kabupro.jp/code/5482.htm i= 1766
http://ke.kabupro.jp/code/5484.htm i= 1767
http://ke.kabupro.jp/code/5486.htm i= 1768
http://ke.kabupro.jp/code/5491.htm i= 1769
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'U

http://ke.kabupro.jp/code/5970.htm i= 1870
http://ke.kabupro.jp/code/5971.htm i= 1871
http://ke.kabupro.jp/code/5973.htm i= 1872
http://ke.kabupro.jp/code/5974.htm i= 1873
http://ke.kabupro.jp/code/5975.htm i= 1874
http://ke.kabupro.jp/code/5976.htm i= 1875
http://ke.kabupro.jp/code/5979.htm i= 1876
http://ke.kabupro.jp/code/5981.htm i= 1877
http://ke.kabupro.jp/code/5982.htm i= 1878
http://ke.kabupro.jp/code/5983.htm i= 1879
http://ke.kabupro.jp/code/5984.htm i= 1880
http://ke.kabupro.jp/code/5985.htm i= 1881
http://ke.kabupro.jp/code/5986.htm i= 1882
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/5987.htm i= 1883
http://ke.kabupro.jp/code/5988.htm i= 1884
http://ke.kabupro.jp/code/5989.htm i= 1885
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/5990.htm i= 1886
http://ke.kabupro.jp/code/5991.htm i= 1887
http://ke.kabupro.jp/code/5992.htm i= 1888
http://ke.kabupro.jp/code/5993.htm i= 1889
http://ke.kabupro.jp/code/5994.htm i= 18

http://ke.kabupro.jp/code/6145.htm i= 1979
http://ke.kabupro.jp/code/6146.htm i= 1980
http://ke.kabupro.jp/code/6147.htm i= 1981
http://ke.kabupro.jp/code/6149.htm i= 1982
http://ke.kabupro.jp/code/6150.htm i= 1983
http://ke.kabupro.jp/code/6151.htm i= 1984
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/6155.htm i= 1985
http://ke.kabupro.jp/code/6156.htm i= 1986
http://ke.kabupro.jp/code/6157.htm i= 1987
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/6158.htm i= 1988
http://ke.kabupro.jp/code/6159.htm i= 1989
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6161.htm i= 1990
http://ke.kabupro.jp/code/6164.htm i= 1991
http://ke.kabupro.jp/code/6165.htm i= 1992
http://ke.kabupro.jp/code/6166.htm i= 1993
http://ke.kabupro.jp/code/6167.htm i= 1994
http

http://ke.kabupro.jp/code/6332.htm i= 2101
http://ke.kabupro.jp/code/6333.htm i= 2102
http://ke.kabupro.jp/code/6334.htm i= 2103
http://ke.kabupro.jp/code/6335.htm i= 2104
http://ke.kabupro.jp/code/6336.htm i= 2105
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6337.htm i= 2106
http://ke.kabupro.jp/code/6338.htm i= 2107
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6339.htm i= 2108
http://ke.kabupro.jp/code/6340.htm i= 2109
http://ke.kabupro.jp/code/6342.htm i= 2110
http://ke.kabupro.jp/code/6343.htm i= 2111
http://ke.kabupro.jp/code/6345.htm i= 2112
http://ke.kabupro.jp/code/6346.htm i= 2113
http://ke.kabupro.jp/code

http://ke.kabupro.jp/code/6517.htm i= 2224
http://ke.kabupro.jp/code/6518.htm i= 2225
http://ke.kabupro.jp/code/6521.htm i= 2226
http://ke.kabupro.jp/code/6531.htm i= 2227
http://ke.kabupro.jp/code/6532.htm i= 2228
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6533.htm i= 2229
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6535.htm i= 2230
http://ke.kabupro.jp/code/6537.htm i= 2231
http://ke.kabupro.jp/code/6538.htm i= 2232
http://ke.kabupro.jp/code/6539.htm i= 2233
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts'

http://ke.kabupro.jp/code/6651.htm i= 2312
http://ke.kabupro.jp/code/6652.htm i= 2313
http://ke.kabupro.jp/code/6653.htm i= 2314
http://ke.kabupro.jp/code/6654.htm i= 2315
http://ke.kabupro.jp/code/6655.htm i= 2316
http://ke.kabupro.jp/code/6656.htm i= 2317
http://ke.kabupro.jp/code/6658.htm i= 2318
http://ke.kabupro.jp/code/6659.htm i= 2319
http://ke.kabupro.jp/code/6662.htm i= 2320
http://ke.kabupro.jp/code/6663.htm i= 2321
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/6664.htm i= 2322
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6666.htm i= 2323
http://ke.kabupro.jp/code/6668.htm i= 2324
http://ke.kabupro.jp/code/6670.htm i= 2325
http://ke.kabupro.jp/code/6674.htm i= 2326
http://ke.kabupro.jp/code/6675.htm i= 2327
http://ke.kabupro.jp/code/6676.htm i= 2328
http://ke.k

http://ke.kabupro.jp/code/6875.htm i= 2436
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/6877.htm i= 2437
http://ke.kabupro.jp/code/6879.htm i= 2438
http://ke.kabupro.jp/code/6881.htm i= 2439
http://ke.kabupro.jp/code/6882.htm i= 2440
http://ke.kabupro.jp/code/6888.htm i= 2441
http://ke.kabupro.jp/code/6890.htm i= 2442
http://ke.kabupro.jp/code/6894.htm i= 2443
http://ke.kabupro.jp/code/6897.htm i= 2444
http://ke.kabupro.jp/code/6898.htm i= 2445
http://ke.kabupro.jp/code/6899.htm i= 2446
http://ke.kabupro.jp/code/6901.htm i= 2447
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:22>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/6902.htm i= 2448
http://ke.kabupro.jp/code/6904.htm i= 2449
http://ke.kabupro.jp/code/6905.htm i= 2450
http://ke.kabupro.jp/code/6907.htm i= 2451
http://ke.kabupro.jp/code/6908.htm i= 2452
http://ke.k

http://ke.kabupro.jp/code/7067.htm i= 2546
http://ke.kabupro.jp/code/7068.htm i= 2547
http://ke.kabupro.jp/code/7069.htm i= 2548
http://ke.kabupro.jp/code/7070.htm i= 2549
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7071.htm i= 2550
http://ke.kabupro.jp/code/7072.htm i= 2551
http://ke.kabupro.jp/code/7073.htm i= 2552
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7074.htm i= 2553
http://ke.kabupro.jp/code/7076.htm i= 2554
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-U

http://ke.kabupro.jp/code/7268.htm i= 2647
http://ke.kabupro.jp/code/7269.htm i= 2648
http://ke.kabupro.jp/code/7270.htm i= 2649
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/7271.htm i= 2650
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7272.htm i= 2651
http://ke.kabupro.jp/code/7273.htm i= 2652
http://ke.kabupro.jp/code/7276.htm i= 2653
http://ke.kabupro.jp/code/7277.htm i= 2654
http://ke.kabupro.jp/code/7278.htm i= 2655
http://ke.kabupro.jp/code/7279.htm i= 2656
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/7280.htm i= 2657
http://ke.kabupro.jp/code/7282.htm i= 2658
取込エラー
Invalid dictionary construct: [/'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'DescendantFonts', [<PDFObjRef:19>], /'Encoding', /'UniJIS-UTF16-H', /'Subtype'

http://ke.kabupro.jp/code/7481.htm i= 2745
http://ke.kabupro.jp/code/7482.htm i= 2746
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7483.htm i= 2747
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7485.htm i= 2748
http://ke.kabupro.jp/code/7486.htm i= 2749
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7487.htm i= 2750
http://ke.kabupro.jp/code/7488.htm i= 2751
http://ke.kabupro.jp/code/7490.htm i= 2752
http://ke.kabupro.jp/code/7494.h

http://ke.kabupro.jp/code/7687.htm i= 2858
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7688.htm i= 2859
http://ke.kabupro.jp/code/7689.htm i= 2860
http://ke.kabupro.jp/code/7692.htm i= 2861
http://ke.kabupro.jp/code/7694.htm i= 2862
http://ke.kabupro.jp/code/7695.htm i= 2863
http://ke.kabupro.jp/code/7697.htm i= 2864
決算短信が存在しない
list index out of range


http://ke.kabupro.jp/code/7698.htm i= 2865
http://ke.kabupro.jp/code/7701.htm i= 2866
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x82o\\x83S\\x83V\\x83b\\x83N'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:17>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7702.htm i= 2867
http://ke.kabupro.jp/code/7705.htm i= 2868
http://ke.kabupro.jp/code/7707.htm i= 2869
http://ke.kabupro.jp/

http://ke.kabupro.jp/code/7879.htm i= 2974
http://ke.kabupro.jp/code/7883.htm i= 2975
http://ke.kabupro.jp/code/7885.htm i= 2976
http://ke.kabupro.jp/code/7886.htm i= 2977
http://ke.kabupro.jp/code/7887.htm i= 2978
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7888.htm i= 2979
http://ke.kabupro.jp/code/7893.htm i= 2980
http://ke.kabupro.jp/code/7894.htm i= 2981
http://ke.kabupro.jp/code/7895.htm i= 2982
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/7896.htm i= 2983
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/7897.htm i= 2984
http://ke.kabupro.jp/code/7898.htm i= 2985
取込エラー
only algorit

http://ke.kabupro.jp/code/8070.htm i= 3101
http://ke.kabupro.jp/code/8071.htm i= 3102
http://ke.kabupro.jp/code/8072.htm i= 3103
http://ke.kabupro.jp/code/8074.htm i= 3104
http://ke.kabupro.jp/code/8075.htm i= 3105
http://ke.kabupro.jp/code/8076.htm i= 3106
http://ke.kabupro.jp/code/8077.htm i= 3107
http://ke.kabupro.jp/code/8078.htm i= 3108
http://ke.kabupro.jp/code/8079.htm i= 3109
http://ke.kabupro.jp/code/8081.htm i= 3110
http://ke.kabupro.jp/code/8084.htm i= 3111
http://ke.kabupro.jp/code/8085.htm i= 3112
http://ke.kabupro.jp/code/8086.htm i= 3113
http://ke.kabupro.jp/code/8087.htm i= 3114
http://ke.kabupro.jp/code/8088.htm i= 3115
http://ke.kabupro.jp/code/8089.htm i= 3116
http://ke.kabupro.jp/code/8090.htm i= 3117
http://ke.kabupro.jp/code/8091.htm i= 3118
http://ke.kabupro.jp/code/8093.htm i= 3119
http://ke.kabupro.jp/code/8095.htm i= 3120
http://ke.kabupro.jp/code/8096.htm i= 3121
http://ke.kabupro.jp/code/8097.htm i= 3122
http://ke.kabupro.jp/code/8098.htm i= 3123
取込エラー
Inval

http://ke.kabupro.jp/code/8285.htm i= 3219
http://ke.kabupro.jp/code/8287.htm i= 3220
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/8289.htm i= 3221
http://ke.kabupro.jp/code/8291.htm i= 3222
http://ke.kabupro.jp/code/8293.htm i= 3223
http://ke.kabupro.jp/code/8298.htm i= 3224
http://ke.kabupro.jp/code/8301.htm i= 3225
東証以外の銘柄のため、PDF見つからず
http://ke.kabupro.jp/code/8303.htm i= 3226
http://ke.kabupro.jp/code/8304.htm i= 3227
http://ke.kabupro.jp/code/8306.htm i= 3228
http://ke.kabupro.jp/code/8308.htm i= 3229
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/8309.htm i= 3230
http://ke.kabupro.jp/code/8316.htm i= 3231
http://ke.kabupro.jp/code/8331.htm i= 3232
http://ke.kabupro.jp/code/8334.htm i= 3233
http://ke.kabupro.jp/code/8336.htm i= 3234
取込エラー
Invalid dictionary construct

http://ke.kabupro.jp/code/8747.htm i= 3347
http://ke.kabupro.jp/code/8750.htm i= 3348
http://ke.kabupro.jp/code/8766.htm i= 3349
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/8769.htm i= 3350
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x83S\\x83V\\x83b\\x83N'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/8771.htm i= 3351
http://ke.kabupro.jp/code/8772.htm i= 3352
http://ke.kabupro.jp/code/8783.htm i= 3353
http://ke.kabupro.jp/code/8789.htm i= 3354
http://ke.kabupro.jp/code/8793.htm i= 3355
http://ke.kabupro.jp/code/8795.htm i= 3356
http://ke.kabupro.jp/code/8798.htm i= 3357
http://ke.kabupro.jp/code/8801.htm i= 3358
http://ke.kabupro.jp/code/8802.htm i= 3359
取込エラー
Invalid diction

http://ke.kabupro.jp/code/9057.htm i= 3455
http://ke.kabupro.jp/code/9058.htm i= 3456
http://ke.kabupro.jp/code/9059.htm i= 3457
http://ke.kabupro.jp/code/9060.htm i= 3458
http://ke.kabupro.jp/code/9062.htm i= 3459
http://ke.kabupro.jp/code/9063.htm i= 3460
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/9064.htm i= 3461
http://ke.kabupro.jp/code/9065.htm i= 3462
http://ke.kabupro.jp/code/9066.htm i= 3463
http://ke.kabupro.jp/code/9067.htm i= 3464
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/9068.htm i= 3465
http://ke.kabupro.jp/code/9069.htm i= 3466
http://ke.kabupro.jp/code/9070.htm i= 3467
http://ke.kabupro.jp/code/9072.htm i= 3468
http://ke.kabupro.jp/code/9073.htm i= 3469
http://ke.kabupro.jp/code/9074.htm i= 3470
http://ke.kabupro.jp/code/9075.htm i= 3471
http://ke.kabupro.jp/code/9

http://ke.kabupro.jp/code/9404.htm i= 3566
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/9405.htm i= 3567
http://ke.kabupro.jp/code/9407.htm i= 3568
http://ke.kabupro.jp/code/9408.htm i= 3569
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/9409.htm i= 3570
http://ke.kabupro.jp/code/9412.htm i= 3571
http://ke.kabupro.jp/code/9413.htm i= 3572
http://ke.kabupro.jp/code/9414.htm i= 3573
http://ke.kabupro.jp/code/9416.htm i= 3574
http://ke.kabupro.jp/code/9417.htm i= 3575
http://ke.kabupro.jp/code/9418.htm i= 3576
http://ke.kabupro.jp/code/9419.htm i= 3577
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.

http://ke.kabupro.jp/code/9678.htm i= 3668
http://ke.kabupro.jp/code/9679.htm i= 3669
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/9682.htm i= 3670
http://ke.kabupro.jp/code/9684.htm i= 3671
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/9685.htm i= 3672
http://ke.kabupro.jp/code/9686.htm i= 3673
http://ke.kabupro.jp/code/9687.htm i= 3674
http://ke.kabupro.jp/code/9691.htm i= 3675
http://ke.kabupro.jp/code/9692.htm i= 3676
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-U

http://ke.kabupro.jp/code/9945.htm i= 3797
http://ke.kabupro.jp/code/9946.htm i= 3798
http://ke.kabupro.jp/code/9948.htm i= 3799
取込エラー
Invalid dictionary construct: [/'Type', /'Font', /'BaseFont', /b"b'", /"\\x82l\\x82r\\x96\\xbe\\x92\\xa9'", /'Subtype', /'Type0', /'DescendantFonts', [<PDFObjRef:12>], /'Encoding', /'UniJIS-UTF16-H']


http://ke.kabupro.jp/code/9950.htm i= 3800
http://ke.kabupro.jp/code/9955.htm i= 3801
http://ke.kabupro.jp/code/9956.htm i= 3802
http://ke.kabupro.jp/code/9959.htm i= 3803
http://ke.kabupro.jp/code/9960.htm i= 3804
http://ke.kabupro.jp/code/9962.htm i= 3805
http://ke.kabupro.jp/code/9964.htm i= 3806
取込エラー
only algorithm code 1 and 2 are supported


http://ke.kabupro.jp/code/9966.htm i= 3807
http://ke.kabupro.jp/code/9967.htm i= 3808
http://ke.kabupro.jp/code/9969.htm i= 3809
http://ke.kabupro.jp/code/9972.htm i= 3810
http://ke.kabupro.jp/code/9973.htm i= 3811
http://ke.kabupro.jp/code/9974.htm i= 3812
http://ke.kabupro.jp/code/9976.htm i= 3813
http://ke.k

In [5]:
#手順1：tabulaで取り込む銘柄コードの表をcsvへ書込み
#かなり後で使用する
df_for_tabula = pd.DataFrame()
df_for_tabula['code'] = tabula_dict.keys()
df_for_tabula['error'] = tabula_dict.values()

df_for_tabula.to_csv('temp_file/全銘柄PDFデータ（手順1_tabula用銘柄コード）.csv', mode='w', index=False, encoding="shift-jis", errors='none')

df_for_tabula

Unnamed: 0,code,error
0,1333,"Invalid dictionary construct: [/'Type', /'Font..."
1,1438,"Invalid dictionary construct: [/'Type', /'Font..."
2,1447,"Invalid dictionary construct: [/'Type', /'Font..."
3,1448,"Invalid dictionary construct: [/'Type', /'Font..."
4,1451,"Invalid dictionary construct: [/'Type', /'Font..."
...,...,...
821,9964,only algorithm code 1 and 2 are supported
822,9978,"Invalid dictionary construct: [/'Type', /'Font..."
823,9983,"Invalid dictionary construct: [/'Type', /'Font..."
824,9984,only algorithm code 1 and 2 are supported


In [7]:
#手順1：camelotで取得した表の確認
df_camelot1 = df_camelot1.reindex(columns=['code', '流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', 
                         '投資有価証券', '投資その他の資産合計', '流動負債合計', '固定負債合計', ])
df_camelot1

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1301,86649,7100,,,15715,11682,13547,39189,37166
0,1332,231751,10986,,,147428,38076,86443,153467,134021
0,1352,12137,4019,,,26593,345,2390,11866,21666
0,1375,10202,,,18031,,,,7614,
0,1376,28828145,3447948,,,6627416,,2829597,16514107,1726482
...,...,...,...,...,...,...,...,...,...,...
0,9991,71446,20.8,,△1.4,23439,△0.0,7290,37959,5094
0,9994,32537,8664,,,11459,894,11165,28133,5102
0,9995,28864,3395,,,1537,2131,3112,10263,888
0,9996,18787671,2448882,,,5577535,6167809,7689024,7800804,345038


In [8]:
#手順1：camelotで取得した表をcsvへ書込み
df_camelot1.to_csv('temp_file/全銘柄PDFデータ（手順1_camelot加工前）.csv', mode='w', index=False, encoding="shift-jis", errors='none')

In [9]:
#手順1：camelotで取得した表をcsvから読み込み、余分な文字を消す
df_camelot2 = pd.read_csv('temp_file/全銘柄PDFデータ（手順1_camelot加工前）.csv', encoding=("cp932"), header=0)

replace_feature_list = list(df_camelot2.select_dtypes(include=object).columns.values)
replace_list = [',', '△', '―', '-', '，', '\n', ' ',
                '※1', '※2', '※3', '※4', '※5', '※6', '※7', '※8', '※9',
                '※１', '※２', '※３', '※４', '※５', '※６', '※７', '※８', '※９']
for i in replace_feature_list:
    for j in replace_list:
        df_camelot2[i] = df_camelot2[i].str.replace(j, '')
df_camelot2

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1301,86649,7100,,,15715,11682,13547,39189,37166
1,1332,231751,10986,,,147428,38076,86443,153467,134021
2,1352,12137,4019,,,26593,345,2390,11866,21666
3,1375,10202,,,18031,,,,7614,
4,1376,28828145,3447948,,,6627416,,2829597,16514107,1726482
...,...,...,...,...,...,...,...,...,...,...
2990,9991,71446,20.8,,1.4,23439,0.0,7290,37959,5094
2991,9994,32537,8664,,,11459,894,11165,28133,5102
2992,9995,28864,3395,,,1537,2131,3112,10263,888
2993,9996,18787671,2448882,,,5577535,6167809,7689024,7800804,345038


In [10]:
#手順1：十分に取り込めていない銘柄コードについて、
#①再抽出する銘柄コードの抽出と、②削除する銘柄コードの抽出
camelot_re_dict = {}
camelot_drop_list = []
for i in range(0, len(df_camelot2)):
    #①再抽出する銘柄コードの抽出
    if len(df_camelot2.iloc[i, :].value_counts()) == 1:
        camelot_re_dict[df_camelot2.iloc[i, 0]] = 're1'
        print('code=', df_camelot2.iloc[i, 0], '再抽出：資料が左に細くて1つも取り込めない')
    elif df_camelot2.iloc[i, 9] == '非流動負債合計':
        camelot_re_dict[df_camelot2.iloc[i, 0]] = 're2'
        print('code=', df_camelot2.iloc[i, 0], '再抽出：固定負債合計の値が非流動負債合計')
        
for i in range(0, len(df_camelot2)):    
    #②削除する銘柄コードの抽出
    if len(df_camelot2.iloc[i, :].value_counts()) <= 3:
        camelot_drop_list.append(df_camelot2.iloc[i, 0])
        print('code=', df_camelot2.iloc[i, 0], '削除：特徴量が2つ以下')
    elif df_camelot2.iloc[i, :].str.contains('%').sum() !=0:
        camelot_drop_list.append(df_camelot2.iloc[i, 0])
        print('code=', df_camelot2.iloc[i, 0], '削除：%を含む')
    elif df_camelot2.iloc[i, 9] == '非流動負債合計':
        camelot_drop_list.append(df_camelot2.iloc[i, 0])
        print('code=', df_camelot2.iloc[i, 0], '削除：固定負債合計の値が非流動負債合計')

code= 3402 再抽出：固定負債合計の値が非流動負債合計
code= 4183 再抽出：固定負債合計の値が非流動負債合計
code= 6232 再抽出：資料が左に細くて1つも取り込めない
code= 6361 再抽出：固定負債合計の値が非流動負債合計
code= 7203 再抽出：固定負債合計の値が非流動負債合計
code= 7605 再抽出：資料が左に細くて1つも取り込めない
code= 8160 再抽出：資料が左に細くて1つも取り込めない
code= 8399 再抽出：資料が左に細くて1つも取り込めない
code= 8746 再抽出：資料が左に細くて1つも取り込めない
code= 9201 再抽出：固定負債合計の値が非流動負債合計
code= 9519 再抽出：固定負債合計の値が非流動負債合計
code= 9678 再抽出：資料が左に細くて1つも取り込めない
code= 9719 再抽出：固定負債合計の値が非流動負債合計
code= 3245 削除：%を含む
code= 3402 削除：固定負債合計の値が非流動負債合計
code= 4095 削除：特徴量が2つ以下
code= 4183 削除：固定負債合計の値が非流動負債合計
code= 4519 削除：特徴量が2つ以下
code= 4689 削除：特徴量が2つ以下
code= 4755 削除：特徴量が2つ以下
code= 5202 削除：特徴量が2つ以下
code= 5464 削除：特徴量が2つ以下
code= 6098 削除：特徴量が2つ以下
code= 6232 削除：特徴量が2つ以下
code= 6361 削除：固定負債合計の値が非流動負債合計
code= 6417 削除：特徴量が2つ以下
code= 6594 削除：特徴量が2つ以下
code= 6697 削除：特徴量が2つ以下
code= 6758 削除：特徴量が2つ以下
code= 6981 削除：特徴量が2つ以下
code= 7150 削除：特徴量が2つ以下
code= 7157 削除：特徴量が2つ以下
code= 7167 削除：特徴量が2つ以下
code= 7181 削除：特徴量が2つ以下
code= 7182 削除：特徴量が2つ以下
code= 7184 削除：特徴量が2つ以下
code= 7189 削除：特徴量が2つ以下
code= 

In [11]:
#手順1：削除する銘柄コードの削除
for i in camelot_drop_list:
    df_camelot2.drop(df_camelot2.index[df_camelot2['code'] == i], inplace=True)
df_camelot2

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1301,86649,7100,,,15715,11682,13547,39189,37166
1,1332,231751,10986,,,147428,38076,86443,153467,134021
2,1352,12137,4019,,,26593,345,2390,11866,21666
3,1375,10202,,,18031,,,,7614,
4,1376,28828145,3447948,,,6627416,,2829597,16514107,1726482
...,...,...,...,...,...,...,...,...,...,...
2990,9991,71446,20.8,,1.4,23439,0.0,7290,37959,5094
2991,9994,32537,8664,,,11459,894,11165,28133,5102
2992,9995,28864,3395,,,1537,2131,3112,10263,888
2993,9996,18787671,2448882,,,5577535,6167809,7689024,7800804,345038


In [12]:
#手順1：camelotで取得した表（加工・削除後）をcsvへ書込み
df_camelot2.to_csv('temp_file/全銘柄PDFデータ（手順1_camelot完成）.csv', mode='w', index=False, encoding="shift-jis", errors='none')

In [13]:
#手順2：camelotで再抽出する銘柄コードと、空データフレームの作成
codes_camelot_re = list(camelot_re_dict.keys())
df_camelot_re1 = pd.DataFrame()

In [14]:
#手順2：camelotで再抽出
def get_pdf_camelot_re(start_url, code, frag):
    time.sleep(1)
    response = requests.get(start_url)
    soup = BeautifulSoup(response.content, 'html.parser')

    table = soup.find('table', attrs={'class': 'Quote'})
    #訂正があった場合でも、訂正前のPDFを取得する
    for i in range(0, 5):
        if '訂正' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text\
        or '補足' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text:
            pass
        else:
            target_pdf = table.find_all('td', text = re.compile('.*決算短信.*'))[i].find('a').get('href')
            break
                
    try:
        tables = camelot.read_pdf(target_pdf, flavor='stream', pages = '4-end', table_areas=['0,800,700,0'])
        if frag == 're1':
            get_features_camelot_re1(tables, code)
        else:
            get_features_camelot_re2(tables, code)
    except Exception as e:
        print('取込エラー')
        print(e)
        print('\n')
        pass

#手順2：対応①　camelot「固定負債合計の値が非流動負債合計」PDFデータの取込み
def get_features_camelot_re1(tables, code):
    feature_list = ['流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', '投資有価証券',
                    '投資その他の資産合計', '流動負債合計', '固定負債合計']
    feature_remove_list = []
    df_elements = []
    for table in tables:
        df_tbl = table.df  
        for feature in feature_list:
            if len(df_tbl[df_tbl.iloc[:,0] == feature]) == 1:
                #資産と負債が違うテーブルのため、df_element1の列がずれる場合がある
                #特徴量と値だけの1行2列のデータフレームを作成
                df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-1]]
                #【左から2列目に値が入っているPDFのため、その対応をする】
                if df_element1.iloc[0, 1] == '':
                    df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-2]]
                #後のconcatで列がずれないようにするため、値の列の名前を1に統一する
                df_element2 = df_element1.rename(columns={df_element1.columns[1]: 1})
                df_elements.append(df_element2)
                #資産と負債のテーブルが2つある銘柄がある（連結と単独のテーブル）
                #同じ特徴量を2回取得することを避けるため、一度入れた特徴量は削除リストに登録
                feature_remove_list.append(feature)
        #テーブル処理が1つ終わったら、削除リストに登録された特徴量を元のリストから削除する
        if len(feature_remove_list) != 0:
            for feature_remove in feature_remove_list:
                feature_list.remove(feature_remove)
            feature_remove_list = []
    df_all1 = pd.concat(df_elements).T
    df_all2 = pd.DataFrame([list(df_all1.iloc[1,:])], columns=df_all1.iloc[0,:],)  
    df_all2['code'] = code
    dfs_concat_camelot_re(df_all2)

    
#手順2：対応②　camelot「固定負債合計の値が非流動負債合計」PDFデータの再抽出
def get_features_camelot_re2(tables, code):
#【現金及び預金→現金及び現金同等物、固定負債合計→非流動負債合計に変更】
    feature_list = ['流動資産合計', '現金及び現金同等物', '現金預金', '有形固定資産', '有形固定資産合計', '投資有価証券',
                    '投資その他の資産合計', '流動負債合計', '非流動負債合計']
    feature_remove_list = []
    df_elements = []
    for table in tables:
        df_tbl = table.df  
        for feature in feature_list:
            if len(df_tbl[df_tbl.iloc[:,0] == feature]) == 1:
                #資産と負債が違うテーブルのため、df_element1の列がずれる場合がある
                #特徴量と値だけの1行2列のデータフレームを作成
                df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-1]]
                #【左から2列目に値が入っているPDFのため、その対応をする】
                if df_element1.iloc[0, 1] == '':
                    df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-2]]
                #後のconcatで列がずれないようにするため、値の列の名前を1に統一する
                df_element2 = df_element1.rename(columns={df_element1.columns[1]: 1})
                df_elements.append(df_element2)
                #資産と負債のテーブルが2つある銘柄がある（連結と単独のテーブル）
                #同じ特徴量を2回取得することを避けるため、一度入れた特徴量は削除リストに登録
                feature_remove_list.append(feature)
        #テーブル処理が1つ終わったら、削除リストに登録された特徴量を元のリストから削除する
        if len(feature_remove_list) != 0:
            for feature_remove in feature_remove_list:
                feature_list.remove(feature_remove)
            feature_remove_list = []
    df_all1 = pd.concat(df_elements).T
    df_all2 = pd.DataFrame([list(df_all1.iloc[1,:])], columns=df_all1.iloc[0,:],)\
    .rename(columns={'現金及び現金同等物': '現金及び預金'}).rename(columns={'非流動負債合計': '固定負債合計'}) 
    df_all2['code'] = code
    dfs_concat_camelot_re(df_all2)
    
    
def dfs_concat_camelot_re(df_all2):
    global df_camelot_re1
    df_camelot_re1 = pd.concat([df_camelot_re1, df_all2], axis=0)

In [15]:
#手順2：camelotで再抽出をPDFから特徴量をDataFrameへ記入　
for i in range(0, len(codes_camelot_re)):
    code = codes_camelot_re[i]
    frag = camelot_re_dict[code]
    start_url = 'http://ke.kabupro.jp/code/{}.htm'.format(code)
    print(start_url, 'i=', i)
    get_pdf_camelot_re(start_url, code, frag)

http://ke.kabupro.jp/code/3402.htm i= 0
http://ke.kabupro.jp/code/4183.htm i= 1
http://ke.kabupro.jp/code/6232.htm i= 2
http://ke.kabupro.jp/code/6361.htm i= 3
http://ke.kabupro.jp/code/7203.htm i= 4
http://ke.kabupro.jp/code/7605.htm i= 5
http://ke.kabupro.jp/code/8160.htm i= 6
http://ke.kabupro.jp/code/8399.htm i= 7
http://ke.kabupro.jp/code/8746.htm i= 8
http://ke.kabupro.jp/code/9201.htm i= 9
http://ke.kabupro.jp/code/9519.htm i= 10
http://ke.kabupro.jp/code/9678.htm i= 11
http://ke.kabupro.jp/code/9719.htm i= 12


In [16]:
#手順2：camelotで再取得した表の確認
df_camelot_re1 = df_camelot_re1.reindex(columns=['code', '流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', 
                         '投資有価証券', '投資その他の資産合計', '流動負債合計', '固定負債合計', ])
df_camelot_re1

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,3402,1181039.0,236354.0,,998358.0,,,,681378.0,845186.0
0,4183,787572.0,195987.0,,455749.0,,,,466305.0,409663.0
0,6232,3257717.0,1891731.0,,,,646888,675887.0,432941.0,3346.0
0,6361,468136.0,136084.0,,160722.0,,,,291212.0,82087.0
0,7203,22776800.0,5100857.0,,,11411153.0,,,21460466.0,16518344.0
0,7605,13909184.0,6247882.0,,,13160081.0,,,,
0,8160,20354.0,16002.0,,,14779.0,2825,8027.0,16515.0,6087.0
0,8399,,,,,,,,,
0,8746,7319602.0,2334471.0,,,388267.0,1628841,2056000.0,4204103.0,44459.0
0,9201,567816.0,408335.0,,,1045413.0,"(C),(c) \nその他の金融資産",,476893.0,648850.0


In [17]:
#手順2：camelotで再取得した表をcsvへ書込み
df_camelot_re1.to_csv('temp_file/全銘柄PDFデータ（手順2_camelot_re加工前）.csv', mode='w', 
                      index=False, encoding="shift-jis", errors='none')

In [18]:
#手順2：camelotで再取得した表の余分な文字を消す
df_camelot_re2 = pd.read_csv('temp_file/全銘柄PDFデータ（手順2_camelot_re加工前）.csv', encoding=("cp932"), header=0)
replace_feature_list = list(df_camelot_re2.select_dtypes(include=object).columns.values)
replace_list = [',', '△', '―', '-', '，', '\n', ' ',
                '※1', '※2', '※3', '※4', '※5', '※6', '※7', '※8', '※9',
                '※１', '※２', '※３', '※４', '※５', '※６', '※７', '※８', '※９', '\D']

for i in replace_feature_list:
    for j in replace_list:
        df_camelot_re2[i] = df_camelot_re2[i].str.replace(j, '')
df_camelot_re2


Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,3402,1181039.0,236354.0,,998358.0,,,,681378.0,845186.0
1,4183,787572.0,195987.0,,455749.0,,,,466305.0,409663.0
2,6232,3257717.0,1891731.0,,,,646888.0,675887.0,432941.0,3346.0
3,6361,468136.0,136084.0,,160722.0,,,,291212.0,82087.0
4,7203,22776800.0,5100857.0,,,11411153.0,,,21460466.0,16518344.0
5,7605,13909184.0,6247882.0,,,13160081.0,,,,
6,8160,20354.0,16002.0,,,14779.0,2825.0,8027.0,16515.0,6087.0
7,8399,,,,,,,,,
8,8746,7319602.0,2334471.0,,,388267.0,1628841.0,2056000.0,4204103.0,44459.0
9,9201,567816.0,408335.0,,,1045413.0,,,476893.0,648850.0


In [19]:
#手順2：camelotで再取得した銘柄のうち、十分に取り込めていない銘柄コードの抽出と削除
camelot_re_drop_list = []

#削除する銘柄コードの抽出        
for i in range(0, len(df_camelot_re2)):    
    #②削除する銘柄コードの抽出
    if len(df_camelot_re2.iloc[i, :].value_counts()) <= 3:
        camelot_re_drop_list.append(df_camelot_re2.iloc[i, 0])
        print('code=', df_camelot_re2.iloc[i, 0], '削除：特徴量が2つ以下')
        
#削除する銘柄コードの削除
for i in camelot_re_drop_list:
    df_camelot_re2.drop(df_camelot_re2.index[df_camelot_re2['code'] == i], inplace=True)
df_camelot_re2

code= 8399 削除：特徴量が2つ以下


Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,3402,1181039,236354,,998358.0,,,,681378.0,845186.0
1,4183,787572,195987,,455749.0,,,,466305.0,409663.0
2,6232,3257717,1891731,,,,646888.0,675887.0,432941.0,3346.0
3,6361,468136,136084,,160722.0,,,,291212.0,82087.0
4,7203,22776800,5100857,,,11411153.0,,,21460466.0,16518344.0
5,7605,13909184,6247882,,,13160081.0,,,,
6,8160,20354,16002,,,14779.0,2825.0,8027.0,16515.0,6087.0
8,8746,7319602,2334471,,,388267.0,1628841.0,2056000.0,4204103.0,44459.0
9,9201,567816,408335,,,1045413.0,,,476893.0,648850.0
10,9519,46699,19406,,104148.0,,,,13375.0,182306.0


In [20]:
#手順2：camelotで再取得した表（加工・削除後）をcsvへ書込み
df_camelot_re2.to_csv('temp_file/全銘柄PDFデータ（手順2_camelot_re完成）.csv', mode='w',
                      index=False, encoding="shift-jis", errors='none')

In [21]:
#手順3：tabulaの利用
def get_pdf_tabula(start_url_tabula, code_tabula):
    response = requests.get(start_url_tabula)
    soup = BeautifulSoup(response.content, 'html.parser')
    if 'リクエストされたページがみつかりませんでした' in soup.text:
        print('東証以外の銘柄のため、PDF見つからず')
        pass
    else:
        table = soup.find('table', attrs={'class': 'Quote'})  
        #訂正があった場合でも、訂正前のPDFを取得する
        for i in range(0, 5):
            if '訂正' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text\
            or '補足' in table.find_all('td', text = re.compile('.*決算短信.*'))[i].text:
                pass
            else:
                target_pdf = table.find_all('td', text = re.compile('.*決算短信.*'))[i].find('a').get('href')
                break

        try:
            '''
            area (list of float, list of list of float, optional) –
            Portion of the page to analyze(top,left,bottom,right). Default is entire page.
            '''
            df_tbls = tabula.read_pdf(target_pdf, pages = 'all', stream=True, silent=True)
            get_features_tabula(df_tbls, code_tabula)           
        except Exception as e:
            error_dict[code_tabula] = e
            print('取込エラー')
            print(e)
            print('\n')
            pass

def get_features_tabula(df_tbls, code_tabula):
    feature_list = ['流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', '投資有価証券', 
                '投資その他の資産合計', '流動負債合計', '固定負債合計']
    df_elements = []
    feature_remove_list = []
    count_tables = 0
    for df_tbl in df_tbls:
        count = 0
        for feature in feature_list:
            if len(df_tbl[df_tbl.iloc[:,0] == feature]) == 1:
                #資産と負債が違うテーブルのため、df_element1の列がずれる場合がある
                #特徴量と値だけの1行2列のデータフレームを作成
                df_element1 = df_tbl[df_tbl.iloc[:,0] == feature].iloc[:, [0,-1]]
                #後のconcatで列がずれないようにするため、値の列の名前が違うため1に統一する
                df_element2 = df_element1.rename(columns={df_element1.columns[1]: 1})
                df_elements.append(df_element2)
                #資産と負債のテーブルが2つある銘柄がある（連結と単独のテーブル）
                #同じ特徴量を2回取得することを避けるため、一度入れた特徴量は削除リストに登録
                feature_remove_list.append(feature)
        #テーブル処理が1つ終わったら、削除リストに登録された特徴量を元のリストから削除する
        if len(feature_remove_list) != 0:
            for feature_remove in feature_remove_list:
                feature_list.remove(feature_remove)
            feature_remove_list = []

    df_all1 = pd.concat(df_elements).T
    df_all2 = pd.DataFrame([list(df_all1.iloc[1,:])], columns=df_all1.iloc[0,:],)  
    df_all2['code'] = code_tabula
    dfs_concat_tabula(df_all2)
    
    
def dfs_concat_tabula(df_all2):
    global df_tabula1
    df_tabula1 = pd.concat([df_tabula1, df_all2], axis=0)


In [22]:
#手順3：取り込む銘柄コードと、空データフレームの作成
#PDFの表抽出には、camelotとtabulaがある。それぞれ抽出できない銘柄がいくつか存在する。
#camelotの方が抽出できる銘柄が多いので、camelotで抽出後、残りをtabulaで抽出する。

codes_tabula = pd.read_csv('temp_file/全銘柄PDFデータ（手順1_tabula用銘柄コード）.csv', 
                           encoding=("cp932"), header=0).iloc[:, 0]
df_tabula1 = pd.DataFrame()
error_dict = {}

In [23]:
#手順3：tabulaでPDFから特徴量をDataFrameへ記入　※2時間くらいかかる
'''
・取込エラー
    No objects to concatenate　→　データ抽出できないPDFである可能性が高い
'''
for i in range(0, len(codes_tabula)):
    code_tabula = codes_tabula[i]
    start_url_tabula = 'http://ke.kabupro.jp/code/{}.htm'.format(code_tabula)
    print(start_url_tabula, 'i=', i)
    get_pdf_tabula(start_url_tabula, code_tabula)

http://ke.kabupro.jp/code/1333.htm i= 0
http://ke.kabupro.jp/code/1438.htm i= 1
http://ke.kabupro.jp/code/1447.htm i= 2
http://ke.kabupro.jp/code/1448.htm i= 3
http://ke.kabupro.jp/code/1451.htm i= 4
http://ke.kabupro.jp/code/1712.htm i= 5
http://ke.kabupro.jp/code/1721.htm i= 6
http://ke.kabupro.jp/code/1723.htm i= 7
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/1724.htm i= 8
http://ke.kabupro.jp/code/1726.htm i= 9
http://ke.kabupro.jp/code/1737.htm i= 10
http://ke.kabupro.jp/code/1766.htm i= 11
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/1780.htm i= 12
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/1798.htm i= 13
http://ke.kabupro.jp/code/1801.htm i= 14
http://ke.kabupro.jp/code/1803.htm i= 15
http://ke.kabupro.jp/code/1812.htm i= 16
http://ke.kabupro.jp/code/1820.htm i= 17
http://ke.kabupro.jp/code/1824.htm i= 18
http://ke.kabupro.jp/code/1828.htm i= 19
http://ke.kabupro.jp/code/1840.htm i= 20
http://ke.kabupro.jp/code/1847.htm i= 21
http:/

http://ke.kabupro.jp/code/3540.htm i= 177
http://ke.kabupro.jp/code/3541.htm i= 178
http://ke.kabupro.jp/code/3543.htm i= 179
http://ke.kabupro.jp/code/3550.htm i= 180
http://ke.kabupro.jp/code/3556.htm i= 181
http://ke.kabupro.jp/code/3559.htm i= 182
http://ke.kabupro.jp/code/3562.htm i= 183
http://ke.kabupro.jp/code/3566.htm i= 184
http://ke.kabupro.jp/code/3577.htm i= 185
http://ke.kabupro.jp/code/3607.htm i= 186
http://ke.kabupro.jp/code/3626.htm i= 187
http://ke.kabupro.jp/code/3627.htm i= 188
http://ke.kabupro.jp/code/3628.htm i= 189
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/3630.htm i= 190
http://ke.kabupro.jp/code/3636.htm i= 191
http://ke.kabupro.jp/code/3640.htm i= 192
http://ke.kabupro.jp/code/3646.htm i= 193
http://ke.kabupro.jp/code/3647.htm i= 194
http://ke.kabupro.jp/code/3649.htm i= 195
http://ke.kabupro.jp/code/3652.htm i= 196
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/3653.htm i= 197
http://ke.kabupro.jp/code/3665.htm i= 198
http://k

取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/4680.htm i= 356
http://ke.kabupro.jp/code/4709.htm i= 357
http://ke.kabupro.jp/code/4714.htm i= 358
http://ke.kabupro.jp/code/4719.htm i= 359
http://ke.kabupro.jp/code/4722.htm i= 360
http://ke.kabupro.jp/code/4732.htm i= 361
http://ke.kabupro.jp/code/4752.htm i= 362
http://ke.kabupro.jp/code/4760.htm i= 363
http://ke.kabupro.jp/code/4761.htm i= 364
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/4771.htm i= 365
http://ke.kabupro.jp/code/4812.htm i= 366
http://ke.kabupro.jp/code/4819.htm i= 367
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/4820.htm i= 368
http://ke.kabupro.jp/code/4826.htm i= 369
http://ke.kabupro.jp/code/4838.htm i= 370
http://ke.kabupro.jp/code/4840.htm i= 371
http://ke.kabupro.jp/code/4888.htm i= 372
http://ke.kabupro.jp/code/4901.htm i= 373
http://ke.kabupro.jp/code/4917.htm i= 374
http://ke.kabupro.jp/code/4918.htm i= 375
http://ke.kabupro.jp/code/4922.htm i= 376
http://ke.kabupr

http://ke.kabupro.jp/code/6664.htm i= 530
http://ke.kabupro.jp/code/6696.htm i= 531
http://ke.kabupro.jp/code/6701.htm i= 532
http://ke.kabupro.jp/code/6702.htm i= 533
http://ke.kabupro.jp/code/6703.htm i= 534
http://ke.kabupro.jp/code/6724.htm i= 535
http://ke.kabupro.jp/code/6730.htm i= 536
http://ke.kabupro.jp/code/6737.htm i= 537
http://ke.kabupro.jp/code/6752.htm i= 538
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/6753.htm i= 539
http://ke.kabupro.jp/code/6754.htm i= 540
http://ke.kabupro.jp/code/6762.htm i= 541
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/6777.htm i= 542
http://ke.kabupro.jp/code/6794.htm i= 543
http://ke.kabupro.jp/code/6804.htm i= 544
http://ke.kabupro.jp/code/6806.htm i= 545
http://ke.kabupro.jp/code/6809.htm i= 546
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/6817.htm i= 547
http://ke.kabupro.jp/code/6823.htm i= 548
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/6824.htm i= 549
http://ke.kabupro.jp/cod

http://ke.kabupro.jp/code/8225.htm i= 709
http://ke.kabupro.jp/code/8227.htm i= 710
http://ke.kabupro.jp/code/8230.htm i= 711
http://ke.kabupro.jp/code/8247.htm i= 712
http://ke.kabupro.jp/code/8255.htm i= 713
http://ke.kabupro.jp/code/8260.htm i= 714
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/8287.htm i= 715
http://ke.kabupro.jp/code/8308.htm i= 716
http://ke.kabupro.jp/code/8336.htm i= 717
http://ke.kabupro.jp/code/8358.htm i= 718
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/8366.htm i= 719
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/8387.htm i= 720
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/8395.htm i= 721
取込エラー
No objects to concatenate


http://ke.kabupro.jp/code/8439.htm i= 722
http://ke.kabupro.jp/code/8511.htm i= 723
http://ke.kabupro.jp/code/8518.htm i= 724
取込エラー
Plan shapes are not aligned


http://ke.kabupro.jp/code/8522.htm i= 725
http://ke.kabupro.jp/code/8560.htm i= 726
http://ke.kabupro.jp/code/8566.htm i= 

In [24]:
#手順3：tabulaで取得した表の確認
df_tabula1 = df_tabula1.reindex(columns=['code', '流動資産合計', '現金及び預金', '現金預金', '有形固定資産', '有形固定資産合計', 
                         '投資有価証券', '投資その他の資産合計', '流動負債合計', '固定負債合計', ])
df_tabula1

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1333,300511,31579,,,147902,43665,64393,213484,152237
0,1438,3239976,2125532,,,971599,,312646,1278725,232571
0,1447,10852865,3894837,,,1720706,215825,1246302,7571502,4709414
0,1448,39809,,6654,,21904,11164,13113,37814,15465
0,1451,12489804,3984906,,,1946262,1689,282510,5000041,4076325
...,...,...,...,...,...,...,...,...,...,...
0,9964,38009140,6437893,,,21001210,665558,2250509,25691945,4503249
0,9978,9068441,2105930,,,917594,92427,1480395,7690898,2883576
0,9983,1729266,,,151875,,,,631623,
0,9984,"△4,816,777",,,"404,062 H",,"2,495,273 M",,,


In [25]:
#手順3：tabulaで取得した表をcsvへ書込み
df_tabula1.to_csv('temp_file/全銘柄PDFデータ（手順3_tabula加工前）.csv', mode='w',
                  index=False, encoding="shift-jis", errors='none')

In [26]:
#手順3：tabulaで取得した表をcsvから読み込み、余分な文字を消す
df_tabula2 = pd.read_csv('temp_file/全銘柄PDFデータ（手順3_tabula加工前）.csv', encoding=("cp932"), header=0)

replace_feature_list = list(df_tabula2.select_dtypes(include=object).columns.values)
replace_list = [',', '△', '―', '-', '，', '\n', ' ',
                '※1', '※2', '※3', '※4', '※5', '※6', '※7', '※8', '※9',
                '※１', '※２', '※３', '※４', '※５', '※６', '※７', '※８', '※９', '\D',
                'H', 'M', '百万円']
for i in replace_feature_list:
    for j in replace_list:
        df_tabula2[i] = df_tabula2[i].str.replace(j, '')
df_tabula2

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1333,300511,31579,,,147902,43665,64393,213484,152237
1,1438,3239976,2125532,,,971599,,312646,1278725,232571
2,1447,10852865,3894837,,,1720706,215825,1246302,7571502,4709414
3,1448,39809,,6654,,21904,11164,13113,37814,15465
4,1451,12489804,3984906,,,1946262,1689,282510,5000041,4076325
...,...,...,...,...,...,...,...,...,...,...
713,9964,38009140,6437893,,,21001210,665558,2250509,25691945,4503249
714,9978,9068441,2105930,,,917594,92427,1480395,7690898,2883576
715,9983,1729266,,,151875,,,,631623,
716,9984,4816777,,,404062,,2495273,,,


In [27]:
#手順3：tabulaで再取得した銘柄のうち、十分に取り込めていない銘柄コードの抽出と削除
#tabulaはあまりうまく抽出できないため、削除する銘柄が多い
tabula_drop_list = []

#削除する銘柄コードの抽出        
for i in range(0, len(df_tabula2)):    
    if len(df_tabula2.iloc[i, :].value_counts()) <= 3:
        tabula_drop_list.append(df_tabula2.iloc[i, 0])
        print('code=', df_tabula2.iloc[i, 0], '削除：特徴量が2つ以下')
        
#削除する銘柄コードの削除
for i in tabula_drop_list:
    df_tabula2.drop(df_tabula2.index[df_tabula2['code'] == i], inplace=True)
df_tabula2

code= 2160 削除：特徴量が2つ以下
code= 2175 削除：特徴量が2つ以下
code= 2914 削除：特徴量が2つ以下
code= 2928 削除：特徴量が2つ以下
code= 3035 削除：特徴量が2つ以下
code= 3673 削除：特徴量が2つ以下
code= 3837 削除：特徴量が2つ以下
code= 3996 削除：特徴量が2つ以下
code= 4021 削除：特徴量が2つ以下
code= 4061 削除：特徴量が2つ以下
code= 4151 削除：特徴量が2つ以下
code= 4235 削除：特徴量が2つ以下
code= 4503 削除：特徴量が2つ以下
code= 4541 削除：特徴量が2つ以下
code= 4578 削除：特徴量が2つ以下
code= 4612 削除：特徴量が2つ以下
code= 4901 削除：特徴量が2つ以下
code= 4985 削除：特徴量が2つ以下
code= 5108 削除：特徴量が2つ以下
code= 5189 削除：特徴量が2つ以下
code= 5192 削除：特徴量が2つ以下
code= 5357 削除：特徴量が2つ以下
code= 5857 削除：特徴量が2つ以下
code= 5922 削除：特徴量が2つ以下
code= 5949 削除：特徴量が2つ以下
code= 6034 削除：特徴量が2つ以下
code= 6287 削除：特徴量が2つ以下
code= 6301 削除：特徴量が2つ以下
code= 6324 削除：特徴量が2つ以下
code= 6376 削除：特徴量が2つ以下
code= 6406 削除：特徴量が2つ以下
code= 6448 削除：特徴量が2つ以下
code= 6481 削除：特徴量が2つ以下
code= 6506 削除：特徴量が2つ以下
code= 6702 削除：特徴量が2つ以下
code= 6724 削除：特徴量が2つ以下
code= 6754 削除：特徴量が2つ以下
code= 6869 削除：特徴量が2つ以下
code= 6942 削除：特徴量が2つ以下
code= 6988 削除：特徴量が2つ以下
code= 7013 削除：特徴量が2つ以下
code= 7122 削除：特徴量が2つ以下
code= 7198 削除：特徴量が2つ以下
code= 7282 

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1333,300511,31579,,,147902,43665,64393,213484,152237
1,1438,3239976,2125532,,,971599,,312646,1278725,232571
2,1447,10852865,3894837,,,1720706,215825,1246302,7571502,4709414
3,1448,39809,,6654,,21904,11164,13113,37814,15465
4,1451,12489804,3984906,,,1946262,1689,282510,5000041,4076325
...,...,...,...,...,...,...,...,...,...,...
713,9964,38009140,6437893,,,21001210,665558,2250509,25691945,4503249
714,9978,9068441,2105930,,,917594,92427,1480395,7690898,2883576
715,9983,1729266,,,151875,,,,631623,
716,9984,4816777,,,404062,,2495273,,,


In [28]:
#手順3：tabulaで取得した表（加工・削除後）をcsvへ書込み
df_tabula2.to_csv('temp_file/全銘柄PDFデータ（手順3_tabula完成）.csv', mode='w',
                      index=False, encoding="shift-jis", errors='none')

In [32]:
#手順4：camelotとcamelot_reとtabulaの読出し→結合
df_camelot = pd.read_csv('temp_file/全銘柄PDFデータ（手順1_camelot完成）.csv', 
                             encoding=("cp932"), header=0)
df_camelot_re = pd.read_csv('temp_file/全銘柄PDFデータ（手順2_camelot_re完成）.csv', 
                             encoding=("cp932"), header=0)
df_tabula = pd.read_csv('temp_file/全銘柄PDFデータ（手順3_tabula完成）.csv', 
                             encoding=("cp932"), header=0)

df_pdf = pd.concat([df_camelot, df_camelot_re, df_tabula], axis=0)
df_pdf

Unnamed: 0,code,流動資産合計,現金及び預金,現金預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1301,86649,7100,,,15715.0,11682.0,13547.0,39189,37166.0
1,1332,231751,10986,,,147428.0,38076.0,86443.0,153467,134021.0
2,1352,12137,4019,,,26593.0,345.0,2390.0,11866,21666.0
3,1375,10202,,,18031.0,,,,7614,
4,1376,28828145,3447948,,,6627416.0,,2829597.0,16514107,1726482.0
...,...,...,...,...,...,...,...,...,...,...
646,9964,3.80091e+07,6.43789e+06,,,21001210.0,665558.0,2250509.0,2.56919e+07,4503249.0
647,9978,9.06844e+06,2.10593e+06,,,917594.0,92427.0,1480395.0,7.6909e+06,2883576.0
648,9983,1.72927e+06,,,151875.0,,,,631623,
649,9984,4.81678e+06,,,404062.0,,2495273.0,,,


In [33]:
#手順4：「現金預金」の値を「現金及び預金」に統合
for i in range(0, len(df_pdf)):
    if math.isnan(df_pdf.iloc[i, 3]) is False:
        df_pdf.iloc[i, 2] = df_pdf.iloc[i, 3]
del df_pdf['現金預金']

df_pdf

Unnamed: 0,code,流動資産合計,現金及び預金,有形固定資産,有形固定資産合計,投資有価証券,投資その他の資産合計,流動負債合計,固定負債合計
0,1301,86649,7100,,15715.0,11682.0,13547.0,39189,37166.0
1,1332,231751,10986,,147428.0,38076.0,86443.0,153467,134021.0
2,1352,12137,4019,,26593.0,345.0,2390.0,11866,21666.0
3,1375,10202,,18031.0,,,,7614,
4,1376,28828145,3447948,,6627416.0,,2829597.0,16514107,1726482.0
...,...,...,...,...,...,...,...,...,...
646,9964,3.80091e+07,6.43789e+06,,21001210.0,665558.0,2250509.0,2.56919e+07,4503249.0
647,9978,9.06844e+06,2.10593e+06,,917594.0,92427.0,1480395.0,7.6909e+06,2883576.0
648,9983,1.72927e+06,,151875.0,,,,631623,
649,9984,4.81678e+06,,404062.0,,2495273.0,,,


In [43]:
#手順4：結合した表をcsvへ書込み
df_pdf.to_csv('全銘柄PDFデータ（完成）.csv', mode='w',
                      index=False, encoding="shift-jis", errors='none')
df_pdf.dtypes

code            int64
流動資産合計         object
現金及び預金         object
有形固定資産        float64
有形固定資産合計      float64
投資有価証券        float64
投資その他の資産合計    float64
流動負債合計         object
固定負債合計        float64
dtype: object

In [46]:
#手順5：データのMySQLへの取込み
import mysql.connector
import csv
config = {'user':'root',
    'password' : '',
    'host' : '127.0.0.1',
    'database' : 'test',
    'use_unicode' : 'True',
    'charset' :'utf8' }
dbconnector = mysql.connector.connect(**config) 
# 接続できているか確認 
if dbconnector.is_connected():
    print("データベースへの接続が成功しました。") 
else:
    print("データベースへの接続が失敗しました。") 
    exit(1) 
# cursor オブジェクトの作成 
cursor = dbconnector.cursor(buffered = True) 

cursor.execute("""
    CREATE TABLE IF NOT EXISTS all_stock_PDFdata (
        `code` INTEGER NOT NULL ,
        `流動資産合計` INTEGER,
        `現金及び預金` INTEGER,
        `有形固定資産` INTEGER,
        `有形固定資産合計` INTEGER,
        `投資有価証券` INTEGER,
        `投資その他の資産合計` INTEGER,
        `流動負債合計` INTEGER,
        `固定負債合計` INTEGER,
        PRIMARY KEY (`code`)
        
    )
""")

operation = ("""INSERT INTO all_stock_PDFdata
                VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s)""")
seqs = [] 
with open("全銘柄PDFデータ（完成）.csv", encoding='shift-jis') as f:
    reader = csv.reader(f)
    for row in reader:
        tuples=(row[0], row[1], row[2], row[3], row[4],
                row[5], row[6], row[7], row[8],
               )
        seqs.append(tuples,)
for i in range(1, len(seqs)):
    cursor.execute(operation, seqs[i]) 

dbconnector.commit()
dbconnector.close()

データベースへの接続が成功しました。


In [None]:
###【参考】

#camelotでPDFから特徴量を「並列処理で」DataFrameへ記入　※通常の80%の時間で取り込むことが出来る
import os
import concurrent.futures as confu

with confu.ThreadPoolExecutor(max_workers=os.cpu_count()) as executor:
    for i in range(0, 30):
        code = codes[i]
        start_url = 'http://ke.kabupro.jp/code/{}.htm'.format(code)
        time.sleep(1)
        print(start_url, 'i=', i)
        executor.submit(get_pdf_camelot, start_url, code, i)