In [2]:
import sys,os
sys.path.append("..")
import django
django.setup()
import datetime
import pandas as pd
import requests
from crawlers.finlab.data_process_tools import year_transfer

In [7]:
class CrawlCompanyBasicInfoTW:
    def __init__(self):
        self.target_name = "台股企業基本資訊"
        self.sub_market = ["sii", "otc", "rotc"]



    def crawl_main(self):
        data=[]
        market_category=self.sub_market
        for market in market_category:
            url = "https://mops.twse.com.tw/mops/web/ajax_t51sb01"
            form_data = {
                "encodeURIComponent": "1",
                "step": "1",
                "firstin": "1",
                "TYPEK": market
            }

            res = requests.post(url,data = form_data)
            res.encoding = "utf-8"
            df=pd.read_html(res.text)
            df=pd.DataFrame(df[0])
            df['market'] = 'market
            data.append(df)

        df2=pd.concat(data)
        df2 = df2.astype(str)
        df2 = df2.apply(lambda s: s.str.replace(",", ""))
        df3=df2[["公司代號","公司名稱","公司簡稱","產業類別","外國企業註冊地國","住址",
                       "董事長","總經理","發言人","發言人職稱","總機電話",
                       "成立日期","上市日期","上櫃日期","興櫃日期","實收資本額(元)","已發行普通股數或TDR原發行股數",
                       "私募普通股(股)","特別股(股)","普通股盈餘分派或虧損撥補頻率","股票過戶機構","簽證會計師事務所",
                       "公司網址","投資人關係聯絡電話","投資人關係聯絡電子郵件","英文簡稱","market"]]


        df3 = df3.rename(columns={
                                    "公司代號":"stock_id","公司名稱":"name",
                                    "公司簡稱":"short_name","產業類別":"category",
                                    "外國企業註冊地國":"registered_country","住址":"address",
                                    "董事長":"chairman","總經理":"ceo",
                                    "發言人":"spokesman","發言人職稱":"spokesman_title",
                                    "總機電話":"phone","成立日期":"establishment_date",
                                    "上市日期":"sii_date","上櫃日期":"otc_date",
                                    "興櫃日期":"rotc_date","已發行普通股數或TDR原發行股數":"shares_issued",
                                    "私募普通股(股)":"private_shares","特別股(股)":"special_shares",
                                    "普通股盈餘分派或虧損撥補頻率":"dividend_frequency","股票過戶機構":"stock_transfer_institution",
                                    "簽證會計師事務所":"visa_accounting_firm","公司網址":"website",
                                    "投資人關係聯絡電話":"investor_relations_contact","投資人關係聯絡電子郵件":"investor_relations_email",
                                    "英文簡稱":"english_abbreviation","實收資本額(元)":"capital"

                                    })
        #Data format Process
        df3=df3[df3["stock_id"]!="公司代號"]
        df3["registered_country"]=df3["registered_country"].apply(lambda s: s.replace("－", "台灣"))

        for share_column in ["capital","shares_issued","private_shares","special_shares"]:
            df3[share_column]=df3[share_column].apply(lambda s:pd.to_numeric(s, errors="coerce"))

        for date_column in ["establishment_date","sii_date","otc_date","rotc_date"]:
            df3[date_column]=df3[date_column].apply(lambda t:year_transfer(t))

        df3["update_time"]=datetime.datetime.now().date()

        df3 = df3.fillna('')
        return df3

In [8]:
C=CrawlCompanyBasicInfoTW()
df=C.crawl_main()
df

Unnamed: 0,stock_id,name,short_name,category,registered_country,address,chairman,ceo,spokesman,spokesman_title,...,special_shares,dividend_frequency,stock_transfer_institution,visa_accounting_firm,website,investor_relations_contact,investor_relations_email,english_abbreviation,market,update_time
0,1101,台灣水泥股份有限公司,台泥,水泥工業,台灣,台北市中山北路2段113號,張安平,李鐘培,黃健強,資深副總經理,...,200000000,每年,中國信託商業銀行代理部,勤業眾信聯合會計師事務所,http://www.taiwancement.com,02-25317099分機20358,ir@taiwancement.com,TCC,上市,2020-05-06
1,1102,亞洲水泥股份有限公司,亞泥,水泥工業,台灣,台北市大安區敦化南路2段207號30、31樓,徐旭東,李坤炎,周維崑,副總經理,...,0,每年,亞東證券股份有限公司,勤業眾信聯合會計師事務所,www.acc.com.tw,02 27338000 ext.8336,ir@acc.com.tw,ACC,上市,2020-05-06
2,1103,嘉新水泥股份有限公司,嘉泥,水泥工業,台灣,台北市中山北路2段96號,張剛綸,祁士鉅,王立心,執行副總經理,...,0,每年,群益金鼎證券股份有限公司股代部,勤業眾信聯合會計師事務所,www.chcgroup.com.tw,(02)2551-5211#243,ir@chcgroup.com.tw,CHC,上市,2020-05-06
3,1104,環球水泥股份有限公司,環泥,水泥工業,台灣,台北市南京東路二段125號10樓,侯博義,侯博義,楊宗仁,協理,...,0,每年,華南永昌綜合證券(股)股務代理部,勤業眾信聯合會計師事務所,www.ucctw.com,02-2507-7801,p1590@ucctw.com,UCC,上市,2020-05-06
4,1108,幸福水泥股份有限公司,幸福,水泥工業,台灣,台北市松江路237號15樓,陳兩傳,陳兩傳,溫秀菊,財務部經理,...,0,每半會計年度,永豐金證券股務代理,勤業眾信聯合會計師事務所,www.luckygrp.com.tw,25092188,wendy@luckygrp.com.tw,LUCKY CEMENT,上市,2020-05-06
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
261,8490,台灣利得生物科技股份有限公司,利得,農業科技,台灣,台北市大同區承德路二段81號13樓之1,廖年毓,林進忠,陳惠英,協理,...,0,每年,日盛證券股務代理部,資誠聯合會計師事務所,www.twleaderlife.com,－,－,LE,興櫃,2020-05-06
262,8491,真好玩娛樂科技股份有限公司,真好玩,文化創意業,台灣,台北市中山區南京東路三段２２５號７樓,周玄昆,劉志成,吳旭東,財務長,...,0,每年,永豐金證券股份有限公司,資誠聯合會計師事務所,www.9splay.com.tw,－,－,9Splay,興櫃,2020-05-06
263,8492,兔將創意影業股份有限公司,兔將,文化創意業,台灣,台北市內湖區洲子街71號7樓,李昭樺,李昭樺,李昭樺,總經理,...,0,每年,福邦證券股份有限公司,資誠聯合會計師事務所,http://www.twrglobal.com,－,－,TWR,興櫃,2020-05-06
264,8495,經緯航太科技股份有限公司,經緯航,其他,台灣,台南市東區東門路３段２５３號１２樓,羅正方,羅正方,王國楨,財務長,...,0,每年,宏遠證券股份有限公司,安永聯合會計師事務所,http://www.geosat.com.tw/,－,－,GEOSAT,興櫃,2020-05-06


In [None]:
#pycharm 測試
import sys,os
sys.path.append("..")
import django
django.setup()
from crawlers.models import *
# from crawlers.finlab.pioneers import *
# from crawlers.finlab.import_tools import *

In [None]:
add_to_sql(CompanyBasicInfoTW, df)

In [11]:
df

Unnamed: 0,stock_id,update_time,name,short_name,category,registered_country,address,chairman,ceo,spokesman,...,private_shares,special_shares,dividend_frequency,stock_transfer_institution,visa_accounting_firm,website,investor_relations_contact,investor_relations_email,english_abbreviation,market
0,1101,2020-05-01 23:15:03.291021,台灣水泥股份有限公司,台泥,水泥工業,台灣,台北市中山北路2段113號,張安平,李鐘培,黃健強,...,0,200000000,每年,中國信託商業銀行代理部,勤業眾信聯合會計師事務所,http://www.taiwancement.com,02-25317099分機20358,ir@taiwancement.com,TCC,上市
1,1102,2020-05-01 23:15:03.291021,亞洲水泥股份有限公司,亞泥,水泥工業,台灣,台北市大安區敦化南路2段207號30、31樓,徐旭東,李坤炎,周維崑,...,0,0,每年,亞東證券股份有限公司,勤業眾信聯合會計師事務所,www.acc.com.tw,02 27338000 ext.8336,ir@acc.com.tw,ACC,上市
2,1103,2020-05-01 23:15:03.291021,嘉新水泥股份有限公司,嘉泥,水泥工業,台灣,台北市中山北路2段96號,張剛綸,祁士鉅,王立心,...,0,0,每年,群益金鼎證券股份有限公司股代部,勤業眾信聯合會計師事務所,www.chcgroup.com.tw,(02)2551-5211#243,ir@chcgroup.com.tw,CHC,上市
3,1104,2020-05-01 23:15:03.291021,環球水泥股份有限公司,環泥,水泥工業,台灣,台北市南京東路二段125號10樓,侯博義,侯博義,楊宗仁,...,0,0,每年,華南永昌綜合證券(股)股務代理部,勤業眾信聯合會計師事務所,www.ucctw.com,02-2507-7801,p1590@ucctw.com,UCC,上市
4,1108,2020-05-01 23:15:03.291021,幸福水泥股份有限公司,幸福,水泥工業,台灣,台北市松江路237號15樓,陳兩傳,陳兩傳,溫秀菊,...,0,0,每半會計年度,永豐金證券股務代理,勤業眾信聯合會計師事務所,www.luckygrp.com.tw,25092188,wendy@luckygrp.com.tw,LUCKY CEMENT,上市
5,1109,2020-05-01 23:15:03.291021,信大水泥股份有限公司,信大,水泥工業,台灣,台北市寶慶路37號7樓,楊智雄,楊大寬,吳連富,...,0,0,每年,中國信託商業銀行代理部,資誠聯合會計師事務所,www.hsingta.com.tw,02-23816731#160,june@hsingta.com.tw,HsingTa,上市
6,1110,2020-05-01 23:15:03.291021,東南水泥股份有限公司,東泥,水泥工業,台灣,高雄市前金區五福三路21號4樓之1,陳敏斷,吳長直,黃薪翰,...,0,0,每年,元大證券股份有限公司,國富浩華聯合會計師事務所,www.southeastcement.com.tw,07-2711121,vance.huang@secement.com,TUNA CEMENT,上市
7,1201,2020-05-01 23:15:03.291021,味全食品工業股份有限公司,味全,食品工業,台灣,台北市松江路125號,陳宏裕,張教華,黃國禎,...,0,0,每年,元大證券股務代理部,資誠聯合會計師事務所,http://www.weichuan.com.tw,(02)25065020,KC_Huang@weichuan.com.tw,WEI CHUAN,上市
8,1203,2020-05-01 23:15:03.291021,味王股份有限公司,味王,食品工業,台灣,台北市中山北路二段79號5樓,陳清福,陳恭平,魏璟雄,...,0,0,每年,群益金鼎證券股份有限公司,大中國際聯合會計師事務所,http://www.vewong.com,(02)25717271-610,wei@vewong.com.tw,VE WONG,上市
9,1210,2020-05-01 23:15:03.291021,大成長城企業股份有限公司,大成,食品工業,台灣,台南市永康區蔦松二街三號,韓家宇,莊坤炎,周叔恆,...,0,0,每年,中國信託商業銀行代理部,安侯建業會計師事務所,http://www.dachan.com,02-26577111,john@greatwall-group.com,GREATWALL,上市
