In [15]:
# read the stock_abbr dir and get the stock info from 股票基本信息.csv

import chardet
import csv

def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
        result = chardet.detect(f.read())
    return result['encoding']

def get_stock_info(file_path = './stock_abbr/股票基本信息.csv'):
    
    encoding = detect_encoding(file_path)  # 自动检测编码

    stock_info_list = []  # 用于存储每条信息的 key-value 字典

    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.DictReader(f)  # 使用 DictReader 自动将第一行作为字段名

        for row in reader:
            stock_info_list.append(dict(row))  # 将每一行转换为字典并添加到列表中

    return stock_info_list

# 调用函数并打印结果
stock_info_list = get_stock_info()
print(stock_info_list)



[{'secu_code': '000001.SZ', 'secu_abbr': '平安银行', 'chi_spelling': 'PAYH', 'listed_date': '1991.04.03', 'listed_sector': '1', 'industry_code': '480301', 'first_industry_name': '银行', 'second_industry_name': '股份制银行Ⅱ', 'third_industry_name': '股份制银行Ⅲ'}, {'secu_code': '000002.SZ', 'secu_abbr': '万科A', 'chi_spelling': 'WKA', 'listed_date': '1991.01.29', 'listed_sector': '1', 'industry_code': '430101', 'first_industry_name': '房地产', 'second_industry_name': '房地产开发', 'third_industry_name': '住宅开发'}, {'secu_code': '000004.SZ', 'secu_abbr': '国华网安', 'chi_spelling': 'GHWA', 'listed_date': '1990.12.01', 'listed_sector': '1', 'industry_code': '710402', 'first_industry_name': '计算机', 'second_industry_name': '软件开发', 'third_industry_name': '横向通用软件'}, {'secu_code': '000006.SZ', 'secu_abbr': '深振业A', 'chi_spelling': 'SZYA', 'listed_date': '1992.04.27', 'listed_sector': '1', 'industry_code': '430101', 'first_industry_name': '房地产', 'second_industry_name': '房地产开发', 'third_industry_name': '住宅开发'}, {'secu_code': '000

In [17]:
# change stock list  to a dict with key as the parameter
def stock_list_to_dict(stock_list, key):
    # check if the key is in the stock_list
    if key not in stock_list[0].keys():
        # raise an error if the key is not in the stock_list
        raise ValueError('The key is not in the stock_list')
    # create a dict to store the stock info
    stock_dict = {}
    # loop through the stock_list
    for stock in stock_list:
        # add the stock info to the stock_dict with the key as the key
        stock_dict[stock[key]] = stock
    return stock_dict

# 调用函数并打印结果
# stock_dict = stock_list_to_dict(stock_info_list, '股票代码')


stock_dict = stock_list_to_dict(stock_info_list, 'secu_code')
print(stock_dict)

{'000001.SZ': {'secu_code': '000001.SZ', 'secu_abbr': '平安银行', 'chi_spelling': 'PAYH', 'listed_date': '1991.04.03', 'listed_sector': '1', 'industry_code': '480301', 'first_industry_name': '银行', 'second_industry_name': '股份制银行Ⅱ', 'third_industry_name': '股份制银行Ⅲ'}, '000002.SZ': {'secu_code': '000002.SZ', 'secu_abbr': '万科A', 'chi_spelling': 'WKA', 'listed_date': '1991.01.29', 'listed_sector': '1', 'industry_code': '430101', 'first_industry_name': '房地产', 'second_industry_name': '房地产开发', 'third_industry_name': '住宅开发'}, '000004.SZ': {'secu_code': '000004.SZ', 'secu_abbr': '国华网安', 'chi_spelling': 'GHWA', 'listed_date': '1990.12.01', 'listed_sector': '1', 'industry_code': '710402', 'first_industry_name': '计算机', 'second_industry_name': '软件开发', 'third_industry_name': '横向通用软件'}, '000006.SZ': {'secu_code': '000006.SZ', 'secu_abbr': '深振业A', 'chi_spelling': 'SZYA', 'listed_date': '1992.04.27', 'listed_sector': '1', 'industry_code': '430101', 'first_industry_name': '房地产', 'second_industry_name': '房地产开发'

In [18]:
# add t_stock_archive.csv file info to the stock_dict
def get_stock_archive_info(stock_dict,file_path = './stock_abbr/t_stock_archive.csv'):
    encoding = detect_encoding(file_path)  # 自动检测编码


    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.DictReader(f)  # 使用 DictReader 自动将第一行作为字段名

        for row in reader:
            # check if the stock_code is in the stock_dict
            if row['secu_code'] in stock_dict.keys():
                # add the stock_archive info to the stock_dict
                stock_dict[row['secu_code']]['company_profile'] = row['company_profile']

    return stock_dict


stock_dict_new = get_stock_archive_info(stock_dict)

print(stock_dict_new)

{'000001.SZ': {'secu_code': '000001.SZ', 'secu_abbr': '平安银行', 'chi_spelling': 'PAYH', 'listed_date': '1991.04.03', 'listed_sector': '1', 'industry_code': '480301', 'first_industry_name': '银行', 'second_industry_name': '股份制银行Ⅱ', 'third_industry_name': '股份制银行Ⅲ', 'company_profile': '平安银行是一家总部设在深圳的全国性股份制商业银行,其前身深圳发展银行是中国内地首家公开上市的全国性股份制银行。本行坚守金融为民的初心,经过多年发展,已成长为一家经营管理成熟稳健、机构网点覆盖广泛、金融服务品类齐全、品牌影响市场领先的商业银行,在科技赋能、零售业务、综合金融等领域形成独特竞争力和鲜明经营特色。公司从事的主要业务(一)吸收公众存款;(二)发放短期、中期和长期贷款;(三)办理国内外结算;(四)办理票据承兑与贴现;(五)发行金融债券;(六)代理发行、代理兑付、承销政府债券;(七)买卖政府债券、金融债券;(八)从事同业拆借;(九)买卖、代理买卖外汇;(十)从事银行卡业务;(十一)提供信用证服务及担保;(十二)代理收付款项及代理保险业务;(十三)提供保管箱服务;(十四)结汇、售汇业务;(十五)离岸银行业务;(十六)资产托管业务;(十七)办理黄金业务;(十八)财务顾问、资信调查、咨询、见证业务;(十九)经有关监管机构批准的其他业务。企业荣誉:“2022年度中国最佳股份制零售银行、2022年度中国最佳中小企业银行、2022年度最佳汽车贷款产品、粤港澳大湾区最佳银行——大湾区最佳数字银行、荣获广东金融学会2023年“广东绿色金融改革创新推广案例奖”、深圳绿色金融协会2023年“绿色金融产品创新奖”及网易财经2023年度“绿色金融先锋奖”等。获得“金融物联网创新项目奖”“金融大数据创新项目奖”“金融云创新项目奖”。获得“年度创新机构”“信贷资产证券化年度优秀项目”两项大奖。获得“最受尊敬企业”荣誉。2024年末,本行共有110家分行(含香港分行),合计1,149家营业机构。'}, '000002.SZ': {'secu_