In [15]:
import akshare as ak
import pandas as pd
from utils import connect_to_database

# 创建数据库连接
engine = connect_to_database()

# 获取当前最新的沪深300成分股列表
symbols = ["000300", "000985","000852","000905"]
for symbol in symbols:
    print(f"正在处理指数: {symbol}")
     # 定义表名
    table_name = f"index_{symbol}_cons"

    # 获取新数据
    new_data_df = ak.index_stock_cons_weight_csindex(symbol=symbol)

    try:
        # 尝试读取现有数据
        existing_data_df = pd.read_sql_table(table_name, engine)

        combined_df = pd.concat([existing_data_df, new_data_df], ignore_index=True)
        combined_df = combined_df.drop_duplicates(subset=["日期", "指数代码"]).reset_index(drop=True)

    except Exception as e:
        print(f"读取现有数据时出错: {e}, 将创建新表")
        combined_df = new_data_df

    # 写入数据库
    combined_df.to_sql(table_name, engine, if_exists="replace", index=False)
    print(f"数据已更新到表 {table_name}")
    print(f"新增 {len(new_data_df)} 条记录，当前总共 {len(combined_df)} 条记录")
engine.dispose()

连接到数据库...
正在处理指数: 000300
读取现有数据时出错: Table index_000300_cons not found, 将创建新表
数据已更新到表 index_000300_cons
新增 300 条记录，当前总共 300 条记录
正在处理指数: 000985
读取现有数据时出错: Table index_000985_cons not found, 将创建新表
数据已更新到表 index_000985_cons
新增 5068 条记录，当前总共 5068 条记录
正在处理指数: 000852
读取现有数据时出错: Table index_000852_cons not found, 将创建新表
数据已更新到表 index_000852_cons
新增 1000 条记录，当前总共 1000 条记录
正在处理指数: 000905
读取现有数据时出错: Table index_000905_cons not found, 将创建新表
数据已更新到表 index_000905_cons
新增 500 条记录，当前总共 500 条记录


In [29]:
index_stock_cons_df = ak.index_stock_cons_sina(symbol="000905")
print(index_stock_cons_df)

       symbol  name   trade pricechange changepercent     buy    sell  \
0    sh600004  白云机场   9.660      -0.030        -0.310   9.650   9.660   
1    sh600007  中国国贸  21.130       0.000         0.000  21.120  21.130   
2    sh600008  首创环保   3.130      -0.010        -0.318   3.120   3.130   
3    sh600021  上海电力  20.790      -2.310       -10.000   0.000  20.790   
4    sh600032  浙江新能   7.700      -0.080        -1.028   7.700   7.710   
..        ...   ...     ...         ...           ...     ...     ...   
495  sz301301  川宁生物  11.500      -0.060        -0.519  11.490  11.500   
496  sz301308   江波龙  92.470      -0.590        -0.634  92.470  92.490   
497  sz301358  湖南裕能  39.360      -2.210        -5.316  39.320  39.360   
498  sz301498  乖宝宠物  97.090      -1.760        -1.780  97.090  97.140   
499  sz301536  星宸科技  61.940       0.450         0.732  61.940  61.950   

    settlement    open    high     low    volume      amount    code  ticktime  
0        9.690   9.660   9.690   9.640   8

In [21]:
import tushare as ts

In [22]:
pro = ts.pro_api("94f520e0621fbeaef1471aa3e8c747e67d24898418d3412522f0fa60")

In [28]:
hs300 = pro.index_weight(index_code="000300.SH", start_date="20250101", end_date="20250910")
print(hs300)

     index_code   con_code trade_date  weight
0     000300.SH  600519.SH   20250901  3.8616
1     000300.SH  300750.SZ   20250901  3.3453
2     000300.SH  601318.SH   20250901  2.6228
3     000300.SH  600036.SH   20250901  2.1642
4     000300.SH  601899.SH   20250901  1.6725
...         ...        ...        ...     ...
5095  000300.SH  601808.SH   20250102  0.0444
5096  000300.SH  688082.SH   20250102  0.0431
5097  000300.SH  000800.SZ   20250102  0.0391
5098  000300.SH  600377.SH   20250102  0.0375
5099  000300.SH  001289.SZ   20250102  0.0114

[5100 rows x 4 columns]


In [24]:
hs300['trade_date'].unique()

array(['20250901', '20250829', '20250801', '20250731', '20250701',
       '20250630', '20250603', '20250530', '20250506', '20250430',
       '20250401', '20250331', '20250303', '20250228', '20250205',
       '20250127', '20250102'], dtype=object)

In [27]:
zz500 = pro.index_weight(
    index_code="000905.SH", start_date="20210101", end_date="20240910"
)
print(zz500["trade_date"].unique())
print(len(zz500))

['20240830' '20240731' '20240628' '20240531' '20240430' '20240329'
 '20240229' '20240131' '20231229' '20231130' '20231031' '20230928']
6000


In [30]:
new_data_df = ak.index_stock_cons_weight_csindex(symbol="000905")
print(new_data_df)

             日期    指数代码   指数名称   指数英文名称   成分券代码 成分券名称  \
0    2025-08-29  000905  中证500  CSI 500  000009  中国宝安   
1    2025-08-29  000905  中证500  CSI 500  000021   深科技   
2    2025-08-29  000905  中证500  CSI 500  000027  深圳能源   
3    2025-08-29  000905  中证500  CSI 500  000032  深桑达A   
4    2025-08-29  000905  中证500  CSI 500  000034  神州数码   
..          ...     ...    ...      ...     ...   ...   
495  2025-08-29  000905  中证500  CSI 500  688772  珠海冠宇   
496  2025-08-29  000905  中证500  CSI 500  688777  中控技术   
497  2025-08-29  000905  中证500  CSI 500  688778  厦钨新能   
498  2025-08-29  000905  中证500  CSI 500  688819  天能股份   
499  2025-08-29  000905  中证500  CSI 500  689009  九号公司   

                                        成分券英文名称      交易所  \
0                    China Baoan Group Co.,Ltd.  深圳证券交易所   
1           Shenzhen Kaifa Technology Co., Ltd.  深圳证券交易所   
2                  Shenzhen Energy Group Co Ltd  深圳证券交易所   
3                  Shenzhen SED Industry Co Ltd  深圳证券交易所   
4              