In [122]:
# 这个notebook是用来把设计表里平铺的数据，散落/更新/添加/修改到项目的配置表里
# 这张表格是设计表： intermediateTables\PreCATFishesOrigin.xlsx
# 我们要使用它，来向 configs\xlsx_channel\2001\fish_env_affinity.xlsx 以及 configs\xlsx_channel\2001\fish_pond.xlsx 中添加/修改数据
# 数据应该是单向流动的，尽量不要修改configs目录下的表格
import os.path

rootPath = ".."
ORIGIN_TABLE = r"intermediateTables\PreCATFishesOrigin.xlsx"
AffinitySpreadSheet = r"configs\xlsx_channel\2001\fish_env_affinity.xlsx"
PondSpreadSheet = r"configs\xlsx_channel\2001\fish_pond.xlsx"

ORIGIN_TABLE = os.path.join(rootPath, ORIGIN_TABLE)
AffinitySpreadSheet = os.path.join(rootPath, AffinitySpreadSheet)
PondSpreadSheet = os.path.join(rootPath, PondSpreadSheet)

sheetOrigin = "鱼种设计表"
sheetDictQuality = "品质字典"

startColumnNameStruct = "|调整后遮蔽"
startColumnNameBait = "|饵"
startColumnNameWaterLayer = "|觅食层"
startColumnNameTemp = "|温度"

columnNameFishSpeci = "Species"

dictTempColumns = {
    "中间温":"temperature_fav",
    "调整后温度耐受":"temp_affected_ratio",
    "温度耐受阈值":"temp_threshold",
    }

In [123]:
import pandas as pd

OriginDf = pd.read_excel(ORIGIN_TABLE, sheet_name="鱼种设计表")
# OriginDf.head()
OriginDf.columns

dictQualityDf = pd.read_excel(ORIGIN_TABLE, sheet_name=sheetDictQuality)


In [124]:
# 把columns切成几段，以那些|开头的为分割线
def split_columns(columns):
    split_columns = []
    current_segment = []
    for col in columns:
        # 强制转为字符串再判断前缀，避免非 str 类型（如 int）报错
        if str(col).startswith("|"):
            if current_segment:
                split_columns.append(current_segment)
            current_segment = [col]
        else:
            current_segment.append(col)
    if current_segment:
        split_columns.append(current_segment)
    return split_columns

# print the segments
splittedCols = split_columns(OriginDf.columns)
print(splittedCols)

for segment in splittedCols:
    print(segment)

[['Species', '鱼种', '是否保底', '等阶', '细化等阶', '备注', '本阶内单条价格', '品质', '地图', '阶内权重', 'xp参考', 'gold参考'], ['|温度', '舒适温度min', '舒适温度max', '中间温', '温度耐受', '温度耐受调整', '调整后温度耐受', '温度耐受阈值'], ['|遮蔽', '[水下结构体]开放水域', '[水下结构体]水草', '[水下结构体]石头', '[水下结构体]沉木', '[水下结构体]桥墩'], ['|调整后遮蔽', '[水下结构体]开放水域.1', '[水下结构体]水草.1', '[水下结构体]石头.1', '[水下结构体]沉木.1', '[水下结构体]桥墩.1'], ['|觅食层', '[地图水层]表层', '[地图水层]中层', '[地图水层]底层'], ['|饵', '[真饵]昆虫', '[真饵]甲壳', '[真饵]鱼饵', '[真饵]鱼块', '[真饵]鱼卵', '[真饵]面团', '[真饵]谷物', '[拟饵]T尾', '[拟饵]卷尾', '[拟饵]软虫', '[拟饵]虾管', '[拟饵]米诺', '[拟饵]波爬', '[拟饵]勺子亮片', '[拟饵]旋转亮片', '[拟饵]VIB', '[拟饵]水面拖拉机', '[拟饵]铅笔'], ['|其他', '气压敏感度'], ['|推演水温亲和', '摄氏度下亲和度', 10, 12, 14, 16, 18, 20, 22, 24, 26]]
['Species', '鱼种', '是否保底', '等阶', '细化等阶', '备注', '本阶内单条价格', '品质', '地图', '阶内权重', 'xp参考', 'gold参考']
['|温度', '舒适温度min', '舒适温度max', '中间温', '温度耐受', '温度耐受调整', '调整后温度耐受', '温度耐受阈值']
['|遮蔽', '[水下结构体]开放水域', '[水下结构体]水草', '[水下结构体]石头', '[水下结构体]沉木', '[水下结构体]桥墩']
['|调整后遮蔽', '[水下结构体]开放水域.1', '[水下结构体]水草.1', '[水下结构体]石头.1', '[水下结构体]沉木.1', '[水下结构体]桥墩.1']
['|觅食层'

In [125]:
# 从splittedCols里取出以startColumnNameStruct开头的segment,并去除startColumnNameStruct这一列
# 然后动态的遍历修改AffinitySpreadSheet中的数据
def get_segment_by_start_name(splittedCols, startName):
    for segment in splittedCols:
        if segment[0].startswith(startName):
            return segment[1:]
    return None

# 取出以|遮蔽开头的segment,并去除|遮蔽这一列
segmentStruct = get_segment_by_start_name(splittedCols, startColumnNameStruct)
print(segmentStruct)


['[水下结构体]开放水域.1', '[水下结构体]水草.1', '[水下结构体]石头.1', '[水下结构体]沉木.1', '[水下结构体]桥墩.1']


In [126]:
# 开始遍历修改AffinitySpreadSheet中的数据
import openpyxl

openpyxl.open(AffinitySpreadSheet, read_only=False, keep_links=False)
AffinityPyxl = openpyxl.load_workbook(AffinitySpreadSheet)
# 温度sheet的名字是“TempAffinity”
tempAffinitySheetPath = AffinityPyxl["TempAffinity"]
structAffinitySheetPath = AffinityPyxl["StructAffinity"]
baitTypeAffinitySheetPath = AffinityPyxl["BaitTypeAffinity"]
topAffinitySheetPath = AffinityPyxl["FishEnvAffinity"]


In [None]:
topAffinitySheet = AffinityPyxl["FishEnvAffinity"]

fishNames = OriginDf[columnNameFishSpeci].tolist()
originRows = OriginDf.shape[0]

def getFishNameRowFromTopAffinitySheet(fishName,quality) -> int:
    qualityStr = dictQualityDf[dictQualityDf["品质"] == quality]["后缀"].values[0]

    prefixedFishName = f"Fish_{fishName}{qualityStr}"
    # 在表格中查找这个名字
    foundFishName = False
    # 在表格中B列查找这个名字
    for row in range(2, topAffinitySheet.max_row + 1):
        cell = topAffinitySheet.cell(row=row, column=2)
        if cell.value == prefixedFishName:
            foundFishName = True
            return row
            break
    if not foundFishName:
        lastId = topAffinitySheet.cell(row=topAffinitySheet.max_row, column=1).value
        if lastId is None:
            lastId = 1010300
        else:
            newId = lastId + 10 - lastId % 10

        # add a new row, and set the fish name in B column
        new_row = topAffinitySheet.max_row + 1
        topAffinitySheet.cell(row=new_row, column=2, value=prefixedFishName)
        topAffinitySheet.cell(row=new_row, column=1, value=newId)
        # set the fish name in the 3rd column
        topAffinitySheet.cell(row=new_row, column=3, value=fishName)
        return new_row
    return -1
        
for row in range(originRows):
    fishName = OriginDf.iloc[row][columnNameFishSpeci]
    qualities = OriginDf["品质"][row].split("、")
    for quality in qualities:
        # 先在表格中查找这个名字
        getFishNameRowFromTopAffinitySheet(fishName,quality)

AttributeError: 'int' object has no attribute 'split'

## 水下结构体数据格式转换
将源表中的宽格式数据（每行一种鱼有多列不同结构体的数值）转换成目标表中的结构化格式（每行一种鱼，结构体类型和系数交替排列的多列）

In [None]:
import pandas as pd
from openpyxl.utils.dataframe import dataframe_to_rows

# 定义宽格式转结构化格式的函数
def convert_wide_to_structured(source_df, struct_columns):
    """
    将源表中的宽格式数据转换为目标表中的结构化格式
    
    参数:
    - source_df: 源DataFrame，包含鱼类和结构体系数
    - struct_columns: 水下结构体列名列表
    
    返回:
    - 转换后的DataFrame，适合写入目标表格
    """
    # 获取鱼种名称列 (如果存在)
    fish_name_col = 'name' if 'name' in source_df.columns else 'Species'
    
    # 准备结果DataFrame
    result_rows = []
    
    # 为每个鱼种创建一行
    for idx, row in source_df.iterrows():
        # 开始构建新行
        new_row = {}
        
        # 添加ID和鱼名 (如果存在)
        if 'id' in source_df.columns:
            new_row['id'] = row['id']
        if fish_name_col in source_df.columns:
            new_row['name'] = row[fish_name_col]
        
        # 为每个结构体类型添加一对struct_type和coeff列
        for i, struct_type in enumerate(struct_columns):
            # 确定struct_type列和coeff列的名称
            type_col = f'struct_type{"" if i == 0 else f".{i}"}'  
            coeff_col = f'coeff{"" if i == 0 else f".{i}"}'
            
            # 将结构类型名称和系数值放入对应列
            new_row[type_col] = struct_type
            new_row[coeff_col] = float(row[struct_type])
        
        # 添加备注列 (如果存在)
        if 'mark' in source_df.columns:
            new_row['mark'] = row['mark']
        elif '备注' in source_df.columns:
            new_row['mark'] = row['备注']
        
        # 将新行添加到结果中
        result_rows.append(new_row)
    
    # 创建结果DataFrame
    result_df = pd.DataFrame(result_rows)
    return result_df

In [None]:
# 将OriginDf中的水下结构体数据转换为目标格式并保存

# 1. 从设计表中提取水下结构体列
struct_columns = segmentStruct  # 使用之前提取的结构体列名
print("水下结构体列名:", struct_columns)

# 2. 转换为结构化格式
structured_df = convert_wide_to_structured(OriginDf, struct_columns)

# 3. 检查结果
print("\n转换后的前5行:")
print(structured_df.head())

# 4. 保存到Excel文件（可选）
output_path = os.path.join(rootPath, "intermediateTables", "StructuredEnvData.xlsx")
structured_df.to_excel(output_path, sheet_name='StructAffinity', index=False)
print(f"\n已保存结构化数据到: {output_path}")

水下结构体列名: ['[水下结构体]开放水域.1', '[水下结构体]水草.1', '[水下结构体]石头.1', '[水下结构体]沉木.1', '[水下结构体]桥墩.1']

转换后的前5行:
            name    struct_type  coeff struct_type.1  coeff.1 struct_type.2  \
0          Tench  [水下结构体]开放水域.1    0.0   [水下结构体]水草.1      0.0   [水下结构体]石头.1   
1   Golden_Bream  [水下结构体]开放水域.1    0.0   [水下结构体]水草.1      0.0   [水下结构体]石头.1   
2  Green_Sunfish  [水下结构体]开放水域.1    0.6   [水下结构体]水草.1      1.0   [水下结构体]石头.1   
3  Black_Crappie  [水下结构体]开放水域.1    0.6   [水下结构体]水草.1      1.0   [水下结构体]石头.1   
4  White_Crappie  [水下结构体]开放水域.1    0.6   [水下结构体]水草.1      1.0   [水下结构体]石头.1   

   coeff.2 struct_type.3  coeff.3 struct_type.4  coeff.4  \
0      0.0   [水下结构体]沉木.1      1.0   [水下结构体]桥墩.1      0.0   
1      0.0   [水下结构体]沉木.1      1.0   [水下结构体]桥墩.1      0.0   
2      0.6   [水下结构体]沉木.1      0.0   [水下结构体]桥墩.1      0.0   
3      0.6   [水下结构体]沉木.1      0.0   [水下结构体]桥墩.1      0.0   
4      0.6   [水下结构体]沉木.1      0.6   [水下结构体]桥墩.1      0.0   

                      mark  
0                      NaN  
1  在地图中间弄

In [None]:
structSheet = AffinityPyxl['StructAffinity']

for r_idx, originRow in enumerate(dataframe_to_rows(structured_df, index=False, header=False)):
    rowInTopAffinitySheet = getFishNameRowFromTopAffinitySheet(originRow[0])
    print(f"RowInTopAffinitySheet : ", rowInTopAffinitySheet)
    if rowInTopAffinitySheet == -1:
        print(f"没有找到鱼种 {originRow[0]} 的行名")
        continue
    print(f"Row : ", originRow)
    targetRowName = "Cover_" + originRow[0]

    topAffinitySheet.cell(row=rowInTopAffinitySheet, column=4, value=targetRowName)
    # print(targetRowName)
    headlessRow = originRow[1:-1] # 去掉行名和最后一列的备注
    # print(headlessRow)
    # 在第二列查找行名
    for cell in structSheet["B"]:
        if cell.value == targetRowName:
            # 找到行名，更新数据,更新的方法是将cell对应的行里，0、1元素不变，2（即第三个元素）号元素起，跟headlessRoww一样长的元素，使用headlessRow的值
            n = len(headlessRow)
            for i in range(n):
                structSheet.cell(row=cell.row, column=i+3, value=headlessRow[i])
            break
    else:
        # 如果没有找到行名，则添加新行, and keep the added row as a reference
        # 这里的row[1:]是去掉了行名的部分
        # 这一行的第一个数据是id，用上一行的id往上涨，涨到一个最近的能被10整除的数；
        # 也就是说，id是10的倍数
        maxRow = structSheet.max_row
        lastId = structSheet.cell(maxRow, 1).value
        if lastId is None:
            lastId = 2010000
        else:
            lastId = int(lastId)
        newId = lastId + 10 - (lastId % 10)
        # print(lastId)
        # add a new row, and keep the added row as a reference, the first cell is newId, the second cell is the row name, appended are headlessRow
        newRow = [newId, targetRowName] + list(headlessRow)
        structSheet.append(newRow)

AffinityPyxl.save(AffinitySpreadSheet)
AffinityPyxl.save("StructAffinity")
# AffinityPyxl.close()

RowInTopAffinitySheet :  126
Row :  ['Tench', '[水下结构体]开放水域.1', 0.0, '[水下结构体]水草.1', 0.0, '[水下结构体]石头.1', 0.0, '[水下结构体]沉木.1', 1.0, '[水下结构体]桥墩.1', 0.0, nan]
RowInTopAffinitySheet :  127
Row :  ['Golden_Bream', '[水下结构体]开放水域.1', 0.0, '[水下结构体]水草.1', 0.0, '[水下结构体]石头.1', 0.0, '[水下结构体]沉木.1', 1.0, '[水下结构体]桥墩.1', 0.0, '在地图中间弄个特殊的地方放，并在水面上做点提示']
RowInTopAffinitySheet :  128
Row :  ['Green_Sunfish', '[水下结构体]开放水域.1', 0.6, '[水下结构体]水草.1', 1.0, '[水下结构体]石头.1', 0.6, '[水下结构体]沉木.1', 0.0, '[水下结构体]桥墩.1', 0.0, nan]
RowInTopAffinitySheet :  129
Row :  ['Black_Crappie', '[水下结构体]开放水域.1', 0.6, '[水下结构体]水草.1', 1.0, '[水下结构体]石头.1', 0.6, '[水下结构体]沉木.1', 0.0, '[水下结构体]桥墩.1', 0.0, nan]
RowInTopAffinitySheet :  130
Row :  ['White_Crappie', '[水下结构体]开放水域.1', 0.6, '[水下结构体]水草.1', 1.0, '[水下结构体]石头.1', 0.6, '[水下结构体]沉木.1', 0.6, '[水下结构体]桥墩.1', 0.0, nan]
RowInTopAffinitySheet :  131
Row :  ['Redspotted_Sunfish', '[水下结构体]开放水域.1', 0.0, '[水下结构体]水草.1', 0.6, '[水下结构体]石头.1', 1.0, '[水下结构体]沉木.1', 0.6, '[水下结构体]桥墩.1', 0.0, nan]
RowInTopAffinity