In [7]:
import pandas as pd

# 读取CSV文件
df = pd.read_csv('energy_data.csv')

# 分离基础名称和后缀，添加为新的列
df[['base_name', 'suffix']] = df['Folder'].str.split('_', n=1, expand=True)

# 将能量列转换为数值类型（如果尚未转换）
df['Energy'] = pd.to_numeric(df['Energy'])

# 定义要选择的最低能量的结构数量
top_n = 1  # 选择前 n 个最低能量的结构

# 按照 'base_name' 和 'Energy' 进行排序
df_sorted = df.sort_values(by=['base_name', 'Energy'])

# 对每个 base_name 分组，并选取前 top_n 行（能量最低的结构）
grouped = df_sorted.groupby('base_name', as_index=False).head(top_n)

# 重置索引
grouped = grouped.reset_index(drop=True)

# 输出结果
print(grouped[['Folder', 'Energy']])

# 将结果保存到新的CSV文件
grouped[['Folder', 'Energy']].to_csv('lowest_energy_structures.csv', index=False)


                    Folder     Energy
0     Cr1Cu2Ir2Os3Ru8O32_1 -361.66388
1     Cr1Cu2Ir2Os5Ru6O32_1 -364.47214
2     Cr1Cu2Ir2Pd3Ru8O32_1 -337.99870
3     Cr1Cu2Ir2Pd5Ru6O32_1 -325.94081
4     Cr1Cu2Ir2Ru6Rh5O32_1 -342.63669
...                    ...        ...
3089  Ti5Ir6Os1Ru2Rh2O32_1 -378.69517
3090   Ti5Ir6Os2Ru2W1O32_1 -391.59996
3091  Ti5Ir6Pd1Ru2Rh2O32_1 -371.07736
3092   Ti5Ir6Pd2Ru2W1O32_1 -375.99037
3093   Ti5Ir6Ru2Rh2W1O32_1 -383.33090

[3094 rows x 2 columns]


In [9]:
import os
import shutil
import pandas as pd

# 读取筛选后的数据
grouped = pd.read_csv('lowest_energy_structures.csv')

# 定义源目录和目标目录
source_dir = '/home/haoxw/MEOwork/Calculate_dir/work'
target_dir = './selected_cif_files'

# 创建目标目录（如果不存在）
os.makedirs(target_dir, exist_ok=True)

# 遍历筛选后的 Folder 名称
for folder_name in grouped['Folder']:
    # 源 .cif 文件的路径
    source_cif = os.path.join(source_dir, f'{folder_name}.cif')
    
    # 检查源文件是否存在
    if os.path.exists(source_cif):
        # 目标文件的路径
        target_cif = os.path.join(target_dir, f'{folder_name}.cif')
        
        # 复制 .cif 文件到目标目录
        shutil.copyfile(source_cif, target_cif)
        print(f"已复制 {source_cif} 到 {target_cif}")
    else:
        print(f"文件 {source_cif} 不存在。")


已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Os3Ru8O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Os3Ru8O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Os5Ru6O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Os5Ru6O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Pd3Ru8O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Pd3Ru8O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Pd5Ru6O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Pd5Ru6O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Ru6Rh5O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Ru6Rh5O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir2Ru8Rh3O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir2Ru8Rh3O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir3Os2Ru8O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir3Os2Ru8O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir3Os5Ru5O32_1.cif 到 ./selected_cif_files/Cr1Cu2Ir3Os5Ru5O32_1.cif
已复制 /home/haoxw/MEOwork/Calculate_dir/work/Cr1Cu2Ir3Pd2Ru8O32_1.cif 到 ./