# BBO-Rietveld テンプレート（YOUR_MATERIAL）

このノートブックは、ご自身の材料データに対してブラックボックス最適化（Optuna）でGSAS-IIのリートベルト精密化を自動化するためのテンプレートです。

- まず「設定」セルで STUDY_NAME や入出力ディレクトリ、初期プロジェクト（.gpx）などを調整してください。
- 次に、objective 関数内に探索空間と精密化の手順を実装してください（Y2O3/DSMO/LiCoO2 のノートを参考）。
- 実行は上から順にセルを実行します。

参考ドキュメント
- JupyterLab: https://jupyterlab.readthedocs.io/en/stable/
- GSASIIscriptable: https://gsas-ii.readthedocs.io/en/latest/GSASIIscriptable.html
- Optuna: https://optuna.readthedocs.io/en/stable/

使用データ
- XRDデータ: https://www.rruff.net/odr/rruff_sample#/odr/view/641275/2010/eyJkdF9pZCI6NzM4LCJzb3J0X2J5IjpbeyJzb3J0X2RmX2lkIjoiNzA1MiIsInNvcnRfZGlyIjoiYXNjIn1dLCI3MDUyIjoiU3Ryb250aWFuaXRlIn0/1
- CIFデータ: https://legacy.materialsproject.org/materials/mp-3822/


In [None]:
# 必要パッケージの読み込み
%matplotlib inline

import os
import sys
from multiprocessing import Process, Queue
import pandas as pd
import optuna
import matplotlib.pyplot as plt
from matplotlib.gridspec import GridSpec

# 注意: GSAS-II は環境にインストール済みのため、sys.path.append は不要です
# 使う箇所（クラスや関数内）で `import GSASIIscriptable as G2sc` を行います


In [None]:
# 設定セル（まずここをあなたの材料に合わせて編集）
# STUDY_NAME: 解析対象の材料名（出力フォルダ名にも使用）
# RANDOM_SEED: Optuna の乱数シード（再現性確保）
# DATA_DIR: 入力データ (初期 gpx, PRM, CIF, CSV 等) を置いたフォルダ
# WORK_DIR: 最適化過程で生成される *.gpx や履歴DB等の出力先

STUDY_NAME = 'NaSrPO4_v5_1'  # バージョンアップして新規スタディ（U, V, W精密化追加）
RANDOM_SEED = 1024

DATA_DIR = 'data/NaSrPO4'  # データディレクトリは元のまま
WORK_DIR = 'work/' + STUDY_NAME

# ファイル名の指定
DATA_FILENAME = 'NaSrPO4.csv'
CIF_FILENAME = 'NaSrPO4.cif'
PRM_FILENAME = 'INST_XRY.PRM'

In [None]:
# make directories
! rm -f $WORK_DIR/$STUDY_NAME*
! mkdir -p $WORK_DIR

In [None]:
class ProjectBBO:
    def __init__(self, trial_number):
        import GSASIIscriptable as G2sc
        
        # Create a new project
        self.gpx = G2sc.G2Project(newgpx=os.path.join(WORK_DIR, 'BBO_seed{0}_trial_{1}.gpx'.format(RANDOM_SEED, trial_number)))

        # Add histogram
        self.hist1 = self.gpx.add_powder_histogram(
            os.path.join(DATA_DIR, DATA_FILENAME),
            os.path.join(DATA_DIR, PRM_FILENAME)
        )
        
        # Add phase
        self.phase0 = self.gpx.add_phase(
            os.path.join(DATA_DIR, CIF_FILENAME),
            phasename='NaSrPO4',
            histograms=[self.hist1]
        )

        # Set Instrument Parameters (Ka2/Ka1 ratio for Cu Ka radiation)
        self.hist1.data['Instrument Parameters'][0]['I(L2)/I(L1)'] = [0.5, 0.5, 0]

        # Set to use iso
        for val in self.phase0.data['Atoms']:
            val[9] = 'I'

    def refine_and_calc_Rwp(self, param_dict):
        self.gpx.do_refinements([param_dict])
        for hist in self.gpx.histograms():
            _, Rwp = hist.name, hist.get_wR()
        return Rwp

In [None]:
def objective(trial):
    """
    目的関数（Optuna）- Y2O3/DSMOと同様の精密化方法
    """
    ERROR_PENALTY = 1e9
    
    # 1. 探索空間の定義
    # Limits（範囲）
    limits_lb = trial.suggest_float('Limits lower bound', 1.0, 10.0)
    limits_ub = trial.suggest_float('Limits upper bound', limits_lb + 20, 90.0)
    limits_refine = trial.suggest_categorical('limits refine', [True, False])
    
    # Background
    bg_func = trial.suggest_categorical('background_function', 
                                        ['chebyschev', 'cosine', 
                                         'Q^2 power series', 'Q^-2 power series',
                                         'lin interpolate', 'inv interpolate', 'log interpolate'])
    bg_deg = trial.suggest_int('background_degree', 1, 15)
    bg_refine = trial.suggest_categorical('Background refine', [True, False])
    
    # Instrument Parameters
    inst_params1 = []
    if trial.suggest_categorical('Instrument_parameters refine Zero', [True, False]):
        inst_params1.append('Zero')
    
    # Sample Parameters
    sample_params = []
    for p in ['DisplaceX', 'DisplaceY', 'Scale']:
        if trial.suggest_categorical('Sample_parameters refine %s' % (p), [True, False]):
            sample_params.append(p)
    
    # Peak shape parameters
    inst_params2 = []
    for p in ['U', 'V', 'W', 'X', 'Y', 'SH/L']:
        if trial.suggest_categorical('Peakshape_parameters refine %s' % (p), [True, False]):
            inst_params2.append(p)
    
    # 2. プロジェクトの初期化
    try:
        project = ProjectBBO(trial.number)
    except Exception as e:
        print(f"[Trial {trial.number}] Init error: {str(e)[:60]}")
        return ERROR_PENALTY
    
    # 3. リートベルト精密化
    try:
        # Step 0: Limits設定
        step0 = {'set': {'Limits': [limits_lb, limits_ub]}, 'refine': limits_refine}
        project.refine_and_calc_Rwp(step0)
        
        # Step 0bg: 背景
        step0bg = {
            'set': {
                'Background': {'type': bg_func, 'no. coeffs': bg_deg, 'refine': bg_refine}
            }
        }
        project.refine_and_calc_Rwp(step0bg)
        
        # Step 1: 格子定数 + 装置パラメータ（Zero）
        step1 = {'set': {'Cell': True, 'Instrument Parameters': inst_params1}}
        try:
            project.refine_and_calc_Rwp(step1)
        except:
            pass  # 格子定数精密化が失敗した場合はスキップ
        
        # Step 1-2: Sample Parameters
        if sample_params:
            step1_2 = {'set': {'Sample Parameters': sample_params}}
            project.refine_and_calc_Rwp(step1_2)
        
        # Step 2: ピーク形状パラメータ
        if inst_params2:
            step2 = {'set': {'Instrument Parameters': inst_params2}}
            project.refine_and_calc_Rwp(step2)
        
        # Step 3: 原子座標と温度因子
        step3 = {'set': {'Atoms': {'all': 'XU'}}}
        project.refine_and_calc_Rwp(step3)
        
        # Final Step: 全範囲でLimits精密化
        step_fin = {'set': {'Limits': [10, 90]}, 'refine': True}
        Rwp = project.refine_and_calc_Rwp(step_fin)
        
        # 4. 制約条件チェック
        phase = project.gpx.phases()[0]
        u_iso_list = [atom.uiso for atom in phase.atoms()]
        
        if min(u_iso_list) < 0:
            return ERROR_PENALTY
            
        if Rwp > 95:
            return ERROR_PENALTY
            
        return Rwp
        
    except Exception as e:
        error_msg = str(e)[:80]
        if 'arccos' not in error_msg and 'divide' not in error_msg and 'underflow' not in error_msg:
            print(f"[Trial {trial.number}] Error: {error_msg}")
        return ERROR_PENALTY

In [None]:
# Optuna スタディの作成（履歴は WORK_DIR のSQLiteに保存）
study = optuna.create_study(
    study_name=f"{STUDY_NAME}_seed{RANDOM_SEED}",
    storage=f"sqlite:///{WORK_DIR}/history_sqlite.db",
    load_if_exists=True,
    sampler=optuna.samplers.TPESampler(n_startup_trials=20, seed=RANDOM_SEED),
)


最適化を実行する前に objective 関数を実装してください。試行回数 (n_trials) はデータの難易度と計算時間に応じて調整します。例: 50, 100, 200 など。


In [None]:
# 最適化実行（objective を実装した後で実行）
study.optimize(objective, n_trials=100)


In [None]:
# 結果の整形（Rwp最小の試行が上に来るようソート）
df = study.trials_dataframe()
df.columns = [''.join(col).replace('params', '').strip() for col in df.columns.values]
df.rename(columns={'value': 'Rwp', 'number': 'trial'}, inplace=True)
df.sort_values('Rwp')


In [None]:
# Best configuration
study.best_params

In [None]:
# Best Rwp
study.best_value

In [None]:
# 成果物の保存（任意）
import json

# 全試行履歴をCSVとして保存
df.to_csv(f"{WORK_DIR}/trials.csv", index=False)

# 最良試行のパラメータをJSON保存
with open(f"{WORK_DIR}/best_params.json", "w") as f:
    json.dump(study.best_params, f, indent=2)

# 参考: 最良試行のGPXからCIFを書き出す（必要に応じて有効化）
# from GSASIIscriptable import G2Project
# gpx = G2Project(f"{WORK_DIR}/{STUDY_NAME}_seed{RANDOM_SEED}_trial_{study.best_trial.number}.gpx")
# phase = gpx.phases()[0]
# phase.export_CIF(f"{WORK_DIR}/{STUDY_NAME}_best.cif", quickmode=True)

In [None]:
# Rwp plot
def rwp_plot():
    minvalues = [df.iloc[0]['Rwp']]
    for i in range(1, df.shape[0]):
        minvalues.append(min(minvalues[-1], df.iloc[i]['Rwp']))
    minvalues = pd.DataFrame(minvalues)
    
    minvalues.plot(legend=None)
    plt.ylim([0, 100])
    plt.grid(color='#cccccc')
    plt.ylabel('$R_{wp}$')
    plt.xlabel('Number of trials')
    plt.show()
    
rwp_plot()

In [None]:
# Rietveld plot
def rietveld_plot():
    import GSASIIscriptable as G2sc

    gpx = G2sc.G2Project(
        os.path.join(WORK_DIR, f'BBO_seed{RANDOM_SEED}_trial_{study.best_trial.number}.gpx'))

    hist1 = gpx.histograms()[0]
    phase0 = gpx.phases()[0]

    hist = hist1
    i = 5
    two_theta = hist.getdata("X")[::i]
    Yobs = hist.getdata("Yobs")[::i]
    Ycalc = hist.getdata("Ycalc")[::i]
    bg = hist.getdata("Background")[::i]
    residual = hist.getdata("Residual")[::i]

    fig = plt.figure()
    gs = GridSpec(5, 1, figure=fig)
    ax1 = fig.add_subplot(gs[:4, :])
    ax2 = fig.add_subplot(gs[4, :])
    fig.subplots_adjust(hspace=0)
    ax1.grid(color='#cccccc')

    ax1.scatter(two_theta, Yobs, marker='P', lw=0.0001, c='Black', label='XRD (Obs)')
    ax1.plot(two_theta, Ycalc, label='XRD (Calc)')
    ax1.plot(two_theta, bg, color='red', label='Background (Calc)')
    ax1.set_ylabel('Intensity')
    ax1.legend()
    ax2.plot(two_theta, residual, color='blue')
    plt.setp(ax1.get_xticklabels(), visible=False);
    # ax2.set_ylim(-6600, 6600)
    plt.xlabel(r'$2\theta$ (deg.)')
    ax2.set_ylabel('Residual')
    # change 2theta range according to your data
    ax1.set_xlim(10, 90)
    ax2.set_xlim(10, 90)
    plt.show()
    
rietveld_plot()
