# データの整理と前処理

### csv (YYYY.MM.DD.csv)をまとめて、master.csvをつくる

#### 関数

In [None]:
import re
import os
from pathlib import Path
import pandas as pd

def clean_log_string(raw_str):
    """
    Remove extra RTF/encoding artifacts like '\lang1033', '\f4', etc.
    """
    # 1) Remove sequences like "\lang1234" or "\f12"
    cleaned = re.sub(r'\\lang\d+|\\f\d+', '', raw_str)
    # 2) Collapse multiple whitespaces
    cleaned = re.sub(r'\s+', ' ', cleaned)
    # 3) Trim leading/trailing whitespace
    cleaned = cleaned.strip()
    return cleaned

def parse_log_string(log_str):
    """
    Parse relevant fields from a single trial's log string.
    This function is just an example. Adjust as needed!
    """
    results = {
        "VoltageHold": None,   # e.g., -55, +10
        "Color": None,         # "blue" or "red"
        "DrugList": [],
        "StimPower": None,     # numeric or maybe "100%" as string
        "StimDuration": None,  # numeric (milliseconds)
    }
    
    # --- 1) Voltage Hold: e.g. "-55" or "+10" ---
    match_v = re.search(r'([+-]\d+)', log_str)
    if match_v:
        results["VoltageHold"] = match_v.group(1)
    
    # --- 2) Color (B_ => blue, R_ => red) ---
    if "B_" in log_str:
        results["Color"] = "blue"
    elif "R_" in log_str:
        results["Color"] = "red"
    
    # --- 3) Drug List (simple detection) ---
    known_drugs = ["NBQX", "AP-V", "PTX"]
    found_drugs = []
    for drug in known_drugs:
        if drug in log_str:
            # Try capturing "NBQX 10 uM" etc.
            match_drug = re.search(rf"({drug}\s*\S+)", log_str)
            if match_drug:
                found_drugs.append(match_drug.group(1))
            else:
                found_drugs.append(drug)
    # Convert to semicolon-delimited string
    results["DrugList"] = ";".join(found_drugs) if found_drugs else ""
    
    # --- 4) Stimulus Power & Duration ---
    # Example pattern from your snippet (for "B_1 A 4.2 0.13 ms sweep 20 s"):
    #    B_1\sA\s+([\d\.%]+)\s+([\d\.]+)\s+ms\s+sweep\s+(\d+)\s+s
    # Adjust if your real logs differ.
    stim_pattern = re.compile(r"(R|B)_1\sA\s+([\d.%]+)\s+([\d.]+)\s*ms\s+(?:IT_(\d{1,3})\s+ms\s+)?sweep\s+(\d+)\s*s")
    m = stim_pattern.search(log_str)
    if m:
        # Group(1): 'R' or 'B'
        color_code = m.group(1)  
        # Convert to text if you want
        color_str = "red" if color_code == "R" else "blue"

        power_str    = m.group(2)  # e.g. '4.2', '100%', '5'
        duration_str = m.group(3)  # e.g. '0.13', '1', '2.0'
        it_str       = m.group(4)  # e.g. '50' or '999' if present; else None
        sweep_str    = m.group(5)  # e.g. '20', '10', '5', '15'

        # Convert power
        if power_str.endswith('%'):
            # handle the "100%" case
            # you might store it as float(100.0) or just keep as string "100%"
            try:
                power_float = float(power_str.replace('%',''))
                results["StimPower"] = power_float
            except ValueError:
                # fallback: store raw string
                results["StimPower"] = power_str
        else:
            try:
                results["StimPower"] = float(power_str)
            except ValueError:
                results["StimPower"] = power_str
        
        # Convert duration
        try:
            results["StimDuration"] = float(duration_str)
        except ValueError:
            results["StimDuration"] = duration_str

    return results


def parse_single_brain_log(log_csv_path, opsin, region, brain_id):
    """
    Reads the log CSV named something like '2024.10.12.csv'.
    Returns a DataFrame with one row per trial, plus parsed columns.
    """
    df = pd.read_csv(log_csv_path)
    
    # Guarantee columns exist or create placeholders
    # Adjust depending on your real CSV columns
    if "SliceID" not in df.columns:
        df["SliceID"] = None
    if "CellID" not in df.columns:
        df["CellID"] = None
    if "filename" not in df.columns:
        df["filename"] = None
    if "log" not in df.columns:
        df["log"] = ""
    
    # Add high-level columns
    df["Opsin"] = opsin
    df["Region"] = region
    df["BrainID"] = brain_id
    
    # Parse each row's "log" text:
    # Coerce `log` to a string to avoid TypeError
    df["log"] = df["log"].fillna("").astype(str)
    # 1) Clean up each log string
    df["Cleaned_Log"] = df["log"].apply(clean_log_string)
    parse_results = df["Cleaned_Log"].apply(lambda txt: parse_log_string(str(txt)))
    
    df["VoltageHold"]  = parse_results.apply(lambda d: d["VoltageHold"])
    df["Color"]        = parse_results.apply(lambda d: d["Color"])
    df["DrugList"]     = parse_results.apply(lambda d: d["DrugList"])
    df["StimPower"]    = parse_results.apply(lambda d: d["StimPower"])
    df["StimDuration"] = parse_results.apply(lambda d: d["StimDuration"])
    
    # Clean up SliceID/CellID if needed
    df["SliceID"] = df["SliceID"].astype(str).str.replace(r"[^A-Za-z0-9]+", "", regex=True)
    df["CellID"]  = df["CellID"].astype(str).str.replace(r"[^A-Za-z0-9]+", "", regex=True)

    # Reorder or subset columns for final
    final_cols = [
        "Opsin",
        "Region",
        "BrainID",
        "SliceID",
        "CellID",
        "VoltageHold",
        "Color",
        "StimPower",
        "StimDuration",
        "DrugList",
        "filename",
        # anything else from the original CSV you want to keep
    ]
    # Keep only columns that exist
    final_cols = [c for c in final_cols if c in df.columns]
    
    return df[final_cols]


def collect_all_brains(data_root, out_csv_name):
    """
    Walk through `data_root`, find each directory that has exactly one
    'year.month.date.csv' file, parse it, and append to a master DataFrame.
    Then save one CSV with one row = one trial (across all brains).
    """
    data_root = Path(data_root)
    all_rows = []
    
    # A pattern to match files like 2024.10.12.csv etc.
    # Adjust if your real log file name has a different pattern.
    csv_pattern = re.compile(r'^\d{4}\.\d{2}\.\d{2}\.csv$')

    # Walk all subfolders
    for folder in data_root.rglob("*"):
        if folder.is_dir():
            # Find exactly one CSV that matches year.month.date.csv
            possible_csvs = [f for f in folder.iterdir() 
                             if f.is_file() and csv_pattern.match(f.name)]
            if len(possible_csvs) == 1:
                log_csv_path = possible_csvs[0]
                
                # Heuristics to get opsin / region / brain_id from folder path
                # Example folder structure:
                #   data_root / ChR2 / ACC / 241012_ID2 / 2024.10.12.csv
                # Typically, you can parse:
                #   opsin = "ChR2"
                #   region = "ACC"
                #   brain_id = "241012_ID2"
                parts = log_csv_path.relative_to(data_root).parts
                # parts might be: ("ChR2", "ACC", "241012_ID2", "2024.10.12.csv")
                
                # You could pick them out carefully:
                opsin = None
                region = None
                brain_id = None
                
                if len(parts) >= 1:
                    opsin = parts[0]  # e.g. "ChR2"
                if len(parts) >= 2:
                    region = parts[1]  # e.g. "ACC"
                if len(parts) >= 3:
                    brain_id = parts[2]  # e.g. "241012_ID2"
                
                # Parse that CSV
                df_single = parse_single_brain_log(
                    log_csv_path=log_csv_path,
                    opsin=opsin,
                    region=region,
                    brain_id=brain_id
                )
                
                all_rows.append(df_single)

    # Concatenate all brains
    if all_rows:
        master_df = pd.concat(all_rows, ignore_index=True)
    else:
        # No data found
        master_df = pd.DataFrame()

    # Save the big CSV
    out_csv_path = os.path.join(data_root, out_csv_name)
    master_df.to_csv(out_csv_path, index=False)
    print(f"Master CSV written to: {out_csv_path}")

#### `master.csv`保存 (log csvをまとめる)

In [None]:
data_root = "./sorted_directory/"
out_csv_name = "master.csv"

collect_all_brains(data_root, out_csv_name)

ここで、master.csvを見ながらどの画像をチェックすべきか確認し、DAPIとPaxinos and Franklin atlasを対応させ、下のような表をexcelもしくはnumbersでつくり、csvにしてrootディレクトリ(sortex_directoryなど)にアップする。


| BrainID       | SliceID | APregion  | RoughAP |
|---------------|---------|-----------|---------|
| 241220_ID13   | Slice1  | anterior  | -2.5    |
| 241215_ID12   | Slice1  | posterior | -4.2    |
| 241215_ID12   | Slice2  | middle    | -3.4    |
| 241210_ID10   | Slice1  | posterior | -4.3    |
| 241210_ID10   | Slice2  | middle    | -3.9    |


# master.csvとAPregion.csvの統合

## `master_with_AP.csv`保存(`master.csv`とA`Pregion.csv`をmerge)

In [None]:
import pandas as pd

# Load your main dataset
df_master = pd.read_csv("./sorted_directory/master.csv")

# Load your AP region info
df_ap = pd.read_csv("./sorted_directory/APregion.csv")

# Merge (left join) on BrainID & SliceID
df_merged = pd.merge(
    df_master,
    df_ap,
    on=["BrainID", "SliceID"], 
    how="left"  # So you keep all rows from master.csv
)

# Now df_merged will have extra columns: APregion, RoughAP
# Save it out:
df_merged.to_csv("./sorted_directory/master_with_AP.csv", index=False)
print("Merged CSV saved as master_with_AP.csv")


# ABFファイルのフィルタリング

## 処理するabfファイルを選ぶ

以下のコードは、ある DataFrame（`df_merged`）に対して複数のフィルタ条件を連結し、最終的に条件に合った行だけを取り出す処理を行っています。具体的には、**Opsin**（例: `"ChR2"` など）、**VoltageHold**（例: `-55.0`, `10.0` など）、および **DrugList**（薬剤条件）によるフィルタを組み合わせたものです。

---

### 全体の流れ

1. **DataFrame の読み込み**  
   `df_merged` がまだ存在しない場合、`"./sorted_directory/master_with_AP.csv"` から読み込みます。  
   ```python
   if df_merged is None:
       df_merged = pd.read_csv("./sorted_directory/master_with_AP.csv")
    ```
       
2. **Opsin フィルタ**  
   `opsin_choices = ["ChR2"]` のように設定されている場合、  
   ```python
   opsin_filter = df_merged["Opsin"].isin(opsin_choices)
   ```
   
   によって、`Opsin` 列が `"ChR2"` の行だけを `True` とするブール配列が得られます。

3. **VoltageHold フィルタ**

    たとえば `hold_choices = [-55.0, 10.0]` と指定した場合:

    ```python
    hold_filter = df_merged["VoltageHold"].isin(hold_choices)
    ```
    このコードによって、`VoltageHold` 列の値が `-55.0` または `10.0` の行を `True` とし、それ以外の行は `False` とするブール配列が得られます。

4. **DrugList フィルタ** 

   ユーザーが選んだ複数の薬剤条件 `(drug_choices)` に合わせて、`DrugList` 列をチェックします。
    例えば、`None` なら `DrugList` が `NaN` または空文字の場合を拾い、
    文字列なら
    ```python
    df_merged["DrugList"].str.contains(...) 
    ```
    で部分一致をチェックします。
    これら複数の条件を `OR (|)`で連結したブール配列を最終的に `drug_filter` とします。

5. **AND 結合**

    Opsin フィルタ、VoltageHold フィルタ、DrugList フィルタをすべて満たす行を取り出すには、

   ```python
   final_filter = opsin_filter & hold_filter & drug_filter
    ```
   のように AND 結合を行います。

6. **結果の適用・保存**


   最後に、

   ```python
    df_filtered = df_merged[final_filter]
    df_filtered.to_csv("./sorted_directory/master_with_AP_filtered.csv", index=False)

    ```
   とすれば、フィルタを通った行だけが `df_filtered` に入り、それを CSV として保存することもできます。


### `master_with_AP_filtered.csv`保存

In [None]:
if df_merged is None:
    df_merged = pd.read_csv("./sorted_directory/master_with_AP.csv")

# -------------------------------------------------------------------------
# Filters
opsin_choices = ["Dual_Injection"] # Opsin filter "ChR2", "Dual_Injection", "GtCCR4"
hold_choices = [-55.0, 10.0] # VoltageHold filter
drug_choices = [None]  # DrugList filter (includes the blank)
# -------------------------------------------------------------------------

# 1) Filter by Opsin
opsin_filter = df_merged["Opsin"].isin(opsin_choices)

# 2) Filter by VoltageHold
hold_filter = df_merged["VoltageHold"].isin(hold_choices)

# 3) Build the drug filter (which can be multiple OR conditions)
drug_conditions = []
for choice in drug_choices:
    if choice is None:
        # "select rows where DrugList is NaN or empty"
        drug_conditions.append(df_merged["DrugList"].isna() | (df_merged["DrugList"] == ""))
    else:
        # "DrugList contains the chosen substring"
        drug_conditions.append(df_merged["DrugList"].str.contains(choice, na=False))

# Combine all drug conditions with OR
if len(drug_conditions) > 0:
    drug_filter = drug_conditions[0]
    for c in drug_conditions[1:]:
        drug_filter = drug_filter | c
else:
    # If, for some reason, no drug choices exist, default to "True" 
    # (meaning no restriction on DrugList)
    drug_filter = True

# 4) Combine *all* filters with AND
final_filter = opsin_filter & hold_filter & drug_filter

# 5) Apply to the DataFrame
df_filtered = df_merged[final_filter]
df_filtered.to_csv("./sorted_directory/master_with_AP_filtered.csv", index=False)
df_filtered

# df_filteredに含まれるファイルを解析する

## 関数

### find_abf_files関数

In [None]:
import os

def find_abf_files(root_dir):
    """
    Recursively search for all *.abf files under `root_dir`.
    Return a dictionary mapping the short filename (e.g., '24n15005.abf')
    -> the absolute path to that file.
    """
    abf_dict = {}
    for root, dirs, files in os.walk(root_dir):
        for fname in files:
            if fname.lower().endswith(".abf"):
                full_path = os.path.join(root, fname)
                abf_dict[fname] = full_path
    return abf_dict


In [None]:
import numpy as np
import pandas as pd
import pyabf
from pyabf.tools.memtest import Memtest
from scipy.optimize import curve_fit
from scipy.signal import savgol_filter

###########################
# Bi-exponential function #
###########################
def biexponential_fit(t, m, tau, n, c):
    """
    A 2-term exponential decay function with a forced ratio for tau_1 and tau_2.
    For the fit, t is in seconds, and:
      - tau_1 = 0.1 * tau
      - tau_2 = 0.9 * tau
    """
    tau_1 = 0.1 * tau
    tau_2 = 0.9 * tau
    return m * np.exp(-t / tau_1) + n * np.exp(-t / tau_2) + c

### `find_stim_time_digital`関数

この関数は、指定されたスイープにおいて、選択したデジタル出力チャンネル（redまたはblue）が0から1に遷移する最初の時刻を秒単位で返します。

---

##### 引数:
- **`abf`**: `pyabf.ABF`オブジェクト。ABFファイルを操作するためのオブジェクトです。
- **`sweep_index`**: `int`型。解析対象のスイープインデックスを指定します。
- **`color`**: `str`型。デジタル出力チャンネルを指定します。`"red"`または`"blue"`を選択可能です。

---

##### 戻り値:
- **`float`**: デジタル信号が1に変化する最初のサンプルの時間（秒単位）。
- **`None`**: 該当するデジタル信号が見つからなかった場合。

---

##### 処理の流れ:
1. **デジタル出力チャンネルの選択**:
   - `color`が`"red"`の場合、チャンネル番号は`0`。
   - `color`が`"blue"`の場合、チャンネル番号は`3`。
   - その他の値の場合は、`None`を返して終了。

2. **スイープデータのロード**:
   - 指定された`abf`オブジェクトのスイープデータを`abf.setSweep`でロードします。
   - 時間データ（秒単位）は`abf.sweepX`に、デジタル信号は`abf.sweepD(digOutNum)`に格納されます。

3. **デジタル信号の遷移検出**:
   - デジタル信号が`1`になるインデックス（`idxs`）を`np.where`で検索します。
   - 該当するインデックスがない場合、`None`を返します。

4. **最初の遷移時刻を返す**:
   - 最初のインデックス`idx_stim`に対応する時間を`time_s[idx_stim]`として返します。

---

##### サンプルコード:
```python
stim_time = find_stim_time_digital(abf, sweep_index=0, color="blue")
if stim_time is not None:
    print(f"刺激時間: {stim_time:.3f} 秒")
else:
    print("デジタル信号が検出されませんでした。")


In [None]:
################################
# Detect digital stimulus time #
################################
def find_stim_time_digital(abf, sweep_index, color):
    """
    Return the FIRST time in seconds the chosen digital output transitions from 0 to 1.
    
    Args:
        abf: a pyabf.ABF object
        sweep_index (int): which sweep to examine
        color (str): "red" or "blue" to pick which digital channel to read
    
    Returns:
        float or None: the time (in seconds) of the first sample where digital_sig == 1.
    """
    if color == "red":
        digOutNum = 0
    elif color == "blue":
        digOutNum = 3
    else:
        return None

    abf.setSweep(sweep_index)
    time_s = abf.sweepX
    digital_sig = abf.sweepD(digOutNum)  # 0 or 1 array

    # indices where digital_sig is 1
    idxs = np.where(digital_sig == 1)[0]
    if len(idxs) == 0:
        return None
    
    idx_stim = idxs[0]
    return time_s[idx_stim]

### refined_onset_time関数

この関数は、PSC（Post-Synaptic Current）の応答開始時間（オンセットタイム）を精密に特定するためのものです。特に、刺激時間（stim_time_s）と指定された終了時間（onset_end）の間に制限して特定します。

---

#### 引数:
- **`time_s`**: `array`  
  時間データ（秒単位）の配列。

- **`current_pA`**: `array`  
  電流データ（pA単位）の配列。

- **`stim_time_s`**: `float`  
  刺激時間（秒単位）。

- **`expect_inward`**: `bool`, デフォルト: `True`  
  EPSCが内向き（負の電流）であるかを指定。`True`の場合、負の電流を正に変換して解析を行います。

- **`onset_end`**: `float`, デフォルト: `None`  
  オンセットタイムの最大値を制限（秒単位）。デフォルトでは制限なし（`np.inf`）。

---

#### 戻り値:
- **`float`**: 精密化された応答開始時間（秒単位）。  
  候補が見つからない場合は`stim_time_s`を返します。

---

#### 処理の流れ:

1. **電流データの符号変換**:
   - EPSC（負の電流）の場合、`current_pA`を符号反転（負→正）。
   - 外向きの電流（正の場合）ではそのまま。

2. **平滑化**:
   - Savitzky-Golayフィルタ（`window_length=151`, `polyorder=3`）を適用し、電流データを平滑化。

3. **微分**:
   - 平滑化されたデータの微分を計算（`np.gradient`）。

4. **ピークの検出**:
   - `stim_time_s`から`onset_end`の範囲内でピークを検索。
   - 最大値（または、EPSCの場合の最小値）を持つインデックスを取得。

5. **閾値の計算**:
   - ピーク値の20%を閾値として定義。

6. **潜在的なオンセット候補のフィルタリング**:
   - オンセット候補は以下を満たす必要があります:
     - `stim_time_s`以上、ピーク時間以下。
     - 平滑化された電流が閾値を超える。
     - EPSC（内向き電流）の場合、微分値が負（`d1 < 0`）。
     - 外向き電流の場合、微分値が正（`d1 > 0`）。

7. **最適なオンセットの選択**:
   - 候補の中から`stim_time_s`に最も近い時刻を選択。

---

#### 注意点:
- データの長さが151点未満の場合、平滑化が行えないため`stim_time_s`を返します。
- 潜在的なオンセット候補が見つからない場合も同様に`stim_time_s`を返します。


In [None]:
def refined_onset_time(
    time_s, current_pA, stim_time_s, expect_inward=True, onset_end=None
):
    """
    Refine the response onset time by analyzing the slope around the PSC,
    but force it to be between [stim_time_s, onset_end].

    Steps (for an inward EPSC, expect_inward=True):
      1) Flip current if negative (EPSC) so the "peak" becomes a max.
      2) Smooth with Savitzky-Golay (window=151, poly=3).
      3) Use gradient (np.gradient) to find slope.
      4) Find "peak" after stim_time.
      5) 20% threshold => potential onsets must exceed that threshold,
         also slope < 0 if flipped (for negative events).
      6) Onset must be >= stim_time_s AND <= onset_end.
      7) Pick the candidate onset closest to stim_time_s (but not < stim_time_s).
    """
    # 1) Flip sign if needed
    if expect_inward:
        cur_flipped = -current_pA
    else:
        cur_flipped = current_pA

    # 2) Smooth
    if len(cur_flipped) < 151:
        return stim_time_s
    cur_smoothed = savgol_filter(cur_flipped, window_length=151, polyorder=3)

    # 3) derivative
    d1 = np.gradient(cur_smoothed, time_s)

    # 4) Find the peak AFTER stim_time
    if onset_end is None:
        onset_end = np.inf  # if not provided

    # only look in [stim_time_s, onset_end] for the peak
    post_mask = (time_s >= stim_time_s) & (time_s <= onset_end)
    if not np.any(post_mask):
        return stim_time_s

    idx_max_local = np.argmax(cur_smoothed[post_mask])
    offset_idx = np.where(post_mask)[0][0]
    peak_idx = idx_max_local + offset_idx
    peak_time = time_s[peak_idx]
    peak_value = cur_smoothed[peak_idx]

    # 5) threshold = 20% of that peak
    threshold_20pct = 0.2 * peak_value

    if expect_inward:
        potential_mask = (
            (time_s >= stim_time_s) & 
            (time_s <= peak_time) &     # must be before the peak
            (cur_smoothed > threshold_20pct) &
            (d1 < 0)
        )
    else:
        potential_mask = (
            (time_s >= stim_time_s) &
            (time_s <= peak_time) &
            (cur_smoothed > threshold_20pct) &
            (d1 > 0)
        )

    idx_candidates = np.where(potential_mask)[0]
    if len(idx_candidates) == 0:
        return stim_time_s

    # among candidates, choose the one closest to stim_time_s
    times_candidates = time_s[idx_candidates]
    # they are all >= stim_time_s, so just pick the earliest
    best_idx = idx_candidates[0]
    return time_s[best_idx]

In [None]:
# refined_onsetのためのパラメータ確認plot作成
# %%
import numpy as np
import pyabf
import matplotlib.pyplot as plt
from scipy.signal import savgol_filter

def plot_poststim_segment(
    abf_path,
    sweep_index,
    color="blue",
    rec_chan=0,
    voltage_hold=-55.0,    # <<< passed in just like in measure_sweep
    baseline_window=0.01,
    post_window=0.050,
    smooth_win=151,
    smooth_poly=3
):
    # Load and find stim
    abf = pyabf.ABF(abf_path)
    stim_time = find_stim_time_digital(abf, sweep_index, color)
    if stim_time is None:
        print(f"No stim in sweep {sweep_index}")
        return

    # Baseline subtract exactly as in measure_sweep
    abf.setSweep(
        sweepNumber=sweep_index,
        channel=rec_chan,
        baseline=[stim_time - baseline_window, stim_time]
    )
    t = abf.sweepX
    y = abf.sweepY

    # Isolate the 0–post_window after stim
    mask   = (t >= stim_time) & (t <= stim_time + post_window)
    t_post = t[mask] - stim_time
    y_post = y[mask]

    # Determine sign flip from voltage_hold, same logic as measure_sweep
    expect_inward = (voltage_hold < 10)
    y_flip = -y_post if expect_inward else y_post

    # Smooth + derivative
    if len(y_flip) >= smooth_win:
        y_smooth = savgol_filter(y_flip, smooth_win, smooth_poly)
    else:
        y_smooth = y_flip
    dy = np.gradient(y_smooth, t_post)
    dy = savgol_filter(dy, smooth_win, smooth_poly)

    # Plot
    fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(8,6), sharex=True)
    ax1.plot(t_post*1e3, y_post,    label="raw")
    ax1.plot(t_post*1e3, y_smooth * ( -1 if expect_inward else 1 ),
             label="smoothed", lw=2)
    ax1.set_ylabel("Current (pA)")
    ax1.legend()
    ax1.set_title(f"Sweep {sweep_index}: 0–{post_window*1e3:.0f} ms post-stim")

    ax2.plot(t_post*1e3, dy, label="dI/dt")
    ax2.set_xlabel("Time after stim (ms)")
    ax2.set_ylabel("dI/dt (pA/s)")
    ax2.legend()

    plt.tight_layout()
    plt.show()

# — Example usage —
plot_poststim_segment(
    "./sorted_directory/ChR2/RSC/241215_ID12/24d15001.abf",
    sweep_index=4,
    color="blue",
    rec_chan=0,
    baseline_window=0.01,
    post_window=0.050,
    smooth_win=151,
    smooth_poly=3
)



### measure_sweep 関数

この関数は、ABFファイルの1つのスイープ（sweep）に対して以下の解析を行います：

1. 刺激時間の検出
2. ベースライン補正
3. ピーク検出
4. 応答の開始時間（オンセット）の精密化
5. レイテンシ（応答の遅延時間）計算
6. 立ち上がり時間（10% -> 90%）計算
7. 減衰時間定数の2重指数関数フィット

---

#### 引数:
- **`abf`**: `pyabf.ABF` オブジェクト  
  読み込まれたABFファイル。

- **`sweep_index`**: `int`  
  処理するスイープのインデックス。

- **`color`**: `str`, デフォルト: `"blue"`  
  刺激のデジタル出力の色（`"red"` または `"blue"`）。

- **`rec_chan`**: `int`, デフォルト: `0`  
  処理する記録チャネル。

- **`baseline_window_sec`**: `float`, デフォルト: `0.01`  
  ベースライン補正用のウィンドウサイズ（秒単位）。

- **`voltage_hold`**: `float`, デフォルト: `-55.0`  
  ホールド電圧。電流の符号（正または負）を決定するために使用。

---

#### 戻り値:
- **`dict`**  
  スイープの解析結果を含む辞書を返します。  
  主なキー:
  - `"Sweep"`: スイープインデックス
  - `"Color"`: 刺激の色
  - `"StimTime_s"`: デジタル出力に基づく刺激時間
  - `"RefinedOnset_s"`: 精密化された応答開始時間
  - `"PeakAmplitude_pA"`: ピーク振幅
  - `"Latency_ms"`: レイテンシ（刺激から応答までの遅延）
  - `"RiseTime_ms"`: 立ち上がり時間（10% -> 90%）
  - `"DecayTau"`: 減衰時間定数
  - `"FitParams"`: 2重指数関数フィットのパラメータ

---

#### 処理の流れ:

1. **刺激時間の検出**  
   `find_stim_time_digital` 関数を使用して、デジタル出力信号が1に遷移する最初の時間を特定します。

2. **ベースライン補正**  
   `stim_time_s` の直前の `baseline_window_sec` 秒間をベースラインとして補正します。

3. **ピーク検出**  
   - 刺激後50 ms以内のウィンドウでピーク（最大または最小）を検出。
   - ホールド電圧に基づき、ピークが負（`voltage_hold < 10`）か正かを判断します。

4. **10%値（t10）の検出**  
   - ピークの10%値を計算。
   - 最初にこの値を超えるタイムポイント（t10）を特定。

5. **精密化された応答開始時間の計算**  
   - `refined_onset_time` 関数を使用して、`stim_time_s` と `t10_abs` の間で応答開始時間を特定。

6. **レイテンシの計算**  
   - `stim_time_s` と精密化されたオンセット時間の差を計算（ms単位）。

7. **立ち上がり時間（10% -> 90%）**  
   - ピークの10%から90%までの時間差を計算（ms単位）。

8. **減衰時間定数のフィット**  
   - ピーク時間から100 ms以内のデータを使用し、2重指数関数でフィット。
   - 減衰時間定数（`DecayTau`）を取得。

---

#### 注意:
- データが不足している場合、適切な解析ができず `np.nan` を返す場合があります。
- 精密化された応答開始時間を計算するために、10%値（t10）を制限として使用します。


In [None]:
def measure_sweep(
    abf, 
    sweep_index, 
    color="blue",
    rec_chan=0,
    baseline_window_sec=0.01,
    voltage_hold=-55.0
):
    """
    - Detect digital stimulus time
    - Baseline subtract
    - Find 10% crossing time => pass as 'onset_end' to refined_onset_time
    - Decide negative/positive peak, measure amplitude, latency, etc.
    - Return extra info (peak time, 10% time, decay window) so we can re-plot easily.
    """
    # 1) Stim time
    stim_time_s = find_stim_time_digital(abf, sweep_index, color=color)
    if stim_time_s is None:
        return {}

    # 2) Baseline subtract
    baseline_start_sec = stim_time_s - baseline_window_sec
    baseline_end_sec   = stim_time_s
    abf.setSweep(
        sweepNumber=sweep_index,
        channel=rec_chan,
        baseline=[baseline_start_sec, baseline_end_sec]
    )
    current_bs = abf.sweepY
    time_s = abf.sweepX

    # 3) We'll pick 0–50 ms after stim for "peak" detection
    window_start = stim_time_s
    if voltage_hold==10.0:
        window_end   = stim_time_s + 0.050
    else:
        window_end   = stim_time_s + 0.020
    mask = (time_s >= window_start) & (time_s <= window_end)
    t_post = time_s[mask] - stim_time_s
    c_post = current_bs[mask]
    if len(c_post) == 0:
        return {}

    # 4) Negative vs positive peak
    if voltage_hold < 10:
        peak_idx = np.argmin(c_post)
        expect_inward = True
    else:
        peak_idx = np.argmax(c_post)
        expect_inward = False

    peak_amplitude = c_post[peak_idx]
    peak_time_rel = t_post[peak_idx]  # relative to stim
    peak_time_abs = stim_time_s + peak_time_rel

    # 5) 10% of peak for rise-time
    #    We'll flip sign if it's negative
    sign_factor = -1 if expect_inward else 1
    c_post_flipped = c_post * sign_factor
    peak_flipped = c_post_flipped[peak_idx]
    val10 = 0.1 * peak_flipped
    # find earliest crossing of 10% in c_post_flipped
    idx_10 = np.where(c_post_flipped >= val10)[0]
    if len(idx_10) > 0:
        t10_rel = t_post[idx_10[0]]
        t10_abs = stim_time_s + t10_rel
    else:
        t10_abs = peak_time_abs

    # 6) Refined onset detection in [stim_time_s, t10_abs]
    onset_s = refined_onset_time(
        time_s,
        current_bs,
        stim_time_s,
        expect_inward=expect_inward,
        onset_end=t10_abs
    )
    latency_ms = (onset_s - stim_time_s) * 1000.0

    # 7) Rise time (10% -> 90%)
    val90 = 0.9 * peak_flipped
    idx_90 = np.where(c_post_flipped >= val90)[0]
    if (len(idx_10) > 0) and (len(idx_90) > 0):
        t10 = t_post[idx_10[0]]
        t90 = t_post[idx_90[0]]
        rise_time_ms = (t90 - t10) * 1000.0
    else:
        rise_time_ms = np.nan

    # 8) Decay fit
    fit_window_sec = 0.100
    decay_start = peak_time_abs
    decay_end   = decay_start + fit_window_sec
    decay_mask = (time_s >= decay_start) & (time_s <= decay_end)
    t_decay = time_s[decay_mask] - decay_start
    c_decay = current_bs[decay_mask]

    if len(t_decay) < 3:
        return {
            "Sweep": sweep_index,
            "Color": color,
            "VoltageHold": voltage_hold,
            "StimTime_s": stim_time_s,
            "BaselineStart_s": baseline_start_sec,
            "BaselineEnd_s": baseline_end_sec,
            "RefinedOnset_s": onset_s,
            "PeakAmplitude_pA": peak_amplitude,
            "PeakTime_s": peak_time_abs,
            "T10Time_s": t10_abs,
            "Latency_ms": latency_ms,
            "RiseTime_ms": rise_time_ms,
            "DecayTau": np.nan,
            "R2": np.nan,
            "FitParams": np.nan,
            "DecayStart_s": decay_start,
            "DecayEnd_s": decay_end,
        }

    def biexp_wrap(t, m, tau, n, c):
        return biexponential_fit(t, m, tau, n, c)

    p0 = [peak_amplitude, 0.010, peak_amplitude*0.5, 0]
    try:
        # only constrain tau to [0.5 ms, 100 ms]
        lower = [-np.inf,    0,  -np.inf, -np.inf]
        upper = [ np.inf,  1,   np.inf,  np.inf]
        
        popt, _ = curve_fit(
            biexp_wrap,
            t_decay,
            c_decay,
            p0=p0,
            bounds=(lower, upper),
            method='trf'   # must use a solver that supports bounds
        )
        # —— ADD THIS R² CALCULATION ——
        y_fit    = biexp_wrap(t_decay, *popt)
        ss_res   = np.sum((c_decay - y_fit)**2)
        ss_tot   = np.sum((c_decay - np.mean(c_decay))**2)
        r2       = 1 - ss_res/ss_tot if ss_tot>0 else np.nan
    except RuntimeError:
        popt = [np.nan]*4
        r2   = np.nan


    return {
        "Sweep": sweep_index,
        "Color": color,
        "VoltageHold": voltage_hold,
        "StimTime_s": stim_time_s,
        "BaselineStart_s": baseline_start_sec,
        "BaselineEnd_s": baseline_end_sec,
        "RefinedOnset_s": onset_s,
        "PeakAmplitude_pA": peak_amplitude,
        "PeakTime_s": peak_time_abs,
        "T10Time_s": t10_abs,
        "Latency_ms": latency_ms,
        "RiseTime_ms": rise_time_ms,
        "DecayTau": popt[1],
        "R2":        r2,
        "FitParams": popt,
        "DecayStart_s": decay_start,
        "DecayEnd_s": decay_end,
    }


### analyze_evoked_responses 関数

この関数は、指定されたABFファイル内のすべてのスイープに対して解析を行い、各スイープの結果を含むDataFrameを返します。

---

#### 引数:
- **`abf_path`**: `str`  
  解析対象のABFファイルのパス。

- **`color`**: `str`, デフォルト: `"blue"`  
  刺激に対応するデジタル出力の色（`"red"` または `"blue"`）。

- **`rec_chan`**: `int`, デフォルト: `0`  
  処理する記録チャネルのインデックス。

- **`voltage_hold`**: `float`, デフォルト: `-55.0`  
  ホールド電圧。この値に基づいて電流が正（アウトワード）か負（インワード）かを決定。

---

#### 戻り値:
- **`pd.DataFrame`**  
  各スイープの解析結果を含むDataFrame。

---

#### 処理の流れ:
1. 指定されたABFファイルを `pyabf.ABF` オブジェクトとして読み込む。
2. ファイル内のすべてのスイープをループで処理。
3. 各スイープについて `measure_sweep` 関数を呼び出し、解析を実行。
4. 解析結果をリストに格納し、最終的にDataFrameに変換して返す。

---

### analyze_abf_files 関数

この関数は、指定されたフィルタ済みDataFrame（`df_filtered`）とABFファイルが格納されているディレクトリ（`abf_root`）を基に、各行に対応するABFファイルを解析し、その結果をDataFrameとして返します。

---

#### 引数:
- **`df_filtered`**: `pd.DataFrame`  
  解析対象のABFファイルを指定する情報を含むDataFrame。主なカラムには以下が含まれる:
  - `"filename"`: ABFファイル名（例: `"24n15005.abf"`）
  - `"Color"`: 刺激の色（例: `"blue"` または `"red"`）
  - `"VoltageHold"`: ホールド電圧

- **`abf_root`**: `str`  
  ABFファイルが格納されているディレクトリのルートパス。

---

#### 戻り値:
- **`pd.DataFrame`**  
  各スイープの解析結果を含むDataFrame。

---

#### 処理の流れ:
1. **ABFファイルの検索**  
   指定されたルートディレクトリ（`abf_root`）内を再帰的に検索し、すべての`.abf`ファイルを短いファイル名（例: `"24n15005.abf"`）からフルパスへのマッピングを作成する。

2. **フィルタ済みDataFrameの各行をループで処理**  
   `df_filtered` の各行を処理し、その行に対応するABFファイルを解析する。

3. **ABFファイルのパス取得**  
   現在の行の `"filename"` カラムを基にABFファイルのフルパスを取得。ファイルが見つからない場合は警告を表示してスキップ。

4. **マルチスイープ解析の実行**  
   `analyze_evoked_responses` 関数を呼び出し、解析を実行。

5. **解析結果の統合**  
   - `df_filtered` の行からメタデータ（例: `"Opsin"`, `"Region"`, `"VoltageHold"`）を取得。
   - 各スイープの解析結果に対応するメタデータを付加して、リストに格納。

6. **最終結果の生成**  
   すべてのスイープの結果を統合したDataFrameを作成して返す。

---

#### 注意:
- ABFファイルが見つからない場合は警告を表示し、その行をスキップします。
- 各スイープの解析結果は、対応するフィルタ済みDataFrameのメタデータと統合されます。


In [None]:
###############################################
# Incorporate into your "analyze_evoked..." fn
###############################################
import concurrent.futures

def analyze_evoked_responses(abf_path, color="blue", rec_chan=0, voltage_hold=-55.0):
    """
    Loop over all sweeps in the ABF file, measure the response if a stimulus is detected,
    and return a DataFrame with results for each sweep.
    """
    abf = pyabf.ABF(abf_path)
    
    # ── NEW: run the membrane test and get per-sweep values ──
    mem = Memtest(abf)  # passive properties per sweep
    Ihs   = mem.Ih.values    # clamp currents (pA)
    Rms   = mem.Rm.values    # membrane resistances (MΩ)
    Ras   = mem.Ra.values    # access resistances (MΩ)
    Cms   = mem.CmStep.values# capacitances (pF)
    
    # build a time‐vector for sweep start times (sec)
    # if abf.sweepTimesSec exists you can use that; otherwise:
    times_sec = np.arange(abf.sweepCount) * abf.sweepIntervalSec

    sweep_results = []
    
    for sweep_index in abf.sweepList:
        sweep_dict = measure_sweep(
            abf,
            sweep_index=sweep_index,
            color=color,
            rec_chan=rec_chan,
            baseline_window_sec=0.01,
            voltage_hold=voltage_hold
        )
        if not sweep_dict:
            continue
        # ── NEW: timestamp & membrane properties for this sweep ──
        sweep_dict["sweep_time_s"] = times_sec[sweep_index]
        sweep_dict["Ih_pA"]       = Ihs[sweep_index]
        sweep_dict["Rm_MOhm"]      = Rms[sweep_index]
        sweep_dict["Ra_MOhm"]      = Ras[sweep_index]
        sweep_dict["Cm_pF"]        = Cms[sweep_index]

        sweep_results.append(sweep_dict)

    return pd.DataFrame(sweep_results)



def process_filtered_row(args):
    idx, row, abf_dict, abf_root = args
    abf_name = row["filename"]
    if abf_name not in abf_dict:
        return []
    abf_path = abf_dict[abf_name]
    df_sweep = analyze_evoked_responses(
        abf_path,
        color=row.get("Color","blue"),
        rec_chan=0,
        voltage_hold=row.get("VoltageHold", -55)
    )
    out = []
    for _, sweep_dict in df_sweep.iterrows():
        merged = {
            "index_df_filtered": idx,
            "filename": abf_name,
            **{k: row.get(k) for k in ["Opsin","Region","BrainID","SliceID","CellID","VoltageHold","DrugList","APregion","RoughAP"]},
            **sweep_dict.to_dict()
        }
        out.append(merged)
    return out

def analyze_abf_files_parallel(df_filtered, abf_root, n_workers=None):
    abf_dict = find_abf_files(abf_root)
    args_iter = [
        (idx, row.to_dict(), abf_dict, abf_root)
        for idx, row in df_filtered.iterrows()
    ]
    results_list = []
    with concurrent.futures.ProcessPoolExecutor(max_workers=n_workers) as exe:
        for sublist in exe.map(process_filtered_row, args_iter):
            results_list.extend(sublist)
    return pd.DataFrame(results_list)

def analyze_abf_files(df_filtered, abf_root):
    """
    Given a DataFrame (df_filtered) with a 'filename' column and
    a directory abf_root that contains (somewhere) the ABF files,
    this function:
      1) Recursively finds all .abf files in abf_root
      2) Loops over each row in df_filtered
      3) Loads the ABF file (if found)
      4) Calls analyze_evoked_responses(abf_path, color=...)
      5) Returns a new DataFrame with analysis results 
         (one row per sweep, plus appended metadata).
    """
    # 1) Create the dictionary of all ABF files (short name -> full path)
    abf_dict = find_abf_files(abf_root)
    
    results_list = []
    
    # 2) Loop through each row of df_filtered
    for idx, row in df_filtered.iterrows():
        abf_name = row["filename"]  # e.g. "24n15005.abf"
        
        # 3) Look for full path in abf_dict
        if abf_name not in abf_dict:
            print(f"[WARNING] Cannot find {abf_name} in {abf_root}, skipping...")
            continue
        
        abf_path = abf_dict[abf_name]
        
        # 4) Perform your multi-sweep analysis 
        #    (pass color from the current row to the function)
        row_color = row.get("Color", "blue")  # default to "blue" if missing
        row_voltage = row.get("VoltageHold", -55)  # default to -55 if missing
        
        df_sweep = analyze_evoked_responses(
            abf_path=abf_path, 
            color=row_color, 
            rec_chan=0,
            voltage_hold = row_voltage
        )
        
        # For each sweep result, augment with metadata from df_filtered row
        for i_sweep, sweep_dict in df_sweep.iterrows():
            # sweep_dict holds columns like ["Sweep","Color","StimTime_s", etc.]
            # We'll make a new dictionary that merges row data and sweep data
            merged_result = {
                "index_df_filtered": idx,
                "filename": abf_name,
                
                # copy relevant columns from the row
                "Opsin":       row.get("Opsin", None),
                "Region":      row.get("Region", None),
                "BrainID":     row.get("BrainID", None),
                "SliceID":     row.get("SliceID", None),
                "CellID":      row.get("CellID", None),
                "VoltageHold": row.get("VoltageHold", None),
                "DrugList":    row.get("DrugList", None),
                "APregion":    row.get("APregion", None),
                "RoughAP":     row.get("RoughAP", None),
            }
            
            # Add the columns from the sweep_dict (the actual measurement results)
            # sweep_dict is a Series, so we convert to a dict
            merged_result.update(sweep_dict.to_dict())
            
            results_list.append(merged_result)
    
    # Create a DataFrame from the results
    df_results = pd.DataFrame(results_list)
    return df_results

## `analysis_results.csv`に保存(df_filteredに含まれるファイル解析)

In [None]:
# 0) Suppose we already have df_filtered
if df_filtered is None:
    df_filtered = pd.read_csv("./sorted_directory/master_with_AP_filtered.csv")


# 1) Path where ABF files live (somewhere in subfolders)
abf_root = "./sorted_directory"

# 2) Analyze
#df_results = analyze_abf_files(df_filtered, abf_root)
# NEW (parallel):
df_results = analyze_abf_files_parallel(df_filtered, abf_root, n_workers=8)

# 3) Check/save results
df_results.to_csv("./sorted_directory/analysis_results.csv", index=False)
df_results.to_csv(f"./sorted_directory/analysis_results_{df_results['Opsin'][1]}.csv")
df_results

## `plot_evoked_sweeps_5x2()` 関数

### 関数の概要

次の `plot_evoked_sweeps_5x2()` 関数は、ABF ファイル（電気生理学データ）を可視化するためのものです。具体的には以下の処理を行います:

1. **ABF ファイルのパスを検索**  
   ユーザが指定した `abf_root` ディレクトリを再帰的に探索し、引数で与えられた `filename`（例： `"24n15005.abf"`）に対応するフルパスを取得します。  
   - 見つからない場合はエラーを出して終了します。

2. **ABF データの読み込み**  
   `pyabf.ABF(abf_path)` を使って ABF ファイルを読み込み、刺激タイミングや記録波形 (`sweepY`) などをアクセスできるようにします。

3. **描画対象のスイープ（sweep）の抽出**  
   `df_results`（解析結果を保持する DataFrame）から、指定の `filename` と一致する行のみを抽出します。そこに含まれる `Sweep` 列（スイープ番号）をソートして、最大 10 スイープまでプロット対象にします。

4. **グローバルな x/y の描画範囲を決定するための第一段階処理**  
   各スイープに対して:
   - 該当スイープを `abf.setSweep()` でセットし、必要に応じてベースライン補正 (`baseline=[start, end]`) を行います。
   - 刺激タイミング（`StimTime_s`）を取得し、そこから `[stimTime - 0.1, stimTime + 0.5]` の時間範囲を「描画領域」として切り出します（ただし `StimTime_s` が NaN の場合はスイープ全域を使用）。
   - 切り出した時間領域 (`t_dom`) と電流波形 (`i_dom`) の最小値・最大値を求め、その情報から “グローバルな” 横軸 (time) の最小値・最大値、縦軸 (電流) の最小値・最大値を更新していきます。

5. **第二段階 (プロット本体)**  
   第一段階で集めたスイープごとの情報（`t_dom` や `i_dom` など）を用いて実際にグラフを描画します。
   - “生”の波形 (`t_dom`, `i_dom`) を `ax.plot()` で描画。
   - デジタル信号 (`d_dom`) が 1 になっている区間を、`fill_between()` を用いてシェーディング。
   - 刺激時刻が範囲内にあれば、グレーの縦帯 (`axvspan()`) で示す。
   - 各スイープに対し、オンセット (`RefinedOnset_s`)、ピーク時刻 (`PeakTime_s`) といった解析済みのマーカーをオーバーレイ（`plot_marker()` 関数で描画）。
   - フィット（`FitParams`）がある場合は、2 変数の指数関数などで計算したフィット結果を重ね描画。

6. **凡例とレイアウト**  
   各サブプロットで生成されたラインやラベルをまとめて、一意のもののみを抽出して凡例を作る（ただしコメントアウトされているので、デフォルトでは凡例を表示していない）。  
   タイトルは `fig.suptitle()` で一括設定し、`plt.tight_layout()` でレイアウトを整えた後に `plt.show()` で描画完了。

---

### 関数の主な引数

- **filename (str)**  
  描画対象となる ABF ファイル名（拡張子を含む）。  
- **df_results (pandas.DataFrame)**  
  スイープごとに解析した結果が含まれる表データ。たとえば、列に `Sweep`, `StimTime_s`, `RefinedOnset_s`, `PeakTime_s`, `FitParams` などが入っている想定。
- **abf_root (str)**  
  ABF ファイルを格納したディレクトリへのパス。

---

### 処理の流れ

1. **ABF ファイル検索**:  
   `find_abf_files(abf_root)` を使って、全サブディレクトリを含めて再帰的に `.abf` ファイルを探し、ファイル名（短い名称）からフルパスへの辞書を作る。
2. **ABF の読み込み**:  
   指定した `filename` が見つかれば `abf_path` を得て、`pyabf.ABF(abf_path)` で読み込み。
3. **該当ファイルの解析結果フィルタ**:  
   `df_results["filename"] == filename` で行を絞り込み、スイープ番号 (`Sweep` 列) を抽出してソート。
4. **グローバル描画範囲の決定 (第一段階)**  
   最大 10 個のスイープに対し、ベースライン補正と時間領域切り出しを行い、横軸 (time) と縦軸 (current) の全スイープ共通の min/max を算出。
5. **実際の描画 (第二段階)**  
   各スイープに対応するプロットを個別のサブプロット（5×2 のグリッド）に配置。時間軸をグローバルに合わせて、電流値もグローバルな min/max になるように設定。  
   刺激区間のシェーディング・オンセット/ピークマーカー・フィット曲線等を重ね描画。
6. **レジェンド重複の除去**:  
   全サブプロットで収集したライン/ラベルを集約し、重複しない形で最終的な legend を構築（ただし、サンプルコードでは最後にコメントアウトされており、実際には表示されない設定になっている）。
7. **レイアウト調整 & 表示**:  
   `plt.tight_layout()` で図を整形し、`plt.show()` で表示。

---

### コードを活用する際の注意

- 同じ ABF ファイルに複数のスイープが含まれる場合、本関数はその中でも `df_results` に記載されているものだけをプロットします。
- 刺激時刻がないスイープ（`StimTime_s` が NaN）の場合は、スイープ全体を描画しますが、x 軸範囲は `[0, abf.sweepX.max()]` 付近になる可能性があります。
- `subplot_info` に全スイープぶんの描画用データを一度格納し、二度目のループでグローバル軸範囲を適用して描画しているので、途中でさらにフィルタ等をかけたい場合は適宜ロジックを追加してカスタマイズが可能です。



In [None]:
import matplotlib.pyplot as plt
import numpy as np

def plot_evoked_sweeps_5x2(filename, df_results, abf_root):
    """
    - Plot each sweep in a separate subplot (up to 10 sweeps) arranged 5 rows × 2 columns.
    - Restrict domain [stimTime - 0.1, stimTime + 0.5].
    - Shade digital high times.
    - Mark onset/peak times (if present in df_results).
    - Use a single legend for the entire figure.
    - *All subplots share the same x/y limits* (taken from the min and max found among all sweeps).
    """

    # 1) Dictionary of ABF files
    abf_dict = find_abf_files(abf_root)

    # 2) Get the ABF path
    if filename not in abf_dict:
        print(f"[ERROR] ABF file not found: {filename}")
        return
    abf_path = abf_dict[filename]

    # 3) Load the ABF
    abf = pyabf.ABF(abf_path)

    # 4) Filter df_results for just this file
    df_sub = df_results[df_results["filename"] == filename].copy()
    sweep_nums = sorted(df_sub["Sweep"].unique())

    # Create figure with 5x2 subplots (up to 10 sweeps)
    fig, axes = plt.subplots(nrows=5, ncols=2, figsize=(10, 15), sharex=False, sharey=False)
    axes = axes.flatten()  # to index easily as a list

    # We'll collect global domain/y-range as we go:
    global_t_min = np.inf
    global_t_max = -np.inf
    global_y_bottom = np.inf
    global_y_top = -np.inf

    # We'll also store a dictionary with each subplot's data for a second pass
    subplot_info = []

    # For collecting legend handles/labels from all subplots
    all_lines = []
    all_labels = []

    for i, sweep_num in enumerate(sweep_nums):
        if i >= len(axes):
            print(f"[WARNING] More than {len(axes)} sweeps. Only plotting first {len(axes)}.")
            break

        ax = axes[i]
        row = df_sub[df_sub["Sweep"] == sweep_num].iloc[0]

        # Determine digital channel by color
        row_color = row.get("Color", "blue").lower()
        if row_color == "red":
            digOutNum = 0
        elif row_color == "blue":
            digOutNum = 3
        else:
            digOutNum = 3  # fallback

        hold_val = row.get("VoltageHold", -55)

        # Stim time for domain
        stim_t = row.get("StimTime_s", np.nan)
        if not np.isnan(stim_t):
            baseline_start_sec = stim_t - 0.01
            baseline_end_sec   = stim_t
        else:
            baseline_start_sec = 0
            baseline_end_sec   = 0.01

        # Set sweep with baseline
        abf.setSweep(
            sweepNumber=sweep_num,
            channel=0,
            baseline=[baseline_start_sec, baseline_end_sec]
        )

        time_s = abf.sweepX
        current_pA = abf.sweepY
        digital_sig = abf.sweepD(digOutNum)  # 0 or 1 array

        if np.isnan(stim_t):
            # If no stim time, just plot the whole sweep
            t_dom = time_s
            i_dom = current_pA
            d_dom = digital_sig
            # No domain limit
            local_t_min = t_dom.min()
            local_t_max = t_dom.max()
        else:
            # Domain [stimTime - 0.1, stimTime + 0.5]
            t_min = stim_t - 0.1
            t_max = stim_t + 0.5
            domain_mask = (time_s >= t_min) & (time_s <= t_max)
            if not np.any(domain_mask):
                # If domain empty, skip this sweep
                continue
            t_dom = time_s[domain_mask]
            i_dom = current_pA[domain_mask]
            d_dom = digital_sig[domain_mask]
            local_t_min = t_min
            local_t_max = t_max

        # Prepare data for plotting
        curr_min = i_dom.min()
        curr_max = i_dom.max()

        # Decide local y-limits
        if hold_val < 10:
            # negative
            y_bottom = curr_min * 1.5
            y_top    = 0.5 * curr_min * -1
        else:
            # positive
            y_bottom = 0.5 * curr_max * -1
            y_top    = curr_max * 1.5

        # In case y_top <= y_bottom, swap them
        if y_top <= y_bottom:
            y_bottom, y_top = min(y_bottom, y_top), max(y_bottom, y_top)

        # Update global domain/y-range
        global_t_min = min(global_t_min, local_t_min)
        global_t_max = max(global_t_max, local_t_max)
        global_y_bottom = min(global_y_bottom, y_bottom)
        global_y_top    = max(global_y_top, y_top)

        # Save the data so we can plot after all min/max are known
        subplot_info.append({
            "ax": ax,
            "t_dom": t_dom,
            "i_dom": i_dom,
            "d_dom": d_dom,
            "row": row,
            "sweep_num": sweep_num,
            "row_color": row_color,
            "stim_t": stim_t,
        })

    #
    # Second pass: Actually plot everything with the *global* domain and y-limits
    #
    for info in subplot_info:
        ax = info["ax"]
        t_dom = info["t_dom"]
        i_dom = info["i_dom"]
        d_dom = info["d_dom"]
        row   = info["row"]
        sweep_num = info["sweep_num"]
        row_color = info["row_color"]
        stim_t    = info["stim_t"]

        # Plot data
        ln = ax.plot(t_dom, i_dom, label=f"Sweep {sweep_num}")
        lines, labels = ax.get_legend_handles_labels()
        all_lines.extend(lines)
        all_labels.extend(labels)

        # Shade region where digital_sig == 1
        ax.fill_between(
            t_dom,
            i_dom.min(),
            i_dom.max(),
            where=(d_dom > 0.5),
            color=row_color,
            alpha=0.2
        )

        # Draw a thin gray band for the stimulus if valid
        if not np.isnan(stim_t):
            if (stim_t >= global_t_min) and (stim_t <= global_t_max):
                ax.axvspan(stim_t, stim_t+0.001, color="gray", alpha=0.2)

        ax.set_xlim(global_t_min, global_t_max)
        ax.set_ylim(global_y_bottom, global_y_top)
        ax.set_title(f"Sweep {sweep_num}")

        # Optionally mark onset/peak
        onset_t = row.get("RefinedOnset_s", np.nan)
        peak_t  = row.get("PeakTime_s", np.nan)

        def plot_marker(ax, marker_time, color_marker, label_marker):
            if np.isnan(marker_time):
                return
            if marker_time < global_t_min or marker_time > global_t_max:
                return
            # find the closest index in t_dom
            idx_closest = np.argmin(np.abs(t_dom - marker_time))
            ax.plot(
                t_dom[idx_closest],
                i_dom[idx_closest],
                marker="o",
                ms=7,
                mfc=color_marker,
                mec="k",
                label=label_marker
            )

        plot_marker(ax, onset_t, "green", "Onset")
        plot_marker(ax, peak_t,  "red",   "Peak")

        # If there's a fitted decay
        popt = row.get("FitParams", None)
        decay_start = row.get("DecayStart_s", None)
        decay_end   = row.get("DecayEnd_s", None)
        if (isinstance(popt,(list,np.ndarray)) 
            and not np.any(np.isnan(popt))
            and decay_start is not None 
            and decay_end   is not None):
            fit_t = np.linspace(decay_start, decay_end, 200)
            fit_x = fit_t - decay_start
            fit_y = biexponential_fit(fit_x, *popt)
            # Only plot portion overlapping with global domain
            fit_mask = (fit_t >= global_t_min) & (fit_t <= global_t_max)
            ax.plot(fit_t[fit_mask], fit_y[fit_mask], "k--", lw=2)

    # Remove duplicates in legend
    used = set()
    unique_lines = []
    unique_labels = []
    for l, lb in zip(all_lines, all_labels):
        if lb not in used:
            unique_lines.append(l)
            unique_labels.append(lb)
            used.add(lb)

    # Single legend for the entire figure (optional: adjust loc)
    #fig.legend(unique_lines, unique_labels, loc="upper center", ncol=5)
    fig.suptitle(f"Evoked Responses (5x2 grid): {filename}")

    plt.tight_layout()
    plt.show()


### `plot_evoked_sweeps_5x2()` 関数呼び出し

In [None]:
if df_results is None:
    df_results = pd.read_csv("./sorted_directory/analysis_results.csv")
plot_evoked_sweeps_5x2("24913043.abf", df_results, abf_root)

## `plot_sweep9_for_multiple_files_5x2`関数

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import os

def plot_sweep9_for_multiple_files_5x2(df_results, abf_root, output_dir="."):
    """
    1) From df_results, gather all unique filenames that contain a row with Sweep=9.
    2) Group those filenames in sets of up to 10 (so each figure can have 5x2 subplots).
    3) For each filename in that batch:
       - Attempt to plot the data for sweep 9.
       - Domain: [StimTime_s-0.1, StimTime_s+0.5] if StimTime_s is available, else the entire sweep.
       - Mark digital=1 region, etc.
    4) Save each figure as a JPG in output_dir.

    df_results is assumed to have columns:
      ["filename","Sweep","StimTime_s","Color","VoltageHold",...,"RefinedOnset_s","PeakTime_s","FitParams",...]
    """
    # 1) Filter rows for just Sweep=9
    df_sweep9 = df_results[df_results["Sweep"] == 9].copy()
    if len(df_sweep9) == 0:
        print("[WARNING] No rows with Sweep=9 found in df_results.")
        return

    # 2) Gather unique filenames which have a row for Sweep=9
    filenames_sweep9 = df_sweep9["filename"].unique()
    filenames_sweep9 = sorted(filenames_sweep9)

    # 3) We'll create a dictionary of ABF paths for quick lookup
    abf_dict = find_abf_files(abf_root)

    # We define a helper function to do one figure with up to 10 filenames
    def plot_batch_of_filenames(filenames_batch, fig_index):
        """Plot one figure with up to 10 subplots (5x2), each subplot = one filename's sweep=9."""
        fig, axes = plt.subplots(nrows=5, ncols=2, figsize=(10, 15), sharex=False, sharey=False)
        axes = axes.flatten()

        # Prepare for global domain/y-limits among these 10 filenames
        global_t_min = np.inf
        global_t_max = -np.inf
        global_y_bottom = np.inf
        global_y_top = -np.inf

        # We'll store data to plot in a second pass
        subplot_info = []

        # ─────────────────────────────────────────────────
        # FIRST PASS: find global domain among this batch
        # ─────────────────────────────────────────────────
        for i, fname in enumerate(filenames_batch):
            if i >= len(axes):
                break
            ax = axes[i]
            # Look up the row(s) in df_sweep9 for this filename
            rows_this_file = df_sweep9[df_sweep9["filename"] == fname]
            if len(rows_this_file) == 0:
                # No data? We'll leave it blank
                subplot_info.append({"ax":ax, "fname":fname, "hasData":False})
                continue

            # We'll pick the first row to glean color, stim time, etc.
            row0 = rows_this_file.iloc[0]
            color_str = row0.get("Color","blue").lower()
            if color_str == "red":
                digOutNum = 0
            elif color_str == "blue":
                digOutNum = 3
            else:
                digOutNum = 3

            hold_val = row0.get("VoltageHold", -55)
            stim_t   = row0.get("StimTime_s", np.nan)

            # Load the ABF
            if fname not in abf_dict:
                # ABF not found -> blank
                subplot_info.append({"ax":ax,"fname":fname,"hasData":False})
                continue

            abf_path = abf_dict[fname]
            abf = pyabf.ABF(abf_path)
            # Check if abf actually has that sweep index=9
            if 9 not in abf.sweepList:
                # This ABF doesn't have a sweep #9
                subplot_info.append({"ax":ax,"fname":fname,"hasData":False})
                continue

            # Load that sweep
            baseline_start = (stim_t - 0.01) if not np.isnan(stim_t) else 0
            baseline_end   = stim_t if not np.isnan(stim_t) else 0.01
            abf.setSweep(9, channel=0, baseline=[baseline_start, baseline_end])
            time_s = abf.sweepX
            current_pA = abf.sweepY
            digital_sig = abf.sweepD(digOutNum)

            # domain
            if np.isnan(stim_t):
                t_dom = time_s
                i_dom = current_pA
                d_dom = digital_sig
                local_t_min = t_dom.min()
                local_t_max = t_dom.max()
            else:
                t_min = stim_t - 0.1
                t_max = stim_t + 0.5
                domain_mask = (time_s>=t_min)&(time_s<=t_max)
                if not np.any(domain_mask):
                    # no data
                    subplot_info.append({"ax":ax,"fname":fname,"hasData":False})
                    continue
                t_dom = time_s[domain_mask]
                i_dom = current_pA[domain_mask]
                d_dom = digital_sig[domain_mask]
                local_t_min = t_min
                local_t_max = t_max

            # local y-limits
            curr_min = i_dom.min()
            curr_max = i_dom.max()
            if hold_val < 10:
                y_bottom = curr_min * 1.5
                y_top    = 0.5 * curr_min * -1
            else:
                y_bottom = 0.5 * curr_max * -1
                y_top    = curr_max * 1.5
            if y_top <= y_bottom:
                y_bottom, y_top = min(y_bottom, y_top), max(y_bottom, y_top)

            global_t_min = min(global_t_min, local_t_min)
            global_t_max = max(global_t_max, local_t_max)
            global_y_bottom = min(global_y_bottom, y_bottom)
            global_y_top    = max(global_y_top, y_top)

            # We'll store all rows for potential onset/peak plotting
            subplot_info.append({
                "ax":ax,
                "fname":fname,
                "hasData":True,
                "time_s":time_s,
                "current_pA":current_pA,
                "digital_sig":digital_sig,
                "t_dom":t_dom,
                "i_dom":i_dom,
                "d_dom":d_dom,
                "rows_file":rows_this_file,  # all rows in df_sweep9 for this filename
                "stim_t":stim_t,
                "hold_val":hold_val,
                "digOutNum":digOutNum,
            })

        # ──────────────────────────────────────────────
        # SECOND PASS: actually do the plotting
        # ──────────────────────────────────────────────
        all_lines, all_labels = [], []
        for info in subplot_info:
            ax = info["ax"]
            fname = info["fname"]
            if not info.get("hasData", False):
                ax.set_xlim(0,1)
                ax.set_ylim(-1,1)
                ax.set_title(f"{fname}\n(No data for sweep=9)")
                continue

            t_dom = info["t_dom"]
            i_dom = info["i_dom"]
            d_dom = info["d_dom"]
            rows_file = info["rows_file"]
            stim_t = info["stim_t"]

            # Plot
            ln = ax.plot(t_dom, i_dom, label=f"{fname}")
            lines, labels = ax.get_legend_handles_labels()
            all_lines.extend(lines)
            all_labels.extend(labels)

            ax.fill_between(
                t_dom,
                i_dom.min(), i_dom.max(),
                where=(d_dom>0.5),
                color="blue",  # or use row color if you prefer
                alpha=0.2
            )

            if not np.isnan(stim_t):
                if global_t_min < stim_t < global_t_max:
                    ax.axvspan(stim_t, stim_t+0.001, color="gray", alpha=0.2)

            ax.set_xlim(global_t_min, global_t_max)
            ax.set_ylim(global_y_bottom, global_y_top)
            ax.set_title(f"{fname}\n(Sweep 9)")

            # If you want to mark single-peak onset/peak from the first row
            row0 = rows_file.iloc[0]
            onset_t = row0.get("RefinedOnset_s", np.nan)
            peak_t  = row0.get("PeakTime_s",    np.nan)

            def plot_marker(mtime, color_marker, label_marker):
                if np.isnan(mtime):
                    return
                if not (global_t_min <= mtime <= global_t_max):
                    return
                idx_c = np.argmin(np.abs(t_dom - mtime))
                ax.plot(t_dom[idx_c], i_dom[idx_c],
                        marker="o",
                        ms=7,
                        mfc=color_marker,
                        mec="k",
                        label=label_marker)
            plot_marker(onset_t, "green", "Onset")
            plot_marker(peak_t,  "red",   "Peak")

            # If you want to overlay a fitted decay from row0
            popt = row0.get("FitParams", None)
            decay_start = row0.get("DecayStart_s", None)
            decay_end   = row0.get("DecayEnd_s", None)
            if (isinstance(popt,(list,np.ndarray))
                and not np.any(np.isnan(popt))
                and decay_start is not None 
                and decay_end   is not None):
                fit_t = np.linspace(decay_start, decay_end, 200)
                fit_x = fit_t - decay_start
                fit_y = biexponential_fit(fit_x,*popt)
                mask_ = (fit_t>=global_t_min)&(fit_t<=global_t_max)
                ax.plot(fit_t[mask_], fit_y[mask_], "k--", lw=2)

        used = set()
        unique_lines, unique_labels = [], []
        for l, lb in zip(all_lines, all_labels):
            if lb not in used:
                unique_lines.append(l)
                unique_labels.append(lb)
                used.add(lb)

        fig.suptitle(f"Sweep=9 Plots (Batch {fig_index})")
        plt.tight_layout()

        out_name = f"sweep9_batch{fig_index}.jpg"
        out_path = os.path.join(output_dir, out_name)
        plt.savefig(out_path, dpi=150)
        plt.close(fig)

    # Main loop: chunk the filenames into groups of up to 10
    filenames_per_fig = 10
    total_files = len(filenames_sweep9)
    n_figs = (total_files // filenames_per_fig) + (1 if total_files % filenames_per_fig else 0)
    for fig_i in range(n_figs):
        batch_fnames = filenames_sweep9[fig_i*filenames_per_fig : (fig_i+1)*filenames_per_fig]
        plot_batch_of_filenames(batch_fnames, fig_index=fig_i+1)


In [None]:
if df_results is None:
    df_results = pd.read_csv("./sorted_directory/analysis_results.csv")
plot_sweep9_for_multiple_files_5x2(df_results, abf_root, "./sorted_directory/Sweep9_plots")

# sweepごとにasynchronous EPSC解析

## `measure_sweep_multipeaks()`関数

### 関数の概要

`measure_sweep_multipeaks()` は、1つのスイープ（sweep）データから複数のピーク（イベント）を検出するための関数です。刺激タイミング（stimulus time）以降、指定した時間窓（`post_stim_window_sec`）内でピーク探索を行い、そのピークの時刻・振幅などをまとめて返します。主なステップは以下の通りです。

1. **刺激タイミングの取得 (`find_stim_time_digital`)**  
   デジタル信号から刺激が入った時刻 (`stim_time_s`) を取得し、それを中心として解析します。もし刺激が無い（`None`）場合はイベント検出を行わず空リストを返します。

2. **ベースライン補正**  
   刺激直前の短い時間ウィンドウ（`baseline_window_sec`）で電流値を補正し、基線を 0 に合わせます。

3. **ポスト刺激区間の切り出し**  
   刺激時刻から `post_stim_window_sec` 後までの区間を抽出し、その間だけピーク検出を行います。区間が見つからない場合は空リストを返します。

4. **極性の考慮 (inward / outward)**  
   保持電位（`voltage_hold`）が 10 mV 未満ならば、ピークは陰性（inward current）とみなして波形を反転させ、正側のピークとして検出できるようにします。10 mV 以上の場合はそのままピーク検出を行います。

5. **ピーク検出 (`scipy.signal.find_peaks`)**  
   - `height`: ピークの最小高さ  
   - `distance`: ピーク間の最小間隔（サンプル数に変換）  
   - `width`: ピークの最小幅（ミリ秒指定をサンプル数に変換）  
   - `prominence`: ピークのプロミネンス（局所的にどれだけ突出しているか）  
   これらを指定して `find_peaks` を呼び出します。コード内では、ピークの絶対量 (`peak_amp`) に応じて閾値を動的に設定する処理が含まれています。

6. **検出結果の格納**  
   見つかったピークのインデックス（`peaks`）ごとに、ピーク時刻（`EventTime_s`）、ピーク振幅（`EventAmp_pA`）などの情報を辞書形式でまとめ、リストとして返します。

---

### 引数の説明

- **abf (pyabf.ABF)**  
  解析対象となる ABF データを表すオブジェクト。スイープ設定や電流値の取得に利用します。

- **sweep_index (int)**  
  処理対象とするスイープの番号。

- **color (str)**  
  刺激を検出するデジタルチャンネルを決めるための色指定。通常 `"blue"` か `"red"` などで分けます。

- **rec_chan (int)**  
  記録チャネルのインデックス。ABF ファイル内に複数チャネルがある場合の選択に使います。

- **baseline_window_sec (float)**  
  ベースライン補正に使用する、刺激前の時間（秒）。この区間の平均値を差し引きます。

- **voltage_hold (float)**  
  保持電位 (mV)。これが 10 mV 未満だと陰性ピーク（内向き電流）とみなして波形を反転。

- **post_stim_window_sec (float)**  
  刺激後、ピーク検出を行う時間幅（秒）。例えば 0.25 であれば刺激後 250 ms の間だけ検出する。

- **min_peak_height (float)**  
  ピークとして検出する際に必要な最小高さ (pA)。ただし関数内で動的に更新される場合あり。

- **min_peak_distance (float)**  
  ピーク同士の最小間隔 (秒) で、`find_peaks` に与える `distance` パラメータに変換。

- **threshold_val, width_ms**  
  `find_peaks` の `threshold` / `width` の調整用パラメータ。コード内で適宜変換されて使われます。

---

### 戻り値

- **List[dict]**  
  各ピークイベントを表す辞書のリスト。以下のようなキーを含みます。
  - `"Sweep"`: スイープ番号
  - `"EventIndex"`: 検出されたピークの通し番号
  - `"EventTime_s"`: ピークが起きた絶対時刻（秒）
  - `"EventAmp_pA"`: ピークの振幅（pA）
  - `"StimTime_s"`: 刺激時刻（秒）
  - `"VoltageHold"`: 保持電位
  - など…

ピークが一つも見つからなかった場合は空のリスト `[]` を返します。


In [None]:
import numpy as np
import pyabf
import pyabf.filter
from scipy.signal import find_peaks
from scipy.optimize import curve_fit
#################################
# Multi-peak measurement (per sweep)
#################################
def measure_sweep_multipeaks(
    abf,
    sweep_index,
    color="blue",
    rec_chan=0,
    baseline_window_sec=0.01,
    voltage_hold=-55.0,
    post_stim_window_sec=0.250,
    min_peak_height=10.0,
    min_peak_distance=0.002,
    threshold_val = 10,
    width_ms = 2
):
    """
    Identify *multiple* peak events in a post-stim window.
    Returns a list of dicts (one for each event).
    
    Args:
        abf: a pyabf.ABF object
        sweep_index (int): which sweep to analyze
        color (str): "blue"/"red" for digital channel detection
        rec_chan (int): recording channel index
        baseline_window_sec (float): how many seconds to subtract
        voltage_hold (float): if <10 => inward (negative) events, else outward (positive)
        post_stim_window_sec (float): how long after stimulus to search for events
        min_peak_height (float): minimum absolute amplitude (pA) for detection
        min_peak_distance (float): minimal time in seconds between peaks 
                                   (converted to # of points below).
    
    Returns:
        List of dictionaries, each dictionary describing one event:
            [
              {
                "Sweep": sweep_index,
                "EventIndex": 0,
                "EventTime_s": absolute_time_of_peak,
                "EventAmp_pA": peak_amplitude,
                "StimTime_s": ...
                ...
              },
              ...
            ]
        If no stimulus or no events, returns [].
    """
    # 1) Stim time
    stim_time_s = find_stim_time_digital(abf, sweep_index, color=color)
    if stim_time_s is None:
        return []  # no stim => no events

    # 2) Baseline subtract
    baseline_start_sec = stim_time_s - baseline_window_sec
    baseline_end_sec = stim_time_s
    abf.setSweep(sweepNumber=sweep_index, channel=rec_chan,
                 baseline=[baseline_start_sec, baseline_end_sec])
    current_bs = abf.sweepY
    time_s = abf.sweepX
    

    # 3) Define the post-stim window for searching peaks
    window_start = stim_time_s
    window_end   = stim_time_s + post_stim_window_sec
    mask = (time_s >= window_start) & (time_s <= window_end)
    if not np.any(mask):
        return []
        
    t_post = time_s[mask]
    c_post = current_bs[mask]

    # 4) Negative vs positive peak
    if voltage_hold < 10:
        peak_idx = np.argmin(c_post)
        expect_inward = True
    else:
        peak_idx = np.argmax(c_post)
        expect_inward = False

    # 4) Decide if we look for negative or positive peaks
    #    If voltage_hold<10, we expect negative/inward, so let's invert.
    if voltage_hold < 10:
        # inward = negative => invert to find "positive" peaks
        data_for_find_peaks = -c_post
        # also invert min_peak_height
    else:
        data_for_find_peaks = c_post

    # Possibly reduce smoothing:
    #data_for_find_peaks_filtered = savgol_filter(data_for_find_peaks, window_length=101, polyorder=3)
    data_for_find_peaks_filtered = data_for_find_peaks
    
    # Dynamically scale thresholds based on the biggest peak in that window:
    peak_amp = abs(data_for_find_peaks[peak_idx])
    if voltage_hold < 10:
        min_peak_height = max(10, 0.05 * peak_amp)
        prominence_val = min(5, 0.05 * peak_amp)  # at least 5 pA or 5% of big peak
    else:
        min_peak_height = max(20, 0.2 * peak_amp)
        prominence_val = min(10, 0.1 * peak_amp)  # at least 5 pA or 5% of big peak
    
    # Let peaks be closer in time:
    dt = time_s[1] - time_s[0]
    min_distance_pts = int(0.005 // dt)  # 2 ms if you want to detect very fast multi-peaks
    width_pts = int(width_ms /1000 // dt)
    
    peaks, props = find_peaks(
        data_for_find_peaks_filtered,
        height = min_peak_height,
        #threshold=min_peak_threshold,
        distance=min_distance_pts,
        width = width_pts,
        prominence=prominence_val,
        rel_height=1
    )

    # If no peaks, return []
    if len(peaks) == 0:
        return []

    # 6) For each peak index, store amplitude/time
    event_dicts = []
    for i_evt, p_idx in enumerate(peaks):
        # p_idx is index within t_post/c_post
        # amplitude is c_post[p_idx]
        peak_amp = c_post[p_idx]
        peak_time_rel = t_post[p_idx] - stim_time_s
        peak_time_abs = t_post[p_idx]

        # optional: measure decay or do a smaller "local" fit
        # for brevity we'll skip the advanced steps.
        # We'll just store the amplitude/time in a dictionary.
        event_dict = {
            "Sweep": sweep_index,
            "EventIndex": i_evt,
            "EventTime_s": peak_time_abs,
            "EventAmp_pA": peak_amp,
            "StimTime_s": stim_time_s,
            "VoltageHold": voltage_hold,
            "BaselineStart_s": baseline_start_sec,
            "BaselineEnd_s": baseline_end_sec,
        }
        event_dicts.append(event_dict)

    return event_dicts

## `analyze_evoked_responses_multipeaks(abf_path, color="blue", rec_chan=0, voltage_hold=-55.0, post_stim_window_sec=0.500)`

この関数は、1つの ABF ファイルを開き、すべてのスイープ（`abf.sweepList`）を順に処理します。各スイープに対して `measure_sweep_multipeaks()` を呼び出し、検出されたすべてのイベント（ピーク）をまとめます。その結果を一つの DataFrame として返します。

### 主な処理の流れ

1. **ABF ファイルの読み込み**  
   `pyabf.ABF(abf_path)` を使って ABF オブジェクトを作成します。

2. **フィルタの適用**  
    `pyabf.filter.gaussian(abf, 0) pyabf.filter.gaussian(abf, 1)`

   ここでは最初に `sigma=0` で既存のフィルタを解除し、その後 `sigma=1` のガウシアンフィルタをかける例になっています。

4. **スイープごとのイベント解析**  
`for sweep_index in abf.sweepList:` のループで各スイープに対して `measure_sweep_multipeaks()` を呼び出し、得られたイベント情報を `all_events` リストに追記します。

5. **DataFrame に変換**  
最終的に `all_events`（辞書のリスト）を `pd.DataFrame(all_events)` によって整形し、返します。

---

## `analyze_abf_files_multipeaks(df_filtered, abf_root)`

こちらの関数は、複数の ABF ファイルや複数の設定条件（色/電位など）を含む DataFrame（`df_filtered`）をもとに、各行（各条件）に応じた ABF ファイルを探し出して解析を行います。
### 主な処理の流れ
1. **ABF ファイルパスの辞書作成**  
`abf_dict = find_abf_files(abf_root)` で、ディレクトリ下のすべての ABF ファイルを探して、ファイル名 → 絶対パスの対応を作ります。

2. **df_filtered の各行についてループ**  
それぞれの行には `filename`、`Color`、`VoltageHold` などの情報が含まれます。  
- `abf_name = row["filename"]` で ABF ファイル名を取得  
- `row_color` や `row_voltage` で解析条件を取得

3. **`analyze_evoked_responses_multipeaks()` の呼び出し**  
得られた `abf_path`、`row_color`、`row_voltage` を使って、先述の `analyze_evoked_responses_multipeaks()` を実行します。

4. **結果のマージ**  
`df_events`（マルチピーク解析結果）に対し、元の `df_filtered` の行のメタデータ（BrainID や Region など）を結合して `results_list` に格納します。

5. **DataFrame で返す**  
最後に、すべてのマルチピーク解析結果をまとめたリストを `pd.DataFrame(results_list)` として返します。

---

### 使い所

- **単一の ABF ファイルを複数のスイープで解析したい場合**  
`analyze_evoked_responses_multipeaks()` を呼べば、1 ファイルあたりのすべてのイベント検出結果が得られます。

- **多数のファイル・多数のスライス条件をまとめて処理したい場合**  
`analyze_abf_files_multipeaks()` に、ABF ファイル名や保持電位、色の情報を含む DataFrame を与えると、複数条件を一括でマルチピーク解析できます。



In [None]:
###################################
# Analyzing an ABF with multi-peaks
###################################
def analyze_evoked_responses_multipeaks(
    abf_path, 
    color="blue", 
    rec_chan=0, 
    voltage_hold=-55.0,
    post_stim_window_sec=0.500
):
    """
    Loop over all sweeps in the ABF file, measure *multiple* peaks if present.
    Returns a DataFrame with multiple rows per sweep if multiple peaks are detected.
    """
    abf = pyabf.ABF(abf_path)
    pyabf.filter.gaussian(abf, 0)  # remove old filter
    pyabf.filter.gaussian(abf, 1)  # apply custom sigma
    all_events = []

    for sweep_index in abf.sweepList:
        events = measure_sweep_multipeaks(
            abf=abf,
            sweep_index=sweep_index,
            color=color,
            rec_chan=rec_chan,
            baseline_window_sec=0.01,
            voltage_hold=voltage_hold,
            post_stim_window_sec=post_stim_window_sec
        )
        # events is a list of dictionaries; each dictionary = one event
        all_events.extend(events)

    return pd.DataFrame(all_events)

#################################
# Putting it all together
#################################
def analyze_abf_files_multipeaks(df_filtered, abf_root):
    """
    Similar to 'analyze_abf_files' but calls analyze_evoked_responses_multipeaks().
    Each row in df_filtered => analyze that ABF with that color/hold.
    We may produce multiple events per sweep => final DataFrame has many rows.
    """
    abf_dict = find_abf_files(abf_root)  # short name -> full path
    results_list = []

    for idx, row in df_filtered.iterrows():
        abf_name = row["filename"]  # e.g. "24n15005.abf"
        if abf_name not in abf_dict:
            print(f"[WARNING] Cannot find {abf_name} in {abf_root}, skipping...")
            continue
        abf_path = abf_dict[abf_name]

        row_color = row.get("Color", "blue")
        row_voltage = row.get("VoltageHold", -55)

        # Analyze for multi-peaks
        df_events = analyze_evoked_responses_multipeaks(
            abf_path=abf_path,
            color=row_color,
            rec_chan=0,
            voltage_hold=row_voltage,
            post_stim_window_sec=0.500
        )
        # df_events has columns like Sweep, EventIndex, EventTime_s, EventAmp_pA, etc.

        # For each event, merge with row metadata:
        for _, evt in df_events.iterrows():
            row_dict = {
                "index_df_filtered": idx,
                "filename": abf_name,
                # carry over user columns
                "Opsin":    row.get("Opsin", None),
                "Region":   row.get("Region", None),
                "BrainID":  row.get("BrainID", None),
                "SliceID":  row.get("SliceID", None),
                "CellID":   row.get("CellID", None),
                "DrugList": row.get("DrugList", None),
                "APregion": row.get("APregion", None),
                "RoughAP":  row.get("RoughAP", None),
            }
            # add event columns
            row_dict.update(evt.to_dict())

            results_list.append(row_dict)

    return pd.DataFrame(results_list)

## sweepごとにasynchronous EPSC解析処理段階

In [None]:
# 0) Suppose we already have df_filtered
if df_filtered is None:
    df_filtered = pd.read_csv("./sorted_directory/master_with_AP_filtered.csv")


# 1) Path where ABF files live (somewhere in subfolders)
abf_root = "./sorted_directory"

# 2) Analyze
df_results_multipeaks = analyze_abf_files_multipeaks(df_filtered, abf_root)

# 3) Check/save results
df_results_multipeaks.to_csv("./sorted_directory/analysis_multipeaks_results.csv", index=False)
df_results_multipeaks

# Asynchronous EPSC peak確認plot

## `plot_evoked_sweeps_5x2`説明
この関数は、単一の ABF ファイル（例: `"24n15005.abf"`)に含まれる複数スイープの記録波形を、5行×2列（最大10スイープ）で図示するためのものです。以下の特徴を持ちます:

1. **ドメインの制限**  
   それぞれのスイープに対して、刺激 (StimTime) から前後 [−0.1 秒, +0.5 秒] の範囲のみを抽出し、波形をプロットします。  
   もし StimTime が存在しない場合 (NaN の場合) は、スイープの全範囲をプロットします。

2. **デジタル信号の可視化 (shade)**  
   `abf.sweepD(digOutNum)` を用いて取り出したデジタル出力が 1 の区間を、該当スイープ波形の最小値から最大値に渡って色を塗りつぶし (fill_between)、視覚的に刺激タイミングを示します。

3. **Stimulus のマーク**  
   StimTime が有効な場合、その時点に薄い灰色の帯 (`ax.axvspan`) をプロットし、刺激が入ったタイミングを示します。

4. **単一ピーク解析の結果のマーカー**  
   引数で与えられる `df_results` (単一ピーク解析などの結果) から、  
   - `RefinedOnset_s` (発現時刻)  
   - `PeakTime_s` (ピーク時刻)  
   を取得し、該当時刻をプロット上で緑や赤のマーカーとして描画します。

5. **マルチピーク解析の結果のマーカー**  
   引数 `df_events` (マルチピーク解析の結果) から、  
   - `EventTime_s` (イベント時刻)  
   - `EventAmp_pA` (イベント振幅)  
   を取得し、ダイヤ型（`marker="D"`, 色はマゼンタ）として複数のイベントをプロットに重ねます。

6. **全サブプロットでの共通スケール**  
   全スイープについて、まずは各スイープごとに局所的な x・y 範囲を見積もり、その最小値・最大値を集めて「グローバルな最小・最大」を決めます。  
   そして 2 回目のループで、すべてのサブプロットに対して同じ `xlim`・`ylim` を設定して統一的に表示します。

7. **レジェンド**  
   全てのサブプロットから集めた凡例要素（`all_lines` と `all_labels`）を元に、重複しない形でまとめることができます。  
   ※ ここではコメントアウトされていますが、`fig.legend` を使うことで図全体のレジェンドをまとめて表示可能です。

---

### 関数引数

- `filename (str)`  
  解析・描画対象の ABF ファイル名 (例: `"24n15005.abf"`)

- `df_results (DataFrame)`  
  単一ピーク解析やメインピーク解析結果の DataFrame。  
  該当ファイル・スイープに対して、  
  - `Sweep`,  
  - `RefinedOnset_s`,  
  - `PeakTime_s`,  
  - `FitParams`  
  などの列を持つ。

- `df_events (DataFrame)`  
  マルチピーク解析結果の DataFrame。  
  - `Sweep`,  
  - `EventTime_s`,  
  - `EventAmp_pA`  
  などの列を持つ。

- `abf_root (str)`  
  ABF ファイルが存在するディレクトリへのパス。  
  関数内部で `find_abf_files(abf_root)` を呼び、ファイル名→フルパスの辞書を作る。

---

### 処理の流れ

1. **ABF ファイルの存在確認**  
   `find_abf_files(abf_root)` でファイル名からパスを探し、該当するかチェック。見つからなければエラーを表示して終了。

2. **ABF ファイルの読み込み & フィルタ処理**  
   `abf = pyabf.ABF(abf_path)` でロードし、

   `pyabf.filter.gaussian(abf, 0) pyabf.filter.gaussian(abf, 1)`
    のようにガウシアンフィルタの適用例が記述されている。

4. **データの絞り込みと下準備**  
- `df_sub_main` : 該当ファイルに対する単一ピーク解析結果を抽出  
- `df_sub_evts` : 該当ファイルに対するマルチピーク解析結果を抽出  
- `sweep_nums` : プロット対象となるスイープ番号（ソート済み）

4. **サブプロットの準備 (5×2 = 10)**  
`fig, axes = plt.subplots(nrows=5, ncols=2, figsize=(10, 15))` で 10 面までプロット可能。

5. **第一段階: x軸・y軸の全体範囲を決める**  
各スイープに対して刺激時刻をもとに `[stimTime - 0.1, stimTime + 0.5]` の区間だけ抜き出し、最小値・最大値を計算。  
全スイープの合計で `global_t_min, global_t_max, global_y_bottom, global_y_top` を決定する。

6. **第二段階: 実際にプロット**  
- 抜き出した区間の波形 (`t_dom` vs `i_dom`) をプロット  
- デジタル出力 (`d_dom`) が 1 の区間を `fill_between` で着色  
- StimTime (灰色の帯)  
- 単一ピークの Onset (緑) / Peak (赤)  
- マルチピークのイベント (マゼンタのダイヤマーカー)  
- フィットされた減衰カーブ (二重指数関数など) を描画

7. **レジェンド・タイトル・レイアウト**  
- 重複しない形のレジェンドエントリを作成  
- `fig.suptitle` で全体タイトルを設定  
- `plt.tight_layout()` でサブプロット間のレイアウトを整える

---

### 注意点

- 単一ピーク解析 (`df_results`) とマルチピーク解析 (`df_events`) は別々の DataFrame を受け取る設計。  
- スイープごとに複数行ある場合、実装次第で複数マーカーが表示される可能性がある。  
- フィルタ (`pyabf.filter.gaussian`) の効果やパラメータは例示であり、実際の解析要件に合わせる必要がある。



In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pyabf
import pyabf.filter

def plot_evoked_sweeps_5x2(filename, df_results, df_events, abf_root):
    """
    - Plot each sweep in a separate subplot (up to 10 sweeps) arranged 5 rows × 2 columns.
    - Restrict domain [stimTime - 0.1, stimTime + 0.5].
    - Shade digital high times.
    - Mark onset/peak times (if present in df_results).
    - Mark multi-peak events from df_events using (EventTime_s, EventAmp_pA).
    - Use a single legend for the entire figure.
    - All subplots share the same x/y limits (taken from the min and max found among all sweeps).
    
    Args:
        filename (str): e.g. "24n15005.abf"
        df_results (DataFrame): single-peak or main-peak results 
                                (has columns like Sweep, RefinedOnset_s, PeakTime_s, etc.)
        df_events (DataFrame): multi-peak results 
                               (has columns like Sweep, EventTime_s, EventAmp_pA, etc.)
        abf_root (str): path containing the ABF files
    """

    # 1) Dictionary of ABF files
    abf_dict = find_abf_files(abf_root)

    # 2) Get the ABF path
    if filename not in abf_dict:
        print(f"[ERROR] ABF file not found: {filename}")
        return
    abf_path = abf_dict[filename]

    # 3) Load the ABF
    abf = pyabf.ABF(abf_path)
    pyabf.filter.gaussian(abf, 0)  # remove old filter
    pyabf.filter.gaussian(abf, 1)  # apply custom sigma

    # 4) Filter df_results for just this file
    df_sub_main = df_results[df_results["filename"] == filename].copy()
    df_sub_evts = df_events[df_events["filename"] == filename].copy()

    sweep_nums = sorted(df_sub_main["Sweep"].unique())  # or union of sweeps from both dataframes

    # Create figure with 5x2 subplots (up to 10 sweeps)
    fig, axes = plt.subplots(nrows=5, ncols=2, figsize=(10, 15))
    axes = axes.flatten()  # to index easily as a list

    # We'll collect global domain/y-range as we go:
    global_t_min = np.inf
    global_t_max = -np.inf
    global_y_bottom = np.inf
    global_y_top = -np.inf

    # We'll store info to plot in a second pass
    subplot_info = []

    # Collect legend handles/labels for a single legend at the end
    all_lines = []
    all_labels = []

    # ─────────────────────────────────────────────────────────
    # FIRST PASS: determine global axis limits
    # ─────────────────────────────────────────────────────────
    for i, sweep_num in enumerate(sweep_nums):
        if i >= len(axes):
            print(f"[WARNING] More than {len(axes)} sweeps. Only plotting first {len(axes)}.")
            break

        ax = axes[i]

        # Grab one representative row from df_sub_main for that sweep
        # (assuming each sweep has at least one row there)
        row_main = df_sub_main[df_sub_main["Sweep"] == sweep_num].iloc[0]

        # Determine digital channel by color
        row_color = row_main.get("Color", "blue").lower()
        if row_color == "red":
            digOutNum = 0
        elif row_color == "blue":
            digOutNum = 3
        else:
            digOutNum = 3  # fallback

        # Stim time for domain
        stim_t = row_main.get("StimTime_s", np.nan)
        if not np.isnan(stim_t):
            baseline_start_sec = stim_t - 0.01
            baseline_end_sec   = stim_t
        else:
            baseline_start_sec = 0
            baseline_end_sec   = 0.01

        # Set sweep with baseline
        abf.setSweep(
            sweepNumber=sweep_num,
            channel=0,
            baseline=[baseline_start_sec, baseline_end_sec]
        )
        

        time_s = abf.sweepX
        current_pA = abf.sweepY
        digital_sig = abf.sweepD(digOutNum)  # 0 or 1 array

        # Domain [stimTime - 0.1, stimTime + 0.5], if stim_t is valid
        if np.isnan(stim_t):
            # If no stim time, just plot everything
            t_dom = time_s
            i_dom = current_pA
            d_dom = digital_sig
            local_t_min = t_dom.min()
            local_t_max = t_dom.max()
        else:
            t_min = stim_t - 0.1
            t_max = stim_t + 0.5
            domain_mask = (time_s >= t_min) & (time_s <= t_max)
            if not np.any(domain_mask):
                continue
            t_dom = time_s[domain_mask]
            i_dom = current_pA[domain_mask]
            d_dom = digital_sig[domain_mask]
            local_t_min = t_min
            local_t_max = t_max

        curr_min = i_dom.min()
        curr_max = i_dom.max()

        hold_val = row_main.get("VoltageHold", -55)
        # Decide local y-limits
        if hold_val < 10:
            # negative
            y_bottom = curr_min * 1.5
            y_top    = 0.5 * curr_min * -1
        else:
            # positive
            y_bottom = 0.5 * curr_max * -1
            y_top    = curr_max * 1.5

        if y_top <= y_bottom:
            y_bottom, y_top = min(y_bottom, y_top), max(y_bottom, y_top)

        # Update global domain/y-range
        global_t_min = min(global_t_min, local_t_min)
        global_t_max = max(global_t_max, local_t_max)
        global_y_bottom = min(global_y_bottom, y_bottom)
        global_y_top    = max(global_y_top, y_top)

        # Store info for second pass
        subplot_info.append({
            "ax": ax,
            "sweep_num": sweep_num,
            "row_color": row_color,
            "stim_t": stim_t,
            "t_dom": t_dom,
            "i_dom": i_dom,
            "d_dom": d_dom,
        })

    # ─────────────────────────────────────────────────────────
    # SECOND PASS: do the actual plotting with global limits
    # ─────────────────────────────────────────────────────────
    for info in subplot_info:
        ax = info["ax"]
        sweep_num = info["sweep_num"]
        row_color = info["row_color"]
        stim_t    = info["stim_t"]
        t_dom     = info["t_dom"]
        i_dom     = info["i_dom"]
        d_dom     = info["d_dom"]

        # Plot data
        ln = ax.plot(t_dom, i_dom, label=f"Sweep {sweep_num}")
        lines, labels = ax.get_legend_handles_labels()
        all_lines.extend(lines)
        all_labels.extend(labels)

        # Shade region where digital_sig == 1
        ax.fill_between(
            t_dom,
            i_dom.min(),
            i_dom.max(),
            where=(d_dom > 0.5),
            color=row_color,
            alpha=0.2
        )

        # Stim mark
        if not np.isnan(stim_t):
            if global_t_min < stim_t < global_t_max:
                ax.axvspan(stim_t, stim_t+0.001, color="gray", alpha=0.2)

        ax.set_xlim(global_t_min, global_t_max)
        ax.set_ylim(global_y_bottom, global_y_top)
        ax.set_title(f"Sweep {sweep_num}")

        # ─────────────────────────────────────────────────
        # 1) Mark single-peak onset/peak (from df_results if present)
        # ─────────────────────────────────────────────────
        #   *We can have multiple rows for the same sweep in df_sub_main,
        #    but commonly you might store just one row per sweep in single-peak scenario.
        df_sub_sweep_main = df_sub_main[df_sub_main["Sweep"] == sweep_num]
        if len(df_sub_sweep_main) > 0:
            # Just use the first row (or loop, depending on your logic)
            row_main = df_sub_sweep_main.iloc[0]

            onset_t = row_main.get("RefinedOnset_s", np.nan)
            peak_t  = row_main.get("PeakTime_s",    np.nan)

            def plot_marker(ax, marker_time, color_marker, label_marker):
                if np.isnan(marker_time):
                    return
                if not (global_t_min <= marker_time <= global_t_max):
                    return
                idx_closest = np.argmin(np.abs(t_dom - marker_time))
                ax.plot(
                    t_dom[idx_closest],
                    i_dom[idx_closest],
                    marker="o",
                    ms=7,
                    mfc=color_marker,
                    mec="k",
                    label=label_marker
                )

            plot_marker(ax, onset_t, "green", "Onset")
            plot_marker(ax, peak_t,  "red",   "Peak")

            # Possibly overlay the fitted decay
            popt = row_main.get("FitParams", None)
            decay_start = row_main.get("DecayStart_s", None)
            decay_end   = row_main.get("DecayEnd_s",   None)
            if (isinstance(popt,(list,np.ndarray)) 
                and not np.any(np.isnan(popt))
                and decay_start is not None
                and decay_end   is not None):
                fit_t = np.linspace(decay_start, decay_end, 200)
                fit_x = fit_t - decay_start
                fit_y = biexponential_fit(fit_x, *popt)
                fit_mask = (fit_t >= global_t_min) & (fit_t <= global_t_max)
                ax.plot(fit_t[fit_mask], fit_y[fit_mask], "k--", lw=2)

        # ─────────────────────────────────────────────────
        # 2) Mark multi-peak events (df_events, one row per event)
        # ─────────────────────────────────────────────────
        df_sub_sweep_evts = df_sub_evts[df_sub_evts["Sweep"] == sweep_num]
        for _, evt_row in df_sub_sweep_evts.iterrows():
            evt_time = evt_row["EventTime_s"]
            evt_amp  = evt_row["EventAmp_pA"]  # not always used, but you could check sign etc.

            if np.isnan(evt_time):
                continue
            if not (global_t_min <= evt_time <= global_t_max):
                continue

            # find closest index in t_dom
            idx_closest = np.argmin(np.abs(t_dom - evt_time))
            ax.plot(
                t_dom[idx_closest],
                i_dom[idx_closest],
                marker="D",      # diamond shape
                alpha = 0.3,
                ms=6,
                mfc="magenta",   # fill color
                mec="k",         # edge color
                label="Event"
            )

    # Remove duplicates in legend
    used = set()
    unique_lines = []
    unique_labels = []
    for l, lb in zip(all_lines, all_labels):
        if lb not in used:
            unique_lines.append(l)
            unique_labels.append(lb)
            used.add(lb)

    # Single legend for the entire figure
    # (loc can be changed as you wish, e.g. "upper right")
    #fig.legend(unique_lines, unique_labels, loc="upper center", ncol=5)

    fig.suptitle(f"Evoked Responses (5x2 grid): {filename}")
    plt.tight_layout()
    plt.show()


## 関数呼び出してplot

In [None]:
# 0) Suppose we already have df_filtered
if df_results is None:
    df_results = pd.read_csv("./sorted_directory/analysis_results.csv")
if df_results_multipeaks is None:
    df_results_multipeaks = pd.read_csv("./sorted_directory/analysis_multipeaks_results.csv")
df_results = pd.read_csv("./sorted_directory/analysis_results_ChR2.csv")

# 1) Path where ABF files live (somewhere in subfolders)
abf_root = "./sorted_directory"

plot_evoked_sweeps_5x2("24d20009.abf", df_results, df_results_multipeaks, abf_root)

# df_pairs作成(-55 mVと+10 mVデータを集める)

1) **最初の準備**  
   - `df_filtered_indexreset` は、もとの `df_filtered` に行インデックス列（`row_index`）を追加した新しい表です。  
   - ここでは、`df_filtered` をリセットして `row_index` という列を作成しておき、後の処理で「どの行が先に出てきたか」を判断できるようにしています。  

2) **電位の違いによる分割**  
   - `df_minus55` は、`df_filtered_indexreset` の中で `VoltageHold` が -55 の行だけを取り出したものです。  
   - `df_plus10` は、`VoltageHold` が 10 の行だけを取り出したものです。  
   - これにより、-55 のデータと +10 のデータを別々のテーブルとして扱えるようになります。  

3) **マッチング条件の指定**  
   - `merge_cols` には、`Opsin` や `Region`、`BrainID`、`SliceID`、`CellID`、`Color`、`StimPower`、`StimDuration` など、「一致していてほしい列名」が入っています。  
   - 後の結合（マージ）で、このリストにある列が同じ値の行どうしを組み合わせる、という指定をしています。  

4) **マージ（結合）の実行**  
   - `df_joined` は、`df_minus55` と `df_plus10` を結合した結果です。  
   - ここで、`on=merge_cols` とすることで、両方のテーブルに含まれる指定の列がすべて同じ値の行どうしが結合されます。  
   - `suffixes=("_minus55", "_plus10")` により、同じ列名が衝突した場合に後ろにつける文字列を指定しています（-55 側の列には `_minus55`、+10 側には `_plus10`）。  
   - `how="inner"` は、両方に共通して存在する行だけ残す結合方法を意味します。  

5) **行インデックスによるフィルタ**  
   - 結合後の `df_joined` には、それぞれの行に対応する `row_index_minus55` と `row_index_plus10` が含まれます。  
   - `df_joined["row_index_minus55"] < df_joined["row_index_plus10"]` という条件で、-55 側の行が先に出現し、そのあとに +10 側の行が続く（インデックスが大きい）ケースだけを残しています。  
   - これにより、「同じ条件の -55 の記録が、あとから出てくる +10 の記録より前にある」ペアだけを取得することができます。  

6) **必要な列を抜き出して df_pairs にまとめる**  
   - 最終的に `df_pairs` は、`df_joined` から必要な列だけを取り出したものです。  
   - `filename_minus55` や `filename_plus10` などを同時に保持するので、-55 側と +10 側の記録ファイルがどのようにペアになっているかがひと目でわかります。  
   - こうすることで、同じパラメータ（`Opsin` や `BrainID` など）でありつつ、`VoltageHold` の異なる 2 行が 1 行としてペア化されます。


In [None]:
import pandas as pd

# 0) Suppose we already have df_filtered
if df_filtered is None:
    df_filtered = pd.read_csv("./sorted_directory/master_with_AP_filtered.csv")
if df_results is None:
    df_results = pd.read_csv("./sorted_directory/analysis_results.csv")


# Example DataFrame 'df' with columns like:
# Opsin, Region, BrainID, SliceID, CellID, VoltageHold, filename, etc.

# 0) Add a row index column
df_filtered_indexreset = df_filtered.reset_index(drop=True)
df_filtered_indexreset["row_index"] = df_filtered_indexreset.index  # or use df.reset_index() to keep a built-in col

# 1) Split
df_minus55 = df_filtered_indexreset[df_filtered_indexreset["VoltageHold"] == -55].copy()
df_plus10  = df_filtered_indexreset[df_filtered_indexreset["VoltageHold"] == 10].copy()

# 2) Merge on matching columns (everything except VoltageHold)
#    e.g. Opsin, Region, BrainID, SliceID, CellID, ...
#    Add any columns you want to match exactly in the 'on' list.
merge_cols = [
    "Opsin","Region","BrainID","SliceID","CellID","Color",
    "StimPower","StimDuration", "APregion", "RoughAP"
]
df_joined = pd.merge(
    df_minus55,
    df_plus10,
    on=merge_cols,
    suffixes=("_minus55", "_plus10"),
    how="inner"
)

# 3) Filter so the -55 row index is smaller than the +10 row index
df_joined = df_joined[
    df_joined["row_index_minus55"] < df_joined["row_index_plus10"]
]

# 4) Now df_joined has pairs of rows that match on those columns
#    (and the -55 row appears earlier than the +10 row).
#    If you only need certain columns, you can select them:
df_pairs = df_joined[[
    "Opsin",
    "Region",
    "BrainID",
    "SliceID",
    "CellID",
    "Color",
    "StimPower",
    "StimDuration",
    "APregion", 
    "RoughAP",
    "filename_minus55",  # or other columns from the -55 side
    "filename_plus10",   # or other columns from the +10 side
    # ...
]]

# df_pairs now has one row per match, with columns for both the -55 side
# and the +10 side. You could rename columns if you want.
df_pairs

# Result_of_EIkinetics.csv保存

## -55 mVデータと+10 mVデータの解析結果をanalysis_results.csvから集める

1) **-55 mV 側 (df_minus) と +10 mV 側 (df_plus) の分割**  
   `df_results` から、`VoltageHold` が `-55` の行だけを `df_minus` に、`10` の行だけを `df_plus` にそれぞれ抽出します。  
   これによって、-55 mV 条件で記録されたデータと +10 mV 条件で記録されたデータを分けて集計する準備ができます。

2) **df_minus_agg の作成（-55 mV 側の平均・標準偏差など）**  
   `df_minus` に対して `groupby("filename")` を行い、各ファイルごとに `PeakAmplitude_pA` や `Latency_ms` などの列を `"mean"`, `"std"` で集計しています。  
   これにより、同じ ABF ファイル名に含まれる複数のスイープ結果をまとめ、平均値や標準偏差を求められます。  
   得られた結果の列名は、複数階層 (`PeakAmplitude_pA mean` や `PeakAmplitude_pA std` など) になってしまうので、`to_flat_index()` などでフラット化し、名前を結合しています。  
   最終的に `PeakAmplitude_pA_mean` などのような列に変換されます。  
   さらに、標準偏差を平均で割った「変動係数 (CV)」を求めるため、たとえば `PeakAmplitude_pA_CV = PeakAmplitude_pA_std / PeakAmplitude_pA_mean` のように列を追加しています。

3) **列名を「minus55」向けにリネーム**  
   `filename` や `PeakAmplitude_pA_mean` などの列を、一意にわかりやすくするために `filename_minus55` や `PeakAmp_minus55_mean` のような名前にリネームしています。  
   こうすることで、あとで +10 側と区別できるようになります。

4) **+10 mV 側の集計 (df_plus_agg)**  
   上記と同様に、`df_plus` でも `groupby("filename")` で平均・標準偏差を集計し、列をフラット化します。  
   -55 mV と同じように、`PeakAmplitude_pA_CV` や `Latency_ms_CV` などを計算し、今度は列名を「plus10」向け (`filename_plus10`, `PeakAmp_plus10_mean` など) に変更します。

5) **ペア化テーブル (df_pairs) と -55 側の集計をマージ**  
   すでに作成してあるペア化テーブル (`df_pairs`) は、`filename_minus55` と `filename_plus10` を列として持ち、-55 条件のファイル名と +10 条件のファイル名の対応が記述されています。  
   `df_minus_agg` を、`df_pairs` の `filename_minus55` と結合することで、-55 側の集計情報 (`PeakAmp_minus55_mean` など) をペア化テーブルに合流させます。  
   `left_on="filename_minus55"`, `right_on="filename_minus55"` により、両方のテーブルに共通する -55 mV 側ファイル名が合致した行同士が結合されます。

6) **次に +10 側の集計をマージ**  
   前ステップでできた中間テーブル (`df_merged1`) に対し、`df_plus_agg` を `filename_plus10` 列で結合します。  
   これにより、+10 mV 側の集計データ (`PeakAmp_plus10_mean` など) も同じペアの行に結合され、最終的に -55 側と +10 側それぞれの平均・標準偏差・CV が 1 行にまとまります。

7) **完成したテーブル (df_final)**  
   上記の結合の結果、-55 mV と +10 mV のペアごとに、両者の集計情報が 1 行にそろったテーブルが `df_final` です。  
   これを使うことで、同じ細胞や同じ刺激条件（ただし電位保持だけ異なる）ごとに、-55 mV 時と +10 mV 時の振る舞いを比較できます。


In [None]:
# --- Create aggregated DataFrames including R² ---

# Filter by holding potential
df_minus = df_results[df_results["VoltageHold"] == -55].copy()
df_plus  = df_results[df_results["VoltageHold"] == 10].copy()

# --- For the –55 mV side ---
df_minus_agg = (
    df_minus
    .groupby("filename", as_index=False)
    .agg({
        "PeakAmplitude_pA": ["mean","std","count"],
        "Latency_ms":       ["mean","std","count"],
        "RiseTime_ms":      ["mean","std","count"],
        "DecayTau":         ["mean","std","count"],
        "R2":               ["mean","std","count"],      # ← include R2
        "Ih_pA":    ["mean","std","count"],
        "Rm_MOhm":  ["mean","std","count"],
        "Ra_MOhm":  ["mean","std","count"],
        "Cm_pF":    ["mean","std","count"]
    })
)

# Flatten MultiIndex columns
df_minus_agg.columns = [
    "_".join(filter(None, tup)) if tup[1] else tup[0]
    for tup in df_minus_agg.columns.to_flat_index()
]

# Compute CVs
df_minus_agg["PeakAmplitude_pA_CV"] = (
    df_minus_agg["PeakAmplitude_pA_std"] / df_minus_agg["PeakAmplitude_pA_mean"]
)
df_minus_agg["Latency_ms_CV"] = (
    df_minus_agg["Latency_ms_std"] / df_minus_agg["Latency_ms_mean"]
)
df_minus_agg["RiseTime_ms_CV"] = (
    df_minus_agg["RiseTime_ms_std"] / df_minus_agg["RiseTime_ms_mean"]
)
df_minus_agg["DecayTau_CV"] = (
    df_minus_agg["DecayTau_std"] / df_minus_agg["DecayTau_mean"]
)
df_minus_agg["R2_CV"] = (
    df_minus_agg["R2_std"] / df_minus_agg["R2_mean"]
)
df_minus_agg["Ih_pA_CV"]   = df_minus_agg["Ih_pA_std"]   / df_minus_agg["Ih_pA_mean"]
df_minus_agg["Rm_MOhm_CV"] = df_minus_agg["Rm_MOhm_std"] / df_minus_agg["Rm_MOhm_mean"]
df_minus_agg["Ra_MOhm_CV"] = df_minus_agg["Ra_MOhm_std"] / df_minus_agg["Ra_MOhm_mean"]
df_minus_agg["Cm_pF_CV"]   = df_minus_agg["Cm_pF_std"]   / df_minus_agg["Cm_pF_mean"]

# Rename for clarity
df_minus_agg = df_minus_agg.rename(columns={
    "filename":               "filename_minus55",
    "PeakAmplitude_pA_mean":  "PeakAmp_minus55_mean",
    "PeakAmplitude_pA_std":   "PeakAmp_minus55_std",
    "PeakAmplitude_pA_count": "n_minus55",
    "PeakAmplitude_pA_CV":    "PeakAmp_minus55_CV",
    "Latency_ms_mean":        "Latency_ms_minus55_mean",
    "Latency_ms_std":         "Latency_ms_minus55_std",
    "Latency_ms_count":       "nLatency_minus55",
    "Latency_ms_CV":          "Latency_ms_minus55_CV",
    "RiseTime_ms_mean":       "RiseTime_ms_minus55_mean",
    "RiseTime_ms_std":        "RiseTime_ms_minus55_std",
    "RiseTime_ms_count":      "nRise_minus55",
    "RiseTime_ms_CV":         "RiseTime_ms_minus55_CV",
    "DecayTau_mean":          "DecayTau_minus55_mean",
    "DecayTau_std":           "DecayTau_minus55_std",
    "DecayTau_count":         "nDecay_minus55",
    "DecayTau_CV":            "DecayTau_minus55_CV",
    "R2_mean":                "R2_minus55_mean",      # ← renamed
    "R2_std":                 "R2_minus55_std",
    "R2_count":               "nR2_minus55",
    "R2_CV":                  "R2_minus55_CV",
    "Ih_pA_mean":    "Ih_minus55_mean",
    "Ih_pA_std":     "Ih_minus55_std",
    "Ih_pA_count":   "nIh_minus55",
    "Ih_pA_CV":      "Ih_minus55_CV",

    "Rm_MOhm_mean":  "Rm_minus55_mean",
    "Rm_MOhm_std":   "Rm_minus55_std",
    "Rm_MOhm_count": "nRm_minus55",
    "Rm_MOhm_CV":    "Rm_minus55_CV",

    "Ra_MOhm_mean":  "Ra_minus55_mean",
    "Ra_MOhm_std":   "Ra_minus55_std",
    "Ra_MOhm_count": "nRa_minus55",
    "Ra_MOhm_CV":    "Ra_minus55_CV",

    "Cm_pF_mean":    "Cm_minus55_mean",
    "Cm_pF_std":     "Cm_minus55_std",
    "Cm_pF_count":   "nCm_minus55",
    "Cm_pF_CV":      "Cm_minus55_CV",
    
})

# --- For the +10 mV side ---
df_plus_agg = (
    df_plus
    .groupby("filename", as_index=False)
    .agg({
        "PeakAmplitude_pA": ["mean","std","count"],
        "Latency_ms":       ["mean","std","count"],
        "RiseTime_ms":      ["mean","std","count"],
        "DecayTau":         ["mean","std","count"],
        "R2":               ["mean","std","count"],      # ← include R2
        # ─── membrane‐test metrics ───
        "Ih_pA":    ["mean","std","count"],
        "Rm_MOhm":  ["mean","std","count"],
        "Ra_MOhm":  ["mean","std","count"],
        "Cm_pF":    ["mean","std","count"],
    })
)
df_plus_agg.columns = [
    "_".join(filter(None, tup)) if tup[1] else tup[0]
    for tup in df_plus_agg.columns.to_flat_index()
]
df_plus_agg["PeakAmplitude_pA_CV"] = (
    df_plus_agg["PeakAmplitude_pA_std"] / df_plus_agg["PeakAmplitude_pA_mean"]
)
df_plus_agg["Latency_ms_CV"] = (
    df_plus_agg["Latency_ms_std"] / df_plus_agg["Latency_ms_mean"]
)
df_plus_agg["RiseTime_ms_CV"] = (
    df_plus_agg["RiseTime_ms_std"] / df_plus_agg["RiseTime_ms_mean"]
)
df_plus_agg["DecayTau_CV"] = (
    df_plus_agg["DecayTau_std"] / df_plus_agg["DecayTau_mean"]
)
df_plus_agg["R2_CV"] = (
    df_plus_agg["R2_std"] / df_plus_agg["R2_mean"]
)
df_plus_agg["Ih_pA_CV"]            = df_plus_agg["Ih_pA_std"]               / df_plus_agg["Ih_pA_mean"]
df_plus_agg["Rm_MOhm_CV"]          = df_plus_agg["Rm_MOhm_std"]             / df_plus_agg["Rm_MOhm_mean"]
df_plus_agg["Ra_MOhm_CV"]          = df_plus_agg["Ra_MOhm_std"]             / df_plus_agg["Ra_MOhm_mean"]
df_plus_agg["Cm_pF_CV"]            = df_plus_agg["Cm_pF_std"]               / df_plus_agg["Cm_pF_mean"]

df_plus_agg = df_plus_agg.rename(columns={
    "filename":               "filename_plus10",
    "PeakAmplitude_pA_mean":  "PeakAmp_plus10_mean",
    "PeakAmplitude_pA_std":   "PeakAmp_plus10_std",
    "PeakAmplitude_pA_count": "n_plus10",
    "PeakAmplitude_pA_CV":    "PeakAmp_plus10_CV",
    "Latency_ms_mean":        "Latency_ms_plus10_mean",
    "Latency_ms_std":         "Latency_ms_plus10_std",
    "Latency_ms_count":       "nLatency_plus10",
    "Latency_ms_CV":          "Latency_ms_plus10_CV",
    "RiseTime_ms_mean":       "RiseTime_ms_plus10_mean",
    "RiseTime_ms_std":        "RiseTime_ms_plus10_std",
    "RiseTime_ms_count":      "nRise_plus10",
    "RiseTime_ms_CV":         "RiseTime_ms_plus10_CV",
    "DecayTau_mean":          "DecayTau_plus10_mean",
    "DecayTau_std":           "DecayTau_plus10_std",
    "DecayTau_count":         "nDecay_plus10",
    "DecayTau_CV":            "DecayTau_plus10_CV",
    "R2_mean":                "R2_plus10_mean",       # ← renamed
    "R2_std":                 "R2_plus10_std",
    "R2_count":               "nR2_plus10",
    "R2_CV":                  "R2_plus10_CV",
    # membrane-test renames
    "Ih_pA_mean":             "Ih_plus10_mean",
    "Ih_pA_std":              "Ih_plus10_std",
    "Ih_pA_count":            "nIh_plus10",
    "Ih_pA_CV":               "Ih_plus10_CV",

    "Rm_MOhm_mean":           "Rm_plus10_mean",
    "Rm_MOhm_std":            "Rm_plus10_std",
    "Rm_MOhm_count":          "nRm_plus10",
    "Rm_MOhm_CV":             "Rm_plus10_CV",

    "Ra_MOhm_mean":           "Ra_plus10_mean",
    "Ra_MOhm_std":            "Ra_plus10_std",
    "Ra_MOhm_count":          "nRa_plus10",
    "Ra_MOhm_CV":             "Ra_plus10_CV",

    "Cm_pF_mean":             "Cm_plus10_mean",
    "Cm_pF_std":              "Cm_plus10_std",
    "Cm_pF_count":            "nCm_plus10",
    "Cm_pF_CV":               "Cm_plus10_CV",
})

# Merge back into df_pairs and save as before…
df_merged1 = pd.merge(df_pairs, df_minus_agg,
                      on="filename_minus55", how="left")
df_final   = pd.merge(df_merged1, df_plus_agg,
                      on="filename_plus10", how="left")

df_final.to_csv(
    f"./sorted_directory/Result_of_EIkinetics_{df_final['Opsin'].iat[0]}.csv",
    index=False
)
df_final

# EPSC/IPSC trace plot

## 単一ファイル


In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
import pyabf

def find_stim_time_digital(abf, sweep_index, dig_out_num=3):
    """
    Example: return first time where digital signal transitions from 0 to 1.
    (Adapt as needed, or skip if you have your own method.)
    """
    abf.setSweep(sweep_index)
    time_s = abf.sweepX
    digital_sig = abf.sweepD(dig_out_num)
    idxs = np.where(digital_sig > 0.5)[0]
    if len(idxs) == 0:
        return None
    return time_s[idxs[0]]


def load_all_sweeps(abf_path, stim_chan=3, domain_window=(-0.1, 0.5)):
    """
    Load all sweeps from the ABF at abf_path.
    Return a dict with:
      {
        "raw_traces": [array_of_pA_1, array_of_pA_2, ...],
        "time_axis":  array_of_time_s (common for all sweeps),
      }
    
    Steps:
      1) Load ABF
      2) For each sweep, detect stim_time (if possible). If found, slice domain [stim_time + domain_window].
         Otherwise, keep entire sweep or do a fallback domain.
      3) Baseline-subtract if desired.
    """
    if not os.path.isfile(abf_path):
        print(f"[WARNING] ABF not found: {abf_path}")
        return None

    abf = pyabf.ABF(abf_path)

    # We store one time array and a list of current arrays
    # (We’ll enforce that all sweeps have the same domain size, so we can average.)
    all_traces = []
    all_time = None

    for sweep_idx in abf.sweepList:
        time_s = abf.sweepX
        # Attempt to find stim time from digital output
        stim_time = find_stim_time_digital(abf, sweep_idx, dig_out_num=stim_chan)
        if stim_time is not None:
            t_min = stim_time + domain_window[0]
            t_max = stim_time + domain_window[1]
        else:
            # If no stim time found, fallback to the entire sweep
            t_min = time_s[0]
            t_max = time_s[-1]
        if not np.isnan(stim_time):
            baseline_start_sec = stim_time - 0.1
            baseline_end_sec   = stim_time
        else:
            # fallback if no stim
            baseline_start_sec = 1.155
            baseline_end_sec   = 1.156

        # Make a mask for [t_min, t_max]
        mask = (time_s >= t_min) & (time_s <= t_max)
        if not np.any(mask):
            # If there's no data in that window, skip
            continue

        abf.setSweep(sweep_idx, channel=0, baseline=[baseline_start_sec, baseline_end_sec])
        current_pA = abf.sweepY
        
        t_sel = time_s[mask]
        i_sel = current_pA[mask]

        # If it's the first successful sweep, store as reference
        if all_time is None:
            all_time = t_sel - t_sel[0]  # shift to 0-based time, or keep absolute
        else:
            # We must ensure we can align all sweeps in the same time array shape
            if len(t_sel) != len(all_time):
                # If different sample counts, you might do interpolation or skip
                continue

        all_traces.append(i_sel)

    if (all_time is None) or (len(all_traces) == 0):
        return None

    all_traces = np.array(all_traces)  # shape = (N_sweeps, N_points)
    return {
        "time_s": all_time,
        "raw_traces": all_traces
    }

def plot_epsc_and_ipsc(
    epsc_path,
    ipsc_path,
    domain_window=(-0.1, 0.5),
    output_png="epsc_ipsc.png",
    no_ticks=False,
    figsize=(8, 5),
    title_fontsize=14,
    label_fontsize=11,
    show_title=True,
    show_legend=True
):
    """
    Load EPSC data from epsc_path (e.g., -55 mV) and
    IPSC data from ipsc_path (e.g., +10 mV).
    Plot all sweeps (EPSC in blue, IPSC in red),
    plus their means as thick lines.
    Remove rectangle outlines (axes box), and optionally add an L-shaped scalebar.
    """

    data_epsc = load_all_sweeps(epsc_path, stim_chan=3, domain_window=domain_window)
    data_ipsc = load_all_sweeps(ipsc_path, stim_chan=3, domain_window=domain_window)

    if data_epsc is None and data_ipsc is None:
        print("No data loaded from either file. Nothing to plot.")
        return

    fig, ax = plt.subplots(figsize=figsize)

    # Plot EPSC
    if data_epsc is not None:
        t = data_epsc["time_s"]
        traces = data_epsc["raw_traces"]
        for trace in traces:
            ax.plot(t, trace, color="blue", alpha=0.3, lw=0.7)
        mean_epsc = np.mean(traces, axis=0)
        ax.plot(t, mean_epsc, color="blue", lw=2.0, label="Mean EPSC")

    # Plot IPSC
    if data_ipsc is not None:
        t = data_ipsc["time_s"]
        traces = data_ipsc["raw_traces"]
        for trace in traces:
            ax.plot(t, trace, color="red", alpha=0.3, lw=0.7)
        mean_ipsc = np.mean(traces, axis=0)
        ax.plot(t, mean_ipsc, color="red", lw=2.0, label="Mean IPSC")

    # Draw a vertical line marking the stimulus (time= -domain_window[0]) 
    # in axis-fraction coordinates
    ax.axvline(
        x=-domain_window[0],
        color="blue",
        lw=1.5,
        alpha=0.6,
        label="Stim",
        ymin=0.8,
        ymax=1.0
    )

    # Determine Y-limits
    all_vals = []
    if data_epsc is not None:
        all_vals.extend([data_epsc["raw_traces"].min(), data_epsc["raw_traces"].max()])
    if data_ipsc is not None:
        all_vals.extend([data_ipsc["raw_traces"].min(), data_ipsc["raw_traces"].max()])

    if all_vals:
        y_min = min(all_vals)
        y_max = max(all_vals)
        pad = 0.1 * (y_max - y_min)
        ax.set_ylim(y_min - pad, y_max + pad)

    # Determine X-limits (assuming we re-zeroed time)
    x_maxes = []
    if data_epsc is not None:
        x_maxes.append(data_epsc["time_s"][-1])
    if data_ipsc is not None:
        x_maxes.append(data_ipsc["time_s"][-1])
    if x_maxes:
        ax.set_xlim(0, max(x_maxes))

    # Optionally show legend
    if show_legend:
        ax.legend(fontsize=label_fontsize)

    # If user requests no ticks, remove axes outlines and ticks
    if no_ticks is True:
        for spine in ["top", "right", "left", "bottom"]:
            ax.spines[spine].set_visible(False)
        ax.set_xticks([])
        ax.set_yticks([])

        # Decide how big the scalebar is
        scale_ms = 50e-3  # 50 ms
        scale_pA = 50     # 50 pA

        # Decide reference point near bottom right
        x_min_plot, x_max_plot = ax.get_xlim()
        y_min_plot, y_max_plot = ax.get_ylim()
        x_range = x_max_plot - x_min_plot
        y_range = y_max_plot - y_min_plot

        # Place scalebar 5% from right and 10% from bottom
        x_ref = x_max_plot - 0.05*x_range - scale_ms
        y_ref = y_min_plot + 0.1*y_range

        # Horizontal segment
        ax.plot(
            [x_ref, x_ref + scale_ms],
            [y_ref, y_ref],
            color='k',
            lw=2
        )
        # Vertical segment
        ax.plot(
            [x_ref, x_ref],
            [y_ref, y_ref + scale_pA],
            color='k',
            lw=2
        )
        # Scalebar text
        ax.text(
            x_ref + scale_ms/2,
            y_ref - 0.05 * scale_pA,
            f"{int(scale_ms*1000)} ms",
            ha="center",
            va="top",
            fontsize=label_fontsize
        )
        ax.text(
            x_ref - 0.05*scale_ms,
            y_ref + scale_pA/2,
            f"{scale_pA} pA",
            ha="right",
            va="center",
            rotation=90,
            fontsize=label_fontsize
        )
    else:
        ax.tick_params(axis='both', which='both', length=3, labelsize=label_fontsize)
        ax.set_xlabel("Time (s)", fontsize=label_fontsize)
        ax.set_ylabel("Current (pA)", fontsize=label_fontsize)

    # Optional main title (with adjustable font size)
    if show_title is True:
        ax.set_title("EPSC & IPSC Overlay", fontsize=title_fontsize)

    plt.tight_layout()
    # plt.savefig(output_png, dpi=150)
    # print(f"Saved figure: {output_png}")
    plt.show()



def filename_to_path(filename, abf_root = "./sorted_directory"):    
    # 1) Dictionary of ABF files
    abf_dict = find_abf_files(abf_root)

    # 2) Get the ABF path
    if filename not in abf_dict:
        print(f"[ERROR] ABF file not found: {filename}")
        return
    else:
        return abf_dict[filename]
    

In [None]:
# 0) Suppose we already have df_filtered
if df_results is None:
    df_results = pd.read_csv("./sorted_directory/analysis_results.csv")
if df_final is None:
    df_final = pd.read_csv("./sorted_directory/Result_of_EIkinetics_ChR2.csv")

#df_for_eiplot = df_final
df_for_eiplot = pd.read_csv("./sorted_directory/Result_of_EIkinetics_ChR2.csv")

i = 168
row = df_for_eiplot.iloc[i]

epsc_file = filename_to_path(row["filename_minus55"], abf_root)
ipsc_file = filename_to_path(row["filename_plus10"], abf_root)

print("EPSC ABF file:", epsc_file)
print("IPSC ABF file:", ipsc_file)

plot_epsc_and_ipsc(epsc_file, ipsc_file, 
                   domain_window=(-0.1, 0.5), 
                   output_png="my_epsc_ipsc_plot.png", 
                   no_ticks = True, 
                   figsize=(5, 8),
                   title_fontsize=14, 
                   label_fontsize=11, 
                   show_title = False,
                   show_legend=False)

## 複数ファイル

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt

def create_ei_plots_shared_axes(
    df,
    row_indices,
    abf_root="./sorted_directory",
    domain_window=(-0.1, 0.5),
    no_ticks=True,
    figsize=(5,8),
    title_fontsize=14,
    label_fontsize=11,
    show_title=False,
    show_legend=False,
    show_epsc=True,        # <--- New: controls whether to plot EPSC at all
    show_ipsc=True,         # <--- New: controls whether to plot IPSC at all
    scale_bar_label=True,
    scale_bar_position="right_upper",
    show_mean=True,
    show_raw_epsc=True,
    show_raw_ipsc=True,
    color_epsc="blue",
    color_ipsc="red"
):
    """
    For each row index in row_indices, load the EPSC and IPSC ABFs, then plot them.
    All plots use the same X domain (max length found) and same Y range (global min/max).

    Args:
      df : DataFrame with columns like 'filename_minus55', 'filename_plus10', etc.
      row_indices : list of integers (which rows of df to process)
      abf_root : path to directory with ABF files
      domain_window : tuple of (start_offset, end_offset) relative to stimulus time
      no_ticks : if True, hide axes ticks and draw an L-shaped scalebar
      figsize : size of each output figure
      title_fontsize, label_fontsize : control text sizes
      show_title, show_legend : booleans controlling title & legend
      scale_bar_label : if True, show numeric labels for the scale bar
      scale_bar_position : str, e.g. 'right_upper' or 'right_middle'
        This determines where the L-shaped scale bar is placed if no_ticks=True.
      show_mean : if True, plot the mean EPSC/IPSC trace over the raw sweeps
      show_raw_epsc : if True, plot raw sweeps for the EPSC data
      show_raw_ipsc : if True, plot raw sweeps for the IPSC data
      color_epsc : color (string) for EPSC traces (both raw and mean)
      color_ipsc : color (string) for IPSC traces (both raw and mean)
    """
    # ─────────────────────────────────────────────────────────
    # 1) First pass: load data for all rows and find global min/max
    #    and the maximum time domain among them
    # ─────────────────────────────────────────────────────────
    all_rows_data = []  # will hold tuples (data_epsc, data_ipsc)

    global_min = None
    global_max = None
    global_tmax = 0.0   # track largest time across all files

    for idx in row_indices:
        row = df.iloc[idx]
        color = row["Color"]
        print(color)
        

        # Construct ABF paths
        epsc_abfpath = None
        ipsc_abfpath = None
        if "filename_minus55" in row:
            epsc_abfpath = filename_to_path(row["filename_minus55"], abf_root)
        if "filename_plus10" in row:
            ipsc_abfpath = filename_to_path(row["filename_plus10"], abf_root)

        if color == "blue":
            stim_chan = 3
        else:
            stim_chan = 0
        data_epsc = (load_all_sweeps(epsc_abfpath, stim_chan=stim_chan, domain_window=domain_window) 
                     if epsc_abfpath else None)
        data_ipsc = (load_all_sweeps(ipsc_abfpath, stim_chan=stim_chan, domain_window=domain_window) 
                     if ipsc_abfpath else None)

        all_rows_data.append((data_epsc, data_ipsc))

        # Update global min/max and global_tmax
        local_vals = []
        if data_epsc is not None:
            local_vals.append(data_epsc["raw_traces"].min())
            local_vals.append(data_epsc["raw_traces"].max())
            global_tmax = max(global_tmax, data_epsc["time_s"][-1])

        if data_ipsc is not None:
            local_vals.append(data_ipsc["raw_traces"].min())
            local_vals.append(data_ipsc["raw_traces"].max())
            global_tmax = max(global_tmax, data_ipsc["time_s"][-1])

        if local_vals:
            local_min = min(local_vals)
            local_max = max(local_vals)
            if global_min is None or local_min < global_min:
                global_min = local_min
            if global_max is None or local_max > global_max:
                global_max = local_max

    if global_min is None or global_max is None:
        print("[INFO] No valid data found in any row. Aborting.")
        return

    # Add some padding
    y_range = global_max - global_min
    y_min = global_min - 0.1 * y_range
    y_max = global_max + 0.1 * y_range

    # ─────────────────────────────────────────────────────────
    # 2) Second pass: plot each row's data using the shared domain & range
    # ─────────────────────────────────────────────────────────
    for idx, (data_epsc, data_ipsc) in zip(row_indices, all_rows_data):
        row = df.iloc[idx]
        Opsin = row["Opsin"]
        Region = row["Region"]
        BrainID = row["BrainID"]
        SliceID = row["SliceID"]
        CellID = row["CellID"]
        StimPower = row["StimPower"]
        StimDuration = row["StimDuration"]
        APregion = row["APregion"]
        
        if data_epsc is None and data_ipsc is None:
            print(f"[WARNING] Row {idx}: no valid EPSC or IPSC data. Skipping plot.")
            continue

        fig, ax = plt.subplots(figsize=figsize)

        # Plot EPSC
        if show_epsc and data_epsc is not None:
            t_epsc = data_epsc["time_s"]
            arr_epsc = data_epsc["raw_traces"]
            # raw sweeps
            if show_raw_epsc:
                for trace in arr_epsc:
                    ax.plot(t_epsc, trace, color=color_epsc, alpha=0.3, lw=0.7)
            # mean trace
            if show_mean:
                mean_epsc = arr_epsc.mean(axis=0)
                ax.plot(t_epsc, mean_epsc, color=color_epsc, lw=2.0, label="Mean EPSC")

        # Plot IPSC
        if show_ipsc and data_ipsc is not None:
            t_ipsc = data_ipsc["time_s"]
            arr_ipsc = data_ipsc["raw_traces"]
            # raw sweeps
            if show_raw_ipsc:
                for trace in arr_ipsc:
                    ax.plot(t_ipsc, trace, color=color_ipsc, alpha=0.3, lw=0.7)
            # mean trace
            if show_mean:
                mean_ipsc = arr_ipsc.mean(axis=0)
                ax.plot(t_ipsc, mean_ipsc, color=color_ipsc, lw=2.0, label="Mean IPSC")

        # Stim line (assuming 0 => -domain_window[0])
        ax.axvline(
            x=-domain_window[0],
            color="blue",
            lw=1.5,
            alpha=0.6,
            label="Stim",
            ymin=0.9,
            ymax=1.0
        )

        # Set global domain/range
        ax.set_xlim(0, global_tmax)
        ax.set_ylim(y_min, y_max)

        if show_legend:
            ax.legend(fontsize=label_fontsize)

        if no_ticks:
            # Remove spines/ticks
            for spine in ["top", "right", "left", "bottom"]:
                ax.spines[spine].set_visible(False)
            ax.set_xticks([])
            ax.set_yticks([])

            # Decide how big the scalebar is
            scale_ms = 50e-3  # 50 ms
            scale_pA = 50     # 50 pA

            x_min_plot, x_max_plot = ax.get_xlim()
            y_min_plot, y_max_plot = ax.get_ylim()
            x_range = x_max_plot - x_min_plot
            y_rng = y_max_plot - y_min_plot

            # ─────────────────────────────────────────────────────────
            # Logic for choosing x_ref, y_ref based on scale_bar_position
            # ─────────────────────────────────────────────────────────
            if scale_bar_position == "right_upper":
                # e.g. near upper-right
                x_ref = x_max_plot - 0.05*x_range - scale_ms
                y_ref = y_max_plot - 0.15*y_rng  # 15% below top
            elif scale_bar_position == "right_middle":
                # e.g. near right-middle
                x_ref = x_max_plot - 0.05*x_range - scale_ms
                y_ref = y_min_plot + 0.45*y_rng
            else:
                # fallback: near bottom-right
                x_ref = x_max_plot - 0.05*x_range - scale_ms
                y_ref = y_min_plot + 0.1*y_rng

            # Horizontal segment
            ax.plot(
                [x_ref, x_ref + scale_ms],
                [y_ref, y_ref],
                color='k',
                lw=2
            )
            # Vertical segment
            ax.plot(
                [x_ref, x_ref],
                [y_ref, y_ref + scale_pA],
                color='k',
                lw=2
            )
            # Scalebar text
            if scale_bar_label:
                ax.text(
                    x_ref + scale_ms/2,
                    y_ref - 0.05 * scale_pA,
                    f"{int(scale_ms*1000)} ms",
                    ha="center",
                    va="top",
                    fontsize=label_fontsize
                )
                ax.text(
                    x_ref - 0.05*scale_ms,
                    y_ref + scale_pA/2,
                    f"{scale_pA} pA",
                    ha="right",
                    va="center",
                    rotation=90,
                    fontsize=label_fontsize
                )
        else:
            ax.tick_params(axis='both', which='both', length=3, labelsize=label_fontsize)
            ax.set_xlabel("Time (s)", fontsize=label_fontsize)
            ax.set_ylabel("Current (pA)", fontsize=label_fontsize)

        if show_title:
            ax.set_title(f"{Opsin}_{Region}_{BrainID}_{SliceID}_{CellID}_{StimPower}_{StimDuration}", 
                         fontsize=title_fontsize)

        plt.tight_layout()

        # Optionally save
        out_name = f"eiplot_{Opsin}_{Region}_{BrainID}_{SliceID}_{CellID}_{StimPower}_{StimDuration}_{APregion}.png"
        savepath = os.path.join(abf_root, "EIplots", out_name)
        plt.savefig(savepath, dpi=150, transparent=True)
        print(f"Saved: {out_name}")

        plt.show()

    print("Done creating E-I plots with shared domain/range.")


In [None]:
#row_indices = [114, 112, 107] # ACC
#row_indices = [52, 48, 46] # RSC
#row_indices = [47, 170] # RSCとACC
#row_indices = [139, 136, 130] # ACC-ChR2 Dual
row_indices = [142, 137, 129, 139, 136, 130] # RSC-ChrimsonR Dual
row = df_for_eiplot.iloc[i]
light_orange = "#ff4b00"
light_green = "#03af7a"
create_ei_plots_shared_axes(
    df_for_eiplot,
    row_indices,
    abf_root="./sorted_directory",
    domain_window=(-0.1, 1),
    no_ticks=True,
    figsize=(2.19, 2.69),
    title_fontsize=14,
    label_fontsize=3,
    show_title=False,
    show_legend=False,
    show_epsc = True,
    show_ipsc = True,
    scale_bar_label = False,
    scale_bar_position="right_upper",
    show_mean=True,
    show_raw_epsc=False,
    show_raw_ipsc=False,
    color_epsc=light_green,
    color_ipsc=light_green
)