In [1]:
#　SparkyのlistファイルをCSVファイルに変換するコード
#　現状対応できているのは、一行目がAssinment, w1, w2, Data Heightという列順。これよりも要素が多くなった場合はどうなるのか想定されていない

In [2]:
# ライブラリの読み込み
import pandas as pd
import os
import tkinter as tk
from tkinter import filedialog

In [3]:
def convert_list_to_csv(input_dir, output_dir=None):
    """
    指定されたディレクトリ内の拡張子が '.list' のファイルを読み込み、CSV形式に変換して保存します。

    Args:
        input_dir (str): '.list' 形式のファイルが格納されているディレクトリのパス。
        output_dir (str, optional): 変換されたCSVファイルを保存するディレクトリのパス。
                                    Noneの場合、入力ディレクトリと同じ場所に保存されます。
    """
    if not os.path.exists(input_dir):
        print(f"エラー: 指定された入力ディレクトリ '{input_dir}' が存在しません。")
        return

    if output_dir and not os.path.exists(output_dir):
        print(f"出力ディレクトリ '{output_dir}' が存在しないため、作成します。")
        os.makedirs(output_dir)
    elif output_dir is None:
        output_dir = input_dir # 出力ディレクトリが指定されていない場合は入力ディレクトリと同じにする

    print(f"入力ディレクトリ: {input_dir}")
    print(f"出力ディレクトリ: {output_dir}")

    # ディレクトリ内のすべてのファイルを検索
    for filename in os.listdir(input_dir):
        # 拡張子が '.list' のファイルを対象とする
        if filename.endswith('.list'):
            input_filepath = os.path.join(input_dir, filename)
            
            print(f"\nファイルを処理中: {input_filepath}")

            try:
                # --- 修正部分 ---
                # 1. ヘッダー行を個別に読み込む
                with open(input_filepath, 'r', encoding='utf-8') as f: # エンコーディングを指定
                    header_line = f.readline().strip()
                
                # ヘッダーをスペースで分割し、'Data Height' を結合し直す
                header_parts = header_line.split()
                column_names = []
                i = 0
                while i < len(header_parts):
                    if header_parts[i] == 'Data' and i + 1 < len(header_parts) and header_parts[i+1] == 'Height':
                        column_names.append('Data Height')
                        i += 2 # 'Data' と 'Height' の2つ分進める
                    else:
                        column_names.append(header_parts[i])
                        i += 1

                # 2. データ部分を読み込む (ヘッダー行をスキップ)
                # データ部分の各列はスペースで区切られているので、delim_whitespace=True を使用
                df = pd.read_csv(input_filepath, delim_whitespace=True, header=None, skiprows=1, encoding='utf-8')

                # 3. 読み込んだDataFrameに正しいカラム名を割り当てる
                if len(column_names) == df.shape[1]:
                    df.columns = column_names
                    print(f"カラム名を {column_names} に設定しました。")
                else:
                    print(f"警告: ファイル '{filename}' のデータ列数 ({df.shape[1]}) と")
                    print(f"       解析されたヘッダー列数 ({len(column_names)}) が一致しません。")
                    print("       デフォルトの数値カラム名が使用されます。")
                    # 必要に応じて、ここでエラーを発生させるか、別のカラム名を割り当ててください
                    # 例: raise ValueError("列数が一致しません")
                # --- 修正部分ここまで ---

                # 出力ファイル名を作成（元のファイル名から .list 拡張子を除き、.csv を追加）
                base_filename = os.path.splitext(filename)[0] # 拡張子を除いたファイル名を取得
                output_filename = base_filename + "_raw.csv"
                output_filepath = os.path.join(output_dir, output_filename)

                # CSVファイルとして保存
                df.to_csv(output_filepath, index=False)
                print(f"'{filename}' を '{output_filepath}' にCSVとして保存しました。")

            except Exception as e:
                print(f"ファイルの処理中にエラーが発生しました '{filename}': {e}")
        else:
            print(f"スキップ: '{filename}' (拡張子が .list ではありません)")

In [4]:
### 使用例 (フォルダ選択ダイアログ付き)

if __name__ == "__main__":
    # Tkinterのルートウィンドウを作成（非表示）
    root = tk.Tk()
    root.withdraw()

    # 入力ディレクトリの選択
    input_folder = filedialog.askdirectory(
        title="リストファイルが格納されているフォルダを選択してください"
    )

    if not input_folder:
        print("入力フォルダが選択されませんでした。処理を終了します。")
    else:
        # 出力ディレクトリの選択
        output_folder = filedialog.askdirectory(
            title="CSVファイルを保存するフォルダを選択してください"
        )

        if not output_folder:
            print("出力フォルダが選択されませんでした。入力フォルダと同じ場所に保存します。")
            output_folder = input_folder # 出力フォルダが選択されなかった場合は入力フォルダと同じにする

        convert_list_to_csv(input_folder, output_folder)

入力ディレクトリ: C:/Users/mrtak/JupyterNotebook/NMR_Folder/list_folder
出力ディレクトリ: C:/Users/mrtak/JupyterNotebook/NMR_Folder/CSV_folder

ファイルを処理中: C:/Users/mrtak/JupyterNotebook/NMR_Folder/list_folder\hsqc_GDP.list
カラム名を ['Assignment', 'w1', 'w2'] に設定しました。
'hsqc_GDP.list' を 'C:/Users/mrtak/JupyterNotebook/NMR_Folder/CSV_folder\hsqc_GDP_raw.csv' にCSVとして保存しました。

ファイルを処理中: C:/Users/mrtak/JupyterNotebook/NMR_Folder/list_folder\hsqc_GDP_Data_height.list
カラム名を ['Assignment', 'w1', 'w2', 'Data Height'] に設定しました。
'hsqc_GDP_Data_height.list' を 'C:/Users/mrtak/JupyterNotebook/NMR_Folder/CSV_folder\hsqc_GDP_Data_height_raw.csv' にCSVとして保存しました。

ファイルを処理中: C:/Users/mrtak/JupyterNotebook/NMR_Folder/list_folder\hsqc_M.list
カラム名を ['Assignment', 'w1', 'w2'] に設定しました。
'hsqc_M.list' を 'C:/Users/mrtak/JupyterNotebook/NMR_Folder/CSV_folder\hsqc_M_raw.csv' にCSVとして保存しました。

ファイルを処理中: C:/Users/mrtak/JupyterNotebook/NMR_Folder/list_folder\hsqc_M_Data_height.list
カラム名を ['Assignment', 'w1', 'w2', 'Data Height'] に設定しました。
'hsq

  df = pd.read_csv(input_filepath, delim_whitespace=True, header=None, skiprows=1, encoding='utf-8')
  df = pd.read_csv(input_filepath, delim_whitespace=True, header=None, skiprows=1, encoding='utf-8')
  df = pd.read_csv(input_filepath, delim_whitespace=True, header=None, skiprows=1, encoding='utf-8')
  df = pd.read_csv(input_filepath, delim_whitespace=True, header=None, skiprows=1, encoding='utf-8')


In [8]:
#ここまででこいつの処理は十分