In [6]:
import pandas as pd

# CSVファイル読み込み（例: 'data.csv'）
df = pd.read_csv("./output_filtered_questions/filtered_ID.csv", index_col=0)  # 行名が answer1 などなら index_col=0 を指定

# チェックするラベル一覧
target_labels = [f"answer{i}" for i in range(1, 11)]

# 存在チェック
missing_labels = [label for label in target_labels if label not in df.index]

if missing_labels:
    print("存在しないラベル:", missing_labels)
else:
    print("answer1〜answer10 はすべて存在します。")


存在しないラベル: ['answer1', 'answer4', 'answer6', 'answer7']


In [11]:
import os
import pandas as pd

# 調べるフォルダのパス
folder_path = "./output_filtered_questions"  # ← あなたのCSVがあるフォルダに変更してください

# チェック対象のラベル
target_labels = [f"answer{i}" for i in range(1, 11)]

for file_name in os.listdir(folder_path):
    if file_name.endswith(".csv"):
        file_path = os.path.join(folder_path, file_name)

        try:
            # CSV読み込み（行名をindexとする）
            df = pd.read_csv(file_path, index_col=0)

            # 空白を取り除いた index に更新
            df.index = df.index.str.strip()

            # ラベルの存在チェック
            missing_labels = [label for label in target_labels if label not in df.index]

            print(f"ファイル: {file_name}")
            if missing_labels:
                print(" 存在しないラベル:", missing_labels)
            else:
                print(" answer1〜answer10 はすべて存在します。")

        except Exception as e:
            print(f"ファイル {file_name} の処理中にエラーが発生しました: {e}")



ファイル: filtered_ID30.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID31.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID32.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID33.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID34.csv
 存在しないラベル: ['answer1', 'answer5']
ファイル: filtered_ID35.csv
 存在しないラベル: ['answer8']
ファイル: filtered_ID36.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID37.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID38.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID39.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID40.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID41.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID42.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID43.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID44.csv
 存在しないラベル: ['answer1']
ファイル: filtered_ID45.csv
 存在しないラベル: ['answer1']
ファイル: filtered_ID46.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID47.csv
 answer1〜answer10 はすべて存在します。
ファイル: filtered_ID48.csv
 answer1〜answer10 はすべて存在します。
ファイル: 

In [12]:
import os
import pandas as pd
from collections import defaultdict

# フォルダのパス（適宜変更）
folder_path = "./output_filtered_questions"

# answerごとの件数を記録する辞書
answer_counts = defaultdict(int)

# 対象の answer ラベル
target_labels = [f"answer{i}" for i in range(1, 11)]

# フォルダ内の全CSVファイルを処理
for filename in os.listdir(folder_path):
    if filename.endswith(".csv"):
        filepath = os.path.join(folder_path, filename)
        df = pd.read_csv(filepath, index_col=0)

        # indexの空白を除去（"answer 1" → "answer1" などを修正）
        df.index = df.index.str.replace(" ", "", regex=False)

        # 各 answer ラベルについて出現数を加算
        for label in target_labels:
            if label in df.index:
                answer_counts[label] += 1

# 結果表示
print("各 answer の件数:")
for label in target_labels:
    print(f"{label}: {answer_counts[label]} 件")


各 answer の件数:
answer1: 38 件
answer2: 62 件
answer3: 62 件
answer4: 60 件
answer5: 57 件
answer6: 63 件
answer7: 64 件
answer8: 60 件
answer9: 64 件
answer10: 65 件
