In [1]:
import xml.etree.ElementTree as ET
import csv
import os


In [2]:
def parse_xml_to_csv(xml_folder, csv_file):
    # CSVファイルのヘッダー（カテゴリとファイル名の列を追加）
    headers = ['category', 'filename', 'character', 'openness', 'conscientiousness', 
               'extraversion', 'agreeableness', 'neuroticism', 'hashtags', 'personality', 'hometown', 'occupation', 
               'favorite_things', 'hobby', 'skill', 'habit', 'dream', 
               'talent', 'motto', 'comment']

    with open(csv_file, 'w', newline='', encoding='utf-8') as csvfile:
        writer = csv.DictWriter(csvfile, fieldnames=headers)
        writer.writeheader()

        # 指定されたフォルダ内の全サブディレクトリを処理
        for root, dirs, files in os.walk(xml_folder):
            for filename in files:
                if filename.endswith('.xml'):
                    full_path = os.path.join(root, filename)
                    tree = ET.parse(full_path)
                    xml_root = tree.getroot()

                    # XMLデータから情報を抽出し、必要に応じて再配置
                    data = {'category': os.path.basename(root), 'filename': filename}
                    for child in xml_root:
                        if child.tag == 'big_five_chart':
                            big_five = {grandchild.tag: grandchild.text for grandchild in child}
                            data.update(big_five)
                        else:
                            data[child.tag] = child.text

                    writer.writerow(data)

In [3]:

# この関数を実行して、XMLファイルをCSVに変換
xml_folder = './output'  # XMLファイルが保存されているフォルダのパス
csv_file = 'output.csv'  # 出力するCSVファイルの名前

parse_xml_to_csv(xml_folder, csv_file)