In [1]:
import os
import csv
from datetime import datetime

In [2]:
def get_file_list(root_dir, extension):
    file_list = []
    for root, dirs, files in os.walk(root_dir):
        for file in files:
            if file.lower().endswith(extension.lower()):
                file_path = os.path.join(root, file)
                file_stats = os.stat(file_path)
                file_info = {
                    'name': file,
                    'path': file_path,
                    'size': file_stats.st_size,
                    'created_time': datetime.fromtimestamp(file_stats.st_ctime).strftime('%Y-%m-%d %H:%M:%S')
                }
                file_list.append(file_info)
    return file_list



In [3]:
def save_to_csv(file_list, output_file):
    with open(output_file, 'w', newline='', encoding='utf-8') as csvfile:
        fieldnames = ['name', 'path', 'size', 'created_time']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        
        writer.writeheader()
        for file_info in file_list:
            writer.writerow(file_info)



In [4]:
# 사용 예
host_docs_path = '/workspace/host_docs'  # host_docs 디렉토리 경로
output_csv_path = '/workspace/pdf_file_list.csv'  # 출력 CSV 파일 경로
file_extension = '.pdf'  # 원하는 파일 확장자

file_list = get_file_list(host_docs_path, file_extension)
save_to_csv(file_list, output_csv_path)

print(f"{file_extension} 파일 목록이 {output_csv_path}에 저장되었습니다.")

.pdf 파일 목록이 /workspace/pdf_file_list.csv에 저장되었습니다.
