In [5]:
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime

def analyze_data(file_path):
  """
  CSVファイルを読み込み、記述統計量を計算し、グラフを描画してレポートを作成する関数

  Args:
    file_path (str): CSVファイルのパス
  """
  try:
    # CSVファイルを読み込み
    df = pd.read_csv(file_path)

    # 記述統計量を計算
    statistics = df.describe(include='all')

    # レポートを作成
    now = datetime.now().strftime("%Y%m%d%H%M%S")
    report_file = f"data_analysis_report_{now}.txt"
    with open(report_file, "w") as f:
      f.write(f"データ分析レポート ({now})\n")
      f.write(f"ファイル: {file_path}\n\n")

      # 記述統計量をレポートに書き込み
      f.write(statistics.to_string())
      f.write("\n\n")

      # 各数値列についてヒストグラムを作成し、レポートに画像として追加
      for column in df.select_dtypes(include=['number']):
        plt.figure()  # 新しい図を作成
        plt.hist(df[column], bins=10)
        plt.xlabel(column)
        plt.ylabel("Frequency")
        plt.title(f"Histogram of {column}")
        plt.tight_layout()  # グラフのレイアウトを調整
        image_file = f"{column}_histogram.png"
        plt.savefig(image_file)  # 画像を保存
        plt.close()  # メモリリークを防ぐために図を閉じる

        # レポートに画像へのリンクを追加
        f.write(f"## {column} のヒストグラム\n")
        f.write(f"![{column} のヒストグラム]({image_file})\n\n")

    print(f"レポートを作成しました: {report_file}")

  except FileNotFoundError:
    print(f"ファイルが見つかりません: {file_path}")
  except Exception as e:
    print(f"エラーが発生しました: {e}")

if __name__ == "__main__":
  file_path = "data.csv"  # 分析するCSVファイル名
  analyze_data(file_path)

ファイルが見つかりません: data.csv
