In [1]:
# Jupyter Notebookのセルに書くコード

import pandas as pd
import os

# ./backend ディレクトリに置いたCSVファイル名を指定してください
csv_file_name = 'StatsAllGroup.csv'

In [2]:
# pandasでCSVファイルを読み込む
# volumesで設定したため、コンテナ内のカレントパスにファイルがあるように見えます
try:
    df = pd.read_csv(csv_file_name, encoding='shift_jis')
    print("✅ CSVファイルの読み込みに成功しました！")

except FileNotFoundError:
    print(f"❌ エラー: '{csv_file_name}' が見つかりません。")
    print("ファイル名が正しいか、CSVファイルが`backend`ディレクトリに置かれているか確認してください。")
    print("現在のディレクトリにあるファイル一覧:", os.listdir('.'))

✅ CSVファイルの読み込みに成功しました！


In [3]:
# 'date_'列を日付型に変換
# dayfirst=True を追加して「日」が先に来ることを指定
df['date_'] = pd.to_datetime(df['date_'], dayfirst=True)

# 変換されたか df.info() で確認
print("✅ データ型の変換に成功しました！")
df.info()

✅ データ型の変換に成功しました！
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 25933 entries, 0 to 25932
Data columns (total 71 columns):
 #   Column                                          Non-Null Count  Dtype         
---  ------                                          --------------  -----         
 0   date_                                           25933 non-null  datetime64[ns]
 1   date_name                                       25933 non-null  object        
 2   start_time                                      25933 non-null  int64         
 3   start_time_h                                    25933 non-null  float64       
 4   end_time                                        25933 non-null  int64         
 5   end_time_h                                      25933 non-null  float64       
 6   activity_id                                     25933 non-null  object        
 7   activity_name                                   25933 non-null  object        
 8   period_id                   

In [4]:
# データ全体の情報を表示
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 25933 entries, 0 to 25932
Data columns (total 71 columns):
 #   Column                                          Non-Null Count  Dtype         
---  ------                                          --------------  -----         
 0   date_                                           25933 non-null  datetime64[ns]
 1   date_name                                       25933 non-null  object        
 2   start_time                                      25933 non-null  int64         
 3   start_time_h                                    25933 non-null  float64       
 4   end_time                                        25933 non-null  int64         
 5   end_time_h                                      25933 non-null  float64       
 6   activity_id                                     25933 non-null  object        
 7   activity_name                                   25933 non-null  object        
 8   period_id                                     

In [5]:
# athlete_idから選手の数を確認
athlete_ids = df['athlete_id'].unique()
print(f"✅ 選手の数: {len(athlete_ids)}")

✅ 選手の数: 37


In [6]:
# athlete_idから選手ごとのデータ数を確認
df['athlete_id'].value_counts()

athlete_id
17    1109
44    1105
43    1100
26    1091
8     1090
18    1088
13    1087
40    1048
25    1040
19    1033
21    1024
23    1009
5      997
47     966
46     962
28     946
38     943
41     939
45     936
27     919
20     914
9      852
42     821
39     775
7      515
11     504
56     504
51     282
57     221
52      43
53      27
2       11
55      10
48       8
54       8
49       5
50       1
Name: count, dtype: int64

In [7]:
# 'period_name' の種類とそれぞれの件数を表示
df['period_name'].value_counts()

period_name
Warm up            3714
Rondo              2282
Poss                959
Set piece           918
AT                  902
                   ... 
REhab                 1
Recondintioning       1
18 20                 1
4 21                  1
25                    1
Name: count, Length: 409, dtype: int64

In [8]:
import calplot
import matplotlib.pyplot as plt
import japanize_matplotlib
import os

# 1. 保存用のフォルダを作成
output_folder = 'player_calendars'
os.makedirs(output_folder, exist_ok=True)

# 2. 全ての選手名のリストを取得
athlete_ids = df['athlete_id'].unique()

# 3. forループで各選手に対してグラフ作成と保存を繰り返す
for athlete_id in athlete_ids:
    player_df = df[df['athlete_id'] == athlete_id]
    player_activity = player_df.groupby('date_').size()
    
    plt.figure(figsize=(12, 6))
    calplot.calplot(player_activity, cmap='viridis', suptitle=f'{athlete_id}選手の活動日カレンダー')
    # ファイルとして保存
    plt.savefig(f'{output_folder}/{athlete_id}_calendar.png')

    # メモリを解放するためにプロットを閉じる
    plt.close()

print(f"✅ 全選手の活動カレンダーを'{output_folder}'フォルダに保存しました。")

findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: Font family 'Helvetica' not found.
findfont: 

✅ 全選手の活動カレンダーを'player_calendars'フォルダに保存しました。


<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

<Figure size 1200x600 with 0 Axes>

In [9]:
from PIL import Image
import os

# 1. 画像が保存されているフォルダと、出力するPDFファイル名を指定
image_folder = 'player_calendars'
pdf_filename = 'activity_report.pdf'

# 2. フォルダ内の全てのPNGファイル名を取得し、名前順に並べる
try:
    image_files = [f for f in os.listdir(image_folder) if f.endswith('.png')]
    image_files.sort(key=lambda x: int(x.split('_')[0]))  # id順に並べる
    
    if not image_files:
        print(f"'{image_folder}' フォルダにPNG画像が見つかりませんでした。")
    else:
        # 3. 最初の画像をベースに、残りの画像をPDFのページとして追加
        first_image_path = os.path.join(image_folder, image_files[0])
        first_image = Image.open(first_image_path).convert('RGB')
        
        append_images = []
        for filename in image_files[1:]:
            image_path = os.path.join(image_folder, filename)
            img = Image.open(image_path).convert('RGB')
            append_images.append(img)
            
        # 4. PDFとして保存
        first_image.save(
            pdf_filename,
            "PDF",
            resolution=100.0,
            save_all=True,
            append_images=append_images
        )
        
        print(f"✅ 全選手の活動カレンダーを'{pdf_filename}'として保存しました。")

except FileNotFoundError:
    print(f"❌ エラー: '{image_folder}' フォルダが見つかりません。")

✅ 全選手の活動カレンダーを'activity_report.pdf'として保存しました。
