In [None]:
# print()で画面に表示
print('Hello, Python!')
print('データ分析を始めましょう！')

# 変数に値を保存
name = '太郎'
age = 25
height = 170

# 変数を使って計算
print(name, 'さんは', age, '歳です')
print('身長は', height, 'cmです')


In [None]:
# pandasをインポート（pdという名前で使うのが慣習）
import pandas as pd

# データを辞書形式で作成
data = {
    '名前': ['太郎', '花子', '次郎', '美香', '三郎'],
    '年齢': [25, 23, 27, 22, 30],
    '身長': [170, 158, 175, 162, 168],
    '体重': [65, 50, 70, 52, 72]
}

# DataFrameを作成（Excelのような表形式）
df = pd.DataFrame(data)
print('作成したデータフレーム:')
print(df)


In [None]:
# 基本的な統計情報を表示
print('データの統計情報:')
print(df.describe())

# BMIを計算して新しい列を追加
df['BMI'] = df['体重'] / (df['身長']/100)**2
df['BMI'] = df['BMI'].round(1)  # 小数点第1位まで

print('\nBMIを追加したデータ:')
print(df)


In [None]:
# 条件に合うデータを抽出（フィルタリング）
print('BMIが22以上の人:')
high_bmi = df[df['BMI'] >= 22]
print(high_bmi[['名前', 'BMI']])

print('\n25歳以下の人:')
young = df[df['年齢'] <= 25]
print(young[['名前', '年齢']])

# 複数条件での抽出
print('\n20代の人（20歳以上30歳未満）:')
twenties = df[(df['年齢'] >= 20) & (df['年齢'] < 30)]
print(twenties[['名前', '年齢']])


In [None]:
# データの並び替え
print('年齢順に並び替え:')
sorted_by_age = df.sort_values('年齢')
print(sorted_by_age[['名前', '年齢']])

print('\nBMIの高い順に並び替え:')
sorted_by_bmi = df.sort_values('BMI', ascending=False)
print(sorted_by_bmi[['名前', 'BMI']])


In [None]:
# グループ化と集計
# 年代を追加（20代、30代など）
df['年代'] = (df['年齢'] // 10) * 10
df['年代'] = df['年代'].astype(str) + '代'

print('年代別の平均身長・体重:')
age_group_stats = df.groupby('年代')[['身長', '体重']].mean().round(1)
print(age_group_stats)


In [None]:
# matplotlibをインポート
import matplotlib.pyplot as plt

# Jupyter Notebook内でグラフを表示するための設定
%matplotlib inline

# 日本語フォントの設定（文字化けを防ぐ）
plt.rcParams['font.sans-serif'] = ['Hiragino Sans', 'Yu Gothic', 'Meirio', 'Takao', 'IPAexGothic', 'IPAPGothic', 'VL PGothic', 'Noto Sans CJK JP']
plt.rcParams['axes.unicode_minus'] = False


In [None]:
# 棒グラフ - メンバーの年齢
plt.figure(figsize=(8, 5))
plt.bar(df['名前'], df['年齢'], color='skyblue')
plt.title('メンバーの年齢', fontsize=16)
plt.xlabel('名前', fontsize=12)
plt.ylabel('年齢', fontsize=12)
plt.grid(axis='y', alpha=0.3)
plt.show()


In [None]:
# 散布図 - 身長と体重の関係
plt.figure(figsize=(8, 6))
plt.scatter(df['身長'], df['体重'], s=100, alpha=0.7, color='coral')

# 各点に名前を表示
for idx, row in df.iterrows():
    plt.annotate(row['名前'], (row['身長'], row['体重']), 
                 xytext=(5, 5), textcoords='offset points')

plt.title('身長と体重の関係', fontsize=16)
plt.xlabel('身長 (cm)', fontsize=12)
plt.ylabel('体重 (kg)', fontsize=12)
plt.grid(True, alpha=0.3)
plt.show()


In [None]:
# 複数のグラフを並べて表示
fig, axes = plt.subplots(1, 2, figsize=(12, 5))

# 左側：BMIの棒グラフ
axes[0].bar(df['名前'], df['BMI'], color='lightgreen')
axes[0].set_title('BMI比較', fontsize=14)
axes[0].set_ylabel('BMI', fontsize=12)
axes[0].axhline(y=22, color='red', linestyle='--', alpha=0.5, label='標準BMI(22)')
axes[0].legend()
axes[0].grid(axis='y', alpha=0.3)

# 右側：年代別の平均身長
age_group_stats['身長'].plot(kind='bar', ax=axes[1], color='orange')
axes[1].set_title('年代別平均身長', fontsize=14)
axes[1].set_xlabel('年代', fontsize=12)
axes[1].set_ylabel('身長 (cm)', fontsize=12)
axes[1].grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()
