# Kindle蔵書情報の分析

このノートブックでは、Kindleの蔵書情報をSQLiteデータベースから読み取り、分析および可視化します。

In [None]:
import sys
from pathlib import Path
import platform
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns

# プロジェクトのルートディレクトリをパスに追加
project_root = Path.cwd().parent
sys.path.append(str(project_root))

# プロジェクト固有のモジュールをインポート
from src.kindle_analyzer.analyzer import analyze_kindle_library

# 日本語フォントの設定
# macOSの場合はヒラギノ、Windowsの場合はMSゴシック、それ以外の場合はIPAフォントを使用
if platform.system() == "Darwin":  # macOS
    plt.rcParams["font.family"] = "Hiragino Sans GB"
elif platform.system() == "Windows":  # Windows
    plt.rcParams["font.family"] = "MS Gothic"
else:  # Linux等
    plt.rcParams["font.family"] = "IPAGothic"

## データの読み込み

まず、Kindleの蔵書情報が保存されているSQLiteデータベースを読み込みます。

In [None]:
# データベースファイルのパスを指定
db_path = project_root / "data" / "BookData.sqlite"

# データを分析
results = analyze_kindle_library(db_path)

# 書籍データを取得
book_df = results["book_df"]

# データの基本情報を表示
print(f"書籍の総数: {len(book_df)}")
book_df.head()

## 年ごとの書籍数の分析

年ごとの書籍購入数を分析します。

In [None]:
# 年ごとの書籍数を取得
yearly_counts = results["yearly_counts"]
yearly_counts

In [None]:
# 年ごとの書籍数をプロット
plt.figure(figsize=(12, 6))
ax = sns.barplot(x="year", y="count", data=yearly_counts)

# 各バーの上に数値を表示
for i, v in enumerate(yearly_counts["count"]):
    ax.text(i, v + 0.5, str(v), ha="center")

plt.title("年ごとの書籍購入数", fontsize=16)
plt.xlabel("年", fontsize=12)
plt.ylabel("書籍数", fontsize=12)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 出版社ごとの書籍数の分析

出版社ごとの書籍数を分析します。

In [None]:
# 出版社ごとの書籍数を取得
publisher_counts = results["publisher_counts"]
publisher_counts

In [None]:
# 出版社ごとの書籍数をプロット
plt.figure(figsize=(12, 8))
ax = sns.barplot(x="count", y="publisher", data=publisher_counts)

# 各バーの右に数値を表示
for i, v in enumerate(publisher_counts["count"]):
    ax.text(v + 0.5, i, str(v), va="center")

plt.title("出版社ごとの書籍数", fontsize=16)
plt.xlabel("書籍数", fontsize=12)
plt.ylabel("出版社", fontsize=12)
plt.tight_layout()
plt.show()

## 著者ごとの書籍数の分析

著者ごとの書籍数を分析します。

In [None]:
# 著者ごとの書籍数を取得
author_counts = results["author_counts"]
author_counts

In [None]:
# 著者ごとの書籍数をプロット
plt.figure(figsize=(12, 8))
ax = sns.barplot(x="count", y="author", data=author_counts)

# 各バーの右に数値を表示
for i, v in enumerate(author_counts["count"]):
    ax.text(v + 0.5, i, str(v), va="center")

plt.title("著者ごとの書籍数", fontsize=16)
plt.xlabel("書籍数", fontsize=12)
plt.ylabel("著者", fontsize=12)
plt.tight_layout()
plt.show()

## コンテンツタグごとの書籍数の分析

コンテンツタグごとの書籍数を分析します。

In [None]:
# コンテンツタグごとの書籍数を取得
tag_counts = results["tag_counts"]
tag_counts

In [None]:
# コンテンツタグごとの書籍数をプロット
plt.figure(figsize=(10, 6))
ax = sns.barplot(x="content_tag", y="count", data=tag_counts)

# 各バーの上に数値を表示
for i, v in enumerate(tag_counts["count"]):
    ax.text(i, v + 0.5, str(v), ha="center")

plt.title("コンテンツタグごとの書籍数", fontsize=16)
plt.xlabel("コンテンツタグ", fontsize=12)
plt.ylabel("書籍数", fontsize=12)
plt.tight_layout()
plt.show()

## 月ごとの購入書籍数の分析

月ごとの購入書籍数を分析します。

In [None]:
# 月ごとの購入書籍数を取得
monthly_counts = results["monthly_counts"]
monthly_counts.head()

In [None]:
# 月ごとの購入書籍数をプロット
plt.figure(figsize=(15, 6))
ax = sns.lineplot(x="year_month", y="count", data=monthly_counts, marker="o")

plt.title("月ごとの購入書籍数", fontsize=16)
plt.xlabel("年月", fontsize=12)
plt.ylabel("書籍数", fontsize=12)
plt.xticks(rotation=90)
plt.tight_layout()
plt.show()

## まとめ

以上の分析から、Kindleの蔵書情報について以下のような洞察が得られました：

1. 年ごとの購入傾向
2. 好みの出版社
3. 好みの著者
4. コンテンツの種類（漫画、小説など）
5. 購入パターン（月ごとの変動）

これらの情報を活用して、読書傾向や購入パターンを把握することができます。