In [1]:
import json
import requests
from typing import Dict, List, Any
from bs4 import BeautifulSoup

In [19]:
# 作品一覧を文字列に変換
def works_to_string(data: Dict[str, Dict[str, Any]], works: List[str]) -> str:
    output_lines: List[str] = []

    for work_id in works:
        work = data[work_id]

        id_ = work.get("id")
        if id_:
            output_lines.append(f"ID: {id_}")

        title = work.get("title")
        if title:
            output_lines.append(f"タイトル: {title}")

        catchphrase = work.get("catchphrase")
        if catchphrase:
            output_lines.append(f"キャッチフレーズ: {catchphrase}")

        tags = work.get("tagLabels")
        if tags:
            tag_str = ", ".join(tags)
            output_lines.append(f"タグ: {tag_str}")

        introduction = work.get("introduction")
        if introduction:
            output_lines.append("イントロダクション:\n```\n" + introduction + "\n```")

        output_lines.append("")  # 区切りの空行

    result: str = "\n".join(output_lines)

    return result


# エピソード一覧を文字列に変換
def episodes_to_string(data: Dict[str, Dict[str, Any]], episodes: List[str]) -> str:
    output_lines: List[str] = []

    for episode_id in episodes:
        episode = data[episode_id]

        id_ = episode.get("id")
        if id_:
            output_lines.append(f"ID: {id_}")

        title = episode.get("title")
        if title:
            output_lines.append(f"タイトル: {title}")

        publishedAt = episode.get("publishedAt")
        if publishedAt:
            output_lines.append(f"公開日: {publishedAt}")

        output_lines.append("")  # 区切りの空行

    result: str = "\n".join(output_lines)

    return result

# トップページ

In [3]:
url = "https://kakuyomu.jp/"
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")
data = json.loads(soup.find("script", id="__NEXT_DATA__").string)["props"]["pageProps"][
    "__APOLLO_STATE__"
]
works = list(filter(lambda x: x.startswith("Work"), data.keys()))

In [5]:
print(works_to_string(data, works[:5]))

ID: 16817330650993330082
タイトル: 『聖女じゃない方』の私の異世界冒険は『勇者じゃない方』の君と一緒！　～あれ、私達って本当に『じゃない方』？～
キャッチフレーズ: じゃない方の「私」「僕」だけど、君のためにがんばる！　＃付き合ってない

ID: 16816700426798996703
タイトル: 100日後に別れるかもしれないゲイカップル
キャッチフレーズ: 【書籍化作品】男女が別れるように、男同士だって別れるわけで。

ID: 16817330652495155185
タイトル: 近畿地方のある場所について
キャッチフレーズ: 情報をお持ちの方はご連絡ください

ID: 1177354054887510509
タイトル: ある魔女が死ぬまで　－メグ・ラズベリーの余命一年－
キャッチフレーズ: これは余命一年の魔女が紡ぐ奇跡の物語

ID: 1177354054896217570
タイトル: エースはまだ自分の限界を知らない［第一部+Ex+1.5］
キャッチフレーズ: ［累計４０００万PV突破］リアルではないリアリティ野球青春物



# 検索

In [11]:
url = "https://kakuyomu.jp/search"

params = {
    "q": "転生",  # 検索キーワード
    "page": "1",  # ページ数
    "ex_q": "あいうえお",  # 除外キーワード スペースで複数指定可能: "あいうえお さしすせそ"
    "serial_status": "running",  # 連載状態 "running" か "completed"
    # 作品ジャンル
    # 複数から選べ、カンマ区切りで複数指定可能: "fantasy,action"
    # 使えるワード:
    # fantasy(異世界ファンタジー), action(現代ファンタジー), sf(SF), love_story(恋愛), romance(ラブコメ), drama(現代ドラマ), horror(ホラー)
    # mystery(ミステリー), nonfiction(エッセイ・ノンフィクション), history(歴史・時代・伝奇), criticism(創作論・評論), others(詩・童話・その他), maho(まほうのiらんど), fan_fiction(二次創作)
    "genre_name": "fantasy",
    # **評価数(★の多さ)**
    # "n以上"の場合: "{n}-", "n以下"の場合: "-{n}", "任意設定"の場合: "custom"
    # "custom"の場合、{"total_review_point_min":"5", "total_review_point_max":"10"} のようなparamが付く。
    "total_review_point_range": "1000-",
    # **小説の長さ**
    # "n以上"の場合: "{n}-", "n以下"の場合: "-{n}", "任意設定"の場合: "custom"
    # "custom"の場合、{"total_character_count_min":"1000", "total_character_count_max":"10000"} のようなparamが付く。
    "total_character_count_range": "-20000",
    # **作品公開日**
    # "1days", "7days", "1months", "6months", "1years", "custom" から選べる。
    # "custom"の場合、{"published_date_start": "2025-05-01", "published_date_end"="2025-05-08"} のようなparamが付く。
    "published_date_range": "6months",
    # **作品更新日**
    # "1days", "7days", "1months", "6months", "1years", "custom" から選べる。
    # "custom"の場合、{"last_episode_published_date_start": "2025-05-01", "last_episode_published_date_end"="2025-05-08"} のようなparamが付く。
    "last_episode_published_date_range": "1days",
}

res = requests.get(url, params=params)
soup = BeautifulSoup(res.text, "html.parser")
data = json.loads(soup.find("script", id="__NEXT_DATA__").string)["props"]["pageProps"][
    "__APOLLO_STATE__"
]
works = list(filter(lambda x: x.startswith("Work:"), data.keys()))

In [12]:
print(works_to_string(data, works[:3]))

ID: 16817330659748108558
タイトル: 追放された器用貧乏、隠しボスと配信始めたら徐々に万能とバレ始める
キャッチフレーズ: 攻撃Ａ魔力Ａ敏捷Ａの器用貧乏？⇒オールSの万能です【完結まで毎日更新】
タグ: ダンジョン, 配信, 器用貧乏, 主人公最強, 追放側も主人公好き, カクヨムオンリー, 完結まで毎日更新
イントロダクション:
```
主人公はジョブ勇者。最初は恵まれたジョブと思われていたが、突出した能力がなく、器用貧乏の勇者詐欺と評価されるようになる。そのことからパーティを追放される。さらに最後の情けと称し、隠しボス部屋に放り込まれる。
そこで出迎えるは美しきヴァンパイア。
やけくそ気味に戦っていると、なぜかヴァンパイアが配信用ドローンに興味を持つ。
「ハイシン……？　裏切り的なあれか？」
そうして、半分、気の迷いで隠しボスとの配信を始めたら……、

最初はボスと配信をする物珍しさで興味を持たれるのだが……、

【そもそもヴァンパイアと闘えてるのすごないか？】
【A級配信者を瞬殺？　偶然かな？】
【え、S級ボスまで……！？】

気がつくとめっちゃ注目を集めてしまっていた。

そして追放したパーティもどこか様子がおかしい。。。
※追放側がそんなに悪い奴じゃない作品になります。復讐をご期待して読み始めるとすっきりできませんのでご注意ください。
```

ID: 16818622170366457987
タイトル: 【290万PV感謝】恋愛バトルゲームの主人公のクズ兄に転生したが死にたく無いので全力で努力します
キャッチフレーズ: 転生したら主人公のクズ兄！？死亡フラグ回避しながらサブヒロインと交流
タグ: 学園モノ, ゲーム内転生, メインヒロインは全力回避, ゲーム知識チート, 微ハーレム（メイン以外）, ゲスクズ兄への転生, 異能バトル, 成り上がり
イントロダクション:
```
目が覚めるとそこは知らないベッドに知らない家具、自分の部屋とは違う別のだれかの部屋
部屋の中を物色してると、自分が別人になってる事に気付く
そう、ここは学園恋愛バトルゲーム魔都東京１９９９の世界だった

俺の名前は南原譲二、都内にある中堅ソフト開発会社のエンジニアだ、この会社は今２代目の社長が経営を引き継ぎ業績は悪化の一途を辿ってる、メインの仕事は大手からの業

# 作品ページ

## エピソード一覧

In [None]:
work_id = "16817330652495155185"
url = f"https://kakuyomu.jp/works/{work_id}"
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")
data = json.loads(soup.find("script", id="__NEXT_DATA__").string)["props"]["pageProps"][
    "__APOLLO_STATE__"
]
episodes = list(filter(lambda x: x.startswith("Episode:"), data.keys()))
print(episodes_to_string(data, episodes[:10]))

ID: 16817330652496032095
タイトル: 某月刊誌別冊　2017年7月発行掲載　短編「おかしな書き込み」
公開日: 2023-01-28T13:22:04Z

ID: 16817330652501371395
タイトル: 某週刊誌　1989年3月14日号掲載「実録！奈良県行方不明少女に新事実か？」
公開日: 2023-01-29T15:42:40Z

ID: 16817330652581796438
タイトル: 『近畿地方のある場所について』　1
公開日: 2023-01-30T12:48:00Z

ID: 16817330652620327747
タイトル: 某月刊誌　2006年4月号掲載「林間学校集団ヒステリー事件の真相」
公開日: 2023-01-31T08:58:05Z

ID: 16817330652696945685
タイトル: 某月刊誌　1993年8月号掲載　短編「まっしろさん」
公開日: 2023-02-02T07:33:39Z

ID: 16817330652737203886
タイトル: ネット収集情報　1
公開日: 2023-02-03T09:18:04Z

ID: 16817330652920924558
タイトル: 読者からの手紙　1
公開日: 2023-02-07T11:48:44Z

ID: 16817330652927986674
タイトル: 『近畿地方のある場所について』　2
公開日: 2023-02-16T03:00:06Z

ID: 16817330653284890008
タイトル: 某月刊誌　2009年8月号掲載　読者投稿欄
公開日: 2023-02-16T09:00:00Z

ID: 16817330653315697853
タイトル: 某月刊誌　2015年2月号掲載　短編「賃貸物件」
公開日: 2023-02-16T12:21:48Z



## エピソード取得

In [27]:
work_id = "16817330652495155185"
episode_id = "16817330652496032095"
url = f"https://kakuyomu.jp/works/{work_id}/episodes/{episode_id}"
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")

episode_body = soup.find("div", class_="widget-episodeBody js-episode-body")

# class="blank" を除いた <p> タグのテキストだけ抽出
paragraphs = [
    p.get_text(strip=True)
    for p in episode_body.find_all("p")
    if "blank" not in p.get("class", [])
]

episode = "\n".join(paragraphs)
print(episode)

都内在住の24歳会社員、Aさんは新卒でエンジニアとして入社したシステム会社の業務にも慣れ、刺激のない鬱々とした毎日を送っていたという。
趣味もなく、彼女もいないAさんがストレス解消にしたのはサイト巡りだった。
「恥ずかしい話なんですが、いわゆるアダルトサイトってやつですね。最近だと動画の無料転載をやってるようなサイトも多いじゃないですか？　もちろん褒められたものではないと思うんですが。毎日寝る前にいくつかのそういうサイトを巡るのがほぼ日課みたいになってました」
そのなかでもひときわお気に入りのサイトがあったという。
「そのサイトは有名なレーベルの新作も転載していて、けっこうアクセスしてたと思います。ただ、ちょっと作りが独特で……。動画の再生枠の下って普通は他の動画へのオススメ枠になってることが多いんですけど、そのサイトはコメント欄があったんです」
これはエンジニアとしての俺の予想なんですけど、と前置きしてAさんは続ける。
「こういう界隈のサイトって法律のグレーゾーンで運用してることがほとんどなんで、いつ閉鎖してもおかしくない。そういった理由もあってか、とにかくサイト自体に手間をかけてないんですよね。具体的にいうと、別のサイトの枠組みを流用してることが多い。そのほうがイチから作らなくて済むから簡単なんですよ。だから、そのサイトのコメント欄も運営側が意図して作ったっていうよりかはたまたま流用元にあったっていうような印象を受けました。無断転載のアダルト動画を観て、コメント欄で交流するような変人もいませんしね」
その予想を裏付けるように、コメント欄にコメントが書き込まれることはほとんどなく、あったとしても『動画が途中で切れてるぞ』や『こんな動画じゃなくて新作動画をアップしろ』などといったほとんど文句といってもいいものがまれにみられるくらいで、運営からの返信コメントがあることもなく、活用されている様子はなかった。
ある日、いつものようにそのサイトへアクセスしたＡさんは妙な書き込みを見つけた。
「その動画はお気に入りのレーベルで売り出し中の、新人のデビュー作でした。見つけたときはラッキーって感じだったんですが、観終わった後になんとなくスクロールしたらそのコメントが目に入ったんです」
『かわいい。うちへきませんか。』
「第一印象としては、インターネットの使い方をわかっていないおじ