In [1]:
import requests
import pandas as pd
import time

In [2]:
anime_list = []
page = 1
max_page = 4  # 25개 * 4페이지 = 100개

while page <= max_page:
    response = requests.get(f"https://api.jikan.moe/v4/top/anime?page={page}")
    data = response.json()

    for anime in data["data"]:
        anime_list.append({
            "mal_id": anime.get("mal_id"),
            "url": anime.get("url"),
            "image_url": anime.get("images", {}).get("jpg", {}).get("image_url"),
            "title": anime.get("title"),
            "title_english": anime.get("title_english"),
            "title_japanese": anime.get("title_japanese"),
            "source": anime.get("source"),
            "score": anime.get("score"),
            "scored_by": anime.get("scored_by"),
            "rank": anime.get("rank"),
            "popularity": anime.get("popularity"),
            "synopsis": anime.get("synopsis"),
            "genres": ", ".join([g["name"] for g in anime.get("genres", [])]),
            "themes": ", ".join([t["name"] for t in anime.get("themes", [])])
        })

    print(f"✅ Page {page} 완료")
    page += 1
    time.sleep(1)  # 과부하 방지

# DataFrame으로 저장
df = pd.DataFrame(anime_list)
df.to_csv("top_anime_filtered.csv", index=False, encoding="utf-8-sig")
print("✅ 저장 완료: top_anime_filtered.csv")

✅ Page 1 완료
✅ Page 2 완료
✅ Page 3 완료
✅ Page 4 완료
✅ 저장 완료: top_anime_filtered.csv


In [4]:
all_data = []
page = 1

while True:
    response = requests.get(f"https://api.jikan.moe/v4/seasons/now?page={page}")
    data = response.json()

    if "data" not in data or not data["data"]:
        break

    for anime in data["data"]:
        all_data.append({
            "mal_id": anime.get("mal_id"),
            "title": anime.get("title"),
            "title_english": anime.get("title_english"),
            "image_url": anime.get("images", {}).get("jpg", {}).get("image_url"),
            "source": anime.get("source"),
            "score": anime.get("score"),
            "scored_by": anime.get("scored_by"),
            "rank": anime.get("rank"),
            "popularity": anime.get("popularity"),
            "synopsis": anime.get("synopsis"),
            "genres": ", ".join([g["name"] for g in anime.get("genres", [])]),
            "themes": ", ".join([t["name"] for t in anime.get("themes", [])])
        })

    print(f"📄 {page}페이지 수집 완료 ({len(all_data)}개 누적)")

    if not data["pagination"]["has_next_page"]:
        break

    page += 1
    time.sleep(1)  # 서버 부하 방지

# CSV 저장
df = pd.DataFrame(all_data)
df.to_csv("now_anime.csv", index=False, encoding="utf-8-sig")
print("✅ 'now_anime.csv' 저장 완료!")


📄 1페이지 수집 완료 (25개 누적)
📄 2페이지 수집 완료 (50개 누적)
📄 3페이지 수집 완료 (75개 누적)
📄 4페이지 수집 완료 (100개 누적)
📄 5페이지 수집 완료 (125개 누적)
📄 6페이지 수집 완료 (150개 누적)
📄 7페이지 수집 완료 (170개 누적)
✅ 'now_anime.csv' 저장 완료!


In [7]:
import requests
import pandas as pd
import time

recommend_list = []
page = 1
limit = 5000  # 최대 수집 수

while len(recommend_list) < limit:
    url = f"https://api.jikan.moe/v4/recommendations/anime?page={page}"
    response = requests.get(url)
    data = response.json()

    if "data" not in data or not data["data"]:
        break

    for rec in data["data"]:
        if len(rec["entry"]) >= 2:
            anime1 = rec["entry"][0]
            anime2 = rec["entry"][1]

            recommend_list.append({
                "Anime_1_ID": anime1["mal_id"],
                "Anime_1_Title": anime1["title"],
                "Anime_2_ID": anime2["mal_id"],
                "Anime_2_Title": anime2["title"],
                "Date": rec.get("date", "")
            })

            if len(recommend_list) >= limit:
                break

    print(f"✅ Page {page} 완료 | 누적 {len(recommend_list)}개")
    if not data["pagination"]["has_next_page"]:
        break

    page += 1
    time.sleep(1)

# CSV 저장
df = pd.DataFrame(recommend_list)
df.to_csv("recommend_anime_5000.csv", index=False, encoding="utf-8-sig")
print(f"\n📁 recommend_anime_5000.csv 저장 완료! 총 {len(df)}개 추천 쌍 수집.")


✅ Page 1 완료 | 누적 100개
✅ Page 2 완료 | 누적 200개
✅ Page 3 완료 | 누적 300개
✅ Page 4 완료 | 누적 400개
✅ Page 5 완료 | 누적 500개
✅ Page 6 완료 | 누적 600개
✅ Page 7 완료 | 누적 700개
✅ Page 8 완료 | 누적 800개
✅ Page 9 완료 | 누적 900개
✅ Page 10 완료 | 누적 1000개
✅ Page 11 완료 | 누적 1100개
✅ Page 12 완료 | 누적 1200개
✅ Page 13 완료 | 누적 1300개
✅ Page 14 완료 | 누적 1400개
✅ Page 15 완료 | 누적 1500개
✅ Page 16 완료 | 누적 1600개
✅ Page 17 완료 | 누적 1700개
✅ Page 18 완료 | 누적 1800개
✅ Page 19 완료 | 누적 1900개
✅ Page 20 완료 | 누적 2000개
✅ Page 21 완료 | 누적 2100개
✅ Page 22 완료 | 누적 2200개
✅ Page 23 완료 | 누적 2300개
✅ Page 24 완료 | 누적 2400개
✅ Page 25 완료 | 누적 2500개
✅ Page 26 완료 | 누적 2600개
✅ Page 27 완료 | 누적 2700개
✅ Page 28 완료 | 누적 2800개
✅ Page 29 완료 | 누적 2900개
✅ Page 30 완료 | 누적 3000개
✅ Page 31 완료 | 누적 3100개
✅ Page 32 완료 | 누적 3200개
✅ Page 33 완료 | 누적 3300개
✅ Page 34 완료 | 누적 3400개
✅ Page 35 완료 | 누적 3500개
✅ Page 36 완료 | 누적 3600개
✅ Page 37 완료 | 누적 3700개
✅ Page 38 완료 | 누적 3800개
✅ Page 39 완료 | 누적 3900개
✅ Page 40 완료 | 누적 4000개
✅ Page 41 완료 | 누적 4100개
✅ Page 42 완료 | 누적 4200개
✅ Page 43 

In [8]:
response = requests.get("https://api.jikan.moe/v4/genres/anime")
data = response.json()["data"]

genres = [{
    "mal_id": genre["mal_id"],
    "name": genre["name"],
    "count": genre["count"]
} for genre in data]

df = pd.DataFrame(genres)
df.to_csv("genres.csv", index=False)