In [None]:
import requests
from bs4 import BeautifulSoup
import time
from urllib.parse import urljoin, urlparse

start_url = "https://www.musashino-u.ac.jp/"
domain = "www.musashino-u.ac.jp"
headers = {"User-Agent": "Mozilla/5.0"}

sitemap = {}
visited = set()
to_visit = [start_url]
MAX_PAGES = 20  # limit for speed

while to_visit:
    if len(visited) >= MAX_PAGES:
        print("Reached the page limit.")
        break

    url = to_visit.pop(0)
    if url in visited:
        continue
    visited.add(url)

    try:
        res = requests.get(url, headers=headers)
        time.sleep(0.5)
        if res.status_code != 200:
            continue

        res.encoding = res.apparent_encoding
        soup = BeautifulSoup(res.text, "html.parser")
        title = soup.title.string.strip() if soup.title else "タイトルなし"
        sitemap[url] = title
        print(f"[{len(visited)}] {url} -> {title}")

        for a in soup.find_all("a", href=True):
            href = a["href"]
            new_url = urljoin(url, href)
            parsed = urlparse(new_url)
            if parsed.netloc == domain and new_url not in visited:
                if new_url.startswith("http"):
                    to_visit.append(new_url)

    except Exception as e:
        print("Error:", e)

print("===== Sitemap =====")
for k, v in sitemap.items():
    print(f"{k} : {v}")

[1] https://www.musashino-u.ac.jp/ -> 武蔵野大学
[2] https://www.musashino-u.ac.jp/#main -> 武蔵野大学
[3] https://www.musashino-u.ac.jp/access.html -> 交通アクセス | 武蔵野大学
[4] https://www.musashino-u.ac.jp/admission/request.html -> 資料請求 | 入試情報 | 武蔵野大学
[5] https://www.musashino-u.ac.jp/contact.html -> お問い合わせ | 武蔵野大学
[6] https://www.musashino-u.ac.jp/prospective-students.html -> 武蔵野大学で学びたい方 | 武蔵野大学
[7] https://www.musashino-u.ac.jp/students.html -> 在学生の方 | 武蔵野大学
[8] https://www.musashino-u.ac.jp/alumni.html -> 卒業生の方 | 武蔵野大学
[9] https://www.musashino-u.ac.jp/parents.html -> 保護者の方 | 武蔵野大学
[10] https://www.musashino-u.ac.jp/business.html -> 企業・研究者の方 | 武蔵野大学
[11] https://www.musashino-u.ac.jp/guide/ -> 大学案内 | 武蔵野大学
[12] https://www.musashino-u.ac.jp/guide/profile/ -> 大学紹介 | 大学案内 | 武蔵野大学
[13] https://www.musashino-u.ac.jp/guide/activities/ -> 大学の取り組み | 大学案内 | 武蔵野大学
[14] https://www.musashino-u.ac.jp/guide/campus/ -> キャンパス | 大学案内 | 武蔵野大学
