In [None]:
!pip install -q bs4

In [2]:
import requests
from bs4 import BeautifulSoup

In [3]:
def extract_static_metadata(url):
    headers = {
        'User-Agent': 'Mozilla/5.0'
    }
    
    try:
        res = requests.get(url, headers=headers, timeout=5)
        res.raise_for_status()  # HTTPエラーを捕捉

        soup = BeautifulSoup(res.text, 'html.parser')
        metadata = {
            'title': soup.title.string if soup.title else None,
            'description': None,
            'keywords': None,
            'author': None,
            'og:title': None,
            'og:description': None,
            'og:image': None,
            'og:url': None,
            'twitter:title': None,
            'twitter:description': None,
            'twitter:image': None
        }

        for tag in soup.find_all('meta'):
            name = tag.get('name', '').lower()
            prop = tag.get('property', '').lower()
            content = tag.get('content')

            if name in metadata:
                metadata[name] = content
            elif prop in metadata:
                metadata[prop] = content

        return metadata

    except Exception as e:
        print(f"❌ Error fetching metadata from {url}: {e}")
        return None


In [4]:
url = "https://www.data.go.kr"
meta = extract_static_metadata(url)
print(meta)


{'title': '공공데이터 포털', 'description': '국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다.', 'keywords': None, 'author': None, 'og:title': None, 'og:description': None, 'og:image': 'http://data.go.kr/images/biz/data-search/bg-nation.png', 'og:url': 'https://www.data.go.kr/index.jsp', 'twitter:title': None, 'twitter:description': None, 'twitter:image': None}
