In [17]:
import requests

def find_wikidata_entity(label: str, language: str = "vi"):
    """
    Tìm mã thực thể Wikidata từ nhãn, ưu tiên kết quả có nhãn khớp chính xác.
    """
    url = "https://www.wikidata.org/w/api.php"
    params = {
        "action": "wbsearchentities",
        "search": label,
        "language": language,
        "format": "json"
    }
    response = requests.get(url, params=params)
    data = response.json()
    
    if "search" in data and data["search"]:
        results = [(item["id"], item["label"], item.get("description", "")) for item in data["search"]]
        
        # Ưu tiên kết quả có nhãn khớp chính xác trước
        # results.sort(key=lambda x: (x[1].lower() != label.lower(), len(x[2]) if x[2] else 0), reverse=True)
        
        return [item[0] for item in results]
    return None

def find_wikidata_relation(label: str, language: str = "vi"):
    """
    Tìm mã quan hệ Wikidata từ nhãn, ưu tiên kết quả có nhãn khớp chính xác.
    """
    url = "https://www.wikidata.org/w/api.php"
    params = {
        "action": "wbsearchentities",
        "search": label,
        "language": language,
        "type": "property",  # Chỉ tìm quan hệ (property)
        "format": "json"
    }
    response = requests.get(url, params=params)
    data = response.json()
    
    if "search" in data and data["search"]:
        results = [(item["id"], item["label"], item.get("description", "")) for item in data["search"]]
        
        # # Ưu tiên kết quả có nhãn khớp chính xác trước
        # results.sort(key=lambda x: (x[1].lower() != label.lower(), len(x[2]) if x[2] else 0), reverse=True)
        
        return [item[0] for item in results]
    return None

# Ví dụ sử dụng
entity = find_wikidata_entity("South Park ")
relation = find_wikidata_relation("nghề nghiệp")
print("Entity:", entity)
print("Relation:", relation)


Entity: ['Q16538', 'Q54622175', 'Q951038', 'Q1955703', 'Q2636173', 'Q4540147', 'Q650733']
Relation: ['P106']
