In [1]:
import os
import json
from langchain.schema import Document

#### Regulation1

In [2]:
def regulation1(json_path):
    with open(json_path, 'r', encoding='utf-8') as f:
        data = json.load(f)

    items = data["health_function_guidelines"]["items"]
    documents = []

    for item in items:
        func = item["function"]
        claims = item["inappropriate_claims"]
        claims_text = "、".join(claims) if claims else "（無不當延伸語句）"

        text = f"保健功效：「{func}」。不當延伸語句包括：{claims_text}。"
        meta = {
            "illegal": item["id"], 
            "effect": func
        }
        documents.append(Document(page_content=text, metadata=meta))

    return documents


json_path = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/13項保健功效及不適當功效延申例句之參考.json"
docs1 = regulation1(json_path)

In [3]:
for doc in docs1:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()


=== Document ===
Content: 保健功效：「胃腸功能改善」。不當延伸語句包括：維持腸胃道環境清潔、腸胃道環保、抑制有害腸道細菌、抵抗害菌、消除便祕。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次1-胃腸功能改善', 'effect': '胃腸功能改善'}

=== Document ===
Content: 保健功效：「骨質保健功能」。不當延伸語句包括：可改善骨骼佝僂的情況。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次2-骨質保健功能', 'effect': '骨質保健功能'}

=== Document ===
Content: 保健功效：「牙齒保健功能」。不當延伸語句包括：幫助除牙結石、預防蛀牙等。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次3-牙齒保健功能', 'effect': '牙齒保健功能'}

=== Document ===
Content: 保健功效：「免疫調節功能」。不當延伸語句包括：可幫助人體抗菌功能、提高免疫力。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次4-免疫調節功能', 'effect': '免疫調節功能'}

=== Document ===
Content: 保健功效：「護肝功能（針對化學性肝損傷）」。不當延伸語句包括：增強肝功能。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次5-護肝功能（針對化學性肝損傷）', 'effect': '護肝功能（針對化學性肝損傷）'}

=== Document ===
Content: 保健功效：「抗疲勞功能」。不當延伸語句包括：（無不當延伸語句）。
Metadata: {'illegal': '違反食品安全管理法13 項保健功效及不適當功效延申例句之參考-項次6-抗疲勞功能', 'effect': '抗疲勞功能'}

=== Document ===
Content: 保健功效：「延緩衰老功能」。不當延伸語句包括：預防老人痴呆、青春永駐

#### Regulation2

In [16]:
def regulation2(json_path2):  
    with open(json_path2, 'r', encoding='utf-8') as f:
        data = json.load(f)

    categories = data.get("categories", [])
    documents = []

    for cat in categories:
        category_name = cat.get("category", "無分類")
        examples = cat.get("examples", [])

        for ex in examples:
            func = ex["ad_content"]
            claims = ex.get("ad_content", "（無內容）")
            text = f"類別：「{category_name}」。不適當共通性廣告詞句包括：{claims}。"
            meta = {
                "illegal": ex["ID"],
                "effect": func
            }
            documents.append(Document(page_content=text, metadata=meta))

    return documents


json_path2 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編.json"
docs2 = regulation2(json_path2)

In [30]:
for doc in docs2:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：完全無副作用。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次1', 'effect': '完全無副作用'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：人畜無害。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次2', 'effect': '人畜無害'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：安全使用。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次3', 'effect': '安全使用'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：絕對可以保證。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次4', 'effect': '絕對可以保證'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：最安全。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次5', 'effect': '最安全'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：對無副作用。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次6', 'effect': '對無副作用'}

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當共通性廣告詞句包括：無過敏性及毒性。
Metadata: {'illegal': '中醫藥司之中藥成藥效能、適應症語意解析及中藥廣告違規態樣釋例彙編-項次7', 'effect': '無過敏性及毒性'}

=== Document 

#### Regulation3

In [28]:
def regulation3(json_path3):
    with open(json_path3, 'r', encoding='utf-8') as f:
        data = json.load(f)

    tcm_data = data.get("inappropriate_tcm_ads", {})
    categories = tcm_data.get("violation_categories", [])
    documents = []

    for cat in categories:
        cat_id = cat.get("id", "")
        category_name = cat.get("category", "無分類")
        terms = cat.get("prohibited_terms", [])

        # 將所有 prohibited_terms 合併為一段文字
        terms_text = "、".join(terms) if terms else "（無不當廣告語句）"

        # 建立一筆 Document
        content = f"類別：「{category_name}」。不適當廣告詞句包括：{terms_text}。"
        metadata = {
            "illegal": cat_id,
            "effect": category_name
        }

        documents.append(Document(page_content=content, metadata=metadata))

    return documents

json_path3 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/中藥成藥不適當共通性廣告詞句.json"
docs3 = regulation3(json_path3)


In [29]:
for doc in docs3:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 類別：「誇張藥物安全性」。不適當廣告詞句包括：完全無副作用、人畜無害、安全使用、安全可以保證、最安全、絕對無副作用、無過敏性及毒性、徹底安全、安心的交給...。
Metadata: {'illegal': 'safety_exaggeration', 'effect': '誇張藥物安全性'}

=== Document ===
Content: 類別：「誇張藥物效能」。不適當廣告詞句包括：根治、完全預防、徹底消除、最佳、效果真好、根本治療、唯一、最理想的、更佳/最佳、獨創/特的、最常用、最適用於此、首創唯一、世界風行、風行全球、比市面上同類藥物好。
Metadata: {'illegal': 'efficacy_exaggeration', 'effect': '誇張藥物效能'}

=== Document ===
Content: 類別：「誇張藥物效力快速」。不適當廣告詞句包括：三分鐘奏效、立即見效、藥到病除、迅速、非常/特別、特效、速效、幾分鐘OK、瞬間/馬上舒解。
Metadata: {'illegal': 'speed_exaggeration', 'effect': '誇張藥物效力快速'}

=== Document ===
Content: 類別：「誇張藥物製法」。不適當廣告詞句包括：最高技術、最進步製法、最新科學、經特殊科技、最新奈米技術。
Metadata: {'illegal': 'manufacturing_exaggeration', 'effect': '誇張藥物製法'}

=== Document ===
Content: 類別：「保證藥物效能」。不適當廣告詞句包括：可具保單、無效退款、效果絕對保證、百分之百、比一般傳統的OO更優異。
Metadata: {'illegal': 'guarantee_claims', 'effect': '保證藥物效能'}

=== Document ===
Content: 類別：「借由他人名義為宣傳者」。不適當廣告詞句包括：專家或醫師等專業醫事人員推薦、病人推薦、名人推薦OO背書、掛保證。
Metadata: {'illegal': 'third_party_endorsement', 'effect': '借由他人名義為宣傳者'}

=== Docu

#### Regulation4

In [None]:
def regulation4(json_path4):
    with open(json_path4, 'r', encoding='utf-8') as f:
        data = json.load(f)

    cosme_data = data.get("prohibited_physiological_claims", {})
    categories = cosme_data.get("categories", [])
    documents = []

    for cat in categories:
        cat_id = cat.get("id", "")
        category_name = cat.get("category", "無分類")
        terms = cat.get("prohibited_terms", [])

        for term in terms:
            content = f"分類「{category_name}」中，以下廣告用語不得使用：「{term}」。"
            metadata = {
                "illegal": cat_id, 
                "effect": category_name
            }
            documents.append(Document(page_content=content, metadata=metadata))


        documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [None]:
json_path4 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/化妝品涉及影響生理機能或改變身體結構之詞句.json"
docs4 = regulation4(json_path4)

for doc in docs4:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

#### Regulation5

In [None]:
def regulation5(json_path5):
    with open(json_path5, 'r', encoding='utf-8') as f:
        data = json.load(f)

    category = data.get("category", "無分類")
    cases = data.get("cases", [])
    documents = []

    for case in cases:
        law_id = case.get("ID", "")
        content = case.get("content", "（無內容）")

        metadata = {
            "illegal": law_id,
            "effect": category
        }

        documents.append(Document(page_content=content, metadata=metadata))

    return documents


In [None]:
json_path5 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/化粧品衛生管理法.json"
docs5 = regulation5(json_path5)

for doc in docs5:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 化粧品之標示、宣傳及廣告內容，不得有虛偽或誇大之情事。
Metadata: {'illegal': '化粧品衛生管理法-第10條', 'effect': '化粧品衛生管理法'}

=== Document ===
Content: 違反第10條第1項規定或依第4條所定準則有關宣傳或廣告之內容、方式之規定者，處新臺幣四萬元以上二十萬元以下罰鍰；違反同條第2項規定者，處新臺幣六十萬元以上五百萬元以下罰鍰；情節重大者，並得令其停業及廢止其公司、商業、工廠之全部或部分登記事項。
Metadata: {'illegal': '化粧品衛生管理法-第20條', 'effect': '化粧品衛生管理法'}



#### Regulation6

In [38]:
def regulation6(json_path6):
    with open(json_path6, 'r', encoding='utf-8') as f:
        data = json.load(f)

    documents = []
    for category in data.get("categories", []):
        law_name = category.get("category", "無分類")
        for case in category.get("cases", []):
            law_id = case.get("ID", "")
            content = case.get("content", "")

            full_text = f"{law_id}：{content}"
            metadata = {
                "illegal": law_id,
                "effect": law_name
            }

            documents.append(Document(page_content=full_text, metadata=metadata))

    return documents

In [None]:
json_path6 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/食品、化粧品、藥物、醫療器材相關法規彙編.json"
docs6 = regulation6(json_path6)

for doc in docs6:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

#### Regulation7

In [53]:
def regulation7(json_path7):
    """
    將「食品及相關產品標示宣傳廣告…可使用詞句」JSON 轉成 Document list
    metadata 只包含 'illegal' 與 'effect' 兩欄，與 regulation4 保持一致
    """
    with open(json_path7, 'r', encoding='utf-8') as f:
        data = json.load(f)

    documents = []

    # 走訪最外層 categories
    for cat in data.get("categories", []):
        cat_name = cat.get("category", "")

        # ── 1️⃣ 通常可以使用之詞句 ───────────────────────────
        if cat_name == "通常可以使用之詞句":
            for case in cat.get("cases", []):
                case_id = case.get("ID", "")
                term     = case.get("ad_content", "")

                content = f"分類「{cat_name}」中，'可'使用之廣告用語：「{term}」。"
                metadata = {
                    "legal": case_id,   # 與 regulation4 一樣，填入唯一 ID
                    "effect":  term   # 分類名稱
                }
                documents.append(Document(page_content=content, metadata=metadata))

        # ── 2️⃣ 營養素生理功能（含多層 subcategory）────────────
        elif cat_name == "營養素生理功能":
            for sub in cat.get("subcategories", []):
                nutrient_name = sub.get("subcategory", "未命名營養素")
                for case in sub.get("cases", []):
                    case_id = case.get("ID", "")
                    term     = case.get("ad_content", "")

                    content = f"營養素「{nutrient_name}」可使用之廣告用語：「{term}」。"
                    metadata = {
                        "legal": case_id,       # 唯一 ID
                        "effect":  term  # 營養素名稱
                    }
                    documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [54]:
json_path7 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-可用詞句.json"
docs7 = regulation7(json_path7)

for doc in docs7:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「幫助牙齒骨骼正常發育」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次1', 'effect': '幫助牙齒骨骼正常發育'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「幫助消化」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次2', 'effect': '幫助消化'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「幫助維持消化道機能」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次3', 'effect': '幫助維持消化道機能'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「改變細菌叢生態」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次4', 'effect': '改變細菌叢生態'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「使排便順暢」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次5', 'effect': '使排便順暢'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「調整體質」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次6', 'effect': '調整體質'}

=== Document ===
Content: 分類「通常可以使用之詞句」中，'可'使用之廣告用語：「調節生理機能」。
Metadata: {'legal': '食品及相關產品標示宣傳廣告涉及不實誇張易生誤解或醫療效能認定準則-項次7', 'effect': '調節生

#### Regulation8

In [57]:
def regulation8(json_path8):
    with open(json_path8, 'r', encoding='utf-8') as f:
        data = json.load(f)

    law_data = data.get("食品安全衛生管理法", {})
    documents = []

    for article, items in law_data.items():
        for item in items:
            item_no = item.get("項次", "")
            content_text = item.get("內容", "")
            content = f"法規「食品安全衛生管理法」{article}第{item_no}項：{content_text}"
            metadata = {
                "illegal": f"{article}-第{item_no}項",
                "effect": f"{content_text}"
            }
            documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [58]:
json_path8 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/食品安全衛生管理法.json"
docs8 = regulation8(json_path8)

for doc in docs8:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 法規「食品安全衛生管理法」第28條第1項：食品、食品添加物、食品用洗潔劑及經中央主管機關公告之食品器具、食品容器或包裝，其標示、宣傳或廣告，不得有不實、誇張或易生誤解之情形。
Metadata: {'illegal': '第28條-第1項', 'effect': '食品、食品添加物、食品用洗潔劑及經中央主管機關公告之食品器具、食品容器或包裝，其標示、宣傳或廣告，不得有不實、誇張或易生誤解之情形。'}

=== Document ===
Content: 法規「食品安全衛生管理法」第28條第2項：食品不得為醫療效能之標示、宣傳或廣告。
Metadata: {'illegal': '第28條-第2項', 'effect': '食品不得為醫療效能之標示、宣傳或廣告。'}

=== Document ===
Content: 法規「食品安全衛生管理法」第45條第1項：違反第二十八條第一項或中央主管機關依第二十八條第三項所定辦法者，處新臺幣四萬元以上四百萬元以下罰鍰。
Metadata: {'illegal': '第45條-第1項', 'effect': '違反第二十八條第一項或中央主管機關依第二十八條第三項所定辦法者，處新臺幣四萬元以上四百萬元以下罰鍰。'}



#### Regulation9

In [61]:
def regulation9(json_path9):
    with open(json_path9, 'r', encoding='utf-8') as f:
        data = json.load(f)

    cases = data.get("cases", [])
    documents = []

    for case in cases:
        case_id = case.get("ID", "")
        content_text = case.get("content", "")
        content = f"合法使用詞句範例（{case_id}）：「{content_text}」。"
        metadata = {
            "legal": case_id,  # 這邊沿用ID作為illegal欄位
            "effect": f"{content_text}"
        }
        documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [62]:
json_path9 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/食品藥品健康食品得使用詞句補充案例.json"
docs9 = regulation9(json_path9)

for doc in docs9:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次1）：「能完整補充人體營養」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次1', 'effect': '能完整補充人體營養'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次2）：「調整體質」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次2', 'effect': '調整體質'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次3）：「提升生理機能」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次3', 'effect': '提升生理機能'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次4）：「調節生理機能」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次4', 'effect': '調節生理機能'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次5）：「促進新陳代謝」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次5', 'effect': '促進新陳代謝'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次6）：「幫助入睡」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次6', 'effect': '幫助入睡'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品、健康食品得使用詞句補充案例-項次7）：「調整體質」。
Metadata: {'legal': '食品、藥品、健康食品得使用詞句補充案例-項次7', 'effect': '調整體質'}

=== Document ===
Content: 合法使用詞句範例（食品、藥品

#### Regulation10

In [4]:
def regulation10(json_path10):
    with open(json_path10, 'r', encoding='utf-8') as f:
        data = json.load(f)

    ad_cases = data.get("advertisement_violation_cases", {})
    title = ad_cases.get("title", "無標題")
    cases = ad_cases.get("cases", [])
    documents = []

    for case in cases:
        case_id = case.get("id", "")
        ad_content = case.get("ad_content", "")
        violation_type = case.get("violation_type", "無違規類型")

        content = f"在文件「{title}」中，案例編號「{case_id}」違規用語為：「{ad_content}」，違規類型為：「{violation_type}」。"
        metadata = {
            "illegal": case_id,
            "effect": violation_type
        }
        documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [5]:
json_path10 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/衛生福利部暨臺北市政府衛生局食品廣告例句209.json"
docs10 = regulation10(json_path10)

for doc in docs10:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 在文件「衛生福利部暨臺北市政府衛生局食品廣告例句209」中，案例編號「衛生福利部暨臺北市政府衛生局食品廣告例句209-項次1」違規用語為：「對長期便秘、下痢等慢性病有不錯的效果」，違規類型為：「涉及療效」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局食品廣告例句209-項次1', 'effect': '涉及療效'}

=== Document ===
Content: 在文件「衛生福利部暨臺北市政府衛生局食品廣告例句209」中，案例編號「衛生福利部暨臺北市政府衛生局食品廣告例句209-項次2」違規用語為：「改善排便異常」，違規類型為：「涉及療效」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局食品廣告例句209-項次2', 'effect': '涉及療效'}

=== Document ===
Content: 在文件「衛生福利部暨臺北市政府衛生局食品廣告例句209」中，案例編號「衛生福利部暨臺北市政府衛生局食品廣告例句209-項次3」違規用語為：「一年四季預防傷風感冒的聖品」，違規類型為：「涉及療效」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局食品廣告例句209-項次3', 'effect': '涉及療效'}

=== Document ===
Content: 在文件「衛生福利部暨臺北市政府衛生局食品廣告例句209」中，案例編號「衛生福利部暨臺北市政府衛生局食品廣告例句209-項次4」違規用語為：「對於容易感冒...有很好的效果」，違規類型為：「涉及療效」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局食品廣告例句209-項次4', 'effect': '涉及療效'}

=== Document ===
Content: 在文件「衛生福利部暨臺北市政府衛生局食品廣告例句209」中，案例編號「衛生福利部暨臺北市政府衛生局食品廣告例句209-項次5」違規用語為：「消化不良」，違規類型為：「涉及療效」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局食品廣告例句209-項次5', 'effect': '涉及療效'}

=== Document ===
Content

#### Regulation11

In [69]:
def regulation11(json_path11):
    with open(json_path11, 'r', encoding='utf-8') as f:
        data = json.load(f)

    health_data = data.get("health_food_violations", {})
    cases = health_data.get("cases", [])
    documents = []

    for case in cases:
        violation_id = case.get("ID", "")
        ad_content = case.get("ad_content", "")
        violation_type = case.get("violation_type", "")

        content = f"違規案例編號「{violation_id}」中，違規廣告用語為：「{ad_content}」。違規類型為：「{violation_type}」。"
        metadata = {
            "illegal": violation_id,
            "effect": violation_type
        }

        documents.append(Document(page_content=content, metadata=metadata))

    return documents

In [70]:
json_path11 = "/home/r12942159/NTU_AI/Final-Project/法規及案例 Vector Stores/衛生福利部暨臺北市政府衛生局健康食品廣告例句83.json"
docs11 = regulation11(json_path11)

for doc in docs11:
    print("=== Document ===")
    print("Content:", doc.page_content)
    print("Metadata:", doc.metadata)
    print()

=== Document ===
Content: 違規案例編號「衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次1」中，違規廣告用語為：「有清血防栓成份」。違規類型為：「超出調節血脂之保健功效許可範圍」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次1', 'effect': '超出調節血脂之保健功效許可範圍'}

=== Document ===
Content: 違規案例編號「衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次2」中，違規廣告用語為：「預防及減輕高血脂症、血栓病」。違規類型為：「超出調節血脂之保健功效許可範圍」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次2', 'effect': '超出調節血脂之保健功效許可範圍'}

=== Document ===
Content: 違規案例編號「衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次3」中，違規廣告用語為：「能乳化及清理體內膽固醇和三酸甘油脂。長期服用，可降低體內膽固醇及脂肪，防止血管硬化。」。違規類型為：「超出調節血脂之保健功效許可範圍」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次3', 'effect': '超出調節血脂之保健功效許可範圍'}

=== Document ===
Content: 違規案例編號「衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次4」中，違規廣告用語為：「紅酒單寧酸物質存在於葡萄中之天然抗氧化物質，可防止血液中壞的膽固醇氧化」。違規類型為：「超出調節血脂之保健功效許可範圍」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次4', 'effect': '超出調節血脂之保健功效許可範圍'}

=== Document ===
Content: 違規案例編號「衛生福利部暨臺北市政府衛生局健康食品廣告例句83-項次5」中，違規廣告用語為：「含OMEGA 3，有助於降低膽固醇之作用，可預防心臟血管疾病」。違規類型為：「超出調節血脂之保健功效許可範圍」。
Metadata: {'illegal': '衛生福利部暨臺北市政府衛生局

#### Combine docs

In [72]:
all_docs = docs1 + docs2 + docs3 + docs4 + docs5 + docs6 + docs7 + docs8 + docs9 + docs10 + docs11

In [75]:
import pickle

# 儲存
with open("Knowledge-Base.pkl", "wb") as f:
    pickle.dump(all_docs, f)