In [1]:
from elasticsearch import Elasticsearch

# 連接 Elasticsearch（無需帳號密碼）
es = Elasticsearch("http://localhost:9200")

# 測試連線
if es.ping():
    print("✅ 成功連接 Elasticsearch")
else:
    print("❌ 連接失敗")


✅ 成功連接 Elasticsearch


In [2]:
index_name = "ig_data"

# 如果索引已經存在，則刪除並重新建立
if es.indices.exists(index=index_name):
    es.indices.delete(index=index_name)

es.indices.create(index=index_name, body={
    "settings": {
        "number_of_shards": 1,
        "number_of_replicas": 0
    },
    "mappings": {
        "properties": {
            "content": {"type": "text"},
            "creation_timestamp": {"type": "date"}
        }
    }
})

print(f"✅ 索引 '{index_name}' 已建立")


✅ 索引 'ig_data' 已建立


In [4]:
import json
json_file='ig_data.json'

# 假設你的 JSON 檔案名稱為 'account_information.json'
with open(json_file, 'r', encoding='utf-8') as f:
    data = json.load(f)

In [5]:
import datetime


for i in data:
    # 要插入的文本資料
    doc={}
    # 讀取data資料
    doc["content"]=i["title"]
    doc["datetime"]=i["creation_timestamp"]
    doc["timestamp"]=datetime.datetime.now()

    # 插入文件（Elasticsearch 會自動生成 ID）
    res = es.index(index=index_name, body=doc)
    print(f"✅ 文本已寫入，ID: {res['_id']}")




✅ 文本已寫入，ID: 3SwHE5UBfT7d_IY-TLSN
✅ 文本已寫入，ID: 3iwHE5UBfT7d_IY-TLSy
✅ 文本已寫入，ID: 3ywHE5UBfT7d_IY-TLS3
✅ 文本已寫入，ID: 4CwHE5UBfT7d_IY-TLS7
✅ 文本已寫入，ID: 4SwHE5UBfT7d_IY-TLS_
✅ 文本已寫入，ID: 4iwHE5UBfT7d_IY-TLTE
✅ 文本已寫入，ID: 4ywHE5UBfT7d_IY-TLTI
✅ 文本已寫入，ID: 5CwHE5UBfT7d_IY-TLTN
✅ 文本已寫入，ID: 5SwHE5UBfT7d_IY-TLTR
✅ 文本已寫入，ID: 5iwHE5UBfT7d_IY-TLTV
✅ 文本已寫入，ID: 5ywHE5UBfT7d_IY-TLTZ
✅ 文本已寫入，ID: 6CwHE5UBfT7d_IY-TLTe
✅ 文本已寫入，ID: 6SwHE5UBfT7d_IY-TLTi
✅ 文本已寫入，ID: 6iwHE5UBfT7d_IY-TLTm
✅ 文本已寫入，ID: 6ywHE5UBfT7d_IY-TLTq
✅ 文本已寫入，ID: 7CwHE5UBfT7d_IY-TLTv
✅ 文本已寫入，ID: 7SwHE5UBfT7d_IY-TLT0
✅ 文本已寫入，ID: 7iwHE5UBfT7d_IY-TLT6
✅ 文本已寫入，ID: 7ywHE5UBfT7d_IY-TLT_
✅ 文本已寫入，ID: 8CwHE5UBfT7d_IY-TbQE
✅ 文本已寫入，ID: 8SwHE5UBfT7d_IY-TbQI
✅ 文本已寫入，ID: 8iwHE5UBfT7d_IY-TbQM
✅ 文本已寫入，ID: 8ywHE5UBfT7d_IY-TbQQ
✅ 文本已寫入，ID: 9CwHE5UBfT7d_IY-TbQW
✅ 文本已寫入，ID: 9SwHE5UBfT7d_IY-TbQa
✅ 文本已寫入，ID: 9iwHE5UBfT7d_IY-TbQe
✅ 文本已寫入，ID: 9ywHE5UBfT7d_IY-TbQi
✅ 文本已寫入，ID: -CwHE5UBfT7d_IY-TbQo
✅ 文本已寫入，ID: -SwHE5UBfT7d_IY-TbQs
✅ 文本已寫入，ID: -iwHE5UBfT7d_IY-TbQw
✅ 文本已寫入，ID

In [None]:
es.indices.delete(index=index_name)
print(f"🗑️ 索引 '{index_name}' 已刪除")


🗑️ 索引 'ig_data' 已刪除


In [None]:
es.indices.delete(index=index_name)
print(f"🗑️ 索引 '{index_name}' 已刪除")


🗑️ 索引 'ig_data' 已刪除


In [6]:
query = {
    "query": {
        "match": {
            "content": "麵"
        }
    }
}

response = es.search(index=index_name, body=query)

for hit in response["hits"]["hits"]:
    print(hit['_id'])

# print(response["hits"]["hits"])

# print("🔍 搜索結果：")
# for hit in response["hits"]["hits"]:
#     print(f"📄 {hit['_source']['content']} (ID: {hit['_id']})")


eSwHE5UBfT7d_IY-Vbdr
kywHE5UBfT7d_IY-Ura7
JSwHE5UBfT7d_IY-UbZm
nSwHE5UBfT7d_IY-T7Wh
mSwHE5UBfT7d_IY-T7WU
fCwHE5UBfT7d_IY-UrZ2
XSwHE5UBfT7d_IY-TrW9
SiwHE5UBfT7d_IY-UbbY
YywHE5UBfT7d_IY-UrYk
MiwHE5UBfT7d_IY-TrUS


In [None]:
es.indices.delete(index=index_name)
print(f"🗑️ 索引 '{index_name}' 已刪除")


🗑️ 索引 'ig_data' 已刪除
