In [51]:
from pymongo import MongoClient

col_mongo_name = "国家按章分"
# col_mongo_name = "上海按章分"
# col_mongo_name = "中心按章分"
mongo = MongoClient("mongodb://localhost:27017/")
db = mongo["xunfei"]
col_mongo = db[col_mongo_name]


In [52]:
from pymilvus import connections, utility, FieldSchema, CollectionSchema, DataType, Collection
connections.connect("default", host="localhost", port="19530")
col_name = "CountryPolicy"
# col_name = "ShanghaiPolicy"
# col_name = "CentrePolicy"
fields = [
    FieldSchema(name="para_id", dtype=DataType.VARCHAR, is_primary=True, max_length=100),
    FieldSchema(name="text", dtype=DataType.VARCHAR, max_length=8192),
    FieldSchema(name="dense_vector", dtype=DataType.FLOAT_VECTOR, dim=1024),
    FieldSchema(name="sparse_vector", dtype=DataType.SPARSE_FLOAT_VECTOR)
]

schema = CollectionSchema(fields, description="Policy Paragraph Embeddings")


if utility.has_collection(col_name):
    Collection(col_name).drop()
col = Collection(col_name, schema, consistency_level="Strong")

dense_index = {"index_type": "HNSW", "metric_type": "L2"}
col.create_index("dense_vector", dense_index)
sparse_index = {"index_type": "SPARSE_INVERTED_INDEX", "metric_type": "IP"}
col.create_index("sparse_vector", sparse_index)
# col = Collection(col_name)
col.load()

In [3]:
from FlagEmbedding import BGEM3FlagModel

model = BGEM3FlagModel('BAAI/bge-m3',
                      use_fp16=False,
                      pooling_method='cls',
                      devices=['cuda:0'])

def get_embeddings(text):
    embeddings = model.encode(
        text,
        return_dense=True,
        return_sparse=True,
        return_colbert_vecs=False
    )
    return embeddings

  from .autonotebook import tqdm as notebook_tqdm
Fetching 30 files: 100%|██████████| 30/30 [00:00<?, ?it/s]


In [54]:
from tqdm import tqdm

batch_ids = []
para_ids = []
texts = []
dense_vectors = []
sparse_vectors = []
BATCH_SIZE = 100

for doc in tqdm(col_mongo.find({"vectorized": False}), desc='向量生成中...'):
    para_id = doc['para_id']
    text = doc['text']
    try:
        vector = get_embeddings(text)
        # print(vector)
        # break
        dense_vector = vector["dense_vecs"]
        sparse_vector = vector["lexical_weights"]
        para_ids.append(para_id)
        texts.append(text)
        dense_vectors.append(dense_vector)
        sparse_vectors.append(sparse_vector)
        batch_ids.append(doc['_id'])
        if len(para_ids) > BATCH_SIZE:
            col.insert([para_ids, texts, dense_vectors, sparse_vectors])
            col_mongo.update_many({"_id": {"$in": batch_ids}}, {"$set": {"vectorized": True}})
            batch_ids = []
            para_ids = []
            texts = []
            dense_vectors = []
            sparse_vectors = []

    except Exception as e:
        print(f"向量化失败：{para_id}, {type(e).__name__}: {e}")

if para_ids:
    col.insert([para_ids, texts, dense_vectors, sparse_vectors])
    col_mongo.update_many({"_id": {"$in": batch_ids}}, {"$set": {"vectorized": True}})
print("生成已完成。")

向量生成中...: 6277it [05:20, 19.60it/s]

生成已完成。





In [73]:
from pymilvus import AnnSearchRequest, WeightedRanker

def dense_search(col, query_dense_embedding, limit=5):
    search_params = {"metric_type": "L2", "params": {"level":1}}
    res = col.search(
        [query_dense_embedding],
        anns_field="dense_vector",
        limit=limit,
        output_fields=["text"],
        param=search_params,
    )[0]
    return [hit.get("text") for hit in res]


def sparse_search(col, query_sparse_embedding, limit=5):
    search_params = {
        "metric_type": "IP",
        "params": {},
    }
    res = col.search(
        [query_sparse_embedding],
        anns_field="sparse_vector",
        limit=limit,
        output_fields=["text"],
        param=search_params,
    )[0]
    return [hit.get("text") for hit in res]


def hybrid_search(
    col,
    query_dense_embedding,
    query_sparse_embedding,
    sparse_weight=1.0,
    dense_weight=1.0,
    limit=20,
):
    dense_search_params = {"metric_type": "L2", "params": {"level":1}}
    dense_req = AnnSearchRequest(
        [query_dense_embedding], "dense_vector", dense_search_params, limit=limit
    )
    sparse_search_params = {"metric_type": "IP", "params": {}}
    sparse_req = AnnSearchRequest(
        [query_sparse_embedding], "sparse_vector", sparse_search_params, limit=limit
    )
    rerank = WeightedRanker(sparse_weight, dense_weight)
    res = col.hybrid_search(
        [sparse_req, dense_req], rerank=rerank, limit=limit, output_fields=["text"]
    )[0]
    return [hit.get("text") for hit in res]

In [56]:
import jieba

def doc_text_formatting(query, docs):
    query_words = list(set(jieba.lcut(query)))  # 中文分词
    formatted_texts = []

    for doc in docs:
        highlighted = doc
        for word in query_words:
            if not word.strip():
                continue
            highlighted = re.sub(
                re.escape(word),
                f"<span style='color:red'>{word}</span>",
                highlighted
            )
        formatted_texts.append(highlighted)
    return formatted_texts


In [76]:
query = input("Enter your search query: ")
query_embeddings = get_embeddings([query])

Enter your search query:  投标文件造假将面临怎样的处罚？


In [77]:
dense_results = dense_search(col, query_embeddings["dense_vecs"][0])
sparse_results = sparse_search(col, query_embeddings["lexical_weights"][0])
hybrid_results = hybrid_search(
    col,
    query_embeddings["dense_vecs"][0],
    query_embeddings["lexical_weights"][0],
    sparse_weight=0.7,
    dense_weight=1.0,
)

In [78]:
import re
from IPython.display import Markdown, display

# Dense 搜索结果
display(Markdown("### 🔍 **Dense Search Results:**"))
formatted_results = doc_text_formatting(query, dense_results)
for result in formatted_results:
    display(Markdown(result))

# Sparse 搜索结果
display(Markdown("### 🌿 **Sparse Search Results:**"))
formatted_results = doc_text_formatting(query, sparse_results)
for result in formatted_results:
    display(Markdown(result))

# Hybrid 搜索结果
display(Markdown("### 🔄 **Hybrid Search Results:**"))
formatted_results = doc_text_formatting(query, hybrid_results)
for result in formatted_results:
    display(Markdown(result))


### 🔍 **Dense Search Results:**

第三十三条 第三十三条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。<span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，由县级以上地方人民政府住房城乡建设主管部门处中标项目金额5‰以上10‰以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额5%以上10%以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其1年至3年内参加依法必须进行招标<span style='color:red'>的</span>建筑工程设计招标<span style='color:red'>的</span><span style='color:red'>投标</span>资格，并予以公告，直至由工商行政管理机关吊销营业执照。

第七十五条 第七十五条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。依法必须进行招标项目<span style='color:red'>的</span><span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，有关行政监督部门处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一至三年<span style='color:red'>投标</span>资格，并予以公告，直至由工商行政管理机关吊销营业执照。<span style='color:red'>投标</span>人未中标<span style='color:red'>的</span>，对单位<span style='color:red'>的</span>罚款金额按照招标项目合同金额依照招标<span style='color:red'>投标</span>法规定<span style='color:red'>的</span>比例计算。

第五十四条 第五十四条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一年至三年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格并予以公告，直至由工商行政管理机关吊销营业执照。

第五十七条 第五十七条<span style='color:red'>投标</span>人或者其他利害关系人捏造事实、伪造材料或者以非法手段取得证明材料进行投诉，尚未构成犯罪<span style='color:red'>的</span>，由铁路工程建设项目招标<span style='color:red'>投标</span>行政监管部门责令改正，给予警告；情节严重<span style='color:red'>的</span>，可以并处3万元以下<span style='color:red'>的</span>罚款。

第六十九条 第六十九条<span style='color:red'>投标</span>人在<span style='color:red'>投标</span>过程中存在弄虚作假、与招标人或者其他<span style='color:red'>投标</span>人串通<span style='color:red'>投标</span>、以行贿谋取中标、无正当理由放弃中标以及进行恶意投诉等<span style='color:red'>投标</span>不良行为<span style='color:red'>的</span>，除依照有关法律、法规进行<span style='color:red'>处罚</span>外，省级交通运输主管部门还可以扣减其年度信用评价分数或者降低年度信用评价等级。

### 🌿 **Sparse Search Results:**

第五十四条 第五十四条规定<span style='color:red'>的</span>情节严重行为，由有关行政监督部门取消其1年至3年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格：(一)伪造、变造资格、资质证书或者其他许可证件骗取中标；(二)3年内2次以上使用他人名义<span style='color:red'>投标</span>；(三)弄虚作假骗取中标给招标人造成直接经济损失30万元以上；(四)其他弄虚作假骗取中标情节严重<span style='color:red'>的</span>行为。<span style='color:red'>投标</span>人自本条第二款规定<span style='color:red'>的</span><span style='color:red'>处罚</span>执行期限届满之日起3年内又有该款所列违法行为之一<span style='color:red'>的</span>，或者弄虚作假骗取中标情节特别严重<span style='color:red'>的</span>，由工商行政管理机关吊销营业执照。

第六十九条 第六十九条<span style='color:red'>投标</span>人在<span style='color:red'>投标</span>过程中存在弄虚作假、与招标人或者其他<span style='color:red'>投标</span>人串通<span style='color:red'>投标</span>、以行贿谋取中标、无正当理由放弃中标以及进行恶意投诉等<span style='color:red'>投标</span>不良行为<span style='color:red'>的</span>，除依照有关法律、法规进行<span style='color:red'>处罚</span>外，省级交通运输主管部门还可以扣减其年度信用评价分数或者降低年度信用评价等级。

第五十一条 第五十一条规定<span style='color:red'>处罚</span>。（一）利用技术手段对享有相同权限<span style='color:red'>的</span>市场主体提供有差别<span style='color:red'>的</span>信息；（二）拒绝或者限制社会公众、市场主体免费注册并获取依法必须公开<span style='color:red'>的</span>招标<span style='color:red'>投标</span>信息；（三）违规设置注册登记、<span style='color:red'>投标</span>报名等前置条件；（四）故意与各类需要分离开发并符合技术规范规定<span style='color:red'>的</span>工具软件不兼容对接；（五）故意对递交或者解密<span style='color:red'>投标</span><span style='color:red'>文件</span>设置障碍。

四、（子段1-2） 要求提供有效身份证明<span style='color:red'>文件</span>、缴纳竞买（<span style='color:red'>投标</span>）保证金外，还应提交竞买（<span style='color:red'>投标</span>）保证金不属于银行贷款、股东借款、转贷和募集资金<span style='color:red'>的</span>承诺书及商业金融机构<span style='color:red'>的</span>资信证明。根据国发10号<span style='color:red'>文件</span>规定，对发现并核实竞买人存在下列违法违规违约行为<span style='color:red'>的</span>，在结案和问题查处整改到位前，国土资源主管部门必须禁止竞买人及其控股股东参加土地竞买活动：1.存在伪造公文骗取用地和非法倒卖土地等犯罪行为<span style='color:red'>的</span>；2.存在非法转让土地使用权等违法行为<span style='color:red'>的</span>；3.因企业原因造成土地闲置一年以上<span style='color:red'>的</span>；4.开发建设企业违背出让合同约定条件开发利用土地<span style='color:red'>的</span>。各级国土资源主管部门必须严格执行国发10号<span style='color:red'>文件</span>有关规定和上述规定，要及时<span style='color:red'>将</span>发现并核实有违法违规违约企业<span style='color:red'>的</span>名单、问题和查处结果入网上传到国土资源部门户网站<span style='color:red'>的</span>中国土地市场网页，不执行或弄虚作假<span style='color:red'>的</span>，按有关法规纪律规定严肃追究有关人员责任。（四）严格划拨决定书和出让合同管理。各类住房建设项目应当在划拨决定书和出让合同中约定土地交付之日起一年内开工建设，自开工之日起三年内竣工。综合用地<span style='color:red'>的</span>，必须在合同中分别载明商业、住房等规划、建设及各相关条件。市、县国土资源主管部门要会同住房城乡建设（房地产、规划、住房保障）主管部门，研究制定违反土地划拨决定书和出让合同应约定<span style='color:red'>的</span>条件、规定和要求<span style='color:red'>的</span>违约责任及<span style='color:red'>处罚</span>条款，连同土地受让人对上述内容<span style='color:red'>的</span>承诺一并写入土地划拨决定书和出让合同，确保以保障性为重点<span style='color:red'>的</span>各类住房用地、建设和销售等按照国家政策落实到位。

第五十八条 第五十八条招标<span style='color:red'>投标</span>活动当事人和电子招标<span style='color:red'>投标</span>系统运营机构伪造、篡改、损毁招标<span style='color:red'>投标</span>信息，或者以其他方式弄虚作假<span style='color:red'>的</span>，依照招标<span style='color:red'>投标</span>法

### 🔄 **Hybrid Search Results:**

第三十三条 第三十三条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。<span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，由县级以上地方人民政府住房城乡建设主管部门处中标项目金额5‰以上10‰以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额5%以上10%以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其1年至3年内参加依法必须进行招标<span style='color:red'>的</span>建筑工程设计招标<span style='color:red'>的</span><span style='color:red'>投标</span>资格，并予以公告，直至由工商行政管理机关吊销营业执照。

第六十九条 第六十九条<span style='color:red'>投标</span>人在<span style='color:red'>投标</span>过程中存在弄虚作假、与招标人或者其他<span style='color:red'>投标</span>人串通<span style='color:red'>投标</span>、以行贿谋取中标、无正当理由放弃中标以及进行恶意投诉等<span style='color:red'>投标</span>不良行为<span style='color:red'>的</span>，除依照有关法律、法规进行<span style='color:red'>处罚</span>外，省级交通运输主管部门还可以扣减其年度信用评价分数或者降低年度信用评价等级。

第五十四条 第五十四条规定<span style='color:red'>的</span>情节严重行为，由有关行政监督部门取消其1年至3年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格：(一)伪造、变造资格、资质证书或者其他许可证件骗取中标；(二)3年内2次以上使用他人名义<span style='color:red'>投标</span>；(三)弄虚作假骗取中标给招标人造成直接经济损失30万元以上；(四)其他弄虚作假骗取中标情节严重<span style='color:red'>的</span>行为。<span style='color:red'>投标</span>人自本条第二款规定<span style='color:red'>的</span><span style='color:red'>处罚</span>执行期限届满之日起3年内又有该款所列违法行为之一<span style='color:red'>的</span>，或者弄虚作假骗取中标情节特别严重<span style='color:red'>的</span>，由工商行政管理机关吊销营业执照。

第六十八条 第六十八条　<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假骗取中标<span style='color:red'>的</span>，中标无效；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任；尚不构成犯罪<span style='color:red'>的</span>，依照招标<span style='color:red'>投标</span>法

第五十一条 第五十一条规定<span style='color:red'>处罚</span>。（一）利用技术手段对享有相同权限<span style='color:red'>的</span>市场主体提供有差别<span style='color:red'>的</span>信息；（二）拒绝或者限制社会公众、市场主体免费注册并获取依法必须公开<span style='color:red'>的</span>招标<span style='color:red'>投标</span>信息；（三）违规设置注册登记、<span style='color:red'>投标</span>报名等前置条件；（四）故意与各类需要分离开发并符合技术规范规定<span style='color:red'>的</span>工具软件不兼容对接；（五）故意对递交或者解密<span style='color:red'>投标</span><span style='color:red'>文件</span>设置障碍。

第七十五条 第七十五条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。依法必须进行招标项目<span style='color:red'>的</span><span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，有关行政监督部门处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一至三年<span style='color:red'>投标</span>资格，并予以公告，直至由工商行政管理机关吊销营业执照。<span style='color:red'>投标</span>人未中标<span style='color:red'>的</span>，对单位<span style='color:red'>的</span>罚款金额按照招标项目合同金额依照招标<span style='color:red'>投标</span>法规定<span style='color:red'>的</span>比例计算。

第五十四条 第五十四条<span style='color:red'>投标</span>人以他人名义<span style='color:red'>投标</span>或者以其他方式弄虚作假，骗取中标<span style='color:red'>的</span>，中标无效，给招标人造成损失<span style='color:red'>的</span>，依法承担赔偿责任；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>人有前款所列行为尚未构成犯罪<span style='color:red'>的</span>，处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一年至三年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格并予以公告，直至由工商行政管理机关吊销营业执照。

第五十七条 第五十七条<span style='color:red'>投标</span>人或者其他利害关系人捏造事实、伪造材料或者以非法手段取得证明材料进行投诉，尚未构成犯罪<span style='color:red'>的</span>，由铁路工程建设项目招标<span style='color:red'>投标</span>行政监管部门责令改正，给予警告；情节严重<span style='color:red'>的</span>，可以并处3万元以下<span style='color:red'>的</span>罚款。

第七十七条 第七十七条　<span style='color:red'>投标</span>人或者其他利害关系人捏造事实、伪造材料或者以非法手段取得证明材料进行投诉，给他人造成损失<span style='color:red'>的</span>，依法承担赔偿责任。招标人不按照规定对异议作出答复，继续进行招标<span style='color:red'>投标</span>活动<span style='color:red'>的</span>，由有关行政监督部门责令改正，拒不改正或者不能改正并影响中标结果<span style='color:red'>的</span>，依照本条例

第五十三条 第五十三条<span style='color:red'>投标</span>人相互串通<span style='color:red'>投标</span>或者与招标人串通<span style='color:red'>投标</span><span style='color:red'>的</span>，<span style='color:red'>投标</span>人以向招标人或者评标委员会成员行贿<span style='color:red'>的</span>手段谋取中标<span style='color:red'>的</span>，中标无效，处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一年至二年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格并予以公告，直至由工商行政管理机关吊销营业执照；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。给他人造成损失<span style='color:red'>的</span>，依法承担赔偿责任。

第二十二条 第二十二条造价工程师在最高<span style='color:red'>投标</span>限价、招标标底或者<span style='color:red'>投标</span>报价编制、工程结算审核和工程造价鉴定中，签署有虚假记载、误导性陈述<span style='color:red'>的</span>工程造价成果<span style='color:red'>文件</span><span style='color:red'>的</span>，记入造价工程师信用档案，依照《注册造价工程师管理办法》进行查处；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。

第五十三条 第五十三条规定<span style='color:red'>的</span>情节严重行为，由有关行政监督部门取消其1年至2年内参加依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span><span style='color:red'>投标</span>资格：(一)以行贿谋取中标；(二)3年内2次以上串通<span style='color:red'>投标</span>；(三)串通<span style='color:red'>投标</span>行为损害招标人、其他<span style='color:red'>投标</span>人或者国家、集体、公民<span style='color:red'>的</span>合法利益，造成直接经济损失30万元以上；(四)其他串通<span style='color:red'>投标</span>情节严重<span style='color:red'>的</span>行为。<span style='color:red'>投标</span>人自本条第二款规定<span style='color:red'>的</span><span style='color:red'>处罚</span>执行期限届满之日起3年内又有该款所列违法行为之一<span style='color:red'>的</span>，或者串通<span style='color:red'>投标</span>、以行贿谋取中标情节特别严重<span style='color:red'>的</span>，由工商行政管理机关吊销营业执照。法律、行政法规对串通<span style='color:red'>投标</span>报价行为<span style='color:red'>的</span><span style='color:red'>处罚</span>另有规定<span style='color:red'>的</span>，从其规定。

第七十三条 第七十三条供应商捏造事实、提供虚假材料或者以非法手段取得证明材料进行投诉<span style='color:red'>的</span>，由财政部门列入不良行为记录名单，禁止其1至3年内参加政府采购活动。

第七十一条 第七十一条依法必须进行招标项目<span style='color:red'>的</span>招标人向他人透露已获取招标<span style='color:red'>文件</span><span style='color:red'>的</span>潜在<span style='color:red'>投标</span>人<span style='color:red'>的</span>名称、数量或者可能影响公平竞争<span style='color:red'>的</span>有关招标<span style='color:red'>投标</span><span style='color:red'>的</span>其他情况<span style='color:red'>的</span>，或者泄露标底<span style='color:red'>的</span>，有关行政监督部门给予警告，可以并处一万元以上十万元以下<span style='color:red'>的</span>罚款；对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员依法给予处分；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。前款所列行为影响中标结果<span style='color:red'>的</span>，中标无效。

第七十四条 第七十四条<span style='color:red'>投标</span>人相互串通<span style='color:red'>投标</span>或者与招标人串通<span style='color:red'>投标</span><span style='color:red'>的</span>，<span style='color:red'>投标</span>人以向招标人或者评标委员会成员行贿<span style='color:red'>的</span>手段谋取中标<span style='color:red'>的</span>，中标无效，由有关行政监督部门处中标项目金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下<span style='color:red'>的</span>罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，取消其一至二年<span style='color:red'>的</span><span style='color:red'>投标</span>资格，并予以公告，直至由工商行政管理机关吊销营业执照；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。给他人造成损失<span style='color:red'>的</span>，依法承担赔偿责任。<span style='color:red'>投标</span>人未中标<span style='color:red'>的</span>，对单位<span style='color:red'>的</span>罚款金额按照招标项目合同金额依照招标<span style='color:red'>投标</span>法规定<span style='color:red'>的</span>比例计算。

第五十二条 第五十二条依法必须进行招标<span style='color:red'>的</span>项目<span style='color:red'>的</span>招标人向他人透露已获取招标<span style='color:red'>文件</span><span style='color:red'>的</span>潜在<span style='color:red'>投标</span>人<span style='color:red'>的</span>名称、数量或者可能影响公平竞争<span style='color:red'>的</span>有关招标<span style='color:red'>投标</span><span style='color:red'>的</span>其他情况<span style='color:red'>的</span>，或者泄露标底<span style='color:red'>的</span>，给予警告，可以并处一万元以上十万元以下<span style='color:red'>的</span>罚款；对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员依法给予处分；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任。前款所列行为影响中标结果<span style='color:red'>的</span>，中标无效。

第七十七条 第七十七条供应商有下列情形之一<span style='color:red'>的</span>，处以采购金额千分之五以上千分之十以下<span style='color:red'>的</span>罚款，列入不良行为记录名单，在一至三年内禁止参加政府采购活动，有违法所得<span style='color:red'>的</span>，并处没收违法所得，情节严重<span style='color:red'>的</span>，由工商行政管理机关吊销营业执照；构成犯罪<span style='color:red'>的</span>，依法追究刑事责任：（一）提供虚假材料谋取中标、成交<span style='color:red'>的</span>；（二）采取不正当手段诋毁、排挤其他供应商<span style='color:red'>的</span>；（三）与采购人、其他供应商或者采购代理机构恶意串通<span style='color:red'>的</span>；（四）向采购人、采购代理机构行贿或者提供其他不正当利益<span style='color:red'>的</span>；（五）在招标采购过程中与采购人进行协商谈判<span style='color:red'>的</span>；（六）拒绝有关部门监督检查或者提供虚假情况<span style='color:red'>的</span>。供应商有前款第（一）至（五）项情形之一<span style='color:red'>的</span>，中标、成交无效。

第二十三条 第二十三条供应商有下列情形之一<span style='color:red'>的</span>，处以采购金额5‰以上10‰以下<span style='color:red'>的</span>罚款，列入不良行为记录名单，在1-3年内禁止参加政府采购活动，有违法所得<span style='color:red'>的</span>，并处没收违法所得，情节严重<span style='color:red'>的</span>，由工商行政管理机关吊销营业执照；涉嫌犯罪<span style='color:red'>的</span>，移送司法机关处理：（一）提供虚假材料谋取中标、成交<span style='color:red'>的</span>；（二）采取不正当手段诋毁、排挤其他供应商<span style='color:red'>的</span>；（三）与采购人、其他供应商或者采购代理机构恶意串通<span style='color:red'>的</span>；（四）向采购人、采购代理机构行贿或者提供其他不正当利益<span style='color:red'>的</span>；（五）在招标采购过程中与采购人进行协商谈判<span style='color:red'>的</span>；（六）拒绝有关部门监督检查或者提供虚假情况<span style='color:red'>的</span>。供应商有前款第（一）至（五）项情形之一<span style='color:red'>的</span>，中标、成交无效。

第六十九条 第六十九条招标代理机构违法泄露应当保密<span style='color:red'>的</span>与招标<span style='color:red'>投标</span>活动有关<span style='color:red'>的</span>情况和资料<span style='color:red'>的</span>，或者与招标人、<span style='color:red'>投标</span>人串通损害国家利益、社会公共利益或者他人合法权益<span style='color:red'>的</span>，由有关行政监督部门处五万元以上二十五万元以下罚款，对单位直接负责<span style='color:red'>的</span>主管人员和其他直接责任人员处单位罚款数额百分之五以上百分之十以下罚款；有违法所得<span style='color:red'>的</span>，并处没收违法所得；情节严重<span style='color:red'>的</span>，有关行政监督部门可停止其一定时期内参与相关领域<span style='color:red'>的</span>招标代理业务，资格认定部门可暂停直至取消招标代理资格；构成犯罪<span style='color:red'>的</span>，由司法部门依法追究刑事责任。给他人造成损失<span style='color:red'>的</span>，依法承担赔偿责任。前款所列行为影响中标结果，并且中标人为前款所列行为<span style='color:red'>的</span>受益人<span style='color:red'>的</span>，中标无效。

第七十七条 第七十七条第一款<span style='color:red'>的</span>规定追究法律责任：（一）向评标委员会、竞争性谈判小组或者询价小组成员行贿或者提供其他不正当利益；（二）中标或者成交后无正当理由拒不与采购人签订政府采购合同；（三）未按照采购<span style='color:red'>文件</span>确定<span style='color:red'>的</span>事项签订政府采购合同；（四）<span style='color:red'>将</span>政府采购合同转包；（五）提供假冒伪劣产品；（六）擅自变更、中止或者终止政府采购合同。供应商有前款第一项规定情形<span style='color:red'>的</span>，中标、成交无效。评审阶段资格发生变化，供应商未依照本条例

In [None]:
from FlagEmbedding import BGEM3FlagModel
sentences_1 = ["你是谁？", "我已有MongoDB文档，之后该怎么做？"]
sentences_2 = ["需要设计一个具体的分割与存储方案，结合你已有的 MongoDB 文档结构", "可以根据你的MongoDB文档向量化"]
model = BGEM3FlagModel('BAAI/bge-m3',
                       use_fp16=True,
                       pooling_method='cls',
                       devices=['cuda:0']) # Setting use_fp16 to True speeds up computation with a slight performance degradation
embeddings_1 = model.encode(
    sentences_1,
    return_dense=True,
    return_sparse=True,
    return_colbert_vecs=False,
)
embeddings_2 = model.encode(
    sentences_2,
    return_dense=True,
    return_sparse=True,
    return_colbert_vecs=False,
)
dense_similarity = embeddings_1["dense_vecs"] @ embeddings_2["dense_vecs"].T
print('dense similarity:', dense_similarity)
sparse_similarity = model.compute_lexical_matching_score(
    embeddings_1["lexical_weights"],
    embeddings_2["lexical_weights"],
)
print('sparse similarity:', sparse_similarity)

queries = ['query_1', 'query_2']
passages = ["样例文档-1", "样例文档-2"]
q_embeddings = model.encode_queries(
    queries,
    return_dense=True,
    return_sparse=True,
    return_colbert_vecs=False,
)
p_embeddings = model.encode_corpus(
    passages,
    return_dense=True,
    return_sparse=True,
    return_colbert_vecs=False,
)
dense_scores = q_embeddings["dense_vecs"] @ p_embeddings["dense_vecs"].T
print('dense scores:', dense_scores)
sparse_scores = model.compute_lexical_matching_score(
    q_embeddings["lexical_weights"],
    p_embeddings["lexical_weights"],
)
print('sparse similarity:', sparse_scores)