In [11]:
from functools import cache
import json
from typing import Any, Protocol
from DBTool import DatabaseLike, SQliteDB

class PiplineLike(Protocol):
    def invoke[T](self, samp:T) -> T: ...

class Rewriter:
    def invoke(self, samp:str) -> str:
        pass


def init_pipline(file_path:str) -> PiplineLike:
    raise NotImplementedError

def get_random_conv(db:DatabaseLike, num:int, seed:float=114.514) -> list[Any]:
    result = db.random_get(num,seed)
    result = [json.loads(res[6]) for res in result]
    return result

def apply_pipline[T](pipline:PiplineLike, samples:list[T]) -> list[T]:
    result = [pipline.invoke(samp) for samp in samples]
    return result


In [12]:
db = SQliteDB.connect_db("./data/magpieQwen.db")

In [13]:
get_random_conv(db, 3)

[[{'from': 'human',
   'value': '假设你需要自助机器人为一个在线销售平台开发一套有利于吸引顾客的自主推荐策略。请根据客户数据（例如浏览历史、购物车项目、购买历史、个人喜好，等等）与产品信息（例如类别信息、销售数量、评价、物品标签，等等）进行输出。'},
  {'from': 'gpt',
   'value': '开发一套自主推荐策略，旨在提高在线销售平台的顾客满意度和销售量，需要综合考虑客户数据和产品信息。以下是一种可能的策略框架：\n\n### 1. 数据收集与预处理\n- **客户数据**：收集用户的浏览历史、购物车项目、购买历史、个人喜好（如通过问卷调查或用户设置获取）、用户行为（如点击、停留时间、搜索关键词）。\n- **产品信息**：收集商品的类别信息、销售数量、评价、物品标签、价格、库存状态等。\n\n### 2. 数据分析与模型构建\n- **用户画像构建**：基于用户数据，构建用户画像，包括用户的兴趣偏好、购买力、活跃时间等。\n- **商品分析**：分析商品的销售趋势、用户评价、热门标签，识别热销商品和潜在爆款。\n- **推荐算法选择**：根据业务需求和数据特性，选择合适的推荐算法，如协同过滤、基于内容的推荐、深度学习模型（如深度神经网络、卷积神经网络）等。\n\n### 3. 推荐策略设计\n- **个性化推荐**：根据用户画像，为每个用户推荐符合其兴趣和偏好的商品。\n- **热门商品推荐**：基于销售数据和用户评价，推荐热销商品，吸引新用户。\n- **交叉销售与向上销售**：根据用户购物车和购买历史，推荐相关或更高级别的商品。\n- **库存管理推荐**：推荐库存较多的商品，帮助平衡库存。\n- **时间敏感推荐**：根据用户活跃时间，推送实时优惠或限时折扣。\n\n### 4. 实时更新与优化\n- **实时反馈**：收集用户对推荐商品的反馈，如点击率、购买率、用户评价，用于模型的实时调整。\n- **A/B测试**：定期进行A/B测试，比较不同推荐策略的效果，优化推荐算法。\n- **模型迭代**：根据业务需求和市场变化，定期更新推荐模型，引入新的算法或优化现有模型。\n\n### 5. 隐私保护与合规\n- **数据脱敏**：确保在处理用户数据时，遵守数据保护法规，对敏感信息进行脱敏处理。\n- *

In [None]:
# main

db = connect_db("./data/magpieQwen.db")
pipline = init_pipline("./prompt.json")
samples = get_random_conv(db, 10)
results = apply_pipline(pipline, samples)
db.close()