1.导入必要的库

In [1]:
# 用于数据处理和分析的库
import pandas as pd  
# Ollama 语言模型接口
from langchain_community.llms import Ollama  
# 用于创建能处理 DataFrame 的智能代理
from langchain_experimental.agents import create_pandas_dataframe_agent  

2.初始化 Ollama 模型

In [None]:
llm = Ollama(
    model="llama3.1",  # 使用 llama3.1 模型
    temperature=0.75,  # 控制输出的随机性，0-1之间，越高越随机，越低越确定
)
# 这里选择 llama3.1 是因为它是一个强大的开源语言模型
# temperature 设置为 0.75 是为了在保持回答准确性的同时保留一定的创造性


3.读取数据

In [3]:
df = pd.read_csv("product_data.csv")
# 读取 CSV 文件
# 这个文件包含产品数据，包括产品名称、价格、库存等信息

4.创建智能代理

In [4]:
agent = create_pandas_dataframe_agent(
    llm,  # 使用之前初始化的语言模型
    df,   # 传入数据框
    verbose=True,  # 显示详细的执行过程
    allow_dangerous_code=True  # 允许执行 Python 代码
)

# 这是最核心的部分：
# agent 将 LLM 和 DataFrame 结合起来
# 它能够：
# 理解自然语言查询
# 将查询转换为 Python 代码
# 在 DataFrame 上执行操作
# 返回人类可读的结果


5.执行查询

In [None]:
query = "tell me the price of Apple"
response = agent.run(query)
print(response)

# 查询过程：
# 1. agent 接收自然语言查询
# 2. 使用 LLM 理解查询意图
# 3. 生成相应的 pandas 操作代码
# 4. 在 DataFrame 上执行代码
# 5. 将结果转换为自然语言回答

graph LR
    
    A[自然语言查询] --> B[LLM解析]

    B --> C[生成代码]

    C --> D[DataFrame操作]

    D --> E[结果解释]
    
    E --> F[自然语言回答]

这种设计的优点：
1. 用户友好：可以用自然语言查询数据
2. 灵活性强：能处理各种复杂查询
3. 可解释性：verbose 模式显示执行过程
4. 安全性：可以控制代码执行权限