### 1. 基本概念
create_pandas_dataframe_agent是LangChain提供的一个工具，用于创建能够理解和操作Pandas DataFrame的AI代理。

### 2. 主要参数


In [None]:
agent = create_pandas_dataframe_agent(
    llm,                    # 语言模型
    df,                     # DataFrame对象
    prefix="",             # 提示词前缀
    suffix="",             # 提示词后缀
    input_variables=None,  # 输入变量列表
    verbose=False,         # 是否显示详细日志
    agent_type="zero-shot-react-description",  # 代理类型
    return_intermediate_steps=False,  # 是否返回中间步骤
    max_iterations=15,     # 最大迭代次数
    max_execution_time=None,  # 最大执行时间
    early_stopping_method="force",  # 早停方法
)

### 3. 使用示例
1.基础查询


In [None]:
class DataAnalyzer:
    def __init__(self, df: pd.DataFrame):
        self.agent = create_pandas_dataframe_agent(
            llm=Ollama(model="llama2"),
            df=df,
            verbose=True
        )
    
    def analyze(self, query: str):
        try:
            return self.agent.run(query)
        except Exception as e:
            return f"分析出错: {str(e)}"

# 使用示例
df = pd.DataFrame({
    '产品': ['A', 'B', 'C'],
    '价格': [100, 200, 300],
    '销量': [1000, 2000, 3000]
})

analyzer = DataAnalyzer(df)
result = analyzer.analyze("计算总销售额并找出最畅销的产品")

2.高级分析

In [None]:
class AdvancedDataAnalyzer:
    def __init__(self, df: pd.DataFrame):
        self.df = df
        self.agent = create_pandas_dataframe_agent(
            llm=Ollama(model="llama2"),
            df=df,
            verbose=True,
            prefix="你是一个数据分析专家。",
            suffix="请确保分析结果准确且易于理解。"
        )
    
    def statistical_analysis(self):
        """统计分析"""
        queries = [
            "计算每列的基本统计信息",
            "找出数据中的异常值",
            "分析各列之间的相关性"
        ]
        results = {}
        for query in queries:
            results[query] = self.agent.run(query)
        return results
    
    def trend_analysis(self, time_column: str):
        """趋势分析"""
        return self.agent.run(f"分析{time_column}列的时间趋势")
    
    def custom_analysis(self, query: str):
        """自定义分析"""
        return self.agent.run(query)

create_pandas_dataframe_agent是一个强大的工具，可以帮助我们构建智能的数据分析应用。通过合理使用和配置，可以实现高效、准确的数据分析功能。