In [1]:
## 导入依赖
import openai
import os
import numpy as np
import pandas as pd
import json
import io
from openai import OpenAI
import inspect
import pymysql
import tiktoken
from docx import Document
import matplotlib.pyplot as plt
import seaborn as sns
import tempfile
import ast
from IPython.display import display, Markdown, Code




openai.api_key = os.getenv("OPENAI_API_KEY")
openai.api_base="https://newone.nxykj.tech/v1"


client = OpenAI(api_key=openai.api_key ,base_url=openai.api_base)

# 1. 外挂知识库

In [2]:
# 读取数据字典
with open('/root/autodl-tmp/iquery项目/data/数据字典/iquery数据字典.md', 'r', encoding='utf-8') as f:
    md_content = f.read()

In [3]:
# 读取业务知识文档
with open("/root/autodl-tmp/iquery项目/data/业务知识/本公司数据分析师业务介绍.md", 'r', encoding='utf-8') as f:
    da_instruct = f.read()

# 2. 在线云盘功能实现

In [4]:
import os

def create_directory(directory):
    """
    根据项目创建云盘目录
    """
    base_path = "/root/autodl-tmp/iquery项目/iquery云盘"
    full_path = os.path.join(base_path, directory)
    # 如果目录不存在，则创建它
    if not os.path.exists(full_path):
        os.makedirs(full_path)
        print(f"目录 {directory} 创建成功")
    else:
        print(f"目录 {directory} 已存在")

In [5]:
import os
from docx import Document

def append_in_doc(folder_name, doc_name, qa_string):
    """"
    往文件里追加内容
    @param folder_name=目录名，doc_name=文件名，qa_string=追加的内容
    """
    base_path = "/root/autodl-tmp/iquery项目/iquery云盘"
    ## 目录地址
    full_path_folder=base_path+"/"+folder_name
    ## 文件地址
    full_path_doc = os.path.join(full_path_folder, doc_name)+".doc"
    

    # 检查目录是否存在，如果不存在则创建
    if not os.path.exists(full_path_folder):
        os.makedirs(full_path_folder)
    
    # 检查文件是否存在
    if os.path.exists(full_path_doc):
        # 文件存在，打开并追加内容
        document = Document(full_path_doc)
    else:
        # 文件不存在，创建一个新的文档对象
        document = Document()

    # 追加内容
    document.add_paragraph(qa_string)
    
    # 保存文档
    document.save(full_path_doc)
    print(f"内容已追加到 {doc_name}")

In [6]:
from docx import Document
import matplotlib.pyplot as plt
import os
import tempfile

def append_img_in_doc(folder_name, doc_name, img):
    """"
    往文件里追加图片
    @param folder_name=目录名，doc_name=文件名，img=图片对象，数据类型为matplotlib.figure.Figure对象
    """
    base_path = "/root/autodl-tmp/iquery项目/iquery云盘"
    ## 目录地址
    full_path_folder=base_path+"/"+folder_name
    ## 文件地址
    full_path_doc = os.path.join(full_path_folder, doc_name)+".doc"
    

    # 检查目录是否存在，如果不存在则创建
    if not os.path.exists(full_path_folder):
        os.makedirs(full_path_folder)
    
    # 检查文件是否存在
    if os.path.exists(full_path_doc):
        print(full_path_doc)
        # 文件存在，打开并追加内容
        document = Document(full_path_doc)
    else:
        # 文件不存在，创建一个新的文档对象
        document = Document()

    # 追加图片
    # 将matplotlib的Figure对象保存为临时图片文件
    with tempfile.NamedTemporaryFile(delete=False, suffix='.png') as tmpfile:
        fig.savefig(tmpfile.name, format='png')
        # 将图片插入到.docx文档中
        document.add_picture(tmpfile.name)
    
    # 保存文档
    document.save(full_path_doc)
    print(f"图片已追加到 {doc_name}")


In [7]:
## 实现根据项目和文件获取文件内容的方法

from docx import Document
import os

def get_file_content(project_name, file_name):
    """
    实现根据项目名和文件名获取文件内容的方法
    @param project_name:项目名，file_name：文件名
    @return 文件内容
    """
    # 构建文件的完整路径
    base_path = "/root/autodl-tmp/iquery项目/iquery云盘"
    file_path = os.path.join(project_name, file_name)
    full_path = os.path.join(base_path, file_path)+".doc"
    
    # 确保文件存在
    if not os.path.exists(full_path):
        return "文件不存在"
    
    try:
        # 加载文档
        doc = Document(full_path)
        content = []
        
        # 遍历文档中的每个段落，并收集文本
        for para in doc.paragraphs:
            content.append(para.text)
        
        # 将所有段落文本合并成一个字符串返回
        return '\n'.join(content)
    except Exception as e:
        return f"读取文件时发生错误: {e}"

# 3. 辅助函数

In [8]:
import ast
def extract_python(json_str):
    """
    解析JSON字符串中的Python代码
    """
    if isinstance(json_str, dict):
        return json_str['py_code']   
       # 使用literal_eval将字符串转换为字典
    dict_data = json.loads(json_str)
    # 提取'py_code'的值
    py_code_value = dict_data['py_code']
    # 提取并返回'py_code'的值
    return py_code_value

In [9]:
import ast

def extract_sql(json_str):
    """
    解析JSON字符串中的SQL代码
    """
    if isinstance(json_str, dict):
        return json_str['sql_query']
    # 使用literal_eval将字符串转换为字典
    dict_data = ast.literal_eval(json.dumps(json_str))

    # 提取'sql_query'的值
    sql_query_value = dict_data['sql_query']
    # 提取并返回'sql_query'的值
    return sql_query_value

In [10]:
def insert_fig_object(code_str):
    """
    为图片创建fig对象
    """
    global fig
    # 检查是否已存在 fig 对象的创建
    if 'fig = plt.figure' in code_str:
        return code_str  # 如果存在，则返回原始代码字符串

    # 定义可能的库别名和全名
    plot_aliases = ['plt.', 'matplotlib.pyplot.','plot']
    sns_aliases = ['sns.', 'seaborn.']

    # 寻找第一次出现绘图相关代码的位置
    first_plot_occurrence = min((code_str.find(alias) for alias in plot_aliases + sns_aliases if code_str.find(alias) >= 0), default=-1)
 
    # 如果找到绘图代码，则在该位置之前插入 fig 对象的创建
    if first_plot_occurrence != -1:
        plt_figure_index = code_str.find('plt.figure')
        if plt_figure_index != -1:
            # 寻找 plt.figure 后的括号位置，以确定是否有参数
            closing_bracket_index = code_str.find(')', plt_figure_index)
            # 如果找到了 plt.figure()，则替换为 fig = plt.figure()
            modified_str = code_str[:plt_figure_index] + 'fig = ' + code_str[plt_figure_index:closing_bracket_index + 1] + code_str[closing_bracket_index + 1:]
        else:
            modified_str = code_str[:first_plot_occurrence] + 'fig = plt.figure()\n' + code_str[first_plot_occurrence:]
        return modified_str
    else:
        return code_str  # 如果没有找到绘图代码，则返回原始代码字符串

# 4. 外部函数

In [11]:
def python_inter(py_code):
    """
    用于对chatbi数据库中各张数据表进行查询和处理，并获取最终查询或处理结果。
    :param py_code: 字符串形式的Python代码，用于执行对chatbi数据库中各张数据表进行操作
    :return：代码运行的最终结果
    """    
    # 添加图片对象，如果存在绘图代码，则创建fig对象
    py_code = insert_fig_object(py_code)
    global_vars_before = set(globals().keys())
    try:
        exec(py_code, globals())
    except Exception as e:
        return str(e)
    global_vars_after = set(globals().keys())
    new_vars = global_vars_after - global_vars_before
    if new_vars:
        result = {var: globals()[var] for var in new_vars}
        return str(result)
    else:
        try:
            return str(eval(py_code, globals()))
        except Exception as e:
            return "已经顺利执行代码"

In [12]:
def sql_inter(sql_query):
    """
    用于获取iquery数据库中各张表的有关相关信息，\
    核心功能是将输入的SQL代码传输至iquery数据库所在的MySQL环境中进行运行，\
    并最终返回SQL代码运行结果。需要注意的是，本函数是借助pymysql来连接MySQL数据库。
    :param sql_query: 字符串形式的SQL查询语句，用于执行对MySQL中iquery数据库中各张表进行查询，并获得各表中的各类相关信息
    :return：sql_query在MySQL中的运行结果。
    """
    
    mysql_pw = "iquery_agent"
    
    connection = pymysql.connect(
            host='localhost',  # 数据库地址
            user='iquery_agent',  # 数据库用户名
            passwd=mysql_pw,  # 数据库密码
            db='iquery',  # 数据库名
            charset='utf8'  # 字符集选择utf8
        )
    
    try:
        with connection.cursor() as cursor:
            # SQL查询语句
            sql = sql_query
            cursor.execute(sql)

            # 获取查询结果
            results = cursor.fetchall()

    finally:
        connection.close()
    
    
    return json.dumps(results)

In [13]:
def extract_data(sql_query,df_name):
    """
    用于借助pymysql，将MySQL中的iquery数据库中的表读取并保存到本地Python环境中。
    :param sql_query: 字符串形式的SQL查询语句，用于提取MySQL中iquery数据库中的某张表。
    :param df_name: 将MySQL数据库中提取的表格进行本地保存时的变量名，以字符串形式表示。
    :return：表格读取和保存结果
    """
    
    mysql_pw = "iquery_agent"
    
    connection = pymysql.connect(
            host='localhost',  # 数据库地址
            user='iquery_agent',  # 数据库用户名
            passwd=mysql_pw,  # 数据库密码
            db='iquery',  # 数据库名
            charset='utf8'  # 字符集选择utf8
        )
    
    
    globals()[df_name] = pd.read_sql(sql_query, connection)
    
    return "已成功完成%s变量创建" % df_name

# 5. 核心函数

In [14]:
def auto_functions(functions_list):
    """
    Chat模型的functions参数编写函数
    :param functions_list: 包含一个或者多个函数对象的列表；
    :return：满足Chat模型functions参数要求的functions对象
    """
    def functions_generate(functions_list):
        # 创建空列表，用于保存每个函数的描述字典
        functions = []
        # 对每个外部函数进行循环
        for function in functions_list:
            # 读取函数对象的函数说明
            function_description = inspect.getdoc(function)
            # 读取函数的函数名字符串
            function_name = function.__name__

            system_prompt = '以下是某的函数说明：%s' % function_description
            user_prompt = '根据这个函数的函数说明，请帮我创建一个JSON格式的字典，这个字典有如下5点要求：\
                           1.字典总共有三个键值对；\
                           2.第一个键值对的Key是字符串name，value是该函数的名字：%s，也是字符串；\
                           3.第二个键值对的Key是字符串description，value是该函数的函数的功能说明，也是字符串；\
                           4.第三个键值对的Key是字符串parameters，value是一个JSON Schema对象，用于说明该函数的参数输入规范。\
                           5.输出结果必须是一个JSON格式的字典，只输出这个字典即可，前后不需要任何前后修饰或说明的语句' % function_name

            response = client.chat.completions.create(
                              model="gpt-3.5-turbo",
                              messages=[
                                {"role": "system", "content": system_prompt},
                                {"role": "user", "content": user_prompt}
                              ]
                            )
            json_function_description=json.loads(response.choices[0].message.content.replace("```","").replace("json",""))
            json_str={"type": "function","function":json_function_description}
            functions.append(json_str)
        return functions
    
    max_attempts = 4
    attempts = 0

    while attempts < max_attempts:
        try:
            functions = functions_generate(functions_list)
            break  # 如果代码成功执行，跳出循环
        except Exception as e:
            attempts += 1  # 增加尝试次数
            print("发生错误：", e)
            if attempts == max_attempts:
                print("已达到最大尝试次数，程序终止。")
                raise  # 重新引发最后一个异常
            else:
                print("正在重新运行...")
    return functions

In [15]:
from IPython.display import display, Markdown, Code
def check_code_run(messages,
                   project_name,
                   doc_name,
                   functions_list=None,
                   tools=None,
                   model="gpt-3.5-turbo",
                   auto_run = True):
    """
    能够自动执行外部函数调用的对话模型
    :param messages: 必要参数，字典类型，输入到Chat模型的messages参数对象
    :param prject_name: 项目名
    :param doc_name: 文件名
    :param functions_list: 可选参数，默认为None，可以设置为包含全部外部函数的列表对象
    :param model: Chat模型，可选参数，默认模型为gpt-3.5-turbo
    :return：Chat模型输出结果
    """
    code = None
    # 如果没有外部函数库，则执行普通的对话任务
    if functions_list == None:
        response = client.chat.completions.create(
                        model=model,
                        messages=messages,
                        )
        response_message = response.choices[0].message
        final_response = response_message.content
        
    # 若存在外部函数库，则需要灵活选取外部函数并进行回答
    else:

        # 创建外部函数库字典
        available_functions = {func.__name__: func for func in functions_list}

        # 第一次调用大模型
        response = client.chat.completions.create(
                        model=model,
                        messages=messages,
                        tools=tools,
                        tool_choice="auto", )
        response_message = response.choices[0].message
        tool_calls = response_message.tool_calls
        if tool_calls:
            messages.append(response_message) 
            for tool_call in tool_calls:
                function_name = tool_call.function.name
                function_to_call = available_functions[function_name]
                function_args = json.loads(tool_call.function.arguments)
                #########################################
                    # 创建code对象
                if 'sql_inter' in function_name or 'extract_data' in function_name:
                    code = extract_sql(function_args)
                    # 将代码字符串转换为Markdown格式
                    markdown_code = f"```sql\n{code}\n```"
                else:
                    code = extract_python(function_args)
                    
                    code = insert_fig_object(code)
                    # 将代码字符串转换为Markdown格式
                    markdown_code = f"```python\n{code}\n```"
                #########################################
              
                if auto_run == False: 
                    print("已将问题转化为如下代码准备运行：")
                    # 在Jupyter Notebook中展示Markdown格式的代码
                    display(Markdown(markdown_code))
                
                    res = input('是否确认并继续执行（1），或者退出本次运行过程（2）')
                    if res == '2':
                        print("终止运行")
                        return None
                    else:
                        print("正在执行代码，请稍后...")
                        
                function_response = function_to_call(**function_args)
                messages.append(
                    {
                        "tool_call_id": tool_call.id,
                        "role": "tool",
                        "name": function_name,
                        "content": function_response,
                    }
                ) 
            ## 第二次调用模型
            second_response = client.chat.completions.create(
                model=model,
                messages=messages,
            ) 
            # 获取最终结果
            final_response = second_response.choices[0].message.content
        else:
            final_response = response_message.content
    del messages
    ##################################
    if code:
        substrings = ['plt.', 'matplotlib.pyplot.', 'sns.', 'seaborn.','plot']
        if any(substring in code for substring in substrings):
            global fig
            append_img_in_doc(project_name, doc_name, img=fig)
            print("图片保存成功！")
    ################################
                
    return final_response

In [16]:
import tiktoken

def chat_with_inter(functions_list=None, 
                    prompt="你好呀", 
                    model="gpt-3.5-turbo", 
                    system_message=[{"role": "system", "content": "你是一个智能助手。"}], 
                    auto_run = True):
    
    print("正在初始化外部函数库")
    # 创建函数列表对应的参数解释列表
    tools = auto_functions(functions_list)
    print("外部函数库初始化完成")
    project_name = input("请输入当前分析项目名称：")
    folder_name = create_directory(project_name)
    print("已完成数据分析文件创建")
    doc_name = input("请输入当前分析阶段，如数据探索阶段和理解、数据清洗阶段等：")
    doc_name += '问答'
    print("好的，即将进入交互式分析流程")
    # 多轮对话阈值
    if 'gpt-4' in model:
        tokens_thr = 6000
    elif '16k' in model:
        tokens_thr = 14000
    else:
        tokens_thr = 3000
    
    messages = system_message
    ## 完成给用户输入的问题赋值
    user_input = prompt
    messages.append({"role": "user", "content": prompt})
    ## 计算token大小
    embedding_model = "text-embedding-ada-002"
    # 模型对应的分词器（TOKENIZER）
    embedding_encoding = "cl100k_base"
    encoding = tiktoken.get_encoding(embedding_encoding)
    tokens_count = len(encoding.encode((prompt + system_message[0]["content"])))
    
    while True:           
        answer = check_code_run(messages,
                                project_name=project_name,
                                doc_name = doc_name,
                                functions_list=functions_list, 
                                tools=tools,
                                model=model, 
                                auto_run = auto_run)
        
        
        print(f"模型回答: {answer}")
        
        #####################判断是否记录文档 start#######################
        while True:
            record = input('是否记录本次回答（1），还是再次输入问题并生成该问题答案（2）')
            if record == '1':
                
                Q_temp = 'Q:' + user_input
                A_temp = 'A:' + answer
                
                append_in_doc(folder_name=project_name, 
                                               doc_name=doc_name, 
                                               qa_string=Q_temp)
                append_in_doc(folder_name=project_name, 
                                               doc_name=doc_name, 
                                               qa_string=A_temp)
                
                # 记录本轮问题答案
                messages.append({"role": "assistant", "content": answer})
                break
            else:
                print('好的，请再次输入问题')
                user_input = input()
                messages[-1]["content"] = user_input
                answer = check_code_run(messages, 
                                        project_name=project_name,
                                        doc_name = doc_name,
                                        functions_list=functions_list,
                                        tools=tools,
                                        model=model,                                       
                                        auto_run = auto_run)  
                
                print(f"模型回答: {answer}")
                
        ########################判断是否记录文档 stop #######################
        

        # 询问用户是否还有其他问题
        user_input = input("您还有其他问题吗？(输入退出以结束对话): ")
        if user_input == "退出":
            del messages
            break

        # 记录新一轮问答
        messages.append({"role": "assistant", "content": answer})
        messages.append({"role": "user", "content": user_input})
        
        # 计算当前总token数
        tokens_count += len(encoding.encode((answer + user_input)))
        
        # 删除超出token阈值的对话内容
        while tokens_count >= tokens_thr:
            tokens_count -= len(encoding.encode(messages.pop(1)["content"]))

In [17]:
functions_list = [extract_data, python_inter]

In [18]:
chat_with_inter(functions_list=functions_list, 
                prompt="请将iquery数据库中的user_demographics表保存到本地Python环境中，并命名为user_demographics_df", 
                model="gpt-3.5-turbo-16k", 
                system_message=[{"role": "system", "content": md_content}], 
                auto_run = False)

正在初始化外部函数库
外部函数库初始化完成


请输入当前分析项目名称： iquery项目总结


目录 iquery项目总结 已存在
已完成数据分析文件创建


请输入当前分析阶段，如数据探索阶段和理解、数据清洗阶段等： 数据可视化


好的，即将进入交互式分析流程
已将问题转化为如下代码准备运行：


```sql
SELECT * FROM user_demographics
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...


  globals()[df_name] = pd.read_sql(sql_query, connection)


模型回答: 已将iquery数据库中的user_demographics表保存到本地Python环境中，并命名为user_demographics_df。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  统计一下user_demographics_d数据集中有多少条数据


已将问题转化为如下代码准备运行：


```python
len(user_demographics_df)
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: user_demographics数据集中共有5353条数据。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  解释一下user_demographics_d数据集的字段


模型回答: user_demographics数据集中的字段解释如下：

1. customerID：客户ID，user_demographics数据表的主键，由数字和字母组成。

2. gender：用户的性别，取值为Female（女性）或Male（男性）。

3. SeniorCitizen：是否为老人，取值为0（不是）或1（是）。

4. Partner：用户是否有伴侣，取值为Yes（有）或No（没有）。

5. Dependents：用户经济是否独立，往往用于判断用户是否已经成年，取值为Yes（有）或No（没有）。

这些字段记录了用户的个人基本情况，包括性别、年龄状况、是否结婚以及是否经济独立等。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  iquery数据库中有哪些表？


已将问题转化为如下代码准备运行：


```python
tables = engine.table_names()
tables
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: 我需要连接到数据库以获取表名。请提供连接到iquery数据库的相关信息，例如主机名、端口号、用户名和密码等。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 2


好的，请再次输入问题


 查看一下iquery数据库下有哪些表？


已将问题转化为如下代码准备运行：


```python
tables = engine.table_names()
tables
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: 在当前环境下无法访问iquery数据库，因此无法查看数据库中的表。请确保已经正确连接到iquery数据库，并且具有访问权限。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 查看一下MySQL数据中iquery数据库下有哪些表？


好的，请再次输入问题


 查看一下MySQL数据中iquery数据库下有哪些表？


已将问题转化为如下代码准备运行：


```python
tables = engine.table_names()
tables
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: I'm sorry, it seems that there was an error in accessing the database. Please make sure that you have established a connection to the iquery database and try again.


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  我想分析一下电信用户流失情况，需要到iquery中哪些表？


模型回答: 要分析电信用户的流失情况，您需要访问iquery数据库中的以下表：

1. user_demographics：用户的个人基本情况，包括性别、年龄状况、是否结婚以及是否经济独立等。

2. user_services：用户订购的电信服务情况，包括电话服务、网络服务以及其他可能的增值服务。

3. user_payments：用户的支付情况，包括支付方式、合同类型以及每月和总消费金额等。

4. user_churn：用户的流失情况，记录了用户是否已流失。

通过分析这些表的数据，您可以了解用户的基本特征、订购的服务类型、支付情况以及是否存在流失的情况，从而进行相关的用户流失分析。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  统计一下user_churn表中用户流失的占比


已将问题转化为如下代码准备运行：


```python
churn_count = user_churn_df['Churn'].value_counts()
churn_percentage = churn_count['Yes'] / churn_count.sum()
churn_percentage
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: 在计算用户流失占比之前，请先将user_churn表保存到本地Python环境中，并命名为user_churn_df。然后可以使用以下代码来计算用户流失的占比：

```python
churn_count = user_churn_df['Churn'].value_counts()
churn_percentage = churn_count['Yes'] / churn_count.sum()
churn_percentage
```

请先执行以上步骤，再计算用户流失的占比。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  请将iquery数据库中的user_churn表保存到本地Python环境中，并命名为user_churn_df


已将问题转化为如下代码准备运行：


```sql
SELECT * FROM user_churn
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: 已将iquery数据库中的user_churn表保存到本地Python环境中，并命名为user_churn_df。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  统计一下user_churn_df中用户流失的占比


已将问题转化为如下代码准备运行：


```python
churn_count = user_churn_df['Churn'].value_counts()
churn_percentage = churn_count['Yes'] / churn_count.sum()
churn_percentage
```

是否确认并继续执行（1），或者退出本次运行过程（2） 1


正在执行代码，请稍后...
模型回答: 根据user_churn_df数据集统计，用户流失的占比为26.76%。其中，用户流失的数量为1521个，用户总数为5684个。

请注意，用户流失占比的计算是基于user_churn_df数据集的统计，具体的占比可能会因数据集的更新和样本的选择而有所不同。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  根据你掌握的数据情况，如果我想减少电信用户的流失，你有什么建议？


模型回答: 根据数据情况，如果您想减少电信用户的流失，我有以下建议：

1. 提供优质的客户服务：建立一个高效和友好的客户服务团队，及时回应用户的问题和需求，提供满意的解决方案，以提升用户的满意度和忠诚度。

2. 提供个性化的服务：了解用户的需求和偏好，根据其特定需求提供个性化的服务和定制化的产品，增加用户的粘性和满意度。

3. 提供具有竞争力的价格：通过正常的市场竞争策略，提供有竞争力的价格和优惠活动，吸引用户留存并吸引新用户。

4. 提供高质量的网络和技术支持：保持网络的稳定性和速度，提供及时的技术支持，确保用户可以顺畅地使用电信服务。

5. 定期进行用户调研和反馈收集：定期进行用户满意度调研和反馈收集，了解用户的意见和反馈，及时改进和优化服务，提升用户的体验。

6. 推出具有吸引力的增值服务：开发具有吸引力和差异化的增值服务，如网络电视、在线娱乐、智能家居等，以增加用户对服务的依赖性和满意度。

7. 加强用户教育和沟通：定期向用户提供相关信息、产品更新和优惠活动，加强与用户的沟通和互动，增加用户的参与感和忠诚度。

这些建议将有助于提高用户的满意度、忠诚度和留存率，减少电信用户的流失。然而，具体的策略和措施需要根据您的业务情况和目标受众做出具体调整和决策。


是否记录本次回答（1），还是再次输入问题并生成该问题答案（2） 1


内容已追加到 数据可视化问答
内容已追加到 数据可视化问答


您还有其他问题吗？(输入退出以结束对话):  退出
