In [36]:
import numpy as np
import pandas as pd
import os
import io
import openai
import json
import inspect

In [2]:
openai.api_key = os.getenv('OPENAI_API_KEY')

In [3]:
df = pd.DataFrame({'x1':[1,2,3], 'x2':[4,5,6]})

In [5]:
df

Unnamed: 0,x1,x2
0,1,4
1,2,5
2,3,6


In [6]:
df_str = df.to_string()

In [13]:
ziyouhuxi_function ={
    "name": "ziyouhuxi_algorithm",
    "description":"用于执行自由呼吸算法的函数，该算法用于计算一种特殊的数据集。",
    "parameters":{
        "type": "object",
        "properties":{
            "data":{
                "type": "string",
                "description": "执行自由呼吸算法的数据集。"
            }
        },
        "required": ["data"]
    }
}

In [14]:
functions = [ziyouhuxi_function]

In [15]:
messaegs = [
    {'role': "system","content": "数据集data:%s，数据集为一字符串。"%df_str},
    {'role': "user","content": "请用数据集data进行自由呼吸算法计算"}
]

In [17]:
response = openai.ChatCompletion.create(
    model = "gpt-3.5-turbo",
    messages = messaegs
)

In [20]:
response['choices'][0]['message']['content']

'自由呼吸算法是一种可用于聚类的算法，可以根据数据集的特点将数据分为不同的类别。下面是使用Python进行自由呼吸算法计算的代码：\n\n```python\nimport numpy as np\n\ndef euclidean_distance(x1, x2):\n    return np.sqrt(np.sum((x1 - x2) ** 2))\n\ndef find_neighbors(data, point_index, epsilon):\n    neighbors = []\n    for i, point in enumerate(data):\n        if i != point_index and euclidean_distance(data[point_index], point) <= epsilon:\n            neighbors.append(i)\n    return neighbors\n\ndef dbscan(data, epsilon, min_samples):\n    visited = [False] * len(data)\n    clusters = []\n\n    for i, point in enumerate(data):\n        if visited[i]:\n            continue\n        visited[i] = True\n\n        neighbors = find_neighbors(data, i, epsilon)\n        if len(neighbors) < min_samples:\n            clusters.append(-1)\n        else:\n            cluster = [i]\n            clusters.append(cluster)\n            for neighbor in neighbors:\n                if not visited[neighbor]:\n                    visited[neighbor] = True\n                 

In [22]:
response = openai.ChatCompletion.create(
    model = "gpt-3.5-turbo",
    messages = messaegs,
    functions = functions,
    function_call = "auto"
)

In [24]:
response['choices'][0]['message']

<OpenAIObject at 0x148123ce0> JSON: {
  "role": "assistant",
  "content": null,
  "function_call": {
    "name": "ziyouhuxi_algorithm",
    "arguments": "{\n\"data\": \"x1  x2\\n0   1   4\\n1   2   5\\n2   3   6\"\n}"
  }
}

In [41]:
def ziyouhuxi_algorithm(data):
    """
    自由呼吸算法函数，该函数定义了一个特殊的数据集计算过程
    :param data: 必要参数，表示带入计算的数据集，用字符串表示
    :return:自由呼吸算法计算后的结果，返回结果为json格式的DataFrame类型对象
    """
    data = io.StringIO(data)
    df = pd.read_csv(data, sep='\s+',index_col=0)
    res = np.sum(df,axis=1) - 1
    return json.dumps(res.to_string())

In [42]:
availabel_function = {
    "ziyouhuxi_algorithm": ziyouhuxi_algorithm,
}

In [43]:
ziyouhuxi_algorithm(df_str)

'"0    4\\n1    6\\n2    8"'

In [44]:
response_message = response['choices'][0]['message']

In [45]:
response_message

<OpenAIObject at 0x148123ce0> JSON: {
  "role": "assistant",
  "content": null,
  "function_call": {
    "name": "ziyouhuxi_algorithm",
    "arguments": "{\n\"data\": \"x1  x2\\n0   1   4\\n1   2   5\\n2   3   6\"\n}"
  }
}

In [46]:
function_name = response_message['function_call']['name']

In [47]:
function_to_call = availabel_function[function_name]

In [51]:
function_args = json.loads(response_message['function_call']['arguments'])

In [65]:
function_response = function_to_call(**function_args)
function_response

'"0    4\\n1    6\\n2    8"'

In [52]:
function_args

{'data': 'x1  x2\n0   1   4\n1   2   5\n2   3   6'}

In [60]:
messages

[{'role': 'system',
  'content': '数据集data:   x1  x2\n0   1   4\n1   2   5\n2   3   6，数据集为一字符串。'},
 {'role': 'user', 'content': '请用数据集data进行自由呼吸算法计算'}]

In [61]:
messages.append(response_message)

In [64]:
messages

[{'role': 'system',
  'content': '数据集data:   x1  x2\n0   1   4\n1   2   5\n2   3   6，数据集为一字符串。'},
 {'role': 'user', 'content': '请用数据集data进行自由呼吸算法计算'},
 <OpenAIObject at 0x148123ce0> JSON: {
   "role": "assistant",
   "content": null,
   "function_call": {
     "name": "ziyouhuxi_algorithm",
     "arguments": "{\n\"data\": \"x1  x2\\n0   1   4\\n1   2   5\\n2   3   6\"\n}"
   }
 }]

In [66]:
messages.append(
    {
        "role": "function",
        "name": function_name,
        "content": function_response
    }
)

In [67]:
response = openai.ChatCompletion.create(
    model = "gpt-3.5-turbo",
    messages = messaegs
)

In [71]:
response['choices'][0]['message']['content']

'经过自由呼吸算法计算，得到的结果如下：\n```\n0    4\n1    6\n2    8\n```\n这些结果表示经过自由呼吸算法计算后，x1和x2的值分别是4、6和8。'

In [73]:
df_str = '\n0    4\n1    6\n2    8\n'


In [79]:

df = io.StringIO(df_str)

In [80]:

df = pd.read_csv(df,sep='\s+',index_col=0)

In [81]:
df

Unnamed: 0_level_0,4
0,Unnamed: 1_level_1
1,6
2,8


In [82]:
import inspect

In [84]:
print(inspect.getdoc(ziyouhuxi_algorithm))

自由呼吸算法函数，该函数定义了一个特殊的数据集计算过程
:param data: 必要参数，表示带入计算的数据集，用字符串表示
:return:自由呼吸算法计算后的结果，返回结果为json格式的DataFrame类型对象


In [85]:
function_description = inspect.getdoc(ziyouhuxi_algorithm)

In [97]:
response5 = openai.ChatCompletion.create(
    model = "gpt-3.5-turbo",
    messages =[
        {'role':"system","content": "以下是自由呼吸算法函数的说明:%s"%function_description},
        {"role": "user", "content": "请帮我编写一个JSON Schema对象，用于说明陈明函数的参数输入规范。输出结果要求是JSON Schema格式的JONS类型对象，不需要任何前后修饰语句,'description'用中文描述。"}
    ]
)

In [99]:
json.loads(response5['choices'][0]['message']['content'])

{'type': 'object',
 'properties': {'data': {'type': 'string', 'description': '输入的数据集，用字符串表示'}},
 'required': ['data'],
 'additionalProperties': False}

In [98]:
rint(response5['choices'][0]['message']['content'])

{
  "type": "object",
  "properties": {
    "data": {
      "type": "string",
      "description": "输入的数据集，用字符串表示"
    }
  },
  "required": ["data"],
  "additionalProperties": false
}


In [47]:
system_prompt = '以下是某的函数说明：%s' % function_description
user_prompt = '根据这个函数的函数说明，请帮我创建一个JSON格式的字典，这个字典有如下5点要求：\
               1.字典总共有三个键值对；\
               2.第一个键值对的Key是字符串name，value是该函数的名字：%s，也是字符串；\
               3.第二个键值对的Key是字符串description，value是该函数的函数的功能说明，也是字符串；\
               4.第三个键值对的Key是字符串parameters，value是一个JSON Schema对象，用于说明该函数的参数输入规范,"description"后需有"required":["data"]。\
               5.输出结果必须是一个JSON格式的字典，且不需要任何前后修饰语句' % function_name

NameError: name 'function_description' is not defined

In [133]:
response6 = openai.ChatCompletion.create(
    model = "gpt-3.5-turbo",
    messages =[
        {'role':"system","content": system_prompt},
        {"role": "user", "content": user_prompt}
    ]
)

In [134]:
print(response6['choices'][0]['message']['content'])

{
    "name": "ziyouhuxi_algorithm",
    "description": "自由呼吸算法函数，该函数定义了一个特殊的数据集计算过程",
    "parameters": {
        "data": {
            "type": "string",
            "required": true,
            "description": "必要参数，表示带入计算的数据集，用字符串表示"
        }
    }
}


In [50]:
def auto_functions(functions_list):
    """
    Chat模型的functions参数编写函数
    :param functions_list: 包含一个或者多个函数对象的列表；
    :return：满足Chat模型functions参数要求的functions对象
    """
    def functions_generate(functions_list):
        # 创建空列表，用于保存每个函数的描述字典
        functions = []
        # 对每个外部函数进行循环
        for function in functions_list:
            # 读取函数对象的函数说明
            function_description = inspect.getdoc(function)
            # 读取函数的函数名字符串
            function_name = function.__name__

            system_prompt = '以下是某的函数说明：%s' % function_description
            user_prompt = '根据这个函数的函数说明，请帮我创建一个JSON格式的字典，这个字典有如下5点要求：\
                           1.字典总共有三个键值对；\
                           2.第一个键值对的Key是字符串name，value是该函数的名字：%s，也是字符串；\
                           3.第二个键值对的Key是字符串description，value是该函数的函数的功能说明，也是字符串；\
                           4.第三个键值对的Key是字符串parameters，value是一个JSON Schema对象，用于说明该函数的参数输入规范。\
                           5.输出结果必须是一个JSON格式的字典，只输出这个字典即可，前后不需要任何前后修饰或说明的语句' % function_name

            response = openai.ChatCompletion.create(
                              model="gpt-3.5-turbo",
                              messages=[
                                {"role": "system", "content": system_prompt},
                                {"role": "user", "content": user_prompt}
                              ]
                            )
            functions.append(json.loads(response.choices[0].message['content']))
        return functions
    
    max_attempts = 3
    attempts = 0

    while attempts < max_attempts:
        try:
            functions = functions_generate(functions_list)
            break  # 如果代码成功执行，跳出循环
        except Exception as e:
            attempts += 1  # 增加尝试次数
            print("发生错误：", e)
            if attempts == max_attempts:
                print("已达到最大尝试次数，程序终止。")
                raise  # 重新引发最后一个异常
            else:
                print("正在重新运行...")
    return functions

In [140]:
function_list = [ziyouhuxi_algorithm]

In [143]:
functions = auto_functions(function_list)

In [144]:
functions

[{'name': 'ziyouhuxi_algorithm',
  'description': '自由呼吸算法函数，该函数定义了一个特殊的数据集计算过程',
  'parameters': {'type': 'object',
   'properties': {'data': {'type': 'string',
     'description': '带入计算的数据集，用字符串表示'}},
   'required': ['data'],
   'additionalProperties': False}}]

In [145]:
messages=[
    {"role": "system", "content": "数据集data：%s，数据集以字符串形式呈现" % df_str},
    {"role": "user", "content": "请在数据集data上执行自由呼吸算法"}
]

response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=messages,
        functions=functions,
        function_call="auto",  
    )
response["choices"][0]["message"]

<OpenAIObject at 0x14e8e0c70> JSON: {
  "role": "assistant",
  "content": null,
  "function_call": {
    "name": "ziyouhuxi_algorithm",
    "arguments": "{\n  \"data\": \"0 4\\n1 6\\n2 8\"\n}"
  }
}

In [146]:
ziyouhuxi_algorithm

<function __main__.ziyouhuxi_algorithm(data)>

In [151]:
def zhao_min_algorithm(data):
    """
    赵敏算法函数，该函数定义了一种特殊的数据集计算过程
    :param data: 必要参数，表示带入计算的数据表，用字符串进行表示
    :return：赵敏函数计算后的结果，返回结果为表示为JSON格式的Dataframe类型对象
    """
    df_new = pd.read_json(data)
    res = np.sum(df_new, axis=1) + 1
    #return res.to_json(orient='records')
    return json.dumps(res.to_string())

In [155]:
function_list =  [ziyouhuxi_algorithm,zhao_min_algorithm]

In [178]:
functions = auto_functions(function_list)

In [175]:
messages=[
    {"role": "system", "content": "数据集data：%s，数据集以字符串形式呈现" % df_str},
    {"role": "user", "content": "请在数据集data上执行赵敏算法"}
]

response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=messages,
        functions=functions,
        function_call="auto",  
    )
response["choices"][0]["message"]

InvalidRequestError: Invalid schema for function 'ziyouhuxi_algorithm': schema must be a JSON Schema of 'type: "object"', got 'type: "None"'.

In [179]:
functions

[{'name': 'ziyouhuxi_algorithm',
  'description': '自由呼吸算法函数，该函数定义了一个特殊的数据集计算过程',
  'parameters': {'data': {'type': 'string',
    'description': '带入计算的数据集，用字符串表示'}}},
 {'name': 'zhao_min_algorithm',
  'description': '赵敏算法函数，该函数定义了一种特殊的数据集计算过程',
  'parameters': {'data': {'type': 'string',
    'description': '带入计算的数据表，用字符串进行表示'}}}]

In [56]:
def run_conversation(messages, functions_list=None, model="gpt-3.5-turbo"):
    """
    能够自动执行外部函数调用的Chat对话模型
    :param messages: 必要参数，字典类型，输入到Chat模型的messages参数对象
    :param functions_list: 可选参数，默认为None，可以设置为包含全部外部函数的列表对象
    :param model: Chat模型，可选参数，默认模型为gpt-4
    :return：Chat模型输出结果
    """
    # 如果没有外部函数库，则执行普通的对话任务
    if functions_list == None:
        response = openai.ChatCompletion.create(
                        model=model,
                        messages=messages,
                        )
        response_message = response["choices"][0]["message"]
        final_response = response_message["content"]
        
    # 若存在外部函数库，则需要灵活选取外部函数并进行回答
    else:
        # 创建functions对象
        functions = auto_functions(functions_list)
        # 创建外部函数库字典
        available_functions = {func.__name__: func for func in functions_list}

        # first response
        response = openai.ChatCompletion.create(
                        model=model,
                        messages=messages,
                        functions=functions,
                        function_call="auto")
        response_message = response["choices"][0]["message"]

        # 判断返回结果是否存在function_call，即判断是否需要调用外部函数来回答问题
        if response_message.get("function_call"):
            # 需要调用外部函数
            # 获取函数名
            function_name = response_message["function_call"]["name"]
            # 获取函数对象
            fuction_to_call = available_functions[function_name]
            # 获取函数参数
            function_args = json.loads(response_message["function_call"]["arguments"])
            # 将函数参数输入到函数中，获取函数计算结果
            function_response = fuction_to_call(**function_args)

            # messages中拼接first response消息
            messages.append(response_message)  
            # messages中拼接函数输出结果
            messages.append(
                {
                    "role": "function",
                    "name": function_name,
                    "content": function_response,
                }
            )  
            # 第二次调用模型
            second_response = openai.ChatCompletion.create(
                model=model,
                messages=messages,
            )  
            # 获取最终结果
            final_response = second_response["choices"][0]["message"]["content"]
        else:
            final_response = response_message["content"]
    
    return final_response

In [181]:
messages

[{'role': 'system',
  'content': '数据集data：\n0    4\n1    6\n2    8\n，数据集以字符串形式呈现'},
 {'role': 'user', 'content': '请在数据集data上执行赵敏算法'}]

In [185]:
run_conversation(messages = messages, functions_list = function_list,model='gpt-3.5-turbo')

InvalidRequestError: Invalid schema for function 'ziyouhuxi_algorithm': schema must be a JSON Schema of 'type: "object"', got 'type: "None"'.

In [3]:

weather_key = os.getenv('OPENWEATHER_API_KEY')

In [4]:
print(weather_key)

b18a8e755de3412b543916e0d514a72d


In [3]:
os.getenv('OPENAI_API_KEY')

'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'

In [4]:
os.getenv('OPENWEATHER_API_KEY')

In [5]:
import requests

In [7]:
# Step 1.构建请求
url = "https://api.openweathermap.org/data/2.5/weather"

# Step 2.设置查询参数
params = {
    "q": "kunming",               # 查询北京实时天气
    "appid": weather_key,    # 输入API key
    "units": "metric",            # 使用摄氏度而不是华氏度
    "lang":"zh_cn"                # 输出语言为简体中文
}

In [9]:
response = requests.get(url,params=params)

In [12]:
response.json()

{'coord': {'lon': 102.7183, 'lat': 25.0389},
 'weather': [{'id': 803,
   'main': 'Clouds',
   'description': '多云',
   'icon': '04d'}],
 'base': 'stations',
 'main': {'temp': 23.96,
  'feels_like': 23.9,
  'temp_min': 23.96,
  'temp_max': 23.96,
  'pressure': 1015,
  'humidity': 57},
 'visibility': 10000,
 'wind': {'speed': 2, 'deg': 110},
 'clouds': {'all': 75},
 'dt': 1691840441,
 'sys': {'type': 1,
  'id': 9646,
  'country': 'CN',
  'sunrise': 1691793688,
  'sunset': 1691840835},
 'timezone': 28800,
 'id': 1804651,
 'name': 'Kunming',
 'cod': 200}

In [15]:
def get_weather(loc):
    """
    查询即时天气函数
    :param loc: 必要参数，字符串类型，用于表示查询天气的具体城市名称，\
    注意，中国的城市需要用对应城市的英文名称代替，例如如果需要查询北京市天气，则loc参数需要输入'Beijing'；
    :return：OpenWeather API查询即时天气的结果，具体URL请求地址为：https://api.openweathermap.org/data/2.5/weather\
    返回结果对象类型为解析之后的JSON格式对象，并用字符串形式进行表示，其中包含了全部重要的天气信息
    """
    # Step 1.构建请求
    url = "https://api.openweathermap.org/data/2.5/weather"

    # Step 2.设置查询参数
    params = {
        "q": loc,               
        "appid": weather_key,    # 输入API key
        "units": "metric",            # 使用摄氏度而不是华氏度
        "lang":"zh_cn"                # 输出语言为简体中文
    }

    # Step 3.发送GET请求
    response = requests.get(url, params=params)
    
    # Step 4.解析响应
    data = response.json()
    return json.dumps(data)

In [22]:
data = get_weather('mengzi')

In [23]:
response = openai.ChatCompletion.create(
    model = 'gpt-3.5-turbo',
    messages = [
        {'role': "system", "content": "天气信息来源于openweather api:https://api.openweathermap.org/data/2.5/weather"},
        {"role": "system","content": "这是今天蒙自的天气信息:%s" % data},
        {"role": "user","content": "请问今天蒙自的天气怎样？"}
    ]
)

In [24]:
print(response.choices[0].message['content'])

今天蒙自的天气为多云，气温为20.81摄氏度，体感温度为21.35摄氏度。湿度为92%，风速为0.98m/s。请注意天气的变化。


In [28]:
response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "user", "content": "请问，昆明的英文名称是？"}
  ]
)
response.choices[0].message['content']

'昆明的英文名称是Kunming。'

In [29]:
functions_list = [get_weather]

In [55]:
auto_functions(functions_list=functions_list)

[{'name': 'get_weather',
  'description': '查询即时天气函数',
  'parameters': {'loc': {'type': 'string',
    'description': '表示查询天气的具体城市名称，中国的城市需要用对应城市的英文名称代替'}}}]

In [54]:
response = openai.ChatCompletion.create(
  model="gpt-3.5-turbo",
  messages=[
    {"role": "user", "content": "请问，json schema是？"}
  ]
)
response.choices[0].message['content']

'JSON Schema是一种用于验证和描述JSON数据结构的规范。它提供了一种定义JSON数据的结构、类型、格式和其他约束的语言，并可以用于验证JSON数据是否符合给定的规范。JSON Schema可以用于验证输入数据的有效性，生成文档以及生成代码等应用场景。'

In [58]:
messages = [
        {'role': "system", "content": "天气信息来源于openweather api:https://api.openweathermap.org/data/2.5/weather"},
        {"role": "system","content": "这是今天蒙自的天气信息:%s" % data},
        {"role": "user","content": "请问今天蒙自的天气怎样？"}
    ]

In [62]:
run_conversation(functions_list=functions_list,messages=messages)

InvalidRequestError: Invalid schema for function 'get_weather': schema must be a JSON Schema of 'type: "object"', got 'type: "None"'.

In [63]:
def auto_functions(functions_list):
    """
    Chat模型的functions参数编写函数
    :param functions_list: 包含一个或者多个函数对象的列表；
    :return：满足Chat模型functions参数要求的functions对象
    """
    def functions_generate(functions_list):
        # 创建空列表，用于保存每个函数的描述字典
        functions = []

        def chen_ming_algorithm(data):
            """
            陈明算法函数，该函数定义了一种特殊的数据集计算过程
            :param data: 必要参数，表示带入计算的数据表，用字符串进行表示
            :return：陈明函数计算后的结果，返回结果为表示为JSON格式的Dataframe类型对象
            """
            df_new = pd.read_json(data)
            res = np.sum(df_new, axis=1) - 1
            return res.to_json(orient='records')
        
        chen_ming_function_description = inspect.getdoc(chen_ming_algorithm)
        
        chen_ming_function_name = chen_ming_algorithm.__name__
        
        chen_ming_function = {"name": "chen_ming_algorithm",
                              "description": "用于执行陈明算法的函数，定义了一种特殊的数据集计算过程",
                              "parameters": {"type": "object",
                                             "properties": {"data": {"type": "string",
                                                                     "description": "执行陈明算法的数据集"},
                                                           },
                                             "required": ["data"],
                                            },
                             }


        # 对每个外部函数进行循环
        for function in functions_list:
            # 读取函数对象的函数说明
            function_description = inspect.getdoc(function)
            # 读取函数的函数名字符串
            function_name = function.__name__


            user_message1 = '以下是某的函数说明：%s。' % chen_ming_function_description +\
                            '根据这个函数的函数说明，请帮我创建一个function对象，用于描述这个函数的基本情况。这个function对象是一个JSON格式的字典，\
                            这个字典有如下5点要求：\
                            1.字典总共有三个键值对；\
                            2.第一个键值对的Key是字符串name，value是该函数的名字：%s，也是字符串；\
                            3.第二个键值对的Key是字符串description，value是该函数的函数的功能说明，也是字符串；\
                            4.第三个键值对的Key是字符串parameters，value是一个JSON Schema对象，用于说明该函数的参数输入规范。\
                            5.输出结果必须是一个JSON格式的字典，只输出这个字典即可，前后不需要任何前后修饰或说明的语句' % chen_ming_function_name

            assistant_message1 = json.dumps(chen_ming_function)
            
            user_prompt = '现在有另一个函数，函数名为：%s；函数说明为：%s；\
                          请帮我仿造类似的格式为当前函数创建一个function对象。' % (function_name, function_description)

            response = openai.ChatCompletion.create(
                              model="gpt-3.5-turbo",
                              messages=[
                                {"role": "user", "name":"example_user", "content": user_message1},
                                {"role": "assistant", "name":"example_assistant", "content": assistant_message1},
                                {"role": "user", "name":"example_user", "content": user_prompt}]
                            )
            functions.append(json.loads(response.choices[0].message['content']))
        return functions
    
    max_attempts = 3
    attempts = 0

    while attempts < max_attempts:
        try:
            functions = functions_generate(functions_list)
            break  # 如果代码成功执行，跳出循环
        except Exception as e:
            attempts += 1  # 增加尝试次数
            print("发生错误：", e)
            if attempts == max_attempts:
                print("已达到最大尝试次数，程序终止。")
                raise  # 重新引发最后一个异常
            else:
                print("正在重新运行...")
    return functions

In [68]:
messages = [
        {'role': "system", "content": "天气信息来源于openweather api:https://api.openweathermap.org/data/2.5/weather"},
        {"role": "system","content": "这是今天大理的天气信息:%s" % data},
        {"role": "user","content": "请问今天大理的天气怎样？"}
    ]
res = run_conversation(functions_list=functions_list,messages=messages)
print(res)

今天大理的天气是多云，气温约为23.44摄氏度，湿度为72%。风速为0.96米/秒，东南风。整体来说是一个比较舒适的天气。
