# <center>OpenAI在线大模型调用及微调方法

## <center>Ch.11 借助Google API库进行高效AI应用开发

&emsp;&emsp;在熟练掌握Function calling功能的高效实现方法，并且对外部工具API具有一定程度的技术认知之后，接下来我们尝试进行一些更具应用实践价值的AI项目开发。毫无疑问，对于初入门的AI应用开发人员来说，非常重要的一点是需要了解目前有哪些（和研发任务相关的）API可以调用，然后才能更进一步的基于这些API的功能设计AI应用程序的整体功能。基于此，本节我们将重点介绍谷歌云开发者工具库（谷歌API库）的使用方法。并详细介绍谷歌API库中办公相关API（如邮箱Gmail、在线文档Google Doc、在线表格Google sheet等）的调用方法，并在此基础上尝试进行AI高效办公的应用开发。

- 谷歌云Google Cloud与谷歌云API库

&emsp;&emsp;当然，这里我们首先需要介绍到底什么是谷歌云。类似于阿里云，谷歌云的功能定位最开始是提供一系列云存储和云计算服务，对标购买实体服务器，即客户不用支付高昂的本地购买服务器的成本，而可以根据实际的需求，在云端支付一定费用，并“虚拟出”一部分对应的存储空间了计算资源，用于数据的存储和计算。谷歌云的核心功能模块如Google Compute Engine模块就是专门用于提供云计算服务的模块，Google Cloud Storage功能模块则专门负责非关系型数据库存储、Google Cloud SQL功能模块专门负责关系型数据库服务。而伴随着云服务规模不断扩大，有越来越多的开发者活跃在云社区，并且云的功能本质其实就是在线服务器，而谷歌也在不断优化这个在线服务器能够提供的功能，目标是将其打造为在线的应用开发平台。逐渐的，谷歌云增加了更多的PaaS和IaaS组建，同时不断优化在线应用开发的流程，重视统一各类应用API格式及权限管理方法，外加在谷歌云上率先开源了谷歌系应用API，方便开发者直接在谷歌云上围绕谷歌系应用API进行二次开发，并鼓励开发者将新的应用的API按照统一制式和权限要求在谷歌云API库中进行开放，从而吸引更多的开发者。而时至今日，谷歌云早已不仅仅是云算力提供商，更是全球范围内最大的在线应用开发平台，有越来越多的开发者倾向于使用谷歌云进行快速应用开发，并且谷歌云上也诞生了数以万计m的应用，谷歌云API库也是目前最丰富的API库之一。

> 相当于歌云同时提供了强大的工具（开发工具）和强大的基础设施（云存储与云算力）。

> 为了更加稳定的使用谷歌云及调用相关API，建议全程开启魔法。

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201643640.png" alt="8180520f4562940eade33b594d87113" style="zoom:33%;" />

<center>谷歌云官网：https://cloud.google.com

- 借助谷歌云API库进行AI应用开发

&emsp;&emsp;而作为大模型应用开发的新人，先从谷歌云入手进行学习和AI应用开发，肯定是门槛最低、效率最高的方法。谷歌云上不仅有成百上千的各类应用的API，而且拥有统一的API制式和权限管理方法，调用过程非常方面，一个账号进行一次项目认证（如果需要的话）即可使用海量的API，外加详细完整的开发者文档（说明文档），更是极大程度降低了新人上手使用API的门槛。同时，谷歌云毕竟是功能完备的应用开发平台，如果不仅是尝试使用API进行前期的探索，而是希望真正意义上的完成企业级应用开发，也完全可以在谷歌云上进行。谷歌云不仅提供了完整的在线应用开发与发布流程，而且提供了（相对）廉价、稳定的云服务，开发者开发的应用程序可以直接在云端运行，并享受谷歌云提供的一整套应急、维护流程，以及实时可视化监控页面。

&emsp;&emsp;当然，截止目前，由于存在墙的限制，国内使用谷歌云进行开发还有一定门槛，但在一个浩如烟海的API库中进行技术尝试和技术畅想（畅想能够做到哪些事情并进行初步尝试），对于初学者来说仍然是意义极为重大的一件事。目前来看，对于大模型AI应用开发人员来说，很多时候技术想象力甚至是比技术实现能力更重要。

- 基于谷歌云的AI应用开发

&emsp;&emsp;因此，接下来，我们就先从Gmail API调用方法入手进行介绍，先介绍将邮箱接入Chat模型的方法，及尝试编写一个智能收发邮件的AI应用程序，并且借助这个过程为大家详细介绍谷歌云API库的获取和调用一般流程，方便后续同学们自行根据需求调用相应的API完成AI应用开发。需要说明的是，本节我们将重点介绍谷歌系办公应用的API使用方法，而之后的内容，我们还将尝试把这些API连成一个整体，尝试搭建定制化在线代码解释器，来自动执行数据分析并编写数据分析报告。因此，为了顺利的学习之后的内容，本小节内容至关重要。

In [8]:
import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")

import numpy as np
import pandas as pd

import json
import io
import inspect
import requests
import re

from gptLearning import *

### 1.谷歌云初步使用与Gmail API获取方法

&emsp;&emsp;接下来我们首先尝试在谷歌云中获取Gmail API。首先，我们需要使用我们的谷歌账号登陆谷歌云官网Google Cloud：https://cloud.google.com/ 。具体谷歌账号注册方法参考《【预习课】谷歌邮箱Gmail注册》教学内容，该小节介绍的注册的Gmail账号实际上就是谷歌账号。

- 项目（Project）创建过程

&emsp;&emsp;登陆后即可查看完整的谷歌云服务的条例，并且能够在主页领取90天内300$的免费试用金，如果有需要，我们可以使用这个免费额度租赁在线算力或支付API调用费用（和其他API类似，谷歌云的大部分API都有每日免费调用次数，超过次数则需要扣费）。这里我们点击左边功能栏的API和服务，进入谷歌云API库：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201227583.png" alt="a0f349d4d2d87f12ee9c36b6ec914a7" style="zoom:33%;" />

在我们首次尝试使用Google Cloud API库中API时，会提示需要先创建一个项目（project），然后再在具体的项目中申请开通API权限，即我们创建的这个项目本身也是API使用时的一个标识符。需要注意的是，“代码归属于应用、应用归属于项目”是最基本的开发逻辑，尽管对于算法研发人员来说，或许早就习惯了以建模完整流程代表一个开发周期，但更为一般的开发过程是以项目作为最小单位来执行的。而在若要在谷歌云上获取API，则必须先创建项目。d接下来我们点击右侧创建项目，进入项目创建页面：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201231477.png" alt="6e10907a50f484d871c11c40436e5e1" style="zoom:33%;" />

然后设置项目名称。项目名称一旦创建则无法修改，不过若只是用于API的功能测试，项目名称可以随便选取。另外需要注意的是每个账号可以创建的项目数量是有限的，默认每个账号配额是12个项目，若需要开通更多项目则需要单独申请：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201232387.png" alt="ac316576f3ab59b0681559a6380044c" style="zoom:33%;" />

- API启用

&emsp;&emsp;创建完项目之后，接下来即可在在某个项目中开通API和服务，再次强调，谷歌云的开发逻辑是先申明项目，然后才有“项目中的”API。这里在已启用的API和服务页面我们能够看到当前全部一经启用的API及API调用情况，若当前项目中没有API，则会如下图所示，并没有任何数据展示。这里我们点击+启用API和服务，为这个项目添加API：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201236144.png" alt="63bb907e175ed40827b353165313a15" style="zoom:33%;" />

接下来将进入API库的主页面，这里完整陈列了谷歌云上的一系列API，可以发现当前谷歌云API生态及其丰富。为了找到目标API——Gmail API，我们可以按照左侧的功能栏进行目标API的检索，也可以在居中的搜索栏中直接进行搜索。这里我们直接搜索Gmail：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201238842.png" alt="50a4dc9a3e6a58a0a4d60b28fb23bd3" style="zoom:33%;" />

根据搜索结果能够发现和Gmail相关的API有两个，第一个API是谷歌邮箱的API，第二个API是监控邮箱指标的工具API，这里我们选择第一个API，点击进入Gmail API页面：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201242465.png" alt="99e713b61d432630fb1af27cef70d65" style="zoom:33%;" />

能够看到有非常多关于Gmail API的说明。这里我们直接点击启用，Gmail API使用说明稍后进行介绍：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201648115.png" alt="25b10e46e1b8b40eeaa37240f471d94" style="zoom:33%;" />

- API凭据获取（或证书，Credentials）

&emsp;&emsp;首次使用Gmail API时会提示：为了使用该API，需要先创建凭据。这里的API凭据（Credentials，有时也译为证书）是一种身份验证方法，凭据本身是一个包含特定信息的文件，而只有拿到API权限相匹配的凭据，才能顺利调用API。这里的凭据的功能非常类似于此前我们为了调用OpenAI所使用的API-Key，只不过对于谷歌云来说，需要通过一套权限管理系统管理数量庞大的API，这套权限管理系统相比OpenAI的API-Key来说，会更加复杂。

&emsp;&emsp;那Gmail API的凭据到底是什么呢，由应该如何获取呢？首先我们需要知道的是，在谷歌云中，为了管理数量庞大的API，谷歌云设置了三种不同复杂程度各不相同的凭据类型，用于去调用不同类型的API。总的来说，谷歌云的设置了三种凭据，分别是API 密钥、OAuth 2.0 客户端 ID以及服务账户密钥。各类不同的密钥对应的API类型如下：      

（1）**API 密钥**：这是一个简单的字符串，可以用来访问不需要用户身份验证的 API。例如，如需调用一个公开的 Google API（如 Google Maps API），那么最少只需要一个 API 密钥。

（2）**OAuth 2.0 客户端 ID**：这是一个更复杂的凭据，用于访问需要用户身份验证的 API。例如，如需要访问用户的 Gmail 数据，就需要使用 OAuth 2.0 客户端 ID 来获取用户的授权。

（3）**服务账户密钥**：这是一个用于服务器到服务器交互的凭据。例如，如果当前应用是一个后端服务，需要访问 Google Cloud Storage，就需要一个服务账户密钥。

简单来说，API 密钥像是口令，口令无误则可以使用API。而OAuth 2.0 客户端 ID验证则是用于验证当前账户是否具有某些权限，例如如果B用户授权给开发账户A可以使用其Gmail数据，那么开发者A才可以使用Gmail API调用B用户的邮箱，换而言之，开发者A才能够使用Gmail API。而若要完成B用户邮箱对开发者A的授权，就需要满足某些规范，这些规范被称为OAuth 2.0。而一旦授权完成，开发者A就将获得一个json格式数据对象，这个就是未来开发者A可以调用B用户邮箱的凭据。需要注意的是，课程中将主要涉及API密钥和OAuth 2.0凭据的获取和使用，而服务账户密钥则是一种特殊账户——服务账户的验证方法，主要在后端程序开发时会用到，课程中不会涉及后端开发，因此也不会涉及服务账户密钥的获取和使用，这里我们就不过多进行介绍了。

&emsp;&emsp;当然，尽管谷歌云的API凭据体系会比较复杂，但实际我们在申请调用API时，系统会根据我们调用的API类型提醒需要获取的凭据类型，并不需要我们来进行凭据类型的选取，我们只需要按照提示一步步操作即可。这里在申请使用Gmail API时，系统会提示我们创建凭据，调用Gmail API需要创建OAuth 2.0凭据，我们点击创建凭据即可进入凭据创建流程：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201244607.png" alt="9cb3446ce0f1099565a963ec0a5c790" style="zoom:33%;" />

需要注意的是，凭据就像双方进行的授权，对于Gmail API来说凭据就是用户对开发者的授权，具体来说是用户使用的某个应用（例如Gmail）对某个应用程序进行授权，所以整个授权过程处处都会涉及应用和应用程序相关的条例。例如第一步中，我们需要选择Gmail API，用于说明这个程序是专门调用Gmail的程序，并且需要选择用户数据，表明这个应用程序接下来会申请调用谷歌用户的Gmail应用程序的数据，而不是Gmail系统的后台数据：

> 在谷歌云规定的开发流程中，各关键词的包含关系是项目>应用程序>API。目前的凭据就是某个应用程序调用Gmail的凭据，这个应用程序的名称会在下一步进行定义。所以这个创建凭据的过程其实也就是创建应用程序的过程。而我们后续在调用Gmail API时，其实就是在围绕这个应用程序在进行开发，这个应用程序也就是API验证的一个环节。

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201418706.png" alt="22f2e20e8eb53d97d971ab5fb5f1284" style="zoom:33%;" />

然后需要自定义这个应用程序的名称，并且需要填写开发者相关信息（相当于契约的一方的详细信息）：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201420150.png" alt="34a7362bcb85a1c054d24f901ede58f" style="zoom:33%;" />

接下来是关于这个应用程序的一些使用范围的限制，这部分可以先直接跳过，后面也可以再进行调整：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201420266.png" alt="3ca0bb5985662127ae6a4e237abc3ce" style="zoom:33%;" />

最后就是填写OAuth客户端ID页面，从实际填写信息上来看，这个页面是用于说明当前应用（My-Autogmail-test）的应用类型，及其相关的详细信息，而由于本身这个应用是遵循OAuth协议的，并且当我们填写完这一页内容之后这个应用会获得一个独一无二的ID，因此这个页面被称为OAuth客户端ID创建页面，而客户端ID实际上就是My-Autogmail-test应用程序的表示，因此我们也可以说整个凭据授权的过程也是围绕着这个客户端ID进行授权。

&emsp;&emsp;本页面具体需要填写的信息，主要需要选择应用类型。由于我们是在Python环境中调用Gmail，而Python环境中最便捷的调用方式就是运行一个本地的web服务器，这样用户就可以在浏览器中打开授权页面，并且Google可以将用户重定向回你的应用，以此完成双向的授权。因此这里我们选择Web应用，然后选择一个客户端名称，然后填写已获授权的重定向URI，用于在本地进行授权之后重新定向并回到我们的应用程序，由于是本地发起的请求，因此是localhost，端口号的话可以自行进行编写：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201424465.png" alt="c6cb262f4d427c6389a563e8ed13d48" style="zoom:33%;" />

> 关于已获授权的重定向URI，其实是翻译问题导致难以理解。其实本质上是当我们已经完成这份OAuth授权文件的编写之后，相当于是拿到了应用程序已经签字的合同文本，但还需要有个授权的过程、即授权方在合同上签字的过程。那应该如何执行这个授权过程呢？最好的方法就是由这个应用发起请求，然后通过某个端口打开本地浏览器，然后再让授权方在浏览器中输入账户信息（例如Gmail账户信息）并进行确认，从而完成授权，而本地Web应用程序发起请求并打开浏览器这个过程并不复杂，需要说明的是当用户授权完成后需要往哪个本地端口发送已经授权完成的信息，而这个重定向URI，就是负责这方面的信息说明。

编写完成后，即可获取当前客户端的ID，以及一个可以下载的凭据证书。这里我们直接点击下载：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201752814.png" alt="512f61abf5dba5240fd138cbd7eab0f" style="zoom:33%;" />

这个下载到本地的凭据是个json格式文件，需要妥善保存。这里我们将其改名为credentials-web1.json，并保存到当前Jupyter主空间内方便后续程序对其进行读取：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201758776.png" alt="0f29a41437592b9bf2e4e2162fdfa75" style="zoom:60%;" />

此外，如果在首次完成客户端创建时没下载凭据，之后也可以通过如下方式下载，先点击客户端：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201426203.png" alt="b42f0ac3643486a81fc88e1ec94e1ba" style="zoom:33%;" />

然后点击此处进行下载：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201428675.png" alt="7b0f676c2121d2582d41308a2f42019" style="zoom:33%;" />

至此，我们就获得了当前应用程序的OAuth授权凭证

- OAuth的客户授权

&emsp;&emsp;但是，当前这个凭证相当于是单方签字的合同，我们还需要完成用户的授权，才算是两方都签了合同，合同才能生效，我们才能够利用这个应用程序去调用用户的Gmail。

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201805687.png" alt="4ddf461a4b9058706101d7c9d2dace5" style="zoom:33%;" />

用户授权的步骤总共分两步，其一是我们需要记录我们的目标用户，其次是我们需要向目标用户发送确认请求。首先我们需要在左侧的OAuth同意屏幕页面内确认当前Project的“内测”用户有哪些，这里我们点击ADD USERS，即可进入页面标记我们的目标用户：

> 这里需要注意，有另一种说法是OAuth的客户授权只需要执行第二步即可，执行完第二步之后第一步会自动完成。但根据实际测试情况来看，目前的谷歌云API OAuth的客户授权必须要手动ADD USERS才能顺利执行后续步骤。

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201809551.png" alt="a646a58f90b218856e32796ce2af6e7" style="zoom:33%;" />

这里需要注意的是，每个新注册的project都是测试状态，此时最多只能添加100位用户，且必须要添加谷歌账号。并且需要注意，这里允许用户填写自己的谷歌账号，且此时无需审核时间，可以直接进入到第二步发送请求和验证的环节。而如果填写的是其他账号，则需要几天的审核时间。这里我们直接填写自己的谷歌账号（邮箱）并点击保存：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307201814750.png" alt="f7e68118d741188f60880a1f1afac94" style="zoom:33%;" />

由于使用自己的账号作为应用程序的客户无需审核，此时我们可以直接进入到下一步，即在程序中发送请求验证，具体验证过程如下。根据官网帮助文档的说明，首先我们可以在本地创建一个名为quickstart.py的代码文件，并输入如下代码：

In [None]:
from __future__ import print_function

import os.path

from google.auth.transport.requests import Request
from google.oauth2.credentials import Credentials
from google_auth_oauthlib.flow import InstalledAppFlow
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError

# If modifying these scopes, delete the file token.json.
SCOPES = ['https://www.googleapis.com/auth/gmail.readonly']


def main():
    """Shows basic usage of the Gmail API.
    Lists the user's Gmail labels.
    """
    creds = None
    # The file token.json stores the user's access and refresh tokens, and is
    # created automatically when the authorization flow completes for the first
    # time.
    if os.path.exists('token.json'):
        creds = Credentials.from_authorized_user_file('token.json', SCOPES)
    # If there are no (valid) credentials available, let the user log in.
    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file(
                'credentials.json', SCOPES)
            creds = flow.run_local_server(port=0)
        # Save the credentials for the next run
        with open('token.json', 'w') as token:
            token.write(creds.to_json())

    try:
        # Call the Gmail API
        service = build('gmail', 'v1', credentials=creds)
        results = service.users().labels().list(userId='me').execute()
        labels = results.get('labels', [])

        if not labels:
            print('No labels found.')
            return
        print('Labels:')
        for label in labels:
            print(label['name'])

    except HttpError as error:
        # TODO(developer) - Handle errors from gmail API.
        print(f'An error occurred: {error}')


if __name__ == '__main__':
    main()

这段代码有两点需要注意，其一是需要将credentials.json替换成本地下载下来的授权凭证，即替换为credentials-web1.json，其二就是需要将端口号修改为重定向时设置的端口号，其三就是需要提前安装好调用谷歌API相关的库，具体安装代码如下，在命令行中使用pip工具进行安装即可：

In [None]:
! pip install --upgrade google-auth google-auth-httplib2 google-auth-oauthlib google-api-python-client requests

准备工作完成后，即可执行如下代码运行该py文件：

In [1]:
%run quickstart.py

Please visit this URL to authorize this application: https://accounts.google.com/o/oauth2/auth?response_type=code&client_id=683609230731-ueq9rcljo7t56bnkt465dgd07h0m96rj.apps.googleusercontent.com&redirect_uri=http%3A%2F%2Flocalhost%3A9900%2F&scope=https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fgmail.readonly&state=899lehBTuoDZ9io68MAuS7AUD9OQPg&access_type=offline
Labels:
CHAT
SENT
INBOX
IMPORTANT
TRASH
DRAFT
SPAM
CATEGORY_FORUMS
CATEGORY_UPDATES
CATEGORY_PERSONAL
CATEGORY_PROMOTIONS
CATEGORY_SOCIAL
STARRED
UNREAD


一般来说执行时会自动弹出授权页面，若没有自动弹出网页，也可以点击上方蓝色连接完成授权。弹出的网页内容如下：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307202040283.png" alt="acabdb452517eb839b02a7ab14442d4" style="zoom:33%;" />

注意，这里要选择（或者重新登录）我们在ADD USERS中添加的用户，进入到该用户的授权流程中。此时系统会提示当前应用（My-autoGmail-Test）是未验证的应用，是否授权。需要注意的是，这里授权的邮箱就是之后我们利用API调用的邮箱。这里点击继续：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307202041874.png" alt="f5048ccd85e764242e4a70b8e989ba4" style="zoom:33%;" />

然后会进行第二次提示是否进行授权，并提供详细的授权信息说明。这里点击继续：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307202043865.png" alt="a6a671804988213e0b2abd764cbf56b" style="zoom:33%;" />

至此，我们就完整的执行完了客户授权流程，授权结束后会弹出如下验证页面则说明验证成功：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307202045758.png" alt="c81d1683f7dca73208c97a78b9a0240" style="zoom:33%;" />

需要注意的是，这里由于应用本身是Web应用属性，因此整个客户授权过程都是基于Web端来执行。当执行完成后，本地会出现一个名为token.json的文件，该文件是用户授权之后的完整凭据（相当于双方都签了字），该凭据可以作为后续API使用时的凭据。

> Gmail API官方帮助文档：https://developers.google.com/gmail/api/guides

- 验证是否成功授权

&emsp;&emsp;一般来说返回上述页面则说明授权成功，不过我们可以再次quickstart.py，测试是否授权成功。需要注意的是，quickstart.py本身的功能是去获取邮箱中所有邮件标签，例如"Inbox"（收件箱）、"Sent"（已发送）、"Drafts"（草稿箱）和"Spam"（垃圾邮件）等，若能成功打印邮箱中邮件标签，则说明利用token.json凭据，我们能够顺利访问授权的Gmail邮箱。

In [25]:
%run quickstart.py

Labels:
CHAT
SENT
INBOX
IMPORTANT
TRASH
DRAFT
SPAM
CATEGORY_FORUMS
CATEGORY_UPDATES
CATEGORY_PERSONAL
CATEGORY_PROMOTIONS
CATEGORY_SOCIAL
STARRED
UNREAD


至此，我们就完整的完成了Gmail用户授权的全流程，接下来即可尝试使用Chat模型调用外部Gmail API进行智能邮件收发应用程序编写了。这里需要注意的是，Gmail API的OAuth授权过程的成功实现非常重要，之后我们还会使用谷歌云的其他API来构建更加复杂的AI应用程序，其中大多数都需要进行OAuth授权，而这里如果已经完成了授权，则该凭证也是可以应用于其他API调用的。

## 2.借助Gmail API构建智能邮件收发应用程序

#### 2.1 在Chat模型中添加查阅最近一封邮件能力

&emsp;&emsp;接下来，我们尝试将Gmail API接入Chat模型中。根据课程里面定义优化后的Function calling功能执行流程，在先确定了基本功能实现的目标之后，总共分四步进行，首先测试该外部函数功能是否具备可行性；第二步是先验证大语言模型是否具备解读外部函数结果和准确翻译外部函数参数的能力；第三步是据此创建能够调用外部工具API外部函数，并编写非常详细函数说明；第四步则是将定义好的外部函数带入run_conversation函数或者chat_with_model函数测试对话效果。这里我们首先尝试通过外部函数赋予Chat模型查阅最近一封邮件的功能，具体实现过程如下：

- Step 1.测试外部函数功能可行性

&emsp;&emsp;这里我们先测试能否通过调用Gmail API查阅最近得一封邮件信息，包括发件人、日期和邮件内容：

In [105]:
from googleapiclient.discovery import build
from google.oauth2.credentials import Credentials
import base64
import email
from email import policy
from email.parser import BytesParser

In [16]:
# 从本地文件中加载凭据
creds = Credentials.from_authorized_user_file('token.json')

# 创建 Gmail API 客户端
service = build('gmail', 'v1', credentials=creds)

# 列出用户的一封最新邮件
results = service.users().messages().list(userId='me', maxResults=1).execute()
messages = results.get('messages', [])

# 遍历邮件
for message in messages:
    # 获取邮件的详细信息
    msg = service.users().messages().get(userId='me', id=message['id']).execute()

    # 获取邮件头部信息
    headers = msg['payload']['headers']

    # 提取发件人、发件时间
    From, Date = "", ""
    for h in headers:
        name = h['name']
        if name.lower() == 'from':
            From = h['value']
        if name.lower() == 'date':
            Date = h['value']

    # 提取邮件正文
    if 'parts' in msg['payload']:
        part = msg['payload']['parts'][0]
        if part['mimeType'] == 'text/plain':
            data = part['body']["data"]
        else:
            data = msg['payload']['body']["data"]
    else:
        data = msg['payload']['body']["data"]
        
    data = data.replace("-","+").replace("_","/")
    decoded_data = base64.b64decode(data)
    str_text = str(decoded_data, "utf-8")
    msg_str = email.message_from_string(str_text)

    if msg_str.is_multipart():
        text = msg_str.get_payload()[0]  
    else:
        text = msg_str.get_payload()
    
    print('From: {}'.format(From[:8]))
    print('Date: {}'.format(Date))
    print('Content: {}'.format(text))

From: "端木赋范空间"
Date: Fri, 21 Jul 2023 16:06:45 +0800
Content: 测试邮件接收功能



<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307211620797.png" alt="42ab469de5e37e2afa7213813a3642e" style="zoom:33%;" />

能够看到，我们预设的功能能够非常好的实现。上述代码流程并不复杂，核心流程是通过service.users().messages().list(userId='me', maxResults=1).execute()获取了最近一封邮件的信息，并最终保留在msg中。

> 更多关于Gmail API返回结果信息解读，可参考Gmail API官网功能介绍：https://developers.google.com/gmail/api/guides

In [17]:
msg

{'id': '189777cce07e5138',
 'threadId': '189777cce07e5138',
 'labelIds': ['UNREAD', 'IMPORTANT', 'CATEGORY_PERSONAL', 'INBOX'],
 'snippet': '测试邮件接收功能',
 'payload': {'partId': '',
  'mimeType': 'multipart/alternative',
  'filename': '',
  'headers': [{'name': 'Delivered-To', 'value': 'duanmutianchen@gmail.com'},
   {'name': 'Received',
    'value': 'by 2002:a05:7001:204:b0:4f3:e055:e953 with SMTP id rq4csp56950mab;        Fri, 21 Jul 2023 01:06:55 -0700 (PDT)'},
   {'name': 'X-Received',
    'value': 'by 2002:a17:906:328f:b0:96a:63d4:24c5 with SMTP id 15-20020a170906328f00b0096a63d424c5mr1110441ejw.77.1689926815311;        Fri, 21 Jul 2023 01:06:55 -0700 (PDT)'},
   {'name': 'ARC-Seal',
    'value': 'i=1; a=rsa-sha256; t=1689926815; cv=none;        d=google.com; s=arc-20160816;        b=cQZgOj4NB5HYlkbwQQtThsPSNeEgMMJUvjtts/d15/RCb0o1lfhPAGDfmUkH8rWGiD         mw3J1HeX4bOE3aVQBqLtSv2jxcsdMACfpuAX/062J/0J9Lofg0QHUWFPD2gULitQ2bV4         5w1qv/Pg6rzILxg4TUyHs6AzFKOimBjAEIqjnm7ctgjFUlog6HG

然后之后的代码实际上就是在msg中提取相关信息，包括发件人信息、收件时间和邮件正文信息等。

- Step 2.验证模型能否解读Gmail API返回结果

&emsp;&emsp;而为了满足更多不同问题的回答，我们这里考虑直接让Chat模型解读msg结果，我们可以通过如下流程测试Chat模型是否熟悉Gmail API这一功能及其返回结果的解读方式。

In [19]:
response = openai.ChatCompletion.create(
  model="gpt-4-0613",
  messages=[
    {"role": "system", "content": "这是我的Gmail邮箱最近一封邮件的内容：%s" % msg},
    {"role": "system", "content": "邮件内容是由Gmail API获取"},
    {"role": "user", "content": "请问我的Gmail最近一封邮件是谁发送的，具体内容是什么？"}
  ]
)
response.choices[0].message['content']

'您的最新一封Gmail邮件是由"端木赋范空间"发送的，邮件的主题是"测试"，具体内容为"测试邮件接收功能"。'

能够发现，Chat模型能够非常好的理解msg中所包含的信息。而后我们在设计外部函数和Chat模型的通信流程时，即可直接让外部函数对大语言模型直接输出msg结果。

- Step 3.创建外部函数

&emsp;&emsp;接下来，我们就按照Step 1中的代码流程，创建一个能够返回最近一封邮件信息的msg对象，并输出为JSON格式：

In [119]:
def get_latest_email(userId):
    """
    查询Gmail邮箱中最后一封邮件信息
    :param userId: 必要参数，字符串类型，用于表示需要查询的邮箱ID，\
    注意，当查询我的邮箱时，userId需要输入'me'；
    :return：包含最后一封邮件全部信息的对象，该对象由Gmail API创建得到
    """
    # 从本地文件中加载凭据
    creds = Credentials.from_authorized_user_file('token.json')
    
    # 创建 Gmail API 客户端
    service = build('gmail', 'v1', credentials=creds)
    
    # 列出用户的一封最新邮件
    results = service.users().messages().list(userId=userId, maxResults=1).execute()
    messages = results.get('messages', [])

    # 遍历邮件
    for message in messages:
        # 获取邮件的详细信息
        msg = service.users().messages().get(userId='me', id=message['id']).execute()
        
    return json.dumps(msg)

In [9]:
functions_list = [get_latest_email]

在编写完函数之后，为了确保最终的对话函数能顺利运行，我们可以手动测试auto_functions能否根据函数说明正确编写functions参数，以及测试下Chat模型能否正确识别functions参数格式要求，并将用户需求顺利解读和翻译为函数可以接受的参数形式：

In [10]:
functions = auto_functions(functions_list)

In [13]:
functions

[{'name': 'get_latest_email',
  'description': '查询Gmail邮箱中最后一封邮件信息',
  'parameters': {'type': 'object',
   'properties': {'userId': {'type': 'string',
     'description': "需要查询的邮箱ID。注意，当查询我的邮箱时，userId需要输入'me'"}},
   'required': ['userId']}}]

能够发现functions参数编写完全没问题。接下来测试Chat模型能否顺利创建满足格式的参数：

In [11]:
response = openai.ChatCompletion.create(
        model="gpt-4-0613",
        messages=[{"role": "user", "content": '请帮我查下我的邮箱里最后一封邮件内容'}],
        functions=functions,
        function_call="auto",  
    )

In [12]:
response

<OpenAIObject chat.completion id=chatcmpl-7f0wG7J2QzOz396YX0v2cVwDvOjK5 at 0x15a08c31ee0> JSON: {
  "id": "chatcmpl-7f0wG7J2QzOz396YX0v2cVwDvOjK5",
  "object": "chat.completion",
  "created": 1690009412,
  "model": "gpt-4-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": null,
        "function_call": {
          "name": "get_latest_email",
          "arguments": "{\n  \"userId\": \"me\"\n}"
        }
      },
      "finish_reason": "function_call"
    }
  ],
  "usage": {
    "prompt_tokens": 95,
    "completion_tokens": 16,
    "total_tokens": 111
  }
}

能够发现，Chat函数能够将“查询我的邮箱”需求翻译为userId参数输入为'me'，后续可以顺利调用函数。至此手动验证结束，此前我们定义的一系列自动函数是可以使用的。

- Step 4.验证对话效果

最后让我们来测试对话效果：

In [28]:
chat_with_model(prompt="你好")

模型回答: 你好！有什么我可以帮助你的吗？


您还有其他问题吗？(输入退出以结束对话):  请帮我查下我Gmail邮箱里最后一封邮件的邮件内容


模型回答: 对不起，由于隐私问题，我无法查看您的个人电邮内容。请您自行登录邮箱查阅邮件。


您还有其他问题吗？(输入退出以结束对话):  退出


In [7]:
chat_with_model(functions_list, prompt="你好")

模型回答: 你好！有什么可以帮助你的吗？
您还有其他问题吗？(输入退出以结束对话):  请帮我查下我Gmail邮箱里最后一封邮件的邮件内容
模型回答: 您在Gmail邮箱的最后一封邮件是在2023年7月21日16:06:45（北京时间）收到的，发件人是“端木赋范空间”。邮件的主题是“测试”，内容为：“测试邮件接收功能”。
您还有其他问题吗？(输入退出以结束对话):  今天北京天气如何？
模型回答: 很抱歉，我无法查询实时天气信息，建议你使用手机或电脑上的天气应用进行查询。
您还有其他问题吗？(输入退出以结束对话):  退出


能够发现，此时模型就能够非常顺利的查阅我的邮箱里面的最后一封邮件了。

#### 2.2 在Chat模型中添加发送邮件功能

- 授权管理

&emsp;&emsp;当然，只能查阅最近的一封邮件，并不能算是一个真正意义上智能邮件系统，我们至少还应该为其添加发送邮件的功能。但是需要注意的是，此前我们创建的token其实只包含了阅读邮件的API授权，并未包含发送邮件API授权。因此这里首先需要进行API权限修改，即再次申请获取Gmail发送邮件API授权。我们这里直接提取之前quickstart.py的授权部分代码进行运行，并将send权限的授权文件保存在本地token_send.json文件中：

In [49]:
SCOPES = ['https://www.googleapis.com/auth/gmail.send']

flow = InstalledAppFlow.from_client_secrets_file(
                'client_web1.json', SCOPES)
creds = flow.run_local_server(port=8899, access_type='offline', prompt='consent')

with open('token_send.json', 'w') as token:
    token.write(creds.to_json())

Please visit this URL to authorize this application: https://accounts.google.com/o/oauth2/auth?response_type=code&client_id=597598790553-j4tj274ajpeta15s9lc0sffmlqmbhi9q.apps.googleusercontent.com&redirect_uri=http%3A%2F%2Flocalhost%3A8899%2F&scope=https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fgmail.send&state=lobsankAOTUOPwEwAcm1yorKtLAkDD&access_type=offline&prompt=consent


这里需要注意谷歌云API的独特使用方法，即一个（类）API在进行使用时会分根据API功能不同，需要进行多次授权。而此次授权和quickstart.py的授权部分不同之处就在于SCOPES变量的设置，SCOPES是一个包含多个地址的列表，而其中每个地址就代表着不同请求的发送地址，换而言之就代表着不同API权限，地址尾部为gmail.send则表示发送邮件的API，而尾部为gmail.readonly则表示只能阅读邮件。具体不同的API功能对应可以参考官方说明：https://developers.google.com/gmail/api/auth/scopes?hl=zh_CN

&emsp;&emsp;当然，我们也可以一次性获得包含多个权限的授权文件，此时SCOPES可以按照如下方式进行定义，此时授权文件可以同时允许执行文件阅读和发送：

In [16]:
SCOPES = ['https://www.googleapis.com/auth/gmail.send','https://www.googleapis.com/auth/gmail.readonly']

完成授权之后，即可使用Gmail的发送邮件功能了。这里需要注意将授权文件改为token_send.json，具体代码实现流程如下：

In [50]:
from googleapiclient.discovery import build
from google.oauth2.credentials import Credentials
from email.mime.text import MIMEText
import base64

# 从本地文件中加载凭据
creds = Credentials.from_authorized_user_file('token_send.json')

# 创建 Gmail API 客户端
service = build('gmail', 'v1', credentials=creds)

def create_message(sender, to, subject, message_text):
    """创建一个MIME邮件"""
    message = MIMEText(message_text)
    message['to'] = to
    message['from'] = sender
    message['subject'] = subject
    raw_message = base64.urlsafe_b64encode(message.as_string().encode('utf-8')).decode('utf-8')
    return {
        'raw': raw_message
    }

def send_message(service, user_id, message):
    """发送邮件"""
    try:
        sent_message = service.users().messages().send(userId=user_id, body=message).execute()
        print(f'Message Id: {sent_message["id"]}')
        return sent_message
    except Exception as e:
        print(f'An error occurred: {e}')
        return None

# 创建邮件，发件人、收件邮箱、邮件主题和邮件内容
message = create_message('me', '2323365771@qq.com', 'Hello', 'Hello, world!')

# 发送邮件
send_message(service, 'me', message)

Message Id: 18978cd39d717f54


{'id': '18978cd39d717f54',
 'threadId': '18978cd39d717f54',
 'labelIds': ['SENT']}

&emsp;&emsp;需要注意的是，这里的MIME（Multipurpose Internet Mail Extensions，多用途互联网邮件扩展）是一种互联网标准，它扩展了原始的电子邮件规范（只能处理ASCII文本），使电子邮件能够支持其他类型的数据，如文本（包括非ASCII字符）、图像、音频、视频和应用程序数据。而在Python中，email.mime模块提供了创建和修改MIME消息的类。这些类可以创建包含多种数据类型的复杂邮件消息，包含文本、HTML、附件和嵌入的图像等的邮件。这里我们可以查看创建的message对象：

In [17]:
message

{'raw': 'Q29udGVudC1UeXBlOiB0ZXh0L3BsYWluOyBjaGFyc2V0PSJ1cy1hc2NpaSIKTUlNRS1WZXJzaW9uOiAxLjAKQ29udGVudC1UcmFuc2Zlci1FbmNvZGluZzogN2JpdAp0bzogMjMyMzM2NTc3MUBxcS5jb20KZnJvbTogbWUKc3ViamVjdDogSGVsbG8KCkhlbGxvLCB3b3JsZCE='}

> 此外，还可以通过sent_message = service.users().messages().send(userId=user_id, body=message).execute()方式调用Gmail API。

> 上述代码不需要完全掌握，稍后我们会介绍如何借助Chat模型自行编写相关代码的方法，即一种借助AI创建AI应用程序的方法。

而在对应的邮箱内，现在即可查阅刚刚发送的邮件：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307212110979.png" alt="image-20230721211002953" style="zoom:33%;" />

而在原始邮箱，也能查看发送记录：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307212129054.png" alt="9f963159e3a5cf48e7f097dc68e9f85" style="zoom:33%;" />

至此，我们就成功尝试调用Gmail send API进行邮件发送。接下来我们将上述代码封装为一个完整的可被Chat模型调用的外部函数：

In [120]:
def send_email(to, subject, message_text):
    """
    借助Gmail API创建并发送邮件函数
    :param to: 必要参数，字符串类型，用于表示邮件发送的目标邮箱地址；
    :param subject: 必要参数，字符串类型，表示邮件主题；
    :param message_text: 必要参数，字符串类型，表示邮件全部正文；
    :return：返回发送结果字典，若成功发送，则返回包含邮件ID和发送状态的字典。
    """
    
    creds_file='token_send.json'
    
    def create_message(to, subject, message_text):
        """创建一个MIME邮件"""
        message = MIMEText(message_text)
        message['to'] = to
        message['from'] = 'me'
        message['subject'] = subject
        raw_message = base64.urlsafe_b64encode(message.as_string().encode('utf-8')).decode('utf-8')
        return {
            'raw': raw_message
        }

    def send_message(service, user_id, message):
        """发送邮件"""
        try:
            sent_message = service.users().messages().send(userId=user_id, body=message).execute()
            print(f'Message Id: {sent_message["id"]}')
            return sent_message
        except Exception as e:
            print(f'An error occurred: {e}')
            return None

    # 从本地文件中加载凭据
    creds = Credentials.from_authorized_user_file(creds_file)

    # 创建 Gmail API 客户端
    service = build('gmail', 'v1', credentials=creds)

    message = create_message(to, subject, message_text)
    res = send_message(service, 'me', message)

    return json.dumps(res)

In [15]:
functions_list = [send_email]

最后让我们来测试对话效果。同样，为了保险起见，我们还是先测试下functions参数能否顺利创建，以及模型能否根据用户需求及functions参数说明，合理创建调用外部函数所需参数：

In [16]:
functions = auto_functions(functions_list)

In [17]:
functions

[{'name': 'send_email',
  'description': '借助Gmail API创建并发送邮件函数',
  'parameters': {'type': 'object',
   'properties': {'to': {'type': 'string', 'description': '邮件发送目标地址'},
    'subject': {'type': 'string', 'description': '邮件主题'},
    'message_text': {'type': 'string', 'description': '邮件正文'}},
   'required': ['to', 'subject', 'message_text']}}]

functions参数创建没问题，接下来我们进一步测试Chat模型能否顺利创建函数所需参数：

In [18]:
response = openai.ChatCompletion.create(
        model="gpt-4-0613",
        messages=[{"role": "user", "content": '请帮我给陈明发送一封邮件，请他明天早上9点半来我办公室开会，商量下半年技术开发计划。'}],
        functions=functions,
        function_call="auto",  
    )

In [19]:
response

<OpenAIObject chat.completion id=chatcmpl-7f14iHnXtYJND76KqRBUfUGYcR58Y at 0x15a08c19760> JSON: {
  "id": "chatcmpl-7f14iHnXtYJND76KqRBUfUGYcR58Y",
  "object": "chat.completion",
  "created": 1690009936,
  "model": "gpt-4-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": null,
        "function_call": {
          "name": "send_email",
          "arguments": "{\n  \"to\": \"chenming@example.com\",\n  \"subject\": \"\u6280\u672f\u5f00\u53d1\u8ba1\u5212\u4f1a\u8bae\u901a\u77e5\",\n  \"message_text\": \"\u9648\u660e\uff0c\\n\\n\u6211\u5e0c\u671b\u4f60\u5728\u660e\u5929\u65e9\u4e0a9:30\u80fd\u6765\u6211\u7684\u529e\u516c\u5ba4\uff0c\u6211\u4eec\u9700\u8981\u5f00\u4f1a\u8ba8\u8bba\u4e0b\u534a\u5e74\u7684\u6280\u672f\u5f00\u53d1\u8ba1\u5212\u3002\\n\\n\u8c22\u8c22\uff0c\\n[\u60a8\u7684\u540d\u5b57]\"\n}"
        }
      },
      "finish_reason": "function_call"
    }
  ],
  "usage": {
    "prompt_tokens": 139,
    "completion_toke

这里我们发现，模型会根据语义创建邮件的主题和内容。不过需要注意的是，在我们没有说明陈明的邮箱地址时，Chat模型会默认往chenming@example.com地址发送邮件。

&emsp;&emsp;在经过一系列验证之后，接下来我们尝试直接进行多轮对话进行效果验证：

In [58]:
chat_with_model()

模型回答: 你好！有什么我能帮助你的吗？


您还有其他问题吗？(输入退出以结束对话):  请帮我给陈明发送一封邮件，请他明天早上9点半来我办公室开会，商量下半年技术开发计划。


模型回答: 对不起，我不能帮你发送电子邮件。我是一个AI助手，不具备发邮件的权限。


您还有其他问题吗？(输入退出以结束对话):  退出


In [61]:
chat_with_model(functions_list=functions_list,
                system_message=[{"role": "system", "content": "陈明的邮箱地址是：2323365771@qq.com"}])

模型回答: 你好！有什么可以帮助你的吗？


您还有其他问题吗？(输入退出以结束对话):  请以九天的名义，给陈明发送一封邮件，请他明天早上9点半来我办公室开会，商量下半年技术开发计划。


Message Id: 18978d63f06165a7
模型回答: 好的，我已经给陈明发送了邮件，通知他明天早上9点半到你的办公室开会，商量下半年的技术开发计划。


您还有其他问题吗？(输入退出以结束对话):  退出


然后即可在邮箱中查看查收的邮件：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/202307212225430.png" alt="2673ce536a8cd92b1fd535d10884d5d" style="zoom:23%;" />

至此，我们就将邮件发送功能也完整集成到Chat模型当中了。

> 当然，这里也可以要求Chat模型以更加官方和书面的方式进行邮件编写，模仿不同的语气进行文字内容创建也是Chat模型的长项，大家可以自行进行尝试。

#### 2.3 在Chat模型中同时调用邮件发送和查询功能

&emsp;&emsp;在我们分别跑通了邮件发送功能之后，接下来我们尝试将在一个对话中同时调用这两个功能。毕竟大多数AI应用都是围绕某一方面应用的多功能集合，例如对于一个智能收发邮件助手的AI应用来说，收件和发件肯定是最基本的功能需求。而要在一个Chat模型中集成收件和发件两方面功能，我们只需要在functions_list同时添加get_latest_email和send_email即可：

In [62]:
functions_list = [get_latest_email, send_email]

然后测试效果。这里我们先让Chat模型发送一封邀请参会的邮件，然后利用陈明的邮箱给我的Gmail邮箱进行回复，在间隔一小段时间之后继续询问Chat模型是否收到陈明的邮件回复，以及简单查阅回复内容。具体对话流程如下：

In [67]:
chat_with_model(functions_list=functions_list,
                system_message=[{"role": "system", "content": "陈明的邮箱地址是：2323365771@qq.com"}])

模型回答: 你好！有什么我可以帮你的吗？


您还有其他问题吗？(输入退出以结束对话):  请以九天的名义，给陈明发送一封邮件，请他明天早上9点半来我办公室开会，商量下半年技术开发计划。


Message Id: 18978e3b39ba3204
模型回答: 我已经发送了这封邮件给陈明，请求他明天早上9点半来你的办公室开会，商量下半年技术开发计划。


您还有其他问题吗？(输入退出以结束对话):  帮我查下邮箱，看陈明回复我了么？


模型回答: 是的，陈明回复了你的邮件，他说他已经收到你的邮件并将按时参加会议。


您还有其他问题吗？(输入退出以结束对话):  退出


而在我的邮箱，能够查到陈明的回复邮件：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/1a892e01f2041a47d5af67ff463e021.png" alt="1a892e01f2041a47d5af67ff463e021" style="zoom:33%;" />

至此，我们就完成了在一个Chat对话中同时调用发件和收件功能。并且通过上面的实践能够发现，伴随着Chat模型中集成的外部工具API越来越多，整个应用也会看起来变得更加智能。而实际上也确实如此，在借助Function calling进行AI应用开发的过程中，外部函数库的功能范围是决定当前AI应用“智能”与否的关键。

&emsp;&emsp;但于此同时，我们又发现，创建一个包含外部工具API的外部函数的过程并不简单，一方面我们需要反复尝试来获取对应的API权限，另一方面我们也需要拥有一定的API调用知识，才能够顺利编写外部函数代码。仅仅是创建一个智能邮件收发的应用，我们就花费了不小的篇幅介绍相关API获取方法及函数编写方法。但其实，这个开发过程或许是可以一定程度简化的，而简化的核心思路就是**借助AI（Chat模型）来帮我们完成AI应用的开发**。

- 进阶开发思路

In [10]:
    import urllib.request as libreq
    with libreq.urlopen('http://export.arxiv.org/api/query?search_query=all:electron&start=0&max_results=1') as url:
      r = url.read()
    print(r)


b'<?xml version="1.0" encoding="UTF-8"?>\n<feed xmlns="http://www.w3.org/2005/Atom">\n  <link href="http://arxiv.org/api/query?search_query%3Dall%3Aelectron%26id_list%3D%26start%3D0%26max_results%3D1" rel="self" type="application/atom+xml"/>\n  <title type="html">ArXiv Query: search_query=all:electron&amp;id_list=&amp;start=0&amp;max_results=1</title>\n  <id>http://arxiv.org/api/cHxbiOdZaP56ODnBPIenZhzg5f8</id>\n  <updated>2023-07-19T00:00:00-04:00</updated>\n  <opensearch:totalResults xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">198428</opensearch:totalResults>\n  <opensearch:startIndex xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">0</opensearch:startIndex>\n  <opensearch:itemsPerPage xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/">1</opensearch:itemsPerPage>\n  <entry>\n    <id>http://arxiv.org/abs/cond-mat/0102536v1</id>\n    <updated>2001-02-28T20:12:09Z</updated>\n    <published>2001-02-28T20:12:09Z</published>\n    <title>Impact of Electron-Electron C

In [2]:
import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")

import numpy as np
import pandas as pd

import json
import io
import inspect
import requests

from gptLearning import *

In [4]:
import requests
import json

def google_search(search_term, api_key, cse_id, **kwargs):
    url = "https://www.googleapis.com/customsearch/v1"
    params = {
        'q': search_term,
        'key': api_key,
        'cx': cse_id,
    }
    params.update(kwargs)
    response = requests.get(url, params=params)
    return response.json()

# 使用你的API密钥和搜索引擎ID替换以下值
api_key = "AIzaSyBymbg68UDECz_HgRFibnLyur_pceRUNQU"
cse_id = "42c33c991e2a2417f"

results = google_search("OpenAI", api_key, cse_id)
print(json.dumps(results, indent=2))

{
  "kind": "customsearch#search",
  "url": {
    "type": "application/json",
    "template": "https://www.googleapis.com/customsearch/v1?q={searchTerms}&num={count?}&start={startIndex?}&lr={language?}&safe={safe?}&cx={cx?}&sort={sort?}&filter={filter?}&gl={gl?}&cr={cr?}&googlehost={googleHost?}&c2coff={disableCnTwTranslation?}&hq={hq?}&hl={hl?}&siteSearch={siteSearch?}&siteSearchFilter={siteSearchFilter?}&exactTerms={exactTerms?}&excludeTerms={excludeTerms?}&linkSite={linkSite?}&orTerms={orTerms?}&relatedSite={relatedSite?}&dateRestrict={dateRestrict?}&lowRange={lowRange?}&highRange={highRange?}&searchType={searchType}&fileType={fileType?}&rights={rights?}&imgSize={imgSize?}&imgType={imgType?}&imgColorType={imgColorType?}&imgDominantColor={imgDominantColor?}&alt=json"
  },
  "queries": {
    "request": [
      {
        "title": "Google Custom Search - OpenAI",
        "totalResults": "121000000",
        "searchTerms": "OpenAI",
        "count": 10,
        "startIndex": 1,
        "

In [5]:
results

{'kind': 'customsearch#search',
 'url': {'type': 'application/json',
  'template': 'https://www.googleapis.com/customsearch/v1?q={searchTerms}&num={count?}&start={startIndex?}&lr={language?}&safe={safe?}&cx={cx?}&sort={sort?}&filter={filter?}&gl={gl?}&cr={cr?}&googlehost={googleHost?}&c2coff={disableCnTwTranslation?}&hq={hq?}&hl={hl?}&siteSearch={siteSearch?}&siteSearchFilter={siteSearchFilter?}&exactTerms={exactTerms?}&excludeTerms={excludeTerms?}&linkSite={linkSite?}&orTerms={orTerms?}&relatedSite={relatedSite?}&dateRestrict={dateRestrict?}&lowRange={lowRange?}&highRange={highRange?}&searchType={searchType}&fileType={fileType?}&rights={rights?}&imgSize={imgSize?}&imgType={imgType?}&imgColorType={imgColorType?}&imgDominantColor={imgDominantColor?}&alt=json'},
 'queries': {'request': [{'title': 'Google Custom Search - OpenAI',
    'totalResults': '121000000',
    'searchTerms': 'OpenAI',
    'count': 10,
    'startIndex': 1,
    'inputEncoding': 'utf8',
    'outputEncoding': 'utf8',
  

In [6]:
print(json.dumps(results, indent=2))

{
  "kind": "customsearch#search",
  "url": {
    "type": "application/json",
    "template": "https://www.googleapis.com/customsearch/v1?q={searchTerms}&num={count?}&start={startIndex?}&lr={language?}&safe={safe?}&cx={cx?}&sort={sort?}&filter={filter?}&gl={gl?}&cr={cr?}&googlehost={googleHost?}&c2coff={disableCnTwTranslation?}&hq={hq?}&hl={hl?}&siteSearch={siteSearch?}&siteSearchFilter={siteSearchFilter?}&exactTerms={exactTerms?}&excludeTerms={excludeTerms?}&linkSite={linkSite?}&orTerms={orTerms?}&relatedSite={relatedSite?}&dateRestrict={dateRestrict?}&lowRange={lowRange?}&highRange={highRange?}&searchType={searchType}&fileType={fileType?}&rights={rights?}&imgSize={imgSize?}&imgType={imgType?}&imgColorType={imgColorType?}&imgDominantColor={imgDominantColor?}&alt=json"
  },
  "queries": {
    "request": [
      {
        "title": "Google Custom Search - OpenAI",
        "totalResults": "121000000",
        "searchTerms": "OpenAI",
        "count": 10,
        "startIndex": 1,
        "

In [3]:
api_key = "AIzaSyBymbg68UDECz_HgRFibnLyur_pceRUNQU"
cse_id = "42c33c991e2a2417f"

In [7]:
import requests
import json

def google_search(search_term, api_key, cse_id, num_results):
    # 计算需要发送的请求次数
    num_requests = num_results // 10 + (num_results % 10 > 0)

    for i in range(num_requests):
        # 计算这次请求的起始索引
        start_index = i * 10 + 1

        # 发送请求
        url = "https://www.googleapis.com/customsearch/v1"
        params = {
            'q': search_term,
            'key': api_key,
            'cx': cse_id,
            'start': start_index,
        }
        response = requests.get(url, params=params)
        results = response.json()

        # 打印结果
        for item in results['items']:
            print("Title:", item['title'])
            print("Link:", item['link'])
            print("Snippet:", item['snippet'])
            print()

# 使用你的API密钥和搜索引擎ID替换以下值
api_key = "AIzaSyBymbg68UDECz_HgRFibnLyur_pceRUNQU"
cse_id = "42c33c991e2a2417f"

google_search("OpenAI", api_key, cse_id, 6)

Title: OpenAI
Link: https://openai.com/
Snippet: Creating safe AGI that benefits all of humanity.

Title: ChatGPT on the App Store
Link: https://apps.apple.com/us/app/chatgpt/id6448311069
Snippet: 5 days ago ... I have submitted numerous feedbacks to open AI about this but nothing has changed on that front.

Title: Introducing ChatGPT
Link: https://openai.com/blog/chatgpt
Snippet: Nov 30, 2022 ... The model is often excessively verbose and overuses certain phrases, such as restating that it's a language model trained by OpenAI. These ...

Title: OpenAI Platform
Link: https://platform.openai.com/playground
Snippet: Explore resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's developer platform.

Title: GPT-4 is OpenAI's most advanced system, producing safer and ...
Link: https://openai.com/gpt-4
Snippet: Mar 13, 2023 ... GPT-4 is OpenAI's most advanced system, producing safer and more useful responses · GPT-4 can solve difficult problems with greater accu

In [4]:
api_key = "AIzaSyBymbg68UDECz_HgRFibnLyur_pceRUNQU"
cse_id = "42c33c991e2a2417f"

In [5]:
def google_search(search_term, api_key, cse_id, num_results):
    try:
        # 计算需要发送的请求次数
        num_requests = num_results // 10 + (num_results % 10 > 0)

        # 创建两个列表来保存网址和摘要
        links = []
        snippets = []

        for i in range(num_requests):
            # 计算这次请求的起始索引
            start_index = i * 10 + 1

            # 发送请求
            url = "https://www.googleapis.com/customsearch/v1"
            params = {
                'q': search_term,
                'key': api_key,
                'cx': cse_id,
                'start': start_index,
            }
            response = requests.get(url, params=params)
            results = response.json()

            # 保存结果
            for item in results['items']:
                links.append(item['link'])
                snippets.append(item['snippet'])

        return links, snippets
    except Exception as e:
        print(f"An error occurred while searching: {e}")
        return None, None


In [6]:
import requests
from bs4 import BeautifulSoup

def fetch_first_accessible_page(links):
    for link in links:
        try:
            response = requests.get(link, timeout=5)
            # 检查状态码，200表示请求成功
            if response.status_code == 200:
                soup = BeautifulSoup(response.text, 'html.parser')
                return soup
        except requests.exceptions.RequestException as e:
            print(f"Skipping link {link} due to exception: {e}")
    return None

links, snippets = google_search("OpenAI", api_key, cse_id, 6)

soup = fetch_first_accessible_page(links)

if soup is not None:
    print(soup.prettify())  # 打印网页的HTML内容
else:
    print("No accessible page found.")

<!DOCTYPE html>
<html lang="en-US">
 <head>
  <meta charset="utf-8"/>
  <title>
   OpenAI
  </title>
  <meta content="width=device-width, initial-scale=1" name="viewport"/>
  <link crossorigin="" href="https://github.githubassets.com/" rel="preconnect"/>
  <link crossorigin="" href="https://fonts.googleapis.com/" rel="preconnect"/>
  <script data-cf-beacon='{"token": "393a70f7207446539b84da589836560a"}' src="https://static.cloudflareinsights.com/beacon.min.js">
  </script>
  <meta content="Creating safe AGI that benefits all of humanity" name="description"/>
  <meta content="OpenAI" property="og:title"/>
  <meta content="Creating safe AGI that benefits all of humanity" property="og:description"/>
  <meta content="https://images.openai.com/blob/fb4a2ba6-9109-4c7b-af4d-cae530c3fa78/recruitment-video-poster.jpg?trim=0%2C0%2C0%2C0" property="og:image"/>
  <meta content="People chatting around a couch in a plant-filled sunny room" property="og:image:alt"/>
  <meta content="summary_large_ima

In [7]:
type(soup)

bs4.BeautifulSoup

In [8]:
soup.get_text()

'\n\n\nOpenAI\n\n\n\n\n\n\n\n\n\n\n\n\nCloseSearch Submit Skip to main contentSite NavigationResearchOverviewIndexProductOverviewChatGPTGPT-4DALLÂ·E 2Customer storiesSafety standardsPricingDevelopersOverviewDocumentationAPI referenceExamplesSafetyCompanyAboutBlogCareersCharterSecuritySearch Navigation quick links Log inSign upMenu Mobile Navigation CloseSite NavigationResearchProductDevelopersSafetyCompany Quick Links Log inSign upSearch Submit  Your browser does not support the video tag. Creating safe AGI that benefits all of humanityQuicklinksLearn about OpenAIPioneering research on the path to AGILearn about our researchTransforming work and creativity with AIExplore our productsJoin us in shaping the future of technologyView careersSafety & responsibilityOur work to create safe and beneficial AI requires a deep understanding of the potential risks and benefits, as well as careful consideration of the impact.Learn about safetyResearchWe research generative models and how to align t

In [9]:
response = openai.ChatCompletion.create(
  model="gpt-4-0613",
  messages=[
    {"role": "system", "content": "这是我们爬取到的OpenAI官网首页的内容'%s'" % soup.get_text()},
    {"role": "user", "content": "从中你能解读出哪些信息？请用简体中文回答"}
  ]
)
response.choices[0].message['content']

'1. OpenAI是一家致力于研究和开发人工智能（AI）的公司，以创造对全人类有益的人工智能（AGI）为目标。\n2. OpenAI的研究领域主要是生成模型以及如何让这些模型与人类价值观相符合。\n3. OpenAI有自己的API平台，提供最新的模型和安全最佳实践指南，他们有的产品包括ChatGPT，GPT-4，DALL·E 2等，还有一些用户案例和安全标准设定。\n4. OpenAI还进行对技术影响的研究，涉及到公众安全和潜在的工作市场影响等问题。\n5. OpenAI为开发者提供各种开发文档、API参考和实例，有着自己的开发者社区。\n6. OpenAI积极招募不同学科背景的人才加入他们的团队，以共同开发安全利人的AI。\n7. OpenAI通过其网站界面提供了一些关于他们研究项目的最新更新，包括有关公共安全风险管理、数学推理进程监管等主题的更新。他们也鼓励团队成员不断学习，汲取不同领域的知识以创新并扩大解决问题的空间。\n8. OpenAI成立于2015年，有Twitter，YouTube，GitHub，SoundCloud，LinkedIn等社交媒体账号。\n\n总的来说，这个网站主要提供OpenAI的最新研究成果，产品信息，开发者资源，招聘信息，公司信息以及他们对AI安全和责任的看法。'