# <center> 交互式智能编程助手MateGen       
# <center>    功能介绍与入门使用教程

### MateGen简介

&emsp;&emsp;MateGen是一款由九天老师团队开发的交互式智能编程助手，可以在Python代码环境中运行，核心功能如下

- **多轮对话与无限上下文记忆**：可以在对话过程中逐渐深入理解你的需求，并长期记住上下文信息。
- **基于RAG的本地知识库问答**：支持在海量文本中进行高精度检索，围绕本地文本进行知识库问答。
- **本地代码解释器**：可以连接本地Python环境，编写和执行Python代码，辅助完成编程任务。
- **NL2SQL**：能够连接本地MySQL环境，根据需求编写和执行SQL代码，帮助完成数据查询和提取任务。
- **图像识别**：可以处理用户提供的图片，并针对图片内容进行信息识别和回答问题。
- **联网功能**：可以在互联网、知乎或GitHub上搜索相关信息，回答用户提出的问题。
- **Kaggle竞赛辅导**：能够搜索Kaggle竞赛相关信息，下载热门Kernel，并进行知识库问答，辅导参与竞赛。
- **论文解读和数据分析报告编写**：可以帮助解读学术论文或编写数据分析报告。

而在实际使用过程中，九天老师团队秉持实用性优先的原则设计的MateGen还具备如下特性：

- **易用性**：MateGen为在线Agent，无需任何网络工具和硬件门槛即可使用，各项功能不用进行参数设置，MateGen会自动根据用户需求开启不同功能；
- **强悍的RAG系统**：支持本地文件夹一键同步创建云端词向量数据库，且最大支持1000份文档、10G体量的文本搜索问答；
- **复杂问题拆解与自动debug**：面对复杂任务，MateGen会自动进行任务拆解，并在不同环节调用不同工具进行处理，同时，若部分环节运行出问题，MateGen会首先尝试自动优化运行流程，并在多次尝试无法解决问题时向用户寻求帮助；
- **高效率Function calling**：MateGen同时具备Multi Function calling（一个任务开启多个功能）和Parallel Function calling（一个功能开多个执行器），借此提高响应效率。

本文将详细介绍MateGen的安装和调用方法。

## <center> 一、MateGen下载与API-KEY获取

### 1.虚拟环境创建与MateGen安装

&emsp;&emsp;MateGen安装非常简单，可以直接通过`pip install mategen`进行安装，需要注意的是，MateGen运行所需依赖较多，因此推荐借助虚拟环境进行安装。首先创建一个名为`mategen`的虚拟环境：        
```bash
conda create -n mategen python=3.8
```       
然后使用如下指令激活虚拟环境：
```bash
conda activate mategen
```       
接着在虚拟环境中安装MateGen：
```bash
pip install mategen
```     
安装完成之后，考虑到需要在Jupyter中调用MateGen，我们还需要在虚拟环境中安装IPython Kernel：
```bash
pip install ipykernel
```
并且将这个虚拟环境添加到Jupyter的Kernel列表中：
```bash
python -m ipykernel install --user --name mategen --display-name "mategen"
```     
然后开启Jupyter服务：     
```bash
jupyter lab
```

若要更新MateGen，则可输入如下命令：
```bash
pip install --upgrade mategen --index-url https://pypi.org/simple --no-cache-dir
```

> 以上代码需要在命令行环境中运行

然后在Jupyter的Kernel中选择mategen，即可进入到对应虚拟环境运行MateGen：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240706230000498.png" alt="image-20240706230000498" style="zoom:30%;" />

然后运行如下代码测试是否安装成功：

In [1]:
import MateGen
from MateGen import *

安装后按照如下方式导入即可：

In [2]:
# 查看MateGen版本号
MateGen.__version__

> 注：最新版本可能随时发生变化，大家安装最新版即可。

### 2.MateGen API-KEY获取

&emsp;&emsp;MateGen目前只开放了在线服务版本，借助在线大模型来完成各项服务，无需本地硬件、无需网络环境要求即可零门槛使用。调用MateGen需要通过API-KEY进行身份验证，**目前MateGen正在公测，限量开放200个内测名额，每个名额包含100万token使用额度，每位用户限领一个API-KEY，若需继续使用，也可按需充值token额度。API-KEY领取、加入技术交流群、其他任何问题，<span style="color:red;">扫码添加客服小可爱(微信：littlelion_1215)，回复“MG”详询哦👇</span>**

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240706225245612.png" alt="image-20240706225245612" style="zoom:50%;" />

获取了API-KEY之后，即可调用MateGen了。

## <center> 二、MateGen对话功能与本地知识库问答功能介绍

- MateGen实例化

&emsp;&emsp;MateGen的调用流程和sklearn模型调用流程类似，都是先需要实例化一个MateGen聊天机器人，然后再执行对话。实例化过程如下：

In [5]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY')

每个新的API-KEY实例化MateGen时，需要同步基础指令和调度流程等，因此需要等待一小段时间。此后若不更换API-KEY，则无需重复这个流程。

- 增强模式

&emsp;&emsp;MateGen支持两种运行模式，普通模式与增强模式，开启增强模式时MateGen会有更强的性能表现，但同时也会有更长的响应时间以及更高昂的费用。默认情况下MateGen以普通模式运行，当设置参数`enhanced_mode`为True时则开启增强模式：

In [4]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY', 
                       enhanced_mode = True)

帮助文档的各项实验均基于增强模式运行得到的结果。

### 1.MateGen基础对话功能介绍

- MateGen对话方式与无限上下文

&emsp;&emsp;我们可以使用MateGen.chat()的方式开启对话，MateGen支持单次对话和多次对话两种模式，无论哪种模式，MateGen都具备多轮对话记忆以及拥有无限对话上下文。用户无需担心多轮对话内容总量超出模型最大对话上下文，MateGen会根据用户对话情况，智能截取聊天内容带入模型，并且采用时间衰减和未知信息增加权重等策略，实现无限上下文。

&emsp;&emsp;当MateGen.chat()带入对话文本时，即可实现单次对话：

In [11]:
mategen.chat("你好，很高兴见到你！")

而若不带入对话文本，则可以实现多轮对话：

In [12]:
mategen.chat()

并且随时开启MateGen，都拥有多轮对话记忆：

In [13]:
mategen.chat('好的，请问我的上一个问题是？')

甚至当我们删除MateGen或重启代码环境，MateGen仍然可以读取保存在服务器上的对话记录，实现多轮对话：

In [14]:
del mategen

In [5]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY')

In [16]:
mategen.chat("请你帮我总结下咱俩之前的对话内容。")

- 清理消息

&emsp;&emsp;若不想保存历史消息，也可调用mategen.clear_messages()清理历史消息：

In [17]:
mategen.clear_messages()

- token消耗统计

&emsp;&emsp;同时，无论是否清理消息，MateGen都能实时统计token消耗总量。

In [19]:
mategen.print_usage()

> 本地token技术可能会因为硬件环境变化而统计有误，实际每个MateGen的token消耗量都会由服务器进行更加准确的统计。

### 2.借助MateGen进行本地知识库问答

&emsp;&emsp;MateGen自带先进的知识库检索（RAG）功能，能够围绕海量文本进行高精度检索问答、文本总结、文本翻译改写等。MateGen为每位用户提供了10G的在线文档存储空间，允许用户上传1000份文档，并且可以围绕PDF、md、ppt、word、txt等主流文档格式进行词向量化存储和读取。在设置了知识库问答的时候，**MateGen会根据用户提问，自动判断是否需要进行知识库检索，并不会强制检索再进行回答**。

#### 2.1 设置本地知识库地址

&emsp;&emsp;MateGen的知识库问答允许用户把本地文件夹的内容批量上传，同时允许创建多个知识库（一个文件夹对应一个知识库），并且可以在问答过程随时切换知识库。首次开启知识库问答之前建议先设置本地知识库的根目录地址，便于存储各个知识库文件夹，若不设置，则MateGen会默认在系统根目录下创建一个知识库文件夹。

&emsp;&emsp;我们可以借助如下函数指定知识库根目录地址，例如我们设置E盘下work文件夹为知识库根目录地址:

In [4]:
mategen.set_knowledge_base_url('E:\\work')

> 注意，Windows下需要通过两个反斜杠来表示文件夹层级关系。

#### 2.2 开启知识库对话

&emsp;&emsp;设置完成后即可开启知识库问答，首次开启知识库问答时需要输入知识库名称，例如此处创建一个名为'OpenML'的知识库：

In [3]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY', 
                       knowledge_base_chat=True)

> 注，此处我们重新实例化了一个MateGen，但正如此前所说，MateGen并不会因为重新实例化而丢失多轮对话记忆，这个实例化过程也可以看成是重新设置参数的过程。

然后即可在`E:\work`下查看知识库地址，目前知识库地址为`E:\work\knowledge_base\OpenML`，其中knowledge_base是知识库根目录：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707152757132.png" alt="image-20240707152757132" style="zoom:33%;" />

接下来我们将九天老师机器学习公开课课件全部放进去，公开课课件总共636页，属于海量文本专业知识检索：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707153507902.png" alt="image-20240707153507902" style="zoom:33%;" />

> MateGen知识库问答测试文档下载：链接：https://pan.baidu.com/s/1Gn7vpDHWQYp_x601r5R4yQ?pwd=sst0  提取码：sst0 

当然，哪怕是开启了知识库，MateGen也会根据用户提问的内容，决定是否进行知识库检索：

- 自主判断是否需要检索

In [16]:
# 提一个机器学习之外的问题
mategen.chat('请帮我简单介绍下Transformer基本原理')

接下来进一步测试MateGen RAG性能。我们分别从专业知识点（类似大海捞针）、大规模文本总结以及情感判断分析三个方面测试MateGen的RAG性能：

- 知识点提取

首次围绕某知识库对话，系统会先上传知识库文档，并进行词向量化处理，因此首次开启对话会略微耗费一点时间，之后再次开启对话则无需再次进行词向量化处理。

In [5]:
# 专业知识点提取
mategen.chat('请帮我检索下知识库，并详细总结Mini Batch K-Means聚类算法的建模流程。')

- 海量文本总结

In [22]:
# 海量文本总结
mategen.chat('现在你的知识库OpenML包含的文档，是九天老师机器学习公开课课件。请帮我总结下，九天老师在公开课中讲解了几种决策树算法呢？')

- 情感判别

In [23]:
mategen.chat('根据知识库所存储的课件，你觉得九天老师的机器学习公开课质量如何？')

&emsp;&emsp;不难看出**MateGen的RAG系统稳定高效，适合各种问答场景。**除了日常问答外，带有课件知识库的MateGen还可以进行教学辅导，例如指导学生课前预习、课中答疑、课后复习等。

#### 2.3 更新知识库

&emsp;&emsp;对于相同的知识库，若想增删一些文件，可以先在本地文件夹内操作，然后再调用`upload_knowledge_base`更新知识库即可：

In [6]:
mategen.upload_knowledge_base(knowledge_base_name='OpenML')

#### 2.4 切换知识库问答

&emsp;&emsp;MateGen还支持随时切换知识库进行问答。例如此时我们再创建一个知识库，用于存储MateGen的使用指南文档：

In [7]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY', 
                       knowledge_base_chat=True)

系统会自动创建MateGen文件夹：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707155027222.png" alt="image-20240707155027222" style="zoom:33%;" />

我们在MateGen文件夹中放置MateGen使用指南：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707155211341.png" alt="image-20240707155211341" style="zoom:33%;" />

然后开启对话，这里需要注意的是，在切换知识库后，我们需要先清理MateGen历史对话消息，以免历史对话消息影响后续RAG质量：

In [26]:
mategen.clear_messages()

清理完历史消息后再进行知识库问答：

In [8]:
mategen.chat('请检索你的知识库，并告诉我MateGen应该如何查看token消耗情况。')

&emsp;&emsp;然后随时可以切换回OpenML知识库进行问答，我们可以直接输入0，然后在知识库序号中选择OpenML进行问答即可：

In [9]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY', 
                       knowledge_base_chat=True)

In [10]:
mategen.chat('请检索你的知识库，并帮我介绍下网格搜索优化算法的优劣势')

并且由于MateGen本身是无限对话长度，因此哪怕现在没有调用MateGen使用方法知识库，但MateGen仍然可以读取此前对话记忆进行回答：

In [11]:
mategen.chat('很好，你是否还记得MateGen应该如何查看token消耗来着？')

#### 2.4 切换知识库问答

&emsp;&emsp;关闭知识库问答功能也非常简单，再次实例化MateGen，并取消knowledge_base_chat设置：

In [17]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY')

In [18]:
mategen.clear_messages()

### 3.借助MateGen实现NL2SQL

&emsp;&emsp;MateGen可以连接MySQL数据库，并且可以稳定高效实现NL2SQL。无需额外手动设置，当系统检测到用户需要进行数据库相关操作时，MateGen就会自动开启NL2SQL功能，完成SQL代码编写和运行：

- 输入数据库基本参数

In [19]:
mategen.chat('请帮我查看当前数据库中，总共有几张表。')

In [20]:
mategen.chat('好的，host:localhost,port:3306,ueser:root,password:19920229,database name:telco_db')

> 目前MateGen只支持MySQL数据库，更多数据库种类连接方式正在开发中。

- 数据库查询

In [19]:
mategen.chat('请帮我查看下，这八张表中，四个不带_new尾缀的数据集，数据量是否相同。')

- 数据查询

In [21]:
mategen.chat('你做得很好，接下来请帮我在user_payments表中，查看月消费金额最高的用户ID，以及对应的总消费金额是多少。')

- 数据读取

In [25]:
mategen.chat('很好，接下来请帮我将user_churn表读取到当前文件夹中，并命名为user_churn.csv')

然后即可在当前代码运行文件夹内找到这个数据集：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707174225784.png" alt="image-20240707174225784" style="zoom:33%;" />

### 4.借助MateGen实现NL2Python：本地代码解释器实现流程

&emsp;&emsp;MateGen还可以实现NL2Python，可以连接本地Python环境进行自动编程，进而辅助用户完成数据读取、数据预处理、数据建模、数据可视化等事项。

- 读取数据集

In [26]:
mategen.chat('好的，接下来请帮我将当前文件夹内的user_churn.csv读取到当前Python环境中。')

然后我们即可在当前操作空间中查看读取到的数据集：

In [29]:
# 更新命名空间，即可在本地调用代码操作结果
globals().update(MateGen.export_variables())
user_churn_df.head()

- 数据可视化

In [27]:
mategen.chat('好的，请用可视化的方式帮我分析下Churn字段的取值分布。')

&emsp;&emsp;这里需要注意，当涉及到绘图任务的时候，若设置了阿里云图床，则MateGen会自动将图片上传至oss图床，并保存每张图片的公开访问网址，方便后续组合图片形成数据分析报告。

> 在没有图床的情况下MateGen绘图功能也可正常使用，阿里云oss图床设置方法见下文《MateGen联网方式设置》部分。

> 除了可以进行数据清洗和数据可视化相关工作之外，MateGen还可以来进行机器学习建模或深度学习建模等复杂编程任务，并且，若带入企业代码库文档，MateGen还可以模仿企业代码习惯来进行编程。

### 5.MateGen复杂任务规划执行与自动debug功能

&emsp;&emsp;截止目前，我们介绍了MateGen的知识库问答、NL2SQL和NL2Python等功能，在继续介绍MateGen其他进阶功能之前，需要说明的是，MateGen的各项功能支持组合使用。当面对复杂任务的时候，MateGen会自动组合各项功能来构建执行流程，自动逐步执行任务，同时每一步遇到了任何问题都会自动debug。

- NL2SQL+NL2Python联动

&emsp;&emsp;例如，我们可以让MateGen直接从MySQL中读取数据集到Python中并本地进行保存，这个简单的例子中就涉及到NL2SQL和NL2Python两个功能的串联实现。

In [28]:
mategen.chat('接下来请帮我将数据库中user_payments读取到当前Python环境中，并在当前文件夹中保存一份user_payments.csv文件')

- 知识库问答+NL2SQL+NL2Python

&emsp;&emsp;同时，MateGen也支持在任何处理的环节即时查询知识库，这里我们创建一个telco_db知识库，然后保存一份md文件，其中包含了各数据集字段信息和`重要字段`列表。我们尝试让MateGen先读取这个知识库，获取`重要字段`列表信息，然后再从各个数据集中获取`重要字段`列表组成一个新的数据集，并读取到本地：

In [21]:
mategen = MateGenClass(api_key = 'YOUR_API_KEY', 
                       knowledge_base_chat=True)

其中telco_db文件夹中放置如下文件：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707211246277.png" alt="image-20240707211246277" style="zoom:33%;" />

其中`telco_data_dictionary`内容包含了数据库中每个数据集中所包含的字段情况、以及`重要字段说明`如下：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707211336385.png" alt="image-20240707211336385" style="zoom:33%;" />

接下来让MateGen在这一系列数据集中提取关键字段：

In [22]:
mategen.chat('请查阅你的知识库，确认数据集中最重要的字段，并帮我从不带尾缀_new的几张表中，挑选这些字段组成一张新的表，并保存在MySQL中，取名为telco')

上述流程中，不仅涉及到RAG、NL2SQL、NL2Python，还涉及到自动debug过程，上述过程中第一次将新数据集写入MySQL时遇到了缺失值、第二次操作时由遇到了重名数据集、第三次才顺利将数据集写入。

> MateGen会即时自主根据执行结果来调整执行流程，若反复多次都无法尝试成功，并不会无限尝试下去，而是会向用户求助。

然后即可查看当前操作空间中是否已经顺利读取该数据集：

In [24]:
# 更新命名空间，即可在本地调用代码操作结果
globals().update(MateGen.export_variables())
telco_df.head()

数据集中关键字段和知识库中列举关键字段一致：

In [30]:
telco_df.columns

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707211928265.png" alt="image-20240707211928265" style="zoom:33%;" />

数据库中也成功保存了telco数据集：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707212050570.png" alt="image-20240707212050570" style="zoom:33%;" />

> 除此之外，MateGen还支持Multi Function calling（一个任务开启多个功能）和Parallel Function calling（一个功能开多个执行器），借此提高响应效率。

In [31]:
mategen.clear_messages()

### 6.MateGen视觉能力

&emsp;&emsp;MateGen具备视觉能力，只需要在提问时附带图片连接，就可以调用MateGen的视觉能力、围绕图片进行识别再进行回答：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707212637973.png" alt="image-20240707212637973" style="zoom:33%;" />

In [32]:
mategen.chat('请帮我描述下这张图片上的内容：https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707212637973.png')

- MateGen视觉+NL2Python联动

&emsp;&emsp;同样，MateGen的视觉功能可以和别的功能联动，例如我们可以给MateGen输入一张图片，然后让其模仿绘制一张新的图，并且可以直接通过对话来修改图片。例如有张图片如下：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/fig_b92cda8f15534922a7ef72ff329146fb.png" alt="image-20240630215206479" style="zoom:40%;" />

接下来让MateGen先读取该图片，再借助其Python代码解释器，绘制一张一样的图片。

In [5]:
mategen.chat('请帮我描述下这张图片上的内容：https://ml2022.oss-cn-hangzhou.aliyuncs.com/fig_b92cda8f15534922a7ef72ff329146fb.png')

In [6]:
mategen.chat('非常好！现在，请基于你对这张图片的理解，使用Python代码帮我创建一组数据，使其满足图片上的数据分布，并编写一段Python绘图代码，绘制类似的图片，并直接运行你编写的代码。')

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/fig_000fb565989f4bfc862c77ccd5d977a9.png" alt="image-20240630215206479" style="zoom:40%;" />

可以看出基本能够对原图进行模仿绘制。接下来尝试对其进行修改，同样，我们让MateGen先参考一张图的配色，然后修改原图。参考图片如下：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240701222610915.png" alt="image-20240701222610915" style="zoom:33%;" />

In [8]:
mategen.chat('我觉这张图片颜色不够好看，请帮我参考这张图片上的主配色：https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240701222610915.png，调整原图配色。')

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240701223909424.png" alt="image-20240701223909424" style="zoom:33%;" />

### 7.MateGen联网能力

> 注意，由于MateGen会借助爬虫爬取公开数据，爬虫需要用到的cookies经常会失效，因此以下功能`不一定`能顺利运行，推荐先使用`check_network_environment()`函数测试下各项联网功能能否正常运行，并使用`internet_config_assistant()`获取联网设置帮助，并将自己的cookie输入作为参数，以便顺利实现联网功能。

#### 7.1 MateGen联网功能实现

&emsp;&emsp;MateGen自带联网功能，当用户的问题超出MateGen知识库时，MategGen就会开启联网功能，从互联网上获取答案。MateGen的互联网搜索由谷歌搜索API驱动（但无需联网工具即可使用），会从知乎、Github获取相关信息，更适合获取技术相关信息。同时，MateGen还可以调用Kaggle API，若用户有需求，可以从Kaggle上获取竞赛说明和热门Kernel方案构建知识库再来进行问答。

In [5]:
mategen.chat('请帮我介绍下阿里云最新发布的Qwen2大模型。')

In [6]:
mategen.chat('Qwen2可以用vLLM部署么？流程是什么样的呢？')

&emsp;&emsp;搜索问答的本质是爬取信息创建本地知识库，然后再进行回答，只要开启搜索就会创建一个临时文件夹，并取名为`auto_search`，保存在`knowledge_base`中：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240701231035060.png" alt="image-20240701231035060" style="zoom:50%;" />

> 若有需要，也可以将其设置为永久知识库。

#### 7.2 MateGen Kaggle竞赛辅导功能

&emsp;&emsp;除了能够适时开启联网功能并进行搜索问答外，MateGen还专门围绕Kaggle竞赛信息获取进行了优化。当用户希望了解某项竞赛信息时，只需要在MateGen参数位上输入`kaggle_competition_guidance=True`即可，并在弹出的对话框中输入感兴趣的Kaggle竞赛名称，MateGen就会自动使用Kaggle API，获取该项比赛的Overview（概览信息）、Data（数据集信息）以及热门Kernels（其他参赛者热门竞赛方案），并在本地创建竞赛同名知识库，并自动开启围绕当前竞赛知识库的问答功能。例如我们想要了解Kaggle上的一项名为`House Prices - Advanced Regression Techniques`比赛，即可按照如下方式执行：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240702004111331.png" alt="image-20240702004111331" style="zoom:50%;" />

In [4]:
mategen = MateGenClass(api_key=api_key, 
                       kaggle_competition_guidance=True)

此时当前竞赛的本地知识库位置如下：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240702005129111.png" alt="image-20240702005129111" style="zoom:50%;" />

获取的竞赛知识库文件如下，其中包含了比赛介绍、数据集介绍和热门竞赛方案：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240702005219380.png" alt="image-20240702005219380" style="zoom:50%;" />

接下来MateGen会自动带入该知识库进行问答，从而顺利完成竞赛辅导工作：

In [7]:
mategen.chat('请检索知识库，帮我详细介绍下House Prices这个竞赛')

In [8]:
mategen.chat('在你的知识库中，有什么比较精彩的高分竞赛方案么？能帮我分享下他们的思路么？')

#### 7.3 MateGen联网测试与设置

&emsp;&emsp;不过需要注意的是，MateGen的联网功能有一定使用门槛，有时会因为Cookie失效等原因无法顺利联网，因此MateGen自带了联网检测工具和设置函数，若原始Cookie失效，则可以调用相关实用函数手动输入新的Cookie来重启联网功能。

- MateGen联网检测函数：check_network_environment

In [4]:
check_network_environment()

&emsp;&emsp;check_network_environment会进行5项联网功能检测，首次使用MateGen时会发现oss对象存储设置不成功，是因为oss对象存储没有设置初始变量值，需要用户自行注册阿里云并获取oss存储相关信息，才能开启MateGen的oss存储功能。不过oss设置并不影响MateGen的联网功能，没有oss只会影响MateGen绘图功能无法自动保存到图床上。

- MateGen联网设置函数：internet_config_assistant

&emsp;&emsp;当然，我们可以调用internet_config_assistant函数获取各类不同网络环境设置指南和设置入口，例如，如果我们希望设置阿里云oss对象存储，则可以按照如下方式进行操作：

In [33]:
# 获取帮助
internet_config_assistant()

然后再进行设置即可：

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240707222652585.png" alt="image-20240707222652585" style="zoom:33%;" />

&emsp;&emsp;至此MateGen核心功能全部介绍完毕，欢迎各位用户参与使用并提交反馈。**目前MateGen正在公测，限量开放200个内测名额，每个名额包含100万token使用额度，每位用户限领一个API-KEY，若需继续使用，也可按需充值token额度。API-KEY领取、加入技术交流群、其他任何问题，<span style="color:red;">扫码添加客服小可爱(微信：littlelion_1215)，回复“MG”详询哦👇</span>**

<center><img src="https://ml2022.oss-cn-hangzhou.aliyuncs.com/img/image-20240706225245612.png" alt="image-20240706225245612" style="zoom:50%;" />