# 1小时入门 Gradio 框架：定制你的 AI Agent 程序界面

## 课程介绍

### 课程目标

1. **了解Gradio框架**：对Gradio框架有一个全面的认识，包括其背后的设计理念、主要功能和应用场景。
2. **掌握Gradio的核心概念**：理解Gradio的工作流程、核心概念如Interface和Component，以及如何使用其常用模块。
3. **实践Gradio应用开发**：通过实际的代码演示和操作，使用Gradio构建AI Agent的用户界面，特别是如何为ChatGPT agent设计图形界面。
4. **分析Stable Diffusion的UI**：了解什么是Stable Diffusion，以及如何使用Gradio构建其用户界面。


## 第一部分：为什么选择Gradio作为AGI（Artificial General Intelligence）的UI工具

### 1. **什么是Gradio**
[Gradio官网链接](https://gradio.app/)

Gradio allows you to build demos and share them, all in Python. And usually in just a few lines of code!

### 2. **简单性和易用性**
Prerequisite: Gradio requires Python 3.8 or higher, that’s all!

### 3. **无需前端开发经验**

### 4. **快速原型开发**

### 5. **可以与其他工具和库集成**

### 6. **广泛的应用场景**
如：Stable Diffusion


## 第二部分：Stable Diffusion的UI分析


- **什么是Stable Diffusion**
- **Stable Diffusion的UI界面**
- **与其他方法的比较**

1. **简单性和快速部署**：Gradio允许用户在几行代码内快速创建和部署机器学习模型的界面，无需复杂的前端开发经验。
2. **灵活的输入/输出组件**：Gradio提供了多种预定义的输入和输出组件，如图像、文本、音频等，使得与模型的交互更为直观和简单。
3. **与其他工具和库的集成**：Gradio可以轻松地与其他流行的机器学习库和工具集成，如TensorFlow、PyTorch等，为用户提供了广泛的应用场景。


## 第三部分：Gradio工作模式


- **工作流程**
- **部署**


In [2]:
%pip install gradio

Looking in indexes: https://pypi.mirrors.ustc.edu.cn/simple
Collecting gradio
  Downloading https://mirrors.bfsu.edu.cn/pypi/web/packages/c5/49/ea7450fb03b926110181b758ff30a8426a6aaa60ae99f149ec3e7bacf04e/gradio-4.40.0-py3-none-any.whl (12.5 MB)
     ---------------------------------------- 0.0/12.5 MB ? eta -:--:--
     - -------------------------------------- 0.4/12.5 MB 13.9 MB/s eta 0:00:01
     --- ------------------------------------ 1.0/12.5 MB 12.2 MB/s eta 0:00:01
     ---- ----------------------------------- 1.5/12.5 MB 12.0 MB/s eta 0:00:01
     ------ --------------------------------- 2.1/12.5 MB 11.9 MB/s eta 0:00:01
     -------- ------------------------------- 2.6/12.5 MB 11.9 MB/s eta 0:00:01
     ---------- ----------------------------- 3.1/12.5 MB 11.8 MB/s eta 0:00:01
     ----------- ---------------------------- 3.7/12.5 MB 11.8 MB/s eta 0:00:01
     ------------- -------------------------- 4.2/12.5 MB 11.8 MB/s eta 0:00:01
     --------------- ---------------------

ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
s3fs 2023.4.0 requires fsspec==2023.4.0, but you have fsspec 2024.6.1 which is incompatible.


- **Hello World**

In [1]:
# 导入gradio库，简称为gr
import gradio as gr

# 定义一个函数，该函数接收一个名为name的参数，并返回一个问候消息
def greet(name):
    return "Hello " + name + "!"

# 使用gr.Interface创建一个界面。这个界面将使用上面定义的greet函数。
# 输入和输出都是文本格式。
demo = gr.Interface(fn=greet, inputs="text", outputs="text")
    
# 启动创建的界面，这将在浏览器中打开一个新的窗口/标签页，用户可以在其中输入名字并接收问候消息。
demo.launch(share=True)   


Running on local URL:  http://127.0.0.1:7860
Running on public URL: https://9f891e13aa270e1a7c.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




## 核心Interface类的初始化

核心`Interface`类使用三个必需参数进行初始化：

- **fn**：包装 UI 的函数
- **inputs**：用于输入的组件（例如"text"、"image"或"audio"）
- **outputs**：用于输出的组件（例如"text"、"image"或"label"）


In [2]:
# 写个更复杂的Hello World

import gradio as gr

# 定义一个函数，该函数接收三个参数：名字、是否是早上以及温度。
# 函数返回一个问候消息以及温度的摄氏值。
def greet(name, is_morning, temperature):
    # 根据is_morning的值选择合适的问候语
    salutation = "上午好" if is_morning else "下午好"
    # 使用f-string格式化问候消息
    greeting = f"{salutation} {name}. 今天的温度是 {temperature} 华氏度"
    # 将温度从华氏度转换为摄氏度
    celsius = (temperature - 32) * 5 / 9
    # 返回格式化的问候消息和摄氏温度（保留两位小数）
    return greeting, round(celsius, 2)

# 使用gr.Interface创建一个界面。这个界面将使用上面定义的greet函数。
# 输入包括：文本框（名字）、复选框（是否是早上）和滑块（温度，范围从0到100）。
# 输出包括：文本（问候消息）和数字（摄氏温度）。
demo = gr.Interface(
    fn=greet,
    inputs=["text", "checkbox", gr.Slider(0, 100)],
    outputs=["text", "number"],
)

# 启动创建的界面，这将在浏览器中打开一个新的窗口/标签页，用户可以在其中输入信息并接收问候消息和摄氏温度。
demo.launch()


Running on local URL:  http://127.0.0.1:7861

To create a public link, set `share=True` in `launch()`.




In [4]:
%pip install numpy

Looking in indexes: https://pypi.mirrors.ustc.edu.cn/simple
Note: you may need to restart the kernel to use updated packages.


In [8]:
# 来试试图片功能
# 导入numpy库，简称为np，用于数值计算
import numpy as np
# 导入gradio库，简称为gr，用于创建交互式界面
import gradio as gr

# 定义一个函数，该函数接收一个输入图像，并返回经过sepia滤镜处理的图像
def sepia(input_img):
    # 定义sepia滤镜的转换矩阵
    sepia_filter = np.array([
        [0.393, 0.769, 0.189], 
        [0.349, 0.686, 0.168], 
        [0.272, 0.534, 0.131]
    ])
    # 使用dot函数将输入图像与sepia滤镜的转换矩阵相乘，得到sepia效果的图像
    sepia_img = input_img.dot(sepia_filter.T)
    # 将sepia图像的值归一化到[0, 1]范围
    sepia_img /= sepia_img.max()
    # 返回处理后的sepia图像
    return sepia_img

# 使用gr.Interface创建一个界面。这个界面将使用上面定义的sepia函数。
# 输入是一个200x200的图像，输出是一个经过sepia滤镜处理的图像。
demo = gr.Interface(sepia, gr.Image(image_mode='RGB'), "image")

# 启动创建的界面，这将在浏览器中打开一个新的窗口/标签页，用户可以上传图像并查看经过sepia滤镜处理的结果。
demo.launch()


Running on local URL:  http://127.0.0.1:7862

To create a public link, set `share=True` in `launch()`.




In [9]:
# 组合一下文字和图片（概念：块布局）

# 导入numpy库，用于数值计算
import numpy as np
# 导入gradio库，用于创建交互式界面
import gradio as gr

# 定义一个函数，该函数接收一个字符串并返回其反转字符串
def flip_text(x):
    return x[::-1]

# 定义一个函数，该函数接收一个图像数组并返回其左右翻转的图像
def flip_image(x):
    return np.fliplr(x)

# 使用gr.Blocks创建一个块结构的界面
with gr.Blocks() as demo:
    # 添加Markdown文本，描述界面的功能
    gr.Markdown("翻转文字和图片")
    
    # 创建一个名为"Flip Text"的标签页
    with gr.Tab("翻转文字标签"):
        # 在标签页内添加一个文本输入框
        text_input = gr.Textbox()
        # 在标签页内添加一个文本输出框
        text_output = gr.Textbox()
        # 在标签页内添加一个按钮，用于触发文本翻转操作
        text_button = gr.Button("翻转文字")
    
    # 创建一个名为"Flip Image"的标签页
    with gr.Tab("翻转图片标签"):
        # 在标签页内添加一个行结构
        with gr.Row():
            # 在行内添加一个图像输入组件
            image_input = gr.Image()
            # 在行内添加一个图像输出组件
            image_output = gr.Image()
        # 在标签页内添加一个按钮，用于触发图像翻转操作
        image_button = gr.Button("翻转图片")
    
    # 创建一个可折叠的手风琴组件，包含更多信息
    with gr.Accordion("更多信息"):
        # 在手风琴组件内添加Markdown文本
        gr.Markdown("Look at me...")
    
    # 设置文本按钮的点击事件，将触发flip_text函数，并连接输入和输出组件
    text_button.click(flip_text, inputs=text_input, outputs=text_output)
    # 设置图像按钮的点击事件，将触发flip_image函数，并连接输入和输出组件
    image_button.click(flip_image, inputs=image_input, outputs=image_output)

# 启动创建的界面，这将在浏览器中打开一个新的窗口/标签页，用户可以进行文本或图像翻转操作
demo.launch()


Running on local URL:  http://127.0.0.1:7863

To create a public link, set `share=True` in `launch()`.




## 核心概念

### Interface

`Interface` 是 Gradio 库中的一个核心类，它用于创建和管理用户界面（UI）。通过 `Interface` 类，你可以轻松地将一个 Python 函数包装成一个完整的前端应用。这个类接受多个参数，其中最重要的三个是：

- `fn`：这是你想要展示或测试的 Python 函数。该函数的输入和输出将与界面的输入和输出组件相连接。
- `inputs`：这定义了用户如何与你的函数交互。Gradio 提供了多种预定义的输入组件，如文本框、滑块、图像上传器等。
- `outputs`：这定义了函数输出应如何展示。与 `inputs` 类似，你也可以选择多种预定义的输出组件。

`Interface` 类提供了一系列方法（如 `.launch()`）来管理 UI 的生命周期，包括启动、关闭和重新加载界面。

### Component

`Component` 是构成 Gradio UI 的基础元素。在 Gradio 中，几乎所有的输入和输出组件都是 `Component` 类或其子类的实例。组件负责处理与用户交互有关的所有事务，包括数据的收集和展示。

Gradio 提供了多种类型的组件，分别对应不同类型的数据和交互方式。例如：

- 文本组件（如 `Textbox`）：用于接收和展示文本数据。
- 图像组件（如 `Image`）：用于接收和展示图像数据。
- 控制组件（如 `Slider`、`Checkbox`）：用于接收一些特定范围或选项的输入。

每种组件都有其特定的属性和方法，允许你进行高度定制。例如，你可以设置滑块的最大值和最小值，或者为图像组件设置预期的输入尺寸。

`Interface` 和 `Component` 是 Gradio 库中两个最核心的概念。通过它们，即使没有前端开发经验，你也可以快速地为你的机器学习模型或任何 Python 函数创建一个交互式的、易于使用的界面。


## 第四部分：Gradio常用模块

[Gradio组件和原理](https://www.gradio.app/docs/components)

- **页面组件**
  - **Button, Textbox** 等
- **功能组件**
  - **输入输出组件：Image, Text** 等
  - **控制组件：Slider, Checkbox** 等
- **布局组件**
  - **Container, Section** 等
  


## 第五部分：写一个图形界面的ChatGPT agent


- **设计UI**
  - **输入框和输出框**
- **集成OpenAI模型**
- **代码演示和测试**


In [7]:
%pip install --upgrade openai

Looking in indexes: https://pypi.mirrors.ustc.edu.cn/simple
Note: you may need to restart the kernel to use updated packages.


Traceback (most recent call last):
  File "d:\software\anaconda3\Lib\site-packages\gradio\queueing.py", line 536, in process_events
    response = await route_utils.call_process_api(
               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "d:\software\anaconda3\Lib\site-packages\gradio\route_utils.py", line 285, in call_process_api
    output = await app.get_blocks().process_api(
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "d:\software\anaconda3\Lib\site-packages\gradio\blocks.py", line 1923, in process_api
    result = await self.call_function(
             ^^^^^^^^^^^^^^^^^^^^^^^^^
  File "d:\software\anaconda3\Lib\site-packages\gradio\blocks.py", line 1506, in call_function
    prediction = await fn(*processed_input)
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "d:\software\anaconda3\Lib\site-packages\gradio\utils.py", line 785, in async_wrapper
    response = await f(*args, **kwargs)
               ^^^^^^^^^^^^^^^^^^^^^^^^
  File "d:\software\anaconda3\Lib\site-

In [10]:
from openai import OpenAI
import gradio as gr
import os

# 设置OpenAI API的密钥。请确保替换为你自己的API密钥
# os.environ["OPENAI_API_KEY"] = "你的API 密钥"  # Replace with your key
# os.environ["http_proxy"] = "http://127.0.0.1:17890"
os.environ["https_proxy"] = "http://127.0.0.1:17890"

# 初始化OpenAI API密钥
api_key = os.getenv("OPENAI_API_KEY")
client = OpenAI(api_key=api_key)


# 定义一个函数，该函数接收一个消息和历史对话，然后返回GPT模型的响应
def predict(message, history):
    # 初始化一个空列表，用于存储历史对话
    history_openai_format = []
    
    # 遍历历史对话，将其添加到列表中
    for human, assistant in history:
        history_openai_format.append({"role": "user", "content": human })
        history_openai_format.append({"role": "assistant", "content":assistant})

        
    # 将当前消息也添加到历史对话中
    history_openai_format.append({"role": "user", "content": message})
    
    # 使用OpenAI API与GPT模型进行交互，并获取响应
    # http://platform.openai.com
    response = client.chat.completions.create(model='gpt-4o-mini',
    messages= history_openai_format,
    temperature=1.0,
    stream=True)
    
    partial_message = ""
    for chunk in response:
        if chunk.choices[0].delta.content is not None:
              partial_message = partial_message + chunk.choices[0].delta.content
              yield partial_message

# 使用gr.ChatInterface创建一个聊天界面，并使用上面定义的predict函数
gr.ChatInterface(predict).launch(share=True)


Running on local URL:  http://127.0.0.1:7866
Running on public URL: https://6c03918820a010efde.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




## 课程总结和Q&A

### 总结

在本课程中，我们深入探讨了Gradio框架，一个用于快速创建交互式AI界面的工具。我们了解了其核心概念，如`Interface`和`Component`，并通过实际的代码示例展示了如何使用Gradio为不同的应用创建界面。此外，我们还讨论了Gradio与其他框架的比较，强调了其易用性、灵活性和与其他工具的集成能力。

### 下一步学习路径

1. **深入Gradio**：探索Gradio的高级功能和特性，如自定义样式、部署到生产环境等。
2. **集成其他AI模型**：学习如何使用Gradio与其他流行的机器学习和深度学习框架集成，如TensorFlow、PyTorch等。
3. **UI/UX设计**：为了创建更加用户友好的界面，可以进一步学习UI/UX设计的基础知识。

### 问题和答疑


