# **WebSocket 课件**

## 1. **介绍与概述**

### 1.1 什么是 WebSocket？

- WebSocket 是一种全双工通信协议，用于在客户端和服务器之间建立持久的连接。
- 它允许在连接期间，服务器和客户端都可以随时发送数据，不需要像 HTTP 那样每次通信都重新建立连接。

### 1.2 WebSocket 的特性

- **全双工**：客户端和服务器之间可以实时发送和接收数据。
- **长连接**：只需要建立一次连接，后续数据的交换不需要重新建立连接。
- **低延迟**：相比 HTTP 轮询，WebSocket 减少了不必要的开销，使得数据传输的延迟较低。

---

## 2. **WebSocket 的工作原理**

### 2.1 WebSocket 连接的建立

- WebSocket 通过标准的 HTTP 协议升级握手来建立连接，握手成功后，通信协议从 HTTP 切换为 WebSocket。

### 2.2 WebSocket 数据帧

- WebSocket 使用帧来传输数据，主要包括：
  - **Text frame**: 发送文本数据。
  - **Binary frame**: 发送二进制数据。
  - **Ping/Pong frame**: 用于保持连接活跃。
  - **Close frame**: 用于关闭连接。

---

## 3. **WebSocket 与 HTTP 的区别**

| 特性     | WebSocket                            | HTTP                               |
| -------- | ------------------------------------ | ---------------------------------- |
| 连接类型 | 持久连接（长连接）                   | 短连接（每次请求都建立新连接）     |
| 通信方向 | 双向（客户端与服务器都可以主动通信） | 单向（客户端发起请求，服务器响应） |
| 数据格式 | 二进制、文本                         | 主要是文本                         |
| 典型应用 | 聊天应用、实时游戏、股票行情推送等   | 静态网页、API请求等                |

---

## 4. **WebSocket 的应用场景**

### 4.1 实时通讯应用

- 在线聊天系统、即时通讯应用（如 WhatsApp、Slack）。

### 4.2 实时数据更新

- 股票行情推送、加密货币价格更新等。

### 4.3 实时多人在线游戏

- 在线游戏中，玩家的操作需要实时传输。

### 4.4 其他应用

- 实时协作工具（Google Docs 实时编辑）、IoT 设备实时通信等。

---

## 5. **WebSocket 与轮询技术的对比**

### 5.1 轮询

- HTTP 轮询是指客户端定期向服务器发送请求，询问是否有新的数据。
- 缺点：频繁的请求会增加带宽和服务器的负担。

### 5.2 WebSocket 的优势

- 更少的开销：建立连接后可以持续通信，无需每次都重新发送请求。
- 实时性：由于是全双工通信，服务器可以立即推送更新，而不需要等待客户端请求。

---

## 6. **WebSocket 的实际代码示例**

### 6.1 客户端代码

```html
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>WebSocket Example</title>
</head>
<body>
    <h1>WebSocket Example</h1>
    <button id="sendBtn">Send Message</button>
    <script>
        // 创建 WebSocket 连接
        const socket = new WebSocket('ws://localhost:8080');

        // 连接打开时
        socket.addEventListener('open', (event) => {
            console.log('WebSocket connection opened');
        });

        // 监听消息
        socket.addEventListener('message', (event) => {
            console.log('Message from server', event.data);
        });

        // 发送消息
        document.getElementById('sendBtn').addEventListener('click', () => {
            socket.send('Hello, Server!');
        });

        // 连接关闭时
        socket.addEventListener('close', (event) => {
            console.log('WebSocket connection closed');
        });
    </script>
</body>
</html>
```

### 6.2 服务器端代码 (python 示例)

```javascript
import asyncio
import websockets

# 处理客户端连接
async def handle_connection(websocket, path):
    print("Client connected")

    try:
        # 循环接收消息
        async for message in websocket:
            print(f"Received from client: {message}")

            # 响应客户端消息
            await websocket.send("Hello, Client!")
    except websockets.exceptions.ConnectionClosed as e:
        print("Connection closed", e)
    finally:
        print("Client disconnected")

# 启动 WebSocket 服务器
async def start_server():
    server = await websockets.serve(handle_connection, "localhost", 8080)
    print("Server started on ws://localhost:8080")
    await server.wait_closed()

# 运行事件循环
asyncio.get_event_loop().run_until_complete(start_server())

```

---



**Protocol Buffers (protobuf)** 是由 Google 开发的一种**序列化**和**反序列化**数据格式，用于高效地编码结构化数据。它是一种与语言和平台无关的、可扩展的二进制格式，常用于在不同系统、程序、服务之间进行数据交换。Protobuf 与 JSON 或 XML 类似，都是用来定义消息格式的方式，但相比之下，protobuf 在传输和存储时更为高效。

### 主要特点：
1. **跨语言支持**：protobuf 支持多种编程语言，如 C++, Java, Python, Go 等。
2. **高效的二进制格式**：与基于文本的格式（如 JSON、XML）相比，protobuf 采用二进制格式，传输效率更高，占用空间更少。
3. **向后兼容**：你可以轻松地更新你的数据结构，而不影响已部署的代码。这使得在服务演化过程中保持兼容性变得更容易。
4. **生成代码工具**：通过定义一个 `.proto` 文件，你可以生成相应语言的代码，来处理消息的编解码和解析。

### protobuf 一般用于以下场景：
1. **分布式系统**：在微服务架构中，不同服务之间的通信需要高效的数据序列化格式，protobuf 是常见的选择。
2. **网络通信**：因为其效率高、占用资源少，protobuf 被广泛应用于客户端和服务器之间的数据传输，尤其是在实时通信和移动应用场景下。
3. **数据存储**：在需要高效存储和读取结构化数据的场景中，protobuf 也被用来作为数据持久化的格式，尤其是在大数据处理和数据库系统中。
4. **RPC (远程过程调用)**：gRPC 是基于 protobuf 的一个高效远程过程调用框架，广泛用于跨网络的服务调用。

### 使用示例：
假设你想定义一个包含用户信息的 protobuf 消息：

```protobuf
syntax = "proto3";

message User {
  string name = 1;
  int32 id = 2;
  string email = 3;
}
```

然后，你可以通过生成工具生成相应的代码，并在你的应用程序中使用它来创建、序列化、反序列化这些消息。

总体而言，protobuf 以其高效的压缩和传输特性，广泛应用于需要高性能、低延迟数据传输的系统中。

1. 安装 protobuf 编译器和 Python 库
首先需要安装 protoc（Protocol Buffers 编译器）和 Python 的 protobuf 库。你可以通过以下命令来安装 protobuf 库：


pip install protobuf
2. 定义 .proto 文件
创建一个名为 user.proto 的文件，内容如下：



### 创建 `.proto` 文件

首先，更新你的 `user.proto` 文件：

```proto
syntax = "proto3";

message User {
  string name = 1;
  int32 id = 2;
  int32 age = 3;
  string major = 4;
  string university = 5;
  string message = 6;
}
```

这个新文件添加了年龄、专业、大学和弹幕信息字段。

### 使用生成的 Python 代码

下面是如何使用 Python 来创建并序列化这个对象的示例：

```python
import user_pb2

# 创建一个 User 对象
user = user_pb2.User()
user.name = "张三"
user.id = 888
user.age = 18
user.major = "管理科学"
user.university = "assist研究生"
user.message = "我爱人工智能，未来可期！"  # 弹幕信息

# 序列化为二进制格式
serialized_data = user.SerializeToString()

# 打印序列化的数据
print(f"Serialized Data: {serialized_data}")

# 反序列化二进制数据为对象
new_user = user_pb2.User()
new_user.ParseFromString(serialized_data)

# 打印反序列化后的对象信息
print(f"Name: {new_user.name}")
print(f"ID: {new_user.id}")
print(f"Age: {new_user.age}")
print(f"Major: {new_user.major}")
print(f"University: {new_user.university}")
print(f"弹幕信息: {new_user.message}")
```

### 解释：

1. **弹幕信息**：`user.message = "我爱电子商务，未来可期！"`，这是你要发送的弹幕信息，包含在 `User` 对象中。
2. **序列化和反序列化**：通过 `SerializeToString()` 和 `ParseFromString()` 来将数据进行序列化和反序列化。
3. **打印信息**：反序列化后打印张三的信息，包括学号、年龄、专业、大学和弹幕信息。



这样，你就可以成功地将张三的个人信息与弹幕一起传输并处理了。

In [1]:
import user_pb2

# 创建一个 User 对象
user = user_pb2.User()
user.name = "张三"
user.id = 888
user.age = 18
user.major = "电子商务"
user.university = "assist"
user.message = "我爱人工智能，未来可期！"  # 弹幕信息

# 序列化为二进制格式
serialized_data = user.SerializeToString()

# 打印序列化的数据
print(f"Serialized Data: {serialized_data}")

# 反序列化二进制数据为对象
new_user = user_pb2.User()
new_user.ParseFromString(serialized_data)

# 打印反序列化后的对象信息
print(f"Name: {new_user.name}")
print(f"ID: {new_user.id}")
print(f"Age: {new_user.age}")
print(f"Major: {new_user.major}")
print(f"University: {new_user.university}")
print(f"弹幕信息: {new_user.message}")

Serialized Data: b'\n\x06\xe5\xbc\xa0\xe4\xb8\x89\x10\xf8\x06\x18\x12"\x0c\xe7\x94\xb5\xe5\xad\x90\xe5\x95\x86\xe5\x8a\xa1*\x06assist2$\xe6\x88\x91\xe7\x88\xb1\xe4\xba\xba\xe5\xb7\xa5\xe6\x99\xba\xe8\x83\xbd\xef\xbc\x8c\xe6\x9c\xaa\xe6\x9d\xa5\xe5\x8f\xaf\xe6\x9c\x9f\xef\xbc\x81'
Name: 张三
ID: 888
Age: 18
Major: 电子商务
University: assist
弹幕信息: 我爱人工智能，未来可期！


In [2]:
!protoc --python_out=. user.proto 

In [2]:
import user_pb2

# 创建一个 User 对象
user = user_pb2.User()
user.name = "张三"
user.id = 888
user.age = 18
user.major = "电子商务"
user.university = "assist"
user.message = "我爱人工智能，未来可期！"  # 弹幕信息

# 序列化为二进制格式
serialized_data = user.SerializeToString()

# 打印序列化的数据
print(f"Serialized Data: {serialized_data}")

# 反序列化二进制数据为对象
new_user = user_pb2.User()
new_user.ParseFromString(serialized_data)

# 打印反序列化后的对象信息
print(f"Name: {new_user.name}")
print(f"ID: {new_user.id}")
print(f"Age: {new_user.age}")
print(f"Major: {new_user.major}")
print(f"University: {new_user.university}")
print(f"弹幕信息: {new_user.message}")

Serialized Data: b'\n\x06\xe5\xbc\xa0\xe4\xb8\x89\x10\xf8\x06\x18\x12"\x0c\xe7\x94\xb5\xe5\xad\x90\xe5\x95\x86\xe5\x8a\xa1*\x06assist2$\xe6\x88\x91\xe7\x88\xb1\xe4\xba\xba\xe5\xb7\xa5\xe6\x99\xba\xe8\x83\xbd\xef\xbc\x8c\xe6\x9c\xaa\xe6\x9d\xa5\xe5\x8f\xaf\xe6\x9c\x9f\xef\xbc\x81'
Name: 张三
ID: 888
Age: 18
Major: 电子商务
University: assist
弹幕信息: 我爱人工智能，未来可期！


In [4]:
!protoc --python_out=. dy.proto 

'wss://webcast5-ws-web-lq.douyin.com/webcast/im/push/v2/?app_name=douyin_web&version_code=180800&webcast_sdk_version=1.0.14-beta.0&update_version_code=1.0.14-beta.0&compress=gzip&device_platform=web&cookie_enabled=true&screen_width=1475&screen_height=830&browser_language=zh-CN&browser_platform=Win32&browser_name=Mozilla&browser_version=5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36&browser_online=true&tz_name=Etc/GMT-8&cursor=d-1_u-1_fh-7418255729305752611_t-1727198108721_r-1&internal_ext=internal_src:dim|wss_push_room_id:7418245105288547107|wss_push_did:7418212096275449370|first_req_ms:1727198108640|fetch_time:1727198108721|seq:1|wss_info:0-1727198108721-0-0|wrds_v:7418259383278113805&host=https://live.douyin.com&aid=6383&live_id=1&did_rule=3&endpoint=live_pc&support_wrds=1&user_unique_id=7418212096275449370&im_path=/webcast/im/fetch/&identity=audience&need_persist_msg_count=15&insert_task_id=&live_reason=&room_id=7418245105288547107&heartbeatDuration=0&signature=fZFUP36f+f9g3P34'

让我来分析一下这段代码，特别是关于 s 是如何生成的。
这段代码是一个名为 _getSocketParams 的函数，它接受一个对象 e 作为参数。函数的主要目的是构造一个 WebSocket 连接的 URL。
关于 s 的生成：

首先，代码创建了一个对象 A，它包含了几个固定的参数（如 app_name, version_code 等）以及从输入参数 e 中提取的 routeParams 和其他参数。
然后，s 是通过调用 x(A, r) 生成的。这里：

A 是刚刚创建的包含各种参数的对象
r 是从输入参数 e 中提取的 websocket_key


x 函数没有在这段代码中定义，但根据上下文，我们可以推测它可能是一个用于生成签名或者加密参数的函数。它可能使用 A 中的参数和 websocket_key 来生成一些额外的安全参数。
生成的 s 随后被合并到最终的 URL 参数中。

总结一下，s 是通过调用 x(A, r) 生成的，其中 A 是一个包含多个参数的对象，r 是 WebSocket 密钥。这个 s 可能代表一些额外的安全参数或签名，用于验证 WebSocket 连接的请求。
如果你需要更详细地了解 s 的具体内容或 x 函数的实现，你可能需要查看 x 函数的定义或者相关的文档。

In [4]:
pip install PyExecJS

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting PyExecJS
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/ba/8e/aedef81641c8dca6fd0fb7294de5bed9c45f3397d67fddf755c1042c2642/PyExecJS-1.5.1.tar.gz (13 kB)
  Preparing metadata (setup.py) ... [?25ldone
Building wheels for collected packages: PyExecJS
[33m  DEPRECATION: Building 'PyExecJS' using the legacy setup.py bdist_wheel mechanism, which will be removed in a future version. pip 25.3 will enforce this behaviour change. A possible replacement is to use the standardized build interface by setting the `--use-pep517` option, (possibly combined with `--no-build-isolation`), or adding a `pyproject.toml` file to the source tree of 'PyExecJS'. Discussion can be found at https://github.com/pypa/pip/issues/6334[0m[33m
doneding wheel for PyExecJS (setup.py) ... [?25l
[?25h  Created wheel for PyExecJS: filename=PyExecJS-1.5.1-py3-none-any.whl size=14578 sha256=e27c0206c595ce6a261bb7adf88d56c0ff6be4d7dedd539f16

In [None]:
from liveMan import DouyinLiveWebFetcher

if __name__ == '__main__':
    live_id = '154251804633'
    DouyinLiveWebFetcher(live_id).start()

WebSocket connected.
【直播间排行榜msg】[RoomRankMessageRoomRank(user=User(id=64183684320, short_id=0, nick_name='我有“小蜜”        蜜袋鼯', gender=0, signature='', level=0, birthday=0, telephone='', avatar_thumb=Image(url_list_list=['https://p11.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-avt-0015_305f476d377e74ecc98dff6ace2b0e70.jpeg?from=3067671334', 'https://p3.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-avt-0015_305f476d377e74ecc98dff6ace2b0e70.jpeg?from=3067671334', 'https://p26.douyinpic.com/aweme/100x100/aweme-avatar/tos-cn-avt-0015_305f476d377e74ecc98dff6ace2b0e70.jpeg?from=3067671334'], uri='100x100/aweme-avatar/tos-cn-avt-0015_305f476d377e74ecc98dff6ace2b0e70', height=0, width=0, avg_color='', image_type=0, open_web_url='', content=ImageContent(name='', font_color='', level=0, alternative_text=''), is_animated=False, flex_setting_list=NinePatchSetting(setting_list_list=[]), text_setting_list=NinePatchSetting(setting_list_list=[])), avatar_medium=Image(url_list_list=[], uri='', heig

In [8]:
!pip install PyExecJS
!pip install betterproto

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting betterproto
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/ff/2e/abfed7a721928e14aeb900182ff695be474c4ee5f07ef0874cc5ecd5b0b1/betterproto-1.2.5.tar.gz (26 kB)
  Installing build dependencies ... [?done
doneGetting requirements to build wheel ... [?25l
donePreparing metadata (pyproject.toml) ... [?25l
Collecting grpclib (from betterproto)
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/03/8b/ad381ec1b8195fa4a9a693cb8087e031b99530c0d6b8ad036dcb99e144c4/grpclib-0.4.8-py3-none-any.whl (76 kB)
Collecting stringcase (from betterproto)
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/f3/1f/1241aa3d66e8dc1612427b17885f5fcd9c9ee3079fc0d28e9a3aeeb36fa3/stringcase-1.2.0.tar.gz (3.0 kB)
doneing metadata (setup.py) ... [?25l
Collecting h2<5,>=3.1.0 (from grpclib->betterproto)
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/d0/9e

In [None]:
pip install betterproto