# 实习一：数据库应用案例设计
## PKU-XiaohongshuDB

**成员：**
- 李卓 2000013195
- 顾逸鸥
- 贺阳

## 一、业务需求
小红书App提供了多种功能，我们主要关注用户社交、发帖、评论、点赞、收藏、转发、浏览记录、私信等功能。

## 二、ER图设计
根据上述业务需求，我们需要确定实体，以及实体之间的联系。

### 1. 实体
我们共设立6种实体，并确定它们各自的属性（主码用下划线来标识）：
* **用户**（<u>小红书号</u>，昵称，姓名，手机号，地区，性别）
* **贴子**（<u>帖子ID</u>，发帖时间，帖子内容，帖子类别）
* **视频**（<u>视频ID</u>，发布时间，视频内容）
* **私信消息**（<u>消息ID</u>，消息内容，消息时间）

以上4种都是强实体，而对于评论和浏览记录，我们将其视作弱实体，依赖于贴子或视频而存在。主码应该是贴子ID/视频ID+分辨符。
* **评论**（<u>评论ID，帖子ID</u>，评论内容，评论时间）
* **浏览记录**（<u>记录ID, 用户ID</u>，浏览内容）

### 2. 联系
实体之间存在着若干种联系，我们一一列举如下：
* **关注**：用户与用户之间，多对多。该联系具有“关注时间”属性
* **发私信**：用户与私信消息之间，一对多
* **接受私信**：用户与私信消息之间，一对多
* **引用**：私信消息与私信消息之间，一对一
* **发帖**：用户与贴子之间，一对多
* **发布视频**：用户与视频之间，一对多
* **评论**：用户与贴子或视频之间，多对多
* **点赞**：用户与贴子或视频之间，多对多
* **收藏**：用户与贴子或视频之间，多对多
* **转发**：贴子与贴子之间，一对多。该联系具有“转发人ID”和“转发时间”属性

### 3. ER图
根据列出的实体和联系，我们可以绘制出ER图。
![ER图](./assets/ER图设计.png)


## 三、关系表创建
完成ER图的设计后，要将其转换成关系表。

6个实体各自对应一张表，要注意的是，2个弱实体的表中应有强实体的主码，代表对强实体的依附。
4个多对多联系（关注、评论、点赞、收藏）需单独创建表，表的主码是联系双方的主码。
剩余的都是一对多联系，不需要创建单独的表，而应该将单方参与实体的码作为多方参与实体的属性。

共有10张表，下面我们一一进行创建。注释中包含着一些说明。

1. 用户表（User）
```
用户ID, 昵称, 姓名, 手机号, 地区, 性别
```

2. 贴子表（Post）
```
帖子ID, 用户ID, 发帖时间, 帖子内容, 帖子类别
```

3. 视频表（Video）
```
视频ID, 用户ID, 发布时间, 视频内容
```

4. 私信消息表（Message）
```
消息ID, 发送者ID, 接收者ID, 消息内容, 消息时间, 引用消息ID（可选）
```

5. 评论表（Comment）
```
评论ID, 帖子ID, 用户ID, 评论内容, 评论时间
```

6. 浏览记录表（BrowseRecord）
```
记录ID, 用户ID, 浏览内容
```

7. 关注表（Follow）
```
关注者ID, 被关注者ID, 关注时间
```

8. 评论关系表（CommentRelation）
```
评论ID, 用户ID, 帖子ID/视频ID
```

9. 点赞关系表（LikeRelation）
```
点赞ID, 用户ID, 帖子ID/视频ID
```

10. 收藏关系表（CollectRelation）
```
收藏ID, 用户ID, 帖子ID/视频ID
```

根据上述关系表设计，可以满足小红书App的业务需求。在实际项目中，还需对这些关系表进行进一步优化，以提高查询性能、降低存储成本等。

## 环境配置与初始化（Configuration and Initialization）

In [None]:
%load_ext sql
import pymysql
pymysql.install_as_MySQLdb()
%sql mysql://stu2000013195:stu2000013195@162.105.146.37:43306