在上节课中我们已经完成了前三个步骤，今天我们进行分段统计，绘制出折线图。

1. 分析网页，找到弹幕所在网页位置；
2. 向网页发送请求，获取网页代码；
3. 解析网页，提取弹幕发布时间；
4. 将弹幕发布时间进行分段统计；
5. 绘制折线图。

# 分段统计

想要找出视频中弹幕数较多的部分，我们就需要对视频时间进行拆分，比如说以 30 秒为单位进行分段。

在每个时间范围内进行弹幕数统计，就可以知道每个分段的弹幕数了。

这样的统计方法就是分段统计。

在日常生活中，有很多分段统计的场景。比如对学生成绩的分段统计，对销售额的分段统计，人口普查中各年龄段人数的统计等。

以学生成绩为例。以右图所示，上图为全班同学的数学测试分数，下图对分数进行了分段统计。

可以非常直观地看到各分数段的人数，有利于老师们快速了解本次考试结果，对考试情况作出分析。

# 实现分段统计

我们该如何对视频弹幕进行分段统计呢？

在之前的课程中，我们学习过词频统计，在这里还是可以使用字典进行统计。

首先，创建一个空白字典；

可以把视频以 30 秒为单位进行分段，将分段区间作为字典的键添加进字典中，对应的值设为 0。

接着判断弹幕发布时间，是否在分段区间内；如果在分段区间内，就把对应的值进行累加。

有了思路后，就一步步实现吧。

原视频总时长为 12 分 23 秒，也就是一共有 743 秒；以 30 秒为单位进行分段的话，可以分为 25 段。(743/30)

## 分段区间

我们来分析一下分段区间的构成。

每一个分段的起始值为 30 的倍数加1。
每一个分段的结束值为 30 的倍数。

如果我们用数学方式表示的话：
起始值：30*x+1
结束值：30*(x+1)
x的取值范围为 0-24

怎么用代码生成分段区间呢？

我们可使用 for 循环遍历 range() 函数生成的 0-24 的数字。

将 `30*x+1` 赋值给变量 start， `30*(x+1)` 赋值给变量 end；

使用 格式化 start 和 end，用 短横线相连 并赋值给 segment_range。

In [1]:
# TODO 使用for循环遍历range()函数生成的0-24的数字
for x in range(25):

    # TODO 将30*x+1赋值给变量start
    start = 30*x+1

    # TODO 将30*(x+1)赋值给变量end
    end = 30*(x+1)

    # TODO 格式化字符串start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # TODO 使用print输出segment_range
    print(segment_range)

1-30
31-60
61-90
91-120
121-150
151-180
181-210
211-240
241-270
271-300
301-330
331-360
361-390
391-420
421-450
451-480
481-510
511-540
541-570
571-600
601-630
631-660
661-690
691-720
721-750


回到我们的程序中。在这里，我们需要新建一个字典 subtitlesDict。

我们可使用 for 循环遍历 range() 函数生成的 0-24 的数字。

将 `30*x+1` 赋值给变量 start， `30*(x+1)` 赋值给变量 end；

使用 格式化 start 和 end，用 短横线相连 并赋值给 segment_range。

把 segment_range 作为字典 subtitlesDict 的键，添加进字典中，再将字典中键所对应的值设置为 0。

In [2]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# 将https://comment.bilibili.com/218710655.xml赋值给变量url
url = "https://comment.bilibili.com/218710655.xml"

# 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# 调用.encoding属性获取requests模块的编码方式
# 调用.apparent_encoding属性获取网页编码方式
# 将网页编码方式赋值给response.encoding
response.encoding = response.apparent_encoding

# 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml,"lxml")

# 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name = "d")

# 新建一个列表timeList
timeList = []

# for循环遍历content_all
for comment in content_all:

    # 使用.attrs获取p对应的属性值，并赋值给data
    data = comment.attrs["p"]
    
    # 使用split()函数分割data，获取时间并赋值给time
    time = data.split(",")[0]

    # 将time转换成浮点数，添加进列表timeList中
    timeList.append(float(time))

# TODO 新建一个字典subtitlesDict
subtitlesDict = {}

# TODO 使用for循环遍历range()函数生成的0-24的数字
for x in range(25):

    # TODO 将30*x+1赋值给变量start
    start = 30*x+1

    # TODO 将30*(x+1)赋值给变量end
    end = 30*(x+1)

    # TODO 格式化start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # TODO 将segment_range作为字典subtitlesDict的键,添加进字典中
    # 将字典中键所对应的值设置为0
    subtitlesDict[segment_range] = 0

# TODO print输出subtitlesDict
print(subtitlesDict)

{'1-30': 0, '31-60': 0, '61-90': 0, '91-120': 0, '121-150': 0, '151-180': 0, '181-210': 0, '211-240': 0, '241-270': 0, '271-300': 0, '301-330': 0, '331-360': 0, '361-390': 0, '391-420': 0, '421-450': 0, '451-480': 0, '481-510': 0, '511-540': 0, '541-570': 0, '571-600': 0, '601-630': 0, '631-660': 0, '661-690': 0, '691-720': 0, '721-750': 0}


接下来，我们要判断弹幕发布时间是否在分段区间内。

可以遍历字典的所有键，使用 split() 函数以短横线分隔字典的键。

获取第一项也就分段区间的开始时间，赋值给变量 start_key；获取第二项也就分段区间的结束时间，赋值给变量 end_key。

In [4]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# 将https://comment.bilibili.com/218710655.xml赋值给变量url
url = "https://comment.bilibili.com/218710655.xml"

# 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# 调用.encoding属性获取requests模块的编码方式
# 调用.apparent_encoding属性获取网页编码方式
# 将网页编码方式赋值给response.encoding
response.encoding = response.apparent_encoding

# 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml,"lxml")

# 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name = "d")

# 新建一个列表timeList
timeList = []

# for循环遍历content_all
for comment in content_all:

    # 使用.attrs获取p对应的属性值，并赋值给data
    data = comment.attrs["p"]
    
    # 使用split()函数分割data，获取时间并赋值给time
    time = data.split(",")[0]

    # 将time转换成浮点数，添加进列表timeList中
    timeList.append(float(time))

# 新建一个字典subtitlesDict
subtitlesDict = {}

# 使用for循环遍历range()函数生成的0-24的数字
for x in range(25):

    # 将30*x+1赋值给变量start
    start = 30*x+1

    # 将30*(x+1)赋值给变量end
    end = 30*(x+1)

    # 格式化start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # 将segment_range作为字典subtitlesDict的键,添加进字典中
    # 将字典中键所对应的值设置为0
    subtitlesDict[segment_range] = 0
    
# TODO for循环遍历字典subtitlesDict所有的键
for subtitle in subtitlesDict.keys():

    # TODO 使用split()分隔字典的键获取第一项，赋值给变量start_key
    start_key = subtitle.split("-")[0]

    # TODO 使用split()分隔字典的键获取第二项，赋值给变量end_key
    end_key = subtitle.split("-")[1]

    # TODO 使用print输出start_key
    print(start_key)

    # TODO 使用print输出end_key
    print(end_key)

1
30
31
60
61
90
91
120
121
150
151
180
181
210
211
240
241
270
271
300
301
330
331
360
361
390
391
420
421
450
451
480
481
510
511
540
541
570
571
600
601
630
631
660
661
690
691
720
721
750


分隔好分段区间的一头一尾时间后，接下来就要对弹幕发布时间进行统计。

首先 for 循环变量列表 timeList，如果弹幕分布时间在整型 start_key 和整型 end_key 之间，也就是大于等于整型 start_key，小于等于整型 end_key，就将字典中键所对应的值累加。

In [5]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# 将https://comment.bilibili.com/218710655.xml赋值给变量url
url = "https://comment.bilibili.com/218710655.xml"

# 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# 调用.encoding属性获取requests模块的编码方式
# 调用.apparent_encoding属性获取网页编码方式
# 将网页编码方式赋值给response.encoding
response.encoding = response.apparent_encoding

# 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml,"lxml")

# 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name = "d")

# 新建一个列表timeList
timeList = []

# for循环遍历content_all
for comment in content_all:

    # 使用.attrs获取p对应的属性值，并赋值给data
    data = comment.attrs["p"]
    
    # 使用split()函数分割data，获取时间并赋值给time
    time = data.split(",")[0]

    # 将time转换成浮点数，添加进列表timeList中
    timeList.append(float(time))

# 新建一个字典subtitlesDict
subtitlesDict = {}

# 使用for循环遍历range()函数生成的0-24的数字
for x in range(25):

    # 将30*x+1赋值给变量start
    start = 30*x+1

    # 将30*(x+1)赋值给变量end
    end = 30*(x+1)

    # 格式化start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # 将segment_range作为字典subtitlesDict的键,添加进字典中
    # 将字典中键所对应的值设置为0
    subtitlesDict[segment_range] = 0
    
# for循环遍历字典subtitlesDict所有的键
for subtitle in subtitlesDict.keys():

    # 使用split()分隔字典的键获取第一项，赋值给变量start_key
    start_key = subtitle.split("-")[0]

    # 使用split()分隔字典的键获取第二项，赋值给变量end_key
    end_key = subtitle.split("-")[1]

    # TODO for循环遍历列表timeList
    for item in timeList:

        # TODO 如果弹幕分布时间在整型start_key和整型end_key之间

        if int(start_key) <= item <= int(end_key):
            # TODO 将字典中键所对应的值累加
            subtitlesDict[subtitle] = subtitlesDict[subtitle] + 1

# TODO 使用字典输出subtitlesDict
print(subtitlesDict)

{'1-30': 40, '31-60': 102, '61-90': 68, '91-120': 19, '121-150': 25, '151-180': 53, '181-210': 41, '211-240': 29, '241-270': 15, '271-300': 17, '301-330': 38, '331-360': 32, '361-390': 35, '391-420': 22, '421-450': 19, '451-480': 37, '481-510': 27, '511-540': 34, '541-570': 21, '571-600': 12, '601-630': 15, '631-660': 18, '661-690': 49, '691-720': 12, '721-750': 17}


# 折线图

现在我们将视频弹幕进行了分段统计，将数据储存在一个字典中。

但是这样的呈现形式不太直观，也不太容易作出结果分析，接下来我们要将这些数据进行可视化处理，绘制出折线图。

折线图用于显示数据在一个连续时间或者时间跨度上的变化。

它的特点是反映事物随时间变化的趋势。例如可用来分析某类商品随时间变化的销售额，从而进一步预测未来的销售情况。

在折线图中，一般水平轴（x轴）用来表示时间，并且间隔相同；垂直轴（y轴）代表数据的大小。

在这里，视频时间分段区间作为折线图的 x 轴，分段区间内的弹幕总数作为 y 轴。

# 生成折线图

想要生成折线图，我们需要从 pyecharts.charts 中导入 Line 模块。

接下来，还要学习三个相关函数。
1. Line() 函数
2. add_xaxis()函数
3. add_yaxis()函数

## Line()

首先从 pyecharts.charts 中导入 Line 模块

Line() 函数创建一个 Line 对象，赋值给变量 line。

In [6]:
from pyecharts.charts import Line
saleDict = {"1月": 70, "2月": 80, "3月": 100, "4月": 60, "5月": 120, "6月": 100}
line = Line()

  super().__init__(init_opts=init_opts)


## add_xaxis()

add_xaxis() 函数可以设置折线图的 x 轴。

In [7]:
from pyecharts.charts import Line
saleDict = {"1月": 70, "2月": 80, "3月": 100, "4月": 60, "5月": 120, "6月": 100}
line = Line()
line.add_xaxis(list(saleDict.keys()))

  and should_run_async(code)
  super().__init__(init_opts=init_opts)


<pyecharts.charts.basic_charts.line.Line at 0x7fdf0a4ef970>

在 add_xaxis() 函数中传入一个参数，这个参数的类型是列表，列表中的元素顺序表示折线图 x 轴从左到右的刻度。

在这里我们要传入所有的月份，可以使用 keys() 函数获取字典中所有的键，再使用 list() 函数将格式转换成列表。

通过 Line 对象调用 add_xaxis() 函数，设置对应折线图的 x 轴。

## add_yaxis()

add_yaxis() 函数可以设置折线图的 y 轴及折线图相关参数。

在这里我们添加了数据统称和y轴的值。

In [8]:
from pyecharts.charts import Line
saleDict = {"1月": 70, "2月": 80, "3月": 100, "4月": 60, "5月": 120, "6月": 100}
line = Line()
line.add_xaxis(list(saleDict.keys()))
line.add_yaxis("销售额", list(saleDict.values()))

  and should_run_async(code)
  super().__init__(init_opts=init_opts)


<pyecharts.charts.basic_charts.line.Line at 0x7fdf0a4eff40>

### 数据统称
在 add_yaxis() 函数中，可以设置数据统称，位于折线图的最上方。

在折线图的y轴上，展示的是统计后的数据。

这里我们要传入统计后的数据，可以使用 values() 函数获取字典中所有的值，在使用 list() 函数将格式转换成列表。

# 折线图分析

设置完折线图的参数后，可以使用render()函数默认折线图以html格式存储在代码所在文件夹内。

In [9]:
# 从pyecharts.chart中导入Line
from pyecharts.charts import Line

# 字典saleDict
saleDict = {"1月": 70, "2月": 80, "3月": 100, "4月": 60, "5月": 120, "6月": 100}

# 创建一个Line对象，赋值给line
line = Line()

# 使用list()将字典saleDict所有键转换成列表，传入add_xaxis()中
line.add_xaxis(list(saleDict.keys()))

# TODO 使用add_yaxis()函数，将数据统称设置为"销售额"
# 将字典saleDict所有值转换成列表，作为参数添加进函数中
line.add_yaxis("销售额", list(saleDict.values()))

# TODO 使用render()函数存储文件，设置文件名为line.html
line.render("line_13.html")

from IPython.display import IFrame

IFrame(src='./line_13.html', width=900, height=500)

  and should_run_async(code)
  super().__init__(init_opts=init_opts)


使用 add_yaxis() 函数设置折线图的y轴及相关参数。

添加折线图的数据统称为"弹幕数"，将字典 subtitlesDict 的所有值设置为折线图 y 轴的值。

使用 render() 函数html存储文件，设置文件名为line.html。

In [10]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# 从pyecharts.charts中导入Line模块
from pyecharts.charts import Line

# 将https://comment.bilibili.com/218710655.xml赋值给变量url
url = "https://comment.bilibili.com/218710655.xml"

# 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# 调用.encoding属性获取requests模块的编码方式
# 调用.apparent_encoding属性获取网页编码方式
# 将网页编码方式赋值给response.encoding
response.encoding = response.apparent_encoding

# 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml,"lxml")

# 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name = "d")

# 新建一个列表timeList
timeList = []

# for循环遍历content_all
for comment in content_all:

    # 使用.attrs获取p对应的属性值，并赋值给data
    data = comment.attrs["p"]
    
    # 使用split()函数分割data，获取时间并赋值给time
    time = data.split(",")[0]

    # 将time转换成浮点数，添加进列表timeList中
    timeList.append(float(time))

# 新建一个字典subtitlesDict
subtitlesDict = {}

# 使用for循环遍历range()函数生成的0-24的数字
for x in range(25):

    # 将30*x+1赋值给变量start
    start = 30*x+1

    # 将30*(x+1)赋值给变量end
    end = 30*(x+1)

    # 格式化start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # 将segment_range作为字典subtitlesDict的键,添加进字典中
    # 将字典中键所对应的值设置为0
    subtitlesDict[segment_range] = 0

# for循环遍历字典subtitlesDict所有的键
for subtitle in subtitlesDict.keys():

    # 使用split()分隔字典的键获取第一项，赋值给变量start_key
    start_key = subtitle.split("-")[0]

    # 使用split()分隔字典的键获取第二项，赋值给变量end_key
    end_key = subtitle.split("-")[1]

    # for循环遍历列表timeList
    for item in timeList:

        # 如果弹幕分布时间在整型start_key和整型end_key之间
        if int(start_key)<= item <= int(end_key):

            # 将字典中键所对应的值累加
            subtitlesDict[subtitle] = subtitlesDict[subtitle] + 1

# 使用Line()创建Line对象，赋值给line
line = Line()

# 使用list()将字典subtitlesDict所有键转换成列表，传入add_xaxis()中
line.add_xaxis(list(subtitlesDict.keys()))

# TODO 使用add_yaxis()函数，将数据统称设置为"弹幕数"
# 将字典subtitlesDict所有值转换成列表，作为参数添加进函数中
line.add_yaxis("弹幕数", list(subtitlesDict.values()))

# TODO 使用render()函数存储文件，设置文件名为line.html
line.render("subtitle_13.html")

# TODO 使用print输出success
print("success")

from IPython.display import IFrame

IFrame(src='./subtitle_13.html', width=900, height=500)

  and should_run_async(code)


success


  super().__init__(init_opts=init_opts)


# 折线图分析
生成了折线图后，Yoyo分析了折线图中的几个高峰值。

发现视频开始的一分钟内用户习惯发弹幕签到，在视频互动答题的部分用户的弹幕数也很多。

Yoyo 决定在接下来的视频中增加互动环节，以提高用户参与度。

# 百题斩题目

## 票房对比
小倩获取到了AB两部电影上映一周的售票数据，想用python制作一张同时显示两种数据的折线图来观察数据变化。

解题思路：
1. 使用指定的数据，创建折线图，同时显示两部电影的售票数据变化；
2. 一条折线的数据统称为“A电影”，另一条折线的数据统称为“B电影”；
3. 将生成的折线图命名为“data.html”。

温馨提示：本题需要用到：添加两条折线 这个知识点，请先点击提示进行学习。     

想要添加第二条折线，只需要再使用一次add_yaxis()函数，将第二份数据作为参数添加进函数中就可以啦
```
add_yaxis("A电影")
add_yaxis("B电影")
```

1. A电影的售票数据:
`y_data_A = [20,10,23,134,234,14,76]`
2. B电影的售票数据:
`y_data_B = [125,82,25,62,45,74,156]`
3. 一周的天数横坐标:
`x_data = ["第一天","第二天","第三天","第四天","第五天","第六天","第七天"]`

In [11]:
# TODO 从pyecharts.charts中导入Line模块
from pyecharts.charts import Line

# A电影的售票数据
y_data_A = [20,10,23,134,234,14,76]

# B电影的售票数据
y_data_B = [125,82,25,62,45,74,156]

# 一周的天数数据
x_data = ["第一天","第二天","第三天","第四天","第五天","第六天","第七天"]

# TODO 使用Line()创建Line对象，赋值给line
line = Line()

# TODO 将列表x_data传入add_xaxis()函数
line.add_xaxis(x_data)

# TODO 使用add_yaxis()函数，将数据统称设置为"A电影"
# 将列表y_data_A传入add_yaxis()函数
line.add_yaxis("A电影", y_data_A)

# TODO 使用add_yaxis()函数，将数据统称设置为"B电影"
# 将列表y_data_B传入add_yaxis()函数
line.add_yaxis("B电影", y_data_B)

# TODO 使用render()函数存储文件，设置文件名为data.html
line.render("data_13.html")

# TODO 使用print输出success
print("success")

from IPython.display import IFrame

IFrame(src='./data_13.html', width=900, height=500)

success


  and should_run_async(code)
  super().__init__(init_opts=init_opts)


## 弹幕发送者
每年B站up主颁奖都会吸引一大波粉丝围观，视频中满屏的弹幕齐飞，Yoyo想知道到底有多少人发出了弹幕。

她想到利用今天学习到的知识，通过爬取弹幕接口链接中的 XML代码，统计出一共有多少个发送者。

温馨提示：本题需要用到：发送者 ID 这个知识点，请先点击提示进行学习。

视频链接：
https://www.bilibili.com/video/BV1u7411q7q8

解题思路：
1. 从以上的视频链接中，找到 cid 参数值，并且找到弹幕接口链接；
https://comment.bilibili.com/{cid}.xml
2. 从 XML 文件中提取 d 节点的 p 属性值；
3. 分割 p 属性值的数据，提取发送者 ID；
4. 将发送者 ID 储存在一个列表中，使用 len() 函数数量，并用格式化输出一共有多少个发送者。

发送者ID是第七位，分割字符串时索引第六项

In [13]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# TODO 将获取的弹幕接口链接赋值给变量url
url = "https://comment.bilibili.com/231269971.xml"

# TODO 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# TODO 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# TODO 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml, "lxml")

# TODO 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name = "d")

# TODO 新建一个列表sendList
sendList = []

# TODO for循环遍历content_all
for content in content_all:

    # TODO 使用.attrs获取p对应的属性值，并赋值给data
    data = content.attrs["p"]
    
    # TODO 使用split()函数分割data，获取第七项元素发送者ID，并赋值给变量senderID
    senderID = data.split(",")[6]

    # TODO 如果senderID不在sendList里
    if senderID not in sendList:

        # TODO 将senderID添加进列表sendList中
        sendList.append(senderID)

# TODO 使用len()函数来统计sendList数组的长度
sender = len(sendList)

# TODO 使用格式化输出，输出一共有多少个发送者
print(f"一共有{sender}个发送者")

一共有3178个发送者


## 弹幕数量折线图
Yoyo学习完了今天的课程之后，想要统计以 60 秒为分段区间的弹幕数，并绘制折线图，生成的图片文件名称为line.html，这要怎么做呢？

【题目要求】：
1. 解析网页，获取每条弹幕的发送时间
2. 以60s为一个单位，生成分段区间，统计每个区间内的弹幕数量，将结果保存在字典里
3. 使用pyecharts.charts中的Line模块，绘制折线图，设置 x 轴和 y 轴，将生成的html文件名称为line.html。

In [14]:
# 使用import导入requests模块
import requests

# 从bs4中导入BeautifulSoup模块
from bs4 import BeautifulSoup

# TODO 从pyecharts.charts中导入Line模块
from pyecharts.charts import Line

# 将https://comment.bilibili.com/218710655.xml赋值给变量url
url = "https://comment.bilibili.com/218710655.xml"

# 将变量url作为参数，添加进requests.get()中，给赋值给response
response = requests.get(url)

# 调用.encoding属性获取requests模块的编码方式
# 调用.apparent_encoding属性获取网页编码方式
# 将网页编码方式赋值给response.encoding
response.encoding = response.apparent_encoding

# 将服务器响应内容转换为字符串形式，赋值给xml
xml = response.text

# 使用BeautifulSoup()读取xml，添加lxml解析器，赋值给soup
soup = BeautifulSoup(xml, "lxml")

# 使用find_all()查询soup中d的节点，赋值给content_all
content_all = soup.find_all(name="d")

# TODO 新建一个列表timeList
timeList = []

# TODO for循环遍历content_all
for content in content_all:

    # TODO 使用.attrs获取p对应的属性值，并赋值给data
    data = content.attrs["p"]

    # TODO 使用split()函数分割data，获取时间并赋值给time
    time = data.split(",")[0]

    # TODO 将time转换成浮点数，添加进列表timeList中
    timeList.append(float(time))

# TODO 新建一个字典subtitlesDict
subtitlesDict = {}

# TODO 使用for循环遍历range()函数生成的0-12的数字
for x in range(13):

    # TODO 将60*x+1赋值给变量start
    start = 60*x+1

    # TODO 将60*(x+1)赋值给变量end
    end = 60*(x+1)

    # TODO 格式化start和end
    # 用短横线相连，赋值给segment_range
    segment_range = f"{start}-{end}"

    # TODO 将segment_range作为字典subtitlesDict的键,添加进字典中
    # 将字典中键所对应的值设置为0
    subtitlesDict[segment_range] = 0

# TODO for循环遍历字典subtitlesDict所有的键
for subtitle in subtitlesDict.keys():

    # TODO 使用split()分隔字典的键获取第一项，赋值给变量start_key
    start_key = subtitle.split("-")[0]

    # TODO 使用split()分隔字典的键获取第二项，赋值给变量end_key
    end_key = subtitle.split("-")[1]

    # TODO for循环遍历列表timeList
    for time in timeList:

        # TODO 如果弹幕分布时间在整型start_key和整型end_key之间
        if int(start_key) <= time <= int(end_key):

            # TODO 将字典中键所对应的值累加
            subtitlesDict[subtitle] = subtitlesDict[subtitle] + 1

# TODO 使用Line()创建Line对象，赋值给line
line = Line()

# TODO 使用list()将字典subtitlesDict所有键转换成列表，传入add_xaxis()中
line.add_xaxis(list(subtitlesDict.keys()))

# TODO 使用add_yaxis()函数，将数据统称设置为"弹幕数"
# 将字典subtitlesDict所有值转换成列表，作为参数添加进函数中
line.add_yaxis("弹幕数", list(subtitlesDict.values()))

# TODO 使用render()函数存储文件，设置文件名为line.html
line.render("百词斩_13.html")

# TODO 使用print输出success
print("success")

from IPython.display import IFrame

IFrame(src='./百词斩_13.html', width=900, height=500)

success


  super().__init__(init_opts=init_opts)
