##### BeautifulSoup

简单来说，Beautiful Soup 是 python 的一个库，最主要的功能是从网页抓取数据。官方解释如下：

>Beautiful Soup 提供一些简单的、python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup 自动将输入文档转换为 Unicode 编码，输出文档转换为 utf-8 编码。你不需要考虑编码方式，除非文档没有指定一个编码方式，这时，Beautiful Soup 就不能自动识别编码方式了。然后，你仅仅需要说明一下原始编码方式就可以了。 Beautiful Soup 已成为和 lxml、html6lib 一样出色的 python 解释器，为用户灵活地提供不同的解析策略或强劲的速度。

Beautiful Soup 3 目前已经停止开发，推荐在现在的项目中使用 Beautiful Soup 4，不过它已经被移植到 BS4 了，也就是说导入时我们需要 import bs4 。所以这里我们用的版本是 Beautiful Soup 4.3.2 (简称 BS4)，

>可以利用 pip 来安装.

``pip install beautifulsoup4``

Beautiful Soup 支持 Python 标准库中的 HTML 解析器，还支持一些第三方的解析器，如果我们不安装它，则 Python 会使用 Python 默认的解析器，而lxml 解析器更加强大，速度更快，推荐安装。


lxml HTML 解析器 [教程一](https://lxml.de/)， [教程二](https://www.jianshu.com/p/8f6917e4e6dd)

``
BeautifulSoup(markup, 'lxml')
``


####  官方文档

在这里先分享官方文档链接，不过内容是有些多，但是是最权威的，而且在实时更新。建议大家收藏

https://beautifulsoup.readthedocs.io/zh_CN/latest/



#### 第一步：创建BeautifulSoup对象 

导入我们需要的库 bs4 

然后创建一个文档，从新浪财经的网站上面截取的一部分

\assets\html.html

In [1]:
from bs4 import BeautifulSoup
soup = BeautifulSoup(open('html.html','r',encoding='utf-8'), 'lxml')

In [2]:
print(soup)

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><body><p>

​	
			</p><title>个股点评_证券_新浪财经</title>
<meta content="个股点评_证券_新浪财经" name="Keywords"/>
<div class="hs01"> </div>
<ul class="list_009">
<li><a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产</a><span>(11月22日 07:17)</span></li> <li><a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznctke2383291.shtml" target="_blank">拉尼娜来袭 一文看清相关行业投资机会（附股）</a><span>(11月20日 11:25)</span></li> <li><a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznezxs2782833.shtml" target="_blank">暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？</a><span>(11月20日 08:55)</span></li> <li><a href="https://finance.sina.com.cn/stock/e/2020-11-19/doc-iiznezxs2717397.shtml" target="_blank">2020年11月20日涨停板早知道：七大利好有望发酵</a><span>(11月19日 20:05)</span></li> <li><a href="https:

In [3]:
# 我们来打印一下 soup 对象的内容，格式化输出

print(soup.prettify())

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
 <body>
  <p>
   ​
  </p>
  <title>
   个股点评_证券_新浪财经
  </title>
  <meta content="个股点评_证券_新浪财经" name="Keywords"/>
  <div class="hs01">
  </div>
  <ul class="list_009">
   <li>
    <a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">
     *ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产
    </a>
    <span>
     (11月22日 07:17)
    </span>
   </li>
   <li>
    <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznctke2383291.shtml" target="_blank">
     拉尼娜来袭 一文看清相关行业投资机会（附股）
    </a>
    <span>
     (11月20日 11:25)
    </span>
   </li>
   <li>
    <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznezxs2782833.shtml" target="_blank">
     暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？
    </a>
    <span>
     (11月20日 08:55)
    </span>
   </li>
   <li>
    <a href="https://finance.sina.com

Beautiful Soup 将复杂 HTML 文档转换成一个复杂的树形结构，每个节点都是 Python 对象

我们主要来熟悉一下Tag的对象

Tag 是什么？通俗点讲就是 HTML 中的一个个标签，例如

``<title>个股点评_证券_新浪财经</title>
``

``<a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产</a>
``

这里面<title>,<a>都是属于标签，利用 Beautiful Soup可以非常方便的将标签中的信息提取出来

In [3]:
soup.title

<title>个股点评_证券_新浪财经</title>

In [5]:
# 看一下它是个什么东西 

print(type(soup.title))

<class 'bs4.element.Tag'>


In [8]:
# 对于 Tag，它有两个重要的属性，是 name 和 attrs

soup.title.name

'title'

In [9]:
soup.a

<a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产</a>

In [10]:
soup.a.attrs

{'href': 'https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml',
 'target': '_blank'}

In [11]:
# 在这里，我们把 a 标签的所有属性打印输出了出来，得到的类型是一个字典。 如果我们想要单独获取某个属性，可以这样
soup.a['href']

'https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml'

In [12]:
# 还可以这样，利用 get 方法，传入属性的名称，二者是等价的
soup.a.get('href')

'https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml'

In [39]:
# 我们可以对这些属性和内容等等进行修改，或者删除，不过作为爬虫来说不需要。因为你没有权限修改，另外在加载的时候你不能选择只读 ‘r’

# 修改
# soup.a['href']="http://sina.com.cn"

# 删除
# del soup.a['target']


**NavigableString**

然我们已经得到了标签的内容，那么问题来了，我们要想获取标签内部的文字怎么办呢？很简单，用 .string或者 .text，例如

In [13]:
soup.a.string

'*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产'

In [41]:
soup.a.text

'*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产'

In [42]:
soup.title.string

'个股点评_证券_新浪财经'

**遍历文档树：直接子节点**

要点：.contents .children 属性

In [3]:
soup.a.contents

['*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产']

In [20]:
for child in soup.table.children:
    print(child)



<tbody>
<tr>
<td>
<span class="pagebox">
<span class="pagebox_pre_nolink">上一页</span>
<span class="pagebox_num_nonce">1</span> <span class="pagebox_num">
<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=2">2</a>
</span> <span class="pagebox_num">
<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=3">3</a>
</span> <span class="pagebox_num">
<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=4">4</a>
</span> <span class="pagebox_num">
<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=5">5</a>
</span>
<span class="pagebox_next">
<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=2">下一页</a></span>
</span>
</td>
</tr>
</tbody>




除了children之外，还有父节点，孙节点，兄弟节点等多项相关内容，请同学们通过查阅官网或者参阅其他参考资料进行学习

**节点内容：多个内容情况**

对于单个内容来说可以利用.string 或者 .text 来获得，如果有多个内容的话

In [24]:
soup.a.strings

<generator object Tag._all_strings at 0x000001BDC8320138>

In [15]:
for t in soup.ul.strings:
    # repr() 函数将对象转化为供解释器读取的形式
    print(repr(t))

'\n'
'*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产'
'(11月22日 07:17)'
' '
'拉尼娜来袭 一文看清相关行业投资机会（附股）'
'(11月20日 11:25)'
' '
'暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？'
'(11月20日 08:55)'
' '
'2020年11月20日涨停板早知道：七大利好有望发酵'
'(11月19日 20:05)'
' '
'三大运营商或于年底宣布5G消息商用 产业链标的有望受益（附股）'
'(11月19日 14:22)'
'\n'


In [16]:
for t in soup.ul.stripped_strings:
    print(t)

*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产
(11月22日 07:17)
拉尼娜来袭 一文看清相关行业投资机会（附股）
(11月20日 11:25)
暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？
(11月20日 08:55)
2020年11月20日涨停板早知道：七大利好有望发酵
(11月19日 20:05)
三大运营商或于年底宣布5G消息商用 产业链标的有望受益（附股）
(11月19日 14:22)


In [33]:
for t in soup.table.stripped_strings:
    print(t)

上一页
1
2
3
4
5
下一页


#### 搜索文档树 

很多时候网页内容太多，需要使用搜索而不是遍历文档树

因此我们需要使用 .find 类的命令

find_all () 方法搜索当前 tag 的所有 tag 子节点，并判断是否符合过滤器的条件 1）name 参数 name 参数可以查找所有名字为 name 的 tag, 字符串对象会被自动忽略掉  参数

1. Name 参数

**A. 传字符串** 

In [21]:
soup.find_all('a')

<a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产</a>

**B. 传正则表达式**

如果传入正则表达式作为参数，Beautiful Soup 会通过正则表达式的 match () 来匹配内容。下面例子中找出所有以 t 开头的标签

In [23]:
import re
for tag in soup.find_all(re.compile("t")):
    print(tag.name)
    

html
title
meta
table
tbody
tr
td


2. keyword 参数

如果一个指定名字的参数不是搜索内置的参数名，搜索时会把该参数当作指定名字 tag 的属性来搜索，如果包含一个名字为 x 的参数，Beautiful Soup 会搜索每个 tag 的 x 属性。举例如下


In [36]:
soup.find_all(target='_blank')

[<a href="https://finance.sina.com.cn/stock/zqgd/2020-11-22/doc-iiznezxs3063378.shtml" target="_blank">*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznctke2383291.shtml" target="_blank">拉尼娜来袭 一文看清相关行业投资机会（附股）</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-20/doc-iiznezxs2782833.shtml" target="_blank">暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？</a>,
 <a href="https://finance.sina.com.cn/stock/e/2020-11-19/doc-iiznezxs2717397.shtml" target="_blank">2020年11月20日涨停板早知道：七大利好有望发酵</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-19/doc-iiznctke2237870.shtml" target="_blank">三大运营商或于年底宣布5G消息商用 产业链标的有望受益（附股）</a>,
 <a href="https://finance.sina.com.cn/roll/2020-11-19/doc-iiznezxs2652793.shtml" target="_blank">军工股午后崛起：航空产业链业绩提升 订单量增速有望扩大</a>,
 <a href="https://finance.sina.com.cn/roll/2020-11-19/doc-iiznctke2194128.shtml" target="_blank">国常会再提促进家电消费：家电股迎政策红利 两条主线布局</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-19/doc-

In [24]:
soup.find_all(href=re.compile("2020-11-19"))

[<a href="https://finance.sina.com.cn/stock/e/2020-11-19/doc-iiznezxs2717397.shtml" target="_blank">2020年11月20日涨停板早知道：七大利好有望发酵</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-19/doc-iiznctke2237870.shtml" target="_blank">三大运营商或于年底宣布5G消息商用 产业链标的有望受益（附股）</a>,
 <a href="https://finance.sina.com.cn/roll/2020-11-19/doc-iiznezxs2652793.shtml" target="_blank">军工股午后崛起：航空产业链业绩提升 订单量增速有望扩大</a>,
 <a href="https://finance.sina.com.cn/roll/2020-11-19/doc-iiznctke2194128.shtml" target="_blank">国常会再提促进家电消费：家电股迎政策红利 两条主线布局</a>,
 <a href="https://finance.sina.com.cn/stock/hyyj/2020-11-19/doc-iiznezxs2611976.shtml" target="_blank">涨价题材火爆：有机硅价格创年内新高 最全概念股名单来了</a>]

In [38]:
soup.find_all(href=re.compile("page"))

[<a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=2">2</a>,
 <a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=3">3</a>,
 <a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=4">4</a>,
 <a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=5">5</a>,
 <a href="http://finance.sina.com.cn/roll/index.d.html?cid=56588&amp;page=2">下一页</a>]

#### 问题：

我想知道最大页码，就是我希望提取最大页码（5），该怎么办？

In [50]:
soup.find_all(text=[re.compile("利好"), re.compile("新高"), re.compile("扩大")])

['2020年11月20日涨停板早知道：七大利好有望发酵',
 '军工股午后崛起：航空产业链业绩提升 订单量增速有望扩大',
 '涨价题材火爆：有机硅价格创年内新高 最全概念股名单来了',
 '2020年11月19日涨停板早知道：七大利好有望发酵',
 '2020年11月18日涨停板早知道：七大利好有望发酵',
 '10月装车辆同比翻倍：磷酸铁锂强势回归 龙头股价迭创新高(股)',
 '2020年11月17日涨停板早知道：七大利好有望发酵',
 '2020年11月16日涨停板早知道：七大利好有望发酵',
 '2020年11月13日涨停板早知道：七大利好有望发酵',
 '2020年11月12日涨停板早知道：七大利好有望发酵',
 '2020年11月11日涨停板早知道：七大利好有望发酵',
 '2020年11月10日涨停板早知道：七大利好有望发酵',
 '2020年11月9日涨停板早知道：七大利好有望发酵']

limit 参数 find_all () 方法返回全部的搜索结构，如果文档树很大那么搜索会很慢。如果我们不需要全部结果，可以使用 limit 参数限制返回结果的数量。

In [25]:
soup.find_all(text=[re.compile("利好"), re.compile("新高"), re.compile("扩大")], limit = 5)

['2020年11月20日涨停板早知道：七大利好有望发酵',
 '军工股午后崛起：航空产业链业绩提升 订单量增速有望扩大',
 '涨价题材火爆：有机硅价格创年内新高 最全概念股名单来了',
 '2020年11月19日涨停板早知道：七大利好有望发酵',
 '2020年11月18日涨停板早知道：七大利好有望发酵']

### 练习：

学习使用 .find, .find_parent, .find_parents, .find_next_siblings, .find_next_sibling, .find_next等等其他命令

具体请参阅文档 https://beautifulsoup.readthedocs.io/zh_CN/latest/

#### 试试在线爬虫

把地址改成一个http的地址即可。。。

In [1]:
import requests
from bs4 import  BeautifulSoup
import re

# 使用一个网易的数据页面
url="http://quotes.money.163.com/data/caibao/yjgl_ALL.html?reportdate=20200930&sort=publishdate&order=desc&page=0"

def request_url(url):
    user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36'
    headers = {'User-Agent': user_agent} 
    
    res = requests.get(url,headers=headers)
    res.encoding = 'utf-8'
    return res.text

In [5]:
soup = BeautifulSoup(request_url(url), 'lxml')
content = soup.find('table',class_='fn_cm_table')

tmp =[i.text for i in content.find_all('a')]

code, names = tmp[0::3], tmp[1::3]

In [7]:
names

['恒玄科技',
 '舒华体育',
 '思进智能',
 '西上海',
 '彩虹集团',
 '欧科亿',
 '博迁新材',
 '航亚科技',
 '退市银鸽',
 '康平科技',
 '确成股份',
 '联泓新科',
 '汇创达',
 '会通股份',
 '兆威机电',
 '宸展光电',
 '友发集团',
 '兰剑智能',
 '中芯国际',
 '协和电子',
 '步科股份',
 '艾力斯',
 '*ST数码',
 '利扬芯片',
 '金达莱']

In [8]:
names = soup.find_all('a', href = re.compile('#11a01'))
[n.text for n in names][1::2]

['恒玄科技',
 '舒华体育',
 '思进智能',
 '西上海',
 '彩虹集团',
 '欧科亿',
 '博迁新材',
 '航亚科技',
 '退市银鸽',
 '康平科技',
 '确成股份',
 '联泓新科',
 '汇创达',
 '会通股份',
 '兆威机电',
 '宸展光电',
 '友发集团',
 '兰剑智能',
 '中芯国际',
 '协和电子',
 '步科股份',
 '艾力斯',
 '*ST数码',
 '利扬芯片',
 '金达莱']

In [34]:
# 新浪财经新闻

url = 'https://finance.sina.com.cn/roll/index.d.html?cid=56588&page='+ pagenum
soup = BeautifulSoup(request_url(url), 'lxml')

# 组合搜索，class是关键词，因此需要变成 class_
#[a['href'] for a in soup.find_all('a', class_ = 'sinatail')]
[a.text for a in soup.find_all('a', class_ = 'sinatail')]

['新浪简介',
 'About Sina',
 '广告服务',
 '招聘信息',
 '网站律师',
 'SINA English',
 '会员注册',
 '产品答疑',
 '版权所有']

### 作业 一

注意URL中的关键词 page=1，请通过改变URL来实现自动翻页爬取多条信息

### XPATH

XPath，全称 XML Path Language，即 XML 路径语言，它是一门在XML文档中查找信息的语言。XPath 最初设计是用来搜寻XML文档的，但是它同样适用于 HTML 文档的搜索。

所以在做爬虫时，我们完全可以使用 XPath 来做相应的信息抽取

XPath 的选择功能十分强大，它提供了非常简洁明了的路径选择表达式，另外它还提供了超过 100 个内建函数用于字符串、数值、时间的匹配以及节点、序列的处理等等，几乎所有我们想要定位的节点都可以用XPath来选择。


我们现用表格列举一下几个常用规则：

表达式描述
- nodename选取此节点的所有子节点
- /从当前节点选取直接子节点
- //从当前节点选取子孙节点
- .选取当前节点
- ..选取当前节点的父节点
- @选取属性

在这里列出了XPath的常用匹配规则，例如 / 代表选取直接子节点，// 代表选择所有子孙节点，. 代表选取当前节点，.. 代表选取当前节点的父节点，@ 则是加了属性的限定，选取匹配属性的特定节点。

chrome 和 firefox 给我们提供了很好的帮助

通过 检查 copy copy xpath 完成信息的提取

In [2]:
import requests
from lxml import etree

url = 'http://quotes.money.163.com/data/caibao/yjgl_ALL.html?reportdate=20200930&sort=publishdate&order=desc&page=0'

selector = etree.HTML(request_url(url))
selector.xpath('//*[@id="plate_performance"]/tr[1]/td[3]/a')[0].text

'恒玄科技'

In [84]:
# 去掉一点东西来达到遍历
pstring = '//*[@id="plate_performance"]/tr/td[3]/a'
selector.xpath(pstring)

[<Element a at 0x1bdc98ec8c8>,
 <Element a at 0x1bdc98fb108>,
 <Element a at 0x1bdc99a4e88>,
 <Element a at 0x1bdc99b08c8>,
 <Element a at 0x1bdc99b0b48>,
 <Element a at 0x1bdc99b0748>,
 <Element a at 0x1bdc99b0d48>,
 <Element a at 0x1bdc99b0308>,
 <Element a at 0x1bdc99b0b88>,
 <Element a at 0x1bdc99b0c88>,
 <Element a at 0x1bdc9a27308>,
 <Element a at 0x1bdc9a27e88>,
 <Element a at 0x1bdc9a27e08>,
 <Element a at 0x1bdc9a27f88>,
 <Element a at 0x1bdc9a27c88>,
 <Element a at 0x1bdc9a27088>,
 <Element a at 0x1bdc9a278c8>,
 <Element a at 0x1bdc9a27888>,
 <Element a at 0x1bdc9a27e48>,
 <Element a at 0x1bdc9a27d48>,
 <Element a at 0x1bdc9a27208>,
 <Element a at 0x1bdc9a276c8>,
 <Element a at 0x1bdc9a27d08>,
 <Element a at 0x1bdc9a27b88>,
 <Element a at 0x1bdc9a27f08>]

In [85]:
[x.text for x in selector.xpath(pstring)]

['博迁新材',
 '退市银鸽',
 '康平科技',
 '确成股份',
 '联泓新科',
 '汇创达',
 '会通股份',
 '兆威机电',
 '宸展光电',
 '友发集团',
 '兰剑智能',
 '中芯国际',
 '协和电子',
 '步科股份',
 '艾力斯',
 '*ST数码',
 '利扬芯片',
 '金达莱',
 '五洲特纸',
 '狄耐克',
 '朗特智能',
 '声迅股份',
 '豪森股份',
 '东亚药业',
 '金富科技']

In [87]:
# 找到最大页码
pstring = '/html/body/div[1]/div[4]/div[3]/div[2]/div[2]/div/a[7]'
selector.xpath(pstring)[0].text

'166'

In [88]:
# 回到新闻的例子

url = 'https://finance.sina.com.cn/roll/index.d.html?cid=56588&page=1'
selector = etree.HTML(request_url(url))

#//*[@id="Main"]/div[3]/ul[1]/li[1]/a
#//*[@id="Main"]/div[3]/ul[1]/li[2]/a
pstring = '//*[@id="Main"]/div[3]/ul[1]/li/a'

selector.xpath(pstring)
[x.text for x in selector.xpath(pstring)]

['*ST欧浦或面临退市:因公司控股股东佛山市中基投资宣告破产',
 '拉尼娜来袭 一文看清相关行业投资机会（附股）',
 '暴雪肆虐冷空气“发威”：煤炭供应趋紧 这些厂商躺赢？',
 '2020年11月20日涨停板早知道：七大利好有望发酵',
 '三大运营商或于年底宣布5G消息商用 产业链标的有望受益（附股）']