# 6.4 财经新闻数据

财经新闻数据通常涵盖了各种类别，涉及到金融市场、经济、企业、行业等方面的内容。以下是一些常见的财经新闻数据类别：

|财经新闻数据|类别|内容 |
|---|---|---|
|**股市新闻**|公司新闻|特定公司的新闻，包括业绩公告、重大事件、合并收购等。|
|   |行业新闻|特定行业或行业走势的新闻，包括行业分析、发展趋势等。|
|   |市场分析|股票市场、债券市场、商品市场等方面的分析和预测。|
|**经济新闻**|宏观经济|国家或地区整体经济状况、政策变化等方面的新闻。|
|   |经济数据|各种经济数据，如国内生产总值（GDP）、就业数据、通货膨胀率等。|
|**金融政策**|中央银行政策|央行货币政策、利率决策等方面的新闻。|
|   |政府政策|财政政策、税收政策等方面的新闻。|
|**国际财经**|国际金融|国际金融市场、外汇市场、国际贸易等方面的新闻。|
|   |全球经济|全球经济走势、国际经济关系等方面的新闻。|
|**商业新闻**|商业动态|企业经营活动、商业策略、市场竞争等方面的新闻。|
|   |创业投资|创业公司、风险投资、创业生态等方面的新闻。|

6. **金融科技**：
   - 金融科技创新：关于金融科技行业发展、技术创新、数字化转型等方面的新闻。
   - 区块链与加密货币：关于区块链技术、比特币、以太坊等加密货币的新闻。

以上是财经新闻数据的一些常见类别，新闻内容和分类可能会根据不同的媒体、网站或新闻服务提供商而有所不同。

## 1. 使用网页抓取技术获取财经新闻

In [2]:
import requests
from bs4 import BeautifulSoup

# 定义要抓取的新闻网站的URL
url = 'https://www.cnbc.com/finance/'

# 发起HTTP请求并获取网页内容
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 使用Beautiful Soup解析网页内容
    soup = BeautifulSoup(response.content, 'html.parser')
    
    # 查找新闻标题元素（这里以CNBC网站的财经新闻为例）
    news_titles = soup.find_all('a', class_='Card-title')

    # 输出新闻标题
    for title in news_titles:
        print(title.text)
else:
    print('Failed to fetch news from CNBC.')


Two fresh ways to play the weight loss and megacap tech hype
'Gray divorce' has doubled since the '90s. The financial risk is high for women
Anthropic is lining up a new slate of investors, but has ruled out Saudi Arabia
How to spot and overcome ‘ghost’ jobs
Stocks making the biggest moves midday: Nike, Lululemon, FedEx and more
Stocks making the biggest moves premarket: Reddit, Nike, FedEx and more
Immigration is boosting the U.S. economy and has been 'underestimated': JPMorgan
Stocks making the biggest moves after hours: Lululemon, FedEx, Nike and more
Stocks making the biggest moves midday: Micron, Apple, Nvidia, Chewy and more
Stocks making the biggest premarket moves: Micron, Apple, Broadcom and more
TikTok aside, Congress has its eye on the U.S. money going into China
Stocks making the biggest moves after hours: Micron, Five Below, Chewy and more
Fed raises GDP and inflation outlook, while keeping rate cut forecast
Here's what changed in the new Fed statement
Fed holds rates stea

## 2. 以文件流的形式存取数据

In [8]:
with open("datasets/non-structure-data.txt", "rb") as f:
    for i in f:
        print(i.decode("utf-8"))

据21世纪经济报道（21财经）4日报道，9月3日，在2021中国服贸会“服务贸易开放发展新趋势高峰论坛”上，海关总署研究中心主任万中心预计，今年中国货物贸易有望实现两位数增长，达到5.1万亿美元，这意味着在“十四五”开局第一年，中国有望提前完成货物贸易的“十四五”目标。

万中心指出，疫情以来直到今天，中国货物贸易一直保持着不错的增长。根据其团队的预测，如果不出现极端情况的话，今年中国货物贸易进出口会实现两位数的增长，“这个两位数的增长不仅仅是针对去年的同比增速，相较于疫情前的2019年，今年也有望实现年均两位数的增长，接近‘十一五’时期的数字。”

他指出，按此测算，中国货物贸易的国际市场份额将进一步提升至15%左右。

值得注意的是，根据此前公布的《“十四五”商务发展规划》，“十四五”期间，中国的货物贸易的预期目标为：到2025年，中国货物贸易规模达到5.1万亿美元。“今年，中国有可能达到5.1万亿美元，大概率在今年，也就是‘十四五’开局第一年提前完成这一目标。”

万中心指出，中国货物贸易在“十二五”、“十三五”期间的年均增速分别为7.6%、2.6%，《“十四五”商务发展规划》的预期目标是，“十四五”期间年均增长2%。


在这个示例中，我们首先导入了requests库和Beautiful Soup库，然后定义了要抓取的新闻网站的URL（这里以CNBC财经新闻为例）。接着，我们使用requests库发起了HTTP请求，并通过Beautiful Soup库解析了网页内容。我们通过查找特定的HTML元素来提取新闻标题，并将其打印输出。