# 6.2 市场价格数据的获取


市场价格数据可以从多个来源获取，包括政府机构、金融市场数据提供商、专业数据库网站以及开源数据集。以下是一些常见的获取市场价格数据的途径：

|数据源|官网链接|获取方法|数据特色|费用|
|---|---|---|---|---|
|Wind数据库||终端或API|较全|收费|
|东方财富||终端或API|-|收费|
|同花顺||终端或API|-|免费|
|CSMAR|http://cndata1.csmar.com/|终端或API|收费|
|巨潮资讯数据|http://webapi.cninfo.com.cn/#/|网页|-|
|tushare|http://tushare.org/index.html|API|国内|部分收费|
|Tiingo|https://www.tiingo.com/|API|收费|
|datarade|https://datarade.ai/|综合数据|-|



需要注意的是，获取市场价格数据可能涉及到订阅费用或许可协议，具体取决于数据的来源和使用情况。在使用这些数据时，也要注意数据的准确性和及时性，以及可能存在的数据使用限制和法律约束。

国外的一些知名的数据供应商包括 Bloomberg、Refinitiv（前身为Thomson Reuters）、FactSet、Morningstar 等。除了专业的金融数据供应商之外，还有一些金融数据API提供商，如Alpha Vantage、Quandl、Yahoo Finance等，它们提供了各种金融市场数据的API接口，可以通过这些接口获取数据。

## 1. 使用Tushare的API来访问数据

<img src='images/Tushare.png' width=300>

[Tushare](http://tushare.org)是一个免费、开源的python财经数据接口包。
首先我们安装tushare库，点击左上角+号，然后点击**终端(Terminal**)按钮，接着输入以下命令进行安装：
```shell
pip install tushare
```


安装成功后，我们使用tushare读取上证指数（代码为"sz"）日行情数据。首先初始化pro API,第一次可以通过来记录自己的token凭证，如下token为老师账号的token，仅为了展示课件。[注册官网，可获得自己的API token](https://tushare.pro/document/2)。

In [21]:
import tushare
tushare.set_token(token='95a929d8f6e5e25cc92f81cdab9c6e809b5507664c01bf6b5e3c3645')
pro = tushare.pro_api()

In [17]:
df = pro.daily(ts_code='000001.SZ', start_date='20180701', end_date='20180718')

In [18]:
df.head()

Unnamed: 0,ts_code,trade_date,open,high,low,close,pre_close,change,pct_chg,vol,amount
0,000001.SZ,20180718,8.75,8.85,8.69,8.7,8.72,-0.02,-0.23,525152.77,460697.377
1,000001.SZ,20180717,8.74,8.75,8.66,8.72,8.73,-0.01,-0.11,375356.33,326396.994
2,000001.SZ,20180716,8.85,8.9,8.69,8.73,8.88,-0.15,-1.69,689845.58,603427.713
3,000001.SZ,20180713,8.92,8.94,8.82,8.88,8.88,0.0,0.0,603378.21,535401.175
4,000001.SZ,20180712,8.6,8.97,8.58,8.88,8.64,0.24,2.78,1140492.31,1008658.828
5,000001.SZ,20180711,8.76,8.83,8.68,8.78,8.98,-0.2,-2.23,851296.7,744765.824
6,000001.SZ,20180710,9.02,9.02,8.89,8.98,9.03,-0.05,-0.55,896862.02,803038.965
7,000001.SZ,20180709,8.69,9.03,8.68,9.03,8.66,0.37,4.27,1409954.6,1255007.609
8,000001.SZ,20180706,8.61,8.78,8.45,8.66,8.6,0.06,0.7,988282.69,852071.526
9,000001.SZ,20180705,8.62,8.73,8.55,8.6,8.61,-0.01,-0.12,835768.77,722169.579


## 练习

1. 通过tushare接口获取到国内的股票，比如要获取上港集团(代码600018)的日线数据，代码为"600018"，开始日期为'2010-01-01'，结束日期为"2023-01-01" 
2. 绘制该数据的收盘价'close'的折线图

## 2. 使用yfinance库获取价格数据
<img src='images/yfinance.png' width=300>

以下是一个使用 [yfinance](https://pypi.org/project/yfinance/) 获取市场价格数据的简单示例。

请注意，为了运行此示例，你需要先安装yfinance库。你可以使用pip命令来安装：

```bash
pip install yfinance
```


In [2]:
import yfinance as yf

# 指定股票代码和时间范围
ticker_symbol = 'AAPL'  # 苹果公司的股票代码
start_date = '2022-01-01'
end_date = '2022-12-31'

# 使用yfinance库获取股票价格数据
stock_data = yf.download(ticker_symbol, start=start_date, end=end_date)

# 打印数据的前几行
print(stock_data.head())


[*********************100%%**********************]  1 of 1 completed

                  Open        High         Low       Close   Adj Close  \
Date                                                                     
2022-01-03  177.830002  182.880005  177.710007  182.009995  179.724533   
2022-01-04  182.630005  182.940002  179.119995  179.699997  177.443558   
2022-01-05  179.610001  180.169998  174.639999  174.919998  172.723587   
2022-01-06  172.699997  175.300003  171.639999  172.000000  169.840256   
2022-01-07  172.889999  174.139999  171.029999  172.169998  170.008118   

               Volume  
Date                   
2022-01-03  104487900  
2022-01-04   99310400  
2022-01-05   94537600  
2022-01-06   96904000  
2022-01-07   86709100  





在这个示例中，我们首先导入了yfinance库，然后指定了要获取的股票代码（这里以苹果公司的股票代码‘AAPL’为例）和时间范围（开始日期和结束日期）。接着，我们使用`yf.download`函数来获取指定时间范围内的股票价格数据，并将其存储在名为`stock_data`的DataFrame中。最后，我们打印了数据的前几行，以检查数据是否成功获取。

## 3. 使用Alpha Vantage API获取价格数据

<img src='images/Alpha_Vantage.png' width=300>

[Alpha Vantage](https://www.alphavantage.co/) API 是一个金融数据 API，提供了丰富的金融市场数据和股票市场数据。它为开发者提供了各种金融数据的接口，可以方便地获取实时和历史的股票价格、外汇汇率、加密货币价格、技术指标等数据。

以下是使用 Alpha Vantage API 获取股票价格数据的示例代码：

In [3]:
import requests
import pandas as pd

def get_stock_data(symbol, api_key):
    """
    获取股票价格数据
    symbol: 股票代码
    api_key: Alpha Vantage API 密钥
    返回： 股票价格数据的 DataFrame
    """
    url = f"https://www.alphavantage.co/query?function=TIME_SERIES_DAILY&symbol={symbol}&apikey={api_key}"
    response = requests.get(url)
    data = response.json()

    # 将数据转换为 DataFrame
    if 'Time Series (Daily)' in data:
        df = pd.DataFrame.from_dict(data['Time Series (Daily)'], orient='index')
        df.index = pd.to_datetime(df.index)
        df.columns = ['open', 'high', 'low', 'close', 'volume']
        df = df.astype(float)
        return df
    else:
        print("Error: Unable to retrieve stock data.")
        return None

# 设置 Alpha Vantage API 密钥
api_key = "YOUR_API_KEY"

# 获取股票数据
symbol = "AAPL"  # 苹果公司股票代码
stock_data = get_stock_data(symbol, api_key)
print(stock_data)

              open     high      low   close       volume
2024-04-12  174.26  178.360  174.210  176.55  101670886.0
2024-04-11  168.34  175.460  168.160  175.04   91070275.0
2024-04-10  168.80  169.090  167.110  167.78   49709336.0
2024-04-09  168.70  170.080  168.350  169.67   42231444.0
2024-04-08  169.03  169.200  168.240  168.45   37216858.0
...            ...      ...      ...     ...          ...
2023-11-24  190.87  190.900  189.250  189.97   24048344.0
2023-11-22  191.49  192.930  190.825  191.31   39630011.0
2023-11-21  191.41  191.520  189.740  190.64   38134485.0
2023-11-20  189.89  191.905  189.880  191.45   46538614.0
2023-11-17  190.25  190.380  188.570  189.69   50941404.0

[100 rows x 5 columns]


## 4. 本地文件的存取方法

我们将网上的数据下载完后，存放在自己的电脑里，一般称之为本地存储，存放的位置称为本地路径。这里路径可以分为绝对路径和相对路径。

### 4.1 存取CSV格式数据文件

现在尝试使用pandas的这个方法来读取下【数据】文件夹下的这个数据集：【fund_code.csv】



In [10]:
df = pandas.read_csv("datasets/fund_codes.csv", delimiter="\t", dtype={"基金代码":str})  #string字符串
df

Unnamed: 0,基金代码,基金名称,开始日期,类型
0,000001,华夏成长,2001-12-18,混合式基金
1,000003,中海可转债债券,2013-03-20,债券基金
2,000005,嘉实增强信用,2013-03-08,债券基金
3,000007,鹏华国企债,2013-03-08,债券基金
4,000008,嘉实中证500ETF联接基金,2013-03-22,联接基金
...,...,...,...,...
9148,007140,富国全球美元现汇,2019-04-12,联接基金
9149,007233,金鹰鑫益混合E,2019-04-10,混合式基金
9150,006370,国富大中华美元,2019-04-11,混合式基金
9151,006792,鹏华香港美国互联网美元现汇,2019-04-15,股票基金


当我们不知道`pandas.read_csv`如何使用的时候，我们可以使用命令`pandas.read_csv?`，即`pandas.read_csv` + `?`的形式

如何保存CSV数据文件呢？使用pandas对象的to_csv方法

In [11]:
df.to_csv("datasets/fund_codes_copy.csv")