﻿
# 表现靠前和靠后的股票
我们看看如何获取单个时期的表现靠前和靠后的股票。对于此示例，我们将查看一个月的收盘价：

In [None]:
import pandas as pd

month = pd.to_datetime('02/01/2018')
close_month = pd.DataFrame(
    {
        'A': 1,
        'B': 12,
        'C': 35,
        'D': 3,
        'E': 79,
        'F': 2,
        'G': 15,
        'H': 59},
    [month])

close_month

`close_month` 提供了备选投资组合 (A, B, C, ...) 中的所有股票在 2018 年 2 月的价格。可以看出，这个月表现在前2 位的股票是 E 和 H，价格分别为 79 和 59。

我们可以使用函数 [`Series.nlargest`](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.Series.nlargest.html) 获取这两个值。此函数会返回前 *n* 项。对于我们的示例来说，*n* 是 2。

In [None]:
try:
    # Attempt to run nlargest
    close_month.nlargest(2)
except TypeError as err:
    print('Error: {}'.format(err))

发生了什么？实际上我们没有调用 [`Series.nlargest`](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.Series.nlargest.html) 函数，而是调用了 [`DataFrame.nlargest`](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.DataFrame.nlargest.html)，因为 `close_month` 是一个 DataFrame。我们使用 `.loc[month]` 从 DataFrame 中获取 Series，其中 `month` 是上面创建的 2018-02-01 指数。

In [None]:
close_month.loc[month].nlargest(2)

很棒。这样就获得了这个月表现靠前的股票。如何获取表现靠后的股票呢？有两种方法。你可以使用 Panda 的[`Series.nsmallest`](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.Series.nsmallest.html) 函数或翻转价格符号，然后应用 [`DataFrame.nlargest`](https://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.DataFrame.nlargest.html)。两种方式都行。对于这门课程，我们将翻转符号并使用 nlargest。这样便能重复利用通过 nlargest 创建的函数并获取最小值。

要从 `close_month` 中获取表现最差的 2 支股票，我们将翻转符号。

In [None]:
(-1 * close_month).loc[month].nlargest(2)

这样就会获得表现靠后的股票，但不是实际价格。我们需要翻转 nlargest 输出的符号。

In [None]:
(-1 * close_month).loc[month].nlargest(2) *-1

现在你已经知道如何获取一个月表现靠前和靠后的股票价格。下面做道练习。
## 小测验
实现 `date_top_industries` 以查找某一天表现靠前的收盘价，然后返回它们所对应的行业。函数应该仅返回行业[集合](https://docs.python.org/3/tutorial/datastructures.html#sets)，不能有任何重复项。

- 参数 `top_n` 表示查看表现为前 n 项的股价。
- `date` 参数表示 `prices` DataFrame 中表现靠前的价格对应的日期。
- `sector` 参数包含每支股票的行业信息。

例如：
```
                 Prices
               A         B         C         D         E
2013-07-08     2         2         7         2         6
2013-07-09     5         3         6         7         5
...            ...       ...       ...

           Sector
A       "Utilities"       
B       "Health Care"       
C       "Real Estate"
D       "Real Estate"
E       "Information Technology"

Date:  2013-07-09
Top N: 3
```

函数 `date_top_industries` 创建的集合应该如下所示：
```
{"Utilities", "Real Estate"}
```

*注意股票 A 和 E 在相应日期的价格一样，但是只返回了 A 所在的行业。为了保持简单，我们将仅返回打成平手的第一项所在的行业。*

In [None]:
import project_tests


def date_top_industries(prices, sector, date, top_n):
    """
    Get the set of the top industries for the date
    
    Parameters
    ----------
    prices : DataFrame
        Prices for each ticker and date
    sector : Series
        Sector name for each ticker
    date : Date
        Date to get the top performers
    top_n : int
        Number of top performers to get
    
    Returns
    -------
    top_industries : set
        Top industries for the date
    """
    # TODO: Implement Function
    
    return None


project_tests.test_date_top_industries(date_top_industries)

## 小测验解答
如果你遇到问题，请点击[此处](top_and_bottom_performing_solution.ipynb)查看解答。