## 3 程序组织
### 01 脚本
在该部分，我们将深入研究编写 Python 脚本的惯例。
#### **什么是脚本？**
脚本就是运行和终止一系列语句的程序。
```
# program.py

statement1
statement2
statement3
...
```
到目前为止，我们主要在编写脚本。
#### **问题**
如果你编写一个有用的脚本，它的特性和功能将会增加。你可能想要将其应用于相关的问题。随着时间的推移，它可能会成为一个关键的应用程序。如果你不注意的话，它可能会变成一团乱麻。因此，让我们有条理的组织程序吧。
#### **定义变量**
名称必须在使用之前定义。

In [1]:
from select import select


def squre(x):
    return x * x
a = 42
b = a + 2
z = squre(b)

**顺序很重要。**
几乎总是把变量和函数的定义放到顶部附近。
#### **定义函数**
把所有与单个任务相关的代码都放到一个地方是个好主意。可以使用函数实现：

In [None]:
import csv
def read_prices(filename):
    prices = {}
    with open(filename) as f:
        f_csv = csv.reader(f)
        for row in f_csv:
            prices[row[0]] = float(row[1])
    return prices

函数也可以简化重复的操作。
```
oldprices = read_prices('oldprices.csv')
newprices = read_prices('newprices.csv')
```
#### **什么是函数？**
函数是命名的语句序列。
```
def funcname(args):
  statement
  statement
  ...
  return result
```
任何 `Python` 语句都可以在函数内部使用。
```
def foo():
    import math
    print(math.sqrt(2))
    help(math)
```
`Python` 中没有特殊语句（这使它很容易记住）。
#### **函数定义**
可以按任何顺序定义函数。
```
def foo(x):
    bar(x)

def bar(x):
    statements

# OR
def bar(x):
    statements

def foo(x):
    bar(x)
```
在程序执行期间，函数必须在实际使用之前（调用）定义。
```
foo(3)        # foo must be defined already
```
在文体上，函数以自底向上的方式定义可能更常见。
#### **自底向上的风格**
函数被当做构建块。较小/较简单的块优先。
```
# myprogram.py
def foo(x):
    ...

def bar(x):
    ...
    foo(x)          # Defined above
    ...

def spam(x):
    ...
    bar(x)          # Defined above
    ...

spam(42)            # Code that uses the functions appears at the end
```
后面的函数基于前面的函数构建。再次说明，这仅仅是一种风格问题。在上面程序中唯一重要的事情是 spam(42) 的调用是在最后一步。
#### **函数设计**
理想情况下，函数应该是一个黑盒。它们应该仅对输入进行操作，并避免全局变量和奇怪的副作用。首要目标：模块化和可预测性。
#### **文档字符串**
以文档字符串（doc-string）的形式包含文档是良好的实践。文档字符串是紧接着函数名的字符串。它们用于 help() 函数，集成开发环境和其它的工具。
```
def read_prices(filename):
    '''
    Read prices from a CSV file of name,price data
    '''
    prices = {}
    with open(filename) as f:
        f_csv = csv.reader(f)
        for row in f_csv:
            prices[row[0]] = float(row[1])
    return prices
```
一个好的文档字符串实践是写一句简短的话总结该函数做什么。如果需要更多的信息，请包含一个简短的带有更详细的参数说明的使用示例，
#### **类型注解**
也可以添加可选的类型提示到函数定义中。
```
def read_prices(filename: str) -> dict:
    '''
    Read prices from a CSV file of name,price data
    '''
    prices = {}
    with open(filename) as f:
        f_csv = csv.reader(f)
        for row in f_csv:
            prices[row[0]] = float(row[1])
    return prices
```
提示在操作上什么也不做。它们纯粹是信息性的。但是，集成开发工具，代码检查器，以及其它工具可能会使用它来执行更多的操作。

### 练习
在第 2 节中，编写了一个名为 report.py 的程序，该程序可以打印出显示股票投资组合绩效的报告。此程序包含一些函数。例如：
```
# report.py
import csv

def read_portfolio(filename):
    '''
    Read a stock portfolio file into a list of dictionaries with keys
    name, shares, and price.
    '''
    portfolio = []
    with open(filename) as f:
        rows = csv.reader(f)
        headers = next(rows)

        for row in rows:
            record = dict(zip(headers, row))
            stock = {
                'name' : record['name'],
                'shares' : int(record['shares']),
                'price' : float(record['price'])
            }
            portfolio.append(stock)
    return portfolio
...
```
但是，程序的有些部分仅执行一系列的脚本计算。这些代码出现在程序结尾处。例如：
```
...

# Output the report

headers = ('Name', 'Shares', 'Price', 'Change')
print('%10s %10s %10s %10s'  % headers)
print(('-' * 10 + ' ') * len(headers))
for row in report:
    print('%10s %10d %10.2f %10.2f' % row)
...
```
在本练习中，我们使用函数来对该程序进行有条理的组织，使程序更健壮。

#### **练习 3.1：将程序构造为函数的集合**
请修改 report.py 程序，以便所有主要操作（包括计算和输出）都由一组函数执行。特别地：
* 创建打印报告的函数 print_report(report)。
* 修改程序的最后一部分，使其仅是一系列函数调用，而无需进行其它运算。

#### **练习 3.2：为程序执行创建一个顶层函数**
把程序的最后一部分打包到单个函数 portfolio_report(portfolio_filename, prices_filename) 中。让程序运行，以便下面的函数调用像之前一样创建报告。
```
portfolio_report('Data/portfolio.csv', 'Data/prices.csv')
```
在最终版本中，程序只不过是一系列函数定义，最后是对单个函数portfolio_report() 的调用（它执行程序中涉及的所有步骤）。

通过将程序转换为单个函数，在不同的输入后可以很轻松地运行它。例如，在运行程序后以交互方式尝试这些语句：
```
>>> portfolio_report('Data/portfolio2.csv', 'Data/prices.csv')
... look at the output ...
>>> files = ['Data/portfolio.csv', 'Data/portfolio2.csv']
>>> for name in files:
        print(f'{name:-^43s}')
        portfolio_report(name, 'Data/prices.csv')
        print()

... look at the output ...
```
#### **说明**
Python 使在有一系列语句的文件中编写相对无结构的脚本变得很轻松。总体来说，无论何时，尽可能地利用函数通常总是更好的选择。在某些时候，脚本会不断增加，并且我们希望它更有组织。另外，一个鲜为人知的事实是，如果使用函数，Python 的运行会更快一些。

### 02 深入函数
尽管函数在早先时候介绍了，但有关函数在更深层次上是如何工作的细节却很少提供。本节旨在填补这些空白，并讨论函数调用约定，作用域规则等问题。
#### **调用函数**
考虑以下函数：
```
def read_prices(filename, debug):
    ...
```
可以使用位置参数调用该函数：
```
prices = read_prices('prices.csv', True)
```
或者，可以使用关键字参数调用该函数：
```
prices = read_prices(filename='prices.csv', debug=True)
```
#### **默认参数**
有时候，你希望参数是可选的，如果是这样，请在函数定义中分配一个默认值。
```
def read_prices(filename, debug=False):
    ...
```
如果分配了默认值，则参数在函数调用中是可选的。
```
d = read_prices('prices.csv')
e = read_prices('prices.dat', True)
```
**注意：** 带有默认值的参数（译注：即关键字参数）必须出现在参数列表的末尾（所有非可选参数都放在最前面）
#### **首选关键字参数作为可选参数**
比较以下两种不同的调用风格：
```
parse_data(data, False, True) # ?????

parse_data(data, ignore_errors=True)
parse_data(data, debug=True)
parse_data(data, debug=True, ignore_errors=True)
```
在大部分情况下，关键字参数提高了代码的可读性——特别是对于用作标志的参数，或者与可选特性相关的参数。

#### **设计最佳实践**
始终为函数参数指定简短但有意义的名称。

使用函数的人可能想要使用关键字调用风格。
```
d = read_prices('prices.csv', debug=True)
```
Python 开发工具将会在帮助功能或者帮助文档中显示这些名称。
#### **返回值**
return 语句返回一个值：
```
def square(x):
    return x * x
```
如果没有给出返回值或者 `return` 语句缺失，那么返回` None`：
```
def bar(x):
    statements
    return

a = bar(4)      # a = None

# OR
def foo(x):
    statements  # No `return`

b = foo(4)      # b = None
```
#### *多个返回值**
函数只能返回一个值。但是，通过将返回值放到元组中，函数可以返回多个值：
```
def divide(a,b):
    q = a // b      # Quotient
    r = a % b       # Remainder
    return q, r     # Return a tuple
```
用例：
```
x, y = divide(37,5) # x = 7, y = 2

x = divide(37, 5)   # x = (7, 2)
```
#### **变量作用域**
程序给变量赋值：
```
x = value # Global variable

def foo():
    y = value # Local variable
```
变量赋值发生在函数的内部和外部。定义在函数外部的变量是“全局的”。定义在函数内部的变量是“局部的”。
#### **局部变量**
在函数内部赋值的变量是私有的。
```
def read_portfolio(filename):
    portfolio = []
    for line in open(filename):
        fields = line.split(',')
        s = (fields[0], int(fields[1]), float(fields[2]))
        portfolio.append(s)
    return portfolio
```
在此示例中，filename, portfolio, line, fields 和 s 是局部变量。在函数调用之后，这些变量将不会保留或者不可访问。
```
>>> stocks = read_portfolio('portfolio.csv')
>>> fields
Traceback (most recent call last):
File "<stdin>", line 1, in ?
NameError: name 'fields' is not defined
>>>
```
局部变量也不能与其它地方的变量冲突。
#### **全局变量**
函数可以自由地访问定义在同一文件中的全局变量值。
```
name = 'Dave'

def greeting():
    print('Hello', name)  # Using `name` global variable
```
但是，函数不能修改全局变量：
```
name = 'Dave'

def spam():
  name = 'Guido'

spam()
print(name) # prints 'Dave'
```
**切记：函数中的所有赋值都是局部的**
#### **修改全局变量**
如果必须修改全局变量，请像下面这样声明它：
```
name = 'Dave'

def spam():
    global name
    name = 'Guido' # Changes the global name above
```
全局声明必须在使用之前出现，并且相应的变量必须与该函数处在同一文件中。看上面这个函数，要知道这是一种糟糕的形式。事实上，如果可以的话，尽量避免使用` global `。如果需要一个函数来修改函数外部的某种状态，最好是使用类来代替（稍后详细介绍）。

#### **参数传递**
当调用一个函数的时候，参数变量的传递是引用传递。不拷贝值（参见2.7 节）。如果传递了可变数据类型（如列表，字典），它们可以被原地修改。
```
def foo(items):
    items.append(42)    # Modifies the input object

a = [1, 2, 3]
foo(a)
print(a)                # [1, 2, 3, 42]
```
**关键点：函数不接受输入参数的拷贝。**
#### **重新赋值与修改**
确保了解修改值与给变量名重新赋值的细微差别。
```
def foo(items):
    items.append(42)    # Modifies the input object

a = [1, 2, 3]
foo(a)
print(a)                # [1, 2, 3, 42]

# VS
def bar(items):
    items = [4,5,6]    # Changes local `items` variable to point to a different object

b = [1, 2, 3]
bar(b)
print(b)                # [1, 2, 3]
```
**提醒：变量赋值永远不会重写内存。名称只是被绑定到了新的值上面**

### 练习
本组练习实现的内容可能是本课程最强大的和最难的。有很多步骤，并且过去练习中的许多概念被一次性整合在一起。虽然最后的题解只有大约 25 行的代码，但要花点时间，确保你理解每一个部分。

`report.py `的中心部分主要用于读取 CSV 文件。例如，`read_portfolio()` 函数读取包含投资组合数据的文件，`read_prices()` 函数读取包含价格数据的文件。在这两个函数中，有很多底层的“精细的”事以及相似的特性。例如，它们都打开一个文件并使用 csv 模块来处理，并且将各种字段转换为新的类型。

如果真的需要对大量的文件进行解析，可能需要清理其中的一些内容使其更通用。这是我们的目标。

通过打开 `Work/fileparse.py`文件开始本练习，该文件是我们将要写代码的地方。

#### **练习 3.3：读取 CSV 文件**
首先，让我们仅关注将 CSV 文件读入字典列表的问题。在 fileparse.py 中，定义一个如下所示的函数：
```
# fileparse.py
import csv

def parse_csv(filename):
    '''
    Parse a CSV file into a list of records
    '''
    with open(filename) as f:
        rows = csv.reader(f)

        # Read the file headers
        headers = next(rows)
        records = []
        for row in rows:
            if not row:    # Skip rows with no data
                continue
            record = dict(zip(headers, row))
            records.append(record)

    return records
```
该函数将 CSV 文件读入字典列表中，但是隐藏了打开文件，使用 csv 模块处理，忽略空行等详细信息。

试试看：

提示： python3 -i fileparse.py.
```
>>> portfolio = parse_csv('Data/portfolio.csv')
>>> portfolio
[{'price': '32.20', 'name': 'AA', 'shares': '100'}, {'price': '91.10', 'name': 'IBM', 'shares': '50'}, {'price': '83.44', 'name': 'CAT', 'shares': '150'}, {'price': '51.23', 'name': 'MSFT', 'shares': '200'}, {'price': '40.37', 'name': 'GE', 'shares': '95'}, {'price': '65.10', 'name': 'MSFT', 'shares': '50'}, {'price': '70.44', 'name': 'IBM', 'shares': '100'}]
>>>
```
这很好，除了不能使用数据做任何有用的计算之外。因为所有的内容都是用字符串表示。我们将马上解决此问题，先让我们继续在此基础上进行构建。

In [1]:
import fileparse
portfolio = fileparse.parse_csv('Data/portfolio.csv')
portfolio

[{'name': 'AA', 'shares': '100', 'price': '32.20'},
 {'name': 'IBM', 'shares': '50', 'price': '91.10'},
 {'name': 'CAT', 'shares': '150', 'price': '83.44'},
 {'name': 'MSFT', 'shares': '200', 'price': '51.23'},
 {'name': 'GE', 'shares': '95', 'price': '40.37'},
 {'name': 'MSFT', 'shares': '50', 'price': '65.10'},
 {'name': 'IBM', 'shares': '100', 'price': '70.44'}]

#### **练习 3.4：构建列选择器**
在大部分情况下，你只对 CSV 文件中选定的列感兴趣，而不是所有数据。修改 parse_csv() 函数，以便让用户指定任意的列，如下所示：
```
>>> # Read only some of the data
>>> shares_held = parse_csv('Data/portfolio.csv', select=['name','shares'])
>>> shares_held
[{'name': 'AA', 'shares': '100'}, {'name': 'IBM', 'shares': '50'}, {'name': 'CAT', 'shares': '150'}, {'name': 'MSFT', 'shares': '200'}, {'name': 'GE', 'shares': '95'}, {'name': 'MSFT', 'shares': '50'}, {'name': 'IBM', 'shares': '100'}]
>>>
```

In [2]:
shares_held = fileparse.parse_csv('Data/portfolio.csv', select=['name','shares'])
shares_held

[{'name': 'AA', 'shares': '100'},
 {'name': 'IBM', 'shares': '50'},
 {'name': 'CAT', 'shares': '150'},
 {'name': 'MSFT', 'shares': '200'},
 {'name': 'GE', 'shares': '95'},
 {'name': 'MSFT', 'shares': '50'},
 {'name': 'IBM', 'shares': '100'}]

练习 2.23 中给出了列选择器的示例。

然而，这里有一个方法可以做到这一点：
```
# fileparse.py
import csv

def parse_csv(filename, select=None):
    '''
    Parse a CSV file into a list of records
    '''
    with open(filename) as f:
        rows = csv.reader(f)

        # Read the file headers
        headers = next(rows)

        # If a column selector was given, find indices of the specified columns.
        # Also narrow the set of headers used for resulting dictionaries
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []
        for row in rows:
            if not row:    # Skip rows with no data
                continue
            # Filter the row if specific columns were selected
            if indices:
                row = [ row[index] for index in indices ]

            # Make a dictionary
            record = dict(zip(headers, row))
            records.append(record)

    return records
```
这部分有一些棘手的问题，最重要的一个可能是列选择到行索引的映射。例如，假设输入文件具有以下标题：
```
headers = ['name', 'date', 'time', 'shares', 'price']
```
现在，假设选定的列如下：
```
>>> select = ['name', 'shares']
>>>
```
为了执行正确的选择，必须将选择的列名映射到文件中的列索引。这就是该步骤正在执行的操作：
```
>>> indices = [headers.index(colname) for colname in select ]
>>> indices
[0, 3]
>>>
```
换句话说，名称（"name" ）是第 0 列，股份数目（"shares" ）是第 3 列。

当从文件读取数据行的时候，使用索引对其进行过滤：
```
>>> row = ['AA', '6/11/2007', '9:50am', '100', '32.20' ]
>>> row = [ row[index] for index in indices ]
>>> row
['AA', '100']
>>>
```

#### **练习 3.5：执行类型转换**
修改 parse_csv() 函数，以便可以选择将类型转换应用到返回数据上。例如：
```
>>> portfolio = parse_csv('Data/portfolio.csv', types=[str, int, float])
>>> portfolio
[{'price': 32.2, 'name': 'AA', 'shares': 100}, {'price': 91.1, 'name': 'IBM', 'shares': 50}, {'price': 83.44, 'name': 'CAT', 'shares': 150}, {'price': 51.23, 'name': 'MSFT', 'shares': 200}, {'price': 40.37, 'name': 'GE', 'shares': 95}, {'price': 65.1, 'name': 'MSFT', 'shares': 50}, {'price': 70.44, 'name': 'IBM', 'shares': 100}]

>>> shares_held = parse_csv('Data/portfolio.csv', select=['name', 'shares'], types=[str, int])
>>> shares_held
[{'name': 'AA', 'shares': 100}, {'name': 'IBM', 'shares': 50}, {'name': 'CAT', 'shares': 150}, {'name': 'MSFT', 'shares': 200}, {'name': 'GE', 'shares': 95}, {'name': 'MSFT', 'shares': 50}, {'name': 'IBM', 'shares': 100}]
>>>
```
在 练习 2.24 中已经对此进行了探索。需要将下列代码片段插入到题解中：
```
...
if types:
    row = [func(val) for func, val in zip(types, row) ]
...
```

In [2]:
shares_held = fileparse.parse_csv('Data/portfolio.csv', select=['name', 'shares'], types=[str, int])
shares_held

[{'name': 'AA', 'shares': 100},
 {'name': 'IBM', 'shares': 50},
 {'name': 'CAT', 'shares': 150},
 {'name': 'MSFT', 'shares': 200},
 {'name': 'GE', 'shares': 95},
 {'name': 'MSFT', 'shares': 50},
 {'name': 'IBM', 'shares': 100}]

#### **练习 3.6：处理无标题的数据**
某些 CSV 文件不包含任何的标题信息。例如，prices.csv 文件看起来像下面这样：
```
"AA",9.22
"AXP",24.85
"BA",44.85
"BAC",11.27
...
```
修改 parse_csv() 文件以便通过创建元组列表来处理此类文件。例如：
```
>>> prices = parse_csv('Data/prices.csv', types=[str,float], has_headers=False)
>>> prices
[('AA', 9.22), ('AXP', 24.85), ('BA', 44.85), ('BAC', 11.27), ('C', 3.72), ('CAT', 35.46), ('CVX', 66.67), ('DD', 28.47), ('DIS', 24.22), ('GE', 13.48), ('GM', 0.75), ('HD', 23.16), ('HPQ', 34.35), ('IBM', 106.28), ('INTC', 15.72), ('JNJ', 55.16), ('JPM', 36.9), ('KFT', 26.11), ('KO', 49.16), ('MCD', 58.99), ('MMM', 57.1), ('MRK', 27.58), ('MSFT', 20.89), ('PFE', 15.19), ('PG', 51.94), ('T', 24.79), ('UTX', 52.61), ('VZ', 29.26), ('WMT', 49.74), ('XOM', 69.35)]
>>>
```
要执行此更改，需要修改代码以便数据的第一行不被解释为标题行。另外，需要确保不创建字典，因为不再有可用于列名的键。

In [3]:
prices = fileparse.parse_csv('Data/prices.csv', types=[str,float], has_headers=False)
prices

[('AA', 9.22),
 ('AXP', 24.85),
 ('BA', 44.85),
 ('BAC', 11.27),
 ('C', 3.72),
 ('CAT', 35.46),
 ('CVX', 66.67),
 ('DD', 28.47),
 ('DIS', 24.22),
 ('GE', 13.48),
 ('GM', 0.75),
 ('HD', 23.16),
 ('HPQ', 34.35),
 ('IBM', 106.28),
 ('INTC', 15.72),
 ('JNJ', 55.16),
 ('JPM', 36.9),
 ('KFT', 26.11),
 ('KO', 49.16),
 ('MCD', 58.99),
 ('MMM', 57.1),
 ('MRK', 27.58),
 ('MSFT', 20.89),
 ('PFE', 15.19),
 ('PG', 51.94),
 ('T', 24.79),
 ('UTX', 52.61),
 ('VZ', 29.26),
 ('WMT', 49.74),
 ('XOM', 69.35)]

#### **练习 3.7：选择其它的列分隔符**
尽管 CSV 文件非常普遍，但还可能会遇到使用其它列分隔符（如 制表符（tab） 或空格符（space））的文件。例如，如下所示的 `Data/portfolio.dat` 文件：
```
name shares price
"AA" 100 32.20
"IBM" 50 91.10
"CAT" 150 83.44
"MSFT" 200 51.23
"GE" 95 40.37
"MSFT" 50 65.10
"IBM" 100 70.44
```
`csv.reader()` 函数允许像下面这样指定不同的分隔符：
```
rows = csv.reader(f, delimiter=' ')
```
修改 parse_csv() 函数以便也允许修改分隔符。

例如：
```
>>> portfolio = parse_csv('Data/portfolio.dat', types=[str, int, float], delimiter=' ')
>>> portfolio
[{'price': '32.20', 'name': 'AA', 'shares': '100'}, {'price': '91.10', 'name': 'IBM', 'shares': '50'}, {'price': '83.44', 'name': 'CAT', 'shares': '150'}, {'price': '51.23', 'name': 'MSFT', 'shares': '200'}, {'price': '40.37', 'name': 'GE', 'shares': '95'}, {'price': '65.10', 'name': 'MSFT', 'shares': '50'}, {'price': '70.44', 'name': 'IBM', 'shares': '100'}]
>>>
```

In [4]:
portfolio = fileparse.parse_csv('Data/portfolio.dat', types=[str, int, float], delimiter=' ')
portfolio

[{'name': 'AA', 'shares': 100, 'price': 32.2},
 {'name': 'IBM', 'shares': 50, 'price': 91.1},
 {'name': 'CAT', 'shares': 150, 'price': 83.44},
 {'name': 'MSFT', 'shares': 200, 'price': 51.23},
 {'name': 'GE', 'shares': 95, 'price': 40.37},
 {'name': 'MSFT', 'shares': 50, 'price': 65.1},
 {'name': 'IBM', 'shares': 100, 'price': 70.44}]

#### **说明**
到目前为止，如果你已经完成，那么你创建了一个非常有用的库函数。你可以使用它去解析任意的 CSV 文件，选择感兴趣的列，执行类型转换，而不用对文件或者 csv 模块的内部工作有太多的担心。

### 03 错误检查
虽然前面已经介绍了异常，但本节补充一些有关错误检查和异常处理的其它细节。
#### **程序是如何运行失败的**
Python 不对函数参数类型或值进行检查或者校验。函数可以处理与函数内部语句兼容的任何数据。
```
def add(x, y):
    return x + y

add(3, 4)               # 7
add('Hello', 'World')   # 'HelloWorld'
add('3', '4')           # '34'
```
如果函数中有错误，它们将（作为异常）在运行时出现。
```
def add(x, y):
    return x + y

>>> add(3, '4')
Traceback (most recent call last):
...
TypeError: unsupported operand type(s) for +:
'int' and 'str'
>>>
```
为了验证代码，强烈建议进行测试（稍后介绍）。
#### **异常**
异常用于发出错误信号。

要自己触发异常，请使用 raise 语句：
```
if name not in authorized:
    raise RuntimeError(f'{name} not authorized')
```
要捕获异常，请使用 try-except 语句：
```
try:
    if authenticate['username'] == username:
        print("Authentication successful")
    else:
        raise RuntimeError("Invalid username")
except KeyError:
    print("Username not found in authentication data")
except RuntimeError as e:
    print(f"Authentication error: {e}")
```
#### **异常处理**
异常传递到第一个匹配的 except ：
```
def grok():
    ...
    raise RuntimeError('Whoa!')   # Exception raised here

def spam():
    grok()                        # Call that will raise exception

def bar():
    try:
       spam()
    except RuntimeError as e:     # Exception caught here
        ...

def foo():
    try:
         bar()
    except RuntimeError as e:     # Exception does NOT arrive here
        ...

foo()
```
要处理异常，请将语句放到 except 块里面。 except 块里面可以添加要处理该错误的任何语句。
```
def grok(): ...
    raise RuntimeError('Whoa!')

def bar():
    try:
      grok()
    except RuntimeError as e:   # Exception caught here
        statements              # Use this statements
        statements
        ...

bar()
```
异常处理之后，从 try-except 之后的第一个语句继续执行。
```
def grok(): ...
    raise RuntimeError('Whoa!')

def bar():
    try:
      grok()
    except RuntimeError as e:   # Exception caught here
        statements
        statements
        ...
    statements                  # Resumes execution here
    statements                  # And continues here
    ...

bar()
```
#### **内置异常**
有非常多的內建异常。通常，异常名称表明出了什么问题（例如，因为提供错误的值而触发 ValueError）。下述列表不是一份详尽的清单，请访问 [文档](https://docs.python.org/3/library/exceptions.html) 以获取更多信息。
```
ArithmeticError
AssertionError
EnvironmentError
EOFError
ImportError
IndexError
KeyboardInterrupt
KeyError
MemoryError
NameError
ReferenceError
RuntimeError
SyntaxError
SystemError
TypeError
ValueError
```
#### **异常值**
异常具有一个关联值。它包含有关错误的更明确的信息。
```
raise RuntimeError('Invalid user name')
```
这个值是异常实例的一部分，它被放置在提供给 except 的变量中。
```
try:
    ...
except RuntimeError as e:   # `e` holds the exception raised
    ...
```
e 是异常类型的一个实例。但是，当打印的时候，它通常看起来像一个字符串。
```
except RuntimeError as e:
    print('Failed : Reason', e)
```

#### **捕获多个异常**
可以使用多个 except 块捕获不同类型的异常：
```
try:
  ...
except LookupError as e:
  ...
except RuntimeError as e:
  ...
except IOError as e:
  ...
except KeyboardInterrupt as e:
  ...
```
或者，如果处理不同异常的语句是相同的，则可以对它们进行分组：
```
try:
  ...
except (IOError,LookupError,RuntimeError) as e:
  ...
```
#### **捕获所有的异常**
要捕获所有的异常，请使用 Exception 。如下所示：
```
try:
    ...
except Exception:       # DANGER. See below
    print('An error occurred')
```
通常，像这样编写代码是个坏主意，因为这说明不知道程序为什么会失败。
#### **捕获异常的错误方式**
这里是一个使用异常的错误方式。
```
try:
    go_do_something()
except Exception:
    print('Computer says no')
```
这将捕获所有可能的错误，并且，当代码因为某些根本没想到的原因（如卸载 Python 模块等）运行失败时，可能无法进行调试。
#### **更好的方式**
如果想要捕获所有的错误，这有一个更明智的方法。
```
try:
    go_do_something()
except Exception as e:
    print('Computer says no. Reason :', e)
```
它报告了失败的明确原因。当编写捕获所有可能异常的代码时，拥有查看/报告错误的机制几乎总是一个好主意。

不过，通常来说，最好在合理的范围内尽量窄地捕获异常。仅捕获能处理的异常。让其它错误通过——也许其它代码可以处理。
#### **重新触发异常**
使用 raise 传递捕获的错误。
```
try:
    go_do_something()
except Exception as e:
    print('Computer says no. Reason :', e)
    raise
```
这允许你采取措施（例如：记录日志）并将错误传递给调用者。
#### **异常的最佳实践**
不要捕获异常，而是失败发生时“停止运行，发出预警”（Fail fast and loud）。如果重要的话，别人会处理的。只有你是那个人的时候才捕获异常。即，只捕获可以恢复并正常运行的错误。
#### **finally 语句**
finally 语句指定无论是否发生异常都必须运行的代码。
```
lock = Lock()
...
lock.acquire()
try:
    ...
finally:
    lock.release()  # this will ALWAYS be executed. With and without exception.
```
通常使用 finally 语句安全地管理资源（尤其是锁，文件等）。
#### **with 语句**
在现代代码中，try-finally 语句通常被 with 语句取代。
```
lock = Lock()
with lock:
    # lock acquired
    ...
# lock released
```
一个更熟悉的例子：
```
with open(filename) as f:
    # Use the file
    ...
# File closed
```
with 语句定义资源的使用上下文。当执行离开上下文时，资源被释放。with 语句仅适用于经过专门编程以支持它的某些对象。

### 练习
#### **练习 3.8：触发异常**
在上一节中编写的 parse_csv() 函数允许选择用户指定的列，但是只有输入数据文件具有列标题时才会生效。

请修改代码，以便在同时传递 select 和 has_headers=False 参数时触发异常。例如：
```
>>> parse_csv('Data/prices.csv', select=['name','price'], has_headers=False)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "fileparse.py", line 9, in parse_csv
    raise RuntimeError("select argument requires column headers")
RuntimeError: select argument requires column headers
>>>
```
添加此检查后，你可能会问是否应该在函数中执行其它类型的完整性检查。例如，检查文件名是字符串，列表还是其它类型？

一般来说，最好是跳过此类测试，输入错误的时候让程序运行失败。回溯信息会指出问题的根源，并且帮助调试。

添加上述检查的主要原因是为了避免在无意义的模式下运行代码（例如，使用要求列标题的特性，但是同时指定没有标题）。

这表明调用代码部分出现一个编程错误。检查“不应发生”的情况通常是个好主意。

#### **练习 3.9：捕获异常**
你编写的 parse_csv() 函数用于处理文件的全部内容。但是，在现实世界中，输入文件可能包含损坏的数据，丢失的数据或者脏数据。尝试下面这个实验：
```
>>> portfolio = parse_csv('Data/missing.csv', types=[str, int, float])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "fileparse.py", line 36, in parse_csv
    row = [func(val) for func, val in zip(types, row)]
ValueError: invalid literal for int() with base 10: ''
>>>
```
请修改 parse_csv() 函数以便捕获所有在记录创建期间生成的 ValueError 异常，并为无法转换的行打印警告消息。

错误消息应该包括行号以及有关失败原因的信息。要测试函数，尝试读取上面的 Data/missing.csv 文件，例如：

>>> portfolio = parse_csv('Data/missing.csv', types=[str, int, float])
Row 4: Couldn't convert ['MSFT', '', '51.23']
Row 4: Reason invalid literal for int() with base 10: ''
Row 7: Couldn't convert ['IBM', '', '70.44']
Row 7: Reason invalid literal for int() with base 10: ''
>>>
>>> portfolio
[{'price': 32.2, 'name': 'AA', 'shares': 100}, {'price': 91.1, 'name': 'IBM', 'shares': 50}, {'price': 83.44, 'name': 'CAT', 'shares': 150}, {'price': 40.37, 'name': 'GE', 'shares': 95}, {'price': 65.1, 'name': 'MSFT', 'shares': 50}]
>>>

#### **练习 3.10：隐藏错误**
请修改 parse_csv()函数，以便用户明确需要时可以隐藏解析的错误消息，例如：
```
>>> portfolio = parse_csv('Data/missing.csv', types=[str,int,float], silence_errors=True)
>>> portfolio
[{'price': 32.2, 'name': 'AA', 'shares': 100}, {'price': 91.1, 'name': 'IBM', 'shares': 50}, {'price': 83.44, 'name': 'CAT', 'shares': 150}, {'price': 40.37, 'name': 'GE', 'shares': 95}, {'price': 65.1, 'name': 'MSFT', 'shares': 50}]
>>>
```
在大部分的程序中，错误处理是最难做好的事情之一。一般来说，不应该默默地忽略错误。相反，最好是报告问题，并且让用户选择是否隐藏错误信息（如果它们选择这样做）。

## 04 模块和导入
本节介绍模块的概念以及如何使用跨多个文件的函数。
#### **模块和导入**
任何一个 Python 源文件都是一个模块。
```
# foo.py
def grok(a):
    ...
def spam(b):
    ...
```
`import `语句加载并执行一个模块。
```
# program.py
import foo

a = foo.grok(2)
b = foo.spam('Hello')
...
```
#### **命名空间**
模块是命名值的集合，有时也称为命名空间。名称是源文件中定义的所有全局变量和函数。导入之后，模块名称用作前缀。因此，称为命名空间。
```
import foo

a = foo.grok(2)
b = foo.spam('Hello')
...
```
模块名直接绑定到文件名（foo -> foo.py）。
#### **全局定义**
填充模块命名空间的内容是定义在 **全局（global）** 作用域中任何内容。考虑定义了相同变量 x 的两个模块。
```
# foo.py
x = 42
def grok(a):
    ...

# bar.py
x = 37
def spam(a):
    ...
```
在本例中，x 指向不同的变量。一个是 foo.x，另一个是 bar.x。不同的模块可以使用相同的名称并且这些名称不会相互冲突。

**模块是隔离的。**

#### **把模块当做环境**
对于所有定义在模块里面的代码而言，模块构成一个封闭的环境。
```
# foo.py
x = 42

def grok(a):
    print(x)
```
全局变量始终绑定到封闭模块（相同文件），每个源文件都是它自己的小宇宙。
#### **模块执行**
导入模块时，模块中的所有语句依次执行（execute），直到到达文件末尾。模块命名空间的内容是所有的全局名称，这些名称在执行过程结束时仍然被定义。如果有脚本语句在全局作用域中执行任务（如打印，创建文件等），您将看到它们在导入模块时运行。
#### **import as 语句**
可以在导入模块时更改其名称：
```
import math as m
def rectangular(r, theta):
    x = r * m.cos(theta)
    y = r * m.sin(theta)
    return x, y
```
它的作用与普通导入相同，仅仅是重命名模块而已。
#### **from import语句**
`from import`语句从模块中选出符号并使它们在局部可访问。
```
from math import sin, cos

def rectangular(r, theta):
    x = r * cos(theta)
    y = r * sin(theta)
    return x, y
```
这允许使用模块的某些部分，而不必输入模块前缀。对于经常使用的名称，这非常有用。
#### **导入说明**
有关导入的各种变化不改变模块的工作方式。
```
import math
# vs
import math as m
# vs
from math import cos, sin
...
```
具体来说，`import `始终执行整个文件并且模块仍然是隔离的环境。

`import module as` 语句只局部地更改名称。在后台，`from math import cos, sin `语句仍加载全部的数学模块。当导入完成后，它仅仅将模块中的` cos` 和 `sin` 名称复制到局部命名空间中。
#### **模块加载**
每个模块仅加载和执行一次。注意：重复导入仅返回先前所加载模块的引用

`sys.modules` 是所有已加载模块的字典。
```
>>> import sys
>>> sys.modules.keys()
['copy_reg', '__main__', 'site', '__builtin__', 'encodings', 'encodings.encodings', 'posixpath', ...]
>>>
```
注意：当修改模块的源代码后，如果重复import语句会产生一个常见的困惑。由于模块缓存 sys.modules，重复导入总是返回之前加载的模块——即使更改已经发生。将修改后的代码加载到 Python 中最安全的方式是退出然后重启解释器。
#### **定位模块**
搜索模块时，Python 从路径列表（sys.path）中查询。
```
>>> import sys
>>> sys.path
[
  '',
  '/usr/local/lib/python36/python36.zip',
  '/usr/local/lib/python36',
  ...
]
```
当前工作目录通常是第一个。
#### **模块搜索路径**
如前所述，sys.path 包含搜索路径。可以根据需要手动调整 。
```
import sys
sys.path.append('/project/foo/pyfiles')
```
也可以通过环境变量添加搜索路径。
```
% env PYTHONPATH=/project/foo/pyfiles python3
Python 3.6.0 (default, Feb 3 2017, 05:53:21)
[GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.38)]
>>> import sys
>>> sys.path
['','/project/foo/pyfiles', ...]
```
在大部分情况下，没必要手动调整模块搜索路径。但是，如果尝试导入的 Python 代码位于特殊位置，或者无法从当前工作目录轻松访问，那么就需要手动调整搜索路径了。

### 练习
因为本练习涉及模块，所以确保在适当的环境中运行 Python 至关重要。模块经常给编程新手带来问题，这些问题与当前工作目录相关或者与 Python 路径设置相关。对于本课程，假定您是在 Work/ 目录下编写所有的代码。为了获得最佳结果，应该确保也是在 Work/ 目录下运行解释器。否则，需要确保 practical-python/Work 已添加到 sys.path。
#### **练习 3.11：模块导入**
在第 3 节中，我们创建了一个通用目标函数 parse_csv() 用于解析 CSV 数据文件的内容。

现在，我们来看看如何在其它程序中使用该函数。首先，启动一个新的 shell 窗口，进入到放置所有文件的目录中。我们将要导入它们。

启动 Python 交互模式。
```
bash % python3
Python 3.6.1 (v3.6.1:69c0db5050, Mar 21 2017, 01:21:04)
[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>>
```
当Python 交互模式启动后，尝试导入某些之前编写的程序。应该能看到输出和以前一样。强调一下，导入模块会运行模块中的代码。

In [5]:
import report

如果没有代码运行，可能是因为在错误的目录下运行了 Python。现在，尝试导入 fileparse 模块并获取有关该模块的帮助。

In [12]:
import fileparse
# help(fileparse)
# dir(fileparse)
# 尝试使用 fileparse 模块来读取一些数据
portfolio = fileparse.parse_csv('Data/portfolio.csv',select=['name', 'shares', 'price'], types=[str, int, float])
portfolio
pricelist = fileparse.parse_csv('Data/prices.csv', types=[str, float], has_headers=False)
pricelist
prices = dict(pricelist)
prices
prices['IBM']

106.28

尝试导入一个函数名，以便不用再包含模块名：

In [None]:
from fileparse import parse_csv
portfolio = parse_csv('Data/portfolio.csv',select=['name', 'shares', 'price'], types=[str, int, float])
portfolio

#### **练习 3.12：使用库模块**
在第 2 节中，编写了 report.py 程序用来生成像下面这样的股票报告：
```
      Name     Shares      Price     Change
---------- ---------- ---------- ----------
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84
```
使用该程序并对其进行修改，以便使用 fileparse 模块中的函数完成所有输入文件的处理。为此，将 `fileparse` 作为模块导入，并修改 read_portfolio() 和 read_prices() 函数以便使用 parse_csv() 函数。

在本练习开始时，请使用交互示例作为指南。之后，应该能够获得与之前完全相同的输出。

#### **练习 3.14：使用更多的库导入**
在第 1 节中，编写了一个读取股票投资组合和计算费用的程序 pcost.py。
```
>>> import pcost
>>> pcost.portfolio_cost('Data/portfolio.csv')
44671.15
>>>
```
请修改 pcost.py 文件，以便它能够使用 report.read_portfolio() 函数。
### 说明
当完成练习后，您应该拥有三个程序。包含通用目的函数 parse_csv() 的fileparse.py 程序。用于生成报告，且包含 read_portfolio() 和 read_prices() 函数的 report.py 程序。最后，利用 report.py 程序中编写的read_portfolio() 函数去计算股票投资组合费用的 pcost.py 程序。

## 05 主模块
本节介绍主程序（主模块）的概念
#### **主函数**
许多编程语言都有一个主函数或者主方法的概念。
```
// c / c++
int main(int argc, char *argv[]) {
    ...
}

// java
class myprog {
    public static void main(String args[]) {
        ...
    }
}
```
这是应用程序启动后执行的第一个函数。
#### **Python 主模块**
Python 没有主函数（main function）或主方法（main method）。相反，它有一个主模块（main module）的概念。主模块是第一个运行的源文件。
```
bash % python3 prog.py
...
```
在应用程序启动时，提供给解释器的任何文件都将成为主模块。主模块的名称是什么并不重要。
#### **__main__ 检查**
在编写作为主脚本运行的模块时，以下约定（译注：`__main__ `检查）是一个标准惯例。
```
# prog.py
...
if __name__ == '__main__':
    # Running as the main program ...
    statements
    ...
```
其中，if 里面的语句被称为主程序（ main program）。
#### **主程序与库导入**
任何 Python 文件都可以作为主模块运行，或者作为一个库（译注：library，在 Python 中 library 既可以指模块 module，也可以指包 package），导入后运行。
```
bash % python3 prog.py # Running as main

import prog   # Running as library import
```
在这两种情况下，prog.py 内的 __name__ 变量都是模块的名称。该名称只有当模块作为主模块运行时才被置为 __main__。

通常，我们不希望主程序中的语句在库导入的时候执行。因此对于可能以两种方式执行的模块，我们通常在代码中使用一个 if- 检查，判断当前文件是否是主程序（译注：如果当前程序不是主程序，则 if __name__ == '__main__': 里面的语句不执行）。
```
if __name__ == '__main__':
    # Does not execute if loaded with import ...
```
#### **程序模板**
这里有一个用于编写 Python 程序的通用模板：
```
# prog.py
# Import statements (libraries)
import modules

# Functions
def spam():
    ...

def blah():
    ...

# Main function
def main():
    ...

if __name__ == '__main__':
    main()
```

#### **命令行工具**
`Python` 通常被用于编写命令行工具：
```
bash % python3 report.py portfolio.csv prices.csv
```
这意味着脚本在 shell 或者 终端（terminal）执行。这些脚本通常被用于自动化，后台任务等场景。
#### **命令行参数**
命令行参数是一个包含文本字符串的列表。
```
bash % python3 report.py portfolio.csv prices.csv
```
该列表可以通过 sys.argv 变量访问。
```
# In the previous bash command
sys.argv # ['report.py, 'portfolio.csv', 'prices.csv']
```
以下有一个处理参数的简单示例：
```
import sys

if len(sys.argv) != 3:
    raise SystemExit(f'Usage: {sys.argv[0]} ' 'portfile pricefile')
portfile = sys.argv[1]
pricefile = sys.argv[2]
...
```
#### **标准 I/O**
标准输入/输出（或者stdio）也是文件，有着和普通文件相同的工作方式。
```
sys.stdout
sys.stderr
sys.stdin
```
默认情况下，打印被定向到 sys.stdout 文件，回溯和错误信息被定向到 sys.stderr 文件，输入则是从 sys.stdin 文件读取的。

请注意，标准输入/输出（stdio）可以连接到终端（terminals），文件（files），管道（pipes）等。
```
bash % python3 prog.py > results.txt
# or
bash % cmd1 | python3 prog.py | cmd2
```
#### **环境变量**
可以在 shell 中设置环境变量。
```
bash % setenv NAME dave
bash % setenv RSH ssh
bash % python3 prog.py
```
os.environ 是一个包含这些值的字典。
```
import os

name = os.environ['NAME'] # 'dave'
```
对环境变量的更改会反映在程序启动的任何子进程中。
#### **程序退出**
退出程序可以通过抛出一个异常来实现：
```
raise SystemExit
raise SystemExit(exitcode)
raise SystemExit('Informative message')
```
抑或是
```
import sys
sys.exit(exitcode)
```
非零（non-zero）退出码可用于表示程序发生了错误。
### **#! 行**
在 Unix 系统中，#! 行可用于指定某个路径下的 Python 解释器来执行该脚本（译注：#! 称为 Shebang 或者 hashbang，因为 # 号通常称为 hash 或者 sharp，而 ! 号则常常称为 bang）。将以下内容添加到脚本文件的第一行。
```
#!/usr/bin/env python3
# prog.py
...
```
（译注：#!/usr/bin/env python3 的意思——到 Unix 系统 env 所包含的全部环境变量中寻找 Python3 解释器，并使用 Python3 解释器执行该脚本）

执行脚本需要脚本具有可执行权限。
```
bash % chmod +x prog.py
# Then you can execute
bash % prog.py
... output ...
```
注意：Windows 系统上的 Python 启动器也会寻找 #! 行以指示语言版本。

（译注：Windows 上的 Python 启动器是一个名为 py 的程序，可以通过添加如 #! py -3.8 到脚本文件第一行以指定解释器的版本）
#### **脚本模板**
最后，这里有一个通用代码模板，用于将 Python 程序作为命令行脚本运行：
```
#!/usr/bin/env python3
# prog.py

# Import statements (libraries)
import modules

# Functions
def spam():
    ...

def blah():
    ...

# Main function
def main(argv):
    # Parse command line args, environment, etc.
    ...

if __name__ == '__main__':
    import sys
    main(sys.argv)
```

### 练习
#### **练习 3.15：main() 函数**
在 report.py 文件中添加一个 main() 函数，该函数接受命令行选项列表，并生成与以前相同的输出。修改后，应该能够像下面这样交互地运行它：
```
>>> import report
>>> report.main(['report.py', 'Data/portfolio.csv', 'Data/prices.csv'])
      Name     Shares      Price     Change
---------- ---------- ---------- ----------
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84
>>>
```
请修改 pcost.py 文件，添加一个类似的 main() 函数。
```
>>> import pcost
>>> pcost.main(['pcost.py', 'Data/portfolio.csv'])
Total cost: 44671.15
>>>
```

In [1]:
import report
report.main(['report.py', 'Data/portfolio.csv', 'Data/prices.csv'])

        名称       股份数量         价格         变化
---------- ---------- ---------- ---------- 
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84


In [1]:
import pcost
pcost.main(['pcost.py', 'Data/portfolio.csv'])

Total cost: 44671.15


#### **练习 3.16：编写脚本**
请修改 report.py 和 pcost.py 程序，以便它们在命令行上可以作为脚本执行：
```
bash $ python3 report.py Data/portfolio.csv Data/prices.csv
      Name     Shares      Price     Change
---------- ---------- ---------- ----------
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84

bash $ python3 pcost.py Data/portfolio.csv
Total cost: 44671.15
```

## 06 设计讨论
本节，我们重新考虑之前所做的设计决策。
#### **文件名与可迭代对象**
考虑一下两个返回相同输出的重新。
```
# Provide a filename
def read_data(filename):
    records = []
    with open(filename) as f:
        for line in f:
            records.append(line.rstrip())
    return records

d = read_data('../Playground/Data/portfolio.csv')

# Provide lines
def read_data(lines):
    records = []
    for line in lines:
        records.append(line.rstrip())
    return records

with open('../Playground/Data/portfolio.csv') as f:
    d = read_data(f)
```
* 你更倾向于使用哪个函数？为什么？
* 哪个函数更灵活？
#### **鸭子类型（Duck Typing）**
在计算机程序设计中，`鸭子类型` 用于确定一个对象是否可用于特定目的。这是 鸭子测试 的一种应用。
```
    如果它看起来像鸭子、游泳像鸭子、叫声像鸭子，那么它可能就是只鸭子。
```
上述第二个 `read_data()` 函数接受任何可迭代对象，而不仅是文件行。
```
def read_data(lines):
    records = []
    for line in lines:
        records.append(line.strip().split(','))
    return records
```
这意味这我们可以使用它处理其它的行（lines）。
```
# A CSV file
lines = open('../Playground/Data/portfolio.csv')
data = read_data(lines)

# A zipped file
lines = gzip.open('../Playground/Data/portfolio.csv.gz','rt')
data = read_data(lines)

# The Standard Input
lines = sys.stdin
data = read_data(lines)

# A list of strings
lines = ['ACME,50,91.1','IBM,75,123.45', ... ]
data = read_data(lines)
```
这种设计具有很大的灵活性。

问题：我们应该拥抱还是反对这种灵活性？
#### **库设计最佳实践**
通常，拥抱灵活性可以更好的服务于代码库。不要限制你的选择，灵活性大，带来的威力也大。

### 练习
#### **练习 3.17：从文件名到类文件对象**
现在，你已经创建了一个包含 `parse_csv()` 函数的 `fileparse.py` 文件。`parse_csv()` 函数像下面这样工作：
```
>>> import fileparse
>>> portfolio = fileparse.parse_csv('Data/portfolio.csv', types=[str,int,float])
>>>
```
虽然函数接受的是一个文件名，但是，你可以使代码更具灵活性。请修改函数，以便它可以接受任何类文件或者可迭代对象。例如：
```
>>> import fileparse
>>> import gzip
>>> with gzip.open('Data/portfolio.csv.gz', 'rt') as file:
...      port = fileparse.parse_csv(file, types=[str,int,float])
...
>>> lines = ['name,shares,price', 'AA,100,34.23', 'IBM,50,91.1', 'HPE,75,45.1']
>>> port = fileparse.parse_csv(lines, types=[str,int,float])
>>>
```
在新的代码中，如果像以前一样传递一个文件名会发生什么？
```
>>> port = fileparse.parse_csv('Data/portfolio.csv', types=[str,int,float])
>>> port
... look at output (it should be crazy) ...
>>>
```
正如上面代码显示的那样，这可能带来意想不到的结果，所以，修改的时候需要小心一些。你可以添加安全检查来避免这种情况吗？

In [2]:
import fileparse
lines = ['name,shares,price', 'AA,100,34.23', 'IBM,50,91.1', 'HPE,75,45.1']
port = fileparse.parse_csv(lines, types=[str,int,float])
print(port)

[{'name': 'AA', 'shares': 100, 'price': 34.23}, {'name': 'IBM', 'shares': 50, 'price': 91.1}, {'name': 'HPE', 'shares': 75, 'price': 45.1}]


In [None]:
port = fileparse.parse_csv('Data/portfolio.csv', types=[str,int,float])
port

lines

#### **练习 3.18：修复（fix）现有函数**
请修复 report.py 文件中的 read_portfolio() 和 read_prices() 函数。以便它们可以使用修改后的 parse_csv() 函数。这应该只涉及较小的修改。之后，report.py 和 pcost.py 程序应能够像以往一样工作。