# Python函数 文件 OS模块
## 1.函数关键字
Python中函数涉及的关键字有
- 定义函数关键字`def`
- 函数返回值关键字`return`

## 2.函数的定义
在Python中，定义一个函数要使用`def`语句，依次写出函数名、括号、括号中的参数和冒号`:`，然后，在缩进块中编写函数体，函数的返回值用`return`语句返回。


In [2]:
# 定义一个无参数变量无返回值的函数
def greet_user():
    """显示简单的问候语"""
    print("Hello!")
# 调用该函数
greet_user()

# 定义一个有参数变量有返回值的函数
def get_formatted_name(first_name, last_name):
    """返回整洁的姓名"""
    full_name = first_name + ' ' + last_name
    return full_name.title()
# 调用该函数
musician = get_formatted_name('jimi', 'hendrix')
print(musician)

Hello!
Jimi Hendrix


## 3.函数参数与作用域
### 参数传递
python函数的参数传递：
- 不可变类型：类似`c++`的值传递，如整数、字符串、元组。如`fun(a)`，传递的只是`a`的值，没有影响`a`对象本身。比如在`fun(a)`内部修改`a`的值，只是修改另一个复制的对象，不会影响`a`本身。
- 可变类型：类似`c++`的引用传递，如列表，字典。如`fun(la)`，则是将`la`真正的传过去，修改后`fun`外部的`la`也会受影响。

python中一切都是对象，严格意义我们不能说值传递还是引用传递，我们应该说传不可变对象和传可变对象。
### 函数参数
以下是调用函数时可使用的正式参数类型：
- 必需参数
- 关键字参数
- 默认参数
- 不定长参数

#### 必需参数
必需参数（位置参数）须以正确的顺序传入函数。调用时的数量必须和声明时的一样。

In [3]:
# 定义一个函数
def describe_pet(animal_type, pet_name):
    """显示宠物的信息"""
    print("\nI have a " + animal_type + ".")
    print("My " + animal_type + "'s name is " + pet_name.title() + ".")
# 位置实参调用函数，实参顺序与数量与形参一致
describe_pet('hamster', 'harry')
describe_pet('dog', 'willie')


I have a hamster.
My hamster's name is Harry.

I have a dog.
My dog's name is Willie.


#### 关键字参数
使用关键字参数允许函数调用时参数的顺序与声明时不一致，因为Python解释器能够用参数名匹配参数值。

In [4]:
# 重写上述函数
def describe_pet(animal_type, pet_name):
    """显示宠物的信息"""
    print("\nI have a " + animal_type + ".")
    print("My " + animal_type + "'s name is " + pet_name.title() + ".")
# 关键字实参调用函数，改变实参顺序
describe_pet(pet_name='harry', animal_type='hamster')


I have a hamster.
My hamster's name is Harry.


#### 默认参数
调用函数时，如果没有传递参数，则会使用默认参数。

In [5]:
# 使用默认参数定义上述函数
def describe_pet(pet_name, animal_type = 'dog'):
    """显示宠物的信息"""
    print("\nI have a " + animal_type + ".")
    print("My " + animal_type + "'s name is " + pet_name.title() + ".")
# 使用默认参数调用函数
describe_pet('willie')
# 不使用默认参数
describe_pet(pet_name='harry', animal_type='hamster')


I have a dog.
My dog's name is Willie.

I have a hamster.
My hamster's name is Harry.


#### 不定长参数
若需要函数处理比当初声明时更多的参数，则需要使用不定长参数。和上述2种参数不同，声明时不会命名。基本语法如下：

    def functionname([formal_args,] *var_args_tuple ):
       "函数_文档字符串"
       function_suite
       return [expression]
加了星号`*`的参数会以元组（`tuple`）的形式导入，存放所有未命名的变量参数。

还有一种就是参数带两个星号`**`基本语法如下：

    def functionname([formal_args,] **var_args_dict ):
       "函数_文档字符串"
       function_suite
       return [expression]
加了两个星号`**`的参数会以字典的形式导入。

In [6]:
# 定义包含不定长参数的函数，以元组形式导入
def printinfo( arg1, *vartuple ):
    """打印任何传入的参数"""
    print ("输出: ")
    print (arg1)
    print (vartuple)
# 调用printinfo 函数
printinfo(70, 60, 50)

# 重新定义包含不定长参数的函数，以字典形式导入
def printinfo( arg1, **vardict ):
    """打印任何传入的参数"""
    print ("输出: ")
    print (arg1)
    print (vardict)
# 调用printinfo 函数
printinfo(1, a=2, b=3)

输出: 
70
(60, 50)
输出: 
1
{'a': 2, 'b': 3}


### 变量作用域
Python中，程序的变量并不是在哪个位置都可以访问的，访问权限决定于这个变量是在哪里赋值的。

变量的作用域决定了在哪一部分程序可以访问哪个特定的变量名称。Python的作用域一共有4种，分别是：
- L （Local） 局部作用域
- E （Enclosing） 闭包函数外的函数中
- G （Global） 全局作用域
- B （Built-in） 内置作用域（内置函数所在模块的范围）

以 `L –> E –> G –>B` 的规则查找，即：在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找，再者去内置中找。

    g_count = 0  # 全局作用域
    def outer():
        o_count = 1  # 闭包函数外的函数中
        def inner():
            i_count = 2  # 局部作用域
内置作用域是通过一个名为`builtin`的标准模块来实现的，但是这个变量名自身并没有放入内置作用域内，所以必须导入这个文件才能够使用它。

在Python3.0中，可以使用以下的代码来查看到底预定义了哪些变量：

In [7]:
import builtins
dir(builtins)

['ArithmeticError',
 'AssertionError',
 'AttributeError',
 'BaseException',
 'BlockingIOError',
 'BrokenPipeError',
 'BufferError',
 'ChildProcessError',
 'ConnectionAbortedError',
 'ConnectionError',
 'ConnectionRefusedError',
 'ConnectionResetError',
 'EOFError',
 'Ellipsis',
 'EnvironmentError',
 'Exception',
 'False',
 'FileExistsError',
 'FileNotFoundError',
 'FloatingPointError',
 'GeneratorExit',
 'IOError',
 'ImportError',
 'IndentationError',
 'IndexError',
 'InterruptedError',
 'IsADirectoryError',
 'KeyError',
 'KeyboardInterrupt',
 'LookupError',
 'MemoryError',
 'ModuleNotFoundError',
 'NameError',
 'None',
 'NotADirectoryError',
 'NotImplemented',
 'NotImplementedError',
 'OSError',
 'OverflowError',
 'PermissionError',
 'ProcessLookupError',
 'RecursionError',
 'ReferenceError',
 'RuntimeError',
 'StopAsyncIteration',
 'StopIteration',
 'SyntaxError',
 'SystemError',
 'SystemExit',
 'TabError',
 'TimeoutError',
 'True',
 'TypeError',
 'UnboundLocalError',
 'UnicodeDecode

Python中只有模块（`module`），类（`class`）以及函数（`def`、`lambda`）才会引入新的作用域，其它的代码块（如`if/elif/else/`、`try/except`、`for/while`等）是不会引入新的作用域的，也就是说这些语句内定义的变量，外部也可以访问。
#### 局部变量与全局变量
定义在函数内部的变量拥有一个局部作用域，定义在函数外的拥有全局作用域。

局部变量只能在其被声明的函数内部访问，而全局变量可以在整个程序范围内访问。调用函数时，所有在函数内声明的变量名称都将被加入到作用域中。

In [9]:
# 定义一个全局变量total
total = 0
# 定义sum()函数
def sum( arg1, arg2 ):
    """返回2个参数的和"""
    # total在这里是局部变量
    total = arg1 + arg2 
    print ("函数内是局部变量: ", total)
    return total
 
#调用sum()函数
sum( 10, 20 )
print ("函数外是全局变量: ", total)

函数内是局部变量:  30
函数外是全局变量:  0


#### `global`和`nonlocal`关键字
当内部作用域想修改外部作用域的变量时，就要用到`global`和`nonlocal`关键字了。

In [10]:
num = 1
def fun1():
    # 修改全局变量
    global num  # 需要使用 global 关键字声明
    print(num) 
    num = 123
    print(num)
fun1()
print(num)

1
123
123


如果要修改嵌套作用域（`enclosing`作用域，外层非全局作用域）中的变量则需要`nonlocal`关键字了。

In [11]:
def outer():
    num = 10
    def inner():
        # 修改嵌套作用域
        nonlocal num   # nonlocal关键字声明
        num = 100
        print(num)
    inner()
    print(num)
outer()

100
100


## 4.函数返回值
函数并非总是直接显示输出，相反，它可以处理一些数据，并返回一个或一组值。函数返回的值被称为返回值。

在函数中，可使用`return`语句将值返回到调用函数的代码行。

函数可返回任何类型的值，包括列表和字典等较复杂的数据结构。

In [12]:
# 定义 get_formatted_name 函数，实参为可选的
def get_formatted_name(first_name, last_name, middle_name=''):
    """返回整洁的姓名"""
    if middle_name:
        full_name = first_name + ' ' + middle_name + ' ' + last_name
    else:
        full_name = first_name + ' ' + last_name
    return full_name.title()
# 调用函数
musician = get_formatted_name('jimi', 'hendrix')
print(musician)
musician = get_formatted_name('john', 'hooker', 'lee')
print(musician)

# 定义 build_person 函数，返回值为字典
def build_person(first_name, last_name, age=''):
    """返回一个字典，其中包含有关一个人的信息"""
    person = {'first': first_name, 'last': last_name}
    if age:
        person['age'] = age
    return person

musician = build_person('jimi', 'hendrix', age=27)
print(musician)

Jimi Hendrix
John Lee Hooker
{'first': 'jimi', 'last': 'hendrix', 'age': 27}


## 5.file
### 打开文件方式
#### 读方式
Python`open()`方法用于打开一个文件，并返回文件对象，在对文件进行处理过程都需要使用到这个函数，如果该文件无法被打开，会抛出`OSError`。

注意：使用`open()`方法一定要保证关闭文件对象，即调用`close()`方法。

`open()`函数常用形式是接收两个参数：文件名(file)和模式(mode)。

    open(file, mode='r')
完整的语法格式为：

    open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
- `file`: 必需，文件路径（相对或者绝对路径）。
- `mode`: 可选，文件打开模式
- `buffering`: 设置缓冲
- `encoding`: 一般使用utf8
- `errors`: 报错级别
- `newline`: 区分换行符
- `closefd`: 传入的file参数类型

`mode`参数有：
- `t`	文本模式 (默认)。
- `x`	写模式，新建一个文件，如果该文件已存在则会报错。
- `b`	二进制模式。
- `+`	打开一个文件进行更新(可读可写)。
- `U`	通用换行模式（不推荐）。
- `r`	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
- `rb`	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
- `r+`	打开一个文件用于读写。文件指针将会放在文件的开头。
- `rb+`	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
- `w`	打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
- `wb`	以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
- `w+`	打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
- `wb+`	以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
- `a`	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
- `ab`	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
- `a+`	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
- `ab+`	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

默认为文本模式，如果要以二进制模式打开，加上`b`。

使用方法`read()`读取文件的全部内容。

In [7]:
# 使用相对路径打开文件
with open('test.txt') as file_object:
    contents = file_object.read()
    print(contents.rstrip())

# 使用绝对路径打开文件
f = open(r'C:\Users\l\Python_tasks/test.txt')
print(f.read())  #f.read() 读文件全部内容
f.close() 

Hello, Python world!
Nice to meet you!
Now, I already have a basic impression of you.
Looking forward to getting to know you better!
Hello, Python world!
Nice to meet you!
Now, I already have a basic impression of you.
Looking forward to getting to know you better!


#### 写方式
要将文本写入文件，在调用`open()`时需要提供另一个实参，告诉Python你要写入打开的文件。

打开文件时，可指定读取模式 （`r`）、写入模式 （`w`）、附加模式 （`a`）或让你能够读取和写入文件的模式（`r+`）。如果你省略了模式实参，Python将以默认的只读模式打开文件。

使用文件对象的方法`write()`将一个字符串写入文件。

如果要给文件添加内容，而不是覆盖原有的内容，可以附加模式（`a`）打开文件。以附加模式打开文件时，Python不会在返回文件对象前清空文件，而写入到文件的行都将添加到文件末尾。如果指定的文件不存在，Python将为你创建一个空文件。

In [8]:
# 写入空文件
filename = 'new_test.txt'
with open(filename, 'w') as file_object:
    file_object.write("I love programming.\n")
    file_object.write("I love creating new games.\n")
    
# 附加到文件
with open(filename, 'a') as file_object:
    file_object.write("I also love finding meaning in large datasets.\n")
    file_object.write("I love creating apps that can run in a browser.\n")

### 文件对象的操作方法
文件对象常用方法有：
- `file.close()` 关闭文件
- `file.flush()` 刷新文件内部缓冲，直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
- `file.fileno()` 返回一个整型的文件描述符(`file descriptor FD`整型), 可以用在如`os`模块的`read`方法等一些底层操作上。
- `file.isatty()` 如果文件连接到一个终端设备返回`True`，否则返回`False`。
- `file.read([size])`从文件读取指定的字节数，如果未给定或为负则读取所有。
- `file.readline([size])`读取整行，包括`"\n"`字符。
- `file.readlines([sizeint])` 读取所有行并返回列表，若给定`sizeint > 0`，返回总和大约为`sizeint`字节的行, 实际读取值可能比`sizeint`较大, 因为需要填充缓冲区。
- `file.seek(offset[, whence])` 设置文件当前位置
- `file.tell()` 返回文件当前位置
- `file.truncate([size])` 从文件的首行首字符开始截断，截断文件为`size`个字符，无`size`表示从当前位置截断；截断之后后面的所有字符被删除，其中 Widnows 系统下的换行代表2个字符大小。
- `file.write(str)` 将字符串写入文件，返回的是写入的字符长度。
- `file.writelines(sequence)` 向文件写入一个序列字符串列表，如果需要换行则要自己加入每行的换行符。

### 对excel及csv文件进行操作

In [11]:
import xlrd, xlwt   #xlwt只能写入xls文件

#读取xlsx文件内容
rows = []   #create an empty list to store rows
book = xlrd.open_workbook('./test.xlsx')  #open the Excel spreadsheet as workbook
sheet = book.sheet_by_index(0)    #get the first sheet
for user in range(0, sheet.nrows):  #iterate 1 to maxrows
    rows.append(list(sheet.row_values(user, 0, sheet.ncols)))  #iterate through the sheet and get data from rows in list
print(rows)

#写入xls文件
rows1 = [['Name', 'Num'],['L', '40'],['M', '50']]
book1 = xlwt.Workbook()   #create new book1 excel
sheet1 = book1.add_sheet('user')   #create new sheet
for i in range(0, 3):    
    for j in range(0, len(rows1[i])):
        sheet1.write(i, j, rows1[i][j])
book1.save('./newdata.xlsx')   #sava as testdata1.xls

[[11.0, 12.0, 13.0], [21.0, 22.0, 23.0], [31.0, 32.0, 33.0]]


In [15]:
#读csv文件：先import csv，使用csv.reader()
import csv
with open('./test.csv') as csv_file:
    reader = csv.reader(csv_file)
    for user in reader:
        print(user)

#写csv文件
dict = {'L': '40','M': '50'}
csv_file = open('./test.csv', 'w', newline='')
writer = csv.writer(csv_file)
for key in dict:
    writer.writerow([key, dict[key]])
csv_file.close()   #close CSV file

csv_file1 = csv.reader(open('./test.csv','r'))
for user in csv_file1:
    print(user)

['11', '12', '13']
['21', '22', '23']
['31', '32', '33']
['L', '40']
['M', '50']


## 6.os模块

`os`模块提供了非常丰富的方法用来处理文件和目录:
- `os.sep`: 取代操作系统特定的路径分隔符
- `os.name`: 指示你正在使用的工作平台。比如对于Windows，它是'nt'，而对于Linux/Unix用户，它是'posix'。
- `os.getcwd`: 得到当前工作目录，即当前python脚本工作的目录路径。
- `os.getenv()`和`os.putenv`: 分别用来读取和设置环境变量
- `os.listdir()`: 返回指定目录下的所有文件和目录名
- `os.remove(file)`: 删除一个文件
- `os.stat(file)`: 获得文件属性
- `os.chmod(file)`: 修改文件权限和时间戳
- `os.mkdir(name)`: 创建目录
- `os.rmdir(name)`: 删除目录
- `os.removedirs(r"c：\python")`: 删除多个目录
- `os.system()`: 运行shell命令
- `os.exit()`: 终止当前进程
- `os.linesep`: 给出当前平台的行终止符。例如，Windows使用'\r\n'，Linux使用'\n'而Mac使用'\r'
- `os.path.split()`: 返回一个路径的目录名和文件名
- `os.path.isfile()`和`os.path.isdir()`: 分别检验给出的路径是一个目录还是文件
- `os.path.existe()`: 检验给出的路径是否真的存在
- `os.listdir(dirname)`: 列出`dirname`下的目录和文件
- `os.getcwd()`: 获得当前工作目录
- `os.curdir`:  返回当前目录（'.'）
- `os.chdir(dirname)`: 改变工作目录到`dirname`
- `os.path.isdir(name)`: 判断`name`是不是目录，不是目录就返回`false`
- `os.path.isfile(name)`: 判断`name`这个文件是否存在，不存在返回`false`
- `os.path.exists(name)`: 判断是否存在文件或目录`name`
- `os.path.getsize(name)`: 获得文件大小，如果`name`是目录返回`0L`
- `os.path.abspath(name)`: 获得绝对路径
- `os.path.isabs()`: 判断是否为绝对路径
- `os.path.normpath(path)`: 规范`path`字符串形式
- `os.path.split(name)`: 分割文件名与目录（事实上，如果你完全使用目录，它也会将最后一个目录作为文件名而分离，同时它不会判断文件或目录是否存在）
- `os.path.splitext()`: 分离文件名和扩展名
- `os.path.join(path,name)`: 连接目录与文件名或目录
- `os.path.basename(path)`: 返回文件名
- `os.path.dirname(path)`: 返回文件路径