# File Operations

## 1. 文件与文件路径

文件有两个关键属性：
- 文件名: 包含文件扩展名，表明文件类型
- 路径: 文件的位置

In [1]:
import os

### 1.1 当前工作目录

In [11]:
os.getcwd()  # get current working directory

'/Users/chenwang/Workspace/github/python_tutorials/python_basic'

### 1.2 修改工作目录

In [7]:
os.chdir('/Users/chenwang/Workspace/github/python_tutorials/')  # 修改当前工作目录

In [9]:
os.getcwd()  # 查看修改结果

'/Users/chenwang/Workspace/github/python_tutorials'

In [12]:
os.chdir('/Users/chenwang/Workspace/github/python_tutorials/python_basic')  # 改回来

### 1.3 绝对路径和相对路径

- 绝对路径：相对于根目录
- 相对路径：相对于当前工作目录

`os.path` 模块提供了一些函数，返回一个相对路径的绝对路径，以及检查给定的路径是否为绝对路径。

In [14]:
os.path.abspath('.')  # 返回当前目录的绝对路径

'/Users/chenwang/Workspace/github/python_tutorials/python_basic'

In [15]:
os.path.isabs('.')  # 是否为绝对路径，否

False

In [16]:
os.path.isabs(os.path.abspath('.'))  # 是否为绝对路径，是

True

`relpath(path, start)`: 返回从start 路径到path 的相对路径的字符串。如果start 缺省，则以当前目录为start。

In [17]:
os.path.relpath('/Users/chenwang/Workspace/github/python_tutorials/python_basic/new_dir/test', '/Users')

'chenwang/Workspace/github/python_tutorials/python_basic/new_dir/test'

In [21]:
os.path.relpath('/Users', '/Users/chenwang/Workspace/github/python_tutorials/python_basic/new_dir/test')  # 可以反过来


'../../../../../../..'

In [19]:
os.path.relpath('/Users/chenwang/Workspace/github/python_tutorials/python_basic/new_dir/test')  # 默认从当前目录开始

'new_dir/test'

### 1.4 `os.makedirs()` 创建新文件夹

In [None]:
# os.makedirs('/Users/chenwang/Workspace/github/python_tutorials/python_basic/new_dir/test')

执行上述代码，可以在当前目录下创建一个子文件夹`new_dir`, 然后再在`new_dir` 中创建`test` 文件夹。

### 1.5 `join()`

In [22]:
os.path.join('Users', 'chenwang', 'Workspace')

'Users/chenwang/Workspace'

In [23]:
my_file = os.path.join(os.getcwd(), 'File.ipynb')
my_file

'/Users/chenwang/Workspace/github/python_tutorials/python_basic/File.ipynb'

### 1.6 `basename(path)` 和`dirname(path)`

In [24]:
os.path.dirname(my_file)  # 最后一个斜杠之前的所有内容

'/Users/chenwang/Workspace/github/python_tutorials/python_basic'

In [26]:
os.path.basename(my_file)  # 最后一个斜杠之后的所有内容

'File.ipynb'

如果同时需要路径名和文件名，可以使用`split()`, 返回一个tuple，第一个值是路径，第二个值是文件名。

In [27]:
os.path.split(my_file)

('/Users/chenwang/Workspace/github/python_tutorials/python_basic',
 'File.ipynb')

如果要获取路径每个文件夹的名字，可以通过文件夹分隔符来split string。

In [30]:
os.path.sep  # 查看系统的文件夹分隔符

'/'

In [31]:
my_file.split(os.path.sep)

['',
 'Users',
 'chenwang',
 'Workspace',
 'github',
 'python_tutorials',
 'python_basic',
 'File.ipynb']

### 1.7 查看文件大小和文件夹内容

In [33]:
os.path.getsize(os.getcwd())  # 获取特定（当前）文件夹的大小（字节）

224

注意这里可能只是文件夹的大小，并没有包含文件夹中的文件，如果想知道文件夹的大小，需要遍历文件夹中的所有文件。

In [38]:
os.listdir(os.getcwd())  # 显示特定（当前）文件夹内容

['File.ipynb',
 'regex.ipynb',
 'dictionary.ipynb',
 '.ipynb_checkpoints',
 'Strings.ipynb']

In [39]:
total_size = 0

for filename in os.listdir(os.getcwd()):
    total_size += os.path.getsize(os.path.join(os.getcwd(), filename))

print(total_size)

90596


### 1.8 检查路径的有效性

如果路径不存在，Python 程序会报错。
- `os.path.exists(path)`: 是否存在
- `os.path.isfile(path)`: 是否是一个文件
- `os.path.isdir(path)`: 是否是一个文件夹

In [40]:
os.path.exists('/Users/chenwang')

True

In [41]:
os.path.exists('/Users/Michael')

False

In [42]:
os.path.isfile('/Users/chenwang')

False

In [43]:
os.path.isfile('/Users/chenwang/Workspace/github/python_tutorials/python_basic/File.ipynb')

True

In [44]:
os.path.isdir('/Users/chenwang')

True

In [45]:
os.path.isdir('/Users/chenwang/Workspace/github/python_tutorials/python_basic/File.ipynb')

False

In [46]:
os.path.isdir('/Users/Michael')

False

## 2. 文件读写

- 调用`open()` 打开文件， 返回一个File 对象；
- 调用File 对象的`read()` 或`write()` 方法；
- 调用File 对象的`close()` 方法，关闭该文件；

### 2.1 打开文件

In [56]:
file = open('data/people.txt')  # 默认读模式 r, 等同于下面这行日志
# file = open('data/people.txt', 'r')

open 方法返回一个File 对象，接下来我们可以调用File 对象中的方法来对文件进行读写操作。

### 2.2 读取文件内容

#### `read()` 方法：将整个文件读取成一个字符串

In [53]:
text_str = file.read()
print(text_str)

Michael, 29
Andy, 30
Justin, 19



In [54]:
text_str = file.read()  # 再次执行，就读不出来了，因为指针已经到文件底端了
print(text_str)




#### `readlines()` 方法，返回一个字符串列表，每一行是列表中的一个元素

In [57]:
file = open('data/people.txt')  # 指针回位
text_lines = file.readlines()
print(text_lines)

['Michael, 29\n', 'Andy, 30\n', 'Justin, 19\n']


注意，每一个元素最后，都有一个`\n`。

### 2.3 写入文件

Open file 的第二个参数可以设置成w 或者 a

- w: write
- a: append

注意，写文件不会自动添加换行符(例如print)，如果需要，必须手动添加。

In [58]:
file = open('data/test.txt', 'w')

file.write('hello world!\n')
file.close()

In [59]:
file = open('data/test.txt', 'a')

file.write('hello world again!\n')
file.close()

In [60]:
file = open('data/test.txt', 'r')
content = file.read()
file.close()

print(content)

hello world!
hello world again!



## 3. 文件夹操作

## 3. 使用shelve 模块保存变量

可以把程序中的变量保存到二进制的shelf 文件中，这样程序可以从硬盘恢复变量。

In [61]:
text_lines

['Michael, 29\n', 'Andy, 30\n', 'Justin, 19\n']

In [62]:
import shelve

shelf_file = shelve.open('data/shelf_data')
shelf_file['people'] = text_lines
shelf_file.close()

执行完，我们在data 目录下，会生成一个shelf_data.db 的文件。

shelf 就像一个字典。

In [66]:
shelf_file = shelve.open('data/shelf_data')
type(shelf_file)

shelve.DbfilenameShelf

In [64]:
shelf_file['people']

['Michael, 29\n', 'Andy, 30\n', 'Justin, 19\n']

和字典一样，shelf 有`keys()` 和`values()` 两个方法。

In [67]:
shelf_file.keys()

KeysView(<shelve.DbfilenameShelf object at 0x10c702b00>)

In [68]:
list(shelf_file.keys())  # 转换成list

['people']

In [69]:
list(shelf_file.values())  # 转换成list

[['Michael, 29\n', 'Andy, 30\n', 'Justin, 19\n']]

In [70]:
shelf_file.close()

## 4. Exercises

### 4.1 E1: 生成随机的测验试卷文件

### 4.2 E2: 多重剪切板