# 斜杆

在 Windows 上，路径书写使用倒斜杠 `\` 作为文件夹之间的分隔符，但在 OS X 和 Linux 上，使用正斜杠 `/` 作为它们的路径分隔符。

使用 os.path.join() 函数可以自动根据所在系统生成合适的文件路径。

In [1]:
import os
os.path.join('usr','bin','spam')

'usr/bin/spam'

In [2]:
myFiles = ['accounts.txt', 'details.csv', 'invite.docx']
for filename in myFiles:
    print(os.path.join('usr','bin','spam',filename))

usr/bin/spam/accounts.txt
usr/bin/spam/details.csv
usr/bin/spam/invite.docx


os.path.sep 返回当前系统中正确的文件夹分割斜杠

In [31]:
os.path.sep

'/'

# 当前工作目录

* 利用 os.getcwd()函数， 可以取得当前工作路径的字符串。
* 利用 os.chdir()函数， 可以取改变前工作路径的字符串。但如果目标的工作目录不存在，则会显示错误。

In [8]:
spam = os.getcwd()
spam

'/Users/liangzhuobin/Github/Python-Sweigart2016'

In [9]:
os.chdir('/Users/liangzhuobin/Github')
os.getcwd()

'/Users/liangzhuobin/Github'

In [11]:
os.chdir(spam)
os.getcwd() == spam

True

# 绝对路径和相对路径

单个的句点 `.` 用作文件夹目名称时，是“这个目录”的缩写，两个句点 `..` 意思是父文件夹。

# 用 os.makedirs() 创建文件夹

当中间文件不存在时， os.makedirs() 将创建中间文件夹，确保完整路径名存在。

In [12]:
os.makedirs('./test/chapter08')

# os.path 模块

os.path 是 os 模块中的模块，包含了许多与文件名和文件路径相关的有用函数。例如，前面的 os.path.join() 就是这个模块中的函数。

## 处理绝对路径和相对路径

* os.path.abspath(path)将返回参数的绝对路径的字符串。这是将相对路径转换为绝对路径的简便方法。

* os.path.isabs(path)，如果参数是一个绝对路径，就返回 True，如果参数是一个相对路径，就返回 False。

* os.path.relpath(path, start)将返回从 start 路径到 path 的相对路径的字符串。 如果没有提供 start，就使用当前工作目录作为开始路径。

In [24]:
os.getcwd()

'/Users/liangzhuobin/Github/Python-Sweigart2016'

In [23]:
os.path.abspath('../../ham')

'/Users/liangzhuobin/ham'

In [21]:
os.path.relpath('/Users/spam/eggs', '/Users/spam/ham/abc')

'../../eggs'

* os.path.dirname(path)将返回一个字符串，它包含 path 参数中最后一个斜杠之前的所有内容。
* os.path.basename(path)将返回一个字符串，它包含 path 参数中最后一个斜杠之后的所有内容。
* os.path.split()，获得上述两个字符串组成的元组。

In [32]:
testPath = '/User/spam/eggs/test.txt'
os.path.dirname(testPath)

'/User/spam/eggs'

In [33]:
os.path.basename(testPath)

'test.txt'

In [34]:
os.path.split(testPath)

('/User/spam/eggs', 'test.txt')

在一个文件路径中的各个文件夹的字符串提取成一个列表：使用 split()字符串方法，并根据 os.path.sep 中的字符串进行分割。在 OS X 和 Linux 系统上，返回的列表头上有一个空字符串。

In [35]:
testPath.split(os.path.sep)

['', 'User', 'spam', 'eggs', 'test.txt']

## 查看文件大小和文件夹内容

* os.path.getsize(path)将返回 path 参数中文件的字节数。
* os.listdir(path)将返回文件名字符串的列表，包含 path 参数中的每个文件。

In [36]:
os.path.getsize(os.getcwd())

416

In [37]:
os.listdir(os.getcwd())

['Chapter04-列表.ipynb',
 'Chapter07-模式匹配与正则表达式.ipynb',
 'test',
 'Chapter01-Python基础.ipynb',
 'Chapter03-函数.ipynb',
 'Chapter02-控制流.ipynb',
 '.ipynb_checkpoints',
 'Chapter06-字符串操作.ipynb',
 '.git',
 'Chapter05-字典和结构化数据.ipynb',
 'Chapter08-读写文件.ipynb']

In [42]:
# 计算当前文件夹中所有文件的总大小。

totalSize = 0
for filename in os.listdir(os.getcwd()):
    totalSize += os.path.getsize(os.path.join(os.getcwd(), filename))
    
print(totalSize)

122865


# 检查路径有效性

* os.path.exists(path)：如果 path 参数所指的文件或文件夹存在，返回 True， 否则返回 False。
* os.path.isfile(path)：如果 path 参数存在，并且是一个文件，返回 True，否则返回 False。
* os.path.isdir(path)：如果 path 参数存在，并且是一个文件夹，返回 True， 否则返回 False。

In [44]:
os.path.exists(os.path.join(os.getcwd(),'test'))

True

In [45]:
os.path.isfile(os.path.join(os.getcwd(),'test'))

False

In [46]:
os.path.isdir(os.path.join(os.getcwd(),'test'))

True

In [47]:
os.path.isfile(os.path.join(os.getcwd(),'Chapter01-Python基础.ipynb'))

True

## 文件读写过程

先介绍**纯文本文件**的读写过程，有3个步骤：
1. 调用 open()函数，返回一个 File 对象。 
2. 调用 File 对象的 read()或 write()方法。
3. 调用 File 对象的 close()方法，关闭该文件。

In [49]:
testDir = os.path.join(os.getcwd(),'test','chapter08')
testDir

'/Users/liangzhuobin/Github/Python-Sweigart2016/test/chapter08'

In [50]:
helloFile = open(os.path.join(testDir,'hello.txt'))

In [51]:
helloContent = helloFile.read()
helloContent

'Hello World!'

readlines()方法，从该文件取得一个字符串的列表。列表中的每个字符串就是文本中的每一行。

In [52]:
sonnetFile = open(os.path.join(testDir,'sonnet29.txt'))
sonnetFile.readlines()

["When, in disgrace with fortune and men's eyes,\n",
 'I all alone beweep my outcast state,\n',
 'And trouble deaf heaven with my bootless cries,\n',
 'And look upon myself and curse my fate,']

# 写入文件

* 将'w'作为第二个参数传递给 open()，以写模式打开该文件。写模式将覆写原有的文件。
* 将'a'作为第二个参数传递给 open()，以添加模式打开该文件。添加模式将在已有文件的末尾添加文本。

如果传递给 open()的文件名不存在，写模式和添加模式都会创建一个新的空文件。在读取或写入文件后，调用 close()方法，然后才能再次打开该文件。

In [54]:
baconFile = open(os.path.join(testDir,'bacon.txt'), 'w')
baconFile.write('Hello world!\n')

13

In [55]:
baconFile.close()
baconFile = open(os.path.join(testDir,'bacon.txt'), 'a')
baconFile.write('Bacon is not a vegetable.')

25

In [57]:
baconFile.close()
baconFile = open(os.path.join(testDir,'bacon.txt'))
content = baconFile.read()
baconFile.close()
print(content)

Hello world!
Bacon is not a vegetable.


# 用 shelve 模块保存变量

利用 shelve 模块，你可以将 Python 程序中的变量保存到二进制的 shelf 文件中。 例如，如果运行一个程序，并输入了一些配置设置，就可以将这 些设置保存到一个 shelf 文件，然后让程序下一次运行时加载它们。

In [58]:
import shelve

In [59]:
shelfFile = shelve.open(os.path.join(testDir, 'mydata')) # 文件 'mydata' 不存在，则自动新建
cats = ['Zophie', 'Pooka', 'Simon']
shelfFile['cats'] = cats                                 # 将列表保存在 shelfFile 中， 作为键'cats'关联的值（就像在字典中一样）
shelfFile.close()

testDir 路径下新建了一个二进制 mydata.db 文件（如果是 Window 系统，则是 mydata.bak、mydata.dat 和 mydata.dir 三个文件）。

你的程序稍后可以使用 shelve 模块，重新打开这些文件并取出数据。shelf 值不必用读模式或写模式打开，因为它们在打开后，既能读又能写。

In [63]:
shelfFile = shelve.open(os.path.join(testDir, 'mydata'))
type(shelfFile)

shelve.DbfilenameShelf

In [64]:
shelfFile['cats']

['Zophie', 'Pooka', 'Simon']

就像字典一样，shelf 值有 keys()和 values()方法，返回 shelf 中键和值的类似列表的值。因为不是真正的列表，所以应该将它们传递给 list()函数，才能得列表的形式。

In [65]:
list(shelfFile.keys())

['cats']

In [66]:
list(shelfFile.values())

[['Zophie', 'Pooka', 'Simon']]

In [67]:
shelfFile.close()

# 用 pprint.pformat() 函数保存变量

pprint.pformat()函数将返回文本字符串，但不打印它。 这个字符串不仅是易于阅读的格式，同时也是语法上正确的 Python 代码。可以将它写入.py 文件。该文件将成为你自己的模块，如果你需要使用存储在其中的变量，就可以导入它。

In [72]:
import pprint
cats =[{'name':'Zophie', 'desc':'chubby'}, {'name':'Pooka', 'desc':'fluffy'}]
pprint.pformat(cats)

"[{'desc': 'chubby', 'name': 'Zophie'}, {'desc': 'fluffy', 'name': 'Pooka'}]"

In [81]:
fileObj = open('myCats.py', 'w')
fileObj.write('cats = ' + pprint.pformat(cats) + '\n')

83

In [82]:
fileObj.close()

import 语句导入的模块本身就是 Python 脚本。如果来自 pprint.pformat() 的字符串保存为一个.py 文件，该文件就是一个可以导入的模块，像其他模块一样。

由于 Python 脚本本身也是带有.py 文件扩展名的文本文件，所以你的 Python 程序甚至可以生成其他 Python 程序。然后可以将这些文件导入到脚本中。

In [86]:
import myCats     # 保证 myCats.py 在 os.getcwd() 路径下，否则出差。

In [87]:
myCats.cats

[{'desc': 'chubby', 'name': 'Zophie'}, {'desc': 'fluffy', 'name': 'Pooka'}]

In [88]:
myCats.cats[0]

{'desc': 'chubby', 'name': 'Zophie'}

In [89]:
myCats.cats[0]['name']

'Zophie'