# 第4章 介绍Python对象类型

## 为什么使用内置类型

除非你有内置类型无法提供的特殊对象要处理，最好总是使用内置对象而不是使用自己的实现。原因如下：
- 内置对象使程序更容易编写：简单的任务，内置类型足矣
- 内置对象是扩展的组件：复杂的任务，人工实现的对象往往建立在内置类型基础之上
- 内置对象往往比定制的数据结构更有效率
- 内置对象是语言标准的一部分

## 数字

- 双星号代表乘方

In [1]:
2**100 # 2的100次方

1267650600228229401496703205376L

## 字符串

- 负的索引号等同于与字符串长度相加后的正索引

In [2]:
S = 'Spam'
print S[-2]
print S[len(S) - 2]

a
a


- 对字符串采用分片操作，会返回一个新的对象，这有利于我们拷贝整个字符串

In [3]:
S[:]

'Spam'

- 字符串可使用“+”和“*”

In [4]:
print S + " hello"
print S * 3

Spam hello
SpamSpamSpam


- 字符串具有不可变性——在创建后就不能被改变，但是你总可以通过建立一个新的字符串并以同一个变量名对其进行赋值，Python在运行过程中会清理旧的对象；在Python中，每个对象均分为可变或不可变，核心类型中，数字、字符串和元组不可变，列表和字典可变

In [5]:
S[0] = 'a'

TypeError: 'str' object does not support item assignment

In [6]:
S = S + ' hello'
S

'Spam hello'

- repalce方法：做全局的搜索和替换

In [7]:
test_str = 'This is my brother, and that is my sister'
test_str.replace('is', 'R')

'ThR R my brother, and that R my sRter'

- 可作用于多种类型的通用型操作都是以内置函数或表达式的形式出现的，如 len(X)，但是类型特定的操作是以方法调用的形式出现的，如 aString.upper()

- dir函数可以返回对象的所有属性，help函数可以返回相应的帮助信息

In [8]:
dir(test_str)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__getslice__',
 '__gt__',
 '__hash__',
 '__init__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '_formatter_field_name_split',
 '_formatter_parser',
 'capitalize',
 'center',
 'count',
 'decode',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'index',
 'isalnum',
 'isalpha',
 'isdigit',
 'islower',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',
 'zfill']

In [9]:
help(test_str.upper)

Help on built-in function upper:

upper(...)
    S.upper() -> string
    
    Return a copy of the string S converted to uppercase.



- Python允许在三个引号（单引号或双引号）中包括多行字符串常量，这时，所有的行都合并在一起，并在每一行的行尾加上换行符

In [10]:
test_str = '''
hello
world
!
'''
test_str

'\nhello\nworld\n!\n'

## 列表

- Python的列表对象是最通用的序列，没有固定大小，没有固定类型的约束，可变

- 因为列表是可变的，大多数列表的方法都会就地改变列表对象，而不是创建一个新列表

In [11]:
M = ['bb', 'aa', 'cc']
M.sort()
M

['aa', 'bb', 'cc']

In [12]:
M.reverse()
M

['cc', 'bb', 'aa']

- Python不允许引用不存在的元素，超过列表末尾之外的索引总是会导致错误，对列表末尾之外赋值也是如此

In [13]:
L = [12, 34, 56]
L

[12, 34, 56]

In [14]:
L[4]

IndexError: list index out of range

In [15]:
L[4] = 11

IndexError: list assignment index out of range

- 列表解析源自集合的概念，它是一种通过对序列的每一项运行一个表达式来创建一个新列表的方法；列表解析是编写在方括号中的，提醒你在创建列表这个事实

In [16]:
M = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
[row[1] for row in M if row[1] % 2 == 0]

[2, 8]

- 事实上，解析语法还可以用来创建生成器、集合、字典

In [17]:
G = (sum(row) for row in M)
G

<generator object <genexpr> at 0x10f112af0>

In [18]:
SET = {sum(row) for row in M}
SET

{6, 15, 24}

In [19]:
DICT = {x: ord(x) for x in 'spam'}
DICT

{'a': 97, 'm': 109, 'p': 112, 's': 115}

## 字典

- 字典是Python核心对象集合中的唯一一种映射类型，也具有可变性——可以就地改变，并可以随需求增大或减小

- 通过键索引一个字典往往是Python中编写搜索的最快方法

- Python具有一种叫做垃圾收集的特性，在程序运行时可以清理不再使用的内存，一旦一个对象的最后一次引用被移除，空间将会立即回收

- get方法：带有一个默认值的条件索引

In [20]:
D = {'a': 1, 'c': 3, 'b': 2}
D

{'a': 1, 'b': 2, 'c': 3}

In [21]:
test = D.get('x')
print test

None


In [22]:
test = D.get('x', 0)
print test

0


## 元组

- 元组具有不可变性，编写在圆括号中，支持任意类型、任意嵌套以及常见的序列操作

- 元组提供了一种完整性约束，这对于大型程序来说是方便的

- 在Python中，至少有3种方式可以检查对象类型

In [23]:
L = [1, 2, 3]

In [24]:
if type(L) == type([]):
    print "yes"

yes


In [25]:
if type(L) == list:
    print "yes"

yes


In [26]:
if isinstance(L, list):
    print "yes"

yes
