OrderedDict可以实现一个FIFO（先进先出）的dict，当容量超出限制时，先删除最早添加的Key：

In [141]:
from collections import OrderedDict

class LastUpdatedOrderedDict(OrderedDict):

    def __init__(self, capacity):
        super(LastUpdatedOrderedDict, self).__init__()
        self._capacity = capacity

    def __setitem__(self, key, value):
        containsKey = 1 if key in self else 0
        if len(self) - containsKey >= self._capacity:
            last = self.popitem(last=False)
            print 'remove:', last
        if containsKey:
            del self[key]
            print 'set:', (key, value)
        else:
            print 'add:', (key, value)
        OrderedDict.__setitem__(self, key, value)

**字典 Dictionary**

Python用{key:value}来生成Dictionary。

In [142]:
d = {'dogs':5, 'cats':4}
d

{'cats': 4, 'dogs': 5}

所有的键值对：

In [143]:
d.items()

[('cats', 4), ('dogs', 5)]

**Python 数据类型** 

常用数据类型 Common Data Types

|类型|例子|
|--|--|
|整数|-100|
|浮点数|3.1416|
|字符串|'hello'|
|列表|[1, 1.2, 'hello']|
|字典|{'dogs': 5, 'pigs': 3}|
|Numpy数组|array([1, 2, 3])|

其他类型 Others

|类型|例子|
|--|--|
|长整型|1000000000000L|
|布尔型|True, False|
|元组|('ring', 1000)|
|集合|{1, 2, 3}|
|Pandas类型|DataFrame, Series|
|自定义|Object Oriented Classes|

**整型数字的最大最小值：**

在 32 位系统中，一个整型 4 个字节，最小值 -2,147,483,648，最大值 2,147,483,647。

在 64 位系统中，一个整型 8 个字节，最小值 -9,223,372,036,854,775,808，最大值 9,223,372,036,854,775,807。

In [144]:
import sys
sys.maxint

9223372036854775807

**长整型 Long Integers**

当整型超出范围时，Python会自动将整型转化为长整型，不过长整型计算速度会比整型慢。

长整型可以与整型在一起进行计算，返回的类型还是长整型：

In [145]:
a = sys.maxint + 1
a - 4

9223372036854775804L

**浮点数 Floating Point Numbers**

In [146]:
3.4 - 3.2 

0.19999999999999973

In [147]:
12.3 + 32.4

44.7

In [148]:
2.5 ** 2

6.25

In [149]:
3.4 % 2.1

1.2999999999999998

**Python**的浮点数标准与C，Java一致，都是[IEEE 754 floating point standard](https://en.wikipedia.org/wiki/IEEE_754)。

注意看 3.4 - 3.2 的结果并不是我们预期的0.2，这是因为浮点数本身储存方式引起的，浮点数本身会存在一点误差。

事实上，Python 中储存的值为'0.199999999999999733546474089962430298328399658203125'，因为这是最接近0.2的浮点数。

In [150]:
'{:.52}'.format(3.4 - 3.2)

'0.199999999999999733546474089962430298328399658203125'

当我们使用print显示时，Python会自动校正这个结果

In [151]:
print 3.4 - 3.2

0.2


在Python中运算是有优先级的，优先级即算术的先后顺序，比如“先乘除后加减”和“先算括号里面的”都是两种优先级的规则，优先级从高到低排列如下：

- ( ) 括号
- ** 幂指数运算
- \* / // % 乘，除，整数除法，取余运算
- '+ -' 加减

整数除法，返回的是比结果小的最大整数值：

In [152]:
12.3 // 5.2

2.0

In [153]:
12.3 // -4

-4.0

Python支持链式比较：

In [154]:
x = 2 
1 < x <= 3

True

字符串与数字相乘：

In [155]:
"echo" * 3

'echoechoecho'

字符串长度：

In [156]:
len(s)

5

**分割**

s.split()将s按照空格（包括多个空格，制表符\t，换行符\n等）分割，并返回所有分割得到的字符串。

In [157]:
line = "1 2 3 4  5"
numbers = line.split()
print numbers

['1', '2', '3', '4', '5']


s.split(sep)以给定的sep为分隔符对s进行分割。

In [158]:
line = "1,2,3,4,5"
numbers = line.split(',')
print numbers

['1', '2', '3', '4', '5']


**连接**

与分割相反，s.join(str_sequence)的作用是以s为连接符将字符串序列str_sequence中的元素连接起来，并返回连接后得到的新字符串：

In [159]:
s = ' '
s.join(numbers)

'1 2 3 4 5'

In [160]:
s = ','
s.join(numbers)

'1,2,3,4,5'

**去除多余空格**

s.strip()返回一个将s两端的多余空格除去的新字符串。

s.lstrip()返回一个将s开头的多余空格除去的新字符串。

s.rstrip()返回一个将s结尾的多余空格除去的新字符串。

**多行字符串**

Python 用一对 """ 或者 ''' 来生成多行字符串：

In [161]:
a = """hello world.
it is a nice day."""
print a

hello world.
it is a nice day.


在储存时，我们在两行字符间加上一个换行符 '\n'

In [162]:
a

'hello world.\nit is a nice day.'

**使用 () 或者 \ 来换行**

当代码太长或者为了美观起见时，我们可以使用两种方法来将一行代码转为多行代码：

- ()
- \

In [163]:
a = ("hello, world. "
    "it's a nice day. "
    "my name is xxx")
a

"hello, world. it's a nice day. my name is xxx"

In [164]:
a = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a

"hello, world. it's a nice day. my name is xxx"

**强制转换为字符串**

- str(ob)强制将ob转化成字符串。
- repr(ob)也是强制将ob转化成字符串。

不同点如下：

In [165]:
str(1.1 + 2.2)

'3.3'

In [166]:
repr(1.1 + 2.2)

'3.3000000000000003'

十六进制：

In [167]:
hex(255)

'0xff'

八进制：

In [168]:
oct(255)

'0377'

二进制：

In [169]:
bin(255)

'0b11111111'

**格式化字符串**

Python用字符串的format()方法来格式化字符串。

具体用法如下，字符串中花括号 {} 的部分会被format传入的参数替代，传入的值可以是字符串，也可以是数字或者别的对象。

In [170]:
'{} {} {}'.format('a', 'b', 'c')

'a b c'

可以用数字指定传入参数的相对位置：

In [171]:
'{2} {1} {0}'.format('a', 'b', 'c')

'c b a'

还可以指定传入参数的名称：

In [172]:
'{color} {n} {x}'.format(n=10, x=1.5, color='blue')

'blue 10 1.5'

可以在一起混用：

In [173]:
'{color} {0} {x} {1}'.format(10, 'foo', x = 1.5, color='blue')

'blue 10 1.5 foo'

可以用`{<field name>:<format>}`指定格式：

In [174]:
from math import pi

'{0:10} {1:10d} {2:10.2f}'.format('foo', 5, 2 * pi)

'foo                 5       6.28'

也可以使用旧式的 % 方法进行格式化：

In [175]:
s = "some numbers:"
x = 1.34
y = 2
# 用百分号隔开，括号括起来
t = "%s %f, %d" % (s, x, y)
t

'some numbers: 1.340000, 2'

**分片**

分片用来从序列中提取出想要的子序列，其用法为：

var[lower:upper:step]

其范围包括 lower ，但不包括 upper ，即 [lower, upper)， step 表示取值间隔大小，如果没有默认为1。

In [176]:
s = "hello world"

每隔两个取一个值：

In [177]:
s[::2]

'hlowrd'

当step的值为负时，省略lower意味着从结尾开始分片，省略upper意味着一直分片到开头。

In [178]:
s[::-1]

'dlrow olleh'

**列表**

在Python中，列表是一个有序的序列。

列表用一对 [] 生成，中间的元素用 , 隔开，其中的元素不需要是同一类型，同时列表的长度也不固定。

In [179]:
l = [1, 2.0, 'hello']
print l

[1, 2.0, 'hello']


空列表可以用 [] 或者 list() 生成：

In [180]:
empty_list = []
empty_list

[]

In [181]:
empty_list = list()
empty_list

[]

列表加法，相当于将两个列表按顺序连接：

In [182]:
a = [1, 2, 3]
b = [3.2, 'hello']
a + b

[1, 2, 3, 3.2, 'hello']

列表与整数相乘，相当于将列表重复相加：

In [183]:
l * 2

[1, 2.0, 'hello', 1, 2.0, 'hello']

与字符串不同的是，列表可以通过索引和分片来修改。

对于字符串，如果我们通过索引或者分片来修改，Python会报错：

In [184]:
s = "hello world"
# 把开头的 h 改成大写
s[0] = 'H'

TypeError: 'str' object does not support item assignment

而这种操作对于列表来说是可以的：

In [None]:
a = [10, 11, 12, 13, 14]
a[0] = 100
print a

这种赋值也适用于分片，例如，将列表的第2，3两个元素换掉：

In [None]:
a[1:3] = [1, 2]
a

事实上，对于连续的分片（即步长为 1 ），Python采用的是整段替换的方法，两者的元素个数并不需要相同，例如，将 [11,12] 替换为 [1,2,3,4]：

In [None]:
a = [10, 11, 12, 13, 14]
a[1:3] = [1, 2, 3, 4]
print a

这意味着，可以用这种方法来删除列表中一个连续的分片：

In [None]:
a = [10, 1, 2, 11, 12]
print a[1:3]
a[1:3] = [] #或者del a[1:3]
print a

对于不连续（间隔step不为1）的片段进行修改时，两者的元素数目必须一致：

In [None]:
a = [10, 11, 12, 13, 14]
a[::2] = [1, 2, 3]
a

否则会报错：

In [None]:
a[::2] = []

列表中某个元素个数count

l.count(ob) 返回列表中元素 ob 出现的次数。

In [None]:
a = [11, 12, 13, 12, 11]
a.count(11)

向列表添加单个元素

l.append(ob) 将元素 ob 添加到列表 l 的最后。

In [None]:
a = [10, 11, 12]
a.append(11)
print a

append每次只添加一个元素，并不会因为这个元素是序列而将其展开：

In [None]:
a.append([11, 12])
print a

向列表添加序列

l.extend(lst) 将序列 lst 的元素依次添加到列表 l 的最后，作用相当于 l += lst。

In [185]:
a = [10, 11, 12, 11]
a.extend([1, 2])
print a

[10, 11, 12, 11, 1, 2]


排序

l.sort() 会将列表中的元素按照一定的规则排序：

In [None]:
a = [10, 1, 11, 13, 11, 2]
a.sort()
print a

如果不想改变原来列表中的值，可以使用 sorted 函数：

In [None]:
a = [10, 1, 11, 13, 11, 2]
b = sorted(a)
print a
print b

列表反向

l.reverse() 会将列表中的元素从后向前排列。

In [None]:
a = [1, 2, 3, 4, 5, 6]
a.reverse()
print a

如果不想改变原来列表中的值，可以使用这样的方法：

In [None]:
a = [1, 2, 3, 4, 5, 6]
b = a[::-1]
print a
print b

如果不清楚用法，可以查看帮助：

In [None]:
a.sort?

**字符串是不可变的（Immutable）**

In [None]:
s = "hello world"
s

通过索引改变会报错：

In [None]:
s[0] = 'z'

字符串方法只是返回一个新字符串，并不改变原来的值：

In [None]:
print s.replace('world', 'Mars')
print s

如果想改变字符串的值，可以用重新赋值的方法：

In [None]:
s = "hello world"
s = s.replace('world', 'Mars')
print s

或者用 bytearray 代替字符串：

In [None]:
s = bytearray('abcde')
s[1:3] = '12'
s

数据类型分类：

|可变数据类型|不可变数据类型|
|--|--|
|`list`, `dictionary`, `set`, `numpy array`, `user defined objects|integer`, `float`, `long`, `complex`, `string`, `tuple`, `frozenset`|