# Python 数据类型 

## 常用数据类型 Common Data Types

| 类型| 例子|
| -----  | ----- |
| 整数 | `-100` |
| 浮点数 | `3.1416` |
| 字符串 | `'hello'` |
| 列表 | `[1, 1.2, 'hello']` |
| 字典 | `{'dogs': 5, 'pigs': 3}`|
| Numpy数组 | `array([1, 2, 3])`

## 其他类型 Others

| 类型| 例子|
| -------  | ----- |
| 长整型 | `1000000000000L`
| 布尔型 | `True, False`
| 元组 | `('ring', 1000)`
| 集合 | `{1, 2, 3}`
| Pandas类型| `DataFrame, Series`
| 自定义 | `Object Oriented Classes`

## 整型

### python2与python3中关于整数的除法的不同

python2中整数除法的结果只包含整数部分,小数部分被删除

In [1]:
3/2

1

python2中如果想使得到的结果为浮点数，可以转换整数为**浮点数**或者执行**from \__future__ import division** 指令

In [2]:
3.0/2

1.5

In [3]:
from __future__ import division
3/2

1.5

### 整型数字的范围

在 32 位系统中，一个整型 4 个字节，最小值 -2,147,483,648，最大值 2,147,483,647

在 64 位系统中，一个整型 8 个字节，最小值 -9,223,372,036,854,775,808，最大值 9,223,372,036,854,775,807

python2中整数的最大值和最小值

In [4]:
import sys

max_value = sys.maxint
min_value = -sys.maxint - 1

python3中整数的最大值和最小值

In [5]:
import sys

max_value = sys.maxsize
min_value = -sys.maxsize - 1

## 长整型

一旦变量的值超过int的最大值或者最小值，Python就会从普通整数切换为**长整数**,不过长整型计算速度会比整型慢

In [6]:
a = sys.maxint + 1
#?a
print type(a)

<type 'long'>


可以在赋值时强制让类型为长整型,长整型的一个标志是后面以**字母L**结尾：

In [7]:
b = 1234L
type(b)

long

## 浮点数

Python的浮点数标准与**C**，Java**一致，都是IEEE 754 floating point standard

In [8]:
a = 3.4 - 3.2
a

0.19999999999999973

注意看 3.4 - 3.2 的结果并不是我们预期的0.2，这是因为浮点数本身储存方式引起的，浮点数本身会存在一点误差

事实上，Python 中储存的值为'0.199999999999999733546474089962430298328399658203125'，因为这是最接近0.2的浮点数

In [9]:
'{:.52}'.format(3.4 - 3.2)

'0.199999999999999733546474089962430298328399658203125'

当我们使用print显示时，Python会自动校正这个结果

In [10]:
print a

0.2


## 字符串

Python中可以使用一对单引号''或者双引号""生成字符串
简单来说，在Python中使用单引号或双引号是没有区别的，都可以用来表示一个字符串

In [11]:
s = "hello, world"
print s

hello, world


In [12]:
s = 'hello world'
print s

hello world


但是这两种通用的表达方式，除了可以简化程序员的开发，避免出错之外，还有一种好处，就是可以减少转义字符的使用，是程序看起来更简洁，更清晰

假如你想定义一个字符串my_str，其值为： I'm a student，则可以采用如下方式，通过转义字符 \ 进行定义

In [13]:
my_str = 'I\'m a student'
print my_str

I'm a student


也可以不使用转义字符，利用双引号直接进行定义

In [14]:
my_str = "I'm a student"
print my_str

I'm a student


同样，假如你想定义一个字符串my_str，其值为： Jason said "I like you" ，则可以采用如下方式，通过转义字符 \ 进行定义

In [15]:
my_str = "Jason said \"I like you\""
print my_str

Jason said "I like you"


也可以不使用转义字符，利用单引号直接进行定义

In [16]:
my_str = 'Jason said "I like you"'
print my_str

Jason said "I like you"


### 字符串的简单操作

#### 加法

In [17]:
var1 = 'Hello World!'
 
print "输出 :- ", var1[:6] + 'Runoob!'

输出 :-  Hello Runoob!


#### 与数字相乘

In [18]:
"echo" * 3

'echoechoecho'

#### 分割

`s.split(str="", num=string.count(str))`以 str 为分隔符切片 s，并返回所有分割得到的字符串,如果 num 有指定值，则仅分隔 num+ 个子字符串

In [19]:
??s.split

In [20]:
line = "1 2 3 4  5"
numbers = line.split()
print numbers

['1', '2', '3', '4', '5']


In [21]:
line = "1,2,3,4,5"
numbers = line.split(',')
print numbers

['1', '2', '3', '4', '5']


#### 连接

与分割相反，`s.join(str_sequence)`的作用是以s为连接符将字符串序列将**str_sequence**中的元素连接起来，并返回连接后得到的新字符串

In [22]:
s = ' '
s.join(numbers)

'1 2 3 4 5'

In [23]:
s = ','
s.join(numbers)

'1,2,3,4,5'

#### 替换
`s.replace(str1, str2,  num=string.count(str1))`将字符串s中指定的部分str1替换成想要的部分str2，并返回新的字符串,如果 num 指定，则替换不超过 num 次

In [24]:
s = "hello world"
s.replace('world', 'python')

'hello python'

此时，s的值并没有变化，替换方法只是生成了一个**新的字符串**

In [25]:
s

'hello world'

在Python中，字符串是**不可变类型**，即无法直接修改字符串的某一位字符。
因此改变一个字符串的元素需要新建一个新的字符串。
常见的修改方法除replace外有以下3种

* 将字符串转换成列表后修改值，然后用join组成新字符串

In [26]:
s = 'abcdef'                  #原字符串
s1 = list(s)                  #将字符串转换为列表
s1                         

['a', 'b', 'c', 'd', 'e', 'f']

In [27]:
s1[4] = 'E'                   #将列表中的第5个字符修改为E
s1[5] = 'F'                   #将列表中的第6个字符修改为F
s1

['a', 'b', 'c', 'd', 'E', 'F']

In [28]:
s = ''.join(s1)               #用空串将列表中的所有字符重新连接为字符串
s

'abcdEF'

* 通过字符串序列切片方式

In [29]:
s='Hello World' 
s=s[:6] + 'Bital'          #s前6个字符串+'Bital'
s

'Hello Bital'

In [30]:
s=s[:3] + s[8:]            #s前3个字符串+s第8位之后的字符串
s

'Heltal'

* 通过给一个变量赋值(或者重新赋值)

In [31]:
s='Hello World'
s2=' 2017'             #变量赋值
s=s+s2
s

'Hello World 2017'

In [32]:
s='Hello World'
s='Hello World 2017'   #重新赋值
s

'Hello World 2017'

#### 大小写转换
s.upper()方法返回一个将s中的字母全部大写的新字符串

s.lower()方法返回一个将s中的字母全部小写的新字符串

In [33]:
"hello world".upper()

'HELLO WORLD'

这两种方法也**不会改变原来s的值**

In [34]:
s = "HELLO WORLD"
print s.lower()
print s

hello world
HELLO WORLD


#### 去除多余空格
`s.strip()`返回一个将s两端的多余空格除去的新字符串

`s.lstrip()`返回一个将s开头的多余空格除去的新字符串

`s.rstrip()`返回一个将s结尾的多余空格除去的新字符串

同样这些方法也不会改变原来s的值

In [35]:
s = "  hello world   "
print s.strip()
print s

hello world
  hello world   


#### 多行字符串

Python 用一对 """ 或者 ''' 来生成多行字符串

In [36]:
a = """hello world.
it is a nice day."""
print a

hello world.
it is a nice day.


在储存时，我们在两行字符间加上一个换行符 '\n'

In [37]:
a

'hello world.\nit is a nice day.'

#### 使用 () 或者 \ 来换行

当代码太长或者为了美观起见时，我们可以使用两种方法来将一行代码转为多行代码

1. ()
2. \

In [38]:
a = ("hello, world. "
    "it's a nice day. "
    "my name is xxx")
a

"hello, world. it's a nice day. my name is xxx"

In [39]:
a = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a

"hello, world. it's a nice day. my name is xxx"

### 强制转换为字符串

`str(ob)`强制将`ob`转化成字符串

In [40]:
str(1.1 + 2.2)

'3.3'

字符串转换成数字

方法一：

In [41]:
int('23')

23

In [42]:
float('3.5')

3.5

方法二：

In [43]:
import string 
tt='555'
ts=string.atoi(tt)

## 格式化字符串

Python用字符串的`format()`方法来格式化字符串

具体用法如下，字符串中花括号 {} 的部分会被format传入的参数替代，传入的值可以是字符串，也可以是数字或者别的对象

参考资料：**https://zhuanlan.zhihu.com/p/90439125**

In [44]:
'{} {} {}'.format('a', 'b', 'c')

'a b c'

可以用数字指定传入参数的相对位置：

In [45]:
'{2} {1} {0}'.format('a', 'b', 'c')

'c b a'

还可以指定传入参数的名称：

In [46]:
'{color} {n} {x}'.format(n=10, x=1.5, color='blue')

'blue 10 1.5'

可以在一起混用：

In [47]:
'{color} {0} {x} {1}'.format(10, 'foo', x = 1.5, color='blue')

'blue 10 1.5 foo'

在**引用字典**时，可以用**操作符进行字典拆包：

In [48]:
person = {'name': 'Eric', 'age': 74}
"Hello, {name}. You are {age}.".format(**person)

'Hello, Eric. You are 74.'

可以用**`{<field name>:<format>}`**指定格式：

In [49]:
from math import pi

'{0:10} {1:10d} {2:10.2f}'.format('foo', 5, 2 * pi)

'foo                 5       6.28'

也可以使用旧式的 % 方法进行格式化：

In [50]:
s = "some numbers:"
x = 1.34
y = 2
# 用百分号隔开，括号括起来
t = "%s %f, %d" % (s, x, y)
print t

some numbers: 1.340000, 2


**Python3.6**新特性,字符串**f前缀**同样可以用来格式化字符串，实现与**`s.format()`**一样的功能，且**可读性更好,速度更快**

In [51]:
# 这段代码需要在Python3.6以及上的Python内核下执行 
name = 'Fred'
age = 42
f'He said his name is {name} and he is {age} years old.'

SyntaxError: invalid syntax (<ipython-input-51-153aaaaf9c04>, line 4)

可以在里面调用函数

In [52]:
def to_lowercase(input):
    return input.lower() 
name = "Eric Idle"
f"{to_lowercase(name)} is funny."

SyntaxError: invalid syntax (<ipython-input-52-1f17a3f38f08>, line 4)