# Python 编程基础 - 基本数据类型
---

#### 课程内容

1. 数字（Number）
2. 字符串（String）
3. 列表（List）
4. 元组（Tuple）
5. 集合（Set）
6. 字典（Dictionary）

---
### 1. 数字（Number）

#### 1.1 数字类型

Python3 支持整型（Int）、浮点型（Float）、布尔型（Bool）、复数（Complex）。

- **整型（Int）：**Python3 整型是没有限制大小的，可以当作 Long 类型使用，所以 Python3 没有 Python2 的 Long 类型


- **浮点型（Float）：**浮点型由整数部分与小数部分组成


- **布尔型（Bool）：**True 和 False。在 Python2 中是没有布尔型的，它用数字 0 表示 False，用 1 表示 True。到 Python3 中，把 True 和 False 定义成关键字了，但它们的值还是 1 和 0，它们可以和数字相加


- **复数（Complex）：**复数由实数部分和虚数部分构成，可以用 a + bj，或者 complex(a,b) 表示，复数的实部 a 和虚部 b 都是浮点型

In [None]:
i = 12            # 整型
type(i)

In [None]:
f = 36.5          # 浮点型
type(f)

In [None]:
f2 = 36.          # 注意，加小数点即为浮点型
type(f2)

In [None]:
b = True          # 布尔型（True 和 False）
type(b)

In [None]:
False * 1             # True 和 False 的值为 1 和 0

In [None]:
c = 1 + 2j        # 复数
type(c)

#### 1.2 数字类型转换

有时候，我们需要对数据内置的类型进行转换，数据类型的转换，你只需要将数据类型作为函数名即可。

`int(x)` 将 x 转换为一个整数。

`float(x)` 将 x 转换到一个浮点数。

`complex(x)` 将 x 转换到一个复数，实数部分为 x，虚数部分为 0。

`complex(x, y)` 将 x 和 y 转换到一个复数，实数部分为 x，虚数部分为 y。

In [None]:
%whos

In [None]:
f = int(f)                  # 向下取整

In [None]:
float(i)                # 转成浮点数

In [None]:
# 变量本身没有发生改变，上面运行结果只是返回值
%whos                   

#### 1.3 数字运算

In [None]:
2 + 4              # 加法

In [None]:
2.0 + 4            # 不同类型数字混合运算，会将整型自动转为浮点型

In [None]:
2 - 4              # 减法

In [None]:
2 * 4              # 乘法

In [None]:
2 / 4              # 除法，得到一个浮点数

In [None]:
2 // 4             # 除法，得到一个整数（向下取整）

In [None]:
2.0 // 4           # 如果分母或分子有浮点数，则结果为浮点数

In [None]:
2 % 4              # 取余数

In [None]:
2 ** 4             # 乘方

#### 1.4 常用的数学函数

In [None]:
abs(-2.4)                 # 取绝对值

In [None]:
round(3.1415926, 2)       # 四舍五入

In [None]:
import math               # 导入 math 模块

In [None]:
math.e                    # 自然常数 e

In [None]:
math.pi                   # 圆周率 π

In [None]:
math.ceil(2.5)            # 向上取整

In [None]:
math.floor(2.5)           # 向下取整

In [None]:
math.exp(1)               # 自然常数 e 为底的指数函数

In [None]:
math.log(10)              # 自然对数 ln，即以常数 e 为底数的对数

In [None]:
math.sqrt(4)              # 平方根

---
### 2. 字符串（String）

#### 2.1 字符串的创建

字符串是 Python 中最常用的数据类型之一。我们可以使用引号（`'` 或 `"`）来创建字符串。

In [None]:
s = 'hello world'

In [None]:
type(s)

In [None]:
s2 = "hello world"

In [None]:
s, s2

可以使用三引号（`'''` 或 `"""`）来创建多行字符串，注意前后引号要匹配。

In [None]:
message = '''
hello
hello
hello'''

In [None]:
type(message)

In [None]:
print(message)

In [None]:
message = """
hello
hello
hello"""

In [None]:
print(message)

#### 2.2 字符串索引和切片

`[i]`：通过索引获取字符串中字符

`[i:j]`：截取字符串中的一部分，遵循左闭右开原则，（j - i）为截取长度

In [None]:
s

In [None]:
s[0]             # Python 中从 0 开始计数

In [None]:
s[-2]            # -1 表示倒数第一个数

In [None]:
s[:2]            # 左闭右开，截取长度为 2

In [None]:
s[2:4]           # 左闭右开，截取长度为 2

In [None]:
s[0] = 'H'       # 报错，字符串为不可变数据类型

#### 2.3 字符串运算符

`+`：表示字符串拼接

`*`：表示字符串重复

`in`：如果字符串中包含给定的字符返回 True

`not in`：如果字符串中不包含给定的字符返回 True

In [None]:
'hello' + ' world'

In [None]:
'price is ' + 10           # 报错，要改成相同数据类型

In [None]:
'price is ' + str(10)

In [None]:
'hello' * 3

In [None]:
'he' in 'hello'

In [None]:
'H' not in 'hello'          # Python 大小写敏感

#### 2.4 字符串的方法

`upper()`：将字符串所有字符转换成大写

`lower()`：将字符串所有字符转换成小写

`title()`：返回“标题化”的字符串，即所有单词首字母大写，其余字母小写

`capitalize()`：将字符串的第一个字符转换为大写

`split()`：将字符串按指定字符进行分拆，默认按照空格、制表符、换行符等空字符进行分拆

`replace()`：对字符串中的子字符串进行替换

`find()`：查找字符串中是否包含某子字符串，如包含则返回子字符串开始的索引值，否则返回-1

In [None]:
dir(str)                       # 查看字符串所有方法

In [None]:
help(str.capitalize)           # 查看说明文档

In [None]:
s = 'hello world'

In [None]:
s.find('World')

In [None]:
s.upper()

In [None]:
s               # 字符串为不可变数据类型，原字符串没有发生改变，而是以返回值的形式

In [None]:
s = s.upper()   # 将函数返回值赋值给原变量，则覆盖原变量指代的对象
s

In [None]:
s.lower()

In [None]:
s.title()

In [None]:
s.capitalize()

In [None]:
s.split('O')

In [None]:
s.replace('O','A')       # 将原字符串中的 O 替换为 A

#### 2.5 字符串转义

`\(在行尾时)`	续行符

`\\`	反斜杠符号

`\'`	单引号

`\"`	双引号

`\000`	空

`\n`	换行

`\v`	纵向制表符

`\t`	横向制表符

In [None]:
message = 'hello \
world'

In [None]:
message

In [None]:
news = 'AAPL\'s close price is $320.'      # 报错

In [None]:
news = "AAPL's close price is $320."       # 解决方案一：使用双引号创建字符串
print(news)

In [None]:
news = 'AAPL\'s close price is $320.'      # 解决方案二：使用转义符 \' 表示单引号
print(news)

In [None]:
message = 'hello\nworld'
print(message)

使用原始字符串取消对特殊字符的转义

In [None]:
path = 'C:\Desktop\news'
print(path)

In [None]:
path = r'C:\Desktop\news'
print(path)

#### 2.6 字符串格式化

#### 2.6.1 占位符 %

`%s`：字符串占位

`%d`：整型占位

`%f`：浮点数占位，可指定小数点后精度

In [None]:
print("I'm %s. I'm %d years old." % ('Vamei', 99))        

In [None]:
name = 'Vamei'
age = 99
print("I'm %s. I'm %d years old." % (name, age))            # 也可以使用变量填充

In [None]:
stock = {'name':'GOOG', 'shares':100, 'price':490.1}        # 还可以用字典的形式对字符串进行格式化

r = "%(shares)d of %(name)s at %(price).2f" % stock         # 括号中为字典的键（key），浮点数可以指定精度
r

#### 2.6.2 format() 函数

In [None]:
"I'm {}. I'm {} years old.".format('Vamei', 99)                            # 不用指定数据类型        

In [None]:
"I'm {1}. I'm {0} years old.".format(99, 'Vamei')                          # 通过位置映射  

In [None]:
"I'm {name}. I'm {age} years old.".format(name='Vamei', age=99)            # 通过关键字映射

In [None]:
stock = {'name':'GOOG', 'shares':100, 'price':490.1}           # 还可以用字典的形式对字符串进行格式化

r = "{shares} of {name} at {price:.2f}".format(**stock)        # 花括号中为字典的键（key），浮点数可以指定精度
r

#### 2.6.3 f-string

f-string 是 Python3.6 之后版本添加的，称之为字面量格式化字符串，是新的格式化字符串的语法。

f-string 格式化字符串以 f 开头，后面跟着字符串，字符串中的表达式用大括号 {} 包起来，它会将变量或表达式计算后的值替换进去

In [None]:
name='Vamei'; age=99

In [None]:
f"I'm {name}. I'm {age} years old."

In [None]:
stock = {'name':'GOOG', 'shares':100, 'price':490.1}  

f"{stock['shares']} of {stock['name']} at {stock['price']:.2f}"

---
### 3. 列表（List）

#### 3.1 列表的创建

列表使用方括号 `[]` 创建，用逗号分隔元素。列表中的元素类型可以不同，它支持数字、字符串、列表（所谓嵌套）等。

In [None]:
lst = [1, 'a', [1,2]]

In [None]:
lst

#### 3.2 列表索引和切片

和字符串一样，列表同样可以被索引和截取，列表被截取后返回一个包含所需元素的新列表。

与字符串不一样的是，列表中的元素是可以改变的。

In [None]:
lst[0]

In [None]:
lst[-1]

In [None]:
lst[-1][0]         # 嵌套列表取值

In [None]:
lst[:2]

In [None]:
lst[0] = 2         # 可以通过赋值更新列表元素
lst

#### 3.3 列表运算符

`+`：表示列表拼接

`*`：表示列表重复

`in`：如果列表中包含指定的元素返回 True

`not in`：如果列表中不包含指定的元素返回 True

In [None]:
lst

In [None]:
[1,2,3] + [4,5,6]

In [None]:
[1,2,3] * 3

In [None]:
1 in lst

In [None]:
1 in lst[-1]

#### 3.4 列表修改

#### 3.4.1 更新列表元素

In [None]:
lst = [1, 2, 3]
lst[-1] = [1, 2]                # 列表为可变数据类型
lst

#### 3.4.2 增加列表元素

`append()`：在列表末尾添加一个对象

`extend()`：将某序列中的元素依次添加至原列表中

`insert()`：在列表指定位置添加元素

In [None]:
close1 = [10, 10.2, 9.8, 9.5, 9.2]    # 第一周收盘价
close2 = [9, 9.5, 10, 10.2, 11]       # 第二周收盘价
close1.append(close2)
close1

In [None]:
close1 = [10, 10.2, 9.8, 9.5, 9.2]    # 第一周收盘价
close2 = [9, 9.5, 10, 10.2, 11]       # 第二周收盘价
close1.extend(close2)
close1

In [None]:
help(close1.insert)                   # help 函数可以查看使用说明

In [None]:
close1.insert(1, 'a')
close1

#### 3.4.3 删除列表元素

`remove()`：删除列表中某个值的第一个匹配项，无返回值

`pop()`：删除指定位置的元素（默认删除最后一个元素），并将该元素返回

`del` 语句：删除列表中指定元素，无返回值，可以通过切片同时删除多个元素，也可以删除变量

In [None]:
close = [10, 10.2, 9.2, 9.5, 9.2]

In [None]:
close.remove(9.2)         # remove 一次删除一个元素
close

In [None]:
close.pop(1)               # pop 通过位置删除元素，默认位置为 -1，即最后一个元素，并将删除元素返回

In [None]:
close

In [None]:
del close[0]              # 删除指定位置元素
close

In [None]:
del close[2:4]            # 通过切片删除多个元素
close

In [None]:
del close                 # 删除变量

#### 3.5 列表函数和方法

`len()`：计算列表长度

`max()/min()`：计算列表最大/最小值

`list.count()`：统计某个元素在列表中出现的次数

`list.reverse()`：反向列表中元素

`list.sort()`：对原列表进行排序

`list.copy()`：复制列表

In [None]:
dir(list)

In [None]:
lst = [1,2,3,4,4,4,5]

In [None]:
len(lst)

In [None]:
max(lst)

In [None]:
min(lst)

In [None]:
lst.count(4)

In [None]:
lst.reverse()
lst

In [None]:
lst.sort()
lst

In [None]:
lst2 = lst.copy()            # 修改复制的列表不会改变原列表
lst2

In [None]:
lst2.append('a')
lst2, lst

In [None]:
lst3 = lst                   # 如果直接赋值给新列表，则修改新列表也会改变原列表

In [None]:
lst3.append('a')
lst3, lst

---
### 4. 元组（Tuple）

元组（tuple）与列表类似，不同之处在于元组的元素不能修改。

元组写在小括号 `()` 里，元素之间用逗号隔开。注意，当元组中只包含一个元素时，需要在元素后面添加逗号。

元组中的元素类型也可以不相同。

#### 4.1 元组的创建

In [None]:
stock = ('000001', '平安银行', '银行', 8.5)      # 元组的元素可以是多类型的
type(stock)

In [None]:
stock = '000001', '平安银行', '银行', 8.5        # 不加括号也是可以的
type(stock)

In [None]:
stock = ('000001',)                             # 如果只有一个元素，需要在后面添加逗号
type(stock)

#### 4.2 元组索引和切片

In [None]:
stock = ('000001', '平安银行', '银行', 8.5)
stock[:2]                                        # 通过下标访问元组的元素

In [None]:
stock[2] = '地产'                               # 元组为不可变数据类型，不可对其元素进行修改

#### 4.3 元组运算符

`+`：表示元组拼接

`*`：表示元组重复

`in`：如果元组中包含指定的元素返回 True

`not in`：如果元组中不包含指定的元素返回 True

In [None]:
tup1 = ('a','b','c')
tup2 = ('d','e','f')

In [None]:
tup1 + tup2

In [None]:
tup1 * 3

In [None]:
'a' in tup1

In [None]:
'a' not in tup2

#### 4.4 元组函数和方法

In [None]:
stock = ('000001', '平安银行', '银行', 8.5)
list(stock)                                    # 可以通过 list() 函数将元组转为列表

In [None]:
lst = ['000001', '平安银行', '银行', 8.5]
tuple(lst)                                     # 也可以通过 tuple() 函数将列表转为元组

In [None]:
stock.count('银行')                            # tuple元素的计数

In [None]:
stock.index('银行')                            # 返回某一个值的索引值

In [None]:
a , b = 10, 5

In [None]:
dir(tuple)

---
### 5. 集合（Set）

集合（set）是一个无序的不重复元素序列。

可以使用大括号 `{}` 或者 `set()` 函数创建集合，注意：创建一个空集合必须用 `set()` 而不是 `{}`，因为 `{}` 是用来创建一个空字典。

In [None]:
from random import randint
l = [randint(1,10) for i in range(1000)]       # 产生 1000 个 1-10 之间的随机整数
l

In [None]:
len(l)              # list的元素数量

In [None]:
l[:20]              # 查看前20个元素

In [None]:
s = set(l)          # 通过 set 去重，获得独一无二元素
s

In [None]:
for number in s:
    print("Number %2d occurs %3d times in the data set." % (number, l.count(number)))

---
### 6. 字典（Dictionary）

字典是另一种可变容器模型，且可存储任意类型对象。

字典的每个键值对用冒号 `:` 分割，每个键值对之间用逗号 `,` 分割，整个字典包括在花括号 `{}` 中。

#### 6.1 字典的创建

In [None]:
stock_info = {'code': '000001', 'name': '平安银行', 'industry': '银行'}  

In [None]:
type(stock_info)

字典的键是独一无二的，不会有两个相同的键。创建时如果同一个键被赋值两次，会储存后面的值

In [None]:
stock_info = {'code': '000001', 'name':'平安银行', 'industry':'银行'}
stock_info

In [None]:
stock_info = {'code': '000001', 'name':'平安银行', 'industry':'银行', 'industry':'地产'}
stock_info

字典的键必须为不可变数据类型，所以可以用数字、字符串或元组，不可以使用列表、集合、字典等可变数据类型

In [None]:
{('三日涨幅', '六日涨幅'):(0.05, 0.06)}        # 键可以是元组数据类型

In [None]:
{['三日涨幅', '六日涨幅']:(0.05, 0.06)}        # 键不可以是列表数据类型

#### 6.2 字典取值

In [None]:
stock_info = {'code': '000001', 'name': '平安银行', 'industry': '银行'}  

In [None]:
stock_info['code']

In [None]:
stock_info['name']

In [None]:
stock_info.keys()

In [None]:
stock_info.values()

In [None]:
stock_info.items()                       # (key,value) 组合

In [None]:
for key in stock_info:                   # 默认对字典的键进行循环
    print(key)

In [None]:
for key in stock_info.keys():            # .keys() 可省略
    print(key)

In [None]:
for k in stock_info.items():
    print(k[0])

#### 6.3 字典修改

#### 6.3.1 更新字典元素

In [None]:
stock_info = {'code': '000001', 'name': '平安银行', 'industry': '银行'}  

In [None]:
stock_info['volume'] = 1000              # 新增字典的key
stock_info

In [None]:
stock_info['volume'] += 100              # 字典可原地修改
stock_info

In [None]:
stock_info['industry'] = '股份制银行'     # 更新键的值  
stock_info

#### 6.3.2 删除字典元素

In [None]:
del stock_info['volume']

In [None]:
stock_info

#### 6.4 字典函数和方法

`len()` 函数计算字典元素个数，即键的总数

In [None]:
len(stock_info)

`fromkeys()` 函数用于创建一个新字典，以序列seq中元素做字典的键，value为字典所有键对应的初始值

In [None]:
stock_lst = ['000001','600001','600030']
stock_dict = dict.fromkeys(stock_lst, 0)
stock_dict

`get()` 函数返回指定键的值，如果字典中不存在该键，则返回默认值

In [None]:
stock_info = {'code': '000001', 'name':'平安银行', 'industry':'银行'}

In [None]:
stock_info.get('PE')     # 语法：dict.get(key, default=None) 

In [None]:
stock_info.get('PE', -1)       # 如果没有该键则返回默认值 -1

In [None]:
stock_info['PE']

`update()` 函数把新字典的键值对更新到原字典中

In [None]:
stock_info = {'code': '000001', 'name':'平安银行', 'industry':'银行'}
stock_info2 = {'PE': '10', 'industry':'保险'}  
  
stock_info.update(stock_info2)  

In [None]:
stock_info

In [None]:
stock_info['PB'] = '2'
stock_info

声明：本资料仅限内部研究和交流使用，切勿外传。