# Python 数据类型详解

Python 是一种动态类型语言，提供了丰富的数据类型来存储和处理数据。本笔记本将详细介绍 Python 中的主要数据类型。

## 目录
1. [数字类型](#数字类型)
2. [字符串](#字符串)
3. [列表](#列表)
4. [元组](#元组)
5. [字典](#字典)
6. [集合](#集合)
7. [布尔类型](#布尔类型)
8. [None 类型](#None-类型)
9. [数据类型转换](#数据类型转换)

## 数字类型

Python 支持三种主要的数字类型：整数(int)、浮点数(float)和复数(complex)。

In [10]:
# 整数 (int)
integer_num = 10
negative_int = -5
large_int = 1234567890

print(f"整数: {integer_num}, 类型: {type(integer_num)}")
print(f"负整数: {negative_int}, 类型: {type(negative_int)}")
print(f"大整数: {large_int}, 类型: {type(large_int)}")
print()

# 浮点数 (float)
float_num = 3.14
scientific_notation = 2.5e-3  # 0.0025
negative_float = -10.5

print(f"浮点数: {float_num}, 类型: {type(float_num)}")
print(f"科学计数法: {scientific_notation}, 类型: {type(scientific_notation)}")
print(f"负浮点数: {negative_float}, 类型: {type(negative_float)}")
print()

# 复数 (complex)
complex_num = 3 + 4j
complex_num2 = complex(2, -3)

print(f"复数: {complex_num}, 类型: {type(complex_num)}")
print(f"复数实部: {complex_num.real}")
print(f"复数虚部: {complex_num.imag}")
print(f"使用complex()创建: {complex_num2}, 类型: {type(complex_num2)}")

整数: 10, 类型: <class 'int'>
负整数: -5, 类型: <class 'int'>
大整数: 1234567890, 类型: <class 'int'>

浮点数: 3.14, 类型: <class 'float'>
科学计数法: 0.0025, 类型: <class 'float'>
负浮点数: -10.5, 类型: <class 'float'>

复数: (3+4j), 类型: <class 'complex'>
复数实部: 3.0
复数虚部: 4.0
使用complex()创建: (2-3j), 类型: <class 'complex'>


## 字符串

字符串用于表示文本数据，可以使用单引号、双引号或三引号创建。

In [11]:
# 创建字符串
single_quoted = 'Hello, World!'
double_quoted = "Python Programming"
triple_quoted = '''这是一个
多行
字符串'''
triple_double = """这也是一个
多行字符串"""

print(f"单引号字符串: {single_quoted}, 类型: {type(single_quoted)}")
print(f"双引号字符串: {double_quoted}, 类型: {type(double_quoted)}")
print(f"三引号字符串:\n{triple_quoted}")
print(f"三双引号字符串:\n{triple_double}")
print()

# 字符串操作
str1 = "Hello"
str2 = "Python"

# 连接
concatenated = str1 + " " + str2
print(f"字符串连接: {concatenated}")

# 重复
repeated = str1 * 3
print(f"字符串重复: {repeated}")

# 索引
print(f"字符串索引 - 第一个字符: {str1[0]}, 最后一个字符: {str1[-1]}")

# 切片
print(f"字符串切片 [1:4]: {str2[1:4]}")
print(f"字符串切片 [::2]: {str2[::2]}")

# 常用方法
text = "  Python Programming  "
print(f"原始字符串: '{text}'")
print(f"去除空格: '{text.strip()}'")
print(f"大写: '{text.upper()}'")
print(f"小写: '{text.lower()}'")
print(f"替换: '{text.replace('Python', 'Java')}'")
print(f"查找 'Pro': 位置 {text.find('Pro')}")
print(f"分割: {text.strip().split(' ')}")

单引号字符串: Hello, World!, 类型: <class 'str'>
双引号字符串: Python Programming, 类型: <class 'str'>
三引号字符串:
这是一个
多行
字符串
三双引号字符串:
这也是一个
多行字符串

字符串连接: Hello Python
字符串重复: HelloHelloHello
字符串索引 - 第一个字符: H, 最后一个字符: o
字符串切片 [1:4]: yth
字符串切片 [::2]: Pto
原始字符串: '  Python Programming  '
去除空格: 'Python Programming'
大写: '  PYTHON PROGRAMMING  '
小写: '  python programming  '
替换: '  Java Programming  '
查找 'Pro': 位置 9
分割: ['Python', 'Programming']


## 列表

列表是有序、可变的集合，可以包含不同类型的元素。

In [12]:
# 创建列表
empty_list = []
numbers = [1, 2, 3, 4, 5]
mixed_list = [1, "hello", 3.14, True]
nested_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

print(f"空列表: {empty_list}, 类型: {type(empty_list)}")
print(f"数字列表: {numbers}, 类型: {type(numbers)}")
print(f"混合列表: {mixed_list}, 类型: {type(mixed_list)}")
print(f"嵌套列表: {nested_list}, 类型: {type(nested_list)}")
print()

# 列表操作
# 索引
print(f"列表索引 - 第一个元素: {numbers[0]}, 最后一个元素: {numbers[-1]}")
print(f"嵌套列表索引: {nested_list[1][2]}")  # 访问第二行的第三个元素

# 切片
print(f"列表切片 [1:4]: {numbers[1:4]}")
print(f"列表切片 [::2]: {numbers[::2]}")
print(f"列表反转: {numbers[::-1]}")
print()

# 修改列表
numbers[0] = 10
print(f"修改后的列表: {numbers}")

# 添加元素
numbers.append(6)
print(f"添加元素后: {numbers}")

numbers.insert(2, 2.5)
print(f"插入元素后: {numbers}")

# 扩展列表
numbers.extend([7, 8, 9])
print(f"扩展列表后: {numbers}")

# 删除元素
removed = numbers.pop()  # 删除最后一个元素
print(f"删除的元素: {removed}, 删除后列表: {numbers}")

removed_by_index = numbers.pop(2)  # 删除索引为2的元素
print(f"删除的元素: {removed_by_index}, 删除后列表: {numbers}")

numbers.remove(4)  # 删除第一个出现的4
print(f"删除特定值后: {numbers}")

# 其他操作
print(f"列表长度: {len(numbers)}")
print(f"元素3的索引: {numbers.index(3)}")
print(f"元素5出现的次数: {numbers.count(5)}")

# 排序
unsorted = [3, 1, 4, 1, 5, 9, 2]
unsorted.sort()
print(f"排序后: {unsorted}")

# 列表推导式
squares = [x**2 for x in range(1, 6)]
print(f"列表推导式(平方): {squares}")

even_squares = [x**2 for x in range(1, 11) if x % 2 == 0]
print(f"列表推导式(偶数的平方): {even_squares}")

空列表: [], 类型: <class 'list'>
数字列表: [1, 2, 3, 4, 5], 类型: <class 'list'>
混合列表: [1, 'hello', 3.14, True], 类型: <class 'list'>
嵌套列表: [[1, 2, 3], [4, 5, 6], [7, 8, 9]], 类型: <class 'list'>

列表索引 - 第一个元素: 1, 最后一个元素: 5
嵌套列表索引: 6
列表切片 [1:4]: [2, 3, 4]
列表切片 [::2]: [1, 3, 5]
列表反转: [5, 4, 3, 2, 1]

修改后的列表: [10, 2, 3, 4, 5]
添加元素后: [10, 2, 3, 4, 5, 6]
插入元素后: [10, 2, 2.5, 3, 4, 5, 6]
扩展列表后: [10, 2, 2.5, 3, 4, 5, 6, 7, 8, 9]
删除的元素: 9, 删除后列表: [10, 2, 2.5, 3, 4, 5, 6, 7, 8]
删除的元素: 2.5, 删除后列表: [10, 2, 3, 4, 5, 6, 7, 8]
删除特定值后: [10, 2, 3, 5, 6, 7, 8]
列表长度: 7
元素3的索引: 2
元素5出现的次数: 1
排序后: [1, 1, 2, 3, 4, 5, 9]
列表推导式(平方): [1, 4, 9, 16, 25]
列表推导式(偶数的平方): [4, 16, 36, 64, 100]


## 元组

元组是有序、不可变的集合，通常用于存储相关的数据。

In [13]:
# 创建元组
empty_tuple = ()
single_element = (5,)  # 注意逗号，没有逗号会被认为是整数
numbers_tuple = (1, 2, 3, 4, 5)
mixed_tuple = (1, "hello", 3.14, True)
nested_tuple = ((1, 2, 3), (4, 5, 6), (7, 8, 9))

print(f"空元组: {empty_tuple}, 类型: {type(empty_tuple)}")
print(f"单元素元组: {single_element}, 类型: {type(single_element)}")
print(f"数字元组: {numbers_tuple}, 类型: {type(numbers_tuple)}")
print(f"混合元组: {mixed_tuple}, 类型: {type(mixed_tuple)}")
print(f"嵌套元组: {nested_tuple}, 类型: {type(nested_tuple)}")
print()

# 元组操作
# 索引
print(f"元组索引 - 第一个元素: {numbers_tuple[0]}, 最后一个元素: {numbers_tuple[-1]}")
print(f"嵌套元组索引: {nested_tuple[1][2]}")  # 访问第二行的第三个元素

# 切片
print(f"元组切片 [1:4]: {numbers_tuple[1:4]}")
print(f"元组切片 [::2]: {numbers_tuple[::2]}")

# 元组是不可变的，以下操作会报错
try:
    numbers_tuple[0] = 10
except TypeError as e:
    print(f"错误: {e}")
print()

# 元组解包
a, b, c, d, e = numbers_tuple
print(f"元组解包: a={a}, b={b}, c={c}, d={d}, e={e}")

# 交换变量
x, y = 10, 20
print(f"交换前: x={x}, y={y}")
x, y = y, x
print(f"交换后: x={x}, y={y}")
print()

# 元组方法
print(f"元素3的索引: {numbers_tuple.index(3)}")
print(f"元素2出现的次数: {numbers_tuple.count(2)}")

空元组: (), 类型: <class 'tuple'>
单元素元组: (5,), 类型: <class 'tuple'>
数字元组: (1, 2, 3, 4, 5), 类型: <class 'tuple'>
混合元组: (1, 'hello', 3.14, True), 类型: <class 'tuple'>
嵌套元组: ((1, 2, 3), (4, 5, 6), (7, 8, 9)), 类型: <class 'tuple'>

元组索引 - 第一个元素: 1, 最后一个元素: 5
嵌套元组索引: 6
元组切片 [1:4]: (2, 3, 4)
元组切片 [::2]: (1, 3, 5)
错误: 'tuple' object does not support item assignment

元组解包: a=1, b=2, c=3, d=4, e=5
交换前: x=10, y=20
交换后: x=20, y=10

元素3的索引: 2
元素2出现的次数: 1


## 字典

字典是无序的键值对集合，键必须是不可变类型。

In [14]:
# 创建字典
empty_dict = {}
person = {"name": "Alice", "age": 30, "city": "New York"}
mixed_dict = {1: "one", "two": 2, 3.0: [1, 2, 3]}

print(f"空字典: {empty_dict}, 类型: {type(empty_dict)}")
print(f"个人信息字典: {person}, 类型: {type(person)}")
print(f"混合字典: {mixed_dict}, 类型: {type(mixed_dict)}")
print()

# 使用 dict() 构造函数
from_keys = dict.fromkeys(["name", "age", "city"], "unknown")
constructed = dict(name="Bob", age=25, city="London")

print(f"fromkeys创建: {from_keys}")
print(f"dict()构造函数创建: {constructed}")
print()

# 字典操作
# 访问元素
print(f"访问姓名: {person['name']}")
print(f"使用get访问年龄: {person.get('age')}")
print(f"访问不存在的键(使用get): {person.get('country', 'Not found')}")

# 添加/修改元素
person["email"] = "alice@example.com"
print(f"添加邮箱后: {person}")

person["age"] = 31
print(f"修改年龄后: {person}")

# 删除元素
removed_value = person.pop("city")
print(f"删除的城市: {removed_value}, 删除后: {person}")

# 字典方法
print(f"所有键: {person.keys()}")
print(f"所有值: {person.values()}")
print(f"所有键值对: {person.items()}")

# 遍历字典
print("遍历字典:")
for key, value in person.items():
    print(f"  {key}: {value}")

# 字典推导式
squares_dict = {x: x**2 for x in range(1, 6)}
print(f"字典推导式(平方): {squares_dict}")

even_squares_dict = {x: x**2 for x in range(1, 11) if x % 2 == 0}
print(f"字典推导式(偶数的平方): {even_squares_dict}")

空字典: {}, 类型: <class 'dict'>
个人信息字典: {'name': 'Alice', 'age': 30, 'city': 'New York'}, 类型: <class 'dict'>
混合字典: {1: 'one', 'two': 2, 3.0: [1, 2, 3]}, 类型: <class 'dict'>

fromkeys创建: {'name': 'unknown', 'age': 'unknown', 'city': 'unknown'}
dict()构造函数创建: {'name': 'Bob', 'age': 25, 'city': 'London'}

访问姓名: Alice
使用get访问年龄: 30
访问不存在的键(使用get): Not found
添加邮箱后: {'name': 'Alice', 'age': 30, 'city': 'New York', 'email': 'alice@example.com'}
修改年龄后: {'name': 'Alice', 'age': 31, 'city': 'New York', 'email': 'alice@example.com'}
删除的城市: New York, 删除后: {'name': 'Alice', 'age': 31, 'email': 'alice@example.com'}
所有键: dict_keys(['name', 'age', 'email'])
所有值: dict_values(['Alice', 31, 'alice@example.com'])
所有键值对: dict_items([('name', 'Alice'), ('age', 31), ('email', 'alice@example.com')])
遍历字典:
  name: Alice
  age: 31
  email: alice@example.com
字典推导式(平方): {1: 1, 2: 4, 3: 9, 4: 16, 5: 25}
字典推导式(偶数的平方): {2: 4, 4: 16, 6: 36, 8: 64, 10: 100}


## 集合

集合是无序、不重复元素的集合，支持数学集合操作。

In [15]:
# 创建集合
empty_set = set()
numbers_set = {1, 2, 3, 4, 5}
mixed_set = {1, "hello", 3.14}
duplicates_set = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4}

print(f"空集合: {empty_set}, 类型: {type(empty_set)}")
print(f"数字集合: {numbers_set}, 类型: {type(numbers_set)}")
print(f"混合集合: {mixed_set}, 类型: {type(mixed_set)}")
print(f"去重集合: {duplicates_set}, 类型: {type(duplicates_set)}")  # 自动去重
print()

# 注意: 不能使用 {} 创建空集合，这会创建空字典
empty_dict_literal = {}
print(f"空字典字面量: {empty_dict_literal}, 类型: {type(empty_dict_literal)}")
print()

# 集合操作
set1 = {1, 2, 3, 4, 5}
set2 = {4, 5, 6, 7, 8}

print(f"集合1: {set1}")
print(f"集合2: {set2}")

# 并集
union_set = set1 | set2
print(f"并集: {union_set}")

# 交集
intersection_set = set1 & set2
print(f"交集: {intersection_set}")

# 差集
difference_set = set1 - set2
print(f"差集(set1 - set2): {difference_set}")

# 对称差集
symmetric_difference_set = set1 ^ set2
print(f"对称差集: {symmetric_difference_set}")

# 集合方法
set1.add(6)
print(f"添加元素后: {set1}")

set1.remove(1)  # 如果元素不存在会报错
print(f"移除元素后: {set1}")

set1.discard(10)  # 如果元素不存在不会报错
print(f"安全移除后: {set1}")

popped_element = set1.pop()  # 随机移除一个元素
print(f"弹出的元素: {popped_element}, 弹出后: {set1}")

# 集合推导式
even_squares_set = {x**2 for x in range(1, 11) if x % 2 == 0}
print(f"集合推导式(偶数的平方): {even_squares_set}")

空集合: set(), 类型: <class 'set'>
数字集合: {1, 2, 3, 4, 5}, 类型: <class 'set'>
混合集合: {1, 3.14, 'hello'}, 类型: <class 'set'>
去重集合: {1, 2, 3, 4}, 类型: <class 'set'>

空字典字面量: {}, 类型: <class 'dict'>

集合1: {1, 2, 3, 4, 5}
集合2: {4, 5, 6, 7, 8}
并集: {1, 2, 3, 4, 5, 6, 7, 8}
交集: {4, 5}
差集(set1 - set2): {1, 2, 3}
对称差集: {1, 2, 3, 6, 7, 8}
添加元素后: {1, 2, 3, 4, 5, 6}
移除元素后: {2, 3, 4, 5, 6}
安全移除后: {2, 3, 4, 5, 6}
弹出的元素: 2, 弹出后: {3, 4, 5, 6}
集合推导式(偶数的平方): {64, 100, 4, 36, 16}


## 布尔类型

布尔类型只有两个值：True 和 False，用于逻辑运算。

In [16]:
# 布尔值
true_value = True
false_value = False

print(f"True: {true_value}, 类型: {type(true_value)}")
print(f"False: {false_value}, 类型: {type(false_value)}")
print()

# 布尔运算
print(f"与运算 (True and False): {True and False}")
print(f"或运算 (True or False): {True or False}")
print(f"非运算 (not True): {not True}")
print()

# 布尔转换
# 以下值在布尔上下文中被视为 False
falsy_values = [False, None, 0, 0.0, "", [], (), {}, set()]

print("Falsy 值:")
for value in falsy_values:
    print(f"  {repr(value)} -> {bool(value)}")

print("\nTruthy 值示例:")
truthy_values = [True, 1, 3.14, "hello", [1, 2, 3], (1, 2), {"key": "value"}, {1, 2, 3}]
for value in truthy_values:
    print(f"  {repr(value)} -> {bool(value)}")
print()

# 比较运算
a, b = 10, 20
print(f"a = {a}, b = {b}")
print(f"a == b: {a == b}")
print(f"a != b: {a != b}")
print(f"a < b: {a < b}")
print(f"a > b: {a > b}")
print(f"a <= b: {a <= b}")
print(f"a >= b: {a >= b}")

True: True, 类型: <class 'bool'>
False: False, 类型: <class 'bool'>

与运算 (True and False): False
或运算 (True or False): True
非运算 (not True): False

Falsy 值:
  False -> False
  None -> False
  0 -> False
  0.0 -> False
  '' -> False
  [] -> False
  () -> False
  {} -> False
  set() -> False

Truthy 值示例:
  True -> True
  1 -> True
  3.14 -> True
  'hello' -> True
  [1, 2, 3] -> True
  (1, 2) -> True
  {'key': 'value'} -> True
  {1, 2, 3} -> True

a = 10, b = 20
a == b: False
a != b: True
a < b: True
a > b: False
a <= b: True
a >= b: False


## None 类型

None 表示空值或没有值，是 NoneType 的唯一值。

In [17]:
# None 类型
none_value = None

print(f"None: {none_value}, 类型: {type(none_value)}")
print()

# None 的使用
def function_without_return():
    print("这个函数没有返回值")

result = function_without_return()
print(f"无返回值函数的返回: {result}, 类型: {type(result)}")
print()

# None 在条件判断中的使用
variable = None

if variable is None:
    print("变量是 None")
else:
    print("变量不是 None")

# 检查变量是否已初始化
def process_data(data=None):
    if data is None:
        data = []  # 如果data为None，初始化为空列表
    data.append("processed")
    return data

print(f"处理数据(无参数): {process_data()}")
print(f"处理数据(有参数): {process_data([1, 2, 3])}")

None: None, 类型: <class 'NoneType'>

这个函数没有返回值
无返回值函数的返回: None, 类型: <class 'NoneType'>

变量是 None
处理数据(无参数): ['processed']
处理数据(有参数): [1, 2, 3, 'processed']


## 数据类型转换

Python 提供了内置函数用于在不同数据类型之间转换。

In [18]:
# 数据类型转换示例

# 转换为整数
print("转换为整数:")
print(f"int(3.14) = {int(3.14)}")
print(f"int('123') = {int('123')}")
print(f"int(True) = {int(True)}")
print(f"int(False) = {int(False)}")
print()

# 转换为浮点数
print("转换为浮点数:")
print(f"float(10) = {float(10)}")
print(f"float('3.14') = {float('3.14')}")
print(f"float(True) = {float(True)}")
print()

# 转换为字符串
print("转换为字符串:")
print(f"str(123) = '{str(123)}', 类型: {type(str(123))}")
print(f"str(3.14) = '{str(3.14)}'")
print(f"str(True) = '{str(True)}'")
print(f"str([1, 2, 3]) = '{str([1, 2, 3])}'")
print()

# 转换为布尔值
print("转换为布尔值:")
print(f"bool(0) = {bool(0)}")
print(f"bool(1) = {bool(1)}")
print(f"bool('') = {bool('')}")
print(f"bool('hello') = {bool('hello')}")
print(f"bool([]) = {bool([])}")
print(f"bool([1, 2]) = {bool([1, 2])}")
print()

# 转换为列表
print("转换为列表:")
print(f"list('hello') = {list('hello')}")
print(f"list((1, 2, 3)) = {list((1, 2, 3))}")
print(f"list({{1, 2, 3}}) = {list({1, 2, 3})}")
print(f"list({{'a': 1, 'b': 2}}) = {list({'a': 1, 'b': 2})}")  # 只获取键
print()

# 转换为元组
print("转换为元组:")
print(f"tuple([1, 2, 3]) = {tuple([1, 2, 3])}")
print(f"tuple('hello') = {tuple('hello')}")
print()

# 转换为集合
print("转换为集合:")
print(f"set([1, 2, 2, 3, 3, 3]) = {set([1, 2, 2, 3, 3, 3])}")  # 自动去重
print(f"set('hello') = {set('hello')}")
print()

# 转换为字典
print("转换为字典:")
# 需要可迭代的键值对
pairs = [('a', 1), ('b', 2), ('c', 3)]
print(f"dict({pairs}) = {dict(pairs)}")

转换为整数:
int(3.14) = 3
int('123') = 123
int(True) = 1
int(False) = 0

转换为浮点数:
float(10) = 10.0
float('3.14') = 3.14
float(True) = 1.0

转换为字符串:
str(123) = '123', 类型: <class 'str'>
str(3.14) = '3.14'
str(True) = 'True'
str([1, 2, 3]) = '[1, 2, 3]'

转换为布尔值:
bool(0) = False
bool(1) = True
bool('') = False
bool('hello') = True
bool([]) = False
bool([1, 2]) = True

转换为列表:
list('hello') = ['h', 'e', 'l', 'l', 'o']
list((1, 2, 3)) = [1, 2, 3]
list({1, 2, 3}) = [1, 2, 3]
list({'a': 1, 'b': 2}) = ['a', 'b']

转换为元组:
tuple([1, 2, 3]) = (1, 2, 3)
tuple('hello') = ('h', 'e', 'l', 'l', 'o')

转换为集合:
set([1, 2, 2, 3, 3, 3]) = {1, 2, 3}
set('hello') = {'l', 'e', 'o', 'h'}

转换为字典:
dict([('a', 1), ('b', 2), ('c', 3)]) = {'a': 1, 'b': 2, 'c': 3}


## 总结

Python 提供了丰富的数据类型，每种类型都有其特定的用途和特性：

- **数字类型**：用于数值计算
- **字符串**：用于文本处理
- **列表**：有序、可变序列
- **元组**：有序、不可变序列
- **字典**：键值对映射
- **集合**：无序、不重复元素集合
- **布尔类型**：逻辑值
- **None 类型**：空值表示

理解这些数据类型及其特性对于编写高效的 Python 代码至关重要。