哈希

In [None]:
from collections import defaultdict

# defaultdict 会在 key 不存在时，自动用“默认工厂”生成一个默认值
lookup_list = defaultdict(list)   # 默认值：[]
lookup_int = defaultdict(int)     # 默认值：0
lookup_float = defaultdict(float) # 默认值：0.0
lookup_str = defaultdict(str)     # 默认值：'' (空字符串)


In [None]:
# 往 defaultdict 里写入数据（演示：不存在的 key 会自动创建默认值）
for i in range(5):
    lookup_list["a"].append(i)
    lookup_list["b"].append(i)
    lookup_int["b"] += i
    lookup_float["c"] += i * 0.5
    lookup_str["d"] += str(i)

print(lookup_list)

# defaultdict 的遍历方式与 dict 类似：默认遍历 key
for k in lookup_list:
    print(lookup_list[k])

print(type(lookup_list["a"]))  # list
print(lookup_list.values())    # view 对象
print(list(lookup_list.values()))


defaultdict(<class 'list'>, {'a': [0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4], 'b': [0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4]})
[0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4]
[0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4]
<class 'list'>
dict_values([[0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4], [0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4]])
[[0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4], [0, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4]]


In [None]:
# dict 的几种常见创建方式
d = dict(a=1, b=2)
print(d)

d = dict([("a", 1), ("b", 2)])
print(d)

d = {}
print(d)

d = dict()  # 空字典（等价于 {}）

# fromkeys：给定一组 key，统一赋同一个默认 value
d = dict.fromkeys(["a", "b", 1], 0)
print(d)

# dict 的 keys()/values() 返回的是“视图对象”（动态反映字典变化）
values_view = d.values()
keys_view = d.keys()
print(values_view)
print(keys_view)

# tuple：不可变序列
t = ("a", "b", 1)
print(t)

t = tuple(["a", "b", 1])
print(type(t))
print(t)
print(type(t))


{'a': 1, 'b': 2}
{'a': 1, 'b': 2}
{}
{'a': 0, 'b': 0, 1: 0}
dict_values([0, 0, 0])
dict_keys(['a', 'b', 1])
('a', 'b', 1)
<class 'tuple'>
('a', 'b', 1)
<class 'tuple'>


In [None]:
# dict.get(key[, default])：取不到时返回 default（不抛 KeyError）
d = {"a": 1, "b": 2, "c": 3}

print(d.get("a"))        # 1
print(d.get("d", 4))     # key 不存在 -> 返回 4


1
4


In [6]:
a = (1, 2, 3)
b = [4, 5, 6, 1, 2, 3]
print(set(a).issubset(b))  # True
print(set(b))  # True
print(b)
print(type(set(b)))
print(list(set(b)))
print(type(list(set(b))))

True
{1, 2, 3, 4, 5, 6}
[4, 5, 6, 1, 2, 3]
<class 'set'>
[1, 2, 3, 4, 5, 6]
<class 'list'>


- **tuple** 是不可变的，无法进行增删改操作。  
- **set** 的底层实现也是哈希表，元素无序，不能通过索引访问。  
- 哈希表的底层一般由 **数组 +（链表或其他结构）+ 哈希函数** 构成。  
- 通过计算哈希值可以快速定位数据位置，理想情况下时间复杂度为 **O(1)**。  
- 但可能发生哈希冲突，通常通过 **探测（开放寻址）** 或 **链表（链地址法）** 等方式处理冲突。  
- **SHA-256** 在实践中几乎可以唯一标识一份数据。  


In [None]:
# 哈希表常见应用：两数之和
def two_sum(nums, target):
    """
    使用哈希表解决两数之和问题
    时间复杂度: O(n)
    空间复杂度: O(n)
    """
    hash_map = {}
    for i, num in enumerate(nums):
        complement = target - num
        if complement in hash_map:
            return [hash_map[complement], i]
        hash_map[num] = i
    return []

# 测试
nums = [2, 7, 11, 15]
target = 9
result = two_sum(nums, target)
print(f"两数之和结果: {result}")  # [0, 1]
print(f"验证: {nums[result[0]]} + {nums[result[1]]} = {target}")