# collections.Counter - 频率统计神器
- 自动统计元素出现次数
- 访问不存在的key返回0，不报错
- most_common() 快速找Top K
- 支持数学运算 +、-、&、|


In [None]:
from collections import Counter

# Counter基本用法
arr = [1, 2, 2, 3, 3, 3]
counter = Counter(arr)
print("计数:", counter)
print("最常见的2个:", counter.most_common(2))
print("访问不存在的key:", counter[5])  # 返回0，不报错

# 判断异位词
def is_anagram(s, t):
    return Counter(s) == Counter(t)
print("异位词:", is_anagram("listen", "silent"))


=== Counter 基本用法演示 ===
数组计数: Counter({4: 4, 3: 3, 2: 2, 1: 1})
最常见的3个元素: [(4, 4), (3, 3), (2, 2)]

字符计数: Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, ' ': 1, 'w': 1, 'r': 1, 'd': 1})
字母'l'出现次数: 3
不存在的字母'z'出现次数: 0

异位词判断:
'listen'和'silent': True
'rat'和'car': False

只出现一次的元素: [1, 3, 5]
数组交集: [2, 2]


In [None]:
# set() - 集合基本用法
nums = [1, 2, 2, 3, 3, 4, 5]
my_set = set(nums)  # 自动去重
print("去重后:", my_set)

# 集合运算
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
print("交集:", set1 & set2)
print("并集:", set1 | set2)
print("差集:", set1 - set2)

# 快速判断存在
print("3存在:", 3 in my_set)


=== set() 基本用法演示 ===
原始列表: [1, 2, 2, 3, 3, 4, 5]
转换为集合: {1, 2, 3, 4, 5}

=== 常用操作 ===
添加6后: {1, 2, 3, 4, 5, 6}
删除1后: {2, 3, 4, 5, 6}
尝试删除不存在的10: {2, 3, 4, 5, 6}

集合1: {1, 2, 3, 4}
集合2: {3, 4, 5, 6}
交集 (共同元素): {3, 4}
并集 (所有元素): {1, 2, 3, 4, 5, 6}
差集 (只在set1中): {1, 2}
对称差集 (只在其中一个): {1, 2, 5, 6}
3存在于集合中


In [None]:
# defaultdict vs 普通dict的区别
from collections import defaultdict

print("=== defaultdict vs 普通dict ===")

# 普通dict的问题：访问不存在的key会报错
normal_dict = {}
# print(normal_dict['key'])  # 这会报错 KeyError

# 普通dict的解决方案1：使用get()方法
normal_dict_get = {}
print("使用get()访问不存在的key:", normal_dict_get.get('key', 0))  # 输出: 0，不会报错
print("dict内容:", normal_dict_get)  # 仍然是空字典

# 普通dict的解决方案2：使用get()进行计数
normal_dict_get['count'] = normal_dict_get.get('count', 0) + 1
print("使用get()计数:", normal_dict_get['count'])  # 1

# defaultdict的解决方案：访问不存在的key时自动创建默认值
default_dict = defaultdict(int)  # 默认值是0
print("访问不存在的key:", default_dict['key'])  # 输出: 0
print("dict内容:", dict(default_dict))  # {'key': 0}

# 不同类型的默认值
print("\n=== 不同类型的默认值 ===")

# 默认值为0
int_dict = defaultdict(int)
int_dict['count'] += 1
print("int默认值:", int_dict['count'])  # 1

# 默认值为空列表
list_dict = defaultdict(list)
list_dict['items'].append('apple')
list_dict['items'].append('banana')
print("list默认值:", list_dict['items'])  # ['apple', 'banana']

# 默认值为空集合
set_dict = defaultdict(set)
set_dict['unique'].add('a')
set_dict['unique'].add('b')
print("set默认值:", set_dict['unique'])  # {'a', 'b'}

# 使用lambda自定义默认值
lambda_dict = defaultdict(lambda: 'unknown')
print("自定义默认值:", lambda_dict['name'])  # 'unknown'

# 实际应用场景
print("\n=== 实际应用场景 ===")

# 1. 统计字符出现次数
text = "hello"

# 使用defaultdict
char_count_default = defaultdict(int)
for char in text:
    char_count_default[char] += 1  # 不需要先检查key是否存在
print("defaultdict计数:", dict(char_count_default))

# 使用普通dict + get()
char_count_get = {}
for char in text:
    char_count_get[char] = char_count_get.get(char, 0) + 1  # 使用get()提供默认值
print("普通dict+get()计数:", char_count_get)

# 2. 按首字母分组
words = ["apple", "banana", "cherry", "avocado"]
grouped = defaultdict(list)
for word in words:
    grouped[word[0]].append(word)
print("按首字母分组:", dict(grouped))

# 3. 对比普通dict的繁琐写法
# 普通dict需要这样写：
normal_grouped = {}
for word in words:
    if word[0] not in normal_grouped:
        normal_grouped[word[0]] = []
    normal_grouped[word[0]].append(word)
print("普通dict写法结果:", normal_grouped)

# 注意事项：
# 1. defaultdict的默认值只在访问不存在的key时创建，会自动添加到字典中
# 2. dict.get(key, default)不会修改字典，只是返回默认值
# 3. defaultdict适合需要频繁添加新key的场景
# 4. dict.get()适合只读取不修改的场景


In [None]:
# sorted() vs .sort()
nums = [3, 1, 4, 1, 5, 9, 2, 6]
print("原始列表:", nums)

# .sort() - 原地排序，修改原列表，返回None
nums_copy = nums.copy()
result = nums_copy.sort()
print(".sort()后:", nums_copy)  # 原列表被修改
print(".sort()返回值:", result)  # None

# sorted() - 不修改原列表，返回新的排序列表
nums_copy2 = nums.copy()
sorted_nums = sorted(nums_copy2)
print("sorted()后原列表:", nums_copy2)  # 原列表不变
print("sorted()返回值:", sorted_nums)  # 新的排序列表

# 常用参数
print("升序:", sorted(nums))
print("降序:", sorted(nums, reverse=True))

# key参数
words = ["apple", "pie", "banana", "cherry"]
print("按长度排序:", sorted(words, key=len))

# 注意事项：
# 1. .sort() 只用于列表，sorted() 可用于任何可迭代对象
# 2. .sort() 修改原列表，sorted() 返回新列表
# 3. .sort() 返回None，sorted() 返回排序后的列表


In [None]:
# reversed() - 反转迭代器
nums = [1, 2, 3, 4, 5]
print("原始列表:", nums)
print("转换为列表:", list(reversed(nums)))

# 反转字符串
text = "hello"
print("反转字符串:", ''.join(reversed(text)))

# 与其他方法对比
print("reversed():", list(reversed(nums)))
print("切片[::-1]:", nums[::-1])

# 检查回文
def is_palindrome(text):
    return text == ''.join(reversed(text))
print("'racecar'是回文:", is_palindrome("racecar"))


In [None]:
# join() - 连接字符串
words = ["hello", "world", "python"]
print("用空格连接:", " ".join(words))
print("用逗号连接:", ",".join(words))
print("无分隔符连接:", "".join(words))

# 连接数字（需要先转换为字符串）
numbers = [1, 2, 3, 4, 5]
print("连接数字:", "".join(map(str, numbers)))

# 实际应用
# 构建文件路径
path_parts = ["home", "user", "documents", "file.txt"]
file_path = "/".join(path_parts)
print("文件路径:", file_path)


In [None]:
# sum() + 生成器表达式
s = "hello123world456"
print("原始字符串:", s)

# 基本用法：sum(1 for char in s if char.isdigit())
digit_count = sum(1 for char in s if char.isdigit())
print("数字字符个数:", digit_count)

# 其他例子
text = "Python3 is awesome!"
print(f"'{text}'")

# 统计各种字符类型
digit_count = sum(1 for char in text if char.isdigit())
letter_count = sum(1 for char in text if char.isalpha())
upper_count = sum(1 for char in text if char.isupper())

print("数字个数:", digit_count)
print("字母个数:", letter_count)
print("大写字母个数:", upper_count)

# 统计满足条件的数字
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
even_count = sum(1 for num in numbers if num % 2 == 0)
print("偶数个数:", even_count)


In [None]:
# split() - 分割字符串
text = "apple,banana,cherry"
print("原始字符串:", text)
print("按逗号分割:", text.split(","))
print("按逗号分割，最多2段:", text.split(",", 1))

# 默认按空格分割
sentence = "hello world python"
print("按空格分割:", sentence.split())

# 去除空字符串
data = "a,,b,c,"
print("去除空字符串:", [x for x in data.split(",") if x])

# 注意事项：
# 1. 默认按空白字符分割（空格、制表符、换行符）
# 2. 可以指定分割符和最大分割次数
# 3. 分割结果不包含分割符


In [None]:
# input() - 读取用户输入
# 注意：在Jupyter中input()可能不会正常工作，这里只是演示语法

# 基本用法
# k = int(input())  # 读取一个整数
# s = input()       # 读取一个字符串

# 模拟输入演示
print("模拟：k = int(input())")
k = 5  # 模拟用户输入5
print("k =", k, "类型:", type(k))

print("\n模拟：s = input()")
s = "hello world"  # 模拟用户输入字符串
print("s =", s, "类型:", type(s))

# 常见用法
# 读取多个值
print("\n读取多个值:")
# nums = list(map(int, input().split()))  # 读取一行整数，如：1 2 3 4
nums = [1, 2, 3, 4]  # 模拟输入
print("nums =", nums)

# 读取多个字符串
# words = input().split()  # 读取一行字符串，如：apple banana cherry
words = ["apple", "banana", "cherry"]  # 模拟输入
print("words =", words)

# 注意事项：
# 1. input()返回字符串，需要类型转换
# 2. 在LeetCode等平台中常用这种方式读取输入
# 3. 在Jupyter中通常用变量赋值代替input()
