# 1. 均匀任务调度
- K个计算节点，每个节点当前负载数T，每个节点cpu核心数C，一个cpu核心的最大负载数200；
- 节点总负载数=节点cpu核心数*200=200C；
- 节点的cpu负载=节点当前负载数/节点总负载数；

由于节点容易宕机，需要设计调度算法，将宕机节点的负载均匀分配到其他节点上，使得所有节点的cpu负载保持一致。给定宕机节点的负载数N，求每个节点应该新增的负载数。

若宕机节点的负载数超出了所有节点总负载数，不进行重新分配，每个节点新增任务数为0。

输入描述：
- N: 宕机节点的负载数
- K: 计算节点数
- C: 每个节点cpu核心数
- T: 每个节点当前负载数

输出描述：
- 每个节点应该新增的负载数 [x1, x2, ..., xk]


In [1]:
N1=1180
K1=3
C1=[45,28,45]
T1=[6750,4200,6750]

N2=500
K2=3
C2=[2,2,2]
T2=[200,300,400]

# 新的测试用例
N3 = 11
K3 = 2
C3 = [1, 1]
T3 = [50, 50]

In [14]:
# original code
def distribution_load(N,K,C,T):
    max_load = [c*200 for c in C] # 每个节点最大负载数
    total_capacity = sum(max_load) # 所有节点总负载能力
    current_total_load = sum(T) # 所有节点当前负载数
    
    print(f'max_load={max_load}, total_capacity={total_capacity}, current_total_load={current_total_load}')
    print(f'capacity_needed={current_total_load+N}' )
    
    if current_total_load+N > total_capacity: # 宕机节点的负载数超出了所有节点总负载数
        print('capacity_needed > total_capacity')
        return [0]*K
    
    # 平均分配到每个节点的负载数
    total_load_after_distribution = current_total_load + N # 所有节点重新分配后的总负载数
    average_load = total_load_after_distribution / sum(C) # 平均每个核心的负载数
    
    addtional_load = [0]*K # 每个节点应该新增的负载数
    for i in range(K):
        addtional_load[i] = int(average_load * C[i] - T[i]) # 节点i应该新增的负载数=每个节点分配后的平均负载数-节点当前负载数=每个核心平均负载数*核心数-节点当前负载数
            
    return addtional_load

print(distribution_load(N1,K1,C1,T1))
print(distribution_load(N2,K2,C2,T2))
print(distribution_load(N3,K3,C3,T3)) # 正确输出为[6, 5]，这里为[5, 5]，少了一个负载

max_load=[9000, 5600, 9000], total_capacity=23600, current_total_load=17700
capacity_needed=18880
[450, 280, 450]
max_load=[400, 400, 400], total_capacity=1200, current_total_load=900
capacity_needed=1400
capacity_needed > total_capacity
[0, 0, 0]
max_load=[200, 200], total_capacity=400, current_total_load=100
capacity_needed=111
[5, 5]


上面代码大多情况没问题，但由于`addtional_load[i] = int(average_load * C[i] - T[i])`，会导致出现小数的时候负载直接被省略，导致最终分配后总负载没有达到需求。
下面代码考虑了出现小数时候的情况，并在最终分配时，按照小数部分大小，将剩余负载分配给对应节点。

In [31]:
def distribution_load(N, K, C, T):
    max_load = [c * 200 for c in C]  # 每个节点最大负载数
    total_capacity = sum(max_load)  # 所有节点总负载能力
    current_total_load = sum(T)  # 所有节点当前负载数

    if current_total_load + N > total_capacity:  # 宕机节点的负载数超出了所有节点总负载数
        return [0] * K

    # 计算分配后平均每个核心的负载数
    average_load_per_core = (current_total_load + N) / sum(C)
    # 计算每个节点需要达到的总负载数（含小数部分）
    target_load = [average_load_per_core * c for c in C]
    # 计算每个节点需要增加的负载数（含小数部分）
    additional_load_float = [target - t for target, t in zip(target_load, T)]
    # 取每个节点需要增加的负载数的整数部分
    additional_load_int = [int(x) for x in additional_load_float]
    # 计算已分配的负载总和
    total_assigned = sum(additional_load_int)
    # 计算剩余需要分配的负载单位
    remaining = int(round(N - total_assigned))
    
    print(f'additional_load_float={additional_load_float}, additional_load_int={additional_load_int}, total_assigned={total_assigned}, remaining={remaining}')

    # 计算每个节点需要增加的负载数的小数部分和对应的索引
    fractional_parts = [(x - int(x), i) for i, x in enumerate(additional_load_float)]
    print(f'fractional_parts={fractional_parts}')
    # 按小数部分从大到小排序，如果小数部分相同，索引小的节点优先
    fractional_parts.sort(key=lambda x: (-x[0], x[1])) # -x[0]表示对第一个元素即小数部分降序排序，x[1]表示对第二个元素即索引升序排序
    print(f'fractional_parts_sorted={fractional_parts}')

    # 依次将剩余的负载单位分配给小数部分最大的节点
    # fractional_parts[i][1]=第i个元素的第1个元素，这里为第i个元素的idx
    for i in range(remaining): 
        idx = fractional_parts[i % K][1]  # i一定从0开始，则第一个循环idx一定为fractional_parts[0][1]，即小数部分最大的节点，然后依次按照排序后的顺序分配
        additional_load_int[idx] += 1

    return additional_load_int


print(distribution_load(N1,K1,C1,T1))
print(distribution_load(N2,K2,C2,T2))
print(distribution_load(N3,K3,C3,T3)) # 正确输出为[6, 5]，这里为[6, 5]，正确输出了

additional_load_float=[450.0, 280.0, 450.0], additional_load_int=[450, 280, 450], total_assigned=1180, remaining=0
fractional_parts=[(0.0, 0), (0.0, 1), (0.0, 2)]
fractional_parts_sorted=[(0.0, 0), (0.0, 1), (0.0, 2)]
[450, 280, 450]
[0, 0, 0]
additional_load_float=[5.5, 5.5], additional_load_int=[5, 5], total_assigned=10, remaining=1
fractional_parts=[(0.5, 0), (0.5, 1)]
fractional_parts_sorted=[(0.5, 0), (0.5, 1)]
[6, 5]


我们希望将剩余的负载单位分配给那些最“需要”它们的节点。小数部分越大的节点，表示其实际需要的负载数越接近下一个整数，因此优先分配给它们，可以使负载更均衡。
当平均分配后出现小数部分，先分配整数部分，然后将所有小数部分加和，得到剩余的负载单位，按照小数部分从大到小排序，将剩余的负载单位依次分配给小数部分最大的节点。（通过对小数部分排序实现）

# 2.切换工作目录
Linux系统绝对路径是从根目录开始的完整路径，即以‘/’开头，相对路径是从当前工作目录开始的路径，以‘.'或者‘..’开头。某用户用’cd 相对路径'命令切换工作目录，输出命令后的工作目录。

输入描述：
- 第一行：当前工作目录绝对路径
- 第二行：切换工作目录命令

输出描述：
- 第一行：切换工作目录后的绝对路径 最简洁格式
- 第二行：执行命令过程中经过的最深目录层级数


In [48]:
current_path1='/home/hello'
command1='cd .././/world' 
# 执行 '..'返回上一级目录，路径从 /home/hello 变为 /home。
# 忽略 '.' 和 '//','//'在linux等同于‘/’，即‘/world’表示进入home下的world目录。
# 最终路径为 /home/world，最深目录层级数为2

current_path2='/home/hello'
command2='cd world/.../../.'
# 进入 world 目录，路径从 /home/hello 变为 /home/hello/world。
# 进入 world 下的 ... 目录，路径从 /home/hello/world 变为 /home/hello/world/...
# ‘..’表示返回到 world 目录。路径从 /home/hello/world/... 变为 /home/hello/world
# .表示不进行操作。最终路径为 /home/hello/world，最深目录层级数为4

In [49]:
def simplify_path(path):
    stack = [] # 用于存储有效路径
    parts = path.split('/')
    
    for part in parts:
        if part == '' or part == '.': # 忽略空路径和当前路径
            continue
        elif part == '..': # 将原路径的‘..’（返回上一级目录）执行，并删去对应路径内容
            if stack:
                stack.pop() # 删除最后一个路径
        else:
            stack.append(part)
    
    return '/' + '/'.join(stack) # /绝对路径+有效路径（将有效路径用‘/’连接）得到最终路径


def process_cd_command(current_path, cd_command):
    commands = cd_command.split('/')
    path = current_path
    deepest_level = path.count('/')  # 记录当前路径的最大深度
    traversed_paths = []
    
    for command in commands:
        if command == '' or command == '.':
            continue
        elif command == '..': # 当命令是返回上一级目录
            # 返回上一级目录，除非已经在根目录
            if path != '/':
                path = '/'.join(path.split('/')[:-1]) # 从根目录开始，去掉最后一个目录
                if path == '':  # 如果路径变为空，表示已经回到根目录
                    path = '/'
        else: # 当命令是进入新目录
            if path == '/': # 如果原路径是根目录，直接输出/ + command路径为新路径
                path = f"/{command}"
            else:   # 否则，原路径+command路径为新路径
                path = f"{path}/{command}"
        
        # 追踪遍历过的路径并更新最大深度
        traversed_paths.append(path) # 记录遍历过的路径
        current_depth = path.count('/')
        deepest_level = max(deepest_level, current_depth) # 更新最大深度
    
    print(path)
    simplified_path = simplify_path(path)
    print(simplified_path)
    return simplified_path, deepest_level


current_path1=current_path1.strip()
command1=command1.strip()[3:]

current_path2=current_path2.strip()
command2=command2.strip()[3:]


print(process_cd_command(current_path1, command1))
print(process_cd_command(current_path2, command2))

/home/world
/home/world
('/home/world', 2)
/home/hello/world
/home/hello/world
('/home/hello/world', 4)


# 3. 最大带宽
输入：
- n: 交换机数量
- ports: 每台交换机的端口数
- bandwidths: 每台交换机的端口带宽
- k: 可以选择的交换机数量

输出：
- 最大带宽=端口总数*所有交换机的最小带宽

### 1. 暴力枚举
- 遍历所有可能的交换机组合，计算每个组合的带宽值，找到最大的带宽值。
- 时间复杂度：O(C(n, k)*k)，其中 C(n, k) 是从 n 个元素中选择 k 个元素的组合数,k表示对于每个组合，计算端口总数和最小带宽的时间复杂度。

In [90]:
from itertools import combinations


def max_bandwidth(n, ports, bandwidths, k):
    max_value = 0
    # 遍历所有可能选择的k台交换机组合
    for combo in combinations(range(n), k):
        # combo为k个交换机的索引组合，比如[(0, 1), (0, 2), (1, 2)],这是n=3, k=2的情况
        # 计算端口总数和最小带宽
        total_ports = sum(ports[i] for i in combo) # 第一次循环，combo=(0, 1)，这里为total_ports=ports[0]+ports[1]
        min_bandwidth = min(bandwidths[i] for i in combo) # 第一次循环，combo=(0, 1)，这里为min_bandwidth=min(bandwidths[0], bandwidths[1])
        # 计算当前组合的带宽值
        current_value = total_ports * min_bandwidth
        # 更新最大带宽值
        max_value = max(max_value, current_value)
    
    # 考虑单台交换机带宽最大值
    for i in range(n):
        single_switch_value = ports[i] * bandwidths[i]
        max_value = max(max_value, single_switch_value)

    return max_value

# 测试用例
n1 = 6
ports1 = [20, 100, 30, 10, 50, 80]
bandwidths1 = [50, 40, 30, 90, 70, 20]
k1 = 2

n2 = 5
ports2=[100, 20, 50, 50, 80]
bandwidths2 = [100, 10, 20, 20, 20]
k2 = 3


print(max_bandwidth(n1, ports1, bandwidths1, k1))
print('\n')
print(max_bandwidth(n2, ports2, bandwidths2, k2))

n3=7
ports3 = [100,80,70,60,50,40,30]
bandwidths3=[10,20,25,30,35,40,80]
k3=3
print(max_bandwidth(n3, ports3, bandwidths3, k3)) 

6000


10000
4500


### 2. 贪心算法
- 在每个可能的最小带宽值下，只选择端口数最大的前k 台交换机，可能无法找到全局最优解。
- 时间复杂度：O(nlogn*m)，其中 n 是交换机数量,m是不同的带宽值数量

In [89]:
def max_bandwidth(n, ports, bandwidths, k):
    # 配对端口数和带宽
    switches = list(zip(ports, bandwidths))
    
    # 按带宽降序排序
    unique_bandwidths = sorted(set(bandwidths), reverse=True)
    
    print(f'switches={switches}, unique_bandwidths={unique_bandwidths}')
    
    max_total_bandwidth = 0
    best_combination = []
    
    # 从大到小遍历带宽值，为了找出最优带宽和端口组合
    for b in unique_bandwidths: 
        eligible_switches = [s for s in switches if s[1] >= b] # 选择带宽不小于当前带宽值的交换机
        eligible_switches.sort(key=lambda x: (x[0], x[1]), reverse=True) # 按端口数降序排序,如果端口数相同，按带宽降序排序
        
        selected_switches = eligible_switches[:k] # 选择排序后的组合中的前k个
        total_ports = sum(s[0] for s in selected_switches) # 计算总端口数
        min_bandwidth = min(s[1] for s in selected_switches) # 计算当前最小带宽
        current_bandwidth = total_ports * min_bandwidth # 计算当前带宽

        if current_bandwidth > max_total_bandwidth: # 如果当前带宽大于最大带宽
            max_total_bandwidth = current_bandwidth  # 更新最大带宽值
            best_combination = selected_switches.copy()  # 保存对应的组合
    
    return max_total_bandwidth, best_combination

# Test case 1
n1 = 6
ports1 = [20, 100, 30, 10, 50, 80]
bandwidths1 = [50, 40, 30, 90, 70, 20]
k1 = 2
print(max_bandwidth(n1, ports1, bandwidths1, k1))  # Output: 6000

# Test case 2
n2 = 5
ports2 = [100, 20, 50, 50, 80]
bandwidths2 = [100, 10, 20, 20, 20]
k2 = 3
print(max_bandwidth(n2, ports2, bandwidths2, k2))  # Output: 10000

n3=7
ports3 = [100,80,70,60,50,40,30]
bandwidths3=[10,20,25,30,35,40,80]
k3=3
print(max_bandwidth(n3, ports3, bandwidths3, k3))  


switches=[(20, 50), (100, 40), (30, 30), (10, 90), (50, 70), (80, 20)], unique_bandwidths=[90, 70, 50, 40, 30, 20]
(6000, [(100, 40), (50, 70)])
switches=[(100, 100), (20, 10), (50, 20), (50, 20), (80, 20)], unique_bandwidths=[100, 20, 10]
(10000, [(100, 100)])
switches=[(100, 10), (80, 20), (70, 25), (60, 30), (50, 35), (40, 40), (30, 80)], unique_bandwidths=[80, 40, 35, 30, 25, 20, 10]
(4500, [(60, 30), (50, 35), (40, 40)])


- 代码的核心思路是枚举所有可能的最小带宽值，对于每个带宽值，找到带宽不小于该值的交换机组合，使得总带宽最大。
- 通过排序和筛选，优先选择端口数最多的交换机。
- 最终，找到使总带宽最大的交换机组合。

**为什么要从大到小遍历带宽值？**

1. **覆盖所有可能的最小带宽值**：

   - 我们的问题是要选择最多 \( k \) 台交换机，使得**端口总数乘以最小带宽**的值最大。
   - 最小带宽在计算总带宽时起着关键作用，因此我们需要考虑所有可能的最小带宽值。

2. **保证找到最优解**：

   - 从大的带宽值开始遍历，可以优先考虑高带宽的交换机组合。
   - 高带宽虽然可能对应的交换机数量少，但如果端口总数足够大，可能直接得到最大总带宽。

3. **逐步放宽带宽限制**：

   - 当以较高的带宽值开始时，符合条件的交换机可能较少。
   - 随着带宽值的降低，符合条件的交换机增多，我们可以选择更多的交换机来增加端口总数，但最小带宽也会降低。
   - 这种方式可以在高带宽和大端口总数之间找到最佳平衡。