### Python 基础算法练习（Hadoop + Spark + MySQL + Python）
## <center>4 >>> 面试中的算法题（A）：Python 实战</center>
### <center>算法验证：张君颖  ； 报告日期：2021.1.26</center>
  <font color=blue><center>作者邮箱：zhang.jun.ying@outlook.com</center></font>   
  
  <font color=blue><center>项目源代码、数据、自定义函数已上传GitHub：</center></font>   
    
<font color=blue><center>https://github.com/lotbear/Python-Financial-investment-strategy</center></font>

### >>> 题一：如何判断链表有环
A. 创建一个哈希表，以节点 ID 为 Key，用来存储曾经遍历过的节点，当哈希表中同一 ID 出现第二次时证明有环。（时间复杂度 O（n），空间复杂度 O（n））    

B. 创建两个指针 P1 和 P2，用追击问题求解。P1 每次前进1步，P2每次前进2步，如果链表有环，P2 会与 P1相遇。（时间复杂度 O（n），空间复杂度 O（1））

In [1]:
# 以 B 解题思路实现代码

class Node:
    def __init__(self,data):
        self.data=data
        self.next=None
        
def is_cycle(head):
    P1=head
    P2=head
    while P2 is not None and P2.next is not None:
        P1=P1.next
        P2=P2.next.next
        if P1==P2:
            return True
    return False

In [2]:
node1=Node(5)
node2=Node(3)
node3=Node(7)
node4=Node(2)
node5=Node(6)

node1.next=node2
node2.next=node3
node3.next=node4
node4.next=node5
node5.next=node2

print('链表是否有环？',is_cycle(node1))

链表是否有环？ True


### >>> 题二：实现一个最小栈，带有出栈 pop，入栈 push，取最小元素 get_min，这 3 个功能

需要保证所有功能实现的时间复杂度为 O（1），且出栈操作不影响寻找站内最小元素   

为解决元素出栈后，依然能快速找到最小值，我们需要一个主栈 main_stack，一个辅助栈 min_stack。

In [3]:
class MinStack:
    def __init__(self):
        self.main_stack=[]
        self.min_stack=[]
        
    def push(self,element):
        self.main_stack.append(element)
        # 若辅助栈为空，或新元素的值小于或等于辅助栈栈顶元素的值
        # 将新元素压入辅助栈
        if len(self.min_stack)==0 or element <= self.min_stack[len(self.min_stack)-1]:
            self.min_stack.append(element)
    
    def pop(self):
        # 如果出栈元素和辅助栈栈顶元素的值相等
        # 辅助栈的栈顶元素出栈
        if self.main_stack[len(self.main_stack)-1]==self.min_stack[len(self.min_stack)-1]:
            self.min_stack.pop()
        return self.main_stack.pop()
    
    def get_min(self):
        if len(self.main_stack)==0:
            return None
        return self.min_stack[len(self.min_stack)-1]

In [4]:
my_stack=MinStack()
my_stack.push(4)
my_stack.push(9)
my_stack.push(7)
my_stack.push(3)
my_stack.push(8)
my_stack.push(5)
print('栈中数据：',my_stack.main_stack)
print('栈中最小值：',my_stack.get_min())

栈中数据： [4, 9, 7, 3, 8, 5]
栈中最小值： 3


In [5]:
print('出栈：',my_stack.pop())
print('出栈：',my_stack.pop())
print('出栈：',my_stack.pop())
print('栈中数据：',my_stack.main_stack)
print('栈中最小值：',my_stack.get_min())

出栈： 5
出栈： 8
出栈： 3
栈中数据： [4, 9, 7]
栈中最小值： 4


### >>> 题三：求最大公约数

###  0. 暴力枚举法
两个正整数 a 和 b ( a>b )，若 a%b=0，则最大公约数为 b，否则循环枚举 b//2 至 1的值，使得 a、b可以整除该值

In [6]:
def get_greatest_common_divisor0(a,b):
    big=max(a,b)
    small=min(a,b)
    if big%small==0:
        return small
    for i in range(small//2,1,-1):
        if small%1==0 and big%1==0:
            return i
    return 1

In [7]:
print('25 和 5 最大公约数：',get_greatest_common_divisor0(25,5))
print('13 和 5 最大公约数：',get_greatest_common_divisor0(13,5))
print('3 和 24 最大公约数：',get_greatest_common_divisor0(3,24))

25 和 5 最大公约数： 5
13 和 5 最大公约数： 2
3 和 24 最大公约数： 3


###  1. 辗转相除法
两个正整数 a 和 b ( a>b )，它们的最大公约数等于 a 除以 b 的余数 c 和 b 之间的最大公约数

In [8]:
def get_greatest_common_divisor1(a,b):
    big=max(a,b)
    small=min(a,b)
    if big % small==0:
        return small
    return get_greatest_common_divisor1(big%small,small)

In [9]:
print('25 和 5 最大公约数：',get_greatest_common_divisor1(25,5))
print('13 和 5 最大公约数：',get_greatest_common_divisor1(13,5))
print('3 和 24 最大公约数：',get_greatest_common_divisor1(3,24))

25 和 5 最大公约数： 5
13 和 5 最大公约数： 1
3 和 24 最大公约数： 3


### 2. 更相减损术
两个正整数 a 和 b ( a>b )，它们的最大公约数等于 a-b 的差值 c 和 b 之间的最大公约数

In [10]:
def get_greatest_common_divisor2(a,b):
    if a==b:
        return a
    big=max(a,b)
    small=min(a,b)
    return get_greatest_common_divisor2(big-small,small)

In [11]:
print('25 和 5 最大公约数：',get_greatest_common_divisor2(25,5))
print('13 和 5 最大公约数：',get_greatest_common_divisor2(13,5))
print('3 和 24 最大公约数：',get_greatest_common_divisor2(3,24))

25 和 5 最大公约数： 5
13 和 5 最大公约数： 1
3 和 24 最大公约数： 3


### 3. 将 辗转相除法 + 更相减损术 融合，使用位移运算：     

gcd() = get_greatest_common_divisor()

当 a、b 均为偶数，gcd(a,b)= 2\*gcd(a/2,b/2)= 2\*gcd(a>>1,b>>1)  

当 a 为偶数，b 为奇数，gcd(a,b)= gcd(a/2,b)= gcd(a>>1,b)    

当 a 为奇数，b 为偶数，gcd(a,b)= gcd(a,b/2)= gcd(a,b>>1)    

当 a、b 均为奇数，先利用 更相减损术 运算一次，gcd(a,b)= gcd(b,a-b)，此时 a-b 必然为偶数，再继续用位移运算。   

In [12]:
def get_greatest_common_divisor3(a,b):
    if a==b:
        return a
    # （ a = 偶，b = 偶）
    if (a & 1)==0 and (b & 1)==0:
        return get_greatest_common_divisor3(a>>1,b>>1)<<1
    # （ a = 偶，b = 奇）
    elif (a & 1)==0 and (b & 1)!=0: 
        return get_greatest_common_divisor3(a>>1,b)
    # （ a = 奇，b = 偶）
    elif (a & 1)!=0 and (b & 1)==0: 
        return get_greatest_common_divisor3(a,b>>1)
    # （ a = 奇，b = 奇）
    else:
        big=max(a,b)
        small=min(a,b)
        return get_greatest_common_divisor3(big-small,small)

In [13]:
print('25 和 5 最大公约数：',get_greatest_common_divisor3(25,5))
print('13 和 5 最大公约数：',get_greatest_common_divisor3(13,5))
print('3 和 24 最大公约数：',get_greatest_common_divisor3(3,24))

25 和 5 最大公约数： 5
13 和 5 最大公约数： 1
3 和 24 最大公约数： 3


位移运算：   

x<<y 返回 x 位向左移 y 个位，相当于将 x 乘以 2**y   

x>>y 返回 x 位向右移 y 个位，相当于将 x 除以 2**y   

In [14]:
print('3 << 5 =',3<<5)
print('3*2**5 =',3*2**5)

3 << 5 = 96
3*2**5 = 96


In [15]:
print('5 >> 3 =',5>>3) # 取整
print('5/2**3 =',5/2**3)

5 >> 3 = 0
5/2**3 = 0.625


& 是按位逻辑运算符，比如5 & 6，5和6转换为二进制是101和110，此时101 & 110=100，100转换为十进制是4，所以5 & 6=4

In [16]:
print('5 的二进制:',bin(5))
print('6 的二进制:',bin(6))
print('5 & 6的二进制:',bin(5 & 6))
print('5 & 6 =',5 & 6)

5 的二进制: 0b101
6 的二进制: 0b110
5 & 6的二进制: 0b100
5 & 6 = 4


奇数 & 1= 1   
偶数 & 1= 0

In [17]:
print('5 & 1 =',5 & 1)
print('6 & 1 =',6 & 1)

5 & 1 = 1
6 & 1 = 0


### >>> 题四：如何判断一个数是否是 2 的整数次幂？
如：16 是 2 的 4次方，判断返回 True   

18 是偶数，但不是 2 的整数次幂，判断返回 False  

思路1：创建一个变量 temp 初始值 1，若 temp<= 输入值，则 temp 进入 2的幂次方循环，并将其与输入数值做对比，若相等，输出判断 True，若 temp > 输入值，依然不相等，则输出判断 Flase。    

该方法的时间复杂度为 O（logn）

In [18]:
def is_power_of_2_1(num):
    temp=1
    while temp<=num:
        if temp==num:
            return True
        temp=temp*2
    return False

In [19]:
print('32 是 2 的整数次幂？',is_power_of_2_1(32))
print('66 是 2 的整数次幂？',is_power_of_2_1(66))

32 是 2 的整数次幂？ True
66 是 2 的整数次幂？ False


思路2：如果把 2 的整数次幂转换为二进制数，则它们的共同点为，除首位为 1 其余位为 0，若将所有 2 的整数次幂减 1，则它们所有位上的数值均为 1。此时用原值 n 的二进制数、n-1 后的二进制数，进行位运算 n & (n-1) 是否为 0 即可判断输入值是否为此 2 的整数次方幂。   

该算法的时间复杂度为 O（1）

In [20]:
def is_power_of_2_2(num):
    return ( num & num-1 )==0

In [21]:
print('32 是 2 的整数次幂？',is_power_of_2_2(32))
print('66 是 2 的整数次幂？',is_power_of_2_2(66))

32 是 2 的整数次幂？ True
66 是 2 的整数次幂？ False


### >>> 题五：找出无序数组排序后的最大相邻差
使用桶排序，将原长度为 n 的数组放到 n-1 个桶中，桶之间的跨度为（max_value - min_value）/n-1   

记录每个桶中的最大值和最小值，若桶右侧为空桶，取出该桶的最大值；   

若桶的左侧为空桶，取出桶的最小值；   

用最大值减去最小值，得到相邻值的差值，再对差值取最大值。  

该方法的时间复杂度稳定在 O(n)

In [22]:
class Bucket:
    def __init__(self):
        self.min=None
        self.max=None
        
def get_max_sorted_distance(array=[]):
    # 1. 得到数列的最大值和最小值
    max_value=array[0]
    min_value=array[0]
    for i in range(1,len(array)):
        if array[i]>max_value:
            max_value=array[i]
        if array[i]<min_value:
            min_value=array[i]
    d=max_value-min_value
    # 如果 max_value 和 min_value 相等，说明所有元素相等，返回 0
    if d==0:
        return 0
    print('数组最大值:',max_value)
    print('数组最小值:',min_value)
    print('最大最小差值:',d)
    print('='*35)
    
    # 2. 初始化桶
    bucket_num=len(array)
    buckets=[]
    for i in range(0,bucket_num):
        buckets.append(Bucket())
        
    # 3. 遍历原始数组，确定每个桶的最大值和最小值
    for i in range(0,len(array)):
        # 确定数组元素所归属的桶下标
        index=int((array[i]-min_value)*(bucket_num-1)/d)
        if buckets[index].min is None or buckets[index].min > array[i]:
            buckets[index].min=array[i]
        if buckets[index].max is None or buckets[index].max < array[i]:
            buckets[index].max=array[i]
        print('桶编号:',index,' 最大值:',buckets[index].max,' 最小值:',buckets[index].min)
    print('='*35)
        
    # 4. 遍历桶，找到最大值
    left_max=buckets[0].max
    max_distance=0
    for i in range(1,len(buckets)):
        if buckets[i].min is None:
            continue
        if buckets[i].min-left_max > max_distance:
            max_distance=buckets[i].min-left_max
        left_max=buckets[i].max
    return max_distance

In [23]:
my_array=list([2,6,3,4,10,33,0,-5])
print('排序后相邻两数的最大差值为：',get_max_sorted_distance(my_array))

数组最大值: 33
数组最小值: -5
最大最小差值: 38
桶编号: 1  最大值: 2  最小值: 2
桶编号: 2  最大值: 6  最小值: 6
桶编号: 1  最大值: 3  最小值: 2
桶编号: 1  最大值: 4  最小值: 2
桶编号: 2  最大值: 10  最小值: 6
桶编号: 7  最大值: 33  最小值: 33
桶编号: 0  最大值: 0  最小值: 0
桶编号: 0  最大值: 0  最小值: -5
排序后相邻两数的最大差值为： 23


### >>> 题六：用栈来模拟一个队列，实现入队、出队
思路：栈只能后入先出，而队列是先入先出，要用栈实现队列的功能，需要用两个栈，一个负责入队，一个负责出队，两个栈之间需要关联起来。  

关联方法：用 A 栈负责元素入队，元素依次向栈底靠近，然后再以 pop() 的方式，元素从后往前出 A 栈并入 B 栈，这样元素在栈 B 中的顺序和 A 栈中相反，再利用栈 B 出栈，实现效果上的先入先出。

In [24]:
class StackQueue:
    def __init__(self):
        self.stackA=[]
        self.stackB=[]
    
    def en_queue(self,element):
        self.stackA.append(element)
    
    def de_queue(self):
        if len(self.stackB)==0:
            if len(self.stackA)==0:
                raise Exception('栈已经空了！')
            self.transfer()
        return self.stackB.pop()
    
    def transfer(self):
        while len(self.stackA)>0:
            self.stackB.append(self.stackA.pop())

In [25]:
stack_queue=StackQueue()
stack_queue.en_queue(3)
stack_queue.en_queue(7)
stack_queue.en_queue(21)
stack_queue.en_queue(8)
stack_queue.en_queue(0)
stack_queue.en_queue(-5)
print('A栈:',stack_queue.stackA)
print('B栈:',stack_queue.stackB)

print('='*30)
print('出栈:',stack_queue.de_queue())
print('出栈:',stack_queue.de_queue())
print('A栈:',stack_queue.stackA)
print('B栈:',stack_queue.stackB)

A栈: [3, 7, 21, 8, 0, -5]
B栈: []
出栈: 3
出栈: 7
A栈: []
B栈: [-5, 0, 8, 21]


### >>> 题七：寻找全排列的下一个数
给出一个正整数，对其每个位数上的值进行全排列后，找出仅大于原整数的一个整数。   

如输入：12345，返回：12354  

如输入：12354，返回：12435  

思路：数字全排列的整数中，逆序排序为最大，顺序排列为最小。   

步骤：整数从后向前查看逆序区域，找到逆序区域的前一位，和逆序中大于它的最小数字交换位置，再将原来的逆序区域转为顺序状态。

In [26]:
def find_nearest_number(numbers=[]):
    # 1. 从后向前查看逆序区域，找到逆序区域的前一位
    index=find_transfer_point(numbers)
    # 如果数字置换边界是 0，说明整个数组已经逆序
    # 是全排列中最大整数，返回 null
    if index==0:
        return None
    
    # 2. 把逆序区域的前一位和逆序区域中大于它的最小数字交换位置
    # 复制入参，避免直接修改入参
    numbers_copy=numbers.copy()
    exchange_head(index,numbers_copy)
    
    # 3. 把原来的逆序区域转为顺序
    reverse(index,numbers_copy)
    return numbers_copy

def find_transfer_point(numbers=[]):
    for i in range(len(numbers)-1,0,-1):
        if numbers[i]>numbers[i-1]:
            return i
    return 0

def exchange_head(index,numbers=[]):
    head=numbers[index-1]
    for i in range(len(numbers)-1,0,-1):
        if head<numbers[i]:
            numbers[index-1]=numbers[i]
            numbers[i]=head
            break
    return numbers

def reverse(index,numbers=[]):
    i=index
    j=len(numbers)-1
    while i<j:
        temp=numbers[i]
        numbers[i]=numbers[j]
        numbers[j]=temp
        i+=1
        j-=1
    return numbers

def output_numbers(numbers=[]):
    for i in numbers:
        print(i,end='')
    print()

In [27]:
my_numbers=list([3,5,7,6])
# 打印 3576 之后的 10 个全排列整数
for k in range(0,10):
    my_numbers=find_nearest_number(my_numbers)
    output_numbers(my_numbers)

3657
3675
3756
3765
5367
5376
5637
5673
5736
5763
