栈（有时称为“下压栈push-down stack”）是一种有序的元素集合，新元素的添加和已有元素的移除都始终在同一端进行。这一端通常被称为“栈顶”。与栈顶相对的另一端则被称为“栈底”。

栈底很重要，因为存储在栈中且离栈底较近的元素是那些在栈中存在时间最长的。最近添加的元素是最先被移除的。这种排序原则有时被称为后进先出（last-in first-out）。它基于元素在集合中的存在时间提供了一种排序方式。较新的元素靠近栈顶，而较旧的元素靠近栈底。

栈抽象数据类型由以下结构和操作定义。如上所述，栈是一种有序的元素集合，元素的添加和移除都在称为“栈顶”的一端进行。栈是按后进先出（LIFO）顺序排列的。栈的操作如下。

- Stack()：创建一个新的空栈。它不需要参数，并返回一个空栈。
- push(item)：向栈顶添加一个新元素。它需要该元素，且不返回任何值。
- pop()：从栈中移除顶部元素。它不需要参数，并返回该元素。栈会被修改。
- peek()：返回栈顶元素但不将其移除。它不需要参数。栈不会被修改。
- isEmpty()：用于测试栈是否为空。它不需要参数，并返回一个布尔值。
- size()：返回栈中的项目数量。它不需要参数，返回一个整数。

| Stack Operation | 栈内容          | 返回值  |
|-----------------|-----------------|---------|
| s.isEmpty()     | []              | True    |
| s.push(4)       | [4]             |         |
| s.push('dog')   | [4,'dog']       |         |
| s.peek()        | [4,'dog']       | 'dog'   |
| s.push(True)    | [4,'dog',True]  |         |
| s.size()        | [4,'dog',True]  | 3       |
| s.isEmpty()     | [4,'dog',True]  | False   |
| s.push(8.4)     | [4,'dog',True,8.4] |      |
| s.pop()         | [4,'dog',True]  | 8.4     |
| s.pop()         | [4,'dog']       | True    |
| s.size()        | [4,'dog']       | 2       |

既然我们已经将栈明确定义为一种抽象数据类型，接下来我们就将注意力转向使用Python来实现栈。回想一下，当我们为一种抽象数据类型提供物理实现时，我们将这种实现称为数据结构。

在Python中，就像在任何面向对象编程语言中一样，对于栈这样的抽象数据类型，其实现方式是创建一个新的类。栈操作被实现为方法。此外，为了实现作为元素集合的栈，利用Python提供的基本集合的强大功能和简洁性是合理的。我们将使用列表。


In [1]:
class Stack():
    def __init__(self):
        self.items = []
    
    def isEmpty(self):
        return self.items == []

    def push(self, item):
        self.items.append(item)

    def pop(self):
        return self.items.pop()

    def peek(self):
        return self.items[len(self.items) - 1]

    def size(self):
        return len(self.items)

In [4]:
s = Stack()
# 接下来把上面表格的示例都来实现一遍，自己敲一遍才有感觉
# 不过我选择这一个作业题：编写一个函数revstring(mystr)，该函数使用栈来反转字符串中的字符
def revstring(mystr):
    s1 = Stack()
    s2 = ""
    for i in mystr:
        s1.push(i)
    while not s1.isEmpty():
        # s2.append(s1.pop())
        s2 += s1.pop() # string没有append，只有+=
    return s2
     # 测试
revstring("hello")

'olleh'

### 平衡括号问题
接下来的挑战是编写一个算法，该算法将从左到右读取一个括号字符串，并判断这些符号是否平衡。

平衡括号指的是每个左括号都有一个对应的右括号，且括号对是正确嵌套的。

要解决这个问题，当你从左到右处理这些符号时，最近出现的左括号必须与下一个右符号相匹配。此外，第一个被处理的左符号可能要等到最后一个符号才能与之匹配。右符号与左符号的匹配顺序与它们出现的顺序相反，是从内向外进行匹配的。

一旦确定栈是用于存储括号的合适数据结构，该算法的描述就变得简单明了。从一个空栈开始，从左到右处理括号字符串。如果遇到的符号是左括号，就将其压入栈中，以此作为后续需要出现对应右括号的信号。另一方面，如果遇到的符号是右括号，就弹出栈顶元素。只要能够通过弹出栈顶元素来匹配每个右括号，这些括号就是平衡的。如果在任何时候，栈中没有左括号来匹配某个右括号，那么该字符串的括号就没有正确平衡。当字符串处理完毕，即所有符号都已被处理后，栈应该是空的

In [10]:
def parChecker(symbolString):
    s = Stack()
    for i in symbolString:
        if i == "(":
            s.push(i)
        elif i == ")":
            if s.isEmpty():  #
                return False #加这两行就可以解决) > (的情况

            s.pop()
    
    return s.isEmpty()
    # 不平衡证明栈非空

print(parChecker('((()))'))
print(parChecker('())'))

# 对于多括号的情况，如`{ { ( [ ] [ ] ) } ( ) }`
# 直观来说，把上面的判断逻辑重复三遍就行，造3个栈
# 但是还是得优雅一点考虑下复杂度
def parCheckerM(symbolString):
    s = Stack()
    for i in symbolString:
        if i in f"([{{":
            s.push(i)
        elif i in f")]}}":  # 注意f-string里花括号要用两个表示一个
            if s.isEmpty():
                return False
            s.pop()
    
    return s.isEmpty()

print(parCheckerM('{({([][])}())}'))
print(parCheckerM('[{()]'))

True
False
True
False


### 数制转换问题
如何轻松地将整数值转换为二进制数呢？答案是一种名为“除以2”（Divide by 2）的算法，它使用栈来记录二进制结果的数字
除以2算法假设我们从一个大于0的整数开始。然后通过简单的迭代不断将这个十进制数除以2，并记录余数。第一次除以2可以确定该数值是偶数还是奇数。偶数的余数为0，其个位数字是0；奇数的余数为1，其个位数字是1。我们可以把二进制数看作是一个数字序列，而计算出的第一个余数实际上是这个序列的最后一位数字。
![](/img/python/d2b-conversion.png)

In [15]:
def divideBy2(decimal):
    # 这里还需要再加一个判断，当decimal为0时，直接返回"0"
    # 不过我懒
    s = Stack()
    while decimal > 0:
        s.push(decimal % 2)    # 将余数压入栈
        decimal = decimal // 2
        # %：取余运算符，返回除法的余数
        # //：取整运算符，返回除法的整数部分
        # /：普通除法运算符，返回除法的浮点数结果

    res = ""
    while not s.isEmpty():
        res += str(s.pop())
    return res

divideBy2(10)

'1010'

In [18]:
# 函数divideBy2可以修改为不仅接受十进制值，还能接受目标转换的基数。“除以2”的思路被更通用的“除以基数”所取代。
# 2到10进制的数最多需要10个数字，所以常规的数字字符0、1、2、3、4、5、6、7、8和9完全适用。当基数超过10时，问题就出现了。我们不能再简单地使用余数了，因为此时的余数本身会用两位十进制数来表示。相反，我们需要创建一组数字来表示那些大于9的余数
def baseConverter(decimal, base):
    s = Stack()
    
    digits = "0123456789ABCDEF"
    # 当余数大于等于10时，需要用字母来表示
    # 所以我们用一个字符串来存储所有可能的字符
    # 当需要表示一个大于等于10的余数时，我们就从这个字符串中取出对应的字符
    res = ""
    while decimal > 0:
        s.push(decimal % base)    # 将余数压入栈
        decimal = decimal // base
    while not s.isEmpty():
        res += digits[s.pop()]   # 从栈中弹出余数，并根据digits字符串中的对应字符，将其添加到结果字符串中
    return res

# baseConverter(108, 29)
# 上面会报错，因为我们定义的digits最高只能到16进制，而108的29进制表示为34
# 所以我们需要扩展digits字符串，包含从10到35的所有字符

### 中缀、前缀、后缀表达式
| Infix Expression（中缀表达式） | Prefix Expression（前缀表达式） | Postfix Expression（后缀表达式） |
|-------------------------------|--------------------------------|---------------------------------|
| A + B                         | + A B                          | A B +                           |
| A + B * C                     | + A * B C                      | A B C * +                       |
| (A + B) * C                   | * + A B C                      | A B + C *                       |
| A + B * C + D                 | + + A * B C D                  | A B C * + D +                   |
| (A + B) * (C + D)             | * + A B + C D                  | A B + C D + *                   |
| A * B + C * D                 | + * A B * C D                  | A B * C D * +                   |
| A + B + C + D                 | + + + A B C D                  | A B + C + D +                   |

![](/img/python/infix2prefix-postfix.png)

假设中缀表达式是一个由空格分隔的标记字符串。运算符标记包括`*`、`/`、`+`、`-`，以及左括号`(`和右括号`)`。操作数标记是单字符标识符，如A、B、C等。以下步骤将生成后缀顺序的标记字符串。

1. 创建一个名为opstack的空栈来保存运算符。创建一个空列表用于输出。
2. 使用字符串方法split将输入的中缀字符串转换为列表。
3. 从左到右扫描令牌列表。
4. 如果该标记是操作数，则将其追加到输出列表的末尾。
5. 如果该标记是左括号，则将其压入opstack。
6. 如果该标记是右括号，则弹出操作栈，直到对应的左括号被移除。将每个运算符追加到输出列表的末尾。
7. 如果该标记是运算符（`*`、`/`、`+` 或 `-`），则将其压入opstack。但首先要移除opstack中已有的任何优先级更高或相等的运算符，并将它们添加到输出列表中。
8. 当输入表达式被完全处理后，检查opstack。栈中仍存在的任何运算符都可以被移除并添加到输出列表的末尾。

In [33]:
def infix2postfix(input):
    # 定义运算符的优先级
    precedence = {"+": 1, "-": 1, "*": 2, "/": 2, "^": 3}
    opstack = Stack()
    result = []

    for i in input:
        if i == " ": # 空格害人不浅啊
            continue
        if i in "QWERTYUIOPASDFGHJKLZXCVBNM1234567890":
            result.append(i)
        else:
            while not opstack.isEmpty() and precedence[opstack.peek()] >= precedence[i]:
            # 栈顶优先级比你大那就弹出来
                result.append(opstack.pop())
            opstack.push(i)
    
    while not opstack.isEmpty():
        result.append(opstack.pop())
        # 循环结束后，栈中可能还有未弹出的运算符，将它们全部弹出并添加到结果列表中

    # return result        # 这样返回的是一个列表
    return "".join(result) # 这样才能返回一个str，但我的空格没了


infix2postfix("A * B + C * D")

# 然后我们再在这基础上考虑括号的情况，毕竟不能一口吃成一个胖子

def infix2postfix1(input):
    precedence = {"+": 1, "-": 1, "*": 2, "/": 2, "^": 3}
    opstack = Stack()
    result = []

    for i in input:
        if i == " ":
            continue
        if i in "QWERTYUIOPASDFGHJKLZXCVBNM1234567890":
            result.append(i)

        elif i == "(":
            opstack.push(i)
        elif i == ")":
            while not opstack.isEmpty() and opstack.peek() != "(":
                result.append(opstack.pop())
            opstack.pop() # 弹出左括号

        else:
            while (not opstack.isEmpty() and
                precedence.get(opstack.peek(), 0) >= precedence[i]):
                # 这一句话害惨我了，运算符优先级字典里咩有定义左右括号所以这里报错
                # 所以这里用 get 方法来获取优先级，默认值为 0
                # opstack.peek() != "("): # 多重左括号的时候才会需要这样写
                
                result.append(opstack.pop())
            opstack.push(i)
    
    while not opstack.isEmpty():
        result.append(opstack.pop())

    return "".join(result)

infix2postfix1("( A + B ) * C - ( D - E ) * ( F + G )")

'AB+C*DE-FG+*-'

| 关键字符 | 操作 | 栈状态 | 结果列表（核心片段） |
|----------|------|--------|----------------------|
| (        | 压栈 | ['(']  | []                   |
| A        | 加入结果 | ['(']  | ['A']                |
| +        | 压栈 | ['(', '+'] | ['A']             |
| B        | 加入结果 | ['(', '+'] | ['A','B']        |
| )        | 弹出 + → 弹出 ( | [] | ['A','B','+']      |
| *        | 压栈 | ['*']  | ['A','B','+']        |
| C        | 加入结果 | ['*']  | ['A','B','+','C']    |
| -        | 弹出 * → 压栈 - | ['-'] | ['A','B','+','C','*'] |
| ...（后续括号逻辑同理） | ... | ... | ... |
| 最终弹出剩余运算符 | 弹出 - | [] | ['A','B','+','C','*','D','E','-','F','G','+','*','-'] |

除了凹造型之外，还要考虑货真价实的逆波兰表达式求值问题
这个比较烦人了，我记得学C的时候最难搞的就是多位数、负数等鲁棒性处理
1. 创建一个名为opstack的空栈来保存操作数。
2. 使用字符串方法split()将输入的后缀字符串转换为标记（token）列表（split()默认按任意空格分割，兼容多个空格的情况）。
3. 从左到右扫描令牌列表中的每个标记：
   - 若该标记是运算符（仅*、/、+、-且标记长度为 1，避免将负数的负号误判为运算符）：
  ① 从opstack中弹出两个操作数（第一次弹出的是第二个操作数，第二次弹出的是第一个操作数）；
  ② 根据运算符执行算术运算（除法需向零取整，而非 Python 默认的向下取整）；
  ③ 将运算结果压回opstack。
  - 若该标记是操作数（多位数 / 负数）：
  ① 将标记从字符串转换为整数；
  ② 将转换后的整数值压入opstack。
4. 当输入表达式的所有标记被完全处理后，opstack中应仅剩一个元素，该元素即为后缀表达式的计算结果。
5. 弹出opstack中的最后一个元素并返回，即为最终求值结果。


In [None]:
def postfixEval(input):
    opstack = Stack()
    tokens = input.split()
    # split() 方法默认以空格为分隔符，返回一个List
    # 就算没有空格为分隔符也无所谓
    # 但我也可以用for来处理str，转不转化成List影响很大吗？
    print(tokens) # 我勒个烧钢，多位数问题直接解决了！？
     
    # 辅助函数
    def doMath(op, op1, op2):
        if op == "+":
            return op1 + op2
        elif op == "-":
            return op1 - op2
        elif op == "*":
            return op1 * op2
        elif op == "/":
            return op1 / op2
        else:
            raise ValueError("Invalid operator")
            # raise 和 assert 都好怪
            # 为啥不能像C那样直接print或者return？
    
    for token in tokens:
        # if token.isdigit():           # 哦负数就不能通过isdigit输出True？逆天
        if token.lstrip('-').isdigit(): # lstrip用法是去掉字符串左边的指定字符，默认是空格
            opstack.push(int(token))
            # woc，因为前面split得到了多位数，所以这里直接int强制转换就可以了
        elif token in "+-*/":
            op2 = opstack.pop()
            op1 = opstack.pop()
            res = doMath(token, op1, op2)
            opstack.push(res)
        else:
            raise ValueError("Invalid token")
      
      
    return opstack.pop()

test_expression = "10 6 9 3 + -11 * / * 17 + 5 +"
result = postfixEval(test_expression)
print(result)

['10', '6', '9', '3', '+', '-11', '*', '/', '*', '17', '+', '5', '+']
21.545454545454547


: 

| 关键 token | 操作 | 栈状态（operandStack） | 说明 |
|------------|------|------------------------|------|
| 10         | 转为整数 10，压栈 | [10] | 操作数直接入栈 |
| 6          | 转为整数 6，压栈 | [10, 6] | 操作数直接入栈 |
| 9          | 转为整数 9，压栈 | [10, 6, 9] | 操作数直接入栈 |
| 3          | 转为整数 3，压栈 | [10, 6, 9, 3] | 操作数直接入栈 |
| +          | 弹出 3、9 → 9+3=12 → 压栈 12 | [10, 6, 12] | 运算符需要两个操作数，计算后结果回栈 |
| -11        | 转为整数 -11，压栈 | [10, 6, 12, -11] | 修复后可识别负数，正常入栈 |
| *          | 弹出 -11、12 → 12*-11=-132 → 压栈 -132 | [10, 6, -132] | 乘法运算，结果回栈 |
| /          | 弹出 -132、6 → 6/-132=0（向零取整）→ 压栈 0 | [10, 0] | 除法向零取整，结果回栈 |
| *          | 弹出 0、10 → 10*0=0 → 压栈 0 | [0] | 乘法运算，结果回栈 |
| 17         | 转为整数 17，压栈 | [0, 17] | 操作数直接入栈 |
| +          | 弹出 17、0 → 0+17=17 → 压栈 17 | [17] | 加法运算，结果回栈 |
| 5          | 转为整数 5，压栈 | [17, 5] | 操作数直接入栈 |
| +          | 弹出 5、17 → 17+5=22 → 压栈 22 | [22] | 加法运算，结果回栈 |
| 遍历结束   | 弹出栈中最后一个元素 22 | [] | 栈中唯一元素即为最终结果 |