# $\rm Debug\ 与常见异常$

**目录**
- [SyntaxError](#SyntaxError)
- [TypeError](#TypeError)
- [NameError](#NameError)
- [AttributeError](#AttributeError)
- [LookupError](#LookupError)
- [ValueError](#ValueError)
- [ImportError](#ImportError)
- [ArithmeticError](#ArithmeticError)
- [其他异常](#其他异常)
- [FileNotFoundError](#FileNotFoundError)

一个代码和脚本的正确性，需要从语法层面和语义层面的正确性才能算是有正确功能。本节内容主要从代码角度来谈常见异常，首先分析异常产生原因，产生位置；最终需要采用什么样的方法来解决 Bug

## 使用说明
### 测试说明
每个 `if False: if_body` 是一个块，可以将 False 修改为 True 来运行语句来进行测试。例如

```
if False:
    test = [2, 3, 4]
    for value in test:
        print(value)
```

上面的语句需要将 调整为如下方式即可进行测试：

```
if True:
    test = [2, 3, 4]
    for value in test:
        print(value)
```

### Cell 说明
一个板块包括一般两个 cell，第一个 cell 是错误演示说明，可以在第一个 cell 中查找错误；第二个 cell 是已经修改的参考答案

In [None]:
import pandas as pd
import numpy as np
import sys
from sklearn.linear_model import LinearRegression

<a id="SyntaxError"></a>
## $\rm I.\ SyntaxError$
当解释器遇见语法错误的时候，将产生该错误

### $\rm 1.1\ SyntaxError:\ invalid\ syntax$
表示语法错误：无效的语法。可能导致的原因 <font color='grey'>多余符号、函数名称错误、缺少必要的符号、关键字做自定义名称、其他不正确语法（沿袭其他语言语法导致错误）</font>

In [None]:
# 多添加了括号
if True:
    print(12 / 0))
    
# 缺少冒号
if False:
    n = 1
    while n < 3
        print("Hello world")
        n += 1
# 以关键字变量名   
if False:
    class = 'algebra'
    print(class)
# 其他语言习惯
if False:
    test = 1
    test ++

In [None]:
if False:
    print(12 / 0)
    
if False:
    n = 1
    while n < 3:
        print("Hello world")
        n += 1
        
if False:
    non_class = 'algebra'
    print(non_class)
    
if False:
    test = 1
    test += 1

### $\rm 1.2\ SyntaxError: EOL$
行内出现错误<font color=''>表示行内出现缺失引号、引号不一致、括号等导致的语法错误</font>。可能的警示信息如下：

* `EOL while scanning string literal`
* `unexpected EOF while parsing`


In [None]:
# 引号不全
if False:
    print("Hello World)

if False:
    print("hello')

# 括号不全
if False:
    print("hel"

In [None]:
if False:
    print("Hello World")
    
if False:
    print("hello world")
    
if False:
    print("hel")

### $\rm 1.3\ SyntaxError: IndentationError$
缩进错误，也属于 SyntaxError 的一种。可能会看见以下多种缩径错误，<font color='white'>包括应当缩进没有缩径，缩径数量不一致，不应当缩进的地方缩进了</font>。

* `expected an indented block`
* `unindent does not match any outer indentation level`
* `unexpected indent`

In [None]:
# expected an indented block
if False:
    test = [2, 3, 4]
    for value in test:
    print(value)
    
# unindent does not match any outer indentation level
if False:
    if spam == 42:
        print('Hello!')
      print('Howdy!')

# unexpected indent
if False:
    print('Hello!')
        print('Howdy!')

In [None]:
if False:
    test = [2, 3, 4]
    for value in test:
        print(value)
        
if False:
    spam = 42
    if spam == 42:
        print('Hello!')
        print('Howdy!')
        
if False:
    print('Hello!')
    print('Howdy!')

### $\rm 1.3\ SyntaxError: TabError$
缩进错误，也属于 SyntaxError 的一种。这个错误是因为空格和 `Tab` 混用导致的异常。

* `Inconsistent use of tabs and spaces in indentation`
* `IndentationError: unindent does not match any outer indentation level`

<a id="TypeError"></a>
## $\rm II.\ TypeError$ 
类型错误，出现在运算中类型不合适的错误，函数中需要的参数数据类型不一致的错误。可能出现的错误类型

* `'str' object does not support item assignment`, 类型处理不合适
* `must be str, not int`， 运算对象不合适
* `object is not callable`， 对象使用不合适，例如数据对象被当作可调用对象
* `indices must be integers`，索引取值非整型数据

In [None]:
if False:
    spam = 'I have a pet cat.'
    spam[13] = 'r'
    print(spam)
    
if False:
    eggs = 12
    print('I have ' + eggs + ' eggs.')
    
if False:
    test = "this is string"
    print(test())

# 浮点型数据做索引值
if False:
    print("Hello"[1.0])

In [None]:
if False:
    spam = 'I have a pet cat.'
    spam = spam[:13] + 'r' + spam[14:]
    print(spam)
    
if False:
    eggs = 12
    print('I have ' + str(eggs) + ' eggs.')
    
if False:
    test = "this is string"
    print(test)
    
if False:
    print("Hello"[1])

<a id="NameError"></a>
## $\rm III.\ NameError$ 
名称错误，是发生在局部变量名和全局变量名没有被发现

* ` name *** is not defined`

In [None]:
if False:
    print(test2)

In [None]:
if False:
    test2 = 12
    
    del test2
    print(test2)

### $\rm 3.1\ NameError:UnboundLocalError$ 
局部变量变量存在问题，发生在函数或者方法中。因为局部变量和全局变量存在重名，同时在局部作用域中没有先赋值就开始使用。它是 NameError 异常的子类

* `local variable referenced before assignment`

In [None]:
someVar = 42
def myFunction():
    print(someVar)
    someVar = 100
myFunction()


if False:
    someVar = 42
    def myFunction():
        someVar = 100
        print(someVar)

    myFunction()

In [None]:
# 
if False:
    someVar = 42
    def myFunction():
        print(someVar)

    myFunction()
    
if True:
    someVar = 42
    def myFunction():
        someVar = 100
        print(someVar)

    myFunction()

<a id="AttributeError"></a>
## $\rm IV.\ AttributeError$ 
当属性引用或者属性赋值失败时，就会出现该异常。常见的情况是数据类型不具有相应的方法或者相应的方法名称使用错误，方法的引用使用 `.method_name()` 方式；另外比较常见的就是导入的模块中，没有相应的属性或者方法

* ` *** object has no attribute ***`
* ` module *** has no attribute ***`

In [None]:
# 数据类型方法不正确
if False:
    "".append()
# 属性名称或方法名称错误
if False:
    "abcd".upperr()

# 模块方法名称不正确
if False:
    df = pd.con()

In [None]:
if False:
    print(" ".join(["a", 'b']))
    
if False:
    print("abcd".upper())
    
if False:
    df = pd.DataFrame()

<a id="LookupError"></a>
## $\rm V.\ LookupError$ 
出现在映射和序列中的键或者索引是无效的情况，<font color=''>此外可以通过 [codecs.lookup()](https://docs.python.org/3/library/codecs.html#codecs.lookup) 进行直接产生异常——这个是涉及到编码的问题</font>

### $\rm 5.1\ IndexError$ 
发生在序列数据的下标超出了范围，例如索引取值，切片等使用的索引值超过了索引范围。如果索引值是非整型数据将出现 [TypeError](#TypeError)

In [None]:
if False:
    test = ['cat', 'dog', 'mouse']
    print(test[5])

In [None]:
# 需要调整一下索引值即可
if False:
    test = ['cat', 'dog', 'mouse']
    print(test[1])

### $\rm 5.2\ KeyError$ 
发生在字典等有映射关系的数据中，在已有的键中没有找到键而报错

In [None]:
if False:
    test_dict = {"A": "hello", "B": "World"}
    print(test_dict["hello"])
    
# DataFrame 的列不存在
if False:
    test = pd.DataFrame(columns=["A", "B"])
    test["C"]

In [None]:
# 需要将相应的 key 或者 column 名称调整为已有的方式，⚠️ 某些数据类型具有方法以避免报错，例如字典可以通过 get 的方法来避免报错
if False:
    test_dict = {"A": "hello", "B": "World"}
    print(test_dict["A"])
    
if False:
    test = pd.DataFrame(columns=["A", "B"])
    test["A"]

<a id="ValueError"></a>
## $\rm VI.\ ValueError$ 
在进行运算或者传入函数的参数，类型是正确的但是值不合适导致的异常。例如在类型转换过程中，字符数据被转换为浮点型数据，字符数据直接转换为整型数据，此外在某些方法中要求数据不能有缺失值和无限值

* `could not convert string to float: ***`
* `invalid literal for int() with base 10: ***`
* `Input contains NaN, infinity or a value too large for dtype(***)`

In [None]:
if False:
    float('a')

if False:
    int('1.0')
    
if False:
    X = pd.DataFrame([[1, np.nan], [2, 3], [np.nan, 3], [np.nan, 2]])
    y = pd.Series([1, 2, 0, 1])

    lm = LinearRegression(normalize=True)
    lm.fit(X,y)

In [None]:
if True:
    int(float('1.0'))

if True:
    X = pd.DataFrame([[1, np.nan], [2, 3], [np.nan, 3], [np.nan, 2]])
    y = pd.Series([1, 2, 0, 1])
    
    X = X.fillna(0)
    lm = LinearRegression(normalize=True)
    lm.fit(X,y)

<a id="ImportError"></a>
## $\rm VII.\ ImportError$ 
当在使用 import 语句加载模块时出现异常。例如导入不存在的包，模块中没有相应的的子模块时也会出现异常，<font color="">此外在如果路径不正确同样还是会出现该异常——可以通过 sys.path.append("module_path") 来添加模块所在的路径</font>

* `No module named ***`
* `cannot import name ***`

In [None]:
# 这里需要使用已有的 model 名称即可
if False:
    import no_module

if False:
    from pandas import no_module

## $\rm 7.1\ ModuleNotFoundError$ 
它是 ImportError 的子类，发生该异常是因为在 `sys.modules` 的相关路径中没有该模块

* `No module named ***`

In [None]:
# 这里只是演示，只需要将 False 修改为 True 进行测试即可
if False:
    import config

<a id="ArithmeticError"></a>
## $\rm VIII.\ ArithmeticError$ 
这个是和算数相关的异常，主要包括了 `OverflowError`， `ZeroDivisionError`，前者主要是因为算数运算的记过过于庞大难以呈现而导致异常，后者是因为分母为 0 而导致的异常

In [None]:
if False:
    print(12 / 0)

In [None]:
# 这类可以通过异常处理的方式进行解决，也可以需改为其他数值

# 方式一
if False:
    try:
        print(12 / 0)
    except:
        print("Denominator is Zero")

# 方式二
if False:
    print(12 / 2)
    

<a id="其他异常"></a>
## $\rm IX.\ 其他异常$ 
在进行书写代码的过程中，可能会因为需要检查过程中是否正确是使用 `assert` 进行断言测试，同样可能因为需要截断语句运行而使用 `raise` 抛出异常（特别是捕获到异常处理之后，最终还是需要终止后续代码的时候）。此外可能需要临时终止代码运行，而通过键盘操作（按 `Ctrl + c` ）终止代码运行

### $\rm 9.1\ AssertionError$
断言测试产生的异常，一般使用 `assert` 语句进行测试。语法结构为：`assert expression [, result_prommot]`，如果测试表达式通过则不会产生异常，否则会将 `result_promot` 作为 `AssertionError` 的提示信息抛出异常

In [None]:
# 不需要进行其他调整，这里可以修改 False 为 True 进行测试
if False:
    assert 2 != 1, "Test is Wrong"

if False:
    assert 2 == 1, "Test is Wrong"

### $\rm 9.2\ raise$
`raise` 语句是将异常抛出的一种方式，它会出现异常的正常方式进行运行。另外需要⚠️注意 raise 语句后面的需要使用特定的异常类型来输出异常，例如 `Exception(error)`, `ValueError(error)`, `TypeError(error)` 等

In [None]:
# 不需要进行其他调整，这里可以修改 False 为 True 进行测试
if True:
    try:
        print(2 / 0)
    except Exception as err:
        print(err)    
        raise Exception(err)

### $\rm 9.3\ KeyboardInterrupt$
通过键盘方式终端运行产生的异常，报错信息包括 `KeyboardInterrupt:` 以及发生终止的位置

<a id="FileNotFoundError"></a>
## $\rm X.\ FileNotFoundError$
该异常是发生在需要的文件或者目录不存在而发生的异常，这时需要检查一下相应的目录中是否有相应的文件

In [None]:
# 需要注意修改文件存在路径或者文件存在名称即可
if False:
    pd.read_csv("./test.csv")

![](https://ws1.sinaimg.cn/large/006tNbRwgy1fusth5td2qj30pz092t9k.jpg)

## $\rm A.\ 参考$
1. [3.4. Know Your Error Messages — How to Think like a Computer Scientist: Interactive Edition](http://interactivepython.org/runestone/static/CS152f17/Debugging/KnowyourerrorMessages.html)
2. [exceptions – Built-in error classes - Python Module of the Week](https://pymotw.com/2/exceptions/)
3. [python - ModuleNotFoundError: No module named x - Stack Overflow](https://stackoverflow.com/questions/43728431/modulenotfounderror-no-module-named-x)
4. [Built-in Exceptions — Python 3.7.1rc1 documentation](https://docs.python.org/3/library/exceptions.html#OverflowError)
5. [7. Simple statements — Python 3.7.1rc1 documentation](https://docs.python.org/3/reference/simple_stmts.html#raise)