In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [2]:
import numpy as np

In [3]:
np.__version__

'1.16.2'

# 理解数据结构与算法

算法与数据结构是运算中两个最基本的概念。它们是构造复杂软件的基石。理解了这些基本概念对软件设计有巨大的帮助，关于怎么理解这些基本概念涉及到下面三个特征：

* 算法是如何操作数据结构所包含信息的
* 数据在内存中是怎么组织的
* 特定数据结构的表现性能的特征
在这本书里，我们会从几个角度来审视这个主题。首先，我们会从数据结构和算法的角度阅览一下编程语言Python的基础。接下来，很重要的一点，我们要有正确的数学工具。我们需要理解计算科学中的一些基本概念，源于此，我们需要一些数学。通过采取启发式的方法，发展出一些指导原则一般意味着我们不需要比高中数学更多的东西来理解这些关键思想原则。

另外一个重要方面是评估。衡量算法的表现涉及：理解数据大小的每次增加如何影响算法该数据的操作。 当我们处理大型数据集或者事实应用时，高效的算法和数据结构是很重要的。

最后，我们需要一个完善的实验设计策略。欲能够概念性的把显示世界中的问题翻译为编程语言里的算法和数据结构，这涉及有能力来理解问题的重要组成和把这些组成映射到程序结构的方法。

# 变量和表达式

可以这么理解变量，它是贴在对象上面的标签，它不是对象本身，亦不是对象的容器。变量不包含对象，而是充当对象的指针或引用。

In [None]:
a = [2, 3, 4]
b = a
a.append(5)
b

Python是动态类型语言。变量名在程序执行中可以绑在不同值和类型上。每个值都是一种类型,比如字符串，整型。但是，变量名本身并没有一个类型，这一点与另外的诸如C和Java等大多数语言不同，后者变量名代表一个固定大小。

# Uniquness of numpy data type compared with Python data type

In [None]:
arr = np.arange(10000000)
listarr = arr.tolist()
def scalar_multiple(alist, scalar):
   for i, val in enumerate(alist):
       alist[i] = val * scalar
   return alist
# Using IPython's magic timeit command
%timeit (arr * 2.4)
%timeit (scalar_multiple(listarr, 2.4))

# Cython

In [None]:
%load_ext Cython

In [None]:
%%cython
cdef int a = 0
for i in range(10):
    a += i
print(a)

In [None]:
def f(x):
    return x ** 2 - x
%timeit f(100)

In [None]:
%%cython
from time import time

def f1(x):
    return x ** 2 - x

n = 10000000
start = time()
for _ in range(n):
    f1(100)
end = time()
run_time = (end - start) / n * 1000 * 1000 * 1000
print("%.1f ns" % run_time)
%timeit f1(100)

In [None]:
%%cython
from time import time

cpdef long f2(long x):
    return x ** 2 - x

n = 10000000
start = time()
for _ in range(n):
    f2(100)
end = time()
run_time = (end - start) / n * 1000 * 1000 * 1000
print("%.1f ns" % run_time)
%timeit f2(100)

In [None]:
%%cython
from time import time

cdef long f3(long x):
    return x ** 2 - x

n = 10000000
start = time()
for _ in range(n):
    f3(100)
end = time()
run_time = (end - start) / n * 1000 * 1000 * 1000
print("%.1f ns" % run_time)

In [None]:
A = list(range(10000))
def sum_list(A):
    ret = 0
    for x in A:
        ret += x
    return ret
%timeit sum_list(A)
%timeit sum(A)

## Compare the usual, internal, cython function

In [None]:
%%cython
cpdef int sum_list_cython(A):
    cdef int ret, x
    for x in A:
        ret += x
    return ret
%timeit sum_list_cython(A)