# การใช้งาน Numpy เบื้องต้น

## รายวิชาการประมวลผลข้อมูลขนาดใหญ่
### ผู้ช่วยศาสตราจารย์พิศาล สุขขี
สาขาวิทยาการคอมพิวเตอร์, มหาวิทยาลัยราชภัฏศรีสะเกษ

<hr />

In [None]:
import matplotlib.pyplot as plt
import numpy as np
np.__version__

## ความแตกต่างระหว่าง Numpy และ List

In [None]:
# สร้างลิสต์
gpas_as_list = [4.0, 3.286, 3.5]

In [None]:
# สามารถเพิ่มข้อมูลเข้าไปในลิสต์ได้
gpas_as_list.append(4.0)

# ภายในลิสต์สามารถเก็บข้อมูลที่มีชนิตแตกต่างกันได้
gpas_as_list.insert(1, "Whatevs")

# แสดงผลลิสต์
gpas_as_list

In [None]:
# สามารถนำข้อมูลออกจากลิสต์ได้
gpas_as_list.pop(1)

In [None]:
# แสดงผลลิสต์
gpas_as_list

In [None]:
# การสร้าง Numpy Array จาก List
gpas = np.array(gpas_as_list)

gpas.dtype

In [None]:
# ขนาดของ element เพียงหนึ่งตัวภายใน array
gpas.itemsize

In [None]:
# จำนวน element ทั้งหมด
gpas.size

In [None]:
# จำนวน element ทั้งหมด
len(gpas)

In [None]:
gpas

In [None]:
# จำนวนไบต์ที่ element ใข้ใน array
gpas.nbytes

<hr />

## การสร้างอะเรย์หลายมิติ (Multidimensional Arrays)
### Numpy ndarray

In [None]:
# สร้าง ndarray
students_gpas = np.array(
    [
        [4.0, 3.286, 3.5, 4.0],
        [3.2, 3.8, 4.0, 4.0],
        [3.96, 3.92, 4.0, 4.0]
    ], 
    np.float16)

students_gpas

In [None]:
# แสดงจำนวนมิติของ array ที่สร้างขึ้น
students_gpas.ndim

In [None]:
# แสดงจำนวน แถว และ คอลัมน์ ของ array ที่สร้างขึ้น
students_gpas.shape

In [None]:
# แสดงจำนวน element ทั้งหมดของ array ที่สร้างขึ้น
students_gpas.size

In [None]:
students_gpas.itemsize * students_gpas.size

In [None]:
# แสดงรายละเอียดของ ndarray ที่สร้างขึ้นทั้งหมด
%whos ndarray

In [None]:
#  แสดงรายละเอียดของ ndarray อย่างละเอียดแบบเจาะจง
np.info(students_gpas)

## ndarray indexing

Numpy มีหลายวิธีในการจัดทำดัชนีลงในอาร์เรย์

Slicing: คล้ายกับการดำเนินการในลิสต์ของ Python สามารถแบ่งอาร์เรย์ numpy ได้ เนื่องจากอาร์เรย์อาจเป็นแบบหลายมิติ ผู้ใช้งานต้องระบุตำแหน่งสไลซ์สำหรับแต่ละมิติของอาร์เรย์:

In [None]:
# แสดงการอ้างอิงค่าของ array ที่สร้างขึ้น
# ความสัมพันธ์ระหว่าง a และ b เป็นจะเป็นแบบ reference

a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
b = a[:2, 1:3]

In [None]:
print(a)

In [None]:
print(b)

In [None]:
a[0, 1]

In [None]:
b[0, 0] = 77

# ค่าที่กำหนดให้ b จะส่งผลกระทบต่อค่าที่อ้างอิงจาก a
print(b[0, 0])
print(a[0, 1])

คุณยังสามารถผสมการจัดทำดัชนีจำนวนเต็มกับการจัดทำดัชนีสไลซ์ อย่างไรก็ตาม 

การทำเช่นนี้จะทำให้อาร์เรย์มีลำดับต่ำกว่าอาร์เรย์ดั้งเดิม โปรดทราบว่าสิ่งนี้ค่อนข้างแตกต่างจากวิธีที่ MATLAB จัดการกับการแบ่งอาร์เรย์:

In [None]:
# ทำการสร้างอะเรย์ 2 มิติที่มีขนาดเท่ากับ (3, 4)
# [[ 1  2  3  4]
#  [ 5  6  7  8]
#  [ 9 10 11 12]]
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])

# มี 2 วิธีสำหรับการเข้าถึงข้อมูลที่อยู่ภายในอะเรย์
# ตัวอย่างด้านล่างเป็นการผสมการเข้าถึงข้อมูลที่อยู่ภายในอะเรย์ด้วยการกำหนดดัชนีแบบจำนวนเต็ม ร่วมกับการ slicing
row_r1 = a[1, :]    # Rank 1 view of the second row of a
row_r2 = a[1:2, :]  # Rank 2 view of the second row of a
print(row_r1, row_r1.shape)  # Prints "[5 6 7 8] (4,)"
print(row_r2, row_r2.shape)  # Prints "[[5 6 7 8]] (1, 4)"

# We can make the same distinction when accessing columns of an array:
col_r1 = a[:, 1]
col_r2 = a[:, 1:2]

print(col_r1, col_r1.shape)  # Prints "[ 2  6 10] (3,)"
print(col_r2, col_r2.shape)  # Prints "[[ 2]
                             #          [ 6]
                             #          [10]] (3, 1)"

In [None]:
a = np.array([[1,2], [3, 4], [5, 6]])

print(a, "\n")

# ตัวย่างการใช้ดัชนีในรูปแบบอะเรย์
# The returned array will have shape (3,) and
print(a[[0, 1, 2], [0, 1, 0]])  # Prints "[1 4 5]"

print(np.array([a[0, 0], a[1, 1], a[2, 0]]))  # Prints "[1 4 5]"

# When using integer array indexing, you can reuse the same
# element from the source array:
print(a[[0, 0], [1, 1]])  # Prints "[2 2]"

# Equivalent to the previous integer array indexing example
print(np.array([a[0, 1], a[0, 1]]))  # Prints "[2 2]"

In [None]:
a = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
print(a)

# Create an array of indices
b = np.array([0, 2, 0, 1])
print(b)

print(a[np.arange(4), b]) # Prints "[ 1  6  7 11]"

## ประเภทข้อมูล

ในทุก ๆ Numpy Array เป็นตารางขององค์ประกอบประเภทเดียวกัน 

Numpy มีชุดข้อมูลตัวเลขจำนวนมากที่คุณสามารถใช้สร้างอาร์เรย์ได้ Numpy พยายามเดาประเภทข้อมูลเมื่อคุณสร้างอาร์เรย์ 

แต่ฟังก์ชันที่สร้างอาร์เรย์มักจะรวมอาร์กิวเมนต์ที่เป็นตัวเลือกเพื่อระบุประเภทข้อมูลอย่างชัดเจน นี่คือตัวอย่าง:

In [None]:
x = np.array([1, 2])   # Let numpy choose the datatype
print(x.dtype)         # Prints "int64"

x = np.array([1.0, 2.0])   # Let numpy choose the datatype
print(x.dtype)             # Prints "float64"

x = np.array([1, 2], dtype=np.int64)   # Force a particular datatype
print(x.dtype)                 

<hr />

## ฟังก์ชั่นทางคณิตศาสตร์สำหรับอาร์เรย์

ฟังก์ชันทางคณิตศาสตร์พื้นฐานทำงานตามองค์ประกอบบนอาร์เรย์ และมีให้ใช้งานทั้งแบบโอเวอร์โหลดตัวดำเนินการและเป็นฟังก์ชันในโมดูล numpy:

In [None]:
import numpy as np

x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)

# Elementwise sum; both produce the array
# [[ 6.0  8.0]
#  [10.0 12.0]]
print(x + y)
print(np.add(x, y))
print()

# Elementwise difference; both produce the array
# [[-4.0 -4.0]
#  [-4.0 -4.0]]
print(x - y)
print(np.subtract(x, y))

# Elementwise product; both produce the array
# [[ 5.0 12.0]
#  [21.0 32.0]]
print(x * y)
print(np.multiply(x, y))
print()

# Elementwise division; both produce the array
# [[ 0.2         0.33333333]
#  [ 0.42857143  0.5       ]]
print(x / y)
print(np.divide(x, y))
print()

# Elementwise square root; produces the array
# [[ 1.          1.41421356]
#  [ 1.73205081  2.        ]]
print(np.sqrt(x))

In [None]:
x = np.array([[1,2],[3,4]])

print(np.sum(x))  # Compute sum of all elements; prints "10"
print(np.sum(x, axis=0))  # Compute sum of each column; prints "[4 6]"
print(np.sum(x, axis=1))  # Compute sum of each row; prints "[3 7]"

<hr />

## การ Transpose

In [None]:
x = np.array([[1,2], [3,4]])
print(x)    # Prints "[[1 2]
            #          [3 4]]"
print(x.T)  # Prints "[[1 3]
            #          [2 4]]"

# Note that taking the transpose of a rank 1 array does nothing:
v = np.array([1,2,3])
print(v)    # Prints "[1 2 3]"
print(v.T)  # Prints "[1 2 3]"

<hr>

## Broadcasting

การ Broadcast เป็นกลไกอันทรงพลังที่ช่วยให้ numpy ทำงานกับอาร์เรย์ที่มีรูปร่างต่างกันได้

เมื่อดำเนินการคำนวณทางคณิตศาสตร์ บ่อยครั้งที่เรามีอาร์เรย์ที่เล็กกว่าและอาร์เรย์ที่ใหญ่กว่า 

และเราต้องการใช้อาร์เรย์ที่เล็กกว่าหลายครั้งเพื่อดำเนินการบางอย่างกับอาร์เรย์ที่ใหญ่กว่า

In [None]:
# We will add the vector v to each row of the matrix x,
# storing the result in the matrix y
x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
y = np.empty_like(x)   # ทำการสร้างเมทริกซ์เปล่าที่มีขนาดเท่ากับ x

# ดำเนินการบวกเวกเตอร์ v กับทุก ๆ ในเมทริกซ์ x โดยไม่มีการปรับขนาดของ x
for i in range(4):
    y[i, :] = x[i, :] + v

# ข้อมูลปัจจุบันของ y คือ
# [[ 2  2  4]
#  [ 5  5  7]
#  [ 8  8 10]
#  [11 11 13]]
print(y)

จากตัวอย่างด้านบน !!
เป็นการใช้ Loop For สำหรับวนรอบเพื่อดำเนินการกับแต่ละแถวของเมทริกซ์ x ด้วยเวกตอร์ y

ตัวอย่างด้านล่างนี้เป็นอีกหนึ่งวิธีที่ให้ผลลัพธ์เหมือนกันกันแต่ไม่ต้องใช้ Loop For

In [None]:
# We will add the vector v to each row of the matrix x,
# storing the result in the matrix y
x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
vv = np.tile(v, (4, 1))   # Stack 4 copies of v on top of each other
print(vv)                 # Prints "[[1 0 1]
                          #          [1 0 1]
                          #          [1 0 1]
                          #          [1 0 1]]"
                          
y = x + vv  # Add x and vv elementwise
print(y)  # Prints "[[ 2  2  4
          #          [ 5  5  7]
          #          [ 8  8 10]
          #          [11 11 13]]"

ตัวอย่างด้านล่างนี้ !! 

แสดงให้เห็นว่า Numpy Broadcasting ช่วยให้เราสามารถคำนวณได้โดยไม่ต้องสร้าง v หลายชุด พิจารณาเวอร์ชันนี้โดยใช้การ Boardcasting:

In [None]:
# We will add the vector v to each row of the matrix x,
# storing the result in the matrix y
x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])

y = x + v  # Add v to each row of x using broadcasting
print(y)  # Prints "[[ 2  2  4]
          #          [ 5  5  7]
          #          [ 8  8 10]
          #          [11 11 13]]"