## NumPy

 - Numpy tek veya çok boyutlu (matrix) sayı dizinleriyle uğraşan bir modül
 - Pandas, SciPy, Matplotlib, scikit-learn, scikit-image gibi modüllerin temelinde kullanılıyor
 - Genellikle çok boyutlu matrixler üzerinde analitik işlemleri çok hızlı şekilde yapmaya yarıyor.
 - Veri biliminde çok sık kullanılıyor
 
 - Bir image için:
     - (59, 48, 190), (53, 33, 24) ...
     - (23, 42, 238), (12, 233, 223) ...
     
     şeklinde pixel verisi tutuluyor. Bu image'ı işlerken bu sayılar üzerinden işlem yapıyoruz
     
 - Şirketin yıllık kâr ve gider tablosunu
     - 2018, 100, 90
     - 2019, 90, 120
     - 2020, 80, 70
     - 2021, 13, 24
     
    şeklinde tutuyoruz. Bunun üzerinde analiz yapmak istersek, yine çok boyutlu matrixlerle işlem yapmamız gerekiyor
    
    
### Numpy vs Python Lists

- Kullanım kolaylığı:
    - Numpy **array**leri üzerinde matematiksel işlem yapmak çok kolay.
- Daha hızlı:
    - Sebep 1: numpy arraylerinin boyutları değişemez ve sabittir.
    - Sebep 2: numpy arraylerinin bütün elemanlarının type'ı aynıdır.


In [1]:
pip install numpy

Note: you may need to restart the kernel to use updated packages.


In [3]:
liste = [[1,2,3,4], [2,3,4,5], [3,4,5,6]]


## Bu eski yöntem (python listesi)
for satir in liste:
    print(satir)

[1, 2, 3, 4]
[2, 3, 4, 5]
[3, 4, 5, 6]


## Numpy arrayi tanımlama yöntemleri

In [20]:
# Elemanları kendimiz vererek 

a = np.array([1,2,4,5,6])

print(a)
print(a[0])
print(a[2:4])
print(a[3:])

print(type(a))
print("-"*20)
a = np.array([   [1,2,3],  [4,5,6], [7,8,9]  ])
print(a)
print("a[1,1] ->", a[1,1])
print("a[-1, -1] ->", a[-1, -1])
print("a[0:2, 2] ->", a[0:2, 2])
print("a[2, 0:2] ->", a[2, 0:2])
print("a[0:2, 0:2] -> ", a[0:2, 0:2])
print("-"*20)

a = np.array([ [ [1,2], [2,3] ], [ [3,4], [4,5] ], [[4,5], [5,6]] ])
print(a)



[1 2 4 5 6]
1
[4 5]
[5 6]
<class 'numpy.ndarray'>
--------------------
[[1 2 3]
 [4 5 6]
 [7 8 9]]
a[1,1] -> 5
a[-1, -1] -> 9
a[0:2, 2] -> [3 6]
a[2, 0:2] -> [7 8]
a[0:2, 0:2] ->  [[1 2]
 [4 5]]
--------------------
[[[1 2]
  [2 3]]

 [[3 4]
  [4 5]]

 [[4 5]
  [5 6]]]


In [34]:
# Sadece 0'lardan veya sadece 1'lerden oluşan arrayler oluşturma

a = np.zeros(5) # sadece sıfırlardan oluşan 5 elemanlı numpy array
                # default olarak bütün sayılar float oluyor
print(a)

a = np.ones(5) # sadece birlerden oluşan 5 elemanlı numpy array
                # default olarak bütün sayılar float oluyor    
print(a)

# Boş bir numpy arrayi oluşturma

a = np.empty(5) # elemanlarına herhangi bir değer atanmamış 5 elemanlı bir numpy arrayi
print(a)


print("-"*20)
## Çok boyutlu sadece 0'lardan oluşan bir numpy arrayi oluşturma

a = np.zeros((3,5))
print(a)
print("-"*20)

a = np.zeros((3,2,3))
print(a)



[0. 0. 0. 0. 0.]
[1. 1. 1. 1. 1.]
[1. 1. 1. 1. 1.]
--------------------
[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
--------------------
[[[0. 0. 0.]
  [0. 0. 0.]]

 [[0. 0. 0.]
  [0. 0. 0.]]

 [[0. 0. 0.]
  [0. 0. 0.]]]


In [42]:
a = np.ones((5,6))
print(a)


print(a.shape) # arrayin boyutlarını verir
print(a.ndim) # number of dimensions (toplam kaç boyutlu olduğunu verir)
print(a.dtype) # arrayin değerlerinin data typeı hakkında detay verir
print(a.itemsize) # arrayin her bir elemanının size'ını verir (byte cinsinden)
print(a.size) # arrayin toplam size'ını verir (kaç eleman olduğu)

[[1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1.]]
(5, 6)
2
float64
8
30


In [48]:
# Range ile numpy array oluşturma

a = np.arange(10)
print(a)

a = np.arange(5,10)
print(a)

a = np.arange(5, 20, 3)
print(a)

a = np.arange(1, 10, 0.3) # step size float olabiliyor
print(a)

[0 1 2 3 4 5 6 7 8 9]
[5 6 7 8 9]
[ 5  8 11 14 17]
[1.  1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4.  4.3 4.6 4.9 5.2 5.5 5.8 6.1
 6.4 6.7 7.  7.3 7.6 7.9 8.2 8.5 8.8 9.1 9.4 9.7]


In [51]:
# Başlangıç ve bitiş noktası ve toplam eleman sayısı verilen numpy array oluşturma

a = np.linspace(1, 10, 5)
print(a)

a = np.linspace(0, 100, 21)
print(a)

[ 1.    3.25  5.5   7.75 10.  ]
[  0.   5.  10.  15.  20.  25.  30.  35.  40.  45.  50.  55.  60.  65.
  70.  75.  80.  85.  90.  95. 100.]


In [61]:
a = np.random.randint(0, 10, 5) # 0 ile 10 arasında (10 dahil değil), 5 rastgele tamsayıdan oluşan numpy array
print(a)
print("-"*20)
a = np.random.randint(0,10, (2,4)) # 0 ile 10 arasında (10 dahil değil), 8 rasgele tamsayıdan oluşan, 2x4 boyutlarında bir numpy array
print(a)
print("-"*20)

a = np.random.rand(5)# 0 ile 1 arasında 5 rasgele sayıdan oluşan bir numpy array
print(a)

print("-"*20)

a = np.random.rand(2,4)# 0 ile 1 arasında 8 rasgele sayıdan oluşan 2x4 boyutlarında bir numpy array
print(a)


[8 5 0 7 8]
--------------------
[[4 9 3 7]
 [2 2 8 9]]
--------------------
[0.99216332 0.71437282 0.26365042 0.00731788 0.47744581]
--------------------
[[0.50577113 0.35260262 0.50960578 0.55872994]
 [0.01081508 0.67589408 0.45604368 0.45326617]]


In [69]:
# Arraylerin shape'ini değiştirme

a = np.random.randint(0, 5, (6,4))
print(a)
print("-"*20)

a = a.reshape((2,12))
print(a)

## reshape sonrasındaki toplam eleman sayısının değişmemesi gerekiyor
print("-"*20)

a = a.reshape((3,8))
print(a)

print("-"*20)

a = a.reshape((1,24))
print(a)

print("-"*20)

a = a.reshape(24)
print(a)b

[[4 0 4 2]
 [0 4 1 2]
 [2 0 1 1]
 [0 3 0 0]
 [0 0 1 0]
 [4 4 3 1]]
--------------------
[[4 0 4 2 0 4 1 2 2 0 1 1]
 [0 3 0 0 0 0 1 0 4 4 3 1]]
--------------------
[[4 0 4 2 0 4 1 2]
 [2 0 1 1 0 3 0 0]
 [0 0 1 0 4 4 3 1]]
--------------------
[[4 0 4 2 0 4 1 2 2 0 1 1 0 3 0 0 0 0 1 0 4 4 3 1]]
--------------------
[4 0 4 2 0 4 1 2 2 0 1 1 0 3 0 0 0 0 1 0 4 4 3 1]


## Sayısal İşlemler

In [79]:
a = np.random.randint(1, 10, (3,3))
print(a)

print("Tamamının toplamı: ", a.sum()) # array içerisindeki bütün sayıların toplamını verir
print("Satırların toplamı: ", a.sum(axis=1)) # arrayin satırlarının toplamını verir
print("Sütunların toplamı: ",a.sum(axis=0)) # arrayin sütunlarının toplamını verir
print("Minimum değer: ", a.min()) # arrayin en küçük elemanını verir
print("Maximum değer: ", a.max()) # arrayin en büyük elemanını verir
print("Ortalama değer: ", a.mean()) # arrayin sayı ortalamasını verir
print("Maximum değerin indexi: ", a.argmax()) # arrayin en büyük değerinin indexini verir
print("Minimum değerin indexi: ", a.argmin()) # arrayin en küçük değerinin indexini verir


[[8 5 2]
 [7 5 1]
 [6 7 1]]
Tamamının toplamı:  42
Satırların toplamı:  [15 13 14]
Sütunların toplamı:  [21 17  4]
Minimum değer:  1
Maximum değer:  8
Ortalama değer:  4.666666666666667
Maximum değerin indexi:  0
Minimum değerin indexi:  5


In [102]:
# Aritmetik işlemler

a = np.random.randint(1, 10, (3,3))
print("a=")
print(a)

print("-"*20)
print("b = a+3")
b = a + 3
print(b)

print("-"*20)
print("b = a-3")
b = a - 3
print(b)

print("-"*20)
print("b = a*3")
b = a * 3
print(b)

print("-"*20)
print("b = a/3")
b = a/3
print(b)


print("-"*20)
print("b = a**2")
b = a**2
print(b)


print("-"*20)
print("b = a // 3")
b = a//3
print(b)


print("-"*20)
print("b = a % 3")
b = a%3
print(b)



a=
[[5 3 4]
 [5 1 6]
 [1 1 7]]
--------------------
b = a+3
[[ 8  6  7]
 [ 8  4  9]
 [ 4  4 10]]
--------------------
b = a-3
[[ 2  0  1]
 [ 2 -2  3]
 [-2 -2  4]]
--------------------
b = a*3
[[15  9 12]
 [15  3 18]
 [ 3  3 21]]
--------------------
b = a/3
[[1.66666667 1.         1.33333333]
 [1.66666667 0.33333333 2.        ]
 [0.33333333 0.33333333 2.33333333]]
--------------------
b = a**2
[[25  9 16]
 [25  1 36]
 [ 1  1 49]]
--------------------
b = a // 3
[[1 1 1]
 [1 0 2]
 [0 0 2]]
--------------------
b = a % 3
[[2 0 1]
 [2 1 0]
 [1 1 1]]


In [103]:
print("-"*20)
print("b = np.sin(a)")
b = np.sin(a)
print(b)

print("-"*20)
print("b = np.cos(a)")
b = np.cos(a)
print(b)


print("-"*20)
print("b = np.sqrt(a)")
b = np.sqrt(a)
print(b)


print("-"*20)
print("b = np.log(a)")
b = np.log(a)
print(b)


print("-"*20)
print("b = np.exp(a)")
b = np.exp(a)
print(b)

--------------------
b = np.sin(a)
[[-0.95892427  0.14112001 -0.7568025 ]
 [-0.95892427  0.84147098 -0.2794155 ]
 [ 0.84147098  0.84147098  0.6569866 ]]
--------------------
b = np.cos(a)
[[ 0.28366219 -0.9899925  -0.65364362]
 [ 0.28366219  0.54030231  0.96017029]
 [ 0.54030231  0.54030231  0.75390225]]
--------------------
b = np.sqrt(a)
[[2.23606798 1.73205081 2.        ]
 [2.23606798 1.         2.44948974]
 [1.         1.         2.64575131]]
--------------------
b = np.log(a)
[[1.60943791 1.09861229 1.38629436]
 [1.60943791 0.         1.79175947]
 [0.         0.         1.94591015]]
--------------------
b = np.exp(a)
[[ 148.4131591    20.08553692   54.59815003]
 [ 148.4131591     2.71828183  403.42879349]
 [   2.71828183    2.71828183 1096.63315843]]


In [116]:
a = np.ones((3,3)) * 2
b = np.ones((3,3)) * 3


print("Bu işlemleri yapabilmemiz için, iki arrayin SHAPEinin aynı olması gerekiyor!!!")

print("a=")
print(a)

print("b=")
print(b)

print("-"*20)

c = a + b
print("a+b")
print(c)
print("-"*20)
print("a-b")

c = a - b
print(c)

print("-"*20)
print("a*b (gerçek matrix çarpımı değil, eleman eleman çarpma)")

c = a * b
print(c)

print("-"*20)
print("a @ b (lisede öğrendiğimiz matrix çarpımı)")

c = a @ b
print(c)


print("-"*20)
print("a/b")

c = a / b
print(c)


Bu işlemleri yapabilmemiz için, iki arrayin SHAPEinin aynı olması gerekiyor!!!
a=
[[2. 2. 2.]
 [2. 2. 2.]
 [2. 2. 2.]]
b=
[[3. 3. 3.]
 [3. 3. 3.]
 [3. 3. 3.]]
--------------------
a+b
[[5. 5. 5.]
 [5. 5. 5.]
 [5. 5. 5.]]
--------------------
a-b
[[-1. -1. -1.]
 [-1. -1. -1.]
 [-1. -1. -1.]]
--------------------
a*b (gerçek matrix çarpımı değil, eleman eleman çarpma)
[[6. 6. 6.]
 [6. 6. 6.]
 [6. 6. 6.]]
--------------------
a @ b (lisede öğrendiğimiz matrix çarpımı)
[[18. 18. 18.]
 [18. 18. 18.]
 [18. 18. 18.]]
--------------------
a/b
[[0.66666667 0.66666667 0.66666667]
 [0.66666667 0.66666667 0.66666667]
 [0.66666667 0.66666667 0.66666667]]


In [123]:
print("@ operatörünü kullanabilmek için bir matrixin sütun sayısıyla diğer matrixin satır sayısı aynı olmalı")

a = np.random.randint(1,10, (4,3))
b = np.random.randint(1,10, (3,2))

print(a)
print("-"*20)
print(b)

print("-"*20)
print("a @ b")
print(a @ b)


@ operatörünü kullanabilmek için bir matrixin sütun sayısıyla diğer matrixin satır sayısı aynı olmalı
[[3 8 6]
 [9 9 9]
 [7 9 5]
 [1 5 3]]
--------------------
[[6 1]
 [1 5]
 [2 1]]
--------------------
a @ b
[[38 49]
 [81 63]
 [61 57]
 [17 29]]


In [132]:
# İki numpy arrayini birleştirme (stack)

a = np.ones((3,4))
b = np.zeros((2,4))
c = np.ones((2,4))

print("a=\n",a)
print("-"*20)
print("b=\n",b)
print("-"*20)
print("c=\n",c)
print("-"*20)

# Vertical Stacking (vstack)
# Sütun sayıları aynı olmak zorunda !!

d = np.vstack((a,b,c))
print("np.vstack((a,b))")
print(d)



a=
 [[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]
--------------------
b=
 [[0. 0. 0. 0.]
 [0. 0. 0. 0.]]
--------------------
c=
 [[1. 1. 1. 1.]
 [1. 1. 1. 1.]]
--------------------
np.vstack((a,b))
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]


In [133]:
# İki numpy arrayini birleştirme (stack)

a = np.ones((2,3))
b = np.zeros((2,5))
c = np.ones((2,2))

print("a=\n",a)
print("-"*20)
print("b=\n",b)
print("-"*20)
print("c=\n",c)
print("-"*20)

# Horizontal Stacking (hstack)
# Satır sayıları aynı olmak zorunda !!

d = np.hstack((a,b,c))
print("np.hstack((a,b))")
print(d)


a=
 [[1. 1. 1.]
 [1. 1. 1.]]
--------------------
b=
 [[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
--------------------
c=
 [[1. 1.]
 [1. 1.]]
--------------------
np.hstack((a,b))
[[1. 1. 1. 0. 0. 0. 0. 0. 1. 1.]
 [1. 1. 1. 0. 0. 0. 0. 0. 1. 1.]]


In [141]:
# Numpy arrayleri üzerinde filtreleme ve maskeleme işlemleri

a = np.array([True, True, False]) # boolean numpy array (mask)
print(a)

b = np.array([1,2,3])
print(b)

print(b[2])
print(b[a]) # filtering (a boolean bir array olduğu için)


[ True  True False]
[1 2 3]
3
[1 2]


In [146]:
a = np.random.randint(1,10, (5,5))
print(a)

print("-"*20)
mask = a > 5
print(mask)
print("-"*20)

print(a[mask])

[[4 7 9 7 8]
 [9 1 5 2 3]
 [5 7 9 1 7]
 [6 7 5 3 8]
 [6 1 4 2 8]]
--------------------
[[False  True  True  True  True]
 [ True False False False False]
 [False  True  True False  True]
 [ True  True False False  True]
 [ True False False False  True]]
--------------------
[7 9 7 8 9 7 9 7 6 7 8 6 8]


In [153]:
a = np.random.randint(1,10, (5,5))
print(a)

print("-"*20)
print("a[a < 3]")
b = a[a < 3]
print(b)

print("-"*20)
print("a[a % 2 == 0]")
b = a[a % 2 == 0]
print(b)

print("-"*20)
print("a[a >= 5]")
b = a[a >= 5]
print(b)

[[9 7 5 5 8]
 [7 1 5 5 3]
 [5 7 5 3 9]
 [7 9 5 9 8]
 [9 9 6 4 7]]
--------------------
a[a < 3]
[1]
--------------------
a[a % 2 == 0]
[8 8 6 4]
--------------------
a[a >= 5]
[9 7 5 5 8 7 5 5 5 7 5 9 7 9 5 9 8 9 9 6 7]
