# Indeksowanie i wybór w NumPy

W tej lekcji omówimy, jak wybierać pojedyncze elementy lub ich grupy z tablicy.

In [1]:
import numpy as np

In [2]:
#Creating sample array
arr = np.arange(0,11)

In [3]:
#Show
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

## Indeksowanie nawiasami i wybieranie
Najprostszą metodą pobrania wybranych elementów tablicy jest podejście bardzo podobne do list w Pythonie:

In [4]:
#Get a value at an index
arr[8]

np.int64(8)

In [5]:
#Get values in a range
arr[1:5]

array([1, 2, 3, 4])

In [6]:
#Get values in a range
arr[0:5]

array([0, 1, 2, 3, 4])

## Broadcasting

Tablice NumPy różnią się od zwykłych list Pythona możliwością broadcastingu. W listach możesz podmienić fragment tylko na nową listę o tym samym rozmiarze i kształcie. Jeśli chcesz zastąpić pierwszych 5 elementów listy jedną wartością, musisz przekazać nową listę pięciu elementów. W tablicach NumPy możesz rozgłosić pojedynczą wartość na większy zbiór elementów:

In [7]:
#Setting a value with index range (Broadcasting)
arr[0:5]=100

#Show
arr

array([100, 100, 100, 100, 100,   5,   6,   7,   8,   9,  10])

In [8]:
# Reset array, we'll see why I had to reset in  a moment
arr = np.arange(0,11)

#Show
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [9]:
#Important notes on Slices
slice_of_arr = arr[0:6]

#Show slice
slice_of_arr

array([0, 1, 2, 3, 4, 5])

In [10]:
#Change Slice
slice_of_arr[:]=99

#Show Slice again
slice_of_arr

array([99, 99, 99, 99, 99, 99])

Zauważ, że zmiany pojawiły się również w naszej oryginalnej tablicy!

In [11]:
arr

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

Dane nie są kopiowane, to tylko widok oryginalnej tablicy! Dzięki temu unikamy problemów z pamięcią.

In [12]:
#To get a copy, need to be explicit
arr_copy = arr.copy()

arr_copy

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

In [9]:
np.array([1, 2, 3]) + 5  # [1, 2, 3] + [5, 5, 5]

array([6, 7, 8])

In [13]:
np.ones((3, 3)) + np.array([1, 2, 3])

array([[2., 3., 4.],
       [2., 3., 4.],
       [2., 3., 4.]])

## Indeksowanie tablic 2D (macierzy)

Ogólny zapis to **arr_2d[row][col]** lub **arr_2d[row,col]**. Dla czytelności polecam zapis z przecinkiem.

In [18]:
arr_2d = np.array(([5,10,15],[20,25,30],[35,40,45]))

#Show
arr_2d

array([[ 5, 10, 15],
       [20, 25, 30],
       [35, 40, 45]])

In [19]:
#Indexing row
arr_2d[1]

array([20, 25, 30])

In [20]:
# Format is arr_2d[row][col] or arr_2d[row,col]

# Getting individual element value
arr_2d[1][0]

np.int64(20)

In [21]:
# Getting individual element value
arr_2d[1,0]

np.int64(20)

In [23]:
# 2D array slicing

#Shape (2,2) from top right corner
arr_2d[:2,1:]

array([[10, 15],
       [25, 30]])

In [24]:
#Shape bottom row
arr_2d[2]

array([35, 40, 45])

In [25]:
#Shape bottom row
arr_2d[2,:]

array([35, 40, 45])

## Więcej pomocy w indeksowaniu
Indeksowanie macierzy 2D może być początkowo mylące, zwłaszcza gdy dodajesz parametr kroku. Wyszukaj w Google grafiki hasło *NumPy indexing*, aby zobaczyć przydatne ilustracje, takie jak ta:

<img src= 'numpy_indexing.png' width=500/> Źródło grafiki: http://www.scipy-lectures.org/intro/numpy/numpy.html

## Wybór warunkowy

To kluczowy koncept, który później bezpośrednio przeniesiemy do biblioteki pandas, dlatego warto go dobrze zrozumieć!

Przejdźmy krótko przez to, jak używać nawiasów do wybierania elementów na podstawie operatorów porównań.

In [26]:
arr = np.arange(1,11)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [27]:
arr > 4

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [28]:
bool_arr = arr>4

In [29]:
bool_arr

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [30]:
arr[bool_arr]

array([ 5,  6,  7,  8,  9, 10])

In [31]:
arr[arr>2]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

In [33]:
x = 2
arr[(arr>x) & (arr % 2 == 0)]

array([ 4,  6,  8, 10])

# Świetna robota!