# Logic, Control Flow and Filtering

Logika Boolean adalah dasar pengambilan keputusan dalam program Python. Pelajari tentang operator perbandingan yang berbeda, cara menggabungkannya dengan operator Boolean, dan cara menggunakan hasil Boolean dalam struktur kontrol. Anda juga akan belajar memfilter data dalam panda DataFrames menggunakan logika.

## Comparison Operators

### Equality

Untuk memeriksa apakah dua nilai Python, atau variabel, sama, Anda dapat menggunakan `==`. Untuk memeriksa ketimpangan, Anda perlu `!=`. Sebagai penyegar, lihat contoh berikut yang semuanya menghasilkan `True`. 

In [1]:
print(2 == (1 + 1))
print("intermediate" != "python")
print(True != False)
print("Python" != "python")

True
True
True
True


In [2]:
# Comparison of booleans
print(True == False)

# Comparison of integers
print(-5 * 15 != 75)

# Comparison of strings
print("pyscript" == "PyScript")

# Compare a boolean with an integer
print(True == 1)

False
True
False
True


**Note** : Perbandingan terakhir bekerja dengan baik karena sebenarnya, boolean adalah jenis integer khusus: `True` berkorespondensi dengan `1`, `False` berkorespondensi dengan `0`.

### Greater and less than

Anda dapat menggabungkan dengan tanda sama dengan: `<=` dan `>=` . Perhatikan: `<=` adalah sintaks yang valid, tetapi `=<` tidak valid.

Semua ekspresi Python dalam potongan kode berikut mengevaluasi ke `True` :

In [3]:
print(3 < 4)
print(3 <= 4)
print("alpha" <= "beta")

True
True
True


**Note** : Ingat bahwa untuk perbandingan string, Python menentukan hubungan berdasarkan urutan alfabet.

In [4]:
# Comparison of integers
x = -3 * 6
print(x >= -10)

# Comparison of strings
y = "test"
print("test" <= y)

# Comparison of booleans
print(True > False)

False
True
True


### Compare arrays

In [5]:
# Create arrays
import numpy as np
my_house = np.array([18.0, 20.0, 10.75, 9.50])
your_house = np.array([14.0, 24.0, 14.25, 9.0])

# my_house greater than or equal to 18
print(my_house >= 18)

# my_house less than your_house
print(my_house < your_house)

[ True  True False False]
[False  True  True False]


## Boolean Operators

### and, or, not

Boolean bernilai `1` atau `0`, `True` atau `False`. Dengan operator boolean seperti `and`, `or` dan `not`, Anda dapat menggabungkan boolean ini untuk melakukan kueri lebih lanjut pada data Anda.

In [6]:
# Define variables
my_kitchen = 18.0
your_kitchen = 14.0

# my_kitchen bigger than 10 and smaller than 18?
print(my_kitchen > 10 and my_kitchen < 18)

# my_kitchen smaller than 14 or bigger than 17?
print(my_kitchen < 14 or my_kitchen > 17)

# Double my_kitchen smaller than triple your_kitchen?
print(my_kitchen * 2 < your_kitchen * 3)

False
True
True


Untuk melihat apakah Anda benar-benar memahami operator boolean, lihat potongan kode Python berikut:

In [7]:
x = 8
y = 9
not(not(x < 3) and not(y > 14 or y > 10))

False

**Note** : Perhatikan bahwa `not` memiliki prioritas lebih tinggi dari `and` dan `or`, itu dijalankan terlebih dahulu.

### Boolean operators with Numpy

Sebelumnya, operator operasional seperti `<` dan `>=` bekerja dengan array Numpy di luar kotak. Sayangnya, ini tidak benar untuk operator boolean seperti `and`, `or`, dan `not`.

Untuk menggunakan operator ini dengan Numpy, Anda perlu `np.logical_and()`, `np.logical_or()` dan `np.logical_not()`. Berikut ini contoh di array `my_house` dan `your_house` dari sebelumnya untuk memberi Anda ide:

In [9]:
np.logical_and(my_house > 13, your_house < 15)

array([ True, False, False, False])

In [10]:
# Create arrays
import numpy as np
my_house = np.array([18.0, 20.0, 10.75, 9.50])
your_house = np.array([14.0, 24.0, 14.25, 9.0])

# my_house greater than 18.5 or smaller than 10
print(np.logical_or(my_house > 18.5, my_house < 10))

# Both my_house and your_house smaller than 11
print(np.logical_and(my_house < 11, your_house < 11))

[False  True False  True]
[False False False  True]


## if, elif, else

### Warmup

Untuk bereksperimen dengan `if` dan `else` lain, lihat contoh kode ini:

In [11]:
area = 10.0
if(area < 9) :
    print("small")
elif(area < 12) :
    print("medium")
else :
    print("large")

medium


### if

Dua variabel didefinisikan dalam kode sampel: `room`, string yang memberi tahu Anda kamar rumah yang sedang kita lihat, dan `area`, area kamar itu.

In [12]:
# Define variables
room = "kit"
area = 14.0

# if statement for room
if room == "kit" :
    print("looking around in the kitchen.")

# if statement for area
if area > 15 :
    print("big place!")

looking around in the kitchen.


**Note** : `"big place!"` tidak dicetak karena, `area` tidak lebih dari `15`

### Add else

In [13]:
# Define variables
room = "kit"
area = 14.0

# if-else construct for room
if room == "kit" :
    print("looking around in the kitchen.")
else :
    print("looking around elsewhere.")

# if-else construct for area
if area > 15 :
    print("big place!")
else :
    print("pretty small.")

looking around in the kitchen.
pretty small.


### elif

In [14]:
# Define variables
room = "bed"
area = 14.0

# if-elif-else construct for room
if room == "kit" :
    print("looking around in the kitchen.")
elif room == "bed":
    print("looking around in the bedroom.")
else :
    print("looking around elsewhere.")

# if-elif-else construct for area
if area > 15 :
    print("big place!")
elif area > 10 :
    print("medium size, nice!")
else :
    print("pretty small.")

looking around in the bedroom.
medium size, nice!


## Filtering Pandas DataFrame

### Driving right

Ingat dataset `cars` ?, yang berisi mobil per 1000 orang (`cars_per_cap`) dan apakah orang menyetir sebelah kanan (`drive_right`) untuk negara yang berbeda (`country`).

Anda melihat pendekatan langkah demi langkah untuk memfilter pengamatan dari DataFrame berdasarkan boolean array. Mari kita mulai dari yang sederhana dan mencoba untuk menemukan semua pengamatan pada datasets `cars` di mana `drives_right` adalah `True`.

`drives_right` adalah kolom boolean, jadi Anda harus mengekstraknya sebagai Series dan kemudian menggunakan Series boolean ini untuk memilih pengamatan dari `cars`.

In [15]:
# Import cars data
import pandas as pd
cars_data = 'https://assets.datacamp.com/production/repositories/287/datasets/79b3c22c47a2f45a800c62cae39035ff2ea4e609/cars.csv'
cars = pd.read_csv(cars_data, index_col = 0)

# Extract drives_right column as Series: dr
dr = cars['drives_right']

# Use dr to subset cars: sel
sel = cars[dr]

# Print sel
print(sel)

     cars_per_cap        country  drives_right
US            809  United States          True
RU            200         Russia          True
MOR            70        Morocco          True
EG             45          Egypt          True


Kode dalam contoh sebelumnya berfungsi dengan baik, tetapi Anda sebenarnya tidak perlu membuat variabel `dr` baru. Anda dapat mencapai hasil yang sama tanpa variabel perantara ini. Masukkan kode yang menghitung `dr` langsung ke kurung siku yang memilih pengamatan dari `cars`.

In [16]:
# Convert code to a one-liner
sel = cars[cars['drives_right']]

# Print sel
print(sel)

     cars_per_cap        country  drives_right
US            809  United States          True
RU            200         Russia          True
MOR            70        Morocco          True
EG             45          Egypt          True


### Cars per capita

Kali ini Anda ingin mengetahui negara mana yang memiliki angka mobil per kapita tinggi. Dengan kata lain, di negara mana banyak orang memiliki mobil, atau mungkin beberapa mobil.

Mirip dengan contoh sebelumnya, Anda akan ingin membangun Series boolean, yang kemudian dapat Anda gunakan untuk mengatur ulang `cars` DataFrame untuk memilih pengamatan tertentu. Jika Anda ingin melakukan ini dalam satu-liner, itu baik-baik saja!

In [17]:
# Import cars data
import pandas as pd
cars = pd.read_csv(cars_data, index_col = 0)

# Create car_maniac: observations that have a cars_per_cap over 500
cpc = cars['cars_per_cap']
many_cars = cpc > 500
car_maniac = cars[many_cars]

# Print car_maniac
print(car_maniac)

     cars_per_cap        country  drives_right
US            809  United States          True
AUS           731      Australia         False
JAP           588          Japan         False


Ingat tentang `np.logical_and()`, `np.logical_or()` dan `np.logical_not()`, varian Numpy dari operator `and`, `or` dan `not` ? Anda juga dapat menggunakannya pada Series Pandas untuk melakukan operasi filtering lebih lanjut.

In [18]:
# Create medium: observations with cars_per_cap between 100 and 500
cpc = cars['cars_per_cap']
between = np.logical_and(cpc > 100, cpc < 500)
medium = cars[between]

# Print medium
print(medium)

    cars_per_cap country  drives_right
RU           200  Russia          True
