# 3. Gaining efficiencies

Bab ini membahas tip dan trik efisiensi yang lebih kompleks. Anda akan belajar beberapa modul bawaan yang berguna untuk menulis kode efisien dan berlatih menggunakan teori himpunan (`set`). Anda kemudian akan belajar tentang pola looping dalam Python dan cara membuatnya lebih efisien.

## Efciently combining, counting, and iterating

### Pokémon Overview

* **Trainers** (mengumpulkan Pokémon)
* **Pokémon** (karakter binatang fiksi)
* **Pokédex** (perbekalan yang digunakan untuk menangkap Pokémon)

<img src="datasets/pokemon-overview.png" width=500px height=500px align=left />

### Pokémon Description

<img src="datasets/pokemon-desc.png" width=600px height=600px align=left />

### Combining objects

In [2]:
names = ['Bulbasaur', 'Charmander', 'Squirtle']
hps = [45, 39, 44]

In [3]:
combined = []

for i, pokemon in enumerate(names):
    combined.append((pokemon, hps[i]))
print(combined)

[('Bulbasaur', 45), ('Charmander', 39), ('Squirtle', 44)]


### Combining objects with `zip`

In [7]:
combined_zip = zip(names, hps)
print(type(combined_zip))

<class 'zip'>


In [8]:
combined_zip_list = [*combined_zip]
print(combined_zip_list)

[('Bulbasaur', 45), ('Charmander', 39), ('Squirtle', 44)]


### The collections module

* Part of Python's Standard Library (built-in module)
* Specialized container datatypes
  * Alternatives to general purpose dict, list, set, and tuple
* Notable:
  * `namedtuple` :tuple subclass dengan bidang bernama
  * `deque` : container seperti list dengan *appends* dan *pops* yang lebih cepat
  * `Counter` : dict untuk menghitung objek hashable
  * `OrderedDict` : dict yang mempertahankan urutan entri
  * `defaultdict` : dict yang memanggil *factory function* untuk melengkapi missing values

### Counting with loop

In [11]:
import pandas as pd

pokemon = pd.read_csv("datasets/pokemon.csv")

In [15]:
# Each Pokémon's type (800 total)
poke_types = pokemon['Type 1'].to_list()

type_counts = {}

for poke_type in poke_types:
    if poke_type not in type_counts:
        type_counts[poke_type] = 1
    else:
        type_counts[poke_type] += 1
        
print(type_counts)

{'Grass': 70, 'Fire': 52, 'Water': 112, 'Bug': 69, 'Normal': 98, 'Poison': 28, 'Electric': 44, 'Ground': 32, 'Fairy': 17, 'Fighting': 27, 'Psychic': 57, 'Rock': 44, 'Ghost': 32, 'Ice': 24, 'Dragon': 32, 'Dark': 31, 'Steel': 27, 'Flying': 4}


### collections.Counter()

In [16]:
from collections import Counter

type_counts = Counter(poke_types)
print(type_counts)

Counter({'Water': 112, 'Normal': 98, 'Grass': 70, 'Bug': 69, 'Psychic': 57, 'Fire': 52, 'Electric': 44, 'Rock': 44, 'Ground': 32, 'Ghost': 32, 'Dragon': 32, 'Dark': 31, 'Poison': 28, 'Fighting': 27, 'Steel': 27, 'Ice': 24, 'Fairy': 17, 'Flying': 4})


### The itertools module

* Bagian dari Library Standar Python (modul bawaan)
* Alat fungsional untuk membuat dan menggunakan iterator
* Notable:
  * Innite iterators: `count`, `cycle`, `repeat`
  * Finite iterators: `accumulate`, `chain`, `zip_longest`, etc.
  * **Combination generators: `product`, `permutations`, `combinations`**

### Combinations with loop

In [18]:
poke_types = ['Bug', 'Fire', 'Ghost', 'Grass', 'Water']
combos = []

for x in poke_types:
    for y in poke_types:
        if x == y:
            continue
        if ((x, y) not in combos) & ((y, x) not in combos):
            combos.append((x, y))
            
print(combos)

[('Bug', 'Fire'), ('Bug', 'Ghost'), ('Bug', 'Grass'), ('Bug', 'Water'), ('Fire', 'Ghost'), ('Fire', 'Grass'), ('Fire', 'Water'), ('Ghost', 'Grass'), ('Ghost', 'Water'), ('Grass', 'Water')]


### itertools.combinations()

In [26]:
from itertools import combinations

combos_obj = combinations(poke_types, 2)
print(type(combos_obj))

<class 'itertools.combinations'>


In [27]:
combos = [*combos_obj]
print(combos)

[('Bug', 'Fire'), ('Bug', 'Ghost'), ('Bug', 'Grass'), ('Bug', 'Water'), ('Fire', 'Ghost'), ('Fire', 'Grass'), ('Fire', 'Water'), ('Ghost', 'Grass'), ('Ghost', 'Water'), ('Grass', 'Water')]


### Combining Pokémon names and types

Tiga list telah dimasukkan ke dalam sesi Anda dari dataset yang berisi 800 Pokémon:

* List `names` berisi nama masing-masing Pokémon.
* List `primary_types` berisi tipe primer yang sesuai dari masing-masing Pokémon.
* List `secondary_types` berisi tipe sekunder yang sesuai dari setiap Pokemon (`nan` jika Pokemon hanya memiliki satu jenis).

Kami ingin menggabungkan masing-masing nama dan tipe Pokemon sehingga Anda dapat dengan mudah melihat deskripsi dari masing-masing Pokemon. Berlatih menggunakan `zip()` untuk menyelesaikan tugas ini.

In [30]:
# Create list pokemon
names = pokemon['Name'].to_list()
primary_types = pokemon['Type 1'].to_list()
secondary_types = pokemon['Type 2'].to_list()

In [31]:
# Combine names and primary_types
names_type1 = [*zip(names, primary_types)]

print(*names_type1[:5], sep='\n')

('Bulbasaur', 'Grass')
('Ivysaur', 'Grass')
('Venusaur', 'Grass')
('VenusaurMega Venusaur', 'Grass')
('Charmander', 'Fire')


In [32]:
# Combine all three lists together
names_types = [*zip(names, primary_types, secondary_types)]

print(*names_types[:5], sep='\n')

('Bulbasaur', 'Grass', 'Poison')
('Ivysaur', 'Grass', 'Poison')
('Venusaur', 'Grass', 'Poison')
('VenusaurMega Venusaur', 'Grass', 'Poison')
('Charmander', 'Fire', nan)


In [33]:
# Combine five items from names and three items from primary_types
differing_lengths = [*zip(names[:6], primary_types[:3])]

print(*differing_lengths, sep='\n')

('Bulbasaur', 'Grass')
('Ivysaur', 'Grass')
('Venusaur', 'Grass')


**Note** : Anda berlatih menggunakan `zip()` untuk menggabungkan beberapa objek menjadi satu. Ini adalah fungsi yang bagus yang memungkinkan Anda untuk dengan mudah menggabungkan dua atau lebih objek.

Apakah Anda memperhatikan bahwa jika Anda memberikan `zip()` dengan objek panjang yang berbeda, itu hanya akan digabung sampai objek terkecil yang panjangnya habis?

### Counting Pokémon from a sample

* List `generations` berisi generasi yang sesuai dari setiap Pokémon dalam sampel.

Anda ingin dengan cepat mengumpulkan beberapa hitungan dari list ini untuk lebih memahami sampel yang dihasilkan. Gunakan `Counter` dari modul `collections` untuk mengeksplorasi jenis-jenis Pokemon yang ada dalam sampel Anda, dari generasi mana mereka berasal, dan berapa banyak Pokemon yang memiliki nama yang dimulai dengan huruf tertentu.

In [36]:
# Create list
generations = pokemon['Generation'].to_list()

In [37]:
# Collect the count of primary types
type_count = Counter(primary_types)
print(type_count, '\n')

# Collect the count of generations
gen_count = Counter(generations)
print(gen_count, '\n')

# Use list comprehension to get each Pokémon's starting letter
starting_letters = [letter[0] for letter in names]

# Collect the count of Pokémon for each starting_letter
starting_letters_count = Counter(starting_letters)
print(starting_letters_count)

Counter({'Water': 112, 'Normal': 98, 'Grass': 70, 'Bug': 69, 'Psychic': 57, 'Fire': 52, 'Electric': 44, 'Rock': 44, 'Ground': 32, 'Ghost': 32, 'Dragon': 32, 'Dark': 31, 'Poison': 28, 'Fighting': 27, 'Steel': 27, 'Ice': 24, 'Fairy': 17, 'Flying': 4}) 

Counter({1: 166, 5: 165, 3: 160, 4: 121, 2: 106, 6: 82}) 

Counter({'S': 112, 'M': 67, 'C': 58, 'G': 58, 'P': 53, 'D': 46, 'B': 43, 'A': 42, 'T': 40, 'L': 39, 'R': 31, 'H': 31, 'K': 28, 'F': 26, 'V': 23, 'W': 23, 'E': 21, 'N': 16, 'Z': 10, 'J': 7, 'O': 6, 'I': 5, 'U': 5, 'Q': 4, 'Y': 4, 'X': 2})


**Note** : Anda menggunakan `Counter` dari modul `collections` untuk lebih memahami sampel 500 Pokémon yang dihasilkan. Jenis Pokemon yang paling umum dari sampel adalah `'Water'` dan jenis Pokemon yang paling tidak umum dari sampel adalah `'Fairy'` dan `'Flying'`. Apakah Anda juga memperhatikan bahwa sebagian besar Pokemon dalam sampel berasal dari generasi `1` dan memiliki huruf awal `'S'`?

### Combinations of Pokémon

Ash, seorang pelatih Pokémon, bertemu sekelompok lima Pokémon. Pokemon ini telah dimuat ke dalam list `pokemon`.

In [38]:
pokemon = ['Geodude', 'Cubone', 'Lickitung', 'Persian', 'Diglett']

In [39]:
# Import combinations from itertools
from itertools import combinations

# Create a combination object with pairs of Pokémon
combos_obj = combinations(pokemon, 2)
print(type(combos_obj), '\n')

# Convert combos_obj to a list by unpacking
combos_2 = [*combos_obj]
print(combos_2, '\n')

# Collect all possible combinations of 4 Pokémon directly into a list
combos_4 = [*combinations(pokemon, 4)]
print(combos_4)

<class 'itertools.combinations'> 

[('Geodude', 'Cubone'), ('Geodude', 'Lickitung'), ('Geodude', 'Persian'), ('Geodude', 'Diglett'), ('Cubone', 'Lickitung'), ('Cubone', 'Persian'), ('Cubone', 'Diglett'), ('Lickitung', 'Persian'), ('Lickitung', 'Diglett'), ('Persian', 'Diglett')] 

[('Geodude', 'Cubone', 'Lickitung', 'Persian'), ('Geodude', 'Cubone', 'Lickitung', 'Diglett'), ('Geodude', 'Cubone', 'Persian', 'Diglett'), ('Geodude', 'Lickitung', 'Persian', 'Diglett'), ('Cubone', 'Lickitung', 'Persian', 'Diglett')]


**Note** : Anda menggunakan `combinations()` dari `itertools` untuk mengumpulkan berbagai kombinasi-tupel dari list. `combinations()` memungkinkan Anda menentukan ukuran kombinasi apa pun dengan melewatkan bilangan bulat sebagai argumen kedua. Ash memiliki `10` opsi kombinasi ketika Pokédex-nya hanya dapat menyimpan dua Pokémon. Ia memiliki `5` opsi kombinasi ketika Pokédex-nya dapat menyimpan empat Pokémon.

## Set theory

* Cabang Matematika yang diterapkan pada collections dari objek
  * i.e., `sets`
* Python memiliki tipe data `set` bawaan dengan metode yang menyertai:
  * `intersection()` : semua elemen yang ada di kedua set
  * `difference()` : semua elemen dalam satu set tetapi tidak yang lain
  * `symmetric_difference()` : semua elemen dalam satu set
  * `union()` : semua elemen yang ada di antara set
* Fast membership testing
  * Periksa apakah ada nilai dalam urutan atau tidak
  * Menggunakan operator `in`

### Comparing objects with loops

<img src="datasets/compare-pokemon.png" width=700px height=700px align=left />

In [40]:
list_a = ['Bulbasaur', 'Charmander', 'Squirtle']
list_b = ['Caterpie', 'Pidgey', 'Squirtle']

In [41]:
# for-loop
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)
            
print(in_common)

['Squirtle']


In [50]:
set_a = set(list_a)
print(set_a)

{'Charmander', 'Squirtle', 'Bulbasaur'}


In [51]:
set_b = set(list_b)
print(set_b)

{'Caterpie', 'Pidgey', 'Squirtle'}


In [52]:
set_a.intersection(set_b)

{'Squirtle'}

### Efciency gained with settheory

In [53]:
%%timeit
in_common = []

for pokemon_a in list_a:
    for pokemon_b in list_b:
        if pokemon_a == pokemon_b:
            in_common.append(pokemon_a)

917 ns ± 19.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [54]:
%timeit in_common = set_a.intersection(set_b)

222 ns ± 3.04 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


### Set method: `difference`

In [56]:
set_a = {'Bulbasaur', 'Charmander', 'Squirtle'}
set_b = {'Caterpie', 'Pidgey', 'Squirtle'}

In [57]:
set_a.difference(set_b)

{'Bulbasaur', 'Charmander'}

In [59]:
set_b.difference(set_a)

{'Caterpie', 'Pidgey'}

### Set method: `symmetric_difference`

In [60]:
set_a.symmetric_difference(set_b)

{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey'}

### Set method: `union`

In [61]:
set_a.union(set_b)

{'Bulbasaur', 'Caterpie', 'Charmander', 'Pidgey', 'Squirtle'}

### Membership testing with sets

In [143]:
pokemon = pd.read_csv("datasets/pokemon.csv", nrows=720)

# The same 720 total Pokémon in each data structure
names_list = pokemon['Name'].to_list()
names_tuple = tuple(pokemon['Name'])
names_set = set(pokemon['Name'])

In [72]:
%timeit 'Zubat' in names_list

772 ns ± 2.21 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [73]:
%timeit 'Zubat' in names_tuple

733 ns ± 2.66 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [74]:
%timeit 'Zubat' in names_set

53.7 ns ± 0.218 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


### Uniques with sets

In [76]:
unique_types = []

for prim_type in primary_types:
    if prim_type not in unique_types:
        unique_types.append(prim_type)
        
print(unique_types)

['Grass', 'Fire', 'Water', 'Bug', 'Normal', 'Poison', 'Electric', 'Ground', 'Fairy', 'Fighting', 'Psychic', 'Rock', 'Ghost', 'Ice', 'Dragon', 'Dark', 'Steel', 'Flying']


In [78]:
unique_types_set = set(primary_types)
print(unique_types_set)

{'Water', 'Rock', 'Fire', 'Dark', 'Ghost', 'Electric', 'Fighting', 'Dragon', 'Poison', 'Steel', 'Ground', 'Psychic', 'Fairy', 'Ice', 'Flying', 'Bug', 'Normal', 'Grass'}


### Comparing Pokédexes

Dua pelatih Pokémon, Ash dan Misty, ingin membandingkan koleksi Pokémon masing-masing. Mari kita lihat apa kesamaan Pokémon mereka dan apa yang dimiliki oleh Pokemon Ash yang tidak dimiliki Misty.

Pokédex Ash dan Misty (kumpulan Pokémon mereka) telah dimuat ke dalam sesi Anda sebagai list yang disebut `ash_pokedex` dan `misty_pokedex`.

In [79]:
ash_pokedex = ['Pikachu', 'Bulbasaur', 'Koffing', 'Spearow', 'Vulpix', 'Wigglytuff', 'Zubat', 'Rattata', 'Psyduck', 'Squirtle']
misty_pokedex = ['Krabby', 'Horsea', 'Slowbro', 'Tentacool', 'Vaporeon', 'Magikarp', 'Poliwag', 'Starmie', 'Psyduck', 'Squirtle']


In [80]:
# Convert both lists to sets
ash_set = set(ash_pokedex)
misty_set = set(misty_pokedex)

# Find the Pokémon that exist in both sets
both = ash_set.intersection(misty_set)
print(both)

# Find the Pokémon that Ash has and Misty does not have
ash_only = ash_set.difference(misty_set)
print(ash_only)

# Find the Pokémon that are in only one set (not both)
unique_to_set = ash_set.symmetric_difference(misty_set)
print(unique_to_set)

{'Psyduck', 'Squirtle'}
{'Rattata', 'Vulpix', 'Spearow', 'Koffing', 'Bulbasaur', 'Wigglytuff', 'Zubat', 'Pikachu'}
{'Vaporeon', 'Tentacool', 'Pikachu', 'Horsea', 'Starmie', 'Slowbro', 'Krabby', 'Vulpix', 'Poliwag', 'Rattata', 'Spearow', 'Koffing', 'Wigglytuff', 'Zubat', 'Magikarp', 'Bulbasaur'}


**Note** : Menggunakan `set` memungkinkan Anda melakukan beberapa perbandingan keren antara objek tanpa perlu menulis `for` loop. Dengan beberapa baris kode, Anda dapat melihat bahwa Ash dan Misty memiliki `'Psyduck'` dan `'Squirtle'` di Pokédex mereka. Anda juga dapat melihat bahwa Ash memiliki `8` Pokémon yang tidak dimiliki Misty.

### Searching for Pokémon

Anda ingin melihat apakah Pokémon tertentu adalah anggota Pokédex Ash atau Brock.

Mari kita bandingkan menggunakan `set` vs `list` saat melakukan pengujian keanggotaan ini.

In [81]:
brock_pokedex = ['Onix', 'Geodude', 'Zubat', 'Golem', 'Vulpix', 'Tauros', 'Kabutops', 'Omastar', 'Machop', 'Dugtrio']

In [83]:
# Convert Brock's Pokédex to a set
brock_pokedex_set = set(brock_pokedex)
print(brock_pokedex_set)

# Check if Psyduck is in Ash's list and Brock's set
print('Psyduck' in ash_pokedex)
print('Psyduck' in brock_pokedex_set)

# Check if Machop is in Ash's list and Brock's set
print('Machop' in ash_pokedex)
print('Machop' in brock_pokedex_set)

{'Onix', 'Tauros', 'Golem', 'Dugtrio', 'Omastar', 'Geodude', 'Vulpix', 'Machop', 'Zubat', 'Kabutops'}
True
False
False
True


**Question**

Di dalam konsol IPython Anda, gunakan `%timeit` untuk membandingkan pengujian keanggotaan untuk `'Psyduck'` dan untuk `'Machop'` di `ash_pokedex` dan `brock_pokedex_set` (total **empat timing berbeda**).

Tes keanggotaan mana yang lebih cepat?

In [84]:
%timeit 'Psyduck' in ash_pokedex

189 ns ± 0.388 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In [85]:
%timeit 'Psyduck' in brock_pokedex_set

44.5 ns ± 0.124 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In [86]:
%timeit 'Machop' in ash_pokedex

205 ns ± 0.964 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [87]:
%timeit 'Machop' in brock_pokedex_set

48.5 ns ± 0.143 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


**Answer** : Pengujian keanggotaan jauh lebih cepat ketika Anda menggunakan `set`. Apakah Anda memperhatikan bahwa menggunakan `set` untuk pengujian anggota lebih cepat daripada menggunakan list terlepas dari apakah item yang Anda periksa ada dalam set? Memeriksa `'Psyduck'` (yang tidak ada di set Brock) masih lebih cepat daripada memeriksa `'Psyduck'` dalam daftar Ash!

### Gathering unique Pokémon

Fungsi di bawah ini ditulis untuk mengumpulkan nilai unik dari setiap list:

In [89]:
def find_unique_items(data):
    uniques = []

    for item in data:
        if item not in uniques:
            uniques.append(item)

    return uniques

Mari kita bandingkan fungsi di atas dengan menggunakan tipe data `set` untuk mengumpulkan item unik.

In [92]:
# Use find_unique_items() to collect unique Pokémon names
uniq_names_func = find_unique_items(names)
print(len(uniq_names_func))

# Convert the names list to a set to collect unique Pokémon names
uniq_names_set = set(names)
print(len(uniq_names_set))

# Check that both unique collections are equivalent
print(sorted(uniq_names_func) == sorted(uniq_names_set))

800
800
True


**Question**

Gunakan `%timeit` untuk membandingkan fungsi `find_unique_items()` dengan menggunakan tipe data `set` untuk mengumpulkan nama karakter Pokemon yang unik dalam `set`.

In [93]:
%timeit find_unique_items(names)

5.71 ms ± 21.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [94]:
%timeit set(names)

23 µs ± 110 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


**Answer** : Menggunakan `set` untuk mengumpulkan nilai unik lebih cepat.

In [95]:
# Use the best approach to collect unique primary types and generations
uniq_types = set(primary_types) 
uniq_gens = set(generations)
print(uniq_types, uniq_gens, sep='\n')

{'Water', 'Rock', 'Fire', 'Dark', 'Ghost', 'Electric', 'Fighting', 'Dragon', 'Poison', 'Steel', 'Ground', 'Psychic', 'Fairy', 'Ice', 'Flying', 'Bug', 'Normal', 'Grass'}
{1, 2, 3, 4, 5, 6}


**Note** : Menggunakan tipe data `set` untuk mengumpulkan nilai unik jauh lebih cepat daripada menggunakan `for` loop (seperti pada fungsi `find_unique_items ()`). Karena `set` didefinisikan sebagai kumpulan elemen yang berbeda, itu adalah cara yang efisien untuk mengumpulkan item unik dari objek yang ada. Di sini Anda mengambil keuntungan dari `set` untuk menemukan Pokemon yang berbeda dari sampel (menghilangkan Pokemon duplikat) dan melihat jenis dan generasi Pokémon unik apa yang termasuk dalam sampel.

## Eliminating loops

### Looping in Python

* Looping patterns:
  * `for` loop: iterate secara berurutan sepotong demi sepotong
  * `while` loop: ulangi loop selama kondisi terpenuhi
  * "nested" loops: gunakan satu loop di dalam loop lain
  * Costly!

### Benets of eliminating loops

* Lebih sedikit baris kode
* Keterbacaan kode yang lebih baik
  * "Flat lebih baik daripada bersarang/nested"
* Keuntungan efisiensi

### Eliminating loops with built-ins

In [96]:
pokemon.head()

Unnamed: 0,#,Name,Type 1,Type 2,Total,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
0,1,Bulbasaur,Grass,Poison,318,45,49,49,65,65,45,1,False
1,2,Ivysaur,Grass,Poison,405,60,62,63,80,80,60,1,False
2,3,Venusaur,Grass,Poison,525,80,82,83,100,100,80,1,False
3,3,VenusaurMega Venusaur,Grass,Poison,625,80,100,123,122,120,80,1,False
4,4,Charmander,Fire,,309,39,52,43,60,50,65,1,False


In [102]:
# List of HP, Attack, Defense, Speed
poke_stats = pokemon[['HP', 'Attack', 'Defense', 'Speed']].values.tolist()

In [104]:
# For loop approach
totals = []
for row in poke_stats:
    totals.append(sum(row))
    
# List comprehension
totals_comp = [sum(row) for row in poke_stats]

# Built-in map() function
totals_map = [*map(sum, poke_stats)]

In [105]:
%%timeit
totals = []
for row in poke_stats:
    totals.append(sum(row))

156 µs ± 284 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [106]:
%timeit totals_comp = [sum(row) for row in poke_stats]

125 µs ± 743 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [107]:
%timeit totals_map = [*map(sum, poke_stats)]

89.6 µs ± 313 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### Eliminating loops with built-in modules

In [110]:
poke_types = ['Bug', 'Fire', 'Ghost', 'Grass', 'Water']

In [111]:
# Nested for loop approach
combos = []

for x in poke_types:
    for y in poke_types:
        if x == y:
            continue
        if ((x,y) not in combos) & ((y,x) not in combos):
            combos.append((x,y))

In [112]:
# Built-in module approach
from itertools import combinations

combos2 = [*combinations(poke_types, 2)]

### Eliminate loops with NumPy

In [113]:
# Array of HP, Attack, Defense, Speed
import numpy as np

poke_stats = pokemon[['HP', 'Attack', 'Defense', 'Speed']].values

In [116]:
avgs = []
for row in poke_stats:
    avg = np.mean(row)
    avgs.append(avg)
print(avgs[:10])

[47.0, 61.25, 81.25, 95.75, 49.75, 65.0, 85.0, 104.75, 90.0, 50.0]


In [120]:
avgs_np = poke_stats.mean(axis=1)
print(avgs_np[:10])

[ 47.    61.25  81.25  95.75  49.75  65.    85.   104.75  90.    50.  ]


In [121]:
%timeit avgs = poke_stats.mean(axis=1)

16.4 µs ± 369 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [122]:
%%timeit
avgs = []
for row in poke_stats:
    avg = np.mean(row)
    avgs.append(avg)

6.02 ms ± 162 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### Gathering Pokémon without a loop

List yang berisi 720 Pokémon telah dimuat sebagai `poke_names` dan list yang berisi setiap generasi Pokemon `poke_gens`.

In [124]:
poke_names = pokemon['Name'].tolist()
poke_gens = pokemon['Generation'].tolist()

`for` loop telah dibuat untuk memfilter Pokemon yang dimiliki oleh generasi satu atau dua, dan mengumpulkan jumlah huruf dalam setiap nama Pokémon:

In [126]:
gen1_gen2_name_lengths_loop = []

for name,gen in zip(poke_names, poke_gens):
    if gen < 3:
        name_length = len(name)
        poke_tuple = (name, name_length)
        gen1_gen2_name_lengths_loop.append(poke_tuple)

In [128]:
# Collect Pokémon that belong to generation 1 or generation 2
gen1_gen2_pokemon = [name for name,gen in zip(poke_names, poke_gens) if gen < 3]

# Create a map object that stores the name lengths
name_lengths_map = map(len, gen1_gen2_pokemon)

# Combine gen1_gen2_pokemon and name_lengths_map into a list
gen1_gen2_name_lengths = [*zip(gen1_gen2_pokemon, name_lengths_map)]

print(gen1_gen2_name_lengths_loop[:5])
print(gen1_gen2_name_lengths[:5])

[('Bulbasaur', 9), ('Ivysaur', 7), ('Venusaur', 8), ('VenusaurMega Venusaur', 21), ('Charmander', 10)]
[('Bulbasaur', 9), ('Ivysaur', 7), ('Venusaur', 8), ('VenusaurMega Venusaur', 21), ('Charmander', 10)]


**Note** : Anda berhasil menggunakan list comprehension dan fungsi `map()` untuk menghilangkan `for` loop. Jika Anda membandingkan runtime antara `for` loop dan list comprehension dengan fungsi `map()`, Anda akan melihat bahwa `for` loop membutuhkan waktu yang lebih lama.

Jika Anda seorang Pythonista yang berpengalaman, Anda mungkin telah memperhatikan bahwa Anda bisa mengganti keseluruhan `for` loop dengan satu list comprehension:

```python 
[(name, len(name)) for name,gen in zip(poke_names, poke_gens) if gen < 3]
```

### Pokémon totals and averages without a loop

List 720 Pokémon telah dimuat ke dalam sesi Anda yang disebut `names`. Statistik masing-masing Pokémon telah dimuat sebagai NumPy array sebagai `stats`. Setiap baris statistik sesuai dengan Pokémon `names` dan setiap kolom mewakili masing-masing statistik Pokémon (`HP`, `Attack`, `Defense`, `Special Attack`, `Special Defense`, dan `Speed`).

Anda ingin mengumpulkan nilai total setiap Pokémon (mis., Jumlah setiap baris dalam `stats`) dan nilai rata-rata setiap Pokémon (mis., Rata-rata dari setiap baris dalam `stats`) sehingga Anda menemukan Pokemon terkuat.

In [136]:
names = pokemon['Name'].tolist()
stats = pokemon[['HP', 'Attack', 'Defense', 'Sp. Atk', 'Sp. Def', 'Speed']].values

Di bawah ini `for` loop ditulis untuk mengumpulkan nilai-nilai ini:

In [137]:
poke_list = []

for pokemon,row in zip(names, stats):
    total_stats = np.sum(row)
    avg_stats = np.mean(row)
    poke_list.append((pokemon, total_stats, avg_stats))

In [138]:
# Create a total stats array
total_stats_np = stats.sum(axis=1)

# Create an average stats array
avg_stats_np = stats.mean(axis=1)

# Combine names, total_stats_np, and avg_stats_np into a list
poke_list_np = [*zip(names, total_stats_np, avg_stats_np)]

print(poke_list_np == poke_list, '\n')
print(poke_list_np[:3])
print(poke_list[:3], '\n')
top_3 = sorted(poke_list_np, key=lambda x: x[1], reverse=True)[:3]
print('3 strongest Pokémon:\n{}'.format(top_3))

True 

[('Bulbasaur', 318, 53.0), ('Ivysaur', 405, 67.5), ('Venusaur', 525, 87.5)]
[('Bulbasaur', 318, 53.0), ('Ivysaur', 405, 67.5), ('Venusaur', 525, 87.5)] 

3 strongest Pokémon:
[('MewtwoMega Mewtwo X', 780, 130.0), ('MewtwoMega Mewtwo Y', 780, 130.0), ('RayquazaMega Rayquaza', 780, 130.0)]


In [139]:
%%timeit
poke_list = []

for pokemon,row in zip(names, stats):
    total_stats = np.sum(row)
    avg_stats = np.mean(row)
    poke_list.append((pokemon, total_stats, avg_stats))

8.94 ms ± 159 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [140]:
%timeit poke_list_np = [*zip(names, total_stats_np, avg_stats_np)]

162 µs ± 2.02 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


**Note** : Anda menggunakan metode NumPy `.sum()` dan `.mean()`  dengan sumbu/axis tertentu untuk menghilangkan `for` loop. Dengan pendekatan ini, Anda dapat dengan cepat melihat bahwa 'MewtwoMega Mewtwo X', 'MewtwoMega Mewtwo Y', dan 'RayquazaMega Rayquaza' adalah Pokemon terkuat di list Anda berdasarkan statistik total.

Jika Anda mengumpulkan waktu eksekusi, `for` loop akan menghasilkan milidetik untuk mengeksekusi sementara pendekatan NumPy akan menghasilkan mikrodetik untuk mengeksekusi. Ini cukup perbaikan!

## Writing better loops

### One-time calculation loop

List bilangan bulat yang mewakili setiap generasi Pokemon telah dimuat sebagai `generations`. Anda ingin mengumpulkan jumlah setiap generasi dan menentukan persentase setiap generasi dari jumlah total bilangan bulat.

In [145]:
generations = pokemon['Generation'].tolist()

Loop di bawah ini ditulis untuk menyelesaikan tugas ini:

In [147]:
# Import Counter
from collections import Counter

# Collect the count of each generation
gen_counts = Counter(generations)

In [148]:
for gen,count in gen_counts.items():
    total_count = len(generations)
    gen_percent = round(count / total_count * 100, 2)
    print(
      'generation {}: count = {:3} percentage = {}'
      .format(gen, count, gen_percent)
    )

generation 1: count = 166 percentage = 23.06
generation 2: count = 106 percentage = 14.72
generation 3: count = 160 percentage = 22.22
generation 4: count = 121 percentage = 16.81
generation 5: count = 165 percentage = 22.92
generation 6: count =   2 percentage = 0.28


Mari buat loop ini lebih efisien dengan beralih ke perhitungan satu kali di luar loop.

In [150]:
# Improve for loop by moving one calculation above the loop
total_count = len(generations)

for gen,count in gen_counts.items():
    gen_percent = round(count / total_count * 100, 2)
    print('generation {}: count = {:3} percentage = {}'
          .format(gen, count, gen_percent))

generation 1: count = 166 percentage = 23.06
generation 2: count = 106 percentage = 14.72
generation 3: count = 160 percentage = 22.22
generation 4: count = 121 percentage = 16.81
generation 5: count = 165 percentage = 22.92
generation 6: count =   2 percentage = 0.28


**Note** : Anda melihat perhitungan yang bisa dipindahkan di luar `for` loop membuat loop lebih efisien. Karena jumlah total sekarang dihitung hanya sekali (dan tidak dengan setiap iterasi loop), Anda dapat berharap untuk melihat peningkatan efisiensi dengan loop baru Anda. Saat menulis loop tidak dapat dihindari, pastikan untuk menganalisis loop dan pindahkan perhitungan satu kali di luar.

### Holistic conversion loop

Anda ingin mengumpulkan semua pasangan Pokémon yang memungkinkan. Anda ingin menyimpan masing-masing pasangan ini dalam list individual dengan indeks yang disebutkan sebagai elemen pertama dari setiap list. Ini memungkinkan Anda untuk melihat jumlah total pasangan yang memungkinkan dan memberikan label yang diindeks untuk setiap pasangan.

In [152]:
pokemon_types = ['Bug', 'Dark', 'Dragon', 'Electric', 'Fairy', 'Fighting', 'Fire', 'Flying', 'Ghost', 'Grass', 'Ground', 'Ice', 'Normal', 'Poison', 'Psychic', 'Rock', 'Steel', 'Water']


Loop di bawah ini ditulis untuk menyelesaikan tugas ini:

In [153]:
# Collect all possible pairs using combinations()
possible_pairs = [*combinations(pokemon_types, 2)]

In [154]:
enumerated_pairs = []

for i,pair in enumerate(possible_pairs, 1):
    enumerated_pair_tuple = (i,) + pair
    enumerated_pair_list = list(enumerated_pair_tuple)
    enumerated_pairs.append(enumerated_pair_list)

**Note** : Mari buat loop ini lebih efisien menggunakan konversi holistik.

In [156]:
# Create an empty list called enumerated_tuples
enumerated_tuples = []

# Add a line to append each enumerated_pair_tuple to the empty list above
for i,pair in enumerate(possible_pairs, 1):
    enumerated_pair_tuple = (i,) + pair
    enumerated_tuples.append(enumerated_pair_tuple)

# Convert all tuples in enumerated_tuples to a list
enumerated_pairs = [*map(list, enumerated_tuples)]
print(enumerated_pairs)

[[1, 'Bug', 'Dark'], [2, 'Bug', 'Dragon'], [3, 'Bug', 'Electric'], [4, 'Bug', 'Fairy'], [5, 'Bug', 'Fighting'], [6, 'Bug', 'Fire'], [7, 'Bug', 'Flying'], [8, 'Bug', 'Ghost'], [9, 'Bug', 'Grass'], [10, 'Bug', 'Ground'], [11, 'Bug', 'Ice'], [12, 'Bug', 'Normal'], [13, 'Bug', 'Poison'], [14, 'Bug', 'Psychic'], [15, 'Bug', 'Rock'], [16, 'Bug', 'Steel'], [17, 'Bug', 'Water'], [18, 'Dark', 'Dragon'], [19, 'Dark', 'Electric'], [20, 'Dark', 'Fairy'], [21, 'Dark', 'Fighting'], [22, 'Dark', 'Fire'], [23, 'Dark', 'Flying'], [24, 'Dark', 'Ghost'], [25, 'Dark', 'Grass'], [26, 'Dark', 'Ground'], [27, 'Dark', 'Ice'], [28, 'Dark', 'Normal'], [29, 'Dark', 'Poison'], [30, 'Dark', 'Psychic'], [31, 'Dark', 'Rock'], [32, 'Dark', 'Steel'], [33, 'Dark', 'Water'], [34, 'Dragon', 'Electric'], [35, 'Dragon', 'Fairy'], [36, 'Dragon', 'Fighting'], [37, 'Dragon', 'Fire'], [38, 'Dragon', 'Flying'], [39, 'Dragon', 'Ghost'], [40, 'Dragon', 'Grass'], [41, 'Dragon', 'Ground'], [42, 'Dragon', 'Ice'], [43, 'Dragon', 'Nor

**Note** : Daripada mengonversi setiap tuple ke list di dalam loop, Anda menggunakan fungsi `map()` untuk mengonversi tuple ke list sekaligus di luar loop. Anda terbiasa menulis loop efisien! Ingat, Anda ingin menghindari perulangan sebanyak mungkin saat menulis kode Python. Dalam kasus di mana perulangan tidak dapat dihindari, pastikan untuk memeriksa loop Anda untuk perhitungan satu kali dan konversi holistik untuk membuatnya lebih efisien.

### Bringing it all together: Pokémon z-scores

Setiap Health Points yang sesuai dari Pokémon disimpan dalam NumPy array yang disebut `hps`. Anda ingin menganalisis Poin Kesehatan menggunakan [z-score](https://en.wikipedia.org/wiki/Standard_score) untuk melihat berapa standar deviasi setiap HP Pokémon dari rata-rata semua HP.

In [164]:
hps = pokemon['HP'].values

Kode di bawah ini ditulis untuk menghitung HP z-score untuk setiap Pokémon dan mengumpulkan Pokemon dengan HP tertinggi berdasarkan z-score mereka:

In [166]:
poke_zscores = []

for name,hp in zip(names, hps):
    hp_avg = hps.mean()
    hp_std = hps.std()
    z_score = (hp - hp_avg)/hp_std
    poke_zscores.append((name, hp, z_score))
print(poke_zscores[:5])

[('Bulbasaur', 45, -0.9371870323176603), ('Ivysaur', 60, -0.35966677960564786), ('Venusaur', 80, 0.4103602240103688), ('VenusaurMega Venusaur', 80, 0.4103602240103688), ('Charmander', 39, -1.1681951334024654)]


In [167]:
high_hp_pokemon = []

for name,hp,zscore in poke_zscores:
    if zscore > 2:
        high_hp_pokemon.append((name, hp, zscore))
print(high_hp_pokemon[:5])

[('Wigglytuff', 140, 2.7204412348584186), ('Chansey', 250, 6.95558975474651), ('Lapras', 130, 2.3354277330504103), ('Vaporeon', 130, 2.3354277330504103), ('Snorlax', 160, 3.4904682384744357)]


In [173]:
# Calculate the total HP avg and total HP standard deviation
hp_avg = hps.mean()
hp_std = hps.std()

# Use NumPy to eliminate the previous for loop
z_scores = (hps - hp_avg) / hp_std

# Combine names, hps, and z_scores
poke_zscores2 = [*zip(names, hps, z_scores)]
print(*poke_zscores2[:3], sep='\n')

('Bulbasaur', 45, -0.9371870323176603)
('Ivysaur', 60, -0.35966677960564786)
('Venusaur', 80, 0.4103602240103688)


In [174]:
# Use list comprehension with the same logic as the highest_hp_pokemon code block
highest_hp_pokemon = [(name,hp,zscore) for name,hp,zscore in poke_zscores2 if zscore > 2]
print(*highest_hp_pokemon, sep='\n')

('Wigglytuff', 140, 2.7204412348584186)
('Chansey', 250, 6.95558975474651)
('Lapras', 130, 2.3354277330504103)
('Vaporeon', 130, 2.3354277330504103)
('Snorlax', 160, 3.4904682384744357)
('Lanturn', 125, 2.142920982146406)
('Wobbuffet', 190, 4.645508743898461)
('Blissey', 255, 7.148096505650514)
('Slaking', 150, 3.105454736666427)
('Hariyama', 144, 2.8744466355816223)
('Wailmer', 130, 2.3354277330504103)
('Wailord', 170, 3.875481740282444)
('Drifblim', 150, 3.105454736666427)
('Munchlax', 135, 2.5279344839544144)
('GiratinaAltered Forme', 150, 3.105454736666427)
('GiratinaOrigin Forme', 150, 3.105454736666427)
('Alomomola', 165, 3.68297498937844)
('Kyurem', 125, 2.142920982146406)
('KyuremBlack Kyurem', 125, 2.142920982146406)
('KyuremWhite Kyurem', 125, 2.142920982146406)


**Question**

Gunakan `%%timeit` (*cell magic mode*) di dalam konsol IPython Anda untuk membandingkan runtime antara blok kode asli dan kode baru yang Anda kembangkan menggunakan NumPy dan list comprehension.

Pendekatan mana yang lebih cepat?

In [175]:
%%timeit
poke_zscores = []

for name,hp in zip(names, hps):
    hp_avg = hps.mean()
    hp_std = hps.std()
    z_score = (hp - hp_avg)/hp_std
    poke_zscores.append((name, hp, z_score))

28.9 ms ± 1.4 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [176]:
%%timeit
high_hp_pokemon = []

for name,hp,zscore in poke_zscores:
    if zscore > 2:
        high_hp_pokemon.append((name, hp, zscore))

197 µs ± 1.99 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [177]:
%%timeit
hp_avg = hps.mean()
hp_std = hps.std()

z_scores = (hps - hp_avg) / hp_std

poke_zscores2 = [*zip(names, hps, z_scores)]

224 µs ± 8.22 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [179]:
%timeit highest_hp_pokemon = [(name,hp,zscore) for name,hp,zscore in poke_zscores2 if zscore > 2]

192 µs ± 4.83 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


**Answer** : Total waktu untuk menjalankan solusi yang diperbarui menggunakan NumPy dan list comprehension lebih cepat.

You're Catching 'Em All (efisiensi itu). Anda menghilangkan dua loop menggunakan NumPy broadcasting dan list comprehension. Apakah Anda memperhatikan seberapa cepat pendekatan yang Anda kembangkan dibandingkan dengan loop asli? Suatu kemajuan yang luar biasa!

Ingat teknik yang telah Anda pelajari sepanjang bab ini saat Anda terus menulis kode Python di luar kursus ini. Ingatlah fungsi dan modul bawaan yang Anda pelajari untuk mengeliminasi loop dan ingatlah untuk memeriksa loop yang tidak terhindarkan Anda untuk hal-hal yang dapat dipindahkan ke luar loop.