# 2. List comprehensions and generators

Dalam bab ini, Anda akan membangun pengetahuan Anda tentang iterator dan diperkenalkan ke List comprehensions, yang memungkinkan Anda untuk membuat list rumit - dan lists of lists - dalam satu baris kode! List comprehensions dapat secara dramatis menyederhanakan kode Anda dan membuatnya lebih efisien, dan akan menjadi bagian penting dari kotak alat sains data Python Anda. Anda kemudian akan belajar tentang generator, yang sangat membantu ketika bekerja dengan urutan data yang besar yang mungkin tidak ingin Anda simpan dalam memori, tetapi menghasilkan dengan cepat.

## List comprehensions

### Write a basic list comprehension

Dalam latihan ini, Anda akan mempraktekkan penulisan *list comprehension*. Anda akan menulis list comprehension dan mengidentifikasi output yang akan dihasilkan.

In [2]:
# Create list
doctor = ['house', 'cuddy', 'chase', 'thirteen', 'wilson']

Bagaimana list comprehension menghasilkan list **karakter pertama** dari setiap string di `doctor` ? Perhatikan bahwa list comprehension menggunakan `doc` sebagai variabel iterator. Apa yang akan menjadi output?

In [3]:
[doc[0] for doc in doctor]

['h', 'c', 'c', 't', 'w']

### List comprehension over iterables

Anda tahu bahwa list comprehension dapat dibangun di atas iterables. Dengan objek-objek berikut di bawah ini, yang mana dari list ini yang dapat kita bangun list comprehension?

<pre>
doctor = ['house', 'cuddy', 'chase', 'thirteen', 'wilson']

range(50)

underwood = 'After all, we are nothing more or less than what we choose to reveal.'

jean = '24601'

flash = ['jay garrick', 'barry allen', 'wally west', 'bart allen']

valjean = 24601
</pre>

**Answer** : Anda bisa membangun list comprehension dari semua objek diatas kecuali objek integer `valjean`.

### Writing list comprehensions

Anda sekarang memiliki semua pengetahuan yang diperlukan untuk mulai menulis list comprehensions! Tugas Anda dalam latihan ini adalah menulis list comprehensions yang menghasilkan angka list kuadrat mulai dari 0 hingga 9.

In [4]:
# Create list comprehension: squares
squares = [i**2 for i in range(0, 10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

### Nested list comprehensions

Bagus! Pada titik ini, Anda memiliki pemahaman yang baik tentang sintaks dasar list comprehensions. Mari kita dorong keterampilan menulis kode Anda sedikit lebih jauh. Dalam latihan ini, Anda akan menulis list comprehensions dalam list comprehensions lain, atau list comprehensions bersarang (*nested*). Kedengarannya agak sulit, tetapi Anda bisa melakukannya!

Mari kita keluar sebentar dari string. Salah satu cara di mana list dapat digunakan adalah dalam mewakili objek multi-dimensi seperti matriks. Matriks dapat direpresentasikan sebagai lists of lists dengan Python. Misalnya matriks 5 x 5 dengan nilai 0 hingga 4 di setiap baris dapat ditulis sebagai:

<pre>
matrix = [[0, 1, 2, 3, 4],
          [0, 1, 2, 3, 4],
          [0, 1, 2, 3, 4],
          [0, 1, 2, 3, 4],
          [0, 1, 2, 3, 4]]
</pre>

Tugas Anda adalah untuk membuat ulang matriks ini dengan menggunakan list comprehensions bersarang. Ingatlah bahwa Anda dapat membuat salah satu baris dari matriks dengan list comprehensions tunggal. Untuk membuat lists of lists, Anda hanya perlu memberikan list comprehensions sebagai **output expression** dari list comprehensions keseluruhan:

`[` [*output expression*] `for` *iterator variable* `in` *iterable* `]`

Perhatikan di sini bahwa, **output expression** itu sendiri adalah list comprehensions.

In [5]:
# Create a 5 x 5 matrix using a list of lists: matrix
matrix = [[col for col in range(0, 5)] for row in range(0, 5)]

# Print the matrix
for row in matrix:
    print(row)

[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]


## Advanced comprehensions

### Using conditionals in comprehensions (1)

Anda telah menggunakan list comprehensions untuk membangun list nilai, kadang-kadang menggunakan operasi untuk membuat nilai-nilai ini.

Mekanisme yang menarik dalam list comprehensions adalah bahwa Anda juga dapat membuat list dengan nilai yang hanya memenuhi kondisi tertentu. Salah satu cara untuk melakukan ini adalah dengan menggunakan *conditional* pada variabel iterator. Dalam latihan ini, Anda akan melakukan hal itu!.

`[` *output expression* `for` *iterator variable* `in` *iterable* `if` *predicate expression* `]`.

Anda akan menggunakan resep ini untuk menulis list comprehensions dalam latihan ini. Anda diberi list string `fellowship` dan, menggunakan list comprehensions, Anda akan membuat list yang hanya mencakup anggota `fellowship` yang memiliki 7 karakter atau lebih.

In [8]:
# Create a list of strings: fellowship
fellowship = ['frodo', 'samwise', 'merry', 'aragorn', 'legolas', 'boromir', 'gimli']

# Create list comprehension: new_fellowship
new_fellowship = [member for member in fellowship if len(member) >= 7]

# Print the new list
print(new_fellowship)

['samwise', 'aragorn', 'legolas', 'boromir']


### Using conditionals in comprehensions (2)

Dalam latihan sebelumnya, Anda menggunakan pernyataan bersyarat `if` di bagian *predicate expression* dari list comprehension untuk mengevaluasi variabel iterator. Dalam latihan ini, Anda akan menggunakan pernyataan `if-else` pada ekspresi output dari list.

Tugas Anda adalah menggunakan list comprehension dan pernyataan kondisional `if-else` dalam ekspresi output dan buat list yang membuat anggota `fellowship` dengan 7 karakter atau lebih dan menggantikan yang lain dengan string kosong. Gunakan `member` sebagai variabel iterator dalam list comprehension.

In [9]:
# Create a list of strings: fellowship
fellowship = ['frodo', 'samwise', 'merry', 'aragorn', 'legolas', 'boromir', 'gimli']

# Create list comprehension: new_fellowship
new_fellowship = [member if len(member) >= 7 else '' for member in fellowship]

# Print the new list
print(new_fellowship)

['', 'samwise', '', 'aragorn', 'legolas', 'boromir', '']


### Dict comprehensions

Comprehensions tidak diturunkan hanya ke dunia list. Ada banyak objek lain yang bisa Anda bangun menggunakan comprehensions, seperti dictionary, objek meresap dalam Ilmu Data. Anda akan membuat dictionary menggunakan sintaks comprehensions untuk latihan ini. Dalam hal ini, comprehensions disebut **dict comprehension**.

Ingatlah bahwa perbedaan utama antara list comprehension dan dict comprehension adalah penggunaan kurung kurawal `{}` alih-alih `[]`. Selain itu, anggota dictionary dibuat menggunakan tanda titik dua `:`, seperti pada `<key> : <value>`.

Buat dictionary dengan anggota list sebagai `key` dan panjang setiap string sebagai `value` yang sesuai.

In [10]:
# Create a list of strings: fellowship
fellowship = ['frodo', 'samwise', 'merry', 'aragorn', 'legolas', 'boromir', 'gimli']

# Create dict comprehension: new_fellowship
new_fellowship = {member: len(member) for member in fellowship}

# Print the new dictionary
print(new_fellowship)

{'frodo': 5, 'samwise': 7, 'merry': 5, 'aragorn': 7, 'legolas': 7, 'boromir': 7, 'gimli': 5}


## Introduction to generator expressions

### List comprehensions vs generators

Anda telah melihat dari video yang memuat list comprehensions dan ekspresi generator terlihat sangat mirip dalam sintaksanya, kecuali untuk penggunaan tanda kurung `()` dalam ekspresi generator dan tanda kurung `[]` dalam list comprehensions.

Dalam latihan ini, Anda akan mengingat perbedaan antara list comprehension dan generator. Untuk membantu dengan tugas itu, kode berikut telah dimuat sebelumnya di lingkungan:

In [11]:
# List of strings
fellowship = ['frodo', 'samwise', 'merry', 'aragorn', 'legolas', 'boromir', 'gimli']

# List comprehension
fellow1 = [member for member in fellowship if len(member) >= 7]

# Generator expression
fellow2 = (member for member in fellowship if len(member) >= 7)

Cobalah untuk bermain-main dengan `fellow1` dan `fellow2` dengan mencari tahu tipe mereka dan mencetak nilai-nilai mereka. Berdasarkan pengamatan Anda dan apa yang dapat Anda ingat dari video, pilih dari opsi di bawah deskripsi terbaik untuk perbedaan antara list comprehensions dan generator.

In [12]:
print(type(fellow1))
print(type(fellow2))

<class 'list'>
<class 'generator'>


**Answer** : List comprehensions menghasilkan list sebagai output, generator menghasilkan objek generator.

### Write your own generator expressions

Anda terbiasa dengan generator dan ekspresi generator, serta perbedaannya dari list comprehensions. Dalam latihan ini, Anda akan berlatih membangun ekspresi generator sendiri.

Ingat bahwa ekspresi generator pada dasarnya memiliki sintaksis yang sama dengan list comprehensions, kecuali bahwa ia menggunakan tanda kurung `()` bukan tanda kurung kotak `[]`; ini seharusnya membuat hal-hal terasa akrab! Selain itu, jika Anda pernah iterating dictionary dengan `.items()`, atau menggunakan fungsi `range()`, misalnya, Anda telah menemukan dan menggunakan generator sebelumnya, tanpa mengetahuinya! Saat Anda menggunakan fungsi-fungsi ini, Python membuat generator untuk Anda di belakang layar.

Sekarang, Anda akan mulai sederhana dengan membuat objek generator yang menghasilkan nilai numerik.

In [13]:
# Create generator object: result
result = (num for num in range(0, 31))

# Print the first 5 values
print(next(result))
print(next(result))
print(next(result))
print(next(result))
print(next(result))

# Print the rest of the values
for value in result:
    print(value)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30


### Changing the output in generator expressions

Bagus! Pada titik ini, Anda sudah tahu cara menulis ekspresi generator dasar. Dalam latihan ini, Anda akan mendorong ide ini sedikit lebih jauh dengan menambahkan ekspresi keluaran ekspresi generator. Karena ekspresi generator dan list comprehensions sangat mirip dalam sintaksis, ini seharusnya menjadi tugas yang akrab bagi Anda!

Anda diberi list string `lannister` dan, menggunakan ekspresi generator, buat objek generator yang akan Anda ulangi untuk mencetak nilainya.

In [14]:
# Create a list of strings: lannister
lannister = ['cersei', 'jaime', 'tywin', 'tyrion', 'joffrey']

# Create a generator object: lengths
lengths = (len(person) for person in lannister)

# Iterate over and print the values in lengths
for value in lengths:
    print(value)

6
5
5
6
7


### Build a generator

Dalam latihan sebelumnya, Anda terutama berurusan dengan menulis ekspresi generator, yang menggunakan sintaksis comprehensions. Mampu menggunakan sintaks comprehension untuk ekspresi generator membuat pekerjaan Anda jauh lebih mudah!

Sekarang, ingat dari video bahwa tidak hanya ada ekspresi generator, ada fungsi generator juga. Fungsi generator adalah fungsi yang, seperti ekspresi generator, menghasilkan serangkaian nilai, alih-alih mengembalikan nilai tunggal. Fungsi generator didefinisikan sebagai Anda melakukan fungsi biasa, tetapi setiap kali menghasilkan nilai, ia menggunakan kata kunci `yield` alih-alih `return`.

Dalam latihan ini, Anda akan membuat fungsi generator dengan mekanisme yang sama seperti ekspresi generator yang Anda tentukan dalam latihan sebelumnya:

<pre>lengths = (len(person) for person in lannister)</pre>

In [15]:
# Create a list of strings
lannister = ['cersei', 'jaime', 'tywin', 'tyrion', 'joffrey']

# Define generator function get_lengths
def get_lengths(input_list):
    """Generator function that yields the
    length of the strings in input_list."""

    # Yield the length of a string
    for person in input_list:
        yield len(person)

# Print the values generated by get_lengths()
for value in get_lengths(lannister):
    print(value)

6
5
5
6
7


## Wrapping up comprehensions and generators.

### List comprehensions for time-stamped data

Anda sekarang akan menggunakan apa yang telah Anda pelajari dari bab ini untuk menyelesaikan masalah ekstraksi data yang sederhana. Anda juga akan diperkenalkan dengan struktur data, Series pandas, dalam latihan ini. Kami tidak akan menguraikan banyak hal di sini, tetapi yang harus Anda ketahui adalah bahwa itu adalah struktur data yang akan sering Anda kerjakan saat menganalisis data dari pandas DataFrames. Anda dapat menganggap kolom DataFrame sebagai array satu dimensi yang disebut Series.

Dalam latihan ini, Anda akan menggunakan list comprehensions untuk mengekstrak waktu dari data Twitter time-stamped.

*Catatan: Setiap baris adalah string yang mewakili cap waktu, dan Anda akan mengakses karakter ke 12 hingga 19 untuk mengekstraksi waktu.*

In [17]:
# Import pandas
import pandas as pd
# Load data
df = pd.read_csv('datasets/tweets.csv')

# Extract the created_at column from df: tweet_time
tweet_time = df['created_at']

# Extract the clock time: tweet_clock_time
tweet_clock_time = [entry[11:19] for entry in tweet_time]

# Print the extracted times
print(tweet_clock_time)

['23:40:17', '23:40:17', '23:40:17', '23:40:17', '23:40:17', '23:40:17', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:17', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:17', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:18', '23:40:19', '23:40:18', '23:40:18', '23:40:18', '23:40:19', '23:40:19', '23:40:19', '23:40:18', '23:40:19', '23:40:19', '23:40:19', '23:40:18', '23:40:19', '23:40:19', '23:40:19', '23:40:18', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23

### Conditional list comprehensions for time-stamped data

Anda berhasil mengekstrak data yang menarik, waktu, dari pandas DataFrame! Mari kita ubah pekerjaan Anda lebih lanjut dengan menambahkan persyaratan yang selanjutnya menentukan entri mana yang akan dipilih.

Dalam latihan ini, Anda akan menggunakan list comprehensions untuk mengekstrak waktu dari data Twitter yang bertanda waktu. Anda akan menambahkan ekspresi kondisional ke list comprehensions sehingga Anda hanya memilih waktu di mana `entry[17:19]` sama dengan `'19'`. 

In [18]:
# Extract the created_at column from df: tweet_time
tweet_time = df['created_at']

# Extract the clock time: tweet_clock_time
tweet_clock_time = [entry[11:19] for entry in tweet_time if entry[17:19] == '19']

# Print the extracted times
print(tweet_clock_time)

['23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19', '23:40:19']
