# Tipe Data

Kita telah mengetahui konsep variabel, yang dapat kita gunakan untuk menyimpan beberapa jenis informasi yang berbeda. Kita bisa menyimpan teks, angka, atau nilai boolean. Jenis informasi yang berbeda ini sesuai dengan `type` data Python yang berbeda.

In [1]:
print(type('some text'))
print(type(10))
print(type(10.3))
print(type(True))

<class 'str'>
<class 'int'>
<class 'float'>
<class 'bool'>


# Struktur Data

Kami juga secara singkat memperkenalkan `list` Python, yang dapat digunakan untuk menyimpan kumpulan data.

In [2]:
# contoh list
beans_recipe = ['Rendam kacang dalam air', 'Larutkan garam dalam air', 'Panaskan air dan kacang hingga mendidih', 'Tiriskan kacang setelah matang']
beans_recipe

['Rendam kacang dalam air',
 'Larutkan garam dalam air',
 'Panaskan air dan kacang hingga mendidih',
 'Tiriskan kacang setelah matang']

Terkadang kita akan menyimpan informasi dalam variabel individual, tetapi seringkali kita akan bekerja dengan beberapa informasi yang ingin kita kelompokkan bersama karena hubungan atau kesamaannya. Misalnya, jika kita berbelanja bahan makanan, kita dapat menyimpan setiap barang yang akan kita beli dalam variabel terpisah atau kita dapat menyimpan semua barang dalam satu daftar.

In [3]:
belanja_a = 'ayam'
belanja_b = 'bawang'
belanja_c = 'nasi'
belanja_d = 'paprika'
belanja_e = 'pisang'

belanja_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang']

Manakah dari pendekatan ini yang tampaknya lebih berguna bagi Anda? Mari kita tulis contoh fungsi singkat yang "membeli" setiap bahan makanan yang kita butuhkan.

In [4]:
def beli_bahan_individual(item_a, item_b, item_c, item_d, item_e):
    print('Membeli %s...' % item_a)
    print('Membeli %s...' % item_b)
    print('Membeli %s...' % item_c)
    print('Membeli %s...' % item_d)
    print('Membeli %s...' % item_e)

def beli_bahan_list(items):
    for item in items:
        print('Membeli %s...' % item)

In [5]:
beli_bahan_individual(belanja_a, belanja_b, belanja_c, belanja_d, belanja_e)

Membeli ayam...
Membeli bawang...
Membeli nasi...
Membeli paprika...
Membeli pisang...


In [6]:
beli_bahan_list(belanja_list)

Membeli ayam...
Membeli bawang...
Membeli nasi...
Membeli paprika...
Membeli pisang...


Dengan menggunakan `list`, kita dapat menggunakan loop `for` untuk menulis fungsi yang jauh lebih pendek. Tetapi yang lebih penting, `beli_bahan_list` jauh lebih fleksibel. Bagaimana jika alih-alih membeli lima item, kita ingin membeli lebih banyak atau lebih sedikit?

In [7]:
# mari kita coba beli tiga item saja
beli_bahan_individual(belanja_a, belanja_b, belanja_c)

TypeError: beli_bahan_individual() missing 2 required positional arguments: 'item_d' and 'item_e'

In [8]:
# let's try to buy a sixth item

belanja_f = 'squash'

beli_bahan_individual(belanja_a, belanja_b, belanja_c, belanja_d, belanja_e, belanja_f)

TypeError: beli_bahan_individual() takes 5 positional arguments but 6 were given

Kita menemukan error saat mencoba menggunakan `beli_bahan_individual` karena mengharapkan "tepatnya 5 argumen". Kita tidak akan mengalami masalah dengan `beli_bahan_list`, karena loop `for` dapat bekerja dengan daftar dengan panjang berapa pun.

In [None]:
short_grocery_list = ['ayam', 'bawang', 'nasi']

beli_bahan_list(short_grocery_list)

In [None]:
long_grocery_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']

beli_bahan_list(long_grocery_list)

Kita berhasil menangani list yang lebih pendek dan lebih panjang.

Collections (atau [**containers**](https://stackoverflow.com/questions/11575925/what-exactly-are-containers-in-python-and-what-are-all-the-python-container) dikenal di dalam Python) bisa sangat berguna untuk mengatasi masalah data yang kompleks. Python menyediakan beberapa jenis container, yang akan kita jelajahi. Masing-masing memiliki sifat dan struktur berbeda yang membuatnya berguna untuk tugas tertentu. Kita juga akan mengenal containers yang powerful dan sangat terstruktur yang telah ditemukan dan dibagikan oleh pengguna Python kepada komunitas Python.

Dalam konteks data science, kita akan sering menyebut kumpulan data sebagai **dataset**, dan tipe variabel yang kita gunakan untuk menyimpannya dalam Python sebagai **data structure / struktur data**.

### Latihan

1. Jenis data apa yang dapat diwakili oleh `list`? Bagaimana dengan `list` yang terdiri dari objek `list`?

## `list`

Kita telah membuat list dengan menggunakan tanda kurung siku `[]` terhadap data yang kita ingin masukkan di dalamnya. Kita juga dapat membuat list dari variabel, selain menulis data secara langsung.

In [None]:
belanja_a = 'ayam'
belanja_b = 'bawang'
belanja_c = 'nasi'
belanja_d = 'paprika'
belanja_e = 'pisang'

belanja_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
print(belanja_list)

belanja_list = [belanja_a, belanja_b, belanja_c, belanja_d, belanja_e]
print(belanja_list)

Sejauh ini kita telah bekerja dengan `list` dari string, tetapi kita tidak terbatas hanya pada tipe data itu saja.

In [None]:
int_list = [2, 6, 3049, 18, 37]
float_list = [3.7, 8.2, 178.245, 63.1]
mixed_list = [26, False, 'some words', 1.264]

print(int_list)
print(float_list)
print(mixed_list)

Kita dapat menyimpan `type` data apa pun dalam `list`. Kita bahkan dapat menempatkan `list` di dalam `list`.

In [None]:
list_of_lists = [['a', 'list', 'of', 'words'], [1, 5, 209], [True, True, False]]
print(list_of_lists)

Ada sedikit batasan tentang bagaimana kita menyusun list atau apa yang kita masukkan ke dalamnya. Hal ini dapat menyebabkan struktur "nested" yang sangat rumit.

In [9]:
confusing_list = [[23, 73, 50], 'some words', 12.308, [[False, True], 'more words']]
print(confusing_list)

[[23, 73, 50], 'some words', 12.308, [[False, True], 'more words']]


Kita deskripsikan `list` Python sebagai _heterogen_ karena dapat menampung kumpulan objek campuran. Ini adalah salah satu karakteristik penentu utama dari `list` Python.

Anda mungkin juga memperhatikan bahwa ketika kita memasukkan data ke dalam `list` dalam urutan tertentu, data itu tetap dalam urutan itu ketika kita `print` atau menggunakan `list` dalam perulangan `for`. Karena `list` mempertahankan urutan, kita katakan itu _ordered_. Kita dapat menggunakan karakteristik ini untuk mengambil item tertentu dari `list` berdasarkan posisinya (atau **index**) dalam list.

In [10]:
print(belanja_list)
print(belanja_list[2])

['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
nasi


Mencetak `belanja_list[2]` mengembalikan item ketiga dalam daftar: 'nasi'. Mengapa mengembalikan item ketiga jika kita meminta item di indeks 2? `list` Python adalah _zero-indexed_.

In [11]:
print(belanja_list[0])
print(belanja_list[1])
print(belanja_list[2])

ayam
bawang
nasi


Kami juga dapat mengambil _slice_ dari item dalam list.

In [12]:
print(belanja_list[1:4])
print(belanja_list[3:])
print(belanja_list[:3])

['bawang', 'nasi', 'paprika']
['paprika', 'pisang']
['ayam', 'bawang', 'nasi']


Python juga memiliki sintaks pengindeksan negatif, memungkinkan kita untuk mengakses list dari akhir, bukan dari awal. Elemen terakhir diindeks oleh -1.

In [13]:
print(belanja_list[-1])
print(belanja_list[-3:])

pisang
['nasi', 'paprika', 'pisang']


Kita juga dapat "slicing" list menggunakan step-size selain 1.

In [14]:
print(belanja_list[::2])
print(belanja_list[4:1:-1])

['ayam', 'nasi', 'pisang']
['pisang', 'paprika', 'nasi']


Tentu saja kita juga dapat mengambil informasi dari list dengan menggunakan perulangan `for`.

In [15]:
for item in belanja_list:
    print(item)

ayam
bawang
nasi
paprika
pisang


Meskipun biasanya kita akan menggunakan sintaks `for item in list`, terkadang kita akan menggabungkan perulangan `for` dengan pengindeksan. Fungsi `range` berguna untuk ini. Misalnya, kita dapat memilih setiap item dengan lompat 2 dalam list.

In [16]:
for i in range(0, len(belanja_list), 2):
    print(i, belanja_list[i])

0 ayam
2 nasi
4 pisang


Fungsi `range` mengembalikan urutan bilangan bulat antara argumen pertama dan kedua, menggunakan argumen ketiga sebagai step-size. Perhatikan bahwa batas atas (yaitu argumen kedua) tidak disertakan dalam output.

In [17]:
print(range(0, 10, 3))
print(range(104, 100, -1))
print(range(5)) # dimulai dari 0 dan dihitung dengan 1 secara default

range(0, 10, 3)
range(104, 100, -1)
range(0, 5)


Kami juga dapat menggunakan pengindeksan/slicing untuk mengganti item dalam list.

In [18]:
belanja_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
print(belanja_list)
belanja_list[-1] = 'jeruk' # replace bananas with oranges
print(belanja_list)
belanja_list[1:3] = ['wortel', 'bayam'] #replace onions and rice with carrots and couscous
print(belanja_list)

['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
['ayam', 'bawang', 'nasi', 'paprika', 'jeruk']
['ayam', 'wortel', 'bayam', 'paprika', 'jeruk']


Karena kita dapat memodifikasi list setelah dibuat, kita menyebutnya _mutable_ (modifikasi disebut _mutation_). Beberapa tipe data Python adalah _immutable_, artinya setelah dibuat tidak dapat diubah. Kita akan mengeksplorasi ini lebih lanjut setelah kita mempelajari lebih banyak tipe data.

Cara lain untuk mengubah `list` adalah dengan `append` item baru.

In [19]:
belanja_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
print(belanja_list)
belanja_list.append('squash')
print(belanja_list)
belanja_list.append(['roti', 'garam'])
print(belanja_list) # apa yang terjadi

['ayam', 'bawang', 'nasi', 'paprika', 'pisang']
['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']
['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash', ['roti', 'garam']]


Karena list dapat berisi list lainnya, kita harus berhati-hati dalam menambahkan beberapa item ke list kita. Alih-alih `append`, kita mungkin ingin menggunakan `extend`.

In [20]:
belanja_list = ['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']
print(belanja_list)
belanja_list.extend(['roti', 'garam'])
print(belanja_list)

['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']
['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash', 'roti', 'garam']


Kami juga dapat menghapus item dari list.

In [21]:
print(belanja_list)
del belanja_list[-1] # hapus item terakhir
print(belanja_list)

['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash', 'roti', 'garam']
['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash', 'roti']


In [22]:
print(belanja_list)
print(belanja_list.pop(-1)) # hapus item terakhir dari daftar dan kembalikan
print(belanja_list)

['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash', 'roti']
roti
['ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']


Mutasi lain yang dapat kita buat pada list adalah dengan mengurutkannya.

In [23]:
belanja_list.append('apel')
belanja_list.sort()
print(belanja_list)

['apel', 'ayam', 'bawang', 'nasi', 'paprika', 'pisang', 'squash']


Tiga properti/karakteristik utama yang mendefinisikan `list` Python adalah bahwa ia terurut, heterogen, dan dapat diubah. Karena heterogen dan bisa berubah, `list` sangat fleksibel. Kita perlu berhati-hati dengan perubahan yang kita buat pada `list`, karena perubahan itu bisa sangat tidak terduga. Kita bisa "menghancurkan" kode kita atau kehilangan data!

### Latihan

1. Buat list 10 elemen dan pilih hanya 2 elemen terakhir
2. Ambil list 10 elemen yang sama dan pilih setiap elemen (lompat 2) dimulai dengan elemen pertama.
3. Pilih setiap elemen (lompat 2) dimulai dengan elemen kedua.

## `tuple`

`tuple` Python sangat mirip dengan `list` dengan satu perbedaan utama -- tidak dapat diubah. Kita membuat `tuple` menggunakan tanda kurung `()`.

In [24]:
example_tuple = ('Rita', 24, 173.6, True)
print(example_tuple)

('Rita', 24, 173.6, True)


Meskipun kita dapat mengambil data melalui pengindeksan (karena `tuple` juga ordered seperti list), kita tidak dapat memodifikasinya (karena `tuple` tidak dapat diubah / immutable).

In [25]:
print(example_tuple[2])

173.6


In [26]:
example_tuple[2] = 169.3

TypeError: 'tuple' object does not support item assignment

In [27]:
# penghapusan juga gagal
del example_tuple[-1]

TypeError: 'tuple' object doesn't support item deletion

Sementara untuk kejelasan kita harus menyertakan tuple dengan `()`, Python akan menganggap kita menginginkan `tuple` jika kita tidak menggunakan simbol apa pun untuk menyertakan nilai yang dipisahkan koma.

In [29]:
another_example_tuple = 'Jaka', 37, 182.3, True
print(another_example_tuple)
print(type(another_example_tuple))

('Jaka', 37, 182.3, True)
<class 'tuple'>


`tuple` implisit ini paling sering muncul saat bekerja dengan fungsi yang mengembalikan banyak output. Misalnya, kita mungkin memiliki fungsi yang mengembalikan huruf pertama dan terakhir dari sebuah string.

In [30]:
def first_last(s):
    return s[0], s[-1]

chars = first_last('hai!')
print(chars)

('h', '!')


Dalam kasus seperti itu, terkadang kita ingin menyimpan beberapa output dalam variabel terpisah.

In [31]:
first_char, last_char = first_last('hello!')

print(first_char)
print(last_char)

h
!


Sintaks ini disebut _unpacking_. Kita dapat menggunakannya dengan `tuple` apa pun, apakah itu dikembalikan oleh suatu fungsi atau tidak.

In [32]:
name, age, height, has_dog = example_tuple

print(name)
print(age)
print(height)
print(has_dog)

Rita
24
173.6
True


Baik `list` dan `tuple` Python bersifat ordered dan heterogen. Namun, tidak seperti `list`, `tuple` tidak dapat diubah, artinya tidak dapat dimodifikasi setelah dibuat. Oleh karena itu, `list` mungkin lebih baik untuk mewakili data yang diharapkan berubah selama program berlangsung, seperti daftar tugas. Sebuah `tuple` mungkin lebih baik untuk mewakili data fixed, seperti tanggapan individu subjek survei.

#### Catatan

Satu kesalahan umum yang dilakukan orang dengan sifat immutable dan terutama dengan tuple adalah menganggap struktur data di dalam tuple tidak dapat diubah karena tuple tidak dapat diubah. Mari kita lihat sebuah contoh.

In [33]:
tup = tuple([[], 'a'])
print(tup)
tup[0].append(1)
print(tup)

([], 'a')
([1], 'a')


Meskipun tuple itu sendiri tidak dapat diubah, kita hanya tidak dapat mengubah objek persis yang dikandungnya, sedangkan objek itu sendiri dapat diubah jika mereka mutable. Di mana saja mutabilitas muncul, programmer harus berhati-hati dan tidak menganggap data belum dimodifikasi dalam beberapa konteks.

## `set`

Sebuah `set` Python juga mirip dengan `list`, kecuali dia sifatnya tidak berurutan / ordered. Set bisa menyimpan data heterogen dan bisa berubah, tapi apa artinya tidak berurutan? Penjelasan paling sederhana adalah dengan melihat contoh. Kita bisa membuat satu set dengan melampirkan data kita dengan kurung kurawal `{}`.

In [34]:
example_set = {'Sinta', 29, 170.9, True}
print(example_set)

{True, 170.9, 29, 'Sinta'}


Meskipun kita memasukkan data dalam suatu urutan, `set` dicetak dalam urutan yang berbeda. Lebih penting lagi, kita tidak dapat mengindeks atau slicing `set`.

In [35]:
print(example_set[0])

TypeError: 'set' object is not subscriptable

Namun, kami masih dapat menambah dan menghapus item dari satu set.

In [36]:
print(example_set)
print(example_set.pop())
print(example_set)

{True, 170.9, 29, 'Sinta'}
True
{170.9, 29, 'Sinta'}


In [37]:
example_set.add('True')
print(example_set)
example_set.update([58.1, 'brown'])
print(example_set)

{170.9, 'Sinta', 'True', 29}
{170.9, 'brown', 'Sinta', 'True', 58.1, 29}


Metode `add` dari `set` bekerja mirip dengan metode `append` dari `list`. Metode `update` dari `set` bekerja mirip dengan metode `extend` dari `list`.

_**Mengapa `set` berguna?**_

Tampaknya aneh bahwa kita mungkin menginginkan struktur data _unordered_. Kita tidak dapat mengakses atau mengubah data melalui pengindeksan. Bagaimana ini dapat menguntungkan kita? Jawabannya adalah memberikan kita fleksibilitas tentang bagaimana data disimpan dalam memori, dan fleksibilitas itu dapat membuat pengambilan data lebih cepat.

Bayangkan kita memiliki sepuluh kotak dan sepuluh tumpukan uang. Kita memasukkan sepuluh tumpukan uang ke dalam sepuluh kotak. Sekarang katakan kita ingin menemukan kotak yang berisi \$5.37 di dalamnya. Kita tidak tahu kotak mana ini, jadi kita mulai dengan kotak pertama dan memeriksa. Jika tidak ada di kotak pertama, kita beralih ke kotak kedua. Kita terus memeriksa kotak sampai kita menemukannya. Ini mungkin memakan waktu cukup lama.

![list_illustration](./static/img/list_illustration.png)

Sekarang bayangkan kita memiliki sepuluh tumpukan uang yang sama, tetapi kita memiliki 31 kotak. Alih-alih meletakkan setiap tumpukan uang ke dalam kotak secara berurutan, tempatkan setiap tumpukan ke dalam kotak berdasarkan jumlah uang di tumpukan. Pertama kita kalikan jumlah uang dengan 100, dan kemudian ambil pembagian modulus dengan 31. Ini memberikan nomor kotak tempat kita harus meletakkan tumpukan uang.

In [38]:
piles = [2.83, 8.23, 9.38, 10.23, 25.58, 0.42, 5.37, 28.10, 32.14, 7.31]

In [39]:
def hash_function(x):
    return int(x*100 % 31)

In [40]:
[hash_function(pile) for pile in piles]

[4, 17, 8, 0, 16, 11, 10, 20, 21, 18]

Sekarang katakan kita ingin menemukan kotak dengan \$5.37 di dalamnya. Kita tidak perlu mencari melalui kotak demi kotak. Kita dapat menghitung:

In [41]:
print(int(5.37 * 100 % 31))

10


![hash_illustration](./static/img/hash_illustration.png)

Kotak nomor 10 berisi tumpukan \$5.37.

Teknik menetapkan kotak (yaitu memori) berdasarkan objek yang dikandungnya disebut **hashing**. Ini membuat pencarian data menjadi sangat cepat (seperti yang telah diilustrasikan), tetapi dengan "biaya" peningkatan alokasi memori (kita membutuhkan lebih banyak kotak). Ini juga berarti bahwa kita tidak dapat menetapkan perintah ke objek karena mereka disimpan dalam memori.

Hashing juga menempatkan dua batasan utama pada `set`. Pertama-tama, objek dalam `set` harus tidak dapat diubah. Jika suatu objek diubah, posisinya dalam memori tidak lagi sesuai dengan **hash**-nya. Kedua, objek dalam `set` harus unik. Objek identik berakhir dengan hash yang sama. Karena kita tidak dapat menyimpan banyak objek dalam potongan memori yang sama, kita cukup membuang duplikat apa pun.

Pembatasan kedua ini berarti kita dapat menggunakan `set` untuk dengan mudah menentukan objek unik dalam `list` atau `tuple`.

In [42]:
print(set([23, 609, 348, 10, 5, 23, 340, 82]))
print(set(('a', 'b', 'q', 'c', 'c', 'd', 'r', 'a')))

{609, 5, 10, 82, 340, 23, 348}
{'b', 'd', 'q', 'r', 'c', 'a'}


Karena pencarian data sangat sederhana dalam `set`, set juga sangat berguna untuk membuat perbandingan antar kumpulan data.

In [43]:
student_a_courses = {'history', 'english', 'biology', 'theatre'}
student_b_courses = {'biology', 'english', 'mathematics', 'computer science'}

print(student_a_courses.intersection(student_b_courses))
print(student_a_courses.union(student_b_courses))
print(student_a_courses.difference(student_b_courses))
print(student_b_courses.difference(student_a_courses))
print(student_a_courses.symmetric_difference(student_b_courses))

{'english', 'biology'}
{'english', 'computer science', 'theatre', 'mathematics', 'biology', 'history'}
{'history', 'theatre'}
{'computer science', 'mathematics'}
{'computer science', 'theatre', 'history', 'mathematics'}


![set_operations](./static/img/set_operations.png)

### Latihan

1. Kapan saya harus menggunakan `set` daripada `list`?
2. Apa contoh masalah di mana `set` mungkin menjadi bagian dari solusi?

# dict

Untuk memahami `dict` Python, mari kita mulai lagi dengan `list` Python.

In [44]:
orang = ['Budi', 24, 173.5, 73.5, 'cokelat', 'cokelat', True]

`list` ini menggambarkan seseorang: nama, usia, tinggi badan (dalam sentimeter), berat badan (dalam kilogram), warna rambut, warna mata, dan apakah `orang` ini punya anjing atau tidak. Kita tahu bahwa kita dapat mengakses informasi ini satu per satu dengan indeks.

In [45]:
print('Nama saya %s' % orang[0])
print('Saya memiliki warna rambut %s' % orang[4])

Nama saya Budi
Saya memiliki warna rambut cokelat


Akan cukup sulit dan membuat kita bingung tentang data tersebut berpasangan dengan deskripsi apa (misalnya, `'coklat'` mana yang merupakan warna rambut dan mana yang merupakan warna mata?), atau di mana saya harus menemukannya (akankah usia selalu berada di indeks 1?).

Solusi yang lebih baik adalah struktur data tempat kita dapat mengindeks menggunakan label tertentu. Misalnya daripada menggunakan `orang[0]` untuk print `Budi`, kita dapat menggunakan `orang['nama']`. Alih-alih warna rambut menjadi `orang[4]`, bisa jadi `orang['rambut']`. Fitur ini adalah karakteristik utama dari `dict` Python.

In [46]:
orang_dict = {'name': 'Budi', 'age': 24, 'height': 173.5, 'weight': 73.5, 'hair': 'cokelat', 'eyes': 'cokelat', 'has dog': True}

print('Nama saya %s' % orang_dict['name'])
print('Warna rambut saya %s' % orang_dict['hair'])

Nama saya Budi
Warna rambut saya cokelat


Alih-alih memanggil indeks `'name'` dan `'hair'`, kita menyebutnya **keys**. Setiap key dikaitkan dengan **value** dalam **key-value pair**. Kita bisa melihat key-value pair dalam sintaks `{}` yang digunakan untuk membuat `dict`. Setiap key-value pair dipisahkan dengan koma, dan di dalam pair tersebut key dan value dipisahkan oleh titik dua `:`.

### Latihan
1. Kapan `dict` lebih berguna daripada `list`?
2. Bandingkan fleksibilitas `dict` yang berisi objek `dict` lain dengan array multidimensi.

### `zip`

Fungsi `zip` bisa sangat berguna untuk membuat `dict`. Mari kembali ke `list` yang kita buat sebelumnya yang berisi semua nilai yang mendeskripsikan seseorang. Kita akan membuat `list` kedua yang berisi semua kunci yang kita inginkan untuk memasukkan nilai-nilai ini ke dalam dictionary

In [47]:
value_list = orang
key_list = ['name', 'age', 'height', 'weight', 'hair', 'eyes', 'has dog']

print(value_list)
print(key_list)

['Budi', 24, 173.5, 73.5, 'cokelat', 'cokelat', True]
['name', 'age', 'height', 'weight', 'hair', 'eyes', 'has dog']


Saat ini kita memiliki dua list: satu value dan satu key. Masing-masing tidak memiliki hubungan satu sama lain dalam Python, tetapi kita dapat melihat bahwa mereka saling memiliki secara logika. Bagaimana kita menggabungkannya dengan Python? Dengan menggunakan fungsi `zip`.

In [48]:
key_value_pairs = list(zip(key_list, value_list))
print(key_value_pairs)

[('name', 'Budi'), ('age', 24), ('height', 173.5), ('weight', 73.5), ('hair', 'cokelat'), ('eyes', 'cokelat'), ('has dog', True)]


Kita sekarang memiliki daftar tupel. Kita menafsirkan elemen pertama dari setiap tupel sebagai key, dan elemen kedua sebagai value. Kita dapat mengubah list dari tupel ini secara langsung menjadi `dict`.

In [49]:
orang_dict = dict(key_value_pairs)
print(orang_dict)

{'name': 'Budi', 'age': 24, 'height': 173.5, 'weight': 73.5, 'hair': 'cokelat', 'eyes': 'cokelat', 'has dog': True}


`dict` bersifat unordered / tidak berurutan. Key di-"hash" untuk menetapkan pasangan nilai kunci ke memori. Oleh karena itu, key harus tidak dapat diubah dan unik, mirip dengan elemen `set`. Namun, value tidak memiliki batasan ini.

In [50]:
# ini tidak berhasil
invalid_dict = {[1, 5]: 'a', 5: 23}

TypeError: unhashable type: 'list'

In [51]:
# tapi ini berhasil
valid_dict = {(1, 5): 'a', 5: [23, 6]}
print(valid_dict)

{(1, 5): 'a', 5: [23, 6]}


`dict` juga bisa diubah atau mutable. Kita dapat menambahkan pasangan nilai kunci baru dengan penugasan sederhana.

In [52]:
print(orang_dict)
orang_dict['favorite book'] =  'Huckleberry Finn'
print(orang_dict)

{'name': 'Budi', 'age': 24, 'height': 173.5, 'weight': 73.5, 'hair': 'cokelat', 'eyes': 'cokelat', 'has dog': True}
{'name': 'Budi', 'age': 24, 'height': 173.5, 'weight': 73.5, 'hair': 'cokelat', 'eyes': 'cokelat', 'has dog': True, 'favorite book': 'Huckleberry Finn'}


# Mengubah Struktur Data

Setiap container yang kita perkenalkan memiliki sifat dan karakteristik yang berbeda. Terkadang kita ingin mengubah satu struktur data menjadi struktur data lainnya untuk memanfaatkan perbedaan ini. Kita telah melihat beberapa metode untuk mengubah `dict` menjadi `list` dari `tuple` atau sebaliknya. Kita dapat dengan mudah mengubah antara `list`, `tuple`, dan `set`.

In [53]:
example_list = ['a', 'b', 23, 10, True, 'a', 10]
example_tuple = tuple(example_list)
example_set = set(example_tuple)
example_list = list(example_set)

print(example_tuple)
print(example_set)
print(example_list) # note we lost the duplicates because of set

('a', 'b', 23, 10, True, 'a', 10)
{True, 'b', 10, 23, 'a'}
[True, 'b', 10, 23, 'a']


# Search, Sorting, Iteration

Kita mendiskusikan ide pencarian data dalam struktur data saat menjelaskan apa yang membuat `set` (dan `dict`) begitu istimewa. Seperti apa tampilan pencarian dengan Python? Kita mencari data menggunakan kata kunci `in`.

In [54]:
print(example_list)
print('a' in example_list)
print('c' in example_list)

[True, 'b', 10, 23, 'a']
True
False


Saat berhadapan dengan `dict`, kita dapat mencari key, tetapi bukan value.

In [55]:
print(orang_dict)
print('hair' in orang_dict)
print('has cat' in orang_dict)
print('brown' in orang_dict)

{'name': 'Budi', 'age': 24, 'height': 173.5, 'weight': 73.5, 'hair': 'cokelat', 'eyes': 'cokelat', 'has dog': True, 'favorite book': 'Huckleberry Finn'}
True
False
False


Mencari key penting dalam dictionary agar kita tidak secara tidak sengaja mencoba mengambil pasangan nilai kunci yang tidak ada.

In [56]:
print(orang_dict['has cat'])

KeyError: 'has cat'

In [57]:
if 'has dog' in orang_dict:
    print('Has dog: %s' % orang_dict['has dog'])
else:
    print(None)

if 'has cat' in orang_dict:
    print('Has cat: %s' % orang_dict['has cat'])
else:
    print(None)

Has dog: True
None


In [58]:
# dapat menggunakan metode get untuk hasil yang sama

print('Has dog: %s' % orang_dict.get('has dog'))
print('Has cat: %s' % orang_dict.get('has cat'))

Has dog: True
Has cat: None


Kita bisa membayangkan banyak situasi di mana pencarian berguna. Apakah suatu negara termasuk dalam kumpulan (set) tempat yang akan terkena dampak kekeringan? Apakah suatu tugas ada dalam daftar tugas saya? Apakah nama pengguna ini sudah digunakan, dan jika demikian, apa kata sandi yang cocok (`dict` akan berguna di sini)?

## Sorting

Karena `tuple` tidak dapat diubah, dapatkah kita mengurutkannya? Atau sorting termasuk mutasi? Apa artinya mengurutkan `set` atau `dict`, yang tidak memiliki urutan?

Dari struktur data yang telah kita pelajari sejauh ini, hanya `list` yang memiliki metode `sort`. Namun, Python juga memiliki fungsi `sorted`, yang akan membuat `list` yang diurutkan dari struktur data lainnya. Secara default `sorted` diterapkan ke `dict` membuat `list` dari keys yang diurutkan. Kita harus menggunakan metode `items` jika kita ingin output kita menjadi pasangan nilai kunci.

In [59]:
print(sorted(map(str, example_tuple)))
print(sorted(map(str, example_set)))
print(sorted(orang_dict.items()))
print(sorted(orang_dict))

['10', '10', '23', 'True', 'a', 'a', 'b']
['10', '23', 'True', 'a', 'b']
[('age', 24), ('eyes', 'cokelat'), ('favorite book', 'Huckleberry Finn'), ('hair', 'cokelat'), ('has dog', True), ('height', 173.5), ('name', 'Budi'), ('weight', 73.5)]
['age', 'eyes', 'favorite book', 'hair', 'has dog', 'height', 'name', 'weight']


## Iteration

Seperti yang telah kita lihat dalam beberapa contoh, seringkali akan berguna untuk melakukan iterasi melalui struktur data, apakah akan menjalankan beberapa tugas berdasarkan informasi yang terkandung atau untuk mengubah atau menganalisis kumpulan data. Kita akan paling sering menggunakan loop `for` untuk iterasi struktur data. Dengan `list`, `tuple`, atau `set` elemen container dikembalikan satu demi satu. Dengan `dict`, semuanya sedikit lebih rumit: apakah kita ingin iterasi key, value, atau key-value pair / pasangan nilai kunci?

In [60]:
# secara default kita melakukan iterasi key dari dict
for k in orang_dict:
    print(k)

name
age
height
weight
hair
eyes
has dog
favorite book


In [61]:
# untuk iterasi values...
for v in orang_dict.values():
    print(v)

Budi
24
173.5
73.5
cokelat
cokelat
True
Huckleberry Finn


In [62]:
# atau untuk iterasi terhadap key-value pairs...
for k, v in orang_dict.items():
    print('%s: %s' % (k, v))

name: Budi
age: 24
height: 173.5
weight: 73.5
hair: cokelat
eyes: cokelat
has dog: True
favorite book: Huckleberry Finn


Perhatikan bahwa kita menggunakan `tuple` unpacking dalam loop `for` pada contoh terakhir!

### Comprehensions

Python memiliki sintaks khusus yang disebut _comprehension_ untuk menggabungkan iterasi dengan pembuatan struktur data. Ini pada dasarnya adalah loop `for` yang dibungkus dalam tanda kurung yang sesuai untuk membuat struktur data.

In [63]:
squares = [x**2 for x in range(10)]
square_lut = {x: x**2 for x in range(10)}

print(squares)
print(square_lut)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


Comprehensions sangat berguna untuk melakukan transformasi sederhana pada struktur data. Sebagai contoh, mungkin kita sedang menulis sebuah fungsi yang akan menganalisa `orang_dict`. Mungkin berguna untuk memiliki `dict` dari tipe data nilai dalam `orang_dict` sehingga kita tahu apa yang diharapkan sebagai input.

In [64]:
orang_dict_dtypes = {k: type(v) for k, v in orang_dict.items()}
print(orang_dict_dtypes)

{'name': <class 'str'>, 'age': <class 'int'>, 'height': <class 'float'>, 'weight': <class 'float'>, 'hair': <class 'str'>, 'eyes': <class 'str'>, 'has dog': <class 'bool'>, 'favorite book': <class 'str'>}


Comprehensions juga membuat kode lebih mudah dibaca. Bandingkan implementasi loop `for` dari `square_lut` dengan comprehension.

In [65]:
square_lut = {}
for x in range(10):
    square_lut[x] = x**2

print(square_lut)

square_lut = {x: x**2 for x in range(10)}

print(square_lut)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


## Beberapa topik yang belum kita diskusikan, tetapi telah digunakan:
- `map`