# Iterables

ในการเขียนโปรแกรมบ่อยครั้งเรามักต้องการเข้าถึงข้อมูลในไฟล์ ฐานข้อมูล หรือในตัวแปรที่มีข้อมูลมากจำนวนมาก แต่ว่าโดยทั่วไปเรามักจะต้องการประมวลผลเพียงครั้งละรายการเท่านั้น ดังนั้นเพื่อให้การเขียนโปรแกรมมีประสิทธิภาพมากขึ้นภาษา Python จึงได้กำหนดคุณลักษณะของชนิดข้อมูลหรือฟังก์ชั่นที่เราสามารถอ่านค่าได้ทีละรายการว่า iterables

**Iterables** หมายถึง object (เช่น ชนิดข้อมูล ฟังก์ชั่น) ที่เราสามารถเรียกดูข้อมูลทีละรายการได้ (iterate over) ตัวอย่างของ iterables เช่น ข้อมูลชนิด string, list, tuple, set และ dictionary หรือการอ่านไฟล์จากฟังก์ชั่น open() ดังตัวอย่าง

In [6]:
# example 1

n = 0
for line in open('datasets/atk.csv'):
    print(line)
    n += 1
    # if line number is equal to 5; stop.
    if n == 5:
        break

﻿Order,Order No.,วันที่ส่ง ATK,SAR CoV Ag,Comment

17/3/2565,6503062915,17/3/2022,Negative,

7/3/2565,6503061074,7/3/2022,Negative,

7/3/2565,6503061077,7/3/2022,Negative,

7/3/2565,6503061076,7/3/2022,Negative,



จากตัวอย่างข้างบน คำสั่ง **for** เป็นคำสั่งที่ใช้ในการอ่านข้อมูลทีละบรรทัดจากไฟล์ชื่อ atk.csv ซึ่งเป็นไฟล์ที่เก็บข้อมูลในรูปแบบของ comma separated values โดยในแต่ละบรรทัดจะเป็นข้อมูลหนึ่งรายการ ในไฟล์นี้มีจำนวนข้อมูลมากกว่า 1400 รายการ ดังนั้นการที่เราสามารถอ่านข้อมูลจากไฟล์ได้ทีละรายการเราจะสามารถจัดการกับข้อมูลขนาดเล็กได้อย่างมีประสิทธิภาพมากกว่าการอ่านข้อมูลมาเก็บไว้ในหน่วยความจำทั้งหมด 1400 รายการ

In [5]:
# example 2

d = {'a': 5, 'b': 6, 'c': 8}
for key in d:
    print(key)

a
b
c


**ตัวอย่างที่ 2** แสดงการ iterate ชนิดข้อมูลแบบ dictionary ที่เป็นชนิดของข้อมูลแบบ iterables ที่ส่งค่าคีย์ของข้อมูลทุกครั้งที่มีการเรียกข้อมูลผ่านคำสั่ง **for**

นอกจากนั้น dictionary ยังมีฟังก์ชั่นหรือเมธอดที่ทำหน้าที่เป็น iterables เช่น keys, values, items ดังตัวอย่างที่ 3 และ 4

In [7]:
# example 3

for key, value in d.items():
    print(f'{key} maps to {value}')

a maps to 5
b maps to 6
c maps to 8


In [8]:
# example 4

for values in d.values():
    print(values)

5
6
8


จงเปรียบเทียบ **ตัวอย่างที่ 5** แสดงการอ่านค่าจากชนิดข้อมูลแบบ list โดยการใช้ดัชนีหรือ index กับตัวอย่างที่ 6 ที่ใช้การเข้าถึงข้อมูลแบบ iterable

In [16]:
# example 5

a = [1,2,3,4,5]
for i in range(len(a)):
    print(a[i])

1
2
3
4
5


In [17]:
# example 6

a = [1,2,3,4,5]
for value in a:
    print(value)

1
2
3
4
5


ตัวอย่างที่ 5 ใช้ฟังก์ชั่น len เพื่อหาจำนวนรายการใน list จากนั้นใช้คำสั่ง range เพื่อสร้าง list ของ index และใช้คำสั่ง for เพื่ออ่านค่าจาก list ของ index ทีละค่าและบันทึกในตัวแปร value จะเห็นได้ว่าขั้นตอนมีความซับซ้อนมากกว่าตัวอย่างที่ 6 มาก

ทั้งนี้ หากเราต้องการแสดง index และรายการใน iterables พร้อมกัน เราสามารถใช้ฟังก์ชั่น enumerate ได้ ดังตัวอย่างที่ 7

In [19]:
# example 7
a = [1,2,3,4,5]
for i, value in enumerate(a):
    print(i, value)

0 1
1 2
2 3
3 4
4 5


ตัวอย่างที่ 7 แสดงการใช้ฟังก์ชั่น **enumerate** ที่สร้าง list ของ (index, item) ใน list ตามลำดับ

นอกจากชนิดข้อมูล และฟังก์ชั่นทั่วไปแล้ว ใน library ชื่อว่า itertools ยังมีฟังก์ชั่นที่สร้าง iterables และมีประโยชน์อย่างมากในการนำมาประยุกต์ใช้เช่น

In [40]:
import itertools

In [23]:
for cnt in itertools.count(5):  # this code will run forever
    print(cnt)
    if cnt == 20:
        break

5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20


In [26]:
b = ['เช้า', 'บ่าย', 'ดึก']
n = 0
for shift in itertools.cycle(b): # this code also runs forever cycling through the b list
    print(f'ฉันทำงานกะ{shift}')
    n += 1
    if n == 20:
        break

ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย
ฉันทำงานกะดึก
ฉันทำงานกะเช้า
ฉันทำงานกะบ่าย


In [44]:
c = 'ABCDEF'
[p for p in itertools.permutations(c,2)]

[('A', 'B'),
 ('A', 'C'),
 ('A', 'D'),
 ('A', 'E'),
 ('A', 'F'),
 ('B', 'A'),
 ('B', 'C'),
 ('B', 'D'),
 ('B', 'E'),
 ('B', 'F'),
 ('C', 'A'),
 ('C', 'B'),
 ('C', 'D'),
 ('C', 'E'),
 ('C', 'F'),
 ('D', 'A'),
 ('D', 'B'),
 ('D', 'C'),
 ('D', 'E'),
 ('D', 'F'),
 ('E', 'A'),
 ('E', 'B'),
 ('E', 'C'),
 ('E', 'D'),
 ('E', 'F'),
 ('F', 'A'),
 ('F', 'B'),
 ('F', 'C'),
 ('F', 'D'),
 ('F', 'E')]

In [49]:
for k, g in itertools.groupby('AGGTTGGCCACGGTATTTACCA'):
    print(k, list(g))

A ['A']
G ['G', 'G']
T ['T', 'T']
G ['G', 'G']
C ['C', 'C']
A ['A']
C ['C']
G ['G', 'G']
T ['T']
A ['A']
T ['T', 'T', 'T']
A ['A']
C ['C', 'C']
A ['A']


In [51]:
for comb in itertools.islice(itertools.combinations('ABCDE', 2), 2, 4):
    print(comb)

('A', 'D')
('A', 'E')


In [52]:
dd = {'a': 4, 'd': 5, 'c': 10}
list(dd)

['a', 'd', 'c']

ฟังก์ชั่น list เป็นฟังก์ชั่นที่ใช้สำหรับการสร้างชนิดข้อมูลแบบ list จาก iterables ดังนั้นเราสามารถใช้ฟังก์ชั่นนี้กับ iterables ได้ทั้งหมดรวมทั้ง iterator ด้วย

In [55]:
dd = {'a': 4, 'd': 5, 'c': 10}
set(dd)

{'a', 'c', 'd'}

ฟังก์ชั่น set เป็นฟังก์ชั่นที่ใช้สำหรับการสร้างชนิดข้อมูลแบบ set จาก iterables ดังนั้นเราสามารถใช้ฟังก์ชั่นนี้กับ iterables ได้ทั้งหมดรวมทั้ง iterator ด้วยเช่นกัน

In [59]:
ddd = {(k for k in itertools.groupby('AAAATTGGTTAAA')): (list(g) for k, g in itertools.groupby('AAAATTGGTTAAA'))}

In [60]:
ddd

{<generator object <genexpr> at 0x112e22200>: <generator object <genexpr> at 0x112e22350>}