# List Comprehension

In [1]:
# simple method
nums = [1,2,3,4,5]
sq_nums = []
for n in nums :
    sq_nums.append(n**2)
print(sq_nums)

[1, 4, 9, 16, 25]


In [2]:
# list comprehension
# []는 우리가 list를 만든다는 것을 의미함
# for n in nums에서 element 하나씩 가지고 와서 각각에 대해서 n**2
sq_nums = [n**2 for n in nums]
print(sq_nums)

[1, 4, 9, 16, 25]


In [3]:
vec = [2,4,6]
[3*x for x in vec]

[6, 12, 18]

In [4]:
[3*x for x in vec if x > 3]

[12, 18]

In [8]:
[3*x for x in vec if x < 2]

[]

In [5]:
[[x, x**2] for x in vec]

[[2, 4], [4, 16], [6, 36]]

In [6]:
# error : 리스트 하나에 두 개의 element는 불가능
[x, x**2 for x in vec]

SyntaxError: invalid syntax (<ipython-input-6-0f1ce407c27f>, line 2)

In [7]:
# 특정한 단어가 몇 번 나왔는지 알고 싶은 경우
email = ['once', 'upon', 'a', 'time', 'in', 'a', 'far', 'away']
a = [1 for x in email if x == 'a'] # 'a'가 있으면 1이 들어감
print(a)
print(len(a))

[1, 1]
2


# Template :

    new_list = [f(x) for x in iterable]
    iterable에는 list, dictionary가 있다.

In [9]:
# more list comprehension
words = ['hello', 'this', 'is', 'python']
caps = [word.upper() for word in words]
print(caps)

['HELLO', 'THIS', 'IS', 'PYTHON']


In [10]:
powers = [(x**2, x**3) for x in range(5)] # 0부터 4까지
print(powers)

[(0, 0), (1, 1), (4, 8), (9, 27), (16, 64)]


In [11]:
# function 이용해서 list comprehension 사용하기
def isEven(num) :
    return (num % 2 == 0)

numbers = [2, 10, 7, 300, 63]
isEvens = [isEven(num) for num in numbers]

In [12]:
print(isEvens)

[True, True, False, True, False]


In [13]:
nuc = ['A', 'T']
codons = { x+y+z for x in nuc for y in nuc for z in nuc }
# x는 A 아니면 T가 된다. y는 A 아니면 T가 된다. z는 A 아니면 T가 된다.
# x, y, z는 경우의 수를 2개씩 가지고 있다.
print(codons)

{'TTA', 'TTT', 'TAT', 'AAT', 'TAA', 'ATT', 'AAA', 'ATA'}


In [14]:
nuc = ['A', 'T', 'C', 'G']
codons = { x+y+z for x in nuc for y in nuc for z in nuc }
print(codons)
print(len(codons))

{'CTC', 'GCA', 'TCG', 'TAT', 'CAC', 'CCA', 'GCT', 'TCA', 'TAC', 'TGA', 'GCG', 'TAG', 'CAG', 'AGC', 'GAA', 'TGT', 'TTA', 'CTA', 'TTT', 'TCT', 'AAT', 'AGG', 'CAT', 'TGG', 'GTC', 'ATT', 'CCT', 'CTT', 'CCC', 'ATA', 'GCC', 'CAA', 'ATC', 'TTC', 'TTG', 'ATG', 'CGC', 'GTT', 'GAG', 'AAC', 'GGC', 'GAC', 'GAT', 'ACC', 'AAG', 'ACT', 'GTA', 'GGT', 'ACA', 'ACG', 'TGC', 'CGA', 'AGA', 'CGG', 'TAA', 'CTG', 'CCG', 'CGT', 'GTG', 'GGA', 'TCC', 'AAA', 'AGT', 'GGG'}
64


In [16]:
myDict = {'a':10, 'b':20, 'c':30, 'd':40}
reverserDict = { value : key for key, value in myDict.items()}
print(reverserDict)

{10: 'a', 20: 'b', 30: 'c', 40: 'd'}


In [17]:
# key와 value가 unique하지 않은 경우
myDict = {'a':10, 'b':20, 'c':10, 'd':40}
reverserDict = { value : key for key, value in myDict.items()}
print(reverserDict)
# 10: 'a'가 없어지고 10: 'c'로 바뀜

{10: 'c', 20: 'b', 40: 'd'}


# String, List, Tuple, Dictionary의 길이를 확인하는 함수 -> len

In [18]:
fruit = "banana"
print(len(fruit))

myList = [1,2, [3,4], {"a":"123"}]
print(len(myList))

myTuple = (2,3,4)
print(len(myTuple))

myDict = {"a":{"cell":"123", "email":"a@email"}, "b":{"cell":222, "email":"b@email"}}
print(len(myDict))

6
4
3
2


In [21]:
fruit = "banana"
for letter in fruit:
    print(letter, end = " ")
print()

myList = [1,2, [3,4], {"a":"123"}]
for ele in myList:
    print(ele, end = " ")
print()

myTuple = (2,3,4)
for ele in myTuple:
    print(ele, end = " ")
print()

myDict = {"a":{"cell":"123", "email":"a@email"}, "b":{"cell":222, "email":"b@email"}}
for ele in myDict:
    print(ele, end = " ") # key값만 출력된다.
print()

for i, ele in myDict.items(): # items()가 있어야 key, value가 출력된다.
    print("{} {}".format(i,ele))

b a n a n a 
1 2 [3, 4] {'a': '123'} 
2 3 4 
a b 
a {'cell': '123', 'email': 'a@email'}
b {'cell': 222, 'email': 'b@email'}


# 특정 패턴을 찾거나, 찾은 패턴을 다른 패턴으로 치환하는 경우 -> find, replace

In [22]:
fruit = "banana"
pos = fruit.find("na") # "na"가 나오는 위치를 출력
print(pos)
aa = fruit.find("z") # 없는 것을 찾게 되면 return -1
print(aa)

2
-1


In [23]:
# search and replace
greet = "Hello Bob!"
greet1 = greet.replace("Bob", "John")
print(greet1)

Hello John!


# strip, startswith

In [24]:
greet = "    Hello Bob!   "
print(greet)
print(greet.lstrip()) # left strip : 왼쪽 없애줌
print(greet.rstrip()) # right strip : 오른쪽 없애줌
print(greet.strip()) # strip : 양쪽 없애줌
line = "Have a good weekend"
print(line.startswith("Have")) # "Have"로 시작했으면 True 리턴
print(line.startswith("h"))

    Hello Bob!   
Hello Bob!   
    Hello Bob!
Hello Bob!
True
False


# find를 이용한 string parsing

string.find(value, start, end)
value : required, 찾으려고 하는 것
start : optional, search를 시작하고자 하는 위치, default는 0
end : optional, search를 끝내고자 하는 위치, default는 end of the string

In [25]:
data = "From park@ssu.ac.kr Sat Jan 09:11:44 2019"
atpos = data.find(" ") # " "의 위치를 찾으려고 함
print(atpos)
blankpos = data.find(" ", atpos+1) # p에서부터 다음 blank를 찾아야하니까 atpos에 1을 더해준다.
print(blankpos)
print(data[atpos+1:blankpos]) # 원하는 부분만 뽑아내기

4
19
park@ssu.ac.kr


# Split : String을 List로 변환

In [26]:
greet = "    Hi! Good morning!  "
greetList = greet.split()
print(greetList)

['Hi!', 'Good', 'morning!']


In [27]:
line = "first;second;third"
line1 = line.split()
line2 = line.split(";")
print(line1)
print(line2)

['first;second;third']
['first', 'second', 'third']
