In [1]:
import requests
from bs4 import BeautifulSoup


headers = {
    'User-Agent': (
        'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) '
        'AppleWebKit/537.36 (KHTML, like Gecko) '
        'Chrome/72.0.3626.121 Safari/537.36'
    ),
}


def get_like_count(song_no_list):
    api_url = "https://www.melon.com/commonlike/getSongLike.json"
    params = {"contsIds": song_no_list}
    res = requests.get(api_url, params=params, headers=headers)
    res.raise_for_status()
    response = res.json()
    like_list = response["contsLike"]
    like_dict = {
        str(song["CONTSID"]): song["SUMMCNT"]
        for song in like_list}
    return like_dict


def get_song_list():
    res = requests.get("http://www.melon.com/chart/index.htm", headers=headers)
    res.raise_for_status()
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    tr_tag_list = soup.select('.d_song_list tbody tr')

    song_list = []

    for rank, tr_tag in enumerate(tr_tag_list, 1):
        song_no = tr_tag["data-song-no"]
        song_tag = tr_tag.select_one('a[href*=playSong]')
        album_tag = tr_tag.select_one('.wrap_song_info a[href*=goAlbumDetail]')
        artist_tag = tr_tag.select_one('a[href*=goArtistDetail]')
        
        song = {
            'song_no': song_no,
            'title': song_tag.text,
            'album': album_tag.text,
            'artist': artist_tag.text,
            'rank': rank,
        }
        song_list.append(song)

    song_no_list = [song["song_no"] for song in song_list]
    like_dict = get_like_count(song_no_list)

    for song in song_list:
        like_count = like_dict[song["song_no"]]
        song["like"] = like_count

    return song_list

In [2]:
melon_top100_list = get_song_list()

In [3]:
from collections import defaultdict

In [4]:
artist_dict = defaultdict(int)

In [5]:
artist_dict["t"]

0

# 함수

In [6]:
class Person:
    def say_hello(self, name, age=None):
        print(f"안녕 {name}")

Person().say_hello("sgd")

안녕 sgd


In [7]:
def mysum(x: int, y: int) -> int:
    return x + y + 10

In [8]:
mysum(1, 2)

13

In [9]:
def 부가세_계산2(결제금액):
    부가세 = 결제금액 // 11
    부가세_제외금액 = 결제금액 - 부가세
    # 2개 값을 반환하는 듯 하지만, 실제 1개의 tuple
    return 부가세_제외금액, 부가세

금액1,금액2 = 부가세_계산2(20000)

In [10]:
금액1

18182

In [11]:
금액2

1818

In [12]:
# Type Hinting 버전

from typing import Tuple

def 부가세_계산2(결제금액: int) -> Tuple[int, int]:
    부가세 = 결제금액 // 11
    부가세_제외금액 = 결제금액 - 부가세
    return 부가세_제외금액, 부가세

In [13]:
부가세_계산2(20000)

(18182, 1818)

In [14]:
def mysum(x, y):
    return x + y * 10

In [15]:
print(mysum(1,2))
print(mysum(2,1))
print(mysum(y=2,x=1))

21
12
21


In [16]:
def 봉급계산(기본급, 야근시간=0):
    return 기본급 + 야근시간 * 8000 

In [17]:
봉급계산(800000, 20)

960000

In [18]:
봉급계산(800000, 야근시간=20)

960000

In [19]:
봉급계산(800000)

800000

In [20]:
def 리스트에_항목_추가(항목, 추가할_리스트=[]):
    추가할_리스트.append(항목)
    return 추가할_리스트

list1 = 리스트에_항목_추가("사과")
list2 = 리스트에_항목_추가("바나나")

print(list1)
print(list2)

['사과', '바나나']
['사과', '바나나']


In [21]:
def 리스트에_항목_추가(항목, 추가할_리스트=None):
    if 추가할_리스트 is None:
        추가할_리스트 = []
        
    추가할_리스트.append(항목)
    return 추가할_리스트

list1 = 리스트에_항목_추가("사과")
list2 = 리스트에_항목_추가("바나나")

print(list1)
print(list2)

['사과']
['바나나']


In [22]:
(lambda x, y: 10 * x + y)(1,2)

12

In [23]:
def fn(x, y):
    return 10 * x + y

fn(1,2)

12

# 일급 함수/클래스

In [24]:
from functools import reduce


def reducer1(x, y):
    return x + y

print(reduce(reducer1, [1, 2, 3, 4]))  # 10


print(reduce(lambda x, y: x + y, [1, 2, 3, 4]))  # 10

10
10


In [25]:
def fn():
    song = {
        "song_no":"3333",
        "title":"봄날",
        "album":"yyoo",
        "artist":"artist"
    }

    TEMPLATE = """
    가수: {artist}
    제목: {title}
    좋아요: {like}
    """

    artist = "방탄소년단"
    song_no = "1111"
    title = "봄날"
    album = "111"
    rank = 45
    like = 912355

    context = {
        "song_no": song_no,
        "title": title,
        "album": album,
        "rank": rank,
        "like": like,
        "artist": artist
    }

    return TEMPLATE.format(**context)
    
print(fn())


    가수: 방탄소년단
    제목: 봄날
    좋아요: 912355
    


# (실습)함수

# 문자열을 인자로 받아, 단어수를 반환하는 함수를 작성하세요.

- 예) "우리는 파이썬을 즐겨요"를 인자로 받아, 3을 반환
- 힌트) `"파이썬 자동화".split()`

In [26]:
def strLen(문자열):
    return len(문자열.split())

In [27]:
strLen("우리는 파이썬을 즐겨요")

3

# 문자열을 인자로 받아, 공백을 제외한 글자를 반환하는 함수를 작성하세요.

- 예) "우리는 파이썬을 즐겨요"를 인자로 받아, 10을 반환
- 힌트) 문자열은 순회가능한 객체

In [28]:
def strLenNblank(문자열):
    returnVlaue = ""
    for str in 문자열:
        returnVlaue += str.strip()
    return len(returnVlaue)

def fn2(s):
    return len([ch for ch in s if ch != ' '])

import re
def fn2_1(s):
    return len(re.sub(r"\s+", "", s))

In [29]:
strLenNblank("우리는 파이썬을 즐겨요")

10

In [30]:
fn2("우리는 파이썬을 즐겨요")

10

In [31]:
fn2_1("우리는 파이썬을 즐겨요")

10

# 자연수를 인자로 받아, 천단위 절사한 값을 리턴하는 함수를 작성하세요.

- 예) 정수 1234567을 인자로 받아, 1234000을 반환

In [32]:
def fn3(number):
    return (number//1000) * 1000
fn3(1234567)

1234000

# 클로저

In [33]:
def make_fn(base):
    lambda_fn = lambda x, y: x + y + base
    def fn(x, y):
        return base + x + y
    return fn

In [34]:
ret1 = make_fn(1)

In [35]:
print(ret1(1,2))
print(ret1(2,3))
print(ret1(3,4))

4
6
8


In [36]:
make_fn(1)(1,2)

4

# (실습) 빌트인 함수 및 정렬

## sorted : 정렬

In [37]:
sorted("마가바다라바사")

['가', '다', '라', '마', '바', '바', '사']

In [38]:
number_list = [25, 19, 45, 32]

In [39]:
sorted(number_list, reverse=True)

[45, 32, 25, 19]

In [40]:
def sort_fn(value): # 5, 2, 5, 9
    return value % 10
sorted(number_list, key=sort_fn)

[32, 25, 45, 19]

## filter : 필터링

In [41]:
filter(
    lambda song: song["artist"] == "방탄소년단",
    melon_top100_list
)

<filter at 0x7f846875de50>

In [42]:
iter0 = filter(
    lambda song: song["artist"] == "방탄소년단",
    melon_top100_list
)

iter1 = map(
    lambda song: song["like"],
    iter0,
)

for row in iter1:
    print(row)

361436
153725
406566
91392
92046
516287
85133
253355
80179
81005


# 1. 멜론TOP100 리스트에서 "곡명" 단어수 출력

In [43]:
iter3 = map(
    lambda song: len(song["title"]),
    melon_top100_list
)

for row in iter3:
    print(row)

38
8
9
12
12
14
21
13
18
6
44
14
28
13
28
25
4
30
27
15
24
9
25
23
17
17
7
16
3
11
41
8
6
16
37
31
5
11
2
13
8
16
11
12
19
13
40
2
11
34
5
7
9
19
4
7
3
16
9
12
13
4
3
2
2
3
15
9
26
2
5
4
16
4
9
1
2
9
11
13
18
6
20
17
11
19
7
3
4
7
3
29
20
21
15
10
6
7
7
7


# 2. 멜론TOP100 리스트에서 "곡명" 단어수로 TOP10 곡명 출력

In [44]:
iter3 = map(
    lambda song: (len(song["title"]),song["title"]),
    melon_top100_list
)

def sort_fn(song):
    return song[0]

list(map(
    lambda song: song[1],
    sorted(iter3, key=sort_fn, reverse=True)[:10]
))

['Savage Love (Laxed - Siren Beat) (BTS Remix)',
 '작은 것들을 위한 시 (Boy With Luv) (Feat. Halsey)',
 '오늘도 빛나는 너에게 (To You My Light) (Feat.이라온)',
 'VVS (Feat. JUSTHIS) (Prod. GroovyRoom)',
 '모든 날, 모든 순간 (Every day, Every Moment)',
 '윈윈 (Feat. 개코, BewhY) (Prod. BewhY)',
 'All I Want For Christmas Is You',
 '원해 (Feat. 팔로알토) (Prod. 코드 쿤스트)',
 'Ice Cream (with Selena Gomez)',
 '내 마음이 움찔했던 순간 (취향저격 그녀 X 규현)']

In [45]:
list(
    map(
        lambda song: song["title"],
        sorted(
            melon_top100_list,
            key=lambda song: len(song["title"].split()),
            reverse=True
        )[:10]
    )
)

['작은 것들을 위한 시 (Boy With Luv) (Feat. Halsey)',
 'Savage Love (Laxed - Siren Beat) (BTS Remix)',
 '내 마음이 움찔했던 순간 (취향저격 그녀 X 규현)',
 '모든 날, 모든 순간 (Every day, Every Moment)',
 '오늘도 빛나는 너에게 (To You My Light) (Feat.이라온)',
 '나랑 같이 걸을래 (바른연애 길잡이 X 적재)',
 'All I Want For Christmas Is You',
 '사랑 못해, 남들 쉽게 다 하는 거',
 '별을 담은 시 (Ode To The Stars)',
 '취기를 빌려 (취향저격 그녀 X 산들)']

In [46]:
max(
    melon_top100_list,
    key=lambda song: song["like"]
)

{'song_no': '30244931',
 'title': '봄날',
 'album': 'YOU NEVER WALK ALONE',
 'artist': '방탄소년단',
 'rank': 48,
 'like': 516287}

In [47]:
min(
    melon_top100_list,
    key=lambda song: song["rank"]
)

{'song_no': '33077590',
 'title': 'VVS (Feat. JUSTHIS) (Prod. GroovyRoom)',
 'album': '쇼미더머니 9 Episode 1',
 'artist': '미란이',
 'rank': 1,
 'like': 99573}

# 1. "좋아요" 수가 가장 많은 곡은? 가장 작은 곡은?

In [48]:
max(
    melon_top100_list,
    key=lambda song: song["like"]
)

{'song_no': '30244931',
 'title': '봄날',
 'album': 'YOU NEVER WALK ALONE',
 'artist': '방탄소년단',
 'rank': 48,
 'like': 516287}

In [49]:
min(
    melon_top100_list,
    key=lambda song: song["like"]
)

{'song_no': '33102839',
 'title': '어제의 우리들',
 'album': '어제의 우리들',
 'artist': '스탠딩 에그',
 'rank': 99,
 'like': 2409}

# 2. "곡명" 단어수가 가장 많은 곡은? 가장 작은 곡은?

In [50]:
max(
    melon_top100_list,
    key=lambda song: song["title"].split()
)

{'song_no': '32998018',
 'title': '힘든 건 사랑이 아니다',
 'album': '힘든 건 사랑이 아니다',
 'artist': '임창정',
 'rank': 4,
 'like': 79724}

In [51]:
min(
    melon_top100_list,
    key=lambda song: song["title"].split()
)

{'song_no': '31509376',
 'title': '12:45 (Stripped)',
 'album': '12:45 (Stripped)',
 'artist': 'Etham',
 'rank': 73,
 'like': 97293}

# 3. "곡명" 글자수가 가장 많은 곡은? 가장 작은 곡은?

In [52]:
max(
    melon_top100_list,
    key=lambda song: len(song["title"])
)

{'song_no': '32962258',
 'title': 'Savage Love (Laxed - Siren Beat) (BTS Remix)',
 'album': 'Savage Love (Laxed - Siren Beat) [BTS Remix]',
 'artist': 'Jawsh 685',
 'rank': 11,
 'like': 129098}

In [53]:
min(
    melon_top100_list,
    key=lambda song: len(song["title"])
)

{'song_no': '33077239',
 'title': '병',
 'album': 'BE',
 'artist': '방탄소년단',
 'rank': 76,
 'like': 81005}

# 대소비교

In [54]:
"9" < "10"

False

In [55]:
["9"] < ["1","0"]

False

In [56]:
("9",) < ("1","0")

False

## 퀴즈 : 다수 기준으로 정렬하여, 출력하기

멜론 TOP100 리스트에서 ...

- 1차 기준 : 가수명 오름차순
- 2차 기준 : 좋아요 수 내림차순

In [57]:
def sort_fn(song):    
    return song["artist"], -song["like"]

for song in sorted(
    melon_top100_list,
    key=sort_fn,
    #reverse=True
):
    print("{artist} - {like}".format(**song))

(여자)아이들 - 89101
AKMU (악동뮤지션) - 324530
AKMU (악동뮤지션) - 27815
Anne-Marie - 344306
Ariana Grande - 163933
BLACKPINK - 164283
BLACKPINK - 150873
BLACKPINK - 71717
BLACKPINK - 46199
Billie Eilish - 240736
Conan Gray - 109774
Crush - 46083
Dua Lipa - 125802
Etham - 97293
HYNN (박혜원) - 178536
ITZY (있지) - 57151
Jawsh 685 - 129098
Lauv - 235159
MINO (송민호) - 36972
Mariah Carey - 145453
Maroon 5 - 147210
Red Velvet (레드벨벳) - 207358
TWICE (트와이스) - 45050
Tones And I - 143041
aespa - 22845
가호 (Gaho) - 193775
경서 - 44501
경서예지 - 35824
규현 (KYUHYUN) - 80922
김필 - 101286
노을 - 168366
노을 - 13608
릴보이 (lIlBOI) - 37593
마마무 (Mamamoo) - 49244
마마무 (Mamamoo) - 26902
마크툽 (MAKTUB) - 221777
마크툽 (MAKTUB) - 31090
먼데이 키즈 (Monday Kiz) - 21025
미란이 - 99573
바이브 - 151385
박진영 - 67218
방탄소년단 - 516287
방탄소년단 - 406566
방탄소년단 - 361436
방탄소년단 - 253355
방탄소년단 - 153725
방탄소년단 - 92046
방탄소년단 - 91392
방탄소년단 - 85133
방탄소년단 - 81005
방탄소년단 - 80179
백지영 - 48956
벤 - 5186
블루 (BLOO) - 179950
산들 - 157471
선미 - 82426
송하예 - 19680
순순희 - 33191
스윙스 - 23228
스탠딩 에그

# 정규표현식

In [58]:
"[]"
"\d+"
"\\d" 
r"\d" # Raw의 약자

'\\d'

In [59]:
"\n" # => 1문자
"\t"

'\t'

In [60]:
r"\d{4}" # [0-9] 연속해서 4회 반복
r"[23]\d{3}"

'[23]\\d{3}'

In [61]:
# pk: "\d+"
# uuid: 32글자 => "[0-9a-f{32}]"
# slug => 영문자
# slug(unicode) => 모든 문자

In [62]:
from uuid import uuid4

In [63]:
uuid4()

UUID('4d8aa18e-c050-4d5b-9585-a6eaa213cb5e')

In [64]:
uuid4().hex

'6222dd25e8004d549b4b7f76d72bbf87'

# 유니코드

In [65]:
unicode_ga = '가나다'
utf8_ga = unicode_ga.encode('utf8')

print(len(unicode_ga))   # 3 : 글자 수
print(len(utf8_ga))      # 9 : 바이트 수

# 처음 2글자만 보기
print(unicode_ga[:2])
print(utf8_ga[:6])       # 인코딩따라서 참조하는 인덱스가 다름.

3
9
가나
b'\xea\xb0\x80\xeb\x82\x98'


In [66]:
"가" # str(유니코드) => bytes(특정 인코딩)
"가".encode("utf8") # bytes

b'\xea\xb0\x80'

In [67]:
image_url = "https://search.naver.com/search.naver?where=image&sm=tab_jum&query=%EC%9D%B4%EB%AF%B8%EC%A7%80#"

res = requests.get(image_url, headers=headers)
res

<Response [200]>

In [68]:
f = open("hello.txt", "wb") # bytes를 직접 저장하겠다.
f.write("가".encode("cp949"))
f.close()

In [69]:
# 유니코드를 주면 알아서 인코딩(utf-8,cp949)을 해달라
#     encoding 옵션을 명시적으로 주어, OS마다 다르게 저장되는 인코딩의 차이를 제거한다.
f = open("hello.txt", "wt", encoding="utf8") 
f.write("가")
f.close()

In [70]:
f = open("hello.txt", "wb")
f.write(image_url)
f.close()

TypeError: a bytes-like object is required, not 'str'

In [None]:
# res.text => res.content (bytes)를 디코딩하여, 유니코드화(str)
# res.content.decode("utf8")

In [None]:
from IPython.display import Image

In [None]:
Image(url=image_url)

In [None]:
utf8_bytes = "가".encode("utf8")
utf8_bytes

In [None]:
# 현재 role에 위반되는 항목을 무시하고 진행을 하겠다.
utf8_bytes.decode("utf8", errors="ignore") 

In [None]:
utf8_bytes.decode

In [None]:
f = open("hello.txt", "rt", encoding="utf8")
f.read()

In [None]:
import locale

In [None]:
# 이미지 다운받기
import os
import requests

image_url = "https://www.python.org/static/img/python-logo@2x.png"
image_filename = os.path.basename(image_url)

# 서버에서 요청을 거부할 수도 있습니다. (예: 네이버 웹툰 이미지)
res = requests.get(image_url)
이미지_데이터 = res.content

f = open(image_filename, "wb")
f.write(이미지_데이터)
f.close()

In [None]:
# 네이버 웹툰 이미지 받아보기
import os

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36'
}

image_url = 'https://image-comic.pstatic.net/webtoon/728750/81/20201023203136_f71de6b830335fa091a3cf0819224c9c_IMAG01_1.jpg'

res = requests.get(image_url, headers=headers)
filename = os.path.basename(image_url)
with open(filename, "wb") as f:
    f.write(res.content)
    print(f"written to {filename}.")

In [None]:
!ls

In [None]:
!open .

In [None]:
from contextlib import contextmanager

@contextmanager
def myopen(filepath, mode):
    f = open(filepath, mode)
    try:
        yield f
    finally:
        f.close()  # 항상 호출됩니다.

In [None]:
with myopen("hello.txt", "wt") as f:
    f.write("....")

In [None]:
import pandas as pd

pd.DataFrame(melon_top100_list).to_csv("melon_top100.csv")  # UTF8

# 퀴즈) 텍스트 파일을 줄 단위로 읽어서 출력하기

In [None]:
with open("melon_top100.csv", "rt") as f:
    # TODO: 줄 단위로 읽어서 출력해보세요.
    
#     print(f.read())
    
#     for line in f.read().splitlines():
#         print("!!!",line)

#     for line in f.read().splitlines()[:10]:
#         print("!!!",line)

#     for line in f:   # 파일객체는 Iterable
#         print("!!!", line)

    for index, line in enumerate(f):   # 파일객체는 Iterable
        print(f"[{index}]", line)
        if index >= 10:
            break

# 장식자 (Decorators)

In [None]:
def base_10():
    fn = lambda x, y: x + y + 10
    return fn

def base_10_2():
    fn = lambda x, y: x + y + 10
    def fn(x, y):
        return x + y + 10
    return fn

In [None]:
def mysum1(x, y):
    return x + y

In [None]:
print(base_10()(1,2))
print(base_10_2()(1,2))

In [None]:
# base_10 함수 호출 시마다
# 새로운 함수가 만들어지고 반환합니다.
def base_10(fn):
    def wrap(x, y):
        return x + y + 10
    return wrap

In [None]:
# base_10 함수 호출 시마다
# 새로운 함수가 만들어지고 반환합니다.
def base_10(fn):
    def wrap(x, y):
        return x + y + 10
    return wrap

In [None]:
#
# base_10 활용 예 #2
#

@base_10
def mysum2(x, y):
    return x + y

In [None]:
def base_10(fn):
    def wrap(x, y):
        return fn(x, y) + 10
    return wrap

def base_20(fn):
    def wrap(x, y):
        return fn(x, y) + 20
    return wrap

def base_30(fn):
    def wrap(x, y):
        return fn(x, y) + 30
    return wrap

@base_10
@base_20
@base_30
def mysum3(x, y):
    return x + y

mysum3(1, 2)

In [None]:
def base(base_number):
    def wrap(fn):
        def inner(x, y):
            return fn(x, y) + base_number
        return inner
    return wrap

# base_10 = base(10)
# base_20 = base(20)
# base_30 = base(30)

# @base_10
# @base_30
@base(100)
def mysum3(x, y):
    return x + y

mysum3(1, 2)

In [None]:
def mysum1(x, y):
    return x + y

In [None]:
mysum1 = base_10(mysum1) # 이름을 맞춥니다.
mysum1 = base_10(mysum1) # 이름을 맞춥니다.
mysum1 = base_10(mysum1) # 이름을 맞춥니다.
mysum1 = base_10(mysum1) # 이름을 맞춥니다.

mysum1(1,2)

In [None]:
@base_10
@base_10
@base_10
def mysum2(x,y):
    return x + y

mysum2(1,2)

# 퀴즈) 지정된 조건의 인자만 처리하기

In [None]:
def myfilter(filter_fn, alter_value):
    def wrap(fn):
        def inner(*args):  # args: tuple
            # TODO
            new_args = []
            for arg in args:
                new_args.append(
                    arg if filter_fn(arg) else alter_value
                )
            print(*new_args)
            return fn(*new_args)
           
        return inner
    return wrap


@myfilter(lambda i: i % 2 == 0, 0)
def mysum_only_even_number(a, b, c, d, e):
    return a + b + c + d + e

@myfilter(lambda i: i % 2 == 1, 1)
def mymultiply_only_odd_number(a, b, c, d, e):
    return a * b * c * d * e

assert mysum_only_even_number(1,2,3,4,5) == 6
#       mysum_only_even_number(0,2,0,4,0) == 6
assert mymultiply_only_odd_number(1,2,3,4,5) == 15
#       mymultiply_only_odd_number(1,1,3,1,5)

# memoize 장식자 구현하기

# 장식자 알아보기

In [None]:
def decorator(func):
  def deco_func():
    print("tistory")
    func()
  return deco_func
    
def function1():
  print("ssungkang")
  

function1 = decorator(function1)
function1()
# tistory
# ssungkang
print("111")