형식화(formatting)는 미리 정의된 문자열에 데이터 값을 끼워 넣어서 사람이 보기 좋은 문자열로 저장하는 과정 

4가지 방식이 있지만 3가지는 심각한 단점이 있음 

# 형식 문자열: % 형식화 

In [1]:
a = 0b10111011
b = 0xc5f
print('Binary is %d, hex is %d' % (a, b))

Binary is 187, hex is 3167


%d와 같은 형식 지정자(format specifier) 사용

위와 같은 C 스타일 형식 문자열은 4가지 단점이 있음 

1) 형식화 식에서 오른쪽에 있는 tuple 내 데이터 값의 순서를 바꾸거나 값의 타입을 바꾸면 타입 변환이 불가능 

In [2]:
key = 'my_var'
value = 1.234
formatted = '%-10s = %.2f' %(key, value)
print(formatted)

my_var     = 1.23


In [3]:
# key와 value의 위치를 바꾸면 실행 시점에 예외 발생
reordered_tuple = '%-10s = %.2f' %(value, key)

TypeError: must be real number, not str

이런 오류를 피하려면 % 연산자의 좌우가 서로 잘 맞는지 계속 검사해야 함 

2) 형식화를 하기 전에 값을 살짝 변경해야 한다면 식을 읽기가 매우 어려워진다 

In [4]:
pantry = [
    ('avocados', 1.25),
    ('bananas', 2.5),
    ('cherries', 15),
]
for i, (item, count) in enumerate(pantry):
    print('#%d: %-10s = %.2f' % (i, item, count))

#0: avocados   = 1.25
#1: bananas    = 2.50
#2: cherries   = 15.00


In [5]:
# tuple의 길이가 너무 길어져서 여러 줄에 나눠써야 해서 가독성이 떨어짐
for i, (item, count) in enumerate(pantry):
    print('#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count)))

#1: Avocados   = 1
#2: Bananas    = 2
#3: Cherries   = 15


3) 형식화 문자열에서 같은 값을 여러 번 사용하고 싶다면 튜플에서 같은 값을 여러 번 반복해야 한다 

In [6]:
template = '%s loves food. See %s cook.'
name = 'Max'
formatted = template % (name, name)
print(formatted)

Max loves food. See Max cook.


이런 문제를 해결하기 위해 파이썬의 % 연산자에는 튜플 대신 딕셔너리를 사용 가능 -> 첫번째, 세번째 문제점 해결 가능 

In [7]:
key = 'my_var'
value = 1.234

old_way = '%-10s = %.2f' % (key, value)

new_way = '%(key)-10s = %(value).2f' % {
    'key': key, 'value': value}  # Original

reordered = '%(key)-10s = %(value).2f' % {
    'value': value, 'key': key}  # Swapped

assert old_way == new_way == reordered

In [8]:
print(old_way)
print(new_way)
print(reordered)

my_var     = 1.23
my_var     = 1.23
my_var     = 1.23


In [9]:
name = 'Max'

template = '%s loves food. See %s cook.'
before = template % (name, name)   # Tuple

template = '%(name)s loves food. See %(name)s cook.'
after = template % {'name': name}  # Dictionary

assert before == after

In [10]:
print(after)

Max loves food. See Max cook.


하짐나 딕셔너리 형식 문자열을 사용하면 다른 문제가 더 심해지거나 새로운 문제 발생 <br>
두번째 문제: 형식화 식이 더 길어지고 시각적으로 bad 

In [11]:
for i, (item, count) in enumerate(pantry):
    before = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))

    after = '#%(loop)d: %(item)-10s = %(count)d' % {
        'loop': i + 1,
        'item': item.title(),
        'count': round(count),
    }

    assert before == after


4) 형식화 식에 딕셔너리를 사용하면 문장이 번잡스러워진다  
각 키를 최소 두 번 (한번은 형식 지정자에, 다른 한 번은 딕셔너리 키에) 반복 

In [12]:
soup = 'lentil'
formatted = 'Today\'s soup is %(soup)s.' % {'soup': soup}
print(formatted)

Today's soup is lentil.


In [13]:
menu = {
    'soup': 'lentil',
    'oyster': 'kumamoto',
    'special': 'schnitzel',
}
template = ('Today\'s soup is %(soup)s, '
            'buy one get two %(oyster)s oysters, '
            'and our special entrée is %(special)s.')
formatted = template % menu
print(formatted)

Today's soup is lentil, buy one get two kumamoto oysters, and our special entrée is schnitzel.


# 내장 함수 format과 str.format

In [14]:
a = 1234.5678
formatted = format(a, ',.2f')
print(formatted)

1,234.57


In [18]:
b = 'my string'
formatted = format(b, '^20s')
print('*', formatted, '*')


*      my string       *


In [16]:
help('FORMATTING')

Format String Syntax
********************

The "str.format()" method and the "Formatter" class share the same
syntax for format strings (although in the case of "Formatter",
subclasses can define their own format string syntax).  The syntax is
related to that of formatted string literals, but there are
differences.

Format strings contain “replacement fields” surrounded by curly braces
"{}". Anything that is not contained in braces is considered literal
text, which is copied unchanged to the output.  If you need to include
a brace character in the literal text, it can be escaped by doubling:
"{{" and "}}".

The grammar for a replacement field is as follows:

      replacement_field ::= "{" [field_name] ["!" conversion] [":" format_spec] "}"
      field_name        ::= arg_name ("." attribute_name | "[" element_index "]")*
      arg_name          ::= [identifier | digit+]
      attribute_name    ::= identifier
      element_index     ::= digit+ | index_string
      index_string      ::=

위치 지정자 {}를 사용할 수 있음 

In [19]:
key = 'my_var'
value = 1.234

formatted = '{} = {}'.format(key, value)
print(formatted)

my_var = 1.234


각 위치 지정자에는 콜론 뒤에 형식 지정자를 붙여 넣어 문자열에 값을 넣을 때 어떤 형식으로 변환할지 정할 수 있음  
모든 형식 지정자에 대한 정보: help('FORMATTING')

In [22]:
formatted = '{:<10} = {:.2f}'.format(key, value)
print(formatted)

my_var     = 1.23


위치 지정자 중괄호에 위치 인덱스 사용 가능. 이렇게 하면 FORMAT에 넘기는 인자의 순서를 바꾸지 않아도 됨 

In [23]:
formatted = '{1} = {0}'.format(key, value)
print(formatted)

1.234 = my_var


위치 인덱스 여러 번 사용할 수 있음 (3번째 문제 해결) 

In [24]:
formatted = '{0} loves food. See {0} cook.'.format(name)
print(formatted)

Max loves food. See Max cook.


하지만 여전히 두번째 문제 (가독성)은 해결 X

In [25]:
for i, (item, count) in enumerate(pantry):
    old_style = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))

    new_style = '#{}: {:<10s} = {}'.format(
        i + 1,
        item.title(),
        round(count))

    assert old_style == new_style

형식 지정자에는 딕셔너리 키나 리스트 인덱스를 조합해 위치 지정자에 사용하거나 값을 유니코드나 repr 문자열로 변환하는 등의 고급 옵션 있음

In [27]:
menu

{'soup': 'lentil', 'oyster': 'kumamoto', 'special': 'schnitzel'}

In [26]:
formatted = 'First letter is {menu[oyster][0]!r}'.format(
    menu=menu)
print(formatted)

First letter is 'k'


하지만 이 기능도 네 번째 문제점인 키가 반복되는 경우의 중복을 해결하지 못함 

In [31]:
old_template = (
    'Today\'s soup is %(soup)s, '
    'buy one get two %(oyster)s oysters, '
    'and our special entrée is %(special)s.')
old_formatted = old_template % {
    'soup': 'lentil',
    'oyster': 'kumamoto',
    'special': 'schnitzel',
}

new_template = (
    'Today\'s soup is {soup}, '
    'buy one get two {oyster} oysters, '
    'and our special entrée is {special}.')
new_formatted = new_template.format(
    soup='lentil',
    oyster='kumamoto',
    special='schnitzel',
)

assert old_formatted == new_formatted

# 인터폴레이션을 통한 형식 문자열

f-문자열: 인터폴레이션을 통한 형식 문자열 
위의 모든 문제를 해결할 수 있는 문법 

In [32]:
key = 'my_var'
value = 1.234

formatted = f'{key} = {value}'
print(formatted)

my_var = 1.234


format 함수의 형식 지정자 안에서 콜론 뒤에 사용할 수 있는 언어를 사용할 수 있음 

In [35]:
formatted = f'{key!r:<10} = {value:.2f}'
print(formatted)

'my_var'   = 1.23


모든 형식화 방식의 길이 비교 

In [36]:
f_string = f'{key:<10} = {value:.2f}'

c_tuple  = '%-10s = %.2f' % (key, value)

str_args = '{:<10} = {:.2f}'.format(key, value)

str_kw   = '{key:<10} = {value:.2f}'.format(key=key, value=value)

c_dict   = '%(key)-10s = %(value).2f' % {'key': key, 'value': value}

assert c_tuple == c_dict == f_string
assert str_args == str_kw == f_string

f-문자열을 사용하면 위치 지정자 중괄호 안에 완전한 파이썬 식을 넣을 수 있음 <br>
간결한 구문이므로 2번쨰 문제점을 해결 

In [37]:
for i, (item, count) in enumerate(pantry):
    old_style = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))

    new_style = '#{}: {:<10s} = {}'.format(
        i + 1,
        item.title(),
        round(count))

    f_string = f'#{i+1}: {item.title():<10s} = {round(count)}'

    assert old_style == new_style == f_string

의미가 더 명확해진다면 연속된 문자열을 서로 연결해주는 기능을 사용 가능 (이 경우에도 다른 방식보다 코드가 깔끔)

In [39]:
for i, (item, count) in enumerate(pantry):
    print(f'#{i+1}: '
          f'{item.title():<10s} = '
          f'{round(count)}')

#1: Avocados   = 1
#2: Bananas    = 2
#3: Cherries   = 15


파이썬 식을 형식 지정자 옵션에 넣을 수 있음 <br>
ex. 출력할 숫자 개수를 하드코딩하는 대신 변수를 사용해 형식 문자열 안에 파라미터화 

In [40]:
places = 3
number = 1.23456
print(f'My number is {number:.{places}f}')

My number is 1.235


__값을 문자열로 형식화해야 하는 상황을 만나게 되면 다른 대안 대신 f-문자열을 택하자!!__