# 4. C 스타일 형식 문자열을 str.format과 쓰기보다는 f-문자열을 통한 인터폴레이션을 사용하라

- 형식화(formatting)는 미리 정의된 문자열에 데이터 값을 끼워 넣어서 사람이 보기 좋은 문자열로 저장하는 과정

- % formatting

In [3]:
a = 0b10111011
b = 0xc5f
print('이진수: %d, 십육진수: %d' % (a, b))

이진수: 187, 십육진수: 3167


C 스타일 형식화의 문제점
1. 형식화 식에서 오른쪽에 있는 tuple 내 데이터 값의 순서를 바꾸거나 값의 타입을 바꾸면 타입 변환이 불가능하므로 오류가 발생할 수 있다.

In [4]:
key = 'my_var'
value = 1.234
formatted = '%-10s = %.2f' % (key, value)
print(formatted)

my_var     = 1.23


In [5]:
reordered_tuple = '%-10s = %.2f' % (value, key)

TypeError: must be real number, not str

In [6]:
reordered_string = '%.2f = %-10s' % (key, value)

TypeError: must be real number, not str

2. 형식화를 하기 전에 값을 살짝 변경해야 한다면 식을 읽기가 매우 어려워 진다.

In [7]:
pantry = [
    ('아보카도', 1.24),
    ('바나나', 2.5),
    ('체리', 15),
]
for i, (item, count) in enumerate(pantry):
    print('#%d: %-10s = %.2f' % (i, item, count))

#0: 아보카도       = 1.24
#1: 바나나        = 2.50
#2: 체리         = 15.00


In [8]:
for i, (item, count) in enumerate(pantry):
    print('#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count)))

#1: 아보카도       = 1
#2: 바나나        = 2
#3: 체리         = 15


3. 형식화 문자열에서 같은 값을 여러번 사용하고 싶다면 튜플에서 같은 값을 여러 번 반복해야 한다.

In [9]:
template = '%s는 음식을 좋아해, %s가 요리하는 모습을 봐요.'
name = '철수'
formatted = template % (name, name)
print(formatted)

철수는 음식을 좋아해, 철수가 요리하는 모습을 봐요.


In [12]:
# title test
test = 'dongju park'
print(test.title())
# 띄어쓰기 기준으로 문자 맨 앞글자를 대문자로 변경 

Dongju Park


위의 문제들 해결 방법
1. 딕셔너리 이용

In [14]:
key = 'my_var'
value = 1.234

old_way = '%-10s = %.2f' % (key, value)

new_way = '%(key)-10s = %(value).2f' % {
    'key': key, 'value': value} # 원래방식

reordered = '%(key)-10s = %(value).2f' % {
    'value': value, 'key': key} # 바꾼 방식

print(old_way)
print(new_way)
print(reordered)

assert old_way == new_way == reordered

my_var     = 1.23
my_var     = 1.23
my_var     = 1.23


3. 딕셔너리 이용

In [16]:
template = '%s는 음식을 좋아해, %s가 요리하는 모습을 봐요.'
name = '철수'

before = template % (name, name) # 튜플
template = '%(name)s는 음식을 좋아해, %(name)s가 요리하는 모습을 봐요.'
after = template % {'name': name}

print(before)
print(after)

assert before == after

철수는 음식을 좋아해, 철수가 요리하는 모습을 봐요.
철수는 음식을 좋아해, 철수가 요리하는 모습을 봐요.


2. 딕셔너리를 사용하면 오히려 복잡해짐 -> 네번째 문제가 됨

In [17]:
for i, (item, count) in enumerate(pantry):
    before = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))
    after = '#%(loop)d: %(item)-10s = %(count)d' % {
        'loop': i + 1,
        'item': item.title(),
        'count': round(count),
    }
    
    print(before)
    print(after)
    
    assert before == after

#1: 아보카도       = 1
#1: 아보카도       = 1
#2: 바나나        = 2
#2: 바나나        = 2
#3: 체리         = 15
#3: 체리         = 15


In [18]:
soup = 'lentil'
formatted = 'Today\'s soup is %(soup)s.' % {'soup': soup}  # \'를 보여주기 위해 일부러 원서 코드를 그대로 남겨둠
print(formatted)

Today's soup is lentil.


In [19]:
menu = {
    'soup': 'lentil',
    'oyster': 'tongyoung',
    'special': 'schnitzel',
}
template = ('Today\'s soup is %(soup)s, '
            'buy one get two %(oyster)s oysters, '
            'and our special entrée is %(special)s.')
formatted = template % menu
print(formatted)


Today's soup is lentil, buy one get two tongyoung oysters, and our special entrée is schnitzel.


가독성이 더 나빠지므로 더 나은 방법이 있어야 한다.

## 내장 함수 format과 str.format

format 내장 함수를 통한 **고급 문자열 형식화**

In [20]:
a = 1234.5678
formatted = format(a, ',.2f')
print(formatted)

1,234.57


In [21]:
b = 'my 문자열'
formatted = format(b, '^20s')
print('*', formatted, '*')

*        my 문자열        *


str 타입에 format의 경우 위치 지정자 {}를 사용할 수 있다.

In [22]:
key = 'my_var'
value = 1.234

formatted = '{} = {}'.format(key, value)
print(formatted)

my_var = 1.234


위치 지정자에는 콜론 뒤에 형식 지정자를 넣어 변환 할 수 있다.

In [23]:
help('FORMATTING')

Format String Syntax
********************

The "str.format()" method and the "Formatter" class share the same
syntax for format strings (although in the case of "Formatter",
subclasses can define their own format string syntax).  The syntax is
related to that of formatted string literals, but there are
differences.

Format strings contain “replacement fields” surrounded by curly braces
"{}". Anything that is not contained in braces is considered literal
text, which is copied unchanged to the output.  If you need to include
a brace character in the literal text, it can be escaped by doubling:
"{{" and "}}".

The grammar for a replacement field is as follows:

      replacement_field ::= "{" [field_name] ["!" conversion] [":" format_spec] "}"
      field_name        ::= arg_name ("." attribute_name | "[" element_index "]")*
      arg_name          ::= [identifier | digit+]
      attribute_name    ::= identifier
      element_index     ::= digit+ | index_string
      index_string      ::=

In [24]:
formatted = '{:<10} = {:.2f}'.format(key, value)
print(formatted)

my_var     = 1.23


{:.2f}는 format(value, '.2f') 와 같음

특별 메서드인 \__format\__을 사용해 클래스별로 형식화 방식을 커스텀 가능

**이스케이프**

In [25]:
print('%.2f%%' % 12.5)
print('{} replaces {{}}'.format(1.23))

12.50%
1.23 replaces {}


위치 지정자 중괄호에 위치 인덱스를 전달 할 수 있음.

In [26]:
formatted = '{1} = {0}'.format(key, value)
print(formatted)

1.234 = my_var


세 번째 문제점도 간단히 해결 가능

In [27]:
name = '철수'
formatted = '{0}는 음식을 좋아해. {0}가 요리하는 모습을 봐요.'.format(name)
print(formatted)

철수는 음식을 좋아해. 철수가 요리하는 모습을 봐요.


두번째는 역시 해결하지 못함

In [28]:
for i, (item, count) in enumerate(pantry):
    old_style = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))
        
    new_style = '#{}: {:<10s} = {}'.format(
        i + 1,
        item.title(),
        round(count))
        
    assert old_style == new_style

str.format과 함께 사용하는 형식 지정자에는 딕셔너리 키나 리스트 인덱스를 조합해 위치 지정자에 사용하거나 값을 유니코드나 repr 문자열로 변화나는 등의 고급 옵션이 있다.

In [29]:
formatted = '첫번째 글자는 {menu[oyster][0]!r}'.format(
    menu=menu)
print(formatted)

첫번째 글자는 't'


이 기능도 네 번째 문제점인 키가 반복되는 경우의 중복을 줄여주지는 못함

In [30]:
old_template = (
    'Today\'s soup is %(soup)s, '
    'buy one get two %(oyster)s oysters, '
    'and our special entrée is %(special)s.')
old_formatted = template % {
    'soup': 'lentil',
    'oyster': 'tongyoung',
    'special': 'schnitzel',
}

new_template = (
    'Today\'s soup is {soup}, '
    'buy one get two {oyster} oysters, '
    'and our special entrée is {special}.')
new_formatted = new_template.format(
    soup='lentil',
    oyster='tongyoung',
    special='schnitzel',
)

assert old_formatted == new_formatted

## 인터폴레이션을 통한 형식 문자열

이 문제를 한 번에 완전히 해결하기 위해 파이썬 3.6부터는 인터폴레이션을 통한 형식 문자열(**f-문자열**)이 도입됨

In [33]:
key = 'my_var'
value = 1.234

formatted = f'{key} = {value}'
print(formatted)

my_var = 1.234


In [34]:
formatted = f'{key!r:<10} = {value:.2f}'
print(formatted)

'my_var'   = 1.23


다른 포매팅 방식에 비해 짧다.

In [35]:
f_string = f'{key:<10} = {value:.2f}'

c_tuple  = '%-10s = %.2f' % (key, value)

str_args = '{:<10} = {:.2f}'.format(key, value)

str_kw   = '{key:<10} = {value:.2f}'.format(key=key,
                                            value=value)

c_dict   = '%(key)-10s = %(value).2f' % {'key': key,
                                         'value': value}

assert c_tuple == c_dict == f_string
assert str_args == str_kw == f_string

f-문자열을 사용하면 위치 지정자 중괄호 안에 완전한 파이썬 식을 넣을 수 있다.

두 번째 문제점을 해결한다.

In [36]:
for i, (item, count) in enumerate(pantry):
    old_style = '#%d: %-10s = %d' % (
        i + 1,
        item.title(),
        round(count))
        
    new_style = '#{}: {:<10s} = {}'.format(
        i + 1,
        item.title(),
        round(count))
        
    f_string = f'#{i+1}: {item.title():<10s} = {round(count)}'
        
    assert old_style == new_style == f_string

f-문자열을 여러 줄로 나눌 수도 있다.

In [37]:
for i, (item, count) in enumerate(pantry):
    print(f'#{i+1}: '
    f'{item.title():<10s} = '
    f'{round(count)}')

#1: 아보카도       = 1
#2: 바나나        = 2
#3: 체리         = 15


파이썬 식을 형식 지정자 옵션에 넣을 수도 있다.

In [38]:
places = 3
number = 1.23456
print(f'내가 고른 숫자는 {number:.{places}f}')

내가 고른 숫자는 1.235


**결론 : f-문자열을 쓰자**

- % 연산자를 사용하는 C 스타일 형식화 문자열은 여러 가지 단점과 번잡성이라는 문제가 있다.
- str.format 메서드는 형식 지정자 미니 언어에서 유용한 개념 몇 가지를 새로 제공했다. 하지만 이를 제외하면 str.format 메서드도 C 스타일 형식 문자열의 문제점을 그대로 가지고 있으므로, 가능하면 str.format 사용을 피해야 한다.
- f-문자열은 값을 문자열 안에 넣는 새로운 구문으로, C 스타일 형식화 문자열의 가장 큰 문제점을 해결해준다.
- f-문자열은 간결하지만, 위치 지정자 안에 임의의 파이썬 식을 직접 포함시킬 수 있으므로 매우 강력하다.