---

### **Chapter 1-3**

##### **bytes와 str의 차이**

* bytes에는 8비트 값의 시퀀스가 들어있고, str에는 유니코드 코드 포인트의 시퀀스가 들어있다.
    - `bytes`: 컴퓨터가 이해하는 8비트(0~255)의 숫자
    - `str`: 사람이 이해하는 유니코드 글자 줄 세우기입니다. ('가', 'A')
- 처리할 입력이 원하는 문자 시퀀스인지 확인하려면 도우미 함수를 이용하라
    - 예를 들어, 

In [1]:
def to_str(data):
    """bytes나 str을 받아서 항상 str을 반환합니다."""
    if isinstance(data, bytes):
        # bytes라면 유니코드로 변환(통역)
        return data.decode('utf-8')
    else:
        # 이미 str이라면 그대로 반환
        return data

# 테스트
print(repr(to_str(b'hello')))  # 결과: 'hello'
print(repr(to_str('hello')))   # 결과: 'hello'

'hello'
'hello'


- bytes와 str 인스턴스를 (>,==,+,%)와 같은 연산자에 섞어서 사용할 수 없다.
- 이진 데이터를 파일에서 읽거나 파일(ex. txt)에 쓰고싶으면 이진모드 ('rb', 'wb')로 파일을 열기.
- 유니코드 데이터를 파일에서 읽거나 쓰고 싶을 때는 시스템 디폴트 인코딩에 주의
    - open에 encoding 파라미터를 명시적으로 전달하는게 권장됨.
        - `open('file.txt', 'w', encoding='utf-8')`

---

### **Chapter 1-4**

##### **c 스타일 형식 문자열을 str.format과 쓰기보다는 f-문자열(interpolation을 통한 형식 문자열)을 사용하라.**

- `%` 연산자를 사용하는 C스타일 형식화 문자열은 여러가지 단점과 번잡성 문제가 있다.
- str.format 메서드는 형식 지정자 미니 언어에서 유용한 개념 몇 가지를 새로 제공함.
    - 이를 제외하면 str.format 메서드도 c 스타일 형식 문자열의 문제점을 그대로 가지고 있다. (비권장)
- f-문자열은 값을 문자열 안에 넣는 새로운 구문으로, C스타일 형식화 문자열의 가장 큰 문제점을 해결함. 
    - 간결하고, 위치 지정자 안에 임의의 파이선 식을 포함 시킬 수 있으므로 매우 권장된다.

##### 1. C 스타일 문자열의 문제점

단점: 튜플의 크기가 커지면 가독성이 급격히 떨어지고, 변수 순서가 바뀌면 버그가 생기기 쉬움

In [2]:
name = "VLA_Model"
version = 1.4
# 순서나 타입이 틀리면 바로 에러
print("Model: %s, Ver: %.1f" % (name, version))

Model: VLA_Model, Ver: 1.4


##### 2. str.format() 메서드 (C스타일보다 좋으나 비권장)

- 장점: 인덱스({0})나 키워드({name})를 사용할 수 있어 순서 문제는 해결
- 단점: 여전히 코드가 길고, 변수명을 중복해서 써야함.

In [3]:
# 변수명을 두 번씩 써야 해서 여전히 길다
print("Model: {name}, Ver: {ver}".format(name=name, ver=version))

Model: VLA_Model, Ver: 1.4


##### 3. f-문자열 (f-string) -> (권장!)

- 간결함: 변수를 직접 중괄호 {} 안에 넣음.
- 중괄호 안에서 단순 변수뿐 아니라 파이썬 연산식이나 함수 호출도 가능

In [4]:
# 가장 직관적이고 짧음
print(f"Model: {name}, Ver: {version + 0.1:.1f}")

Model: VLA_Model, Ver: 1.5


---

### **Chapter 1-5**

##### **복잡한 식을 쓰는 대신 도우미 함수를 작성하라.**

- 복잡한 식을 도우미 함수로 옮기기
    - 특히 같은 로직을 반복해 사용할 때는 도우미 함수를 사용할 것.
- Boolean 연산자 or나 and를 식에 사용하는 것보다 `if/else`가 가독성이 더 좋다.

In [15]:
my_dict = {'blue': None}

# 'red' 값이 없거나 비어있으면 0을 반환하는 식
count = int(my_dict.get('red', [''])[0] or 0)
print(count)

0


In [None]:
# if/else를 통한 가독성 향상
value = my_dict.get('red', [''])
if value[0]:
    count = int(value[0])
else:
    count = 0
    
print(count)

0


---

### **Chapter 1-6**

##### **인덱스를 사용하는 대신 대입을 사용해 데이터를 언패킹하라.**

- 언패킹 : 한 문장 안에서 여러 값을 각각의 변수에 한 번에 나누어 담는 문법
    - 튜플, 리스트 등 반복 가능한 모든 객체(Iterable)에 적용
    - iterable이 여러 계층으로 내포된 경우에도 적용 가능
- 인덱스를 사용해 시퀀스 내부에 접근하는 대신 언패킹을 사용해 명확성, 간결성 확보 권장

In [None]:
# 기존 방식 (인덱스 사용 - 번거롭고 실수하기 쉬움)
point = (10, 20)
x = point[0]
y = point[1]

# 언패킹 방식 (명확하고 간결함)
x, y = point

In [18]:
a, b = "Hi"  # a='H', b='i'

print(a)
print(b)

H
i


In [19]:
# (이름, (위도, 경도)) 형태의 데이터
data = ('Hanyang', (37.56, 127.04))

# 계층 구조를 그대로 맞춰서 대입
name, (lat, lon) = data

print(f"{name}의 좌표는 북위 {lat}, 동경 {lon}")

Hanyang의 좌표는 북위 37.56, 동경 127.04


##### **아래와 같은 인덱스 방식은 비권장**

In [21]:
# 연구 데이터: [모델이름, 정확도, 지연시간]
result = ["VLA-v1", 0.95, 45.2]

# 나중에 result[1]이 정확도였는지 지연시간이었는지 헷갈림
print(f"Name: {result[0]}, Acc: {result[1]}")

Name: VLA-v1, Acc: 0.95


##### **권장 방안(언패킹)**

In [22]:
name, acc, latency = result
print(f"Name: {name}, Acc: {acc}")

Name: VLA-v1, Acc: 0.95


In [25]:
## 중요 (값 쉽게 바꾸기)
x, y = 1, 2
x, y = y, x  # 한 줄로 끝! (언패킹 활용)
print(x)
print(y)

2
1


---

### **Chapter 1-7**

##### **range보다는 enumerate를 사용하라.**

- enumerate를 사용하면 이터레이터(반복)에 대해 루프를 돌면서 이터레이터에서 가져오는 원소의 인덱스까지 얻는 코드를 간결하게 작성 가능.
- range에 대해 루프를 돌면서 시퀀스의 원소를 인덱스로 가져오기보다는 enumerate를 사용.
    - enumerate의 두번째 파라미터로 어디부터 원소를 가져오기 시작할지 정하기 가능 (0부터 시작)

##### range vs enumerate 비교

In [27]:
models = ['VLA-v1', 'VLA-v2', 'VLA-v3']

# range 
# len을 통해 길이를 재고, 그 범위만큼 루프를 돌리고 다시 인덱스로 값을 읽어야함
for i in range(len(models)):
    model = models[i]
    print(f"{i + 1}: {model}")

# enumerate
# 인덱스와 원소를 한번에 언패킹해서 가져옴. (권장!)
for i, model in enumerate(models):
    print(f"{i + 1}: {model}")

1: VLA-v1
2: VLA-v2
3: VLA-v3
1: VLA-v1
2: VLA-v2
3: VLA-v3


##### 시작 인덱스 지정하기 (두 번째 파라미터)


In [None]:
# i를 3부터 시작하게함
for i, model in enumerate(models, 3):
    print(f"제 {i}순위 모델: {model}")

제 3순위 모델: VLA-v1
제 4순위 모델: VLA-v2
제 5순위 모델: VLA-v3


---

### **Chapter 1-8**

##### **여러 이터레이터에 대해 나란히 루프를 수행하려면 zip을 사용하라.**

- zip 내장함수를 사용해 여러 이터레이터를 나란히 이터레이션(반복시키기) 할 수 있다.
- zip은 튜플을 지연 계산하는 제너레이터를 만든다. (= 무한히 긴 입력에도 zip을 쓸 수 있다.)
- 입력 인터레이터의 길이가 서로 다르면 zip은 아무런 경고도 없이 가장 짧은 원소의 길이를 가진 이터레이터의 원수 길이까지만 튜플을 내놓고 나머지 길이 외 원소는 무시한다.
    - 이를 극복하기 위해서는 itertools 모듈의 zip_longest 함수를 사용

##### 1. zip의 기본 사용법 (나란히 이터레이션)

In [31]:
names = ['VLA-v1', 'VLA-v2', 'VLA-v3']
counts = [1024, 2048, 4096]

# zip이 (name, count) 형태의 튜플을 하나씩 뱉어줍니다.
for name, count in zip(names, counts):
    print(f"Model: {name}, Params: {count}M")

Model: VLA-v1, Params: 1024M
Model: VLA-v2, Params: 2048M
Model: VLA-v3, Params: 4096M


##### 2. 두 리스트의 길이가 다를 때 (적은 요소 개수에 맞춤)

In [32]:
names = ['VLA-v1', 'VLA-v2']  # 2개
counts = [1024, 2048, 4096]   # 3개

# 결과는 2개만 나옵니다. '4096'은 그냥 무시됩니다!
for name, count in zip(names, counts):
    print(name, count)

VLA-v1 1024
VLA-v2 2048


##### 2. 두 리스트의 길이가 다를 때 (적은 요소 개수에 맞춤) -> 극복방법 (zip_longest사용)

In [33]:
from itertools import zip_longest

names = ['VLA-v1', 'VLA-v2']
counts = [1024, 2048, 4096]

# fillvalue를 지정하면 None 대신 다른 값을 넣을 수도 있습니다.
for name, count in zip_longest(names, counts, fillvalue='Unknown'):
    print(f"{name}: {count}")

VLA-v1: 1024
VLA-v2: 2048
Unknown: 4096


---

### **Chapter 1-9**

##### **For, while 루프 뒤에 Else 블럭을 사용하지 말라.**

- python에는 forw, while루프에 속한 블럭 바로 뒤에 else 블럭을 허용하는 특별한 문법 존재.
- 루프 뒤에 오는 else블럭은 루프가 반복되는 도중에 break를 만나지 않은 경우에만 실행됨.
- 동작이 직관적이지 않으므로 루프 뒤 else는 비권장.

##### 1. 루프 뒤 else의 동작방식

In [None]:
# else블럭이 언제 실행될지 헷갈리기 좋음.
for i in range(2, 5):
    print(f"Loop {i}")
    if 5 % i == 0:
        break # 5가 i로 나누어떨어지면 중단
else:
    # 루프가 break 없이 끝까지 다 돌면 실행됨
    print("Loop else block 실행!")

Loop 2
Loop 3
Loop 4
Loop else block 실행!


##### 2. 가독성 좋게 고치기 (도우미 함수 활용)

In [37]:
def is_coprime(a, b):
    for i in range(2, min(a, b) + 1):
        if a % i == 0 and b % i == 0:
            return False # 찾았으면 즉시 종료
    return True # 끝까지 못 찾았으면 True

if is_coprime(10, 13):
    print("두 수는 서로소입니다.")

두 수는 서로소입니다.


---

### **Chapter 1-10**

#### **대입식을 사용해 반복을 피하라.**

- 대입식에는 왈러스 연산자(:=)를 사용해 하나의 식 안에서 변수 이름에 값을 대입하면서 이 값을 평가할 수 있고, 중복을 줄일 수 있음.
- 대입식이 더 큰 식의 일부분으로 쓰일때는 괄호로 둘러싸야함
- 파이썬에서는 switch/case 문이나 do/while루프를 쓸 수 없지만, 대입식을 사용하면 이런 기능을 더 깔끔하게 흉내가능.


##### **1. 왈러스 (:=) 연산자 개념**

- 보통은 변수에 값을 대입(=)하는 것과 값을 사용하는 것이 별개의 문장으로 나뉘어 있는데, 왈러스(:=) 연산자는 `대입과 평가를 동시에` 가능. 

In [None]:
results = {
    'model_name': 'Efficient-VLA',
    'accuracy_list': [0.92, 0.94, 0.91, 0.95, 0.93] # 5개의 결과
}

# walrus 이전
count = results.get('accuracy_list', [])
if len(count) > 0:
    print(f"{len(count)}개의 결과가 있습니다.") # len(count)를 두 번 계산

# walrus 도입
if (n := len(results.get('accuracy_list', []))) > 0:
    print(f"{n}개의 결과가 있습니다.") # 대입과 동시에 조건문 검사까지!

5개의 결과가 있습니다.
5개의 결과가 있습니다.


##### **2. 괄호 사용 주의사항**

- 보통은 변수에 값을 대입(=)하는 것과 값을 사용하는 것이 별개의 문장으로 나뉘어 있는데, 왈러스(:=) 연산자는 `대입과 평가를 동시에` 가능. 

In [None]:
# (n := len(data) > 0) 처럼 괄호를 잘못 쓰면 n에 True/False가 담길 수 있음
if (n := len(data)) > 0: 
    print(n)

2


##### **3. 파이썬에서는 switch/case 문이나 do/while루프를 쓸 수 없지만, 대입식을 사용하면 이런 기능을 더 깔끔하게 흉내가능.**

In [None]:
# '데이터를 읽어서(read) chunk에 넣고, 그게 비어있지 않으면 계속해라'
# 특정값이 나올때까지 계속 데이터를 읽어야할 때
while (chunk := file.read(1024)):
    process(chunk)

In [None]:
# 여러 전처리 옵션을 체크할 때 코드길이를 줄여줌
# switch/case 느낌으로 만들기
if (val := get_config('mode')) == 'train':
    start_training()
elif val == 'test':
    start_testing()
elif val == 'inference':
    start_inference()