# 7장 파이썬 세상의 프로그래밍 용어

> ## 가비지 컬렉션
가비지 컬렉션 : 메모리 할당과 해제를 해야 하는 시점을 추적해 프로그래머의 부담을 덜어주는 자동화된 메모리 관리 기법

In [39]:
# (p162) 가변, 불변 데이터 타입 참조
spam = ['cat', 'dog']
spam.append('moose')
id(spam)

4631102144

In [40]:
# 리스트 연결
spam = spam + ['rat']
id(spam)

4631466688

+연산자를 사용해 리스트를 연결하면, 이전 리스트를 덮어쓰는 새로운 객체(새로운 아이디) 생성<br>
리스트연결 : 새로운 아이디를 가지는 새로운 리스트를 만든다. <br>
리스트가 새로 만들어질 때, 예전 리스트는 결국 **가비지 컬렉션**에 의해 메모리에서 할당 해제될 것이다.

> ## 리터널
리터널 : 사람이 직접 손으로 작성한 고정 값을 나타내는 소스코드 상의 텍스트


In [2]:
# 42 -> 정수 리터럴
# Zophie -> 문자열 리터럴
age = 42 + len('Zophie')


> ## 키워드
파이썬 키워드는 언어의 일부로 사용하고자 예약된 이름의 집합이며 변수 이름으로 사용할 수 없다.
+ and
+ continue
+ def
+ None
+ True 
+ return
+ await
+ else
+ elif
+ if
+ import <br> 
...

> ## 객체, 값, 인스턴스, 아이디
**객체**: 데이터를 표현하는 것 여기서 데이터란 숫자나 텍스트, 혹은 리스트와 딕셔너리 같은 복잡한 데이터 구조를 전부 아우른다.<br>
모든 객체는 값(value), 아이디(identity), 데이터 타입(data type)이 있다.<br>
**값** : 정수 42 또는 문자열 hello와 같이 객체가 나타내는 데이터다.

객체는 id() 함수를 호출해서 확인할 수 있는 유일한 정수인 아이디를 가지고 생성된다.

In [10]:
# 프로그램이 실행될 때마다 정수의 아이디가 달라진다.
# 프로그램이 실행되는 동안은 변경되지 않는다.
spam = ['cat', 'dog', 'moose']
id(spam)

4544360704

In [14]:
spam.append('snake')
id(spam)

4544360704

In [15]:
spam = [1, 2, 3]
id(spam)

4615637312

새 아이디를 가진 새 리스트 객체에 의해 덮어써졌다. 여러 식별자가 동일한 객체를 참조할 수 있기 때문에, spam 같은 식별자는 아이디와는 전혀 다르다.

딕셔너리에 할당된 두 변수를 보여주는 다음 예에서도 마찬가지이다.

In [16]:
spam = {'name': 'Zophie'}
id(spam)

4543348224

In [17]:
eggs = spam
id(eggs)

4543348224

In [18]:
spam = {'name': 'Zophie'}
eggs = spam
spam['name'] = 'AI'
spam

{'name': 'AI'}

In [21]:
# 둘다 동일한 객체를 가리키기 때문
eggs

{'name': 'AI'}

In [20]:
id(eggs)

4543509248

* is 연산자로 두 객체의 아이디가 같은지 여부를 비교할 수 있다. 반면에 == 연산자는 객체 값이 같은지 여부만 확인한다.<br>
**x is y는 id(x) == id(y)**

In [23]:
spam = {'name': 'noah'}
eggs = spam
spam is eggs

True

In [24]:
spam == eggs

True

In [25]:
bacon = {'name': 'noah'}
spam == bacon

True

In [26]:
spam is bacon

False

In [32]:
# spam과 eggs 변수는 동일한 딕셔너리 객체를 참조한다.
print(id(spam),
id(eggs))

4631011264 4631011264


In [34]:
#bacond은 동일한 데이터가 포함되어 있지만, 별개의 딕셔너리 객체를 참조한다.
print(id(spam),
id(bacon))

4631011264 4615789632


> ## 아이템
아이템: 리스트나 딕셔너리처럼 컨테이너 객체 안에 있는 객체

...

> ## 가변 데이터 타입, 불변 데이터 타입

가변: 객체의 값을 변경할 수 있다. <br>
불변: 객체의 값을 변경할 수 없다.

|**가변 데이터 타입**|**불편 데이터 타입**|
|-------|-------|
|리스트(List)|정수(Integer)|
|딕셔너리|부동소수점|
|집합|부울|
|바이트배열|문자열|
|배열|고정 집합|
||바이트|
||튜플|

> ## 인덱스, 키, 해시

리스트 리터널에 대해 인덱스 연산자를 사용할 수도 있다.<br>
(실제 코드에선 헷갈리고 불필요해 보일 것이다.)

In [42]:
['no', 'noah', 'ah'][1]

'noah'

**해시**: 값에 대해 일종의 지문 역할을 하는 정수이다.<br>
+ 객체의 수명주기 동안 절대로 변하지 않는다.
+ 객체의 값이 같다면 해시도 반드시 같아야 한다.
+ 불변 객체는 해시가 가능하고, 가변 객체는 해시가 *불가능하다.*

In [43]:
hash('hello')

1641031511869227828

In [44]:
hash((1,2,3))

529344067295497451

In [45]:
hash([1,2,3])

TypeError: unhashable type: 'list'

> ## 컨테이너, 시퀀스, 매핑, 집합 타입
컨테이너 : 여러 종류의 객체를 포함할 수 있는, 어떤 데이터 타입이든 가능한 객체 (리스트, 딕셔너리)<br>
시퀀스 : 정수 인덱스를 통해 접근 가능한, 순서 있는 값을 가진 컨테이너 데이터 타입의 객체 <br>
(문자열, 튜플, 리스트, 바이트 객체)<br>
맵핑 : 인덱스 대신 키를 사용하는 컨테이너 데이터 타입의 객체

In [47]:
spam = {'a': 1, 'b': 2, 'c': 3}
list(spam.keys())

['a', 'b', 'c']

+ # 흔히 혼동되어 사용되는 용어
> ## 문 VS 표현식
표현식: 단일 값으로 평가되는 값들과 연산자들로 구성된 명령어이다.<br>


In [5]:
myName  = 'noah'

#표현식 ex
2 + 2 = 4
len(myName) > 4
myName == 'noah'

SyntaxError: cannot assign to operator (2904651805.py, line 4)

문: 사실상, 값으로 도출되지 않는 모든 명령을 뜻한다.<br>
(if문, retur문, def문)


> ## 블록, 절, 바디
블록: 들여쓰기로 시작하여 해당 들여쓰기 수준이 이전 들여쓰기 수준으로 돌아오면 종료된다.
파이썬 공식 문서에서는 블록보다는 **절**이라는 용어를 선호한다.

In [None]:
if name == 'noah':  #절 헤더
    print('hello, kitty!')    #절 스위트(바디)
    print('Do you want a treat?')   #절 스위트(바디)

> ## 변수, 속성
변수: 객체를 가리키는 이름
속성: . 다음에 나오는 모든 이름 <Br>
속성은 객체와 연관된다.

In [10]:
import datetime 
spam = datetime.datetime.now() # spam => datetime 객체를 포함하는 변수
spam.year ,  spam.month    # year, month => 해당 객체의 속성 

(2022, 11)

> # 함수, 메소드
함수: 자신이 호출될 때 실행되는 코드의 모음 <br>
메소드: 클래스와 연관된 일종의 함수

In [12]:
# len()은 함수 
len('noah')

4

In [13]:
# upper()은 문자열 메소드
'Hello'.upper()

'HELLO'

> ## 반복가능 객체 vs 반복자


반복 가능한 객체(iterable)는 말 그대로 반복할 수 있는 객체인데 우리가 흔히 사용하는 문자열, 리스트, 딕셔너리, 세트가 반복 가능한 객체입니다. 즉, 요소가 여러 개 들어있고, 한 번에 하나씩 꺼낼 수 있는 객체입니다. 반복자(iterator)는 값을 차례대로 꺼낼 수 있는 객체(object)입니다.

In [14]:
iterableObj = list('noah')
iterableObj

['n', 'o', 'a', 'h']

In [15]:
iterableObj1 = iter(iterableObj)
iterableObj2 = iter(iterableObj1)
next(iterableObj1)

'n'

In [16]:
next(iterableObj1)

'o'

In [17]:
next(iterableObj2)

'a'

반복가능 객체는 iter()함수에 인수로 전달되는 반면, iter()호출에서 반환되는 객체는 반복자 객체라는 점을 기억하자.

> ## 구분에러 vs 런타임 에러 vs 의미 에러
+ 구분 에러 (syntax error) : 파이썬 인터프리터가 소스 코드의 텍스트를 올바른 명령어로 분석할 수 없을 때 발생 <br> 
(괄호 누락, 쉼표 대신 마침표 표기, 단순 오타 등)

In [19]:
print('Hello'

SyntaxError: unexpected EOF while parsing (1103635973.py, line 1)

In [25]:
a = [1. 2, 3]
a

SyntaxError: invalid syntax (3966749015.py, line 1)

+ 런타임 에러(runtimeError): 실행 중인 프로그램이 존재하지 않는 파일을 열려고 하거나 숫자를 0으로 나누는 것과 같은 몇 가지 작업을 수행하지 못하는 경우에 발생

In [26]:
slices = 8
eaters = 0
print('Each person eats', slices / eaters, 'slices.')

ZeroDivisionError: division by zero

추적 정보에서 언급하는 행 번호는 파이썬 인터프리터가 에러를 감지한 지점일 뿐이라는 사실을 기억하자. 에러의 진짜 원인은 이전 코드 행에 있을 수도 있고 프로그램의 훨씬 더 앞쪽에서 발생했을 수도 있다.

+ 의미에러(semantic error) / 논리 에러(logical error) : 에러 메시지는 발생하거나 충돌을 일으키지 않지만, 컴퓨터는 프로그래머가 의도하지 않은 방식으로 코드를 수행

In [28]:
# 정수 대신 문자열 값을 사용하여 의도하지 않은 행위 유발
print('The sum of 4 and 2 is', '4' + '2')

The sum of 4 and 2 is 42


> ## 타입 강제 변환 vs 타입 캐스팅

In [30]:
type('42')

str

In [33]:
# int()함수가 원래 객체를 기반으로 새 정수 객체를 생성, 이를 캐스팅 
type(int('42'))

int

In [34]:
# 타입 강제 변환
2 + 3.0

5.0