# Chapter 1. 파이썬 기초, IPython과 Jupiter Notebook


## 1.1 파이썬 인터프리터

- 파이썬은 인터프리터 언어(한 줄에 한 명령어만 실행)
- '>>>' 해당 부분이 인터프리터의 프롬프트 부분
- .py 파일을 읽어들여 실행
- 표준 프롬프트는 '>>>' 이지만 IPython의 프롬프트는 'In[#]: '로 표시

## 1.2 IPython의 기초

### 1.2.1 IPython 셀 실행

In [None]:
a = 5
a

5

- 변수 이름만 입력했을 경우 해당 객체에 대한 문자열 표현이 출력

In [None]:
import numpy as np

data = [np.random.standard_normal() for i in range(7)]

data

[0.8275887210187655,
 -1.2072093878950352,
 0.01906685216961878,
 0.09988487534604232,
 -1.4067152101828966,
 0.03983003448086444,
 1.0527924949456453]

- data라는 이름의 변수를 생성하고 새로 생성한 파이썬 리스트를 참조
- 마지막 줄은 data 변수의 값을 출력

### 1.2.2 Jupiter Notebook 실행

- Jupiter Notebook의 주요 구성 요소 -> 노트북
  - 코드, 텍스트, 데이터 시각화를 비롯한 다른 출력을 대화형으로 구성할 수 있는 대화형 문서
- 커널과 상호작용(주피터 대화형 컴퓨팅 프로토콜의 구현체)

### 1.2.3 탭 자동 완성

- IPython의 개선 사항
  - 셸 입력 도중 Tab을 누르면 네임스페이스에서 그 시점까지 입력한 내용과 맞아떨어지는 변수를 자동으로 찾아 드롭다운 메뉴 형태로 보여줌

### 1.2.4 자기 관찰

- 변수의 이름 앞이나 뒤에 '?' -> 해당 객체에 대한 일반 정보 출력

In [None]:
b = [1, 2, 3]

# b?
# print?
# 구글 코랩에서 실행 불가

- 해당 기능은 객체의 자기관찰(introspection)
  - 만약 객체가 함수거나 인스턴스 메서드인경우 정의되어 있는 doctring이 출력됨

## 1.3 파이썬 기초

- 파이썬의 기초 개념&원리

### 1.3.1 시맨틱

- 들여쓰기
  - 파이썬은 기본적으로 R,  C++, JAVA와 달리 중괄호 대신 공백 문자를 사용해 코드를 구조화   
  ```
  for x in array:  
     if x < pivot:  
      less.append(x)  
     else:  
      greater.append(x)
  ```

- **객체 모델의 일관성** (가장 중요)
     - 파이썬의 모든 숫자, 문자열, 자료구조, 함수, 클래스, 모듈 등은 파이썬 이터프리터에서 파이썬 객체에 저장
     - 각 객체는 연관된 자료형과 내부 데이터를 가짐

- 주석
  - '#' 뒤에 오는 글자는 모두 무시
  ```
  results = []
  for line in file_handle:
    # 빈 줄은 건너뛰자.
    # if len(line) == 0:
    #   continue
    results.append(line.replcae("foo", "bar"))

- 함수와 객체 메서드 호출
  - 함수는 괄호와 0개 이상의 인수를 전달하여 호출 가능
  - 매서드 -> 객체가 함수를 포함하고 있는 것
  - 메서드를 통해 함수의 내부 데이터에 접근 가능

- 변수와 인수 전달
  - 변수에 값을 대입 -> 대입 연산자 오른쪽에 있는 객체에 대한 참조 생성
        a = [1, 2, 3]
        b = a
  - 해당 경우 일부 언어에서는 a의 데이터를 복사하지만 파이썬의 경우 동일한 리스트를 가리킴

- 동적 참조와 강한 타입
  - 파이썬의 변수에는 변수와 연관된 고유한 타입이 존재 X
  - 단순 할당을 통해 다른 타입의 객체를 참조
  - 하지만 파이썬에서 무시적 변환 허용 X -> 강한 타입 언어
        "5" + 5
  - 해당 코드의 결과는 타 언어에선 10 혹은 55로 출력되지만 파이썬은 허용 X
  ```
  a = 4.5
  b = 2
  print(f"a is {type(a)}, b is {type(b)})
  a is <class 'float'>, b is <class 'int'>
  a/b
  ```
  - 이때 결과값은 2.25로 b가 float형으로 변환됨

- 속성과 메서드
  - 파이썬에서 객체 내부에 저장된 다른 파이썬 객체인 '속성'과 해당 객체의 내부 데이터에 접근 가능한 함수인 '메서드'를 가짐.
  ```
  a = "foo"
  a.[Tab] # 탭을 눌러 사용 가능한 메서드 확인
  ```
  - 속성과 메서드는 getattr 함수를 통해 이름으로 접근 가능

- 덕 타이핑
  - 객체의 자료형에 관심 X
  - 해당 객체가 어떤 메서드나 행동을 지원하는지 알고 싶은 경우

- 모듈 import

  - Ex)
  ```
  # some_module.py
  PI = 3.141592
  def f(x):
    return x + 2
  def g(a, b):
    return a + b
  ```
  - 다음과 같은 모듈이 있을 때,     
    some_module에 정의된 변수와 함수에 접근하려고 한다면 다음과 같이 사용
  ```
  import some_module
  result = some_module.f(5)
  pi = some_module.PI
  ```
  - as를 사용해서 모듈을 다른 이름으로 import 가능

- 이항 연산자
  - 타 프로그래밍 언어의 사용 방식과 동일
  - 두 변수가 동일한 객체를 참조하는지 확인하는 방법 -> is 연산자
  - 파이썬에서 list는 항상 새로운 리스트를 생성하기 때문에    
    is 연산자와 == 연산자의 결과 값이 달라짐

- 가변 객체와 불변 객체
  - 가변 객체: 리스트, 딕셔너리, 넘파이 배열, 사용자 정의 클래스
  - 불변 객체: 믄자열, 튜플(내부 값 변경 불가능)


### 1.3.2 스칼라 자료형

파이썬은 숫자 데이터, 문자열, 불리언 값, 날짜와 시간을 다룰 수 있는 몇몇 내장 자료형 제공 -> 스칼라 자료형  

|자료형|설명|
|------|----|
|None|파이썬의 null 값(하나의 유일한 None 인스턴스만 존재)|
|str|문자열 자료형|
|bytes|원시 이진 데이터|
|float|배정밀도(64비트) 부동소수점수(double형 X)|
|bool|True or False|
|int|부호가 있는 정수|

- 숫자 자료형
  - 주요 자료형 : int, float
  - int는 정수, float는 부동소수점을 나타냄 (float는 과학적 표기법도 가능)
  - 정수 나눗셈은 C와 달리 부동소수점을 결과 값으로 가짐
  - //을 사용해서 몫만 계산 가능

- 문자열
  - 자료형: str
  - 작은따옴표(' ')나 큰 따옴표(" ")를 사용
  - 개행 문자가 포함된 여러 줄에 걸친 문자열은 세개의 작따옴 or 큰따옴으로 둘러쌈
  ```
  c = """
  This is a longer string that
  spans multiple lines
  """
  ```
  - count 메서드를 사용해서 개행 문자의 개수를 확인 가능    
  위 경우에선 개행 문자가 3개
  - 파이썬의 문자열은 변경이 불가능 -> replcae 메서드를 사용해서 새로운 문자열을 생성해야함.
  - s[:#] -> 슬라이싱 기법으로 #전까지의 문자열을 출력
  - '\' -> 이스케이프 문자, r을 사용하면 문자열을 있는 그대로 출력
  - 두 문자열을 합치면 새로운 문자열 생성
  - 문자열 앞에 f를 붙이고 문자열 내에 {}로 파이썬 표현식 묶기 ->    문자열의 템플릿 or 형식을 지정 가능

- 바이트와 유니코드
  - 파이썬 3.0부터 유니코드가 최상위 문자열 타입
  - encode 메서드를 사용해 유니코드 -> UTF-8 바이트 표현으로 변환
  - decode 메서드를 사용해 다시 반대로 변환 가능

- 불리언
  - 파이썬에서 불리언 값은 True or False
  - and 와 or 예약어로 조합 가능
  - True -> 1, False -> 0
  - not 예약어는 결과를 반대로

- 형 변환
  - str, bool, int, float는 형 변환을 위한 함수로 사용됨
  - 0이 아닌 다른 값은 bool로 변환하면 True가 됨

- None
  - 파이썬에서 사용하는 null 값
  - 함수 인수의 기본 값으로도 사용됨

- 날짜와 시간
  - 파이썬 내장 datetime모듈은 datetime, date, time 자료형을 지원
  - datetime 인스턴스에서 date나 time 메서드를 사용해 해당 datetime의 날짜와 시간을 추출할 수 있음
  - strftime 메서드 -> datetime을 문자열로 포맷
  - strptime 함수 -> 문자열을 해석해 datetime 객체로 만듦
  - 시계열 데이터를 집계하거나 그룹화할 때 datetime의 필드를 치환하는 것이 유용한 경우가 있음
  - Ex) 분과 초 필드를 0으로 치환해서 새로운 객체 생성
  - datetime.datetime은 변경이 불가능하기 때문에 replace에 의해 변경되지 않음
  - 두 datetime 객체의 차이가 delta가 됨
  - timedelta 객체를 datetime 객체에 더하면 그 만큼 시간이 더해진 datetime 객체를 얻을 수 있음
  

### 1.3.3 제어

- if, elif, else
  - C언어와 동일, 조건이 True일 경우 if 블록 내부 코드 실행
  - C언어와의 차이점 -> else if가 아닌 elif 사용
  - 만약 조건 중 하나라도 True라면 그 뒤의 elif와 else 블록 검사 X
  - or 예약어를 사용할 경우 왼쪽 조건이 참이라면 오른쪽 조건 검사 X

- for 문
  - 리스트나 튜플과 같은 컬렉션이나 이터레이터 순회
  - 사용 방법:
  ```
  for value in collection
  ```
  - continue, break -> C언어와 동일
  - break의 경우 가장 안쪽의 for문만 탈출함

- while 문
  - 조건이 False가 되거나 break문을 사용해 명시적으로 반복이 끝날 때까지 블록 내의 코드 실행

- pass
  - 아무것도 하지 않음을 나타냄
  - 아직 구현되지 않은 코드를 나중에 추가하기 위한 placeholder로도 사용

- range
  - 균일한 간격의 연속된 정수를 반환하는 이터레이터를 반환
  - 시작과 끝, 간격을 정할 수 있음
  ```
  list(range(0, 20, 2))
  result: [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
  list(range(5, 0, -1))
  result: [5, 4, 3, 2, 1]
  ```
  - range는 마지막 값 바로 이전의 정수까지의 값을 반환함
  - 일반적으로 색인으로 시퀀스를 반복하기 위해 사용