1장 딥러닝과 파이토치 라이브러리 소개
==

* GPT-2를 통해 만든 문장을 살펴보면 글이 횡설수설하고 불명확한 의미를 갖는 문장이지만 사람이 일일이 만든 규칙이 아니라 여러 글(예시, 데이터)를보고 스스로 학습하여 어느정도 논리정연한 문장을 생성하는 것을 알 수 있다.
* 과거에는 지능에 **자의식**을 포함한다고 여겼으나, GPT의 작업 결과를 보면 작업을 수행하는 데 자의식이 굳이 필요하지 않음을 알 수 있다.
* 기계는 자의식을 가질 수 없으나, 어떤 작업을 수행할 수 있도록 학습시키는 데는 자의식이 필요하지 않으며, 따라서 *"기계가 지식을 가지는 가?"* 라는 문제는 의심의 여지가 없다.


* 본 교재는 인공지능의 하위 범주인 **딥러닝(deep learning)**에 해당하는 알고리즘을 다룬다.
* 딥러닝은 **심층 신경망(deep neural network)**이라는 수학적 개체를 훈련시켜 원하는 작업을 수행토록 하는 과정이다.

1.1 딥러닝 혁명
--
* 십여 년 전까지는 **머신러닝(machine learning)** 시스템은 **피처 엔지니어링(feature engineering)**에 크게 의존하였다.
* 피처 엔지니어링은 다운 스트림 알고리즘이 새로운 데이터를 기반으로 올바론 결과를 낼 수 있또록 입력 데이터를 변환하고 개선하는 일종의 데이터 전처리 작업이다.

* 딥러닝은 데이터로부터 자동으로 피철르 찾아내도록 학습하고 개선한다.
* 딥러닝은 규칙을 수작업으로 만드는 것보다 신경망을 설계하고 훈련 데이터로부터 신경망의 성능을 개선하는 데 집중한다.

* **훈련(training)**은 기대한 값과 실제 모델의 출력 차이가 줄어들도록 신경망을 변경하여, 점점 더 신경망의 성능을 개선한다.
* 훈련 중에 입력되지 않은 데이터에 대해서도 기대값과 적은 차이가 나도록 훈련한다.

1.2 딥러닝을 위한 파이토치
--

* **파이토치(pytorch)**는 딥러닝 프로젝트를 위한 라이브러리로, 딥러닝 모델을 매우 유연하게 표현한다.
* 파이토치는 **텐서(tensor)**라는 데이터 구조를 사용한다. 텐서는 Numpy 배열과 여러 면에서 유사한 다차원 배열로, 수학 연산을 빠르게 수행한다.

1.3 왜 파이토치인가?
--
* 딥러닝은 다양한 분야의 복잡한 작업을 수행한다. (기계 번역, 전략 게임 플레이, 물체 인식 등)
* 실제 학습을 위해서는 유연하면서도 적당한 시간 안에 많은 양의 데이터로 훈련 가능한 도구가 필요하다.

* 파이토치의 최대 장점은 단순함으로, 학습, 활용, 확장, 디버깅 모두 수월하다.
* 파이토치는 숫자, 벡터, 행렬, 배열을 담을 수 있는 텐서를 사용하며, 텐서 연산을 위한 함수도 지원한다.

* 파이토치는 그래픽 연산 유닛(GPU)을 사용해 CPU보다 빠르게 연산한다.
* 파이토치는 풍부한 표현이 가능해 정교하게 모델을 구현할 수 있다.

* 딥러닝 커뮤니티는 이제 파이토치와 텐서플로(TensorFlow)로 양분되었다.
* 텐서플로는 제품화를 위한 견고한 파이프라인과 함께 업계 전반에서, 파이토치는 사용하기 쉬운 장점을 살려 연구와 교육 커뮤니티에서 주로 사용한다.

1.4 파이토치 딥러닝 프로젝트 둘럽괴
--

* 파이토치는 기본적으로 **다차원배열** 혹은 **텐서**를 사용하는 라이브러리이며, 텐서를 사용하기 위한 다양한 연산 라이브러리를 torch 모듈로 제공한다.
* 파이토치는 텐서 기반의 **자동미분** 엔진을 가지고있어, 특정 텐서에서 수행한 모든 연산을 기억했다가 주어진 입력값을 기준으로 미분값을 자동으로 계산한다. 

* 신경망 구성을 위한 핵심 모듈은 torch.nn에서 제공한다.
* 입력 데이터를 텐서로 전환하려면 torch.utils.data에 있는 Dataset클래스가 필요하다.
* DataLoader 클래스를 사용하면 여러 개의 훈련 샘플을 묶어놓은 **배치(batch)**를 훈련에 활용할 수 있다.

* 파이토치는 훈련이 완료된 후 훈련된 모델을 배포하기 위한 기능을 제공한다.
* **토치스크립트(TorchScript)**를 통해 미리 모델을 컴파일 할 수 있다.

1.5 하드웨어와 소프트웨어 요구사항
--

* GPU 사용을 위해서는 CUDA를 지원하는 GPU가 필요하다.
* 2부에서 사용하는 파라미터는 8기가 램 탑재 GPU를 사용하며, 가용 메모리가 적을 경우 파라미터를 조정해야 한다.

* 운영체제는 리눅스, 윈도우에서 파이토치는 GPU 연산을 지원하지만, 맥에서는 CPU만 사용 가능하다.
* 2부에서 다루는 (의학데이터) 데이터는 60GB를 차지한다. 훈련 과정에서의 성능 개선을 위한 캐시 파일용도로 추가로 80GB  공간이 필요하다.

#### 1.5.1 주피터 노트북
* 브라우저에서 인터랙티브하게 코드를 수행하는 주피터 노트북을 사용한다!

1.6 연습문제
--
생략

1.7 핵심요약
--
* 딥러닝 모델은 예제를 학습해서 주어진 입력에 대해 기대하는 결과를 출력하는 방법을 자동으로 배운다.
* 파이토치 등의 라이브러리를 통해 우리는 효과적으로 신경망 모델을 만들고 훈련시킬 수 있다.
* 파이토치는 유연함과 속도에 집중하며 알아보기도 쉽다. 또한 연산을 위해 즉시 실행을 기본으로 지원한다.
* 토치스크립트를 사용하면 모델을 미리 컴파일해서 파이썬뿐 아니라 C++프로그래밍이나 모바일 기기에서도 모델을 동작시킬 수 있다.
* 2017년 초 파이토치 릴리스 후로 딥러닝 도구 생태계는 상당한 통합을 이뤄왔다. (파이토치와 텐서플로)
* 파이토치는 딥러닝 프로젝트를 만드는 다양한 유틸리티 라이브러리를 제공한다.