## Setup for deep learning study

### Jupyter Notebook

1. On local computer
  * Install conda - https://www.anaconda.com/
  * execute Jupyter notebook
  * install tensorflow, pytorch, etc.
  * (with GPU) install cuda, cudnn, ...
  
  
2. Use https://colab.research.google.com/


3. Use https://www.kaggle.com/


# Deep learning with Python 3rd Ed.
<p style='text-align: right;'> By FRANÇOIS CHOLLET </p>

## Ch.1 What is deep learning

이 장에서는 다음 내용을 다룹니다.

* **기본 개념**에 대한 개괄적인 정의
* **머신러닝의 원리**에 대한 간략한 소개
* 딥러닝의 인기 상승과 미래 잠재력

지난 10년간 인공지능(AI)은 언론의 집중적인 관심을 받아왔습니다. **머신러닝, 딥러닝,** 그리고 **AI**는 기술 전문 매체뿐 아니라 다양한 매체에서 수없이 등장합니다. 우리는 **지능형 챗봇, 자율주행차, 가상비서**로 가득한 미래를 꿈꿉니다. 때로는 **암울한 미래**로, 때로는 **유토피아적인 미래**로 묘사되기도 합니다. 인간의 일자리가 줄어들고 대부분의 경제 활동이 로봇이나 AI 에이전트에 의해 처리될 것이라는 예측입니다. 머신러닝 전문가라면 이러한 정보의 홍수 속에서 **진정한 변화를 가져올 신호와 과장된 보도자료를 구분하는 능력**을 갖추는 것이 중요합니다. 우리의 미래는 위태로운 상황이며, 여러분은 이 책을 통해 **AI 시스템 개발에 기여**할 수 있을 것입니다. 자, 이제 다음 질문들을 살펴보겠습니다. 
* 딥러닝은 지금까지 무엇을 성취했을까요?
* 딥러닝은 얼마나 중요한 의미를 가질까요?
* 우리는 다음에 어디로 향할까요?
* 과장된 소문을 믿어야 할까요?

### 1.1 Artificial intelligence, machine learning, and deep learning
먼저, 인공지능(AI)이라는 용어를 사용할 때 무엇을 의미하는지 명확하게 정의해야 합니다. **인공 지능, 머신 러닝, 딥 러닝**은 무엇이며(그림 1.1), 이들은 서로 어떤 관계가 있을까요?

<img src="https://deeplearningwithpython.io/images/ch01/ai-ml-dl.07201556.png" width=300><p style='text-align: center;'> Figure 1.1 Artificial intelligence, 
machine learning, and deep learning</p>

#### 1.1.1 Artificial intelligence

인공지능은 **1950년대**, 신생 컴퓨터 과학 분야의 선구자 몇 명이 **컴퓨터가 "생각"할 수 있을지에 대한 질문**을 던지면서 탄생했습니다. 이 질문은 오늘날까지도 그 함의를 탐구하고 있는 주제입니다.

인공지능이라는 개념은 그 이전 수년, 심지어 수십 년 동안 구상되어 왔지만, **1956년 존 매카시** 당시 다트머스 대학 수학 조교수가 다음과 같은 제안으로 여름 워크숍을 조직하면서 연구 분야로 구체화되었습니다.

> 학습의 모든 측면이나 지능의 다른 특징들은 원칙적으로 매우 정확하게 기술될 수 있고, 따라서 기계가 이를 모방할 수 있다는 가설에 기반하여 연구를 진행할 것입니다. 기계가 언어를 사용하고, 추상화와 개념을 형성하고, 현재 인간만이 할 수 있는 종류의 문제를 해결하고, 스스로 발전할 수 있도록 하는 방법을 찾고자 합니다. 엄선된 과학자들이 여름 동안 함께 연구한다면 이러한 문제 중 하나 이상에서 상당한 진전을 이룰 수 있을 것이라고 생각합니다.

여름이 끝날 무렵, 워크숍은 애초에 탐구하고자 했던 수수께끼를 완전히 해결하지 못한 채 마무리되었습니다. 그럼에도 불구하고, 이 워크숍에는 이후 해당 분야의 선구자가 될 많은 사람들이 참여했으며, 오늘날까지도 계속되고 있는 지적 혁명의 시발점이 되었습니다.

간단히 말해서, **인공지능(AI)은 인간이 일반적으로 수행하는 지적 작업을 자동화하려는 노력**으로 정의할 수 있습니다. 따라서 AI는 머신러닝과 딥러닝을 포괄하는 일반적인 분야이지만, 학습을 포함하지 않는 다양한 접근 방식도 포함합니다. 1980년대 이전의 대부분의 AI 교과서에서는 "학습"이라는 단어조차 언급되지 않았다는 점을 생각해 보십시오! 예를 들어, **초기 체스 프로그램**은 프로그래머가 직접 작성한 **하드코딩된 규칙만을 사용**했기 때문에 머신러닝으로 분류되지 않았습니다. 실제로, 꽤 오랫동안 대부분의 전문가들은 프로그래머가 명시적인 데이터베이스에 저장된 지식을 조작하기 위한 충분히 많은 수의 명시적 규칙을 직접 작성함으로써 인간 수준의 인공지능을 구현할 수 있다고 믿었습니다. 이러한 접근 방식을 **기호적(Symbolic) AI**라고 합니다. **기호적(symbolic) 인공지능은 1950년대부터 1980년대 후반까지** 인공지능 분야의 지배적인 패러다임이었으며, **1980년대 전문가 시스템 붐** 시기에 인기가 절정에 달했습니다.

**기호적(symbolic) 인공지능은 체스 게임과 같이 명확하게 정의된 논리적 문제를 해결하는 데는 적합**했지만, 이미지 분류, 음성 인식, 자연어 번역과 같이 더 복잡하고 모호한 문제를 해결하기 위한 명확한 규칙을 도출하는 데는 한계가 있었습니다. 
이러한 한계를 극복하기 위해 새로운 접근 방식인 **기계 학습이 등장**했습니다.

#### 1.1.2 Machine learning

빅토리아 시대 영국에서, 레이디 에이다 러브레이스는 최초의 범용 기계식 계산기인 해석기관을 발명한 찰스 배비지의 친구이자 협력자였습니다. 해석기관은 1830년대와 1840년대에 설계되었을 당시에는 범용 계산이라는 개념 자체가 존재하지 않았기 때문에, 시대를 훨씬 앞서가는 선구적인 발명품이었습니다. 단지 수학적 해석 분야의 특정 계산을 기계적인 연산을 통해 자동화하기 위한 도구로 고안되었으며, 그래서 이름도 해석기관(Analytical Engine)이 되었습니다. 이처럼 해석기관은 파스칼린이나 라이프니츠의 스텝 레커(파스칼린의 개량형)처럼 기계 장치를 이용해 수학 연산을 구현하려는 초기 시도들의 지적 계승자라고 할 수 있습니다. 1642년(19세의 나이에!) 블레즈 파스칼이 설계한 파스칼린은 세계 최초의 기계식 계산기로, 덧셈, 뺄셈, 곱셈, 심지어 나눗셈까지 가능했습니다.

1843년, 에이다 러브레이스는 해석기관의 발명에 대해 다음과 같이 언급했습니다.

> "해석기관은 무엇인가를 새롭게 창조하려는 의도가 전혀 없습니다. 우리가 명령하는 대로 무엇이든 수행할 수 있을 뿐입니다. 해석기관의 역할은 우리가 이미 알고 있는 것을 활용할 수 있도록 돕는 것입니다."

182년이라는 시간이 흘렀지만, 러브레이스의 이 말은 여전히 ​​의미심장합니다. 범용 컴퓨터가 과연 무엇인가를 "새롭게 창조"할 수 있을까요? 아니면 인간이 이미 완벽하게 이해하고 있는 과정을 기계적으로 실행하는 데에만 그칠까요? 과연 독창적인 사고를 할 수 있을까요? 경험을 통해 학습할 수 있을까요? 창의성을 발휘할 수 있을까요?

그녀의 말은 훗날 인공지능의 선구자인 앨런 튜링이 1950년 발표한 획기적인 논문 "컴퓨팅 기계와 지능"[1]에서 "러브레이스의 반론"으로 인용되었으며, 이 논문은 튜링 테스트[2]와 인공지능의 미래를 결정짓는 핵심 개념들을 소개했습니다. 튜링은 당시로서는 매우 파격적인 견해를 갖고 있었는데, 컴퓨터가 원칙적으로 인간 지능의 모든 측면을 모방하도록 만들 수 있다는 것이었습니다.

컴퓨터가 유용한 작업을 수행하도록 하는 일반적인 방법은 인간 프로그래머가 입력 데이터를 적절한 결과로 변환하는 규칙, 즉 컴퓨터 프로그램을 작성하는 것입니다. 마치 레이디 러브레이스가 해석기관이 수행할 단계별 지침을 작성한 것과 같습니다. **머신러닝**은 이 방식을 뒤집습니다. **기계가 입력 데이터와 그에 대한 결과를 살펴보고 어떤 규칙이 적절해야 하는지 스스로 파악**합니다.(그림 1.2)

<img src="https://deeplearningwithpython.io/images/ch01/a-new-programming-paradigm.e8d1a1c2.png" width="350">
<p style='text-align: center;'> Figure 1.2 Machine learning: a new programming paradigm </p>

머신러닝 시스템은 명시적으로 프로그래밍되지 않고 훈련됩니다. 이 시스템에는 작업과 관련된 많은 예제가 제시되어 있으며, 이러한 예제에서 통계적 구조를 찾아 시스템이 작업을 자동화하기 위한 규칙을 도출할 수 있도록 합니다. 예를 들어 휴가용 사진에 태그를 붙이는 작업을 자동화하고자 한다면, 이미 사람이 태그한 많은 사진 예제가 포함된 머신 러닝 시스템을 제시할 수 있으며, 시스템은 특정 사진을 "풍경"이나 "음식"과 같은 특정 태그에 연결하는 통계 규칙을 학습할 수 있습니다

**기계 학습은 1990년대에야 번성하기 시작**했지만, 더 빠른 하드웨어와 더 큰 데이터셋의 사용 가능성에 힘입어 빠르게 가장 인기 있고 성공적인 AI 하위 분야가 되었습니다. 기계 학습은 수학적 통계와 관련이 있지만, 의학이 화학과 관련이 있지만 화학으로 환원될 수 없다는 점에서 여러 중요한 점에서 통계와 다릅니다. 의학은 고유한 특성을 가진 고유한 시스템을 다루기 때문입니다. 통계와 달리 기계 학습은 베이지안 분석과 같은 고전적인 통계 분석이 불가능한 수백만 개의 이미지 데이터셋(각각 수만 개의 픽셀로 구성된 수백만 개의 이미지 데이터셋과 같은)을 다루는 경향이 있습니다. 그 결과, 기계 학습, 특히 딥러닝은 수학적 이론이 상대적으로 적을 수 있으며, 어쩌면 너무 적을 수도 있습니다. 이론 물리학이나 수학과 달리 기계 학습은 경험적 발견에 의해 주도되며 소프트웨어와 하드웨어의 발전에 크게 의존하는 매우 실용적인 분야입니다.의존하는 매우 실용적인 분야입니다.

#### 1.1.3 Learning rules and representations from data
딥러닝을 정의하고 딥러닝과 다른 머신러닝 접근법의 차이를 이해하려면, 먼저 머신러닝 알고리즘이 무엇을 하는지에 대한 기본적인 이해가 필요하다. 앞서 말했듯이, 머신러닝은 기대되는 결과의 예시가 주어졌을 때, 데이터 처리 작업을 수행하기 위한 규칙을 스스로 발견한다. 따라서 머신러닝을 수행하기 위해서는 다음 세 가지가 필요하다.

* 입력 데이터 포인트 : 예를 들어, 음성 인식 작업이라면 사람의 음성이 담긴 사운드 파일이 입력 데이터가 된다. 이미지 태깅 작업이라면 사진 이미지가 입력 데이터가 된다.
* 기대되는 출력의 예시 : 음성 인식의 경우, 사람이 직접 작성한 음성 파일의 텍스트 전사본이 이에 해당한다. 이미지 작업에서는 “개”, “고양이”와 같은 태그가 기대 출력이 될 수 있다.
* 알고리즘이 얼마나 잘 수행하는지를 측정하는 방법 : 이는 알고리즘의 현재 출력과 기대 출력 사이의 차이를 계산하기 위해 필요하다. 이 측정값은 알고리즘의 동작 방식을 조정하기 위한 피드백 신호로 사용되며, 이러한 조정 과정을 **학습(learning)**이라고 부른다.

머신러닝 모델은 입력 데이터를 의미 있는 출력으로 변환한다. 이 변환 과정은 입력과 출력의 알려진 예시를 반복적으로 접하면서 학습된다. 따라서 머신러닝과 딥러닝의 핵심 문제는 데이터를 의미 있게 변환하는 것이다. 다시 말해, 입력 데이터를 유용한 표현(representation)으로 학습하는 것이 핵심이며, 이러한 표현은 기대 출력에 더 가까워지도록 돕는다.

이제 본격적으로 들어가기 전에, 표현(representation)이란 무엇인가?
본질적으로 표현이란 데이터를 바라보는 또 다른 방식, 혹은 데이터를 인코딩하는 방법이다. 예를 들어, 컬러 이미지는 RGB(빨강–초록–파랑) 형식으로 표현할 수도 있고, HSV(색상–채도–명도) 형식으로 표현할 수도 있다. 이 두 방식은 동일한 데이터를 서로 다르게 표현한 것이다.

어떤 작업은 한 표현 방식에서는 어렵지만, 다른 표현 방식에서는 쉬워질 수 있다. 예를 들어,

* “이미지에서 빨간색 픽셀을 모두 선택하라”는 작업은 RGB 표현에서 더 간단하며,
* “이미지의 채도를 낮춰라”는 작업은 HSV 표현에서 더 간단하다.

머신러닝 모델의 본질은 입력 데이터에 대해 적절한 표현을 찾는 것이다. 즉, 주어진 작업을 수행하기에 더 적합하도록 데이터를 변환하는 것이다.

이를 좀 더 구체적으로 설명해보자. 그림 1.3과 같이, x축과 y축이 있고 (x, y) 좌표로 표현된 점들이 있다고 가정하자.

<img src="https://deeplearningwithpython.io/images/ch01/example_data_points.28a84f5a.png" width="180"><p style='text-align: center;'>Figure 1.3 Some sample data  </p>

보시다시피 흰 점들과 검은 점들이 몇 개 있습니다. 이제 어떤 점의 (x, y) 좌표를 입력으로 받아 그 점이 흰색인지 검은색인지일 가능성을 출력하는 알고리즘을 개발하고자 한다고 가정해봅시다. 이 경우, 입력값은 각 점의 좌표입니다. b기대되는 출력값은 각 점의 색상입니다.
알고리즘이 잘 작동하는지를 평가하는 한 가지 방법은, 예를 들어 점들이 얼마나 높은 비율로 정확하게 분류되는지를 측정하는 것입니다.

여기서 필요한 것은 흰 점과 검은 점을 명확하게 분리할 수 있는 새로운 데이터 표현입니다. 여러 가능한 방법 중 하나로, 그림 1.4에 나타난 것처럼 좌표계를 변환하는 방법을 사용할 수 있습니다.

<img src="https://deeplearningwithpython.io/images/ch01/learning_representations.97fa3c4b.png" width="500"> <p style='text-align: center;'>Figure 1.4 Coordinate change
 </p>

이 새로운 좌표계에서 각 점의 좌표는 데이터의 새로운 표현이라고 할 수 있습니다. 그리고 이 표현은 매우 훌륭합니다. 이 표현을 사용하면 흑백 분류 문제를 다음과 같은 간단한 규칙으로 표현할 수 있습니다.
“x > 0 인 점은 검은색이다” 또는 “x < 0 인 점은 흰색이다.”
이 새로운 표현과 간단한 규칙의 결합은 분류 문제를 깔끔하게 해결합니다.

이 경우 우리는 좌표 변환을 직접 정의했습니다. 즉, 인간의 지능을 사용해 데이터에 적합한 표현을 스스로 고안한 것입니다. 이렇게 극도로 단순한 문제에서는 괜찮지만, 만약 손글씨 숫자 이미지를 분류하는 것이 과제라면 같은 일을 할 수 있을까요? 다양한 필체 전반에 걸쳐 6과 8의 차이, 1과 7의 차이를 드러내는 명시적이고 컴퓨터가 실행할 수 있는 이미지 변환을 직접 적어낼 수 있을까요?

어느 정도까지는 가능합니다. 예를 들어 “닫힌 고리의 개수를 센다”거나 세로·가로 방향의 픽셀 히스토그램과 같은 숫자 표현에 기반한 규칙들은 손글씨 숫자를 구분하는 데 꽤 괜찮은 성능을 냅니다. 하지만 이런 유용한 표현을 손으로 찾아내는 작업은 매우 힘들며, 상상할 수 있듯이 그렇게 만들어진 규칙 기반 시스템은 취약하고 유지보수가 악몽에 가깝습니다. 공들여 만든 규칙을 깨뜨리는 새로운 필체 사례를 하나라도 만나면, 이전의 모든 규칙과의 상호작용을 고려하면서 새로운 데이터 변환과 새로운 규칙을 계속 추가해야 하기 때문입니다.

아마 이런 생각이 들 것입니다. 이렇게 고통스러운 과정을 자동화할 수는 없을까? 자동으로 생성된 다양한 데이터 표현과 그에 기반한 규칙들의 집합을 체계적으로 탐색하고, 개발용 데이터셋에서의 분류 정확도를 피드백으로 삼아 좋은 것들을 골라낼 수는 없을까? 바로 이것이 머신러닝입니다. 머신러닝에서 말하는 ‘학습’이란, 어떤 피드백 신호의 안내를 받아 데이터에 대한 유용한 표현을 만들어내는 데이터 변환을 자동으로 탐색하는 과정을 의미합니다. 즉, 문제를 해결하는 데 더 단순한 규칙이 적용 가능하도록 만들어주는 표현을 찾는 과정입니다.

이러한 변환은 2차원 좌표 분류 예제에서처럼 좌표 변환일 수도 있고, 숫자 분류 예제에서처럼 픽셀 히스토그램이나 고리 개수 세기일 수도 있습니다. 또한 선형 투영, 평행 이동, 그리고 “x > 0 인 모든 점을 선택하라”와 같은 비선형 연산일 수도 있습니다. 머신러닝 알고리즘은 보통 이런 변환을 창의적으로 만들어내지는 않습니다. 대신 ‘가설 공간(hypothesis space)’이라 불리는 미리 정의된 연산 집합 안에서 탐색을 수행합니다. 예를 들어, 2차원 좌표 분류 문제에서는 가능한 모든 좌표 변환의 집합이 바로 가설 공간이 됩니다.

요약하자면, 머신러닝이란 입력 데이터에 대해 미리 정의된 가능성의 공간 안에서, 피드백 신호의 도움을 받아 유용한 표현과 그 위의 규칙을 탐색하는 것입니다. 이 단순한 아이디어는 자율주행부터 자연어 질의응답에 이르기까지 놀라울 정도로 폭넓은 지적 과제를 해결할 수 있게 해줍니다.

이제 우리가 말하는 ‘학습’의 의미를 이해했으니, 딥러닝이 특별한 이유를 살펴보겠습니다.가 말하는 ‘학습’의 의미를 이해했으니, 딥러닝이 특별한 이유를 살펴보겠습니다.가 말하는 ‘학습’의 의미를 이해했으니, 딥러닝이 특별한 이유를 살펴보겠습니다.등 입니다.
(예: "x > 0과 같은 모든 점 선택") 등 입니다.


#### 1.1.4 The “deep” in “deep learning”

딥러닝은 머신러닝의 특정 하위 분야로, 데이터로부터 표현을 학습하는 새로운 접근 방식입니다. 이는 점점 더 의미 있는 표현을 여러 겹으로 학습하는 데 중점을 둡니다. "딥러닝"에서 "딥"은 이 접근 방식이 달성하는 더 깊은 이해를 의미하는 것이 아니라, 표현의 연속적인 층을 의미합니다. 데이터 모델을 구성하는 층의 수를 모델의 깊이라고 합니다. 이 분야를 계층적 표현 학습 또는 계층 구조적 표현 학습이라고 부르는 것도 적절할 수 있습니다. 현대의 딥러닝은 종종 수십, 심지어 수백 개의 연속적인 표현 층을 포함하며, 이 모든 층은 훈련 데이터에 노출됨으로써 자동으로 학습됩니다. 반면, 다른 머신러닝 접근 방식은 데이터의 표현을 한두 겹만 학습하는 데 초점을 맞추는 경향이 있습니다(예: 픽셀 히스토그램을 가져와 분류 규칙을 적용하는 것). 따라서 이러한 접근 방식을 얕은 학습이라고 부르기도 합니다.

딥러닝에서 이러한 계층적 표현은 신경망이라는 모델을 통해 학습되며, 신경망은 말 그대로 층층이 쌓여 있는 구조로 되어 있습니다. 신경망이라는 용어는 신경생물학에서 유래했지만, 딥러닝의 핵심 개념 중 일부가 뇌(특히 시각 피질)에 대한 이해에서 영감을 얻어 개발되었다는 점은 인정되더라도, 딥러닝 모델 자체가 뇌의 모델은 아닙니다. 뇌가 현대 딥러닝 모델에서 사용되는 학습 메커니즘과 유사한 것을 구현한다는 증거는 없습니다. 딥러닝이 뇌처럼 작동하거나 뇌를 모델로 했다는 주장을 담은 대중 과학 기사를 접할 수도 있지만, 이는 사실이 아닙니다. 딥러닝을 신경생물학과 연관 짓는 것은 이 분야에 처음 접하는 사람들에게 혼란을 주고 오히려 역효과를 초래할 수 있습니다. "우리의 마음과 똑같다"는 식의 신비로운 분위기는 필요 없으며, 딥러닝과 생물학 사이의 가설적인 연관성에 대한 내용은 모두 잊어버리는 것이 좋습니다. 여기서는 딥러닝을 데이터로부터 표현을 학습하는 수학적 프레임워크로 정의합니다.

그렇다면 딥러닝 알고리즘이 학습한 표현은 어떤 모습일까요? 그림 1.5에서 볼 수 있듯이, 여러 층으로 이루어진 네트워크가 숫자 이미지를 변환하여 어떤 숫자인지 인식하는 과정을 살펴보겠습니다.

<img src="https://deeplearningwithpython.io/images/ch01/a_deep_network.32f0eedf.png" width="400">
<p styple='text-align: center;'>Figure 1.5 A deep neural network for digit classification </p>

그림 1.6에서 볼 수 있듯이, 신경망은 디지털 이미지를 원본 이미지와 점점 더 다르고 최종 결과에 대한 정보가 점점 더 풍부한 표현으로 변환합니다. 심층 신경망은 정보가 연속적인 필터를 거쳐 점점 더 정제된(즉, 특정 작업과 관련하여 유용한) 형태로 나오는 다단계 정보 정제 과정으로 생각할 수 있습니다.

<img src="https://deeplearningwithpython.io/images/ch01/mnist_representations.fdb30a2d.png" width="400">
<p style='text-align: center;'>Figure 1.6 Deep representations learned by a digit-classification mode </p>
그러니까 딥러닝이란 기술적으로 말하자면 데이터 표현을 학습하는 다단계 방식입니다. 간단한 개념이지만, 충분히 확장된 아주 간단한 메커니즘은 마치 마법처럼 보일 수 있습니다.


#### 1.1.5 Understanding how deep learning works, in three figures

이제 여러분은 머신 러닝이 입력(예: 이미지)을 목표(예: "고양이"라는 레이블)에 매핑하는 것이며, 이는 다양한 입력과 목표의 예시를 관찰함으로써 이루어진다는 것을 알고 있을 것입니다. 또한 심층 신경망은 단순한 데이터 변환(레이어)의 심층적인 시퀀스를 통해 이러한 입력-목표 매핑을 수행하고, 이러한 데이터 변환은 예시에 노출됨으로써 학습된다는 것도 알고 있을 것입니다. 이제 이 학습이 구체적으로 어떻게 일어나는지 살펴보겠습니다.

레이어가 입력 데이터에 대해 어떤 작업을 수행하는지는 레이어의 가중치에 저장되는데, 이는 본질적으로 숫자들의 집합입니다. 기술적인 용어로, 레이어가 구현하는 변환은 가중치로 매개변수화된다고 할 수 있습니다(그림 1.7 참조). (가중치는 레이어의 파라미터라고도 합니다.) 이 맥락에서 학습이란 네트워크가 예시 입력을 해당 목표에 정확하게 매핑할 수 있도록 네트워크의 모든 레이어 가중치에 대한 값 집합을 찾는 것을 의미합니다. 하지만 여기서 중요한 점은 심층 신경망이 수천만 개의 파라미터를 포함할 수 있다는 것입니다. 이 모든 매개변수에 대한 올바른 값을 찾는 것은 특히 하나의 매개변수 값을 변경하면 다른 모든 매개변수의 동작에 영향을 미친다는 점을 고려할 때 매우 어려운 작업처럼 보일 수 있습니다!

<img src="https://deeplearningwithpython.io/images/ch01/deep-learning-in-3-figures-1.55e5a910.png" width="300"><p style='text-align: center;'> Figure 1.7 A neural network is parameterized by its weights. </p>

무언가를 제어하려면 먼저 그것을 관찰할 수 있어야 합니다. 신경망의 출력을 제어하려면 해당 출력이 예상 값에서 얼마나 벗어나 있는지 측정할 수 있어야 합니다. 이것이 바로 신경망의 손실 함수(때로는 목적 함수 또는 비용 함수라고도 함)의 역할입니다. 손실 함수는 신경망의 예측값과 실제 목표값(신경망이 출력하기를 원했던 값)을 입력으로 받아, 신경망이 특정 예제에서 얼마나 잘 수행했는지를 나타내는 거리 점수를 계산합니다(그림 1.8 참조).

<img src="https://deeplearningwithpython.io/images/ch01/deep-learning-in-3-figures-2.bb3cebc2.png" width="300">
<p style='text-align: center;'> Figure 1.8 A loss function  measures the quality of the network’s output. </p>


딥러닝의 핵심은 이 손실 점수를 피드백 신호로 사용하여 가중치 값을 조금씩 조정하는 것입니다. 이렇게 조정하는 방향이 현재 예제의 손실 점수를 낮추는 방향입니다(그림 1.9 참조). 이러한 조정은 옵티마이저의 역할이며, 옵티마이저는 역전파 알고리즘을 구현합니다. 역전파 알고리즘은 딥러닝의 핵심 알고리즘입니다. 다음 장에서는 역전파 알고리즘의 작동 방식을 더 자세히 설명합니다.

<img src="https://deeplearningwithpython.io/images/ch01/deep-learning-in-3-figures-3.de178fa4.png" width="300">
<p style='text-align: center;'> Figure 1.9 The loss score is used as a feedback signal to adjust the weights.</p>

초기에 네트워크의 가중치는 무작위 값으로 할당되므로, 네트워크는 단순히 일련의 무작위 변환을 수행합니다. 당연히 출력은 이상적인 값과는 거리가 멀고, 손실 점수 또한 매우 높습니다. 하지만 네트워크가 매 예제를 처리할 때마다 가중치는 올바른 방향으로 조금씩 조정되고, 손실 점수는 감소합니다. 이것이 바로 학습 과정이며, 충분한 횟수(일반적으로 수천 개의 예제에 걸쳐 수십 번의 패스)를 반복하면 손실 함수를 최소화하는 가중치 값을 얻게 됩니다. 손실이 최소인 네트워크는 출력이 목표값에 최대한 가



#### 1.1.6 딥러닝의 차별점은 무엇일까요?
심층 신경망이 기업의 투자와 연구자들의 관심을 끄는 "최적의" 접근 방식이 된 특별한 이유는 무엇일까요? 20년 후에도 심층 신경망을 사용하고 있을까요?

딥러닝은 인공지능 혁명이라는 위상을 뒷받침하는 여러 가지 특징을 가지고 있으며, 앞으로도 계속해서 중요한 역할을 할 것입니다. 수십 년 후에는 신경망을 직접 사용하지 않을 수도 있지만, 앞으로 우리가 사용하는 기술은 현대 딥러닝과 그 핵심 개념을 직접적으로 계승할 것입니다. 이러한 중요한 특징은 크게 세 가지 범주로 나눌 수 있습니다.

* 단순성 — 딥러닝은 머신러닝 워크플로에서 가장 중요한 단계였던 특징 엔지니어링을 자동화하여 문제 해결을 훨씬 쉽게 만들어 줍니다. 이전의 머신러닝 기법, 즉 얕은 학습은 입력 데이터를 하나 또는 두 개의 연속적인 표현 공간으로만 변환했는데, 이는 대부분의 문제에 충분한 표현력을 제공하지 못했습니다. 따라서 사람은 초기 입력 데이터를 이러한 방법으로 처리하기에 더 적합하게 만들기 위해 많은 노력을 기울여야 했습니다. 즉, 데이터에 대한 좋은 표현을 수동으로 설계해야 했습니다. 이를 특징 엔지니어링이라고 합니다. 반면 딥러닝은 이 단계를 완전히 자동화합니다. 딥러닝을 사용하면 모든 특징을 한 번에 학습할 수 있으므로 직접 특징을 설계할 필요가 없습니다. 이는 머신러닝 워크플로우를 크게 단순화하여 복잡한 다단계 파이프라인을 단일의 간단한 엔드투엔드 딥러닝 모델로 대체하는 경우가 많습니다.
* 확장성 — 딥러닝은 GPU 또는 특수 머신러닝 하드웨어에서 병렬화에 매우 적합하므로 무어의 법칙을 최대한 활용할 수 있습니다. 또한 딥러닝 모델은 작은 데이터 배치를 반복적으로 학습하므로 임의의 크기의 데이터 세트로 학습할 수 있습니다. (유일한 병목 현상은 사용 가능한 병렬 컴퓨팅 성능의 양인데, 무어의 법칙 덕분에 이 장벽은 빠르게 해소됩니다.)
* 다용성 및 재사용성 — 기존의 많은 머신러닝 접근 방식과 달리 딥러닝 모델은 처음부터 다시 시작하지 않고도 추가 데이터로 학습할 수 있으므로 지속적인 온라인 학습에 적합합니다. 이는 매우 큰 규모의 프로덕션 모델에 중요한 특성입니다. 또한, 학습된 딥러닝 모델은 용도 변경이 가능하고 재사용할 수 있습니다. 이것이 바로 "기초 모델"의 핵심 개념입니다. 기초 모델은 방대한 양의 데이터로 학습된 대규모 모델로, 재학습을 거의 또는 전혀 하지 않고도 다양한 새로운 작업에 활용할 수여겨졌던 개념을 예고했습니다.


#### 1.1.7 생성형 AI의 시대
오늘날 딥러닝의 가장 잘 알려진 예는 아마도 최근 등장한 생성형 AI 애플리케이션일 것입니다. ChatGPT, Gemini, Claude와 같은 챗봇과 Midjourney와 같은 이미지 생성 서비스가 대표적입니다. 이러한 애플리케이션은 간단한 입력에 따라 유익하거나 창의적인 콘텐츠를 생성하는 능력으로 대중의 관심을 사로잡았으며, 인간과 기계의 창의성 사이의 경계를 허물고 있습니다.

생성형 AI는 입력된 텍스트와 이미지 콘텐츠를 재구성하는 방법을 학습하는 매우 큰 "기초 모델"에 의해 구동됩니다. 예를 들어, 노이즈가 있는 이미지에서 선명한 이미지를 재구성하거나, 문장에서 다음 단어를 예측하는 등의 작업을 수행합니다. 즉, 그림 1.8의 목표값은 입력 자체에서 가져온 것입니다. 이를 자기지도 학습이라고 하며, 이러한 모델들이 방대한 양의 레이블이 지정되지 않은 데이터를 활용할 수 있게 해줍니다. 이전 머신러닝의 병목 현상이었던 수동 데이터 주석 작업을 없애면서 이전에는 볼 수 없었던 규모의 컴퓨팅이 가능해졌습니다. 이러한 기반 모델 중 일부는 수천억 개의 매개변수를 가지고 있으며, 1페타바이트가 넘는 데이터로 학습되는데, 그 비용은 수천만 달러에 달합니다.

이러한 기반 모델은 인간 지식의 퍼지 데이터베이스처럼 작동하여 특별한 프로그래밍이나 재학습 없이도 매우 광범위한 응용 분야에 적용될 수 있습니다. 이미 방대한 양의 정보를 암기했기 때문에, 학습된 지식 표현에 질의하여 가장 관련성이 높은 결과를 반환하는 방식으로 새로운 문제를 해결할 수 있습니다.

생성형 인공지능은 2022년에야 주류의 관심을 받기 시작했지만, 그 역사는 매우 깁니다. 텍스트 생성에 대한 초기 실험은 1990년대로 거슬러 올라갑니다. 2017년에 출간된 이 책의 초판에는 이미 "생성형 AI"라는 제목의 상당한 분량의 장이 있었는데, 당시의 텍스트 생성 및 이미지 생성 기술을 탐구하면서 "머지않아" 우리가 소비하는 문화 콘텐츠의 상당 부분이 AI의 도움으로 만들어질 것이라는 당시로서는 다소 황당하게 여겨졌던 개념을 예고했습니다.

#### 1.1.8 딥러닝이 지금까지 이룬 성과

지난 10년간 딥러닝은 기술 혁명이라고 해도 과언이 아닐 정도로 큰 성과를 거두었습니다. 2013년부터 2017년까지 지각 관련 작업에서 놀라운 결과를 보여주었고, 2017년부터 2022년까지는 자연어 처리 작업에서 빠른 발전을 이루었으며, 2022년부터 현재까지는 혁신적인 생성형 AI 애플리케이션의 물결을 일으키고 있습니다.

딥러닝은 오랫동안 기계가 해결하지 못했던 매우 어려운 문제들을 해결하는 데 있어 획기적인 발전을 가능하게 했습니다.

* ChatGPT, Gemini와 같은 유창하고 다재다능한 챗봇
* GitHub Copilot과 같은 프로그래밍 도우미
* 실사 수준의 이미지 생성
* 인간 수준의 이미지 분류
* 인간 수준의 음성 인식
* 인간 수준의 필기 및 인쇄 텍스트 인식
* 획기적으로 향상된 기계 번역
* 획기적으로 향상된 텍스트 음성 변환
* 2025년 기준 피닉스, 샌프란시스코, 로스앤젤레스, 오스틴에서 이미 상용화된 인간 수준의 자율 주행
* YouTube, Netflix, Spotify에서 사용되는 것과 같은 향상된 추천 시스템
* 인간을 능가하는 바둑, 체스, 포커 실력

딥러닝이 할 수 있는 일의 전체 범위는 아직 탐구 중입니다. 우리는 불과 몇 년 전만 해도 해결 불가능하다고 여겨졌던 다양한 문제에 딥러닝을 성공적으로 적용하기 시작했습니다. 바티칸 비밀 문서 보관소에 소장된 수만 점의 고대 문서를 자동으로 필사하고, 스마트폰 하나로 들판의 식물 질병을 탐지 및 분류하고, 종양 전문의나 방사선 전문의가 의료 영상 데이터를 해석하는 것을 돕고, 홍수, 허리케인, 심지어 지진과 같은 자연재해를 예측하는 데 활용하고 있습니다. 이러한 모든 성과를 통해 우리는 과학, 의학, 제조, 에너지, 교통, 소프트웨어 개발, 농업, 심지어 예술 창작에 이르기까지 모든 분야와 모든 활동에서 딥러닝이 우리를 돕는 시대에 한 걸음 더 가까워지고 있습니다.걸음 더 가까워지고 있습니다.겨졌던 개념을 예고했습니다.

#### 1.1.9 단기적인 과대광고에 주의하세요

멈출 수 없을 것처럼 보이는 일련의 성공은 엄청난 과대광고를 불러일으켰는데, 그중 일부는 어느 정도 근거가 있지만 대부분은 허황된 이야기일 뿐입니다. 2023년 초, OpenAI의 GPT-4 출시 직후 많은 전문가들은 "이제 아무도 일할 필요가 없다"며 1년 안에 대규모 실업 사태가 발생할 것이라거나 경제 생산성이 곧 10배에서 100배까지 급증할 것이라고 주장했습니다. 물론 2년이 지난 지금, 이 중 어느 것도 현실이 되지 않았습니다. 미국의 실업률은 여전히 ​​낮고 생산성 지표는 약속했던 폭발적인 증가와는 거리가 멉니다. 오해하지 마세요. AI, 특히 생성형 AI의 영향력은 이미 상당하며 놀라울 정도로 빠르게 성장하고 있습니다. 2025년 중반 기준으로 생성형 AI는 연간 수백억 달러의 수익을 창출할 것으로 예상되는데, 이는 불과 2년 전만 해도 존재하지 않았던 산업으로서는 매우 인상적인 수치입니다! 하지만 인공지능은 아직 전반적인 경제에 큰 영향을 미치지 못하고 있으며, 초기부터 쏟아졌던 과장된 약속들에 비하면 초라해 보입니다.

인공지능으로 인한 실업 증가와 생산성 100배 향상에 대한 논의는 이미 불안감을 조성하고 있지만, 인공지능에 대한 과대광고에는 더욱 자극적인 측면이 있습니다. 바로 인간 수준의 일반 지능(AGI)이나 인간의 능력을 훨씬 뛰어넘는 "초지능"의 도래를 주장하는 것입니다. 이러한 주장은 경제적 혼란을 넘어 인류 자체가 디지털 창조물에 의해 대체될지도 모른다는 공포를 불러일으키고 있습니다.

이 분야에 처음 접하는 사람들은 생성형 인공지능의 실질적인 성공이 가까운 시일 내에 AGI가 실현될 것이라는 믿음을 불러일으켰다고 생각하기 쉽지만, 사실은 정반대입니다. 가까운 시일 내에 AGI가 실현될 것이라는 주장이 먼저 나왔고, 이것이 생성형 인공지능의 부상에 크게 기여했습니다. 이미 2013년부터 기술 엘리트들 사이에서는 AGI가 몇 년 안에 도래할 것이라는 우려가 제기되었습니다. 당시에는 구글에 인수된 런던의 AI 연구 스타트업 딥마인드(DeepMind)가 인공 일반 지능(AGI)을 달성할 것이라는 전망이 지배적이었습니다. 이러한 믿음은 2015년 오픈아이디(OpenAI) 설립의 원동력이 되었는데, 오픈아이디는 초기에는 딥마인드에 대한 오픈소스 대항마 역할을 목표로 했습니다. 오픈아이디는 생성형 AI의 발전을 촉진하는 데 중요한 역할을 했으며, 아이러니하게도 가까운 시일 내에 AGI가 실현될 것이라는 믿음이 생성형 AI의 성장을 이끌었다고 할 수 있습니다. 2016년 오픈아이디는 인재 채용 공고에서 2020년까지 AGI를 달성하겠다고 공언했습니다! 물론 당시 기술 업계에서 이러한 낙관적인 전망을 믿는 사람은 소수에 불과했습니다. 하지만 2023년 초, 샌프란시스코 베이 지역의 상당수 엔지니어들은 향후 몇 년 안에 AGI가 등장할 것이라고 확신하는 모습을 보였습니다.

이러한 주장에 대해서는 적절한 회의적인 시각을 갖는 것이 중요합니다. 이름과는 달리 오늘날의 "인공지능"은 "인지 자동화"라고 부르는 것이 더 정확합니다. 인지 자동화는 인간의 기술과 지식을 인코딩하고 작동시키는 것입니다. AI는 요구사항이 명확하게 정의되어 있거나 정확한 예시가 풍부한 문제를 해결하는 데 탁월합니다. AI는 인간의 사고방식을 복제하는 것이 아니라 컴퓨터의 능력을 향상시키는 것입니다.

분명히 말하자면, 인지 자동화는 매우 유용합니다. 하지만 지능, 즉 인지적 자율성은 완전히 다른 개념입니다. AI를 만화 캐릭터에 비유하고, 지능을 살아있는 생명체에 비유해 보겠습니다. 아무리 사실적으로 그려진 만화라도 정해진 장면만 연기할 수 있습니다. 반면 살아있는 생명체는 예상치 못한 상황에 적응할 수 있습니다.

"만화가 충분히 사실적으로 그려졌고 충분히 많은 장면을 다룬다면 무슨 차이가 있나요?"라고 반문할 수도 있습니다. 대규모 언어 모델이 질문에 대해 충분히 인간처럼 들리는 답변을 내놓을 수 있다면, 그것이 진정한 인지적 자율성을 가지고 있는지 여부가 중요할까요? 핵심적인 차이점은 적응력입니다. 지능이란 미지의 것에 직면하고, 그것에 적응하고, 그것으로부터 배우는 능력입니다. 아무리 뛰어난 자동화 시스템이라도 학습되거나 프로그래밍된 상황만 처리할 수 있습니다. 그렇기 때문에 견고한 자동화 시스템을 구축하는 것이 매우 어렵습니다. 모든 가능한 시나리오를 고려해야 하기 때문입니다.

그러니 인공지능이 갑자기 자아를 갖게 되어 인류를 지배하게 될까 봐 걱정하지 마세요. 오늘날의 기술은 그런 방향으로 나아가고 있지 않습니다. 아무리 기술이 발전하더라도 인공지능은 정교한 도구일 뿐, 지각 있는 존재는 아닙니다. 마치 더 나은 시계가 시간 여행으로 이어질 거라고 기대하는 것과 같습니다. 둘은 완전히 다른 개념입니다.

#### 1.1.10 여름이 겨울로 바뀔 수도 있다

단기적인 기대가 지나치게 부풀려지면 기술이 필연적으로 기대에 미치지 못할 때 연구 투자가 줄어들어 장기간 진전이 늦어질 수 있다는 위험이 있다. 이러한 일은 과거에도 있었다. 인공지능은 과거 두 차례에 걸쳐 강렬한 낙관론에 이어 실망과 회의론으로 이어지는 순환을 겪었고, 그 결과 자금 부족 사태가 발생했다. 이는 1960년대 기호 인공지능에서 시작되었다. 당시 인공지능에 대한 전망은 매우 밝았다. 기호 인공지능 접근법의 가장 잘 알려진 선구자이자 옹호자 중 한 명인 마빈 민스키는 1967년에 "한 세대 안에… '인공지능'을 만드는 문제는 상당 부분 해결될 것이다"라고 주장했다. 3년 후인 1970년에는 더욱 구체적인 수치를 제시하며 "3년에서 8년 안에 우리는 평균적인 인간의 일반 지능을 가진 기계를 갖게 될 것이다"라고 예측했다. 2025년 현재, 그러한 성과는 여전히 먼 미래의 일처럼 보입니다. 너무 멀어서 언제쯤 실현될지 예측조차 할 수 없습니다. 하지만 1960년대와 1970년대 초에는 많은 전문가들이 곧 현실이 될 것이라고 믿었습니다(오늘날에도 많은 사람들이 그렇게 생각합니다). 몇 년 후, 이러한 높은 기대가 실현되지 않자 연구자들과 정부 자금은 이 분야에서 등을 돌렸고, 이것이 바로 제1차 인공지능 겨울(냉전 절정 직후의 핵겨울에 빗댄 표현)의 시작이었습니다.

하지만 이것이 마지막은 아니었습니다. 1980년대에 들어서면서 기호 인공지능에 대한 새로운 접근 방식인 전문가 시스템이 대기업들 사이에서 주목받기 시작했습니다. 몇몇 초기 성공 사례들이 투자 물결을 일으켰고, 전 세계 기업들은 전문가 시스템 개발을 위해 사내 인공지능 부서를 설립했습니다. 1985년경에는 기업들이 이 기술에 매년 10억 달러 이상을 투자했지만, 1990년대 초에 이르러서는 이러한 시스템들이 유지 보수 비용이 많이 들고, 확장성이 떨어지며, 활용 범위가 제한적이라는 것이 드러나면서 관심이 시들해졌습니다. 그렇게 두 번째 AI 겨울이 시작되었습니다. 우리는 현재 AI 과대광고와 실망의 세 번째 주기를 목격하고 있을지도 모릅니다. 그리고 여전히 강렬한 낙관론이 지배하는 시기입니다.

제 생각에는 1990년대처럼 AI 연구가 완전히 위축되는 일은 없을 것 같습니다. 만약 겨울이 온다면 아주 온화할 것입니다. AI는 이미 세상을 바꿀 가치를 입증했습니다. 하지만 2023년에서 2024년 사이에 형성된 AI 거품이 꺼질 필요는 불가피해 보입니다. 현재 데이터 센터와 GPU를 중심으로 한 AI 투자액은 연간 1,000억 달러를 넘어서고 있지만, 수익 창출은 100억 달러 수준에 그치고 있습니다. 경영진과 투자자들은 AI가 실제로 이룬 성과가 아니라, 앞으로 무엇을 할 수 있을지에 대한 전망으로 AI를 평가하고 있습니다. 그리고 그러한 전망 중 상당 부분은 기존 기술로는 결코 따라잡을 수 없을 것입니다. 결국 어떤 변화가 일어날 것입니다. 하지만 AI 거품이 꺼지면서 정확히 어떤 일이 벌어질지는 아직 예측하기 어렵습니다.

#### 1.1.11 인공지능의 가능성
비록 우리가 인공지능에 대해 단기적으로는 다소 비현실적인 기대를 갖고 있을지 모르지만, 장기적인 전망은 밝습니다. 딥러닝은 의료 진단부터 디지털 비서에 이르기까지, 세상을 획기적으로 변화시킬 수 있는 많은 중요한 문제에 적용될 수 있으며, 우리는 이제 막 시작 단계에 불과합니다.

2017년, 바로 이 책에서 저는 다음과 같이 썼습니다.

> 지금은 인공지능이 우리 세상에 큰 영향을 미칠 것이라고 믿기 어려울지도 모릅니다. 아직 널리 보급되지 않았기 때문입니다. 마치 1995년에 인터넷의 미래 영향력을 상상하기 어려웠던 것과 같습니다. 당시 대부분의 사람들은 인터넷이 자신과 어떤 관련이 있고 삶을 어떻게 바꿀지 이해하지 못했습니다. 오늘날 딥러닝과 인공지능도 마찬가지입니다. 하지만 분명한 것은 인공지능은 반드시 온다는 것입니다. 머지않은 미래에 인공지능은 여러분의 비서이자 친구가 될 것입니다. 여러분의 질문에 답하고, 자녀 교육을 돕고, 건강을 관리해 줄 것입니다. 인공지능은 식료품을 집 앞까지 배달해주고, A 지점에서 B 지점까지 데려다 줄 것입니다. 점점 더 복잡해지고 정보가 넘쳐나는 세상과의 연결고리가 되어줄 것입니다. 더 중요한 것은, 인공지능이 유전체학부터 수학에 이르기까지 모든 과학 분야에서 인간 과학자들이 획기적인 발견을 할 수 있도록 지원함으로써 인류 전체의 발전에 기여할 것이라는 점입니다.

2025년으로 시간을 앞당겨 보면, 이러한 것들 중 대부분은 이미 현실이 되었거나 현실화 직전에 있습니다. 그리고 이것은 단지 시작에 불과합니다.

* 수천만 명의 사람들이 ChatGPT, Gemini, Claude와 같은 인공지능 챗봇을 매일 비서처럼 사용하고 있습니다. 실제로, 질문에 답하고 "자녀 교육"(숙제 도우미)을 돕는 것이 이러한 챗봇의 가장 인기 있는 활용 분야로 나타났습니다! 많은 사람들에게 인공지능은 이미 세상 정보를 접하는 가장 중요한 인터페이스가 되었습니다.
* 수십만 명의 사람들이 Character.ai와 같은 애플리케이션에서 인공지능 "친구"와 소통하고 있습니다.

* 완전 자율 주행은 이미 피닉스, 샌프란시스코, 로스앤젤레스, 오스틴과 같은 도시에서 대규모로 도입되었습니다.
* 인공지능(AI)은 과학 발전을 가속화하는 데 크게 기여하고 있습니다. 딥마인드의 알파폴드(AlphaFold) 모델은 생물학자들이 전례 없는 정확도로 단백질 구조를 예측하는 데 도움을 주고 있습니다. 저명한 수학자 테렌스 타오는 2026년경에는 AI가 적절하게 사용될 경우 수학 연구를 비롯한 여러 분야에서 신뢰할 수 있는 공동 저자가 될 수 있을 것이라고 예측합니다.

한때는 먼 미래의 비전이었던 AI 혁명이 이제 우리 눈앞에서 빠르게 펼쳐지고 있습니다. 그 과정에서 몇 가지 난관에 부딪힐 수도 있습니다. 마치 1998년에서 1999년 사이에 인터넷 산업이 과대광고로 인해 2000년대 초반 투자 위축을 겪었던 것처럼 말입니다. 하지만 결국 우리는 목표를 달성할 것입니다. AI는 오늘날 인터넷처럼 우리 사회와 일상생활을 구성하는 거의 모든 과정에 적용될 것입니다.

단기적인 과대광고에 현혹되지 말고, 장기적인 비전을 믿으십시오. 인공지능이 진정한 잠재력을 발휘하기까지는 시간이 걸릴지도 모릅니다. 아직 누구도 감히 꿈꿔보지 못한 잠재력의 전모를 생각하면 더욱 그렇습니다. 하지만 인공지능은 반드시 다가올 것이며, 우리의 세상을 놀라운 방식으로 변화시킬 것입니다. 방식으로 변화시킬 것입니다.