# **[멋쟁이사자처럼_AI_NLP] 01. 딥러닝 개론**

> - 인공지능은 **특정 작업 중심(ANI)** → **범용 지능(AGI)** → **초지능(ASI)** 으로 발전 중이다.  
> - 딥러닝은 **CNN → Transformer → 생성형 AI** 로 진화하며,  
  **지각(시각·언어)** 영역에서 **창작과 의사결정** 영역으로 확장되고 있다.

## 1. 인공지능이란?

인공지능(AI, Artificial Intelligence)는 기계가 인간처럼 생각하고 학습하며 문제를 해결하도록 만드는 기술이다.

- **약 인공지능**
	- Artificial Narrow Intelligence (ANI)
	- 특정 작업에 특화된 인공지능 (예: 얼굴 인식, 음성 인식 등)
- **강 인공지능**
	- Artificial General Intelligence (AGI)
	- 인간처럼 다양한 문제를 해결할 수 있는 범용 인공지능, 아직 실현되지 않음
- **초 인공지능**
	- Artificial Superintelligence (ASI)
	- 인간의 지능을 능가하는 수준의 인공지능, 이론적 단계

## 2. 딥러닝 역사

|년도|주요 모델|아키텍처/기술|의의 및 영향|
|--|--|--|--|
|1986|**RNN**|순환 신경망 (시퀀스 처리)|시계열·자연어 처리 가능성 제시|
|1998|**LeNet**|CNN (합성곱 신경망)|이미지 인식 기반 확립|
|2012|**AlexNet**|딥 CNN + GPU 학습|딥러닝 대중화, ImageNet 우승|
|2016|**AlphaGo**|강화학습 + MCTS|인간을 능가한 전략적 판단|
|2017|**Transformer**|Self-Attention 구조|대규모 언어 모델(LLM) 시대 개막|
|2023|**ChatGPT**|GPT 언어모델|대화형 AI의 실용화와 확산|
|2024|**Diffusion**|Latent Diffusion Model|생성형 이미지 AI 시대 개막|

## 3. 인공지능 핵심 개념

- 인공지능(AI)은 기계가 인간의 지능과 행동을 모방하여 데이터를 이해하고 문제를 해결하는 기술
- 머신러닝(Machine Learning)과 딥러닝(Deep Learning)은 인공지능의 대표적인 구현 방법

### 3-1. 머신러닝과 딥러닝

- **전통적 프로그래밍**: 사람이 모든 규칙을 직접 정의하고, 컴퓨터가 이를 수행
- **머신러닝**: 컴퓨터가 데이터를 통해 규칙을 스스로 학습
- **딥러닝**: 인공신경망(ANN)을 기반으로 여러 층의 구조로 복잡한 패턴을 학습

### 3-2. 머신 러닝의 종류

- **지도 학습** (Supervised Learning)
	- 입력 데이터와 정답(레이블) 쌍으로 학습
	- 예) 이미지 분류, 음성 인식
    
- **비지도 학습** (Unsupervised Learning)
	- 레이블 없이 데이터 구조나 패턴 탐색
	- 예) 군집화, 차원 축소
    
- **강화 학습** (Reinforcement Learning)
	- 보상(reward)을 통해 최적 행동 학습
	- 예) 자율주행, 게임 AI
    
#### **강화 학습의 구성 요소**
- 상태 (State) : 현재 환경의 정보
- 에이전트 (Agent) : 의사결정을 수행하는 주체
- 행동 (Action) : 에이전트가 수행하는 동작
- 보상 (Reward) : 행동 결과에 따른 평가값

### 3-3. 딥러닝

딥러닝은 인공신경망(Artificial Neural Network, ANN)을 여러 층으로 쌓아 복잡한 패턴을 학습한다.

#### 신경망 기본 구성
- **뉴런 (Neuron)** : 입력값에 가중치 적용 후 활성화 함수를 통해 출력
- **입력층 (Input Layer)** : 외부 데이터를 입력받는 층
- **은닉층 (Hidden Layer)** : 중간 계산 및 패턴 추출 수행
- **출력층 (Output Layer)** : 최종 결과 출력
- **활성화 함수 (Activation Function)** : 비선형성을 도입하여 복잡한 패턴 학습 가능
    
#### 주요 활성화 함수
- **ReLU** : 빠르고 단순한 비선형 변환
- **Sigmoid** : 확률적 출력, 이진 분류에 사용
- **Softmax** : 다중 분류 문제에서 확률 분포 출력
    
#### 활성화 함수의 역할
- 비선형성을 부여하여 복잡한 데이터 구조 학습 가능  
- 활성화 함수가 없으면 모든 층이 선형 변환만 수행 → 표현력 한계 발생

### 3-4. 학습 과정

딥러닝 모델의 학습은 **순전파(Forward Propagation)** → **손실 계산(Loss Function)** → **역전파(Backpropagation)** 의 순서로 진행된다.

- **순전파 (Forward)**
	- 입력 데이터를 각 층으로 전달
	- 가중치와 활성화 함수로 출력 계산
- **손실 함수 (Loss)**
	- 예측값과 실제값의 차이 계산
	- 모델 성능 평가
- **역전파 (Backward)**
	- 손실을 기준으로 가중치 업데이트
	- 경사하강법(Gradient Descent) 사용

#### 대표 손실 함수
- **MSE (Mean Squared Error)** : 회귀 문제
- **Cross Entropy** : 분류 문제

### 3-5. 과적합과 일반화

적절한 학습은 과적합과 과소적합 사이의 균형점에서 이루어진다.
- **과적합 (Overfitting)** : 학습 데이터에는 잘 맞지만 새로운 데이터에는 성능 저하
- **과소적합 (Underfitting)** : 학습이 충분히 되지 않아 단순한 패턴만 학습
- **일반화 (Generalization)** : 새로운 데이터에도 일정 수준의 성능 유지

## 4. 인공지능의 종류
	
### 4-1. 기능에 따른 인공지능의 종류

근본적으로 **회귀(Regression)**와 **분류(Classification)**라는 두 가지 기본 문제로 나뉜다.

#### **회귀(Regression)**
- 연속적인 값을 예측하는 문제
- 특정 입력에 대해 연속적인 숫자 값을 반환
- ex1) 주가 예측: 미래의 특정 시점 주가(연속적인 값)를 예측
- ex2) 날씨 예측: 미래의 온도, 강수량 등을 예측
    
#### **분류(Classification)**
- 입력 데이터를 분석하여 미리 정의된 카테고리(클래스)를 예측하는 문제
- ex1) 이메일 스팸 필터링: 이메일을 '스팸' 혹은 '일반'으로 분류
- ex2) 의료 진단: 데이터를 통해 환자가 '암 환자'인지 '정상'인지 분류
    
#### **기본 개념의 확장**

- 텍스트 생성 (Text Generation)
	- 분류의 확장으로 볼 수 있습니다.
	- 다음에 올 단어를 사전에 있는 수만 개의 단어 중 하나로 '분류'하는 과정을 반복하여 문장을 생성합니다.
- 이미지 생성 (Image Generation)
	- 회귀의 확장으로 볼 수 있습니다.
	- 각 픽셀의 RGB 값(연속적인 숫자 값)을 '예측'하여 이미지를 만들어냅니다.
        
#### **회귀와 분류의 결합 (=자율주행)**

- 자율주행은 도로 위의 객체(보행자, 차량, 신호등)를 인식하고 (분류), 동시에 해당 객체의 위치나 속도(연속값)를 예측한다 (회귀).

### 4-2. 목적에 따른 인공지능 분류

- **자동화** : 반복적이거나 복잡한 작업을 자동화하여 효율성 극대화.
	- 예) 스마트 팩토리, 자율주행, 물류 최적화
- **의사결정** : 복잡한 데이터를 분석하여 인간보다 더 나은 결정을 내리도록 도움.
	- 예) 금융 리스크 관리, 의료 진단, 마케팅 전략
- **작업 보조** : 주로 생성형 AI가 인간의 창의적 작업을 보조하거나 협업.
	- 예) 이미지/음악 생성, 자동 기사 작성
- **개인화** : 사용자 데이터를 분석하여 맞춤형 경험 제공.
	- 예) 콘텐츠 추천 시스팀, 맞춤형 학습 경로 제공

### 4-3. 데이터에 따른 분류

- **컴퓨터 비전(Computer Vision, CV)**
	- 이미지와 영상을 분석하고 해석
	- 예) 객체 탐지, 이미지 분류, 얼굴 인식, 자율주행차의 시각 시스템
- **자연어 처리(Natural Language Processing, NLP)** 
	- 텍스트와 음성 데이터를 처리하여 인간의 언어를 이해하고 생성하는 분야
    - 예) 챗봇, 기계 번역, 검색 엔진, 감성 분석
- **신호 처리(Signal Processing)**
	- 음성, 전자기파 등 다양한 물리적 신호를 분석하고 유의미한 정보로 변환하는 분야
    - 예) 음성 인식, 센서 데이터 분석, 전파 망원경 등의 신호 기반 이미지 처리 

## 5. 인공지능의 한계

### 5-1. 미해결 문제

- **일반 인공지능(AGI)의 부재**
	- 현재 AI는 특정 작업만 잘하는 **특정 인공지능(ANI)**이고 사람처럼 여러 작업을 전반적으로 수행하고 추론하는 **일반 인공지능(AGI)**은 아직 개발되지 않음.
- **창의적 사고와 감정 이해 부족**
	- AI는 데이터의 패턴을 학습할 뿐, 진정한 의미의 창의성이나 감정을 이해하는 능력은 없다.
	- 생성형 AI도 기존 패턴을 정교하게 모방하고 조합하는 것이지, 완전히 새로운 패턴을 창조하는 것은 아니다.
- **학습의 어려움**
	-  파국적 망각(Catastrophic Forgetting): 새로운 데이터를 학습할 때 기존에 학습한 지식을 잊어버리는 문제.
	- 자기 학습의 한계: AI가 스스로 생성한 데이터로 다시 학습하면, 편향성이 증폭되거나 데이터 다양성이 감소하는 문제가 발생한다.

### 5-2. 윤리적 문제

- **설명 가능한 AI (XAI)의 필요성**
	- AI의 결정 과정을 사람이 이해하기 어려운 '블랙박스' 문제가 있다.
	- AI가 왜 그런 결정을 내렸는지 설명하지 못하면(예: 대출 거절, 질병 진단) 그 결과를 신뢰하기 어렵다.
- **책임 소재의 불명확성**
	- 자율주행차가 사고를 냈을 때, 그 책임이 차량 제조사, AI 개발자, AI 모델 중 누구에게 있는지 법적/윤리적 기준이 모호하다.
- **AI의 사회적 영향력**
	- AI가 공공 정책이나 법적 결정에 활용될 때, 그 과정이 투명하지 않으면 사회적 불평등을 악화시킬 수 있다.

### 5-3. 데이터 편향 문제

AI는 데이터를 기반으로 학습하므로, **편향된 데이터는 편향된 AI를 만듦**
- **훈련 데이터의 편향성**
	- 데이터 수집 과정에서 생긴 인종, 성별, 나이 등에 대한 편향이 AI 모델에 그대로 학습된다.
	- 결과: 고용, 대출 심사, 범죄 예측 등에서 특정 집단에 불리한 차별적인 결정을 내릴 수 있다.
- **데이터 불균형**
	- 특정 그룹(예: 특정 인종의 의료 데이터)의 데이터가 충분하지 않으면, AI는 해당 그룹에 대한 예측 정확도가 현저히 떨어진다.
- **실제 세계 반영의 한계**
	- 데이터는 실제 세계를 온전히 반영하지 못하다. (예: 미세먼지 농도는 소수의 특정 위치에서만 측정됨) 이를 학습한 AI의 예측 결과 역시 실제와 차이가 있을 수 있다.