# Introduction to ML Strategy

## Why ML Strategy

고양이 분류 프로젝트에서 90%의 정확도를 달성했지만 충분하지 않다면, 성능 향상을 위한 다양한 방법들을 고려해볼 수 있습니다. 예를 들어, 더 많은 데이터를 수집하거나, 다양한 각도의 고양이 사진이나 다양한 음성 예제를 수집하는 것, 그래디언트 디센트로 더 오랜 시간 학습시키는 것, 다른 최적화 알고리즘을 시도하는 것, 더 큰 네트워크나 작은 네트워크를 시도하는 것, 드롭아웃이나 L2 정규화를 사용하는 것 등 많은 방법이 있습니다. 그러나 잘못된 선택을 하면, 예를 들어 6개월 동안 데이터를 수집하는 데 시간을 투자하고, 그 결과로 성능 향상을 보지 못하는 등의 문제가 발생할 수 있습니다. 이 수업에서는 기계 학습 문제를 분석하여 가장 유망한 방법을 찾아내는 전략들을 배울 것입니다.

## Orthogonalization

머신러닝 시스템을 개발하는 중, 다양한 요소들을 변경하고 시도해볼 수 있습니다. 중요한 것은 어떤 요소를 조절해야 특정 결과를 얻을 수 있는지 명확하게 알아내는 것입니다. 이를 '직교화(orthogonalization)'라고 합니다.

예를 들면, 오래된 TV에는 화면을 조절하기 위한 여러 다이얼(혹은 노브)이 있습니다. TV의 화면 높이를 조절하는 다이얼, 화면 너비를 조절하는 다이얼, 화면 위치를 조절하는 다이얼 등 각 다이얼은 명확한 기능을 가지고 있습니다. TV 제조자들은 이러한 다이얼이 각자의 기능만을 조절할 수 있도록 설계했습니다. 만약 한 다이얼이 화면의 높이와 너비, 위치 등 여러 가지를 동시에 조절한다면, 사용자는 원하는 화면 설정을 얻기 위해 여러 다이얼을 동시에 조절해야 할 것입니다.

자동차의 운전을 생각해보면, 핸들은 좌우 방향을, 액셀은 속도를, 브레이크는 정지를 위한 것입니다. 만약 이 조작들이 섞여 있다면, 운전하기가 매우 복잡해질 것입니다. 이처럼, 특정 기능을 제어하는 '노브'는 그 기능만을 담당하도록 설계되어야 합니다. 

머신러닝에서도 이런 원칙이 적용됩니다. 지도학습 시스템을 개선하기 위해 우리는 특정 '노브'를 조절해야 합니다. 예를 들어, 학습 세트에 대한 성능이 만족스럽지 않다면, 신경망의 크기를 조절하거나 다른 최적화 알고리즘을 사용하는 것이 좋습니다. 반면, 개발 세트에 대한 성능이 만족스럽지 않을 경우, 정규화와 같은 다른 '노브'를 조절해야 합니다.

요약하자면, 머신러닝에서 중요한 것은 어떤 문제가 발생했을 때 그 문제를 해결하기 위한 구체적인 '노브'를 알고, 그것만을 조절하는 것입니다. 이렇게 하면 머신러닝 시스템의 성능을 효율적으로 최적화할 수 있습니다.

# Setting your goal


1. **Dev 및 Test 세트의 중요성**:
   - Dev 세트는 새로운 아이디어와 모델을 실험하고 최적화하는 데 사용됩니다.
   - 팀은 Dev 세트를 활용하여 여러 아이디어를 평가하고 최종 모델을 선택한 뒤 이를 Test 세트에서 평가합니다.

2. **데이터 분포의 일치**:
   - Dev 및 Test 세트는 동일한 데이터 분포에서 가져와야 합니다. 미래 데이터를 잘 대표하도록 고려해야 합니다.
   - 예를 들어, 다양한 지역에서 데이터를 수집하는 경우, Dev 및 Test 세트는 모든 지역의 데이터를 골고루 포함해야 합니다.

3. **Dev 및 Test 세트 크기**:
   - 큰 데이터셋에서는 Dev 및 Test 세트 크기를 줄일 수 있습니다. 수천 개의 예제가 충분할 수 있습니다.
   - Test 세트의 크기는 최종 시스템 성능을 높은 신뢰도로 평가하기 위한 것이며, 이를 위해서 많은 양의 데이터가 필요하지 않을 수 있습니다.

4. **메트릭 및 데이터 조정**:
   - 평가 메트릭이나 Dev/Test 세트를 조정할 때, 실제 응용 프로그램 요구 사항을 반영하는 새로운 메트릭을 정의해야 합니다.
   - 예를 들어, 알고리즘의 성능을 정확히 측정하기 위해 메트릭에 가중치를 적용할 수 있습니다.

5. **정확한 목표 설정**:
   - Dev 및 Test 세트를 설정하면 팀은 개발 및 평가 목표를 설정한 것과 같으며, 이를 통해 팀은 빠르게 실험하고 모델을 개선할 수 있습니다.
   - 메트릭과 데이터를 빠르게 설정하여 팀의 효율성을 향상시킵니다.


# Comparing to Human-level Performance

**1. 인간 수준의 성능과 베이즈 오류의 추정**
- "인간 수준의 성능"은 머신 러닝 모델의 성능을 평가하는 데 중요한 역할을 합니다.
- 이 용어는 주로 베이즈 오류의 추정치로 사용됩니다. 베이즈 오류는 어떤 함수가 특정 작업에서 얻을 수 있는 최상의 성능을 나타냅니다.

**2. 인간 수준의 오류 추정 방법**
- 인간 수준의 성능을 추정할 때 여러 가지 방법을 사용할 수 있습니다.
- 예를 들어, 의료 영상 분류 작업에서는 의사들의 성능을 측정하고 이를 인간 수준의 성능으로 사용합니다.

**3. 인간 수준의 성능을 베이즈 오류의 근사치로 활용**
- 인간 수준의 성능은 베이즈 오류의 추정치로 활용됩니다. 인간이 얼마나 잘 수행하는지는 문제의 베이즈 오류를 대략적으로 나타내는 지표로 사용됩니다.

**4. 편향과 분산 관점에서의 접근**
- 편향과 분산을 이해하고 이를 기반으로 모델의 성능을 향상시키는 전략을 수립합니다.
- 편향을 줄이기 위한 전략과 분산을 줄이기 위한 전략은 별도로 고려되어야 합니다.

**5. 인간 수준의 성능을 베이즈 오류의 근사치로 사용하는 이유**
- 인간 수준의 성능을 베이즈 오류의 근사치로 사용함으로써, 모델의 성능 향상 방향을 명확하게 결정할 수 있습니다.
- 특히, 인간의 성능이 베이즈 오류에 근접한 경우, 편향과 분산 간의 균형을 조절하는 데 도움이 됩니다.
