### 데이터 인덱싱

- Elasticsearch에서 데이터 인덱싱은 데이터를 검색 가능한 형태로 저장하는 과정입니다. 
- 이 과정은 데이터를 Elasticsearch에 저장하기 전에 중요한 단계로, 효율적인 검색과 분석을 위해 필수적입니다.

1. 인덱싱의 기본 개념
- 인덱스(Index): Elasticsearch에서 데이터를 저장하는 최상위 구조입니다. 관계형 데이터베이스의 '테이블'과 유사합니다.
- 문서(Document): 인덱스 내에 저장되는 개별 데이터 항목입니다. JSON 형식을 사용하며, 관계형 데이터베이스의 '행(row)'에 해당합니다.
- 필드(Field): 문서 내의 각 데이터 요소입니다. 각 필드에는 데이터 타입이 지정되어 있습니다.

#### 실습: 인덱스 생성 및 매핑 설정
a. 인덱스 생성
- 인덱스를 생성할 때 기본 설정을 지정할 수 있습니다.

예시: my_index라는 이름의 인덱스 생성
```json
PUT /my_index
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  }
}
``````
b. 매핑(Mapping) 정의
- 매핑은 인덱스에 저장될 문서의 구조를 정의합니다. 
- 이는 각 필드의 데이터 타입과 추가적인 설정을 포함합니다.

예시: my_index 인덱스에 대한 매핑 정의
```json
PUT /my_index/_mapping
{
  "properties": {
    "name": {
      "type": "text"
    },
    "age": {
      "type": "integer"
    },
    "email": {
      "type": "keyword"
    }
  }
}
``````
c. 데이터 색인하기
- 데이터를 색인하는 것은 해당 데이터를 Elasticsearch에 저장하는 과정입니다. 
- 색인된 데이터는 검색 및 분석에 사용됩니다.

예시: my_index 인덱스에 문서 색인
```json
POST /my_index/_doc
{
  "name": "John Doe",
  "age": 30,
  "email": "john@example.com"
}
````

1. 인덱스 관리
- 인덱스 설정 변경: 이미 생성된 인덱스의 설정을 변경할 수 있습니다.
- 매핑 업데이트: 새로운 필드를 추가하거나, 기존 필드의 설정을 변경할 수 있습니다. 이미 색인된 데이터에 대한 필드 타입은 변경할 수 없습니다.
1. 인덱싱의 중요성
- 검색 성능: 적절한 매핑과 인덱싱 전략은 검색 성능에 큰 영향을 미칩니다.
- 데이터 분석: 데이터 구조와 타입이 명확하면, 효율적인 데이터 분석과 집계가 가능합니다.
- 스케일링: 데이터가 증가함에 따라, 샤딩과 복제를 통해 인덱스를 확장할 수 있습니다.
1. 고급 인덱싱 기법
- 동적 매핑(Dynamic Mapping): Elasticsearch는 문서가 색인될 때 필드 타입을 자동으로 감지하고 매핑을 생성할 수 있습니다.
- 커스텀 분석기(Custom Analyzers): 텍스트 필드의 색인 방식을 세밀하게 제어할 수 있습니다. 예를 들어, 토크나이저(tokenizer)와 토큰 필터(token filter)를 사용하여 텍스트 분석을 커스터마이즈할 수 있습니다.

인덱싱은 Elasticsearch를 사용하는 데 있어 매우 중요한 부분입니다. 데이터의 구조와 쿼리의 요구사항에 맞추어 적절한 인덱싱 전략을 수립하는 것이 중요합니다.