## ♥︎ MongoDB
- 문서 기반의 NoSQL DB
- JSON/BSON 형식의 동적인 문서 사용 (JSON이라는 구조만 있고 데이터의 구조와과 형태가 정해지지 않음) ➡️ 유연성 확장성

1. **문서 기반 데이터베이스**
    - MongoDB는 데이터를 문서(Document)라는 단위로 저장<br>
    각 문서는 키-값으로 이루어진 BSON(Binary JSON)으로 표현되며, 여러 문서가 컬렉션(Collection)에 저장
        - 컬렉션은 테이블, 각 문서는 행데이터로 매칭<br>
2. **유연한 스키마**
    - MongoDB는 동적 스키마(Dynamic Schema)를 사용하므로, 각 문서가 다른 구조를 가질 수 있고 필드를 동적으로 변경할 수 있어 데이터 모델의 변경이 유연함<br>
3. **BSON 형식**
    - JSON과 유사한 문서 구조이지만 내부적으로 이진(바이너리) 데이터인 BSON형식으로 저장
    - BSON은 이진 형식이므로 직렬화 및 역직렬화가 JSON보다 빨라서 DB 입출력이 효율적으로 처리되기 때문에 이는 대용량 데이터 처리 및 전송에서 성능 향상
        **JSON**
        ```json
        {
          "name": "John",
          "age": 30,
          "city": "New York"
        }

        ```
      <br>

        **BSON**

        ```arduino
        \x16\x00\x00\x00          // 전체 크기
        \x02                       // 문자열 타입
        name\x00                   // 필드 이름
        \x00                       // 마지막
        ```
<br>

4. **높은 확장성**
    - MongoDB는 수평적 확장이 가능
        - 수평적 확장은 데이터의 파티셔닝이나 샤딩Sharding 같은 기술을 요구 -> 구현 및 관리 복잡
        - MongoDB는 처음부터 수평적 확장을 염두에 두고 설계되어 데이터를 자동으로 분산 및 관리하는 기능을 내장해서 비교적 쉽게 커맨드로 구현가능
    - 여러 서버에 데이터를 분산하고 데이터베이스의 용량을 증가시킬 수 있어 대규모 애플리케이션에 적합<br>
5. **인덱싱과 검색 기능**
    - MongoDB는 인덱싱을 지원하여 데이터의 검색 속도를 향상
    - 다양한 쿼리와 검색 연산자를 활용하여 유연한 데이터 검색이 가능합니다.<Br>
6. **자동 샤딩(Sharding)**
    - 대용량의 데이터를 처리하기 위해 자동 샤딩 기능을 제공
    - 샤딩(Sharding) : 라우터를 사용해 DB를 분산화(파편화)
    - **Increased read/write throughput**
        - 데이터를 여러 샤드에 분산시켜 병렬로 작업을 수행하므로 읽기/쓰기 처리량이 증가하며, 각 샤드 추가는 처리량을 선형적으로 확장(하나의 샤드가 초당 1,000개의 작업을 처리할 수 있다면, 추가 샤드도 처리량을 1,000개씩 처리)
    - **Data Locality**
        - Zone Sharding을 통해 지리적으로 분산된 애플리케이션을 지원하고, 데이터의 저장 위치를 특정 지역에 강제화하여 데이터의 지역성을 제어

RDBMS : Database > Table > Row (culumns)<br>
MongoDB : Database > Collection > Document (fields)
> Database는 독립적이고 일반적으로 관련 데이터를 그룹화하는데 사용<br>
Collection 동적 스키마를 허용해서 유연한 구조<br>
Document는 JSON형태로 키-값 쌍, 필드가 동적<br>

<br>
RDBMS는 주로 수직적 확장이 일반적이고, 서버의 성능을 업그레이드하는 방식으로 확장하는데에 반해<br>
MongoDB는 수평적 확장으로 여러 서버에 데이터를 분산하여 대용량 데이터를 처리<br><br>
RDBMS는 엄격한 테이블 구조와 SQL 쿼리 언어를 사용 -> 복잡한 쿼리와 관계가 필요할 경우 사용
MongoDB는 유연한 스키마와 JSON스타일 문서를 사용 -> 비정형 데이터와 빠른 개발이 필요할 경우

## ♥︎ MongoDB 설정
DB 시작<br>
brew services start mongodb-community@7.0<br>
<br>
DB 종료<br>
brew services stop mongodb-community@7.0<br>
<br>
연결 URI<br>
mongodb://localhost

## ♥︎ MongoDB 명령어

#### DB
1. **데이터베이스 (없으면)생성 또는 전환**<br>
    ```use [데이터베이스 이름]```<br><br>
2. **현재 데이터베이스 확인**<br>
    ```db```<br><br>
3. **데이터베이스 목록 조회**<br>
    ```show dbs```<br><br>
4. **현재 데이터베이스 삭제**<br>
    ```db.dropDatabase()```<br><br>
5. **현재 데이터베이스 상태 확인(통계 정보)**<br>
    ```db.stats()```<br><br><br>



#### Collection
1. **컬렉션 생성**
    - 생성
    ```db.createCollection("users", { capped: false })```<br>
    'users'라는 이름의 새로운 컬렉션을 생성, capped 옵션은 용량 제한이 있는지 여부를 결정<br><br>

    - size 설정
    ```db.createCollection("log", { capped: true, size: 100000 })```<br>
    size는 컬렉션의 최대 크기 바이트로, 컬렉션의 크기가 100,000바이트를 초과하면, 가장 오래된 문서부터 새 문서로 대체<br><br>

    - 문서 유효성 검사가 있는 컬렉션 생성<br>
    - JSON 스키마를 사용하여 유효성 검사를 적용(phone필드가 필수, email필드는 특정 패턴)
    ```
    db.createCollection("contacts", {
        validator: {
            $jsonSchema: {
                bsonType: "object",
                required: ["phone"],
                properties: {
                    phone: {
                        bsonType: "string",
                        description: "must be a string and is required"
                    },
                    email: {
                        bsonType: "string",
                        pattern: "@mongodb\.com$",
                        description: "must be a string and match the regular expression pattern"
                    }
                }
            }
        }
    })
    ```

   <br>

    - 특정 스토리지 엔진 옵션을 사용하는 컬렉션 생성
    - 'myData'컬렉션 - WiredTiger 스토리지 엔진 + zlib 로 데이터 압축
        - storageEngine 옵션들
            1. **WiredTiger**: MongoDB 3.2 버전부터 기본 스토리지 엔진
            2. **In-Memory Storage Engine**:
                - 데이터를 메모리 내에서만 관리하는 엔진 -> 인메모리 방신은 'redis'를 주로 사용
                - 높은 처리 속도와 낮은 지연 시간이 필요한 애플리케이션에 적합(캐시, 실시간 데이터 분석, 로그)
            3. **MMAPv1**: MongoDB 3.0 버전 이전의 기본 스토리지 엔진, 추후 버전에서는 지원이 중단될 예정
            4. **RocksDB** (써드파티):
                - Facebook에서 개발한 Key-Value 스토어 기반의 스토리지 엔진 -> 키값쌍도 'redis'를 주로 사용
                - 고성능 쓰기 작업과 효율적인 스토리지 사용이 특징
                - 일부 MongoDB 배포판에서 선택적으로 사용<br><br>
    ```
    db.createCollection("myData", {
        storageEngine: {
            wiredTiger: {
                configString: "block_compressor=zlib"
            }
        }
    })
    ```
   <br>
2. **컬렉션 목록 조회**<br>```show collections    # 현재 DB의 모든 컬렉션 목록 표시```
3. **컬렉션 이름 변경**<br>```db.users.renameCollection("customers")    # 'user' > 'customers'```
4. **컬렉션 삭제**<br>```db.customers.drop()    # 'customers' 삭제    ```

## ♥︎ 연산자
#### 비교문법
" 필드 : { 조건 } " -> 조건에 비교 연산자 사용
```
EQual / Not Equal
$eq   / $ne: "pending"
age : 20 -> eq 연산자를 사용 안하기도 함

Greater Than / Less Than / Greater Than or Equal To / Less Than or Equal To
$gt          / $lt       / $gte                     / $lte: 500

In                      /Not In
$in: ["전자제품", "의류"]  /$nin
```
#### 논리연산
논리 연산자는 사용 형태에 주의!
```
And  / Or                                                                           /Not Or(모두 거짓)
$and / { $or: [ { status: "active" }, { type: "admin" } ] } -> 여러 필드를 조건에 걸음    /$nor
name:'name', gender:'F' -> and 연산자를 사용 안하기도 함

Not
{ price: { $not: { $gt: 1000 } } } -> 연산자 안에 연산자 적용
```
#### 그 외
```
$exists : 데이터의 유무
$type : 데이터의 타입을 확인
```

## ♥︎ MongoDB Aggregation 문법
MongoDB의 'Aggregation Framework'는 복잡한 데이터 처리 및 분석 작업을 위해 설계된 기능<br>
-> 데이터를 변환, 결합, 계산<br>
-> 핵심 개념은 Aggregation Pipeline<br><br>

'Aggregation Pipeline' : 여러 단계(stage)를 통해 데이터 처리, 여러 document들을 grouping하여 연산을 수행해 하나의 result 반환<br>
'Stages' : 각 단계는 특정 연산을 수행, 필터링(`$`match), 정렬(`$`sort), 그룹화(`$`group), 프로젝션(`$`project)<br>
'Pipeline Operators' : 각 단계에서 사용되는 연산자, `$`sum, `$`avg, `$`min, `$`max, `$`group, `$`sort<br><br>

```
db.orders.aggregate([
    { $match: {status: "A" } },     -> $match : 데이터 필터링
    { $group: { _id: "cust_id",total: {$sum: "$amount" } } }    -> $group : 데이터를 그룹화하고 집계
] )

db.users.aggregate([
    { $group: { _id: null, averageAge: { $avg: "$age" } } } -> _id:null로 그룹(null이기 때문에 전체를 그룹화)
]);
```
`$`project : 특정 필드를 선택하거나 새로운 필드를 생성 {"_id": 0, "title": 1, "author": 1}<br>
`$`sort : 결과를 정렬 (1:오름차순, -1:내림차순) { $sort : { 필드 : 1 } }<br>
`$`limit : 결과의 개수를 제한<br>
`$`skip : 특정 개수의 문서를 건너뜀<br>
`$`unwind : 배열 필드를 개별 문서로 분리<br>
`$`lookup : 다른 컬렉션과의 조인을 수행

#### Document<br>
## ♥︎ CRUD
#### Create
// 단일 문서 삽입<br>
db.users.insertOne({ name: "Alice", age: 30, address: "123 Maple St" })<br>

// 여러 문서 삽입<br>
```
db.users.insertMany([
    { name: "Bob", age: 25, address: "456 Oak St" },
    { name: "Charlie", age: 35, address: "789 Pine St" }
])
```

<br>

#### Read
// 모든 문서 조회<br>
db.users.find()<br>

// 특정 필드 조회<br>
db.users.find({}, { name: 1, address: 1 }) -> 앞의 괄호는 조건, 1인 필드만 보여준다.<br>

// 조건에 맞는 문서 조회<br>
db.users.find({ address: "서울" })<br>

<br>

#### Update
// 특정 문서 업데이트<br>
db.users.updateOne({ name: "Alice" }, { $set: { age: 31 } })

// 여러 문서 업데이트<br>
db.users.updateMany({ address: "서울" }, { $set: { address: "부산" } })<br>

<br>

#### Delete
// 특정 문서 삭제<br>
db.users.deleteOne({ name: "Alice" })<br>

// 조건에 맞는 여러 문서 삭제<br>
db.users.deleteMany({ address: "부산" })

## ♥︎ Python으로 MongoDB다루기
'$'를 사용하는 연산자를 MongoDB에서 쓸때는 문자열로 감싸야해서 " "로 감싸 키형태로 만들어야 한다
JSON / BSON을 사용하기 때문에!

In [3]:
from pymongo import MongoClient

# MongoDB 인스턴스에 연결
# MongoDB의 client는 Python프로그램이 종료되면 자동으로 정리되어서 client.close()를 생략해도 문제가 없지만 장기 실행 앱/서버는 명시적으로 닫는 것을 권장함
client = MongoClient('mongodb://localhost:27017/')
# client = MongoClient('mongodb://username:password@localhost:27017/')

# 데이터베이스 선택 (없으면 자동 생s성)
db = client['example_db']

# 콜렉션 선택 (없으면 자동 생성)
collection = db['example_collection']

In [4]:
# 새 문서 삽입
example_document = {"name": "John", "age": 30, "city": "New York"}
collection.insert_one(example_document)

InsertOneResult(ObjectId('6833f80ebee0d5ef2c5cc0fb'), acknowledged=True)

In [7]:
# 모든 문서 조회
for doc in collection.find():
    print(doc)

# 조건에 맞는 문서 조회
query = {"name": "John"}
for doc in collection.find(query):
    print(doc)

query={"genre":"fantasy"}
projection={"title":1,"author":1}
for doc in collection.find(query,projection):
    print(doc)

# MongoDB Aggregation
# 그룹화
for doc in collection.aggregate([{"$group":{"_id":"$director","total":{"$avg":"$rating"}}}]):
    print(doc)
# 정렬, 리미트
for doc in collection.find(query).sort("timestamp",1).limit(5):
        print(doc)

{'_id': ObjectId('6833f80ebee0d5ef2c5cc0fb'), 'name': 'John', 'age': 32, 'city': 'New York'}
{'_id': ObjectId('6833f80ebee0d5ef2c5cc0fb'), 'name': 'John', 'age': 32, 'city': 'New York'}


In [6]:
# 하나의 문서 업데이트
collection.update_one({"name": "John"}, {"$set": {"age": 31}})

# 여러 문서 업데이트
collection.update_many({"name": "John"}, {"$set": {"age": 32}})

UpdateResult({'n': 1, 'nModified': 1, 'ok': 1.0, 'updatedExisting': True}, acknowledged=True)

In [8]:
# 하나의 문서 삭제
collection.delete_one({"name": "John"})

# 여러 문서 삭제
collection.delete_many({"name": "John"})

DeleteResult({'n': 0, 'ok': 1.0}, acknowledged=True)

In [9]:
# 콜렉션 삭제
db.drop_collection("example_collection")

# 데이터베이스 삭제
client.drop_database("example_db")