# MongoDB 체험하기.

## 첫번째로 해볼 작업

1. DB 접속
   - `use myDatabase`
2. 정보 저장
   - `db.initialCollection.insertOne({hello: "world"})`
3. 정보 확인
   - `db.initialCollection.find()`

## 데이터베이스계의 이단아 NoSQL

- NoSQL의 특징을 담고 있는 MongoDB
  - 질의 명령어가 SQL이 아니다
  - 정보의 형식을 미리 정하지 않는다.

### NoSQL DBMS란

- NoSQL
  - Not Only SQL
    - 전통적인 관계형 데이터베이스 보다 덜 제한적인 일관성 모델을 제공하는 DB
- DBMS
  - Database Management System
    - 데이터를 저장하고 관리하는 시스템
    - 실생활에 간략하게 DB라고 부른다.

- 특징
  - 기존 RDBMS가 일관성 모델 때문에 가질 수 없었던 확장성, 유연성, 고성능, 고기능성을 확보함

### NoSQL SBMS의 유행 배경

- ACID원칙을 준수
- 2차원의 테이블 형태
- SQL을 통한 질의

- 서버에 요구되는 정보 처리량의 급속한 증가. 정보 처리량을 늘리려면 규칙을 깨야 한다.

- 안정성에 중점을 둔 RDBMS
  - 범용적으로 활용 가능한 RDBMS
- 확장성과 성능 최적화에 특화된 NoSQL
  - 각각의 기능에 특화된 NoSQL
    - mongoDB
      - 범용적 활용
    - redis
      - 캐싱, logging 특화
    - elasticsearch
      - 전문 검색 특화

## MongoDB 소개 및 분산 컴퓨팅

### MongoDB의 인기

- MongoDB는 가장 유명한 NoSQL DBMS 이다

- 왜 MongkDB는 배우고 싶은 기술일까?
  - 현대적 설계로 고성능을 내면서 동시에 많은 기능과 안정화가 이루어진 다목적 DB

### MongoDB의 현대적 설계

과거에는 하나의 DBMS로 처리하는 상황이 빈번했다, 기존 RDBMS는 하나의 인스턴스에서 작동하는 것이 기본값

요즘은 처리할 데이터량이 많아서 분산 컴퓨팅이 빈번하다. 현대적 DBMS는 분산 컴퓨팅을 하는 것이 기본값

MongoDB에서 지원하는 분산 컴퓨팅은 무엇이 있을까?
- 복제
  - 정보를 복사하여 저장하는 방식
    - 안정성을 높이기 위한 방식, 원본 서버가 망가져도 정상 서비스 가능
- 샤딩
  - 정보를 나누어 저장하는 방식
    - 성능을 향상하기 위한 방식. 읽기, 쓰기 성능 향상 가능

### 분산 컴퓨팅 관련 MongoDB 주의점

단일 인스턴스 DBMS에서 만약 쓰기 작업을 하다가 서버가 갑자기 꺼진다면?

- MongoDB:
  - 데이터가 의도치 않게 중간 상태로 저장될 수 있다.
- MySQL:
  - 데이터가 항상 저장 완료하거나, 저장 실패한 상태로만 존재

- WHY
  - MongoDB는 분산 컴퓨팅을 하는 것을 가정하고 쓰기 기본 설정이 되어 있다.
  - Write-Concern, Read-Concern 설정을 알아야 제대로 사용 가능하다.

## JS 친화적 MongoDB

### 고급 기능 내장의 문제점

분산 컴퓨팅 기본값 설정의 문제점

입문이 너무 어렵다!!

- 쓰기 설정?, 샤딩?, 복제?, ACID?, 분산 컴퓨팅?

### 입문자를 위한 JS 채택

- V8엔진의 성능향상으로 인한 웹 개발자의 대규모 업종전환 
- MongoDB도 이런 대세를 활용하여 SQL을 몰라도 개발 가능한 V8엔진의 JS 기반 쉬운 DMBS를 표방함

### JSON과 비슷한 BSON 자료구조

- BSON
```json
{
    "name": "sue",
    "arg": "26",
    "status": "A",
    "groups": ["news", "sports"]
}
```

### 스키마가 없는 방식

- 테이블 구조를 먼저 만들고, 데이터를 넣는다
- 데이터를 넣고, 그에 맞는 테이블을 구성한다.

### 정리하기

- MongoDB가 JS를 사용해서 얻는 특징
  1. 웹 개발자에게 쉬운 입문이 가능하다
  2. BSON 자료형 사용
  3. 내부 명령어를 JS형식으로 사용

## MongoDB 활용

### MongoDB가 대체 가능한 기능

- MongoDB는 범용적인 DBMS로 활용 가능하다.
  - 단 일반적인 상황에서 활용하기에는 무리가 있다.
  - 개발된지 10년 된 기술, 어느정도 안정성이 갖춰짐

- 다른 RDBMS
  - 적어도 25년간은 유지보수된 기능
  - 다양한 개발자와 관련 문서

### MongoDB의 특장점

1. JS에 친화적이다.
2. 성능 확장이 쉽다
3. 높은 성능을 낼 수 있다
4. 유연한 구조로 저장할 수 있다.
5. 다양한 자료형을 지원한다.

### JS기반 프로젝트

- 프로젝트 언어를 JS로 통일시키고자 할 때
  - 전보 변환 없이 전달 가능

- 기존의 JSON 방식의 DB에서 좀 더 많은 기능과 성능이 필요할 때

### 저장할 정보의 형태가 자주 변경되는 경우

- 파일럿 프로젝트
  - 앞으로 몇 명이 이용할지 예측이 안되는 프로젝트
  - 한참 개발 중이고 상황에 따라 데이터 구조가 쉽게 바뀔 수 있는 신규 프로젝트

- 비 정형화된 정보를 전산화
  - 각종 예외사항이 적혀 있는 수기로 작성된 과거의 주문 정보
  - 로그 데이터 형식의 정보를 저장할 때
  - 정보를 정형화하기에 어려운 경우

- 안정성보다 높은 성능이 필요한 경우
  - NoSQL이 기존 DBMS보다 수십배는 더 높은 성능을 가짐

### 그렇다면 활용하면 안되는 경우는 언제 일까?

- 높은 성능보다 안정성, 무결성이 중요한 경우
  - 결제 시스템, 예약 시스템, 데이터 무결성이 중요한 경우

- 복잡한 쿼리가 빈번한 경우
  - JOIN, UNION과 같은 연산능 처리할 때 좀 더 복잡해진다.
  - RDB 와 비교했을 때 없는 함수가 꽤 있다.

# CRUD

## MongoDB의 구조

### 몽고디비 기본 구조

- 데이터베이스
- 컬렉션
- 도큐먼트

### BSON

- JSON과 유사한 BSON구조로 정보를 저장

### Pymongo 소개

```python
import pymongo

connection = pymongo.MongoClient("mongodb://localhost:27017/")
```
pymongo는 mongoDB를 사용할 수 있게 도와주는 파이썬 모듈

### Pymongo로 DB접속

```python
import pymongo
connection = pymongo.MongoClient("mongodb://localhost:27017/")

db = connection.get_database("testDB")
```
- 접속할 데이터베이스로 접근
- 만약 데이터베이스가 없으면 자동으로 생성한 후 접속

### 컬렉션에 도큐먼트 삽입하기

```python
import pymongo
connection = pymongo.MongoClient("mongodb://localhost:27017/")
db = connection.get_database("testDB")
collection = db.get_collection("testCollection")
collection.insert_one({ "hello": "world" })
```
- 컬렉션에 도큐먼트 저장
- 만약 컬렉션이 없다면 자동으로 생성됨

### 데이터베이스, 컬렉션, 도큐먼트 확인하기

```python
# 데이터베이스 목록 조회
print(connection.list_database_names())
# 컬렉션 목록 조회
print(db.list_collection_names())
# pprint로 도큐먼트 목록 조회
pprint(list(collection.find()))
```

- 결과 출력
```
['admin', 'config', 'local', 'testDB']
- 기본 DB들(testDB 제외)
['testCollection]
[[{'_id': ObjectID('...'), 'hello':'world'}]]
```

## BSON 데이터 타입

### BSON 이란?

```json
{
    "name": "karoid",
    "age": 26,
    "status": "B",
    "groups": ["family", "sports"],
}
```
BSON = Binary JSON 의 의미
- JSON의 일부로써 MongoDB 도큐먼트로 데이터를 저장하기 위한 형식

![](image/039_001.png)

- `NULL` : 아무것도 없다
- `Undefined` : 정의 되지 않음

### BSON의 데이터 타입

- Double/Integer : 123.45, 12
- String : "hello"  / 'hello'
- Object : {field: "value"}
- Array : [1, 2, {hi: 'hello'}]
- Boolean : true/false

- Date : ISODate("2017-10-24T05:02:46.395Z")
  - UTC Time
- ObjectId : ObjectId(542c2b97 bac059 5474 108648")
  - (유닉스시간 기기id 프로세스id 카운터)
  - MongoDB에서 각 Document의 primary key의 값으로 사용한다.

## 도큐먼트 생성

### 도큐먼트를 보기 좋게 출력하기

```python
from pprint import pprint
pprint({ BSON document })
```

### 컬렉션에 도큐먼트 삽입하기

```python
import pymongo
connection = pymongo.MongoClient("mongodb://localhost:27017/")
db = connection["testDB"]
collection = db["testCollection"]
collection.insert_one({ "hello": "world" })
```
이전에 잠깐 배웠을 때 insert_one으로 도큐먼트를 생성했었다.

```python
from pprint import pprint
result = collection.insert_one(
    { document }
)
print(result.inserted_id)
pprint(result.inserted_id)
```
- `아이디값`
- `ObjectId(아이디값)`

### 컬렉션에 다수의 도큐먼트 삽입하기

```python
result = collection.insert_many(
    [{ document }, { document }, ... ] 
)
print(result.inserted_ids)
```
- `[ObjectId(아이디값), ObjectId(아이디값)]`

- 웹 서버
  1. 주어진 정보로 게시글을 insert_one으로 저장
  2. 반환된 ObjectId로 해당 게시글 접속 URL을 생성
  3. URL 반환

만약 게시글을 작성하는 웹 서버를 구현한다고 가정하면 다음과 같은 로직을 만들 수 있다.

## 도큐먼트 검색 기초

```python
import pymongo
from pprint import pprint
connection = pymongo.MongoClient("mongodb://localhost:27017/")
db = connection["testDB"]
collection = db["testCollection"]
collection.insert_one({ "hello": "world" })
print(list(collection.find()))
```

### 컬렉션에서 도큐먼트 검색하기

```python
result = collection.find(
    { query },
    { projection }
)
print(result)
print(list(result))
```
- `<pymongo.cursor.Cursor object at ...>`
- `[ { document }, { document }, ... ]`

find 명령어는 컬렉션 내에 query조건에 맞는 다수의 도큐먼트를 검색한다. 

### 커서란?

- 커서란 쿼리 결과에 대한 포인터 도큐먼트의 위치정보만을 반환하여 작업을 효율적으로 만들어준다.

```python
result = collection.find(
    { query }
)
print(list(result))
for document in result:
    print(document)
```
- `[ { document }, { document }, ... ]`
- `{ document } ...`

### 쿼리란?

- 쿼리란 원하는 정보를 걸러내기 위한 깔때기 이다
- 검색하고자 하는 내용을 쿼리로 표현할 수 있어야 한다.

### 기본 Query

```python
{"field": value, "field": value, ...}
```
Query는 그 field에 맞는 value값으로 필터링 한다.

### find문 예시

```python
users.find(
    {"username": "karoid"}
)
```
- `{"_id" : ObjectId(아이디...), "username" : "karoid", "password" : "1111" }`

### Projection이란?

```python
{"field": boolean, "field": boolean, ...}
```
- Projection은 그 field를 보여줄 지 말지를 알려준다
- boolean이 true이면 해당 field를 표현하고 false면 field를 제외한 결과를 출력한다.

### Projection 예시

```python
users.find(
    { "username" : "karoid" }
    { "username" : True }
)
```
- `{"_id" : ObjectId(아이디...), "username" : "karoid"}`

### Projection의 잘못된 예

```python
users.find(
    { "passwordd" : "1111" }
    { "username" : False, "_id": True }
)
```
- projection 안에 True, False이 동시에 사용하면 에러발생
  - 디폴트 값이 하나가 True 면 나머지 False, False 면 나머지 True이지만 동시에 사용시 나머지 값을 True일지 False일지 판단 불가

## 도큐먼트 수정

### 하나의 도큐먼트를 찾아 수정하기

```python
result = collection.update_one(
    { query },
    { update },
    upsert: Boolean
)
print(result.matched_count)
print(result.modified_count)
```
- `1`
- `1`

query로 검색하고, update에 변경할 사항을 적는다.

### 다수의 도큐먼트를 찾아 수정하기

```python
result = collection.update_many(
    { query },
    { update },
    upsert: Boolean
)
print(result.matched_count)
print(result.modified_count)
```
- `12`
- `5`

query로 검색하고, update에 변경할 사항을 적는다.

### 특정 field 값을 업데이트 하기

```python
result = inventory.update_one(
    { "item" : "canvas" },
    { "$set": {"qty": 10} },
)
```
- `{ item: "canvas", qty: 100, size, ...}`
- `{ item: "canvas", qty: 10, size, ...}`


### 특정 field 값을 제거 하기

```python
result = inventory.update_one(
    { "item" : "canvas" },
    { "$unset": {"qty": True} },
)
```
- `{ item: "canvas", qty: 100, size, ...}`
- `{ item: "canvas", size, ...}`

### 해당되는 document가 없다면 새로 추가하기

```python
inventory.update_one(
    { "item": "flash" },
    { "$set": {"size": {"h": 10, "w": 8}, "status": "F"}},
    True
)
```
- `Null`
- `{item: "flash", "size": {"h": 10, "w": 8}, "status": "F"}}`

- [참고] 이 외에도 사용할 수 있는 update연산자

![](image/039_002.png)

## 도큐먼트 삭제

### 하나의 도큐먼트를 찾아 삭제하기

```python
result = collection.delete_one(
    { query }
)
print(result.deleted_count)
```
- `1`

### 다수의 도큐먼트를 찾아 삭제하기

```python
result = collection.delete_many(
    { query }
)
print(result.deleted_count)
```
- `12`

### 특정 field 값을 업데이트 하기

```python
user.delete_many(
    {"password": "1111"}
)
```
- `Null`


# 쿼리 연산자

## 쿼리의 구조

### 앞으로 다양하게 배우게 될 쿼리의 연산자

```sql
SELECT * FROM table WHERE column="value"
```

```python
collection.fild({"field": "value"}, {})
```
쿼리에 연산자가 사용되는 형식에 대해 알아보자

### 쿼리의 형식

```python
{ <field>: {<operator1>: <value>, <operator2>: <value>}, <field>: ...}
```
기본적으로 쿼리는 필드가 가장 바깥에 있고, 안쪽에 연산자가 들어간다.

```python
{ "height": {"$gte": 175, "$lte": 180}, "width": {"$gte": 60}}
```
기본적으로 쿼리는 필드가 가장 바깥에 있고, 안쪽에 연산자가 들어간다.

### $or, $and, $nor이 들어간 쿼리의 형식

```
{
    <$or, $and, $nor>: [<query>, <query>, ...],
    <field>: {<operator1>: <value>, <operator2>: <value>},
    <field>: ...
}
```
하지만 예외적으로 $or, $and, $nor 세 개의 연산자는 가장 바깥에 쓰인다.

```python
{ "$or": [{"status": "A"}, {"qty": {"$lt": 30}}]}
```
하지만 예외적으로 $or, $and, $nor 세 개의 연산자는 가장 바깥에 쓰인다.

### 형식을 지키지 않은 예시

```python
{"name": {"first": 'karoid', "last": 'Jeong'}}
```

```python
{"name.first": 'karoid', "name.last": 'Jeong'}
```

## 점 표기법

### 점 표기법이란?

BSON 내부의 Object에 접근하기 위한 방법

### 객체 내부로 접근하기

```python
{
    "name" : {"first": "sue", "last": "Turing"}
}
```
- `{"name.first": 'sue'}`

점 연산자로 내부에 접근할 수 있다.

### 배열의 요소에 접근하기

```python
{
    "groups": ["news", "sports"]
}
```
- `{"groups.0": "news"}`

마찬가지로 배열의 첫 번째 요소로 news값을 갖는 도큐먼트를 찾고 싶다면?

## 비교 연산자

![](image/039_003.png)

### 대소 비교 쿼리 예시

```python
articles.find({"likes": {"$gt": 10, "$lt": 30}})
```
- 좋아요 수가 10초과 30미만인 도큐먼트 검색

```python
articles.find({"likes": {"$gte": 10, "$lte": 30}})
```
- 좋아요 수가 10 이상 30 이하인 도큐먼트 검색

### 포함 쿼리 예시

```python
inventory.find({ "qty": { "$in": [ 5, 15 ] }})
```
- 수량이 5 또는 15인 아이템 도큐먼트

```python
inventory.find({ "tags": { "$nin" : [
    re.compile("^be"),
    re.compile("^st")
]}})
```
- 태그가 정규표현식 ^be 또는 ^st에 일치하지 않는 도큐먼트

## 논리 연산자

- `$or` : 주어진 조건 중 하나라도 true일 때 true
- `$and` : 주어진 모든 조건이 true일 때 true
- `$nor` : 주어진 조건 중 하나라도 false일 때 true
- `$not` : 주어진 조건이 false일 떄 true

### 연산자의 위치 주의

```python
articles.find({ "$or": [{ "title": "article01" }, { "writer": "Alpha"}]})
```
게시글 중 제목이 article01 이거나 작가가 Alpha인 도큐먼트

```python
articles.find({ "likes": { "$not": { "$lte": 11 }}})
```

- and 연산자는 쓸 일이 많지 않다

```python
inventory.find({"$and": [
    {"qty": {"$gt": 10 }},
    {"qty": {"$lt": 100 }}
]})
```

```python
inventory.find({"qty": {"$gt": 10, "$lt": 100}})
```

### 복합적인 논리 연산자의 사용

```python
inventory.find({
    "$and" : [
        { "$or": [{"price": 0.99}, {"price": 1.99}]},
        { "$or": [{"sale": True}, {"qty": {"$lt":20}}]}
    ]
})
```
논리 연산자를 복합적으로 사용할 때 and연산자가 쓰일 수 있다.

## 문자열 연산자

- `$mod` : 그 필드에 modulo operation을 통해 특정 결과가 나온 Document를 선택한다.
- `$regex` : 특정 정규 표현식과 맞는 Document를 선택한다
- `$text` : 문자열 검색의 기능을 수행한다.
- `$where` : 자바스크립트로 알맞은 Document를 선택한다.

### 정규표현식 연산자

```python
{ <field>: { "$regex": 'pattern', "$options": '<options>'}}
```
- options
  - `i` : 대소문자 무시
  - `m` : 정규식에서 anchor(^)를 사용할 때 값에 `\n` 이 있다면 무력화
  - `x` : 정규식 안에 있는 whitespace를 모두 무시
  - `s` : dot (.) 사용할 때 `\n`을 포함해서 매치

### 정규표현식 예시

```python
articles.find({ "title": { "$regex": 'article0[1-2]'}})
```

### Text 연산자

- 전문 검색 연산자

```python
{
    "$text": {"$search": <string>, "$language": <string>,
        "$caseSensitive": <boolean>, "$diacriticSensitive": <boolean>}
}
```

- `$search` : 검색할 내용
- `$language` : 선택적 검색하는 언어
- `$caseSensitive` : 선택적 False일 경우 대소문자 무시, False가 기본값
- `$diacriticSensitive` : 선택적 $\hat g$와 g와 같이 diacritical mark를 구분할지 선택, False가 기본값

### 문자열 인덱스 설정

```python
collection.create_index([('field', pymongo.TEXT)], default_language='engglish')
```
- 컬렉션당 하나만 만들 수 있는 문자열 인덱스에서만 작동함
- 한글은 문자열 인덱스로 지원하지 않음

### Text연산자 예시: 한 단어

```python
articles.find({ "$text": { "$search": "coffee" }})
```

### Text연산자 예시: 여러 단어

```python
articles.find({ "$text": { "$search": "bake coffee cake" }})
```
하나의 단어가 아닌 띄어시기의 단어들을 구분하여 찾기

### Text 연산자 예시: 구절을 검색

```python
articles.find({ "$text": { "$search": "\"coffee shop\"" }})
```
두 단어를 모두 포함(shop = Shopping 도 찾아줌)

## 배열 연산자

### 도큐먼트에서 배열의 의미

```python
inventory.find({"tags": "school"})
```

```python
{"_id": ObjectId(아이디...), "tags": ["school", "book", "bag", "headphone", "appliance"]}
{"_id": ObjectId(아이디...), "tags": ["appliance", "school", "book"]}
```

```python
inventory.find({"tags": "school"})
```
- 배열은 값이 여러 개(순서 상관 있음)인 것으로 인식

### 연산자 소개

- `$all` : 순서와 상관없이 배열 안의 요소가 모두 포함되면 선택한다ㅏ.
- `$elemMatch` : $elemMatch 조건과 맞는 배열 속 요소를 가진 Document 를 선택한다.
- `$size` : 해당 배열의 크기가 같은 Document를 선택한다.

### `$all` 연산자: 배열 속 모든 값을 포함하는 Document를 찾는다.

```python
{<field>: {"$all": [<value1>, <value2> ...]}}
```

```python
items.find({"tags": {"$all": ["book", "appliance"]}})
```

```python
{
    "_id": ObjectId(아이디...),
    "tags": ["school", "book", "bag", "headphone", "appliance"]
}
{
    "_id": ObjectId(아이디...),
    "tags": ["appliance", "school", "book"]
}
```

### `$elemMatch` 연산자: 해당 field가 query들을 모두 만족하는 값을 갖는 도큐먼트를 검색

```python
{<field>: {"$elemMatch": {<query1>, <query2>, ...}}}
```

```python
score.find({"results": {"$elemMatch": {"$gte": 80, "$lt": 85}}})
```

```python
{"_id": 1, "results": [82, 85, 88]}
```

### `$elemMatch`를 이용하면 Query 안에 Query 넣어서 사용할 수 있다

```python
survey.find(
    {"results": {"$elemMatch": {"product": "xyz", "score": {"$gte": 8}}}}
)
```

```python
{ _id: 3, results: [{product: "abc", score: 7}, {product: "xyz", scored: 8}]}
```

### `$size` 연산자: 해당 field가 모든 query를 만족하는 값을 갖는 Document를 선택

```python
{<field>: {"$size": <array size>}}
```

```python
scores.find({"results": {"$size": 3}})
```

```python
{"_id": 1, "results": [82, 85, 88]}
```




