MicroService Architecture ‐ Data Management Patterns

MicroService Architecture - Data Management Patterns

Polyglot Persistence

마이크로서비스는 서로 간의 DB를 공유하지 않는다.
마이크로서비스에 따라 다른 DB 선택이 가능하다.
이렇게 되면 중복/분할된 데이터가 발생할 수 있는데 데이터 무결성과 데이터 일관성에 대한 문제 해결이 필요하며 Strict Consistency 또는 Eventual Consistency 적용이 필요하다.

Strict Consistency(엄격한 일관성)

강한 일관성은 데이터가 변경되는 즉시 모든 사본에 동일하게 반영되어, 어떤 시점에 어떤 사용자가 데이터를 읽더라도 항상 동일한 값을 보장하는 방식이다. 즉, 데이터가 한 번 갱신되면 그 직후부터는 어디에서 읽든 같은 결과가 나와야 한다.

쉽게 말하면, 어떤 사용자가 값을 변경했다면 다른 사용자는 절대로 “이전 값”을 보아서는 안 된다. 강한 일관성에서는 최신 데이터가 모든 시스템에 반영되기 전까지 읽기나 쓰기 과정이 제어토록 만든다.

강한 일관성의 가장 큰 장점은 신뢰성이다.

사용자는 언제 어디서 데이터를 읽더라도 같은 결과를 기대할 수 있고, 개발자 역시 시스템의 상태를 더 명확하게 이해할 수 있다. 그만큼. 비즈니스 로직도 단순해지고, “어느 서버에서는 아직 반영되지 않았을 수 있다” 같은 예외 상황을 덜 고려해도 된다.

다만 강한 일관성은 그만큼 비용이 크다. 모든 사본이 같은 상태가 될 때까지 기다려야 하므로 응답 속도가 느려질 수 있고, 네트워크 지연이나 일부 노드 장애가 전체 처리에 영향을 줄 수 있다. 즉, 강한 일관성은 정확성과 신뢰성을 높여 주지만, 성능과 가용성 측면에서는 더 많은 희생을 요구하는 방식이기도 하다.

Eventual Consistency(최종적 일관성)

최종 일관성은 데이터를 어떻게 저장하든, 최종적으로는 해당 데이터를 갖고 있는 모든 데이터베이스가 동일한 상태로 수렴하면 된다는 개념이다.

즉, 데이터가 변경된 직후에는 잠시 동안 각 사본의 상태가 서로 다를 수 있지만, 시간이 지나면 결국 같은 값으로 맞춰진다는 것을 의미한다.

최종 일관성은 시스템의 처리 속도와 가용성을 높이기 위해 자주 사용된다.

모든 데이터 변경을 모든 서버에 즉시 반영하려고 하면 응답 시간이 느려질 수 있고, 일부 서버에 문제가 생겼을 때 전체 서비스가 영향을 받을 수도 있다.

반면 최종 일관성은 일시적인 불일치를 허용하는 대신, 더 빠르게 응답하고 더 유연하게 시스템을 운영할 수 있게 해준다.

즉, 최종 일관성은 데이터가 변경된 직후 짧은 시간 동안 사본 간 데이터 불일치 상태를 허용하지만, 결과적으로는 모든 사본이 동일한 상태로 수렴하는 것을 보장하는 개념이다.

이는 “지금 이 순간 완전히 같아야 한다”보다 “조금 늦더라도 결국 맞춰진다”에 더 초점을 둔 방식이라고 볼 수 있다.

최종 일관성은 유튜브 조회수, 인스타그램 좋아요 수, 게시글 조회 수처럼 잠시 값이 어긋나더라도 사용자에게 치명적인 문제가 되지 않는 서비스에서 유용하다.

이런 데이터는 몇 초 정도 늦게 반영되더라도 사용자가 큰 불편을 느끼지 않는 경우가 많다.

오히려 즉각적인 완전 일치를 위해 시스템 성능을 희생하는 것이 더 비효율적일 수 있다.

또한 SNS 피드, 댓글 수, 추천 수처럼 대규모 트래픽이 몰리는 서비스에서도 최종 일관성은 실용적이다.

수많은 사용자가 동시에 데이터를 읽고 쓰는 상황에서 모든 요청에 대해 즉시 완전한 동기화를 보장하려고 하면 시스템 비용이 급격히 커질 수 있기 때문이다. 이럴 때 최종 일관성은 현실적인 타협점이 된다.

즉, 최종 일관성은 사용자 경험에 큰 문제가 없는 범위 내에서만 효과적인 전략이다.

데이터의 약간의 지연이 허용되는 영역에서는 강력하지만, 그 지연이 곧바로 손해나 서비스 신뢰도 저하로 이어지는 영역에서는 신중하게 사용해야 한다.

Database per service Pattern

마이크로 서비스 - 느슨하게 결합, 확장 가능, 독립적
분산 데이터 모델 - 특정 마이크로서비스를 위한 여러 개의 작은 DB로 구성된다.
Database Schema 변경 - 다른 마이크로서비스에 영향을 미치지 않고 수행이 가능하며 개별 DB의 변경은 다른 서비스에 영향을 주지 않는다.
애플리케이션에 단일 장애 지점(SPOF)이 없다 - 애플리케이션이 탄력적이며 개별 DB로 1개의 마이크로서비스만 독립적으로 확장 가능하도록 구성할 수 있다.
DB 분리 - 마이크로서비스에 가장 최적화된 DB 선택이 가능하고 서비스 요구사항 및 기능에 따라 가장 효율적인 DB 사용이 가능하다.
DB 선택 - 관계형, NoSQL
서비스에는 데이터 교환, 서비스 간 통신을 위한 방법이 필요 - 각 서비스는 명확한 API 제공이 필요하며 Communications Resilience로 재시도 및 회로 차단기 패턴을 필요로 한다.
마이크로서비스 간의 분산 트랜잭션 - Consistency + Atomicity 관점에서 부정적 영향을 미치며 복잡한 쿼리, 여러 데이터 저장소에서 조인 쿼리를 실행하기 어렵다.

Database per service 패턴을 따르지 않고 여러 마이크로서비스가 공유 데이터베이스를 사용한다.
공유 데이터베이스의 사용 - 마이크로서비스는 확장성, 복원성, 독립성이라는 속성을 잃게 된다. 또한 공유 데이터베이스는 단일 장애 지점으로 인해 마이크로서비스가 차단될 수 있다.

RDB와 NoSQL

관계형 데이터베이스 테이블
- 고정된 스키마
- SQL을 사용하여 데이터를 관리
- ACID 원칙에 따라 트랜잭션 지원
- 실제 데이터를 저장하기 위해 열과 행을 사용
키(Key)
- PK : 각 테이블마다 고유한 값을 가져야 하는 열
- FK : 한 테이블의 기본 키가 다른 테이블에서 사용되는 경우
- UK : 중복된 값을 가질 수 없는 키

Non-Relational Database
구조화되지 않은 데이터를 저장
사용 편의성, 확장성, 복원성 및 가용성 특성
NoSQL은 Key-Value 혹은 Documents(JSON) 타입으로 저장 - 구조화되지 않은 데이터를 저장한다.
다양한 유형의 저장된 데이터와 데이터 모델 - Document, Key-Value, Graph, Column
ACID를 보장하지 않기 때문에 트랜잭션 관리가 필요하다.

NoSQL - Document

JSON 기반 문서에 데이터를 저장하고 쿼리 - 데이터와 메타데이터는 계층적으로 저장한다.

객체는 애플리케이션 코드에 매핑 - 컨텐츠 관리 및 카탈로그 저장

확장성에 탁월하다.

MongoDB, Cloudant

NoSQL - Key-Value

데이터는 키-값 쌍의 컬렉션으로 저장한다.

세션 지향 애플리케이션에 가장 적합한 선택이다.

Redis, Amazon DynamoDB, Azure CosmosDB, Oracle NoSQL

NoSQL - Column-Based

데이터는 열에 저장한다.

Column별로 독립적으로 확장 가능하다.

빅 데이터 처리를 위한 Data Warehouse를 구축

Apache Cassandra, Apache HBase

NoSQL - Graph

데이터를 그래프 구조로 노드, 엣지, 데이터 속성에 저장

그래프 관계를 저장하고 탐색한다.

CAP(Consistency, Availability, Partition Tolerance)

Data Partitioning

Data Sharding

📖 Java

📖 Kotlin

📖 Coroutine

📖 Spring

📖 Spring Security

📖 Spring Batch

Spring Batch - Scheduler vs Batch
Spring Batch - Batch Concept
Spring Batch - Batch Domain
Spring Batch - Job
Spring Batch - Step
Spring Batch - Flow
Spring Batch - Chunk Process
Spring Batch - ItemReader
Spring Batch - ItemWriter
Spring Batch - ItemProcessor
Spring Batch - Retry & Error Handling
Spring Batch - Multi Threads Processing
[Spring Batch - Batch Event Listener]
[Spring Batch - Batch Test]
[Spring Batch - File Processing]
[Spring Batch - Read and Write Operations in Relational Databases and NoSQL]
[Spring Batch - FaultTolerant & ItemStream]
[Spring Batch - Partitioning]

📖 Reactive Programming

📖 Database

📖 MySQL

📖 Redis

📖 JPA

📖 QueryDsl

Querydsl - Querydsl

📖 MSA

MicroService Architecture - DeComposition Patterns
MicroService Architecture - Service Communications Patterns
MicroService Architecture - API Gateway Patterns
MicroService Architecture - Asynchronous Communications Patterns
MicroService Architecture - Data Management Patterns
MicroService Architecture - CQRS Patterns
MicroService Architecture - Distributed Transactions
[MicroService Architecture - Event-Driven Architecture]
[MicroService Architecture - Resilience & Observability and Monitoring]
[MicroService Architecture - Security Patterns]
[MicroService Architecture - Testing Strategies]
[MicroService Architecture - Scalability & Caching Patterns]
[MicroService Architecture - Deployment Patterns]
[MicroService Architecture - Serverless Architecture]
[MicroService Architecture - GraphQL]
[MicroService Architecture - Evolution of Distributed Systems and Their Drawbacks]
[MicroService Architecture - Protocol Buffers]
[MicroService Architecture - gRPC Communication Patterns]
[MicroService Architecture - gRPC Optimization Strategies and Implementation]
MicroService Architecture - 2PC
MicroService Architecture - TCC
MicroService Architecture - SAGA

📖 Kafka

Apache Kafka - Kafka Introduction
Apache Kafka - Kafka CLI
Apache Kafka - Kafka Producer Application
Apache Kafka - Kafka Consumer Application
Apache Kafka - Idempotent Producer & Transactional Producer & Transactional Consumer
Apache Kafka - Kafka Streams
Apache Kafka - Kafka Topic/Producer/Consumer
Apache Kafka - Producer Mechanism
Apache Kafka - Consumer Mechanism
Apache Kafka - Multi Node Kafka Cluster
Apache Kafka - Producer & Consumer Serialization/DeSerialization
Apache Kafka - Topic Segment Management
Apache Kafka - KSQLDB Stream
Apache Kafka - KSQLDB Table
Apache Kafka - KSQLDB Application
Apache Kafka - Group by & Mview
[Apache Kafka - Join]
[Apache Kafka - Time & Windows]
[Apache Kafka - Connecting KSQLDB to Kafka Connect]
[Apache Kafka - Kafka Connect]
[Apache Kafka - JDBC Source Connector]
[Apache Kafka - JDBC Sink Connector]
[Apache Kafka - Debezium MySQL CDC Source Connector]
[Apache Kafka - Schema Registry]
Apache Kafka - Differences Between RocksDB and In-Memory KeyValueStore in GlobalKTable
Apache Kafka - Kafka Streams
[Apache Kafka - Kafka Connect]
[Apache Kafka - Idempotent Producers and Transactional Producers & Consumers]
[Apache Kafka - CDC(Change Data Capture)]

📖 Apache Flink

[Apache Flink - Apache Flink Architecture]
[Apache Flink - Stream Processing]
[Apache Flink - Data Stream API & Window]
[Apache Flink - State Management]

📖 HTTP

📖 AWS

📖 Docker

📖 Kubernetes

Kubernetes - Probe
Kubernetes - ConfigMap & Secret
Kubernetes - PV/PVC & Deployment & Service & HPA
Kubernetes - Helm & Kustomize
Kubernetes - Pod 1
[Kubernetes - Pod 2]
Kubernetes - Controller 1
[Kubernetes - Controller 2]
[Kubernetes - Object]
[Kubernetes - Ingress & Nginx Application]
[Kubernetes - Node Scheduling]
[Kubernetes - Monitoring]
[Kubernetes - Logging]
Kubernetes - Deployment using Amazon EKS

📖 CI/CD

Github Actions - Github Actions

📖 Nginx

Nginx ‐ Nginx Introduction
Nginx ‐ Nginx Supplementary Summary
Nginx ‐ Deploying Domain with Nginx
Nginx ‐ Implementing HTTPS with Nginx
Nginx ‐ Backend Deployment via Nginx Reverse Proxy
Nginx ‐ Load Balancing with Nginx
[Nginx - Advanced Concept]
[Nginx - Advanced Reverse Proxy]

📖 Monitoring🥈

[Monitoring - Log Concept]
[Monitoring - Log Level & Filter]
[Monitoring - Logback]
[Monitoring - Log Collection with ELK Stack]
[Monitoring - Log Monitoring with Kibana]
[Monitoring - Building a Monitoring System with Spring Boot Actuator]
[Monitoring - Server Monitoring with Prometheus and Grafana with Discord Alerts]

📖 Test

Test - Load Testing Fundamentals
[Test - Diagnosing Bottlenecks via Load Testing]
[Test - Performance Tuning: Resolving Bottlenecks]
Test - JUnit5
Test - Mockito
Test - TestContainers
Test - JMeter
Test - Chaos Monkey
[Test - ArchUnit]
[Test - Unit Testing Essentials]
[Test - TDD]
[Test - Testing with Spring & JPA]
Test - A Guide to Effective Mocking
Test - Appendix: Tips for Better Testing

📖 Effective Java 3/E

📖 Kotlin Academy - Effective Kotlin

(Effective Kotlin Item 1) Kotlin - 가변성을 제한하라
(Effective Kotlin Item 2) Kotlin - 임계 영역을 제거하라
(Effective Kotlin Item 3) Kotlin - 가능한 한 빨리 플랫폼 타입을 제거하라
(Effective Kotlin Item 4) Kotlin - 변수의 스코프를 최소화하라
(Effective Kotlin Item 5) Kotlin - 인수와 상태에 대한 기대치를 명시하라
(Effective Kotlin Item 6) Kotlin - 사용자 정의 오류보다 표준 오류를 선호하라
(Effective Kotlin Item 7) Kotlin - 결과가 없을 가능성이 있는 경우 널 가능 또는 Result 반환 타입을 선호하라
(Effective Kotlin Item 8) Kotlin - use를 사용하여 리소스를 닫아라
(Effective Kotlin Item 9) Kotlin - 단위 테스트를 작성하라
(Effective Kotlin Item 10) Kotlin - 가독성을 목표로 설계하라
(Effective Kotlin Item 11) Kotlin - 연산자의 의미는 함수의 이름과 일치해야 한다
(Effective Kotlin Item 12) Kotlin - 가독성을 높이려면 연산자를 사용하라
(Effective Kotlin Item 13) Kotlin - 타입 명시를 고려하라
(Effective Kotlin Item 14) Kotlin - 리시버를 명시적으로 참조하라
(Effective Kotlin Item 15) Kotlin - 프로퍼티는 동작이 아닌 상태를 나타내야 한다
(Effective Kotlin Item 16) Kotlin - Unit?을 반환이나 연산에 사용하지 말라
(Effective Kotlin Item 17) Kotlin - 이름 있는 인수 사용을 고려하라
(Effective Kotlin Item 18) Kotlin - 코딩 컨벤션을 준수하라
(Effective Kotlin Item 19) Kotlin - knowledge를 반복하지 말라
(Effective Kotlin Item 20) Kotlin - 일반적인 알고리즘을 반복하지 말라
(Effective Kotlin Item 21) Kotlin - 일반적인 알고리즘을 구현할 때 제네릭을 사용하라
(Effective Kotlin Item 22) Kotlin - 타입 매개변수의 섀도잉을 피하라
(Effective Kotlin Item 23) Kotlin - 제네릭 타입에 변성 한정자 사용을 고려하라
(Effective Kotlin Item 24) Kotlin - 공통 모듈을 추출해서 여러 플랫폼에서 재사용하라
(Effective Kotlin Item 25) Kotlin - 각각의 함수는 하나의 추상화 수준으로 작성하라
(Effective Kotlin Item 26) Kotlin - 변경으로부터 코드를 보호하려면 추상화를 사용하라
(Effective Kotlin Item 27) Kotlin - API 안정성을 명시하라
(Effective Kotlin Item 28) Kotlin - 외부 API를 래핑하는 것을 고려하라
(Effective Kotlin Item 29) Kotlin - 가시성을 최소화하라
(Effective Kotlin Item 30) Kotlin - 문서로 규약을 정의하라
(Effective Kotlin Item 31) Kotlin - 추상화 규약을 준수하라
(Effective Kotlin Item 32) Kotlin - 보조 생성자 대신 팩토리 함수를 고려하라
(Effective Kotlin Item 33) Kotlin - 이름 있는 선택적 인수를 갖는 기본 생성자 사용을 고려하라
(Effective Kotlin Item 34) Kotlin - 복잡한 객체 생성을 위해 DSL 정의를 고려하라
(Effective Kotlin Item 35) Kotlin - 의존성 주입을 고려하라
(Effective Kotlin Item 36) Kotlin - 상속보다 합성을 선호하라
(Effective Kotlin Item 37) Kotlin - 데이터 묶음을 표현할 때 data 한정자를 사용하라
(Effective Kotlin Item 38) Kotlin - 연산과 행동을 전달하려면 함수 타입이나 함수형 인터페이스를 사용하라
(Effective Kotlin Item 39) Kotlin - 제한된 계층구조를 표현하기 위해 sealed 클래스와 sealed 인터페이스를 사용하라
[(Effective Kotlin Item 40) Kotlin - 태그 클래스 대신 클래스 계층구조를 선호하라]
[(Effective Kotlin Item 41) Kotlin - 열거형 클래스를 사용해서 값 목록을 나타내라]
[(Effective Kotlin Item 42) Kotlin - equals의 규약을 준수하라]
[(Effective Kotlin Item 43) Kotlin - hashCode의 규약을 준수하라]
[(Effective Kotlin Item 44) Kotlin - compareTo의 규약을 준수하라]
[(Effective Kotlin Item 45) Kotlin - API의 필수적이지 않은 부분을 확장으로 추출하는 것을 고려하라]
[(Effective Kotlin Item 46) Kotlin - 멤버 확장 함수를 피하라]

📖 Kotlin Academy - 핵심편

📖 스프링으로 시작하는 리액티브 프로그래밍

Reactive Programming - Reactive Streams
Reactive Programming - Blocking I/O & Non-Blocking I/O
Reactive Programming - Reactor Outline
Reactive Programming - Marble Diagram
Reactive Programming - Cold Sequence & Hot Sequence
[Reactive Programming - Backpressure]
[Reactive Programming - Sinks]
[Reactive Programming - Scheduler]
[Reactive Programming - Context]
[Reactive Programming - Debugging]
[Reactive Programming - Testing]
[Reactive Programming - Operators]
[Reactive Programming - Spring Webflux]
[Reactive Programming - Annotation Based Controller]
[Reactive Programming - Functional Endpoint]
[Reactive Programming - Spring Data R2DBC]
[Reactive Programming - Exception Handling]
[Reactive Programming - WebClient]
[Reactive Programming - Reactive Streaming Data Processing]

Uh oh!

MicroService Architecture ‐ Data Management Patterns

MicroService Architecture - Data Management Patterns

Polyglot Persistence

Database per service Pattern

RDB와 NoSQL

CAP(Consistency, Availability, Partition Tolerance)

Data Partitioning

Data Sharding

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!