In [1]:
"""
Kafka 컨슈머의 성능을 최적화하는 실습입니다.

TODO:
1. Kafka 컨슈머를 생성하고 `max.poll.records`, `fetch.min.bytes`, `fetch.max.wait.ms` 값을 변경하며 메시지를 소비합니다.
2. 서로 다른 설정에서 메시지 소비 속도를 비교합니다.
3. 메시지를 모두 소비할 때까지 걸린 시간을 출력합니다.

sudo apt-get install libsnappy-dev을 통해 쉘에서 snappy를 설치해야 정상 작동합니다.
"""

from kafka import KafkaConsumer
import time

In [2]:
# 설정 값
BROKER = "localhost:9092"
TOPIC = "test-topic"
POLL_RECORDS = [10, 100, 500]  # 한 번의 폴링에서 가져올 최대 메시지 개수
FETCH_MIN_BYTES = [1024, 10240, 51200]  # 최소 Fetch 크기 (1KB, 10KB, 50KB)
FETCH_MAX_WAIT = [100, 500, 1000]  # 최대 대기 시간 (100ms, 500ms, 1000ms)
NUM_MESSAGES = 100000  # 총 메시지 개수

In [3]:
# TODO 1: 서로 다른 설정에서 메시지 소비 속도를 비교
for poll_records in POLL_RECORDS:
    for fetch_min in FETCH_MIN_BYTES:
        for fetch_wait in FETCH_MAX_WAIT:
            print(f"Testing max.poll.records = {poll_records}, fetch.min.bytes = {fetch_min}, fetch.max.wait.ms = {fetch_wait}...")

            # TODO 2: Kafka 컨슈머를 생성하고 설정 변경
            consumer = KafkaConsumer(
                TOPIC,
                bootstrap_servers=BROKER,  # Kafka 브로커 주소 설정
                auto_offset_reset='earliest',  # 오프셋 초기화 방식 설정
                enable_auto_commit=False,  # 자동 오프셋 커밋 여부 설정
                max_poll_records=poll_records,  # 최대 Poll 개수 설정
                fetch_min_bytes=fetch_min,  # 최소 Fetch 크기 설정
                fetch_max_wait_ms=fetch_wait  # 최대 Fetch 대기 시간 설정
            )

            # TODO 3: 메시지 소비 시작 시간 기록
            start_time = time.time()

            # TODO 4: NUM_MESSAGES 개수만큼 메시지 소비
            message_count = 0
            for message in consumer:
                message_count += 1
                if message_count >= NUM_MESSAGES:  # 원하는 메시지 개수 도달 시 종료
                    break

            # TODO 5: 모든 메시지 소비 완료 후 시간 측정
            elapsed_time = time.time() - start_time

            # TODO 6: 결과 출력
            print(f"Max poll records: {poll_records}, Fetch min bytes: {fetch_min}, Fetch max wait: {fetch_wait}, Time taken: {elapsed_time:.3f} sec\n")

            # TODO 7: 테스트 간 간격 추가
            time.sleep(2)  # 테스트 간 2초 대기

Testing max.poll.records = 10, fetch.min.bytes = 1024, fetch.max.wait.ms = 100...
Max poll records: 10, Fetch min bytes: 1024, Fetch max wait: 100, Time taken: 0.625 sec

Testing max.poll.records = 10, fetch.min.bytes = 1024, fetch.max.wait.ms = 500...
Max poll records: 10, Fetch min bytes: 1024, Fetch max wait: 500, Time taken: 0.595 sec

Testing max.poll.records = 10, fetch.min.bytes = 1024, fetch.max.wait.ms = 1000...
Max poll records: 10, Fetch min bytes: 1024, Fetch max wait: 1000, Time taken: 0.605 sec

Testing max.poll.records = 10, fetch.min.bytes = 10240, fetch.max.wait.ms = 100...
Max poll records: 10, Fetch min bytes: 10240, Fetch max wait: 100, Time taken: 0.596 sec

Testing max.poll.records = 10, fetch.min.bytes = 10240, fetch.max.wait.ms = 500...
Max poll records: 10, Fetch min bytes: 10240, Fetch max wait: 500, Time taken: 0.587 sec

Testing max.poll.records = 10, fetch.min.bytes = 10240, fetch.max.wait.ms = 1000...
Max poll records: 10, Fetch min bytes: 10240, Fetch max