Skip to content
View Yongmin222's full-sized avatar

Block or report Yongmin222

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Yongmin222/README.md

안녕하세요, 이용민입니다 👋

IT 분야로 전환한 비전공자로서, 대용량 데이터 파이프라인 설계와 분산 시스템 운영에 강점을 가진 데이터 엔지니어입니다.

🔹 Data Engineer
🔹 관심 분야

  • 실시간 데이터 파이프라인 (Kafka, Apache Flink, Stream Processing)
  • 대규모 데이터 처리 (BigQuery, Spark, ETL/ELT)
  • 클라우드 데이터 인프라 (GCP, AWS, Data Warehouse 설계)
  • 머신러닝 파이프라인 (Feature Engineering, BigQuery ML, Vertex AI AutoML)

🛠 Tech Stack

📊 Stream Processing & Message Queue

Apache Kafka Apache Flink Confluent

☁️ Cloud Data & Analytics

Google BigQuery Vertex AI AWS EC2 AWS RDS

🐍 Programming & Data Tools

Python Java SQL Pandas

🔧 DevOps & Infrastructure

Docker Kubernetes GitHub Actions Git


🎯 Featured Projects

1. HANNOON - 실시간 프랜차이즈 매출 분석 플랫폼

SK Shieldus 부트캠프 최종 프로젝트 | 팀 3인 / 아키텍처 설계 · 인프라 · Kafka · Flink 담당 | 2025.03 ~ 2025.06

프랜차이즈 매장의 실시간 영수증 데이터를 수집, 처리, 분석하는 End-to-End 데이터 파이프라인

🔧 기술 스택

  • Message Queue: Confluent Kafka (KRaft 모드, 11개 노드)
  • Stream Processing: Apache Flink (3개 병렬 Job)
  • Data Format: Avro + Schema Registry (JSON 대비 40% 압축)
  • Backend: Spring Boot Producer, Kafka Connect
  • Infrastructure: AWS EC2 (11개 인스턴스)

📊 주요 성과

  • ✅ 22시간+ 무중단 안정 가동 (Exactly-Once 보장)
  • ✅ 실시간 매출 모니터링 (초 단위 업데이트)
  • ✅ 중복 결제 이상 거래 탐지 (CEP Pattern)
  • ✅ TOP 3 매장 실시간 랭킹 (Sliding Window)
  • ✅ 분산 환경 트러블슈팅 5건 직접 해결

📂 관련 레포지토리

📄 포트폴리오 상세 보기


2. YouTube 영상 조회수 예측 모델 구축

Google Cloud 실무 프로젝트 | 2025.12

YouTube Data API로 수집한 68,497개 영상 메타데이터 기반 조회수 예측 ML 파이프라인

🔧 기술 스택

  • 데이터 수집: Python, YouTube Data API v3
  • Data Warehouse: Google BigQuery
  • 데이터 분석: SQL, BigQuery ML
  • ML 모델: Vertex AI AutoML, Boosted Tree
  • 배포: Vertex AI Endpoint (REST API)

📊 주요 성과

  • ✅ R² 0.28 → 0.80 달성 (186% 향상)
  • ✅ 원시 15개 컬럼 → 17개 Feature Engineering
  • ✅ Data Leakage 직접 탐지 및 해결 (R² 0.95 → 0.74 → 0.80)
  • ✅ Vertex AI Endpoint REST API 배포

💡 핵심 인사이트

  • 채널 파워(45%) > 콘텐츠 특성(25%) > 제목 키워드(15%)
  • 대형 채널(100만 구독) vs 소형 채널(1만 구독) 간 45배 조회수 차이
  • 키워드 최적화는 소형 채널에서만 약 9% 효과

📄 포트폴리오 상세 보기


📫 Contact & Credentials

📧 Email: gkdlfn579@gmail.com
🔗 GitHub: @Yongmin222

🏅 Certifications

  • AWS Certified Cloud Practitioner (2026.01.28)

Popular repositories Loading

  1. Yongmin222 Yongmin222 Public

  2. purchase purchase Public

    Forked from KFC-KafkaFriedCoders/purchase

    Java

  3. franchise-top-store franchise-top-store Public

    Forked from KFC-KafkaFriedCoders/franchise-top-store

    Java

  4. sales_total_realtime sales_total_realtime Public

    Forked from KFC-KafkaFriedCoders/sales_total_realtime

    Java

  5. duplicate-payment-detector duplicate-payment-detector Public

    Forked from KFC-KafkaFriedCoders/duplicate-payment-detector

    Java