AI-Powered, Bias-Free Restaurant Ranking Platform > Submitted for the 2026 Seoul Big Data Hackathon (Startup Track)
🇰🇷 한국어 버전으로 이동 (Korean Version)
In the current F&B market, restaurant review platforms are heavily polluted by paid advertisements, receipt-based review events, and extreme rating inflation. Project Dimibang aims to break the monopoly of massive delivery/map apps. By utilizing Seoul's Public Data and Generative AI, we provide a 100% trust-based ranking ecosystem. This ESG-driven approach ensures that authentic, high-quality local small businesses can be fairly evaluated and discovered without relying on marketing capital.
To eliminate noise and extract true signals, we replaced simple arithmetic means with robust mathematical models:
-
User Bias Normalization: Mitigates the inflation caused by overly generous raters using Z-scores.
$$z = \frac{x - \mu}{\sigma}$$ -
Weighted Rating (Log-Scale Influence): Grants higher weights (
$W_i$ ) to trusted gourmets based on 'Helpful' votes ($H_i$ ), utilizing a logarithmic scale to enforce diminishing returns and prevent macro-abusing.$$W_i = 1.0 + \alpha \cdot \log_{10}(1 + H_i)$$ $$S = \frac{\sum_{i=1}^{n} (W_i \cdot R_i)}{\sum_{i=1}^{n} W_i}$$ - Bayesian Average: Prevents cold-start manipulation where new restaurants dominate rankings with a few biased 5-star reviews.
- Recursive Trust Model & Anomaly Detection: Shadow-bans abusers through IP/frequency tracking and network-based recursive trust evaluation (similar to PageRank).
- Data Infrastructure: Ingests seed data (Certified safe/good restaurants) via Seoul Open Data API (White-hat approach to avoid scraping risks).
- AI Core Engine: Parses unstructured review text into multi-dimensional scores (Taste, Vibe, Service) and situational tags (e.g., "Good for solo dining") using OpenAI LLM.
- Data Mashup (Spatial Join): Combines restaurant locations with Seoul subway/foot traffic APIs to curate "Highly-rated restaurants in uncrowded areas right now."
- App MVP: Interactive dashboard deployed via Streamlit and FastAPI.
data/: Sample datasets and public data mapping files.notebooks/: EDA and algorithm experiments (Z-score, Bayesian).src/: Core data pipeline, AI parser, and ranking algorithm modules.app/: Streamlit frontend and FastAPI backend prototypes.
AI와 데이터 과학 기반의 신뢰도 100% 미식 랭킹 플랫폼 > 2026 서울시 빅데이터 활용 경진대회 (창업 부문) 출품작
현재 주요 지도 앱과 배달 플랫폼의 리뷰 시스템은 영수증 리뷰 이벤트와 광고로 인해 심각하게 오염되어 있습니다. 또한, 한국 특유의 온정적인 리뷰 문화로 인한 별점 인플레이션 때문에 진짜 맛집을 가려내기 어렵습니다. 디미방은 대형 자본의 독점을 깨고, 마케팅 자본이 부족한 진짜 맛있는 골목상권 소상공인들이 공정하게 평가받고 대중에게 발견될 수 있는 상생(ESG) 플랫폼을 지향합니다.
단순 산술 평균을 버리고, 노이즈를 걸러내 시그널만 남기는 데이터 정제 로직을 도입했습니다.
-
유저 편향 정규화 (Z-Score): 무조건 5점을 주거나 깐깐하게 3점을 주는 유저의 기준을 정규화하여 별점 인플레이션을 수학적으로 상쇄합니다.
$$z = \frac{x - \mu}{\sigma}$$ -
평가자 신뢰도 가중치 (Log-Scale 도입): 타인에게 받은 '도움이 돼요'(
$H_i$ )를 기반으로 가중치($W_i$ )를 부여하되, 로그 스케일을 적용하여 영향력의 한계치를 강제하고 어뷰징을 방어합니다.$$W_i = 1.0 + \alpha \cdot \log_{10}(1 + H_i)$$ $$S = \frac{\sum_{i=1}^{n} (W_i \cdot R_i)}{\sum_{i=1}^{n} W_i}$$ - 베이지안 평균: 리뷰가 적은 신규 식당이 소수의 지인 리뷰만으로 평점 1위를 차지하는 콜드 스타트 오류를 방지합니다.
- 어뷰징 필터링 및 재귀적 모델: 물리적 동선과 작성 빈도를 모니터링하여 조작 트래픽을 차단하며, 구글 PageRank와 유사한 재귀적 신뢰도 모델로 '품앗이'를 방어합니다.
- 초기 시드 데이터 (White-Hat): 불법 스크래핑을 배제하고, 서울 열린데이터광장(모범음식점, 위생등급 업소)의 공공데이터 API를 연동하여 합법적인 베이스라인을 구축합니다.
- 생성형 AI 감성 분석 엔진: 비구조화된 텍스트 리뷰를 LLM 기술을 활용해 다차원 감성 데이터(맛, 분위기, 서비스)와 상황별 큐레이션 태그로 자동 스코어링합니다.
- 이종 데이터 결합 (가점 큐레이션): 식당 평점 데이터와 서울시 '지하철 혼잡도/유동인구' API를 결합하여 "현재 쾌적하게 식사할 수 있는 숨은 맛집"을 실시간 추천합니다.
- 이원화된 UI: 전체 대중 평점과 '내 취향 미식가 그룹 평점'을 분리하여 설명 가능한 점수(Explainable Metric)를 직관적으로 제공합니다.
data/: 공공데이터 및 알고리즘 테스트용 샘플 데이터notebooks/: 데이터 탐색(EDA) 및 알고리즘 프로토타이핑src/: 데이터 수집, 생성형 AI 파싱, 핵심 랭킹 알고리즘 코드app/: FastAPI 백엔드 및 Streamlit 웹 대시보드 코드