Skip to content

FastAPI server wiki

Jaewon Lee edited this page Jan 19, 2026 · 11 revisions

๐Ÿงญ AI Team Wiki

์ด ๋ฌธ์„œ๋Š” ์„œ๋น„์Šค์— ์ ์šฉ๋  STT ๋ฐ LLM ๋ชจ๋ธ์˜ ๊ธฐ์ˆ ์  ๊ฒ€ํ†  ์‚ฌํ•ญ๊ณผ MVP ๊ตฌํ˜„์„ ์œ„ํ•œ ๊ฒฐ์ •์‚ฌํ•ญ์„ ๊ธฐ๋กํ•˜๋Š” ์œ„ํ‚ค์ž…๋‹ˆ๋‹ค.
๋ชจ๋“  ๋ณ€๊ฒฝ ์‚ฌํ•ญ์€ ๋ฌธ์„œํ™” ๋ฐ ๋‚ ์งœ ๊ธฐ๋ก์„ ์›์น™์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ac

๐Ÿ“Œ 1. ํ”„๋กœ์ ํŠธ ๊ฐœ์š”

๐ŸŽฏ 1-1 ๋ชฉ์ 

  • ์Œ์„ฑ ์ธ์‹(STT) ๋ฐ ์ƒ์„ฑํ˜• AI(LLM)๋ฅผ ํ™œ์šฉํ•œ ์ธํ„ฐ๋ ‰ํ‹ฐ๋ธŒ ์„œ๋น„์Šค ๊ตฌ์ถ•
  • ๋ฌด๋ฃŒ/์œ ๋ฃŒ ๋ชจ๋ธ์˜ ํšจ์œจ์  ๋ฐฐ๋ถ„์„ ํ†ตํ•œ ๋น„์šฉ ์ตœ์ ํ™” ๋ฐ ๊ณ ์„ฑ๋Šฅ ๊ตฌํ˜„
  • ์‹ค์‹œ๊ฐ„ ์‘๋‹ต ํ™˜๊ฒฝ์„ ์œ„ํ•œ ์ €์ง€์—ฐ(Low Latency) ์•„ํ‚คํ…์ฒ˜ ๊ฒ€์ฆ

๐Ÿ‘ฅ 1-2 ๋Œ€์ƒ ์‚ฌ์šฉ์ž

  • ์ฃผ์š” ์‚ฌ์šฉ์ž CS ๊ฐœ๋… ๋ฐ ๋ชจ์˜๋ฉด์ ‘ ์ค€๋น„์ƒ, ํ€ด์ฆˆ๋ฅผ ํ†ตํ•œ ํ•™์Šต์„ ์›ํ•˜๋Š” ๊ฐœ๋ฐœ์ž
  • ๋ณด์กฐ ์‚ฌ์šฉ์ž ๊ต์œก ์ฝ˜ํ…์ธ  ๊ด€๋ฆฌ์ž, ์‹œ์Šคํ…œ ์šด์˜ํŒ€

โš™๏ธ 1-3 ์ฃผ์š” ๊ธฐ๋Šฅ

  • ์‚ฌ์šฉ์ž ์Œ์„ฑ ๊ธฐ๋ฐ˜ ์ธํ„ฐ๋ ‰์…˜ ์‹œ์Šคํ…œ
  • ๊ธฐ์ˆ  ๊ฐœ๋… ์„ค๋ช… ๋ฐ ๋งž์ถคํ˜• ํ”ผ๋“œ๋ฐฑ ์ œ๊ณต
  • ์„œ๋น„์Šค ํ•ต์‹ฌ ๋กœ์ง ๊ธฐ๋ฐ˜์˜ MVP ๊ฒ€์ฆ

๐Ÿง‘โ€๐Ÿ’ป 2. ๊ธฐ์ˆ  ์Šคํƒ (Models)

๐Ÿงฉ 2-1 STT (Speech-to-Text) ๋ชจ๋ธ

๊ตฌ๋ถ„ ๊ธฐ์ˆ  ํŠน์ง• ๋น„๊ณ 
์œ ๋ฃŒ Google Cloud STT ๋งค์›” 1์‹œ๊ฐ„ ๋ฌด๋ฃŒ, ๋ฒ”์šฉ์„ฑ ์šฐ์ˆ˜ ๊ธ€๋กœ๋ฒŒ ์„œ๋น„์Šค ์ ํ•ฉ
์œ ๋ฃŒ Naver Clover ํ•œ๊ตญ์–ด ์ธ์‹ ํŠนํ™” ๊ตญ๋‚ด ์‚ฌ์šฉ์ž ์ตœ์ ํ™”
๋ฌด๋ฃŒ OpenAI Whisper ํ•œ๊ตญ์–ด ์ง€์›, WER: 10.32 ์˜คํ”ˆ์†Œ์Šค ํ‘œ์ค€
๋ฌด๋ฃŒ Nvidia Canary WER: 5.63 (ํ˜„์กด ์ตœ๊ณ  ์ •ํ™•๋„) ํ•œ๊ตญ์–ด ๋ฏธ์ง€์›
  • WER(Word Error Rate): ๋‹จ์–ด ์˜ค์ฐจ์œจ์„ ๋œปํ•˜๋ฉฐ, ๋‚ฎ์„์ˆ˜๋ก ์ธ์‹๋ฅ ์ด ๋†’์Œ.

๐Ÿงฉ 2-2 LLM (Large Language Model) ๋ชจ๋ธ

๊ตฌ๋ถ„ ๊ธฐ์ˆ  ์ฃผ์š” ์šฉ๋„ ๋น„๊ณ 
์œ ๋ฃŒ GPT-4o-mini ์ผ๋ฐ˜ ๋ฌธ์ œ ์ฑ„์ , ๊ฐ„๋‹จํ•œ ํ…์ŠคํŠธ ํ”ผ๋“œ๋ฐฑ ์ €๋ ดํ•œ ์œ ๋ฃŒ ๋ชจ๋ธ
์œ ๋ฃŒ DeepSeek-V3 ๋ณต์žกํ•œ CS ๊ฐœ๋… ์„ค๋ช…, ๋ชจ์˜๋ฉด์ ‘ ๋กœ์ง ๋†’์€ ๋…ผ๋ฆฌ ์ถ”๋ก  ์„ฑ๋Šฅ
๋ฌด๋ฃŒ Gemini 1.5 Flash MVP ํ•ต์‹ฌ ์—”์ง„, ์‹ค์‹œ๊ฐ„ ํ”ผ๋“œ๋ฐฑ ๋ถ„๋‹น 15ํšŒ/100๋งŒ ํ† ํฐ ๋ฌด๋ฃŒ

๐Ÿงฉ 2-3 ์Šคํƒ ์„ ์ • ์ด์œ 

  • Gemini 1.5 Flash
    • ๋ฌด๋ฃŒ ํ‹ฐ์–ด์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋†’์€ RPM(๋ถ„๋‹น ํ˜ธ์ถœ ์ˆ˜)๊ณผ ๊ฑฐ๋Œ€ํ•œ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์ œ๊ณตํ•˜์—ฌ MVP ๋‹จ๊ณ„์˜ ๋น„์šฉ ๋ฆฌ์Šคํฌ๋ฅผ ์ตœ์†Œํ™”ํ•œ๋‹ค.
  • Nvidia Canary & OpenAI Whisper
    • ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ์ค‘ ์ตœ์ƒ์œ„ ์ •ํ™•๋„(WER 5.63)๋ฅผ ๋ณด์œ ํ•œ Canary์™€ ํ•œ๊ตญ์–ด ๋ฒ”์šฉ์„ฑ์ด ๋†’์€ Whisper๋ฅผ ๋น„๊ต๊ตฐ์œผ๋กœ ๋‘์–ด ํ™˜๊ฒฝ์— ๋งž๋Š” ์ตœ์ ์˜ ์ธ์‹์„ ๊ตฌํ˜„ํ•˜๊ณ ์ž ํ•œ๋‹ค.
  • DeepSeek-V3
    • ๋ณต์žกํ•œ CS ๊ฐœ๋… ์„ค๋ช…๊ณผ ๊ฐ™์ด ์ •๋ฐ€ํ•œ ๋…ผ๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ์˜์—ญ์—์„œ ์œ ๋ฃŒ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ™œ์šฉํ•˜์—ฌ ์„œ๋น„์Šค์˜ ์งˆ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ์ฑ„ํƒํ–ˆ๋‹ค.

๐Ÿš€ 3. MVP ๊ตฌํ˜„ ์ „๋žต

๐Ÿ—๏ธ 3-1 ์†๋„ ์ค‘์‹ฌ์˜ ๋ฌด๋ฃŒ ๋ชจ๋ธ ํ•ต์‹ฌ ๋กœ์ง ๊ตฌํ˜„

  • STT: OpenAI Whisper(๋ฌด๋ฃŒ ํ‹ฐ์–ด)
    • ๊ณต๊ณต API์™€ ๊ฐ€์† ํ•˜๋“œ์›จ์–ด ๊ธฐ๋ฐ˜ API๋ฅผ ์กฐํ•ฉํ•˜์—ฌ ์‚ฌ์šฉ์ž์—๊ฒŒ ๋Š๊น€ ์—†๋Š” ์Œ์„ฑ ๊ฒฝํ—˜ ์ œ๊ณต.
  • LLM: Gemini 1.5 Flash
    • ๋น ๋ฅธ ์‘๋‹ต ์†๋„๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์„œ๋น„์Šค์˜ ์ฃผ์š” ํ”ผ๋“œ๋ฐฑ ๋กœ์ง ์ˆ˜ํ–‰.

๐Ÿ—‚๏ธ 4. ์ฐธ๊ณ  ์ž๋ฃŒ

๊ณต์‹ ๋ฌธ์„œ

โœจ ์‚ฌ์šฉ ํŒ ๋ฐ ๊ทœ์น™

  • ๋ชจ๋“  ๋ชจ๋ธ์˜ ์„ ์ • ๋ฐ ๋ณ€๊ฒฝ ์‚ฌํ•ญ์€ ๋ฐ˜๋“œ์‹œ ์ด ์œ„ํ‚ค์— ๋ฌธ์„œํ™”ํ•ฉ๋‹ˆ๋‹ค.
  • ์ƒˆ๋กœ์šด ๋ชจ๋ธ ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ(WER ๋“ฑ)๊ฐ€ ๋‚˜์˜ฌ ์‹œ ๋‚ ์งœ์™€ ํ•จ๊ป˜ ์—…๋ฐ์ดํŠธํ•ฉ๋‹ˆ๋‹ค.
  • MVP ์ดํ›„ ์œ ๋ฃŒ ๋ชจ๋ธ ์ „ํ™˜ ์‹œ์ ์€ ๋น„์šฉ ๋Œ€๋น„ ์„ฑ๋Šฅ ํ–ฅ์ƒ ์ง€ํ‘œ๋ฅผ ๊ทผ๊ฑฐ๋กœ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

Clone this wiki locally