Skip to content

FastAPI server wiki

Jaewon Lee edited this page Jan 19, 2026 · 11 revisions

๐Ÿ’ฐ ์œ ๋ฃŒ ๋ชจ๋ธ (Managed Services) ์•ˆ์ •์ ์ธ API ํ™˜๊ฒฝ๊ณผ ๊ธฐ์ˆ  ์ง€์›์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค.

  1. Google Cloud Speech-to-Text ํŠน์ง•: ๊ธ€๋กœ๋ฒŒ ์–ธ์–ด ์ง€์› ๋ฒ”์œ„๊ฐ€ ๋งค์šฐ ๋„“์œผ๋ฉฐ, V2 API๋ฅผ ํ†ตํ•ด ์ตœ์‹  ๋ชจ๋ธ ์ ์šฉ ๊ฐ€๋Šฅ.

๊ณผ๊ธˆ: ๋งค์›” 60๋ถ„ ๋ฌด๋ฃŒ ์ œ๊ณต, ์ดํ›„ ์‚ฌ์šฉ๋Ÿ‰์— ๋”ฐ๋ผ ๊ฒฐ์ œ ํ•„์š”.

  1. Naver CLOVA Speech ํŠน์ง•: ํ•œ๊ตญ์–ด ์ธ์‹๋ฅ ์— ์žˆ์–ด์„œ๋Š” ๊ตญ๋‚ด ์ตœ๊ณ  ์ˆ˜์ค€. ๋ฐฉ์†ก ์ž๋ง‰, ๊ธด ์˜์ƒ ๋ถ„์„ ๋“ฑ์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Œ.

๊ตฌ๋ถ„:

CLOVA Speech: ๊ณ ์„ฑ๋Šฅ, ๊ธด ์Œ์„ฑ ๋ถ„์„์šฉ.

CSR (CLOVA Speech Recognition): ์งง์€ ์Œ์„ฑ ๋ช…๋ น์ด๋‚˜ ๋‹จ๋ฌธ ์ธ์‹์— ํŠนํ™”.

๐Ÿ†“ ๋ฌด๋ฃŒ ๋ชจ๋ธ (Open Source) ์„œ๋ฒ„ ์ธํ”„๋ผ๋ฅผ ์ง์ ‘ ๊ตฌ์ถ•ํ•˜๊ฑฐ๋‚˜ API ๋ฌด๋ฃŒ ํ‹ฐ์–ด๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋น„์šฉ ์—†์ด ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

  1. OpenAI - Whisper ์„ฑ๋Šฅ: ํ•œ๊ตญ์–ด ์ง€์›, WER(๋‹จ์–ด ์˜ค์ฐจ์œจ) ์•ฝ 10.32.

ํŠน์ง•: ํ˜„์žฌ ์ „ ์„ธ๊ณ„์ ์œผ๋กœ ๊ฐ€์žฅ ๋งŽ์ด ์“ฐ์ด๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ. ๋‹ค์–‘ํ•œ ์‚ฌ์ด์ฆˆ(Tiny ~ Large-v3)๊ฐ€ ์žˆ์–ด ํ™˜๊ฒฝ์— ๋งž๊ฒŒ ์„ ํƒ ๊ฐ€๋Šฅ.

  1. Nvidia - Canary ์„ฑ๋Šฅ: ํ•œ๊ตญ์–ด ๋ฏธ์ง€์›(์˜์–ด, ๋…์ผ์–ด, ํ”„๋ž‘์Šค์–ด ๋“ฑ ์œ„์ฃผ), WER ์•ฝ 5.63.

ํŠน์ง•: ํ˜„์กดํ•˜๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ์ค‘ ์ •ํ™•๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์Œ. ๋‹ค๊ตญ์–ด ํ˜ผํ•ฉ ํ™˜๊ฒฝ์—์„œ ๊ฐ•์ ์„ ๋ณด์ž„.

๐Ÿ“š ์šฉ์–ด ์‚ฌ์ „ WER (Word Error Rate, ๋‹จ์–ด ์˜ค์ฐจ์œจ)

์‚ฌ๋žŒ์ด ๋งํ•œ ์ •๋‹ต ๋ฌธ์žฅ๊ณผ AI๊ฐ€ ์ธ์‹ํ•œ ๋ฌธ์žฅ ์‚ฌ์ด์˜ ํŽธ์ง‘ ๊ฑฐ๋ฆฌ(์ˆ˜์ •, ์‚ฝ์ž…, ์‚ญ์ œ)๋ฅผ ๊ณ„์‚ฐํ•œ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค.

๋‚ฎ์„์ˆ˜๋ก ์„ฑ๋Šฅ์ด ์ข‹์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. (์˜ˆ: Canary(5.63) > Whisper(10.32))๐Ÿง  LLM (Large Language Model) List

ํ…์ŠคํŠธ ๋ถ„์„ ๋ฐ ์ƒ์„ฑ์„ ๋‹ด๋‹นํ•˜๋Š” ๋‘๋‡Œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์šฉ๋„์— ๋”ฐ๋ผ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ’ฐ ์œ ๋ฃŒ ๋ชจ๋ธ

  • GPT-4o-mini

    • ์šฉ๋„: ์ผ๋ฐ˜์ ์ธ ํ…์ŠคํŠธ ๋ฌธ์ œ ์ฑ„์ , ์ •ํ˜•ํ™”๋œ ๋ฐ์ดํ„ฐ ์ถ”์ถœ, ๊ฐ„๋‹จํ•œ ํ”ผ๋“œ๋ฐฑ.

    • ํŠน์ง•: GPT-4 ์ˆ˜์ค€์˜ ์ง€๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ๋น„์šฉ๊ณผ ์†๋„๋ฅผ ํš๊ธฐ์ ์œผ๋กœ ๋‚ฎ์ถ˜ ๋ชจ๋ธ.

  • DeepSeek-V3

    • ์šฉ๋„: ๋ณต์žกํ•œ CS(์ปดํ“จํ„ฐ ๊ณตํ•™) ๊ฐœ๋… ์„ค๋ช…, ๋…ผ๋ฆฌ์  ์ถ”๋ก ์ด ํ•„์š”ํ•œ ๋ชจ์˜๋ฉด์ ‘ ๋กœ์ง.

    • ํŠน์ง•: 2025~2026๋…„ ๊ธ‰๋ถ€์ƒํ•œ ๋ชจ๋ธ๋กœ, ํŠนํžˆ ์ฝ”๋“œ ์ƒ์„ฑ ๋ฐ ์ด๊ณต๊ณ„ ๋…ผ๋ฆฌ ์ถ”๋ก ์—์„œ GPT-4o์— ๊ทผ์ ‘ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž„.

๐Ÿ†“ ๋ฌด๋ฃŒ ๋ชจ๋ธ

  • Gemini 1.5 Flash

    • ์ œํ•œ: ๋ถ„๋‹น 15ํšŒ ํ˜ธ์ถœ(RPM), ๋ถ„๋‹น 100๋งŒ ํ† ํฐ๊นŒ์ง€ ๋ฌด๋ฃŒ (Free Tier ๊ธฐ์ค€).

    • ํŠน์ง•: ๋งค์šฐ ๋น ๋ฅธ ์‘๋‹ต ์†๋„์™€ 100๋งŒ ํ† ํฐ์˜ ๊ฑฐ๋Œ€ํ•œ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์ œ๊ณตํ•˜์—ฌ ๊ธด ๋ฌธ์„œ ๋ถ„์„์— ์œ ๋ฆฌ.


๐Ÿš€ MVP (Minimum Viable Product) ๊ตฌํ˜„ ์ „๋žต

ํ•ต์‹ฌ ๊ธฐ๋Šฅ์„ ๊ฐ€์žฅ ๋น ๋ฅด๊ณ  ๋น„์šฉ ํšจ์œจ์ ์œผ๋กœ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•œ ์กฐํ•ฉ์ž…๋‹ˆ๋‹ค.

1. ์Œ์„ฑ ์ธ์‹ (STT) ๋กœ์ง

  • ETRI API: ๊ณต๊ณต AI ์˜คํ”ˆ API๋กœ, ์ผ์ผ 1,000๊ฑด(๊ฑด๋‹น 20์ดˆ ์ด๋‚ด) ๋ฌด๋ฃŒ ์ด์šฉ ๊ฐ€๋Šฅ. ํ•œ๊ตญ์–ด ํŠนํ™” ์„ฑ๋Šฅ์ด ์šฐ์ˆ˜ํ•จ.

  • Groq Whisper: Groq์˜ LPU ํ•˜๋“œ์›จ์–ด ๊ฐ€์†์„ ํ†ตํ•ด Whisper ๋ชจ๋ธ์„ ์ดˆ๊ณ ์†์œผ๋กœ ์‹คํ–‰. ๋ฌด๋ฃŒ ํ‹ฐ์–ด์—์„œ๋„ ์‹ค์‹œ๊ฐ„์— ๊ฐ€๊นŒ์šด ๋ณ€ํ™˜ ์†๋„ ์ œ๊ณต.

2. ํ…์ŠคํŠธ ๋ถ„์„ (LLM) ๋กœ์ง

  • Gemini 1.5 Flash: API ์‘๋‹ต ์ง€์—ฐ ์‹œ๊ฐ„(Latency)์ด ๋งค์šฐ ์งง์•„ ์‚ฌ์šฉ์ž ์ธํ„ฐ๋ž™์…˜์ด ์ค‘์š”ํ•œ MVP ๋‹จ๊ณ„์— ์ ํ•ฉ. ๋ฌด๋ฃŒ ํ• ๋‹น๋Ÿ‰ ๋‚ด์—์„œ ์ถฉ๋ถ„ํ•œ ํ…Œ์ŠคํŠธ ๊ฐ€๋Šฅ.

Clone this wiki locally