2025학년도 수능 국어 영역에 대한 다양한 모델의 성능을 평가하고 비교 분석하기 위해, 각 모델의 문제 풀이 결과와 점수를 분석하는 프로젝트입니다.
- Directory 재구조화
- 평가 코드 작성
- Models
- OpenAI:
o1-preview
,o1-mini
,gpt4o
,4o-mini
- Anthropic:
sonnet3.5
,haiku3.5
,opus3
- Google Gemini:
gemini-1.5-pro
,gemini-1.5-pro-2
,gemini-1.5-flash
- OpenAI:
- Models
- 평가 및 등급 확인
- 오답률 비교