매일 업데이트 · 2026-04-28 기준 · 20시간 전 업데이트
AI 추론·수학 성능 순위 2026
수학·논리 추론 벤치마크 기준 AI 모델 순위
AI 추론·수학 성능 순위 2026 TOP 20
Artificial Analysis 기반1
—
GPT-5.2 (xhigh)
OpenAI
100
2
—
GPT-5 Codex (high)
OpenAI
100
3
—
Gemini 3 Flash Preview (Reasoning)
98
4
—
DeepSeek V3.2 Speciale
DeepSeek
98
5
—
GPT-5.2 (medium)
OpenAI
98
6
—
GPT-5.1 Codex (high)
OpenAI
97
7
—
Gemini 3 Pro Preview (high)
97
8
—
MiMo-V2-Flash (Reasoning)
Xiaomi
97
9
—
KAT-Coder-Pro V1
KwaiKAT
96
10
—
Kimi K2 Thinking
Kimi
96
11
—
GLM-4.7 (Reasoning)
Z AI
96
12
—
Nova 2.0 Lite (high)
Amazon
95
13
—
GPT-5 (high)
OpenAI
95
14
—
GPT-5.1 (high)
OpenAI
95
15
—
gpt-oss-120B (high)
OpenAI
94
16
—
Grok 4
xAI
94
17
—
DeepSeek V3.2 (Reasoning)
DeepSeek
93
18
—
GPT-5 (medium)
OpenAI
93
19
—
GPT-5.1 Codex mini (high)
OpenAI
93
20
—
NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)
NVIDIA
92
점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.
자주 묻는 질문
수학·추론 문제에 가장 강한 AI는 무엇인가요?
Reasoning Index 기준 최신 순위를 참고하세요. 추론 특화 모델(Reasoning 모드)이 일반 모델보다 점수가 높게 나타나는 경향이 있습니다.
AI 추론 순위는 어떤 벤치마크를 사용하나요?
Artificial Analysis Math Index를 사용합니다. MATH, GPQA, HLE 등 수학·논리 추론 능력을 평가하는 벤치마크가 포함됩니다.