AI인사이트 로고AI Insight
매일 업데이트 · 2026-04-28 기준 · 20시간 전 업데이트

AI 추론·수학 성능 순위 2026

수학·논리 추론 벤치마크 기준 AI 모델 순위

AI 추론·수학 성능 순위 2026 TOP 20

Artificial Analysis 기반
1

GPT-5.2 (xhigh)

OpenAI

100
2

GPT-5 Codex (high)

OpenAI

100
3

Gemini 3 Flash Preview (Reasoning)

Google

98
4

DeepSeek V3.2 Speciale

DeepSeek

98
5

GPT-5.2 (medium)

OpenAI

98
6

GPT-5.1 Codex (high)

OpenAI

97
7

Gemini 3 Pro Preview (high)

Google

97
8

MiMo-V2-Flash (Reasoning)

Xiaomi

97
9

KAT-Coder-Pro V1

KwaiKAT

96
10

Kimi K2 Thinking

Kimi

96
11

GLM-4.7 (Reasoning)

Z AI

96
12

Nova 2.0 Lite (high)

Amazon

95
13

GPT-5 (high)

OpenAI

95
14

GPT-5.1 (high)

OpenAI

95
15

gpt-oss-120B (high)

OpenAI

94
16

Grok 4

xAI

94
17

DeepSeek V3.2 (Reasoning)

DeepSeek

93
18

GPT-5 (medium)

OpenAI

93
19

GPT-5.1 Codex mini (high)

OpenAI

93
20

NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)

NVIDIA

92

점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.

자주 묻는 질문

수학·추론 문제에 가장 강한 AI는 무엇인가요?
Reasoning Index 기준 최신 순위를 참고하세요. 추론 특화 모델(Reasoning 모드)이 일반 모델보다 점수가 높게 나타나는 경향이 있습니다.
AI 추론 순위는 어떤 벤치마크를 사용하나요?
Artificial Analysis Math Index를 사용합니다. MATH, GPQA, HLE 등 수학·논리 추론 능력을 평가하는 벤치마크가 포함됩니다.