매일 업데이트 · 2026-04-28 기준 · 20시간 전 업데이트

AI 추론·수학 성능 순위 2026

수학·논리 추론 벤치마크 기준 AI 모델 순위

AI 텍스트 순위 AI 코딩 순위 AI 추론 순위 AI 속도 순위 이미지 AI 순위 영상 AI 순위 보이스 AI 순위 한국어 AI 순위

AI 추론·수학 성능 순위 2026 TOP 20

Artificial Analysis 기반

—

GPT-5.2 (xhigh)

OpenAI

100

—

GPT-5 Codex (high)

OpenAI

100

—

Gemini 3 Flash Preview (Reasoning)

Google

—

DeepSeek V3.2 Speciale

DeepSeek

—

GPT-5.2 (medium)

OpenAI

—

GPT-5.1 Codex (high)

OpenAI

—

Gemini 3 Pro Preview (high)

Google

—

MiMo-V2-Flash (Reasoning)

Xiaomi

—

KAT-Coder-Pro V1

KwaiKAT

—

Kimi K2 Thinking

Kimi

—

GLM-4.7 (Reasoning)

Z AI

—

Nova 2.0 Lite (high)

Amazon

—

GPT-5 (high)

OpenAI

—

GPT-5.1 (high)

OpenAI

—

gpt-oss-120B (high)

OpenAI

—

Grok 4

xAI

—

DeepSeek V3.2 (Reasoning)

DeepSeek

—

GPT-5 (medium)

OpenAI

—

GPT-5.1 Codex mini (high)

OpenAI

—

NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)

NVIDIA

점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.

자주 묻는 질문

수학·추론 문제에 가장 강한 AI는 무엇인가요?

Reasoning Index 기준 최신 순위를 참고하세요. 추론 특화 모델(Reasoning 모드)이 일반 모델보다 점수가 높게 나타나는 경향이 있습니다.

AI 추론 순위는 어떤 벤치마크를 사용하나요?

Artificial Analysis Math Index를 사용합니다. MATH, GPQA, HLE 등 수학·논리 추론 능력을 평가하는 벤치마크가 포함됩니다.

다른 카테고리 순위

AI 텍스트 순위 AI 코딩 순위 AI 속도 순위 이미지 AI 순위 영상 AI 순위 보이스 AI 순위 한국어 AI 순위

전체 AI 순위 페이지로 돌아가기