매일 업데이트 · 2026-04-28 기준 · 20시간 전 업데이트
AI 출력 속도 순위 2026
API 기준 초당 출력 토큰 수(TPS) 실측값 순위
AI 출력 속도 순위 2026 TOP 20
Artificial Analysis 기반1
—
Mercury 2
Inception
100 tok/s
2
—
Granite 4.0 H Small
IBM
46 tok/s
3
▲2
Gemini 3.1 Flash-Lite Preview
36 tok/s
4
—
Granite 3.3 8B (Non-reasoning)
IBM
34 tok/s
5
▼2
Nova Micro
Amazon
31 tok/s
6
▲4
gpt-oss-20B (low)
OpenAI
28 tok/s
7
▲1
gpt-oss-20B (high)
OpenAI
28 tok/s
8
▲1
Sarvam 30B (high)
Sarvam
28 tok/s
9
▼3
Gemini 2.5 Flash-Lite (Reasoning)
28 tok/s
10
▲1
Qwen3.5 0.8B (Non-reasoning)
Alibaba
26 tok/s
11
▼4
Gemini 2.5 Flash-Lite (Non-reasoning)
26 tok/s
12
—
Ministral 3 3B
Mistral
25 tok/s
13
▲6
gpt-oss-120B (high)
OpenAI
21 tok/s
14
▲1
Nova 2.0 Lite (Non-reasoning)
Amazon
21 tok/s
15
▼2
Nova 2.0 Omni (Non-reasoning)
Amazon
21 tok/s
16
—
Qwen3.5 2B (Non-reasoning)
Alibaba
21 tok/s
17
▲3
GPT-5.1 Codex mini (high)
OpenAI
21 tok/s
18
▼4
Devstral Small (Jul '25)
Mistral
21 tok/s
19
▼1
gpt-oss-120B (low)
OpenAI
20 tok/s
20
▲2
Grok 3 mini Reasoning (high)
xAI
20 tok/s
점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.
자주 묻는 질문
가장 빠른 AI 모델은 무엇인가요?
출력 속도는 서버 부하에 따라 변동합니다. 소형 모델(Mini, Flash, Haiku 등)이 일반적으로 더 빠른 경향이 있습니다.
AI 속도는 어떻게 측정하나요?
Artificial Analysis가 API를 통해 초당 출력 토큰 수(tokens/sec)를 실측합니다. 동일 조건에서 반복 측정한 중앙값을 사용합니다.