AI인사이트 로고AI Insight
매일 업데이트 · 2026-04-28 기준 · 20시간 전 업데이트

AI 출력 속도 순위 2026

API 기준 초당 출력 토큰 수(TPS) 실측값 순위

AI 출력 속도 순위 2026 TOP 20

Artificial Analysis 기반
1

Mercury 2

Inception

100 tok/s
2

Granite 4.0 H Small

IBM

46 tok/s
3
2

Gemini 3.1 Flash-Lite Preview

Google

36 tok/s
4

Granite 3.3 8B (Non-reasoning)

IBM

34 tok/s
5
2

Nova Micro

Amazon

31 tok/s
6
4

gpt-oss-20B (low)

OpenAI

28 tok/s
7
1

gpt-oss-20B (high)

OpenAI

28 tok/s
8
1

Sarvam 30B (high)

Sarvam

28 tok/s
9
3

Gemini 2.5 Flash-Lite (Reasoning)

Google

28 tok/s
10
1

Qwen3.5 0.8B (Non-reasoning)

Alibaba

26 tok/s
11
4

Gemini 2.5 Flash-Lite (Non-reasoning)

Google

26 tok/s
12

Ministral 3 3B

Mistral

25 tok/s
13
6

gpt-oss-120B (high)

OpenAI

21 tok/s
14
1

Nova 2.0 Lite (Non-reasoning)

Amazon

21 tok/s
15
2

Nova 2.0 Omni (Non-reasoning)

Amazon

21 tok/s
16

Qwen3.5 2B (Non-reasoning)

Alibaba

21 tok/s
17
3

GPT-5.1 Codex mini (high)

OpenAI

21 tok/s
18
4

Devstral Small (Jul '25)

Mistral

21 tok/s
19
1

gpt-oss-120B (low)

OpenAI

20 tok/s
20
2

Grok 3 mini Reasoning (high)

xAI

20 tok/s

점수는 카테고리별 최고점 기준 정규화됩니다. 전체 순위는 AI 순위 페이지에서 확인하세요.

자주 묻는 질문

가장 빠른 AI 모델은 무엇인가요?
출력 속도는 서버 부하에 따라 변동합니다. 소형 모델(Mini, Flash, Haiku 등)이 일반적으로 더 빠른 경향이 있습니다.
AI 속도는 어떻게 측정하나요?
Artificial Analysis가 API를 통해 초당 출력 토큰 수(tokens/sec)를 실측합니다. 동일 조건에서 반복 측정한 중앙값을 사용합니다.