AI 모델 순위
다양한 벤치마크 데이터를 기반으로 AI 모델의 성능을
객관적으로 비교하고 순위를 확인하세요.
마지막 업데이트: 2026-04-28
순위모델점수
1
GPT-5.5 (xhigh)
OpenAI100
100
93.5%
59.1
44.3%
2026.04.23
2
GPT-5.5 (high)
OpenAI98
98
93.2%
58.5
43.0%
2026.04.23
3
Gemini 3.1 Pro Preview
Google95
95
94.1%
55.5
44.7%
2026.02.19
4
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
Anthropic95
95
91.4%
52.5
39.6%
2026.04.16
5
GPT-5.5 (medium)
OpenAI94
94
92.6%
56.2
40.6%
2026.04.23
6
GPT-5.4 (xhigh)
OpenAI94
94
92.0%
57.3
41.6%
2026.03.05
7
Kimi K2.6
Kimi89
89
91.1%
47.1
35.9%
2026.04.20
8
GPT-5.3 Codex (xhigh)
OpenAI88
88
91.5%
53.1
39.9%
2026.02.05
9
MiMo-V2.5-Pro
Xiaomi88
88
86.6%
45.5
33.8%
2026.04.22
10
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
Anthropic87
87
89.6%
48.1
36.7%
2026.02.05
벤치마크 항목별 리더보드
GPQA (추론)
박사 수준 추론 능력 평가
1
Gemini 3.1 Pro Preview
94.1%2
GPT-5.5 (xhigh)
93.5%3
GPT-5.5 (high)
93.2%Coding (코딩)
코드 생성·완성 벤치마크 종합
1
GPT-5.5 (xhigh)
59.12
GPT-5.5 (high)
58.53
GPT-5.4 (xhigh)
57.3HLE (난이도)
초고난도 문제 해결 능력
1
Gemini 3.1 Pro Preview
44.7%2
GPT-5.5 (xhigh)
44.3%3
GPT-5.5 (high)
43.0%Speed (속도)
초당 출력 토큰 수 (tok/s)
1
Mercury 2
10112
Granite 4.0 H Small
4693
Gemini 3.1 Flash-Lite Preview
371이번 달 AI 순위 동향
카테고리별 1위
종합
GPT-5.5 (xhigh) (OpenAI)
코딩
GPT-5.5 (xhigh) (OpenAI)
추론
GPT-5.2 (xhigh) (OpenAI)
속도
Mercury 2 (Inception)
이미지
GPT Image 2 (high) (OpenAI)
영상
HappyHorse-1.0 (Alibaba-ATH)
보이스
Realtime TTS 1.5 Max (Inworld)
한국AI
K-EXAONE (Reasoning) (LG AI Research)
순위 산정 기준
LLM 종합Artificial Analysis Intelligence Index — 주요 벤치마크 종합 지수
LLM 코딩Artificial Analysis Coding Index — 코드 생성·완성 벤치마크 종합
LLM 추론Artificial Analysis Math Index — 수학·논리 추론 벤치마크 종합
LLM 속도API 기준 초당 출력 토큰 수 (tokens/sec) 실측값
이미지Artificial Analysis 아레나 ELO — 사용자 투표 기반
영상Artificial Analysis 아레나 ELO — T2V/I2V 사용자 투표 기반
보이스Artificial Analysis TTS 아레나 ELO — 음성 합성 사용자 투표 기반
직업별 AI 영향도
AI가 위협하는 직업 확인
AI 도구 디렉토리
검증된 AI 도구 모아보기
AI 가격 비교
ChatGPT·Claude·Gemini 요금제
월별 아카이브
과거 순위 변동 추이 확인
자주 묻는 질문
2026년 가장 성능이 좋은 AI 모델은 무엇인가요?
2026년 종합 성능 1위는 Artificial Analysis Intelligence Index 기준으로 매일 업데이트됩니다. 코딩, 추론(수학), 속도 분야별 순위도 별도로 제공됩니다.
ChatGPT와 Claude 중 어떤 AI가 더 뛰어난가요?
용도에 따라 다릅니다. 코딩 분야에서는 Coding Index, 추론 분야에서는 Math Index로 비교할 수 있습니다. 최신 순위는 매일 갱신되며 Artificial Analysis 벤치마크 데이터를 사용합니다.
AI 모델 순위는 어떤 기준으로 산정되나요?
Artificial Analysis API의 공식 벤치마크 데이터를 사용합니다. LLM은 Intelligence/Coding/Math Index와 출력 속도, 이미지·영상·보이스는 ELO 아레나 점수 기반입니다.
이미지·영상 생성 AI 순위는 어떤 기준인가요?
Artificial Analysis의 아레나 투표 기반 ELO 점수를 사용합니다. 이미지는 사실감·일러스트·편집, 영상은 인물·자연·I2V 등 세부 카테고리별 순위도 제공합니다.
인공지능 순위는 얼마나 자주 업데이트되나요?
AI인사이트의 인공지능 순위는 매일 자동으로 업데이트됩니다. Artificial Analysis API에서 최신 벤치마크 데이터를 수집하여 반영하므로, 신규 모델 출시 후 빠르게 순위에 반영됩니다.
데이터 출처: Artificial Analysis · 2026-04-28 기준 · 점수는 카테고리별 최고점 기준 0-100으로 정규화