2026-03-21 기준 · Artificial Analysis 벤치마크
Claude vs Grok 비교
Anthropic Claude 시리즈와 xAI Grok 시리즈의 종합 성능, 코딩, 속도, 가격을 벤치마크 데이터로 비교합니다.
C
Claude
Anthropic
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)92
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)90
Claude Opus 4.5 (Reasoning)86
G
Grok
xAI
Grok 4.20 Beta 0309 (Reasoning)83
최고 모델 1:1 비교
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)
항목
Grok 4.20 Beta 0309 (Reasoning)
92
종합 점수
83
53
Intelligence
48.50
48.10
코딩 지수
42.20
0.90
GPQA
0.89
0.37
HLE
0.30
54.29 tps
속도
192.10 tps
5$/M
입력 가격
2$/M
25$/M
출력 가격
6$/M
10$/M
혼합 비용
3$/M
점수 시각 비교
종합 성능
Claude92
Grok83
Intelligence Index
Claude53
Grok48.5
Coding Index
Claude48.1
Grok42.2
속도 (tps)
Claude54.3
Grok192.1
용도별 추천
🏆
종합 성능Claude
벤치마크 종합 점수 기준 최고 성능 모델
💻
코딩Claude
Coding Index 기준 코드 생성·완성 능력
⚡
속도Grok
API 출력 속도(tokens/sec) 기준
💰
가격Grok
혼합 비용(blended cost) 기준 경제성
전체 모델 상세 비교
종합 순위 기준 전체 Claude·Grok 모델
| 모델명 | 순위 | 점수 |
|---|---|---|
Claude Opus 4.6 (Adaptive Reasoning, Max Effort) | #4 | 92 |
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) | #5 | 90 |
Claude Opus 4.5 (Reasoning) | #9 | 86 |
Grok 4.20 Beta 0309 (Reasoning) | #13 | 83 |
자주 묻는 질문
Claude와 Grok 중 어떤 AI가 더 좋나요?
용도에 따라 다릅니다. 2026년 기준 Claude Opus 4.6 (Adaptive Reasoning, Max Effort)은 종합 점수 92점이며, Grok 4.20 Beta 0309 (Reasoning)은 83점을 기록합니다. Artificial Analysis 벤치마크 데이터 기반으로 매일 업데이트됩니다.
Claude와 Grok의 가격 차이는 얼마나 되나요?
API 가격 기준으로 Claude Opus 4.6 (Adaptive Reasoning, Max Effort)은 입력 $5/출력 $25이며, Grok 4.20 Beta 0309 (Reasoning)은 입력 $2/출력 $6입니다.
코딩할 때 Claude와 Grok 중 뭐가 나은가요?
2026년 Artificial Analysis Coding Index 기준으로 Claude Opus 4.6 (Adaptive Reasoning, Max Effort)이 48.1, Grok 4.20 Beta 0309 (Reasoning)이 42.2을 기록합니다. 실제 개발 환경에서는 용도에 따라 선택이 달라집니다.