2026-05-02 기준 · Artificial Analysis 벤치마크
Claude vs Grok 비교
Anthropic Claude와 xAI Grok의 성능·속도·가격을 벤치마크 데이터로 비교합니다.
종합 성능은 Claude가 8점 앞서며, Grok 대비 확실한 우위를 보입니다. API 비용은 Grok가 약 540% 저렴합니다. 응답 속도는 Grok가 약 4.1배 빠릅니다.
C
Claude
Anthropic
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)95
Claude Opus 4.6 (Adaptive Reasoning, Max Effort)87
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)85
Claude Opus 4.7 (Non-reasoning, High Effort)85
Claude Opus 4.5 (Reasoning)81
G
Grok
xAI
Grok 4.387
Grok 4.20 0309 v2 (Reasoning)80
Grok 4.20 0309 (Reasoning)79
최고 모델 1:1 비교
Claude Opus 4.7 (Adaptive Reasoning, Max Effort)
항목
Grok 4.3
95
종합 점수
87
57.30
Intelligence
53.20
52.50
코딩 지수
41
0.91
GPQA
0.90
0.40
HLE
0.35
50.56 tps
속도
205.35 tps
5$/M
입력 가격
1.25$/M
25$/M
출력 가격
2.50$/M
10$/M
혼합 비용
1.56$/M
점수 시각 비교
종합 성능
Claude95
Grok87
Intelligence Index
Claude57.3
Grok53.2
Coding Index
Claude52.5
Grok41
속도 (tps)
Claude50.6
Grok205.4
용도별 추천
🏆
종합 성능Claude
벤치마크 종합 점수 기준 최고 성능 모델
💻
코딩Claude
Coding Index 기준 코드 생성·완성 능력
⚡
속도Grok
API 출력 속도(tokens/sec) 기준
💰
가격Grok
혼합 비용(blended cost) 기준 경제성
전체 모델 상세 비교
종합 순위 기준 전체 Claude·Grok 모델
| 모델명 | 순위 | 점수 |
|---|---|---|
Claude Opus 4.7 (Adaptive Reasoning, Max Effort) | #4 | 95 |
Grok 4.3 | #10 | 87 |
Claude Opus 4.6 (Adaptive Reasoning, Max Effort) | #11 | 87 |
Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort) | #13 | 85 |
Claude Opus 4.7 (Non-reasoning, High Effort) | #14 | 85 |
Claude Opus 4.5 (Reasoning) | #24 | 81 |
Grok 4.20 0309 v2 (Reasoning) | #29 | 80 |
Grok 4.20 0309 (Reasoning) | #31 | 79 |
Claude Opus 4.6 (Non-reasoning, High Effort) | #39 | 75 |
Claude Sonnet 4.6 (Non-reasoning, High Effort) | #42 | 72 |
자주 묻는 질문
Claude와 Grok 중 어떤 AI가 더 좋나요?
용도에 따라 다릅니다. 2026년 기준 Claude Opus 4.7 (Adaptive Reasoning, Max Effort)은 종합 점수 95점이며, Grok 4.3은 87점을 기록합니다. Artificial Analysis 벤치마크 데이터 기반으로 매일 업데이트됩니다.
Claude와 Grok의 가격 차이는 얼마나 되나요?
API 가격 기준으로 Claude Opus 4.7 (Adaptive Reasoning, Max Effort)은 입력 $5/출력 $25이며, Grok 4.3은 입력 $1.25/출력 $2.5입니다.
코딩할 때 Claude와 Grok 중 뭐가 나은가요?
2026년 Artificial Analysis Coding Index 기준으로 Claude Opus 4.7 (Adaptive Reasoning, Max Effort)이 52.5, Grok 4.3이 41을 기록합니다. 실제 개발 환경에서는 용도에 따라 선택이 달라집니다.