2026-03-21 기준 · Artificial Analysis 벤치마크
Grok vs ChatGPT 비교
xAI Grok 시리즈와 OpenAI ChatGPT 시리즈의 종합 성능, 코딩, 속도, 가격을 벤치마크 데이터로 비교합니다.
G
Grok
xAI
Grok 4.20 Beta 0309 (Reasoning)83
C
ChatGPT
OpenAI
GPT-5.4 (xhigh)100
GPT-5.3 Codex (xhigh)94
GPT-5.2 (xhigh)89
GPT-5.2 Codex (xhigh)84
GPT-5.4 mini (xhigh)83
최고 모델 1:1 비교
Grok 4.20 Beta 0309 (Reasoning)
항목
GPT-5.4 (xhigh)
83
종합 점수
100
48.50
Intelligence
57.20
42.20
코딩 지수
57.30
0.89
GPQA
0.92
0.30
HLE
0.42
192.10 tps
속도
75.95 tps
2$/M
입력 가격
2.50$/M
6$/M
출력 가격
15$/M
3$/M
혼합 비용
5.63$/M
점수 시각 비교
종합 성능
Grok83
ChatGPT100
Intelligence Index
Grok48.5
ChatGPT57.2
Coding Index
Grok42.2
ChatGPT57.3
속도 (tps)
Grok192.1
ChatGPT75.9
용도별 추천
🏆
종합 성능ChatGPT
벤치마크 종합 점수 기준 최고 성능 모델
💻
코딩ChatGPT
Coding Index 기준 코드 생성·완성 능력
⚡
속도ChatGPT
API 출력 속도(tokens/sec) 기준
💰
가격Grok
혼합 비용(blended cost) 기준 경제성
전체 모델 상세 비교
종합 순위 기준 전체 Grok·ChatGPT 모델
| 모델명 | 순위 | 점수 |
|---|---|---|
GPT-5.4 (xhigh) | #1 | 100 |
GPT-5.3 Codex (xhigh) | #3 | 94 |
GPT-5.2 (xhigh) | #6 | 89 |
GPT-5.2 Codex (xhigh) | #11 | 84 |
GPT-5.4 mini (xhigh) | #12 | 83 |
Grok 4.20 Beta 0309 (Reasoning) | #13 | 83 |
GPT-5.1 (high) | #15 | 82 |
자주 묻는 질문
Grok와 ChatGPT 중 어떤 AI가 더 좋나요?
용도에 따라 다릅니다. 2026년 기준 Grok 4.20 Beta 0309 (Reasoning)은 종합 점수 83점이며, GPT-5.4 (xhigh)은 100점을 기록합니다. Artificial Analysis 벤치마크 데이터 기반으로 매일 업데이트됩니다.
Grok와 ChatGPT의 가격 차이는 얼마나 되나요?
API 가격 기준으로 Grok 4.20 Beta 0309 (Reasoning)은 입력 $2/출력 $6이며, GPT-5.4 (xhigh)은 입력 $2.5/출력 $15입니다.
코딩할 때 Grok와 ChatGPT 중 뭐가 나은가요?
2026년 Artificial Analysis Coding Index 기준으로 Grok 4.20 Beta 0309 (Reasoning)이 42.2, GPT-5.4 (xhigh)이 57.3을 기록합니다. 실제 개발 환경에서는 용도에 따라 선택이 달라집니다.