AI인사이트 로고AI인사이트
AI 도구 디렉토리
Inception (Mercury)

Inception (Mercury)

💬 대화형 AI디퓨전LLM초고속추론API

📋 소개

Inception Labs의 Mercury는 디퓨전 기술을 언어 모델에 적용한 세계 최초 상용 dLLM(diffusion Large Language Model)입니다. Mercury 2는 NVIDIA Blackwell GPU에서 초당 1,009 토큰을 처리하며, Claude 4.5 Haiku(89 tok/s)나 GPT-5 Mini(71 tok/s) 대비 약 10배 빠릅니다. 128K 컨텍스트 윈도우, 조절 가능한 추론 깊이, 도구 사용, JSON 출력을 지원합니다. 입력 $0.25/백만 토큰, 출력 $0.75/백만 토큰으로 Gemini 3 Flash 대비 절반 이하의 비용입니다. 텍스트를 동시에 여러 블록씩 정제하는 방식으로, 기존 순차 토큰 생성과는 근본적으로 다른 아키텍처입니다.

✅ 장점

  • 기존 LLM 대비 10배 빠른 추론 속도
  • 경쟁 모델 대비 매우 저렴한 API 가격
  • 128K 컨텍스트 윈도우 지원

⚠️ 단점

  • 한국어 미지원
  • API 전용으로 일반 사용자 접근 어려움

💡 주요 활용 사례

초저지연 AI 챗봇 구축대규모 텍스트 생성 파이프라인비용 효율적인 AI API 통합실시간 AI 응답이 필요한 서비스 개발

💰 가격

유료

🇰🇷 한국어

🌐 미지원 — 영어만 지원

🏷️ 카테고리

💬 대화형 AI

Inception (Mercury) 사이트 방문

🔄 같은 카테고리 도구