AI인사이트 로고AI Insight
Inception (Mercury)

Inception (Mercury)

💬 대화형 AI디퓨전LLM초고속추론API

소개

Inception Labs의 Mercury는 디퓨전 기술을 언어 모델에 적용한 세계 최초 상용 dLLM(diffusion Large Language Model)입니다. Mercury 2는 기존 LLM 대비 약 10배 빠른 추론 속도를 제공하며, 입력 $0.25/백만 토큰, 출력 $0.75/백만 토큰으로 경쟁 모델 대비 매우 저렴합니다. OpenAI API 호환 인터페이스로 기존 코드베이스에서 손쉽게 전환 가능하며, 코드 특화 모델(Mercury Edit 2), 멀티모달 기능, 실시간 음성 지원, 조절 가능한 추론 깊이 등을 제공합니다. AWS Bedrock과 Azure Foundry를 통한 엔터프라이즈 배포도 지원합니다.

장점

  • 기존 LLM 대비 약 10배 빠른 추론 속도로 실시간 응답 가능
  • 입력 $0.25/출력 $0.75(백만 토큰당)으로 경쟁 모델 대비 절반 이하 비용
  • OpenAI API 호환으로 기존 코드 수정 없이 base URL만 변경하여 전환 가능
  • instant~high 4단계 추론 깊이 조절로 속도-품질 트레이드오프 선택 가능
  • 신규 가입 시 1,000만 토큰 무료 제공으로 부담 없이 테스트 가능

단점

  • 한국어 지원 여부가 공식적으로 확인되지 않음
  • API 전용 서비스로 웹 채팅 인터페이스가 없어 개발자가 아닌 일반 사용자는 접근 어려움
  • 디퓨전 LLM은 아직 초기 기술로 기존 LLM 대비 생태계와 커뮤니티가 제한적
  • 최대 토큰 기본값이 8,192로, 긴 출력이 필요한 작업에서는 설정 조정 필요

주요 활용 사례

  • 초저지연 실시간 AI 챗봇 구축
  • 대규모 텍스트 일괄 생성 파이프라인 운영
  • 코드 자동완성 및 편집 도구 개발 (Mercury Edit 2)
  • 실시간 음성 기반 AI 어시스턴트 개발
  • 기존 OpenAI API 프로젝트의 비용 절감 전환
  • 에이전트 자동화 워크플로우 구축
  • 고객 지원 봇의 응답 속도 최적화

핵심 기능

디퓨전 기반 병렬 토큰 생성

기존 LLM의 순차 생성과 달리 여러 토큰을 동시에 생성하여 10배 빠른 추론 속도 달성

OpenAI API 호환

기존 OpenAI 클라이언트 라이브러리를 그대로 사용할 수 있는 드롭인 대체 API 제공

조절 가능한 추론 깊이

instant, low, medium, high 4단계로 추론 깊이를 조절하여 속도-품질 트레이드오프 선택 가능

코드 특화 모델 (Mercury Edit 2)

코드 편집과 자동완성에 최적화된 별도 dLLM 모델 제공

멀티모달 지원

텍스트, 오디오, 이미지, 영상을 포함하는 멀티모달 기능 제공

실시간 음성 지원

실시간 음성 워크플로우를 위한 초저지연 처리 지원

엔터프라이즈 배포

AWS Bedrock, Azure Foundry를 통한 배포 및 99.5%+ 가동률 SLA 보장

공식 사이트 2026-04-19 검증

💰 요금제 (2026-04-19 기준)

Free Tier

Free (10M tokens)

  • · 신규 가입 시 1,000만 토큰 무료 제공
  • · API 키 즉시 발급

Mercury 2

$0.25/1M input, $0.75/1M output

  • · 가장 빠른 추론 dLLM
  • · 범용 텍스트 생성

Mercury Edit 2

$0.25/1M input, $0.75/1M output

  • · 코드 편집 특화 dLLM
  • · 자동완성 최적화

🇰🇷 한국 사용자 안내

한국어 UI:
확인 필요
결제:
확인 필요
공식 사이트 및 문서에서 한국어 지원 관련 정보가 확인되지 않음. API 기반 서비스로 한국에서 접근은 가능하나, 한국어 UI나 결제 수단에 대한 명시적 정보 없음.

자주 묻는 질문

Mercury는 기존 LLM과 어떻게 다른가요?
Mercury는 디퓨전 기반 LLM(dLLM)으로, 기존 LLM이 토큰을 하나씩 순차적으로 생성하는 것과 달리 여러 토큰을 동시에 병렬 생성합니다. 이를 통해 기존 대비 10배 빠른 추론 속도를 달성합니다.
API 가격은 어떻게 되나요?
Mercury 2와 Mercury Edit 2 모두 입력 $0.25/백만 토큰, 출력 $0.75/백만 토큰입니다. 신규 가입 시 1,000만 토큰이 무료로 제공됩니다.
기존 OpenAI 코드로 바로 전환할 수 있나요?
네, OpenAI API 호환 인터페이스를 제공하므로 기존 OpenAI 클라이언트 라이브러리에서 base URL만 변경하면 바로 사용할 수 있습니다.
추론 깊이 조절이란 무엇인가요?
reasoning_effort 파라미터를 instant, low, medium, high로 설정하여 속도와 품질 사이의 균형을 조절할 수 있습니다. instant/low는 초저지연 시나리오에, medium/high는 복잡한 추론에 적합합니다.
엔터프라이즈 환경에서도 사용할 수 있나요?
AWS Bedrock과 Azure Foundry를 통해 배포 가능하며, 99.5% 이상 가동률 SLA와 프라이빗 배포 옵션을 제공합니다.
한국어를 지원하나요?
공식 문서에서 한국어 지원 여부가 명시되어 있지 않습니다. API 기반 서비스로 한국에서 접근은 가능하지만, 한국어 텍스트 처리 품질은 확인이 필요합니다.

2026-04-19 검증 · 변경 가능