
Fish Audio
🎤 음성/TTSTTS음성합성보이스클로닝
소개
Fish Audio는 오픈소스 TTS 기술 기반의 AI 음성 생성 플랫폼으로, 200만 개 이상의 음성 라이브러리와 10초 샘플 보이스 클로닝을 제공합니다. 감정 태그를 활용한 표현력 있는 음성 합성, 다화자 음성 인식(STT), 실시간 스트리밍 API 등을 지원하며 한국어 포함 30개 이상 언어를 처리합니다. 무료 플랜부터 기업용 Max 플랜까지 다양한 요금제를 제공하고, 공식 사이트는 한국어 UI를 완전 지원합니다.
장점
- 한국어 UI 완전 지원 및 한국어 TTS 생성 가능
- 10초 음성 샘플로 보이스 클로닝 — 전문 성우 대비 90~95% 비용 절감
- 200만 개 이상 사용자 업로드 음성 라이브러리 활용 가능
- 감정 태그(화남·속삭임·흥분 등)로 표현력 있는 음성 생성
- REST API·SDK 제공으로 개발자 통합이 용이
단점
- 무료 플랜은 월 7분·500자/회로 제한이 빠듯함
- 상업적 사용은 Plus($11/월) 이상 유료 플랜 필수
- 한국어 결제 수단(카카오페이 등) 지원 여부 미확인
주요 활용 사례
- 유튜브·광고 영상 나레이션 자동 생성
- 오디오북 제작 및 출판
- 게임·애니메이션 캐릭터 보이스 생성
- 고객 지원 챗봇 음성 출력
- 다국어 콘텐츠 음성 더빙
- 브랜드 전용 AI 보이스 제작
- 실시간 음성 에이전트 구축
핵심 기능
AI 텍스트 음성 변환(TTS)
감정 태그(화남, 슬픔, 속삭임 등)를 삽입하여 표현력 있는 음성을 초저지연으로 생성합니다.
보이스 클로닝
10초 분량의 음성 샘플만으로 자연스러운 보이스 클론을 생성하며, 다국어 발화가 가능합니다.
음성 인식(STT)
다화자 음성을 텍스트로 전사하며 감정 태그와 자연어 설명을 포함합니다.
200만+ 음성 라이브러리
사용자 업로드 기반 200만 개 이상의 음성 모델을 탐색·활용할 수 있습니다.
실시간 스트리밍 API
REST 엔드포인트와 SDK를 통해 초저지연 실시간 음성 스트리밍을 지원합니다.
30개+ 다국어 지원
한국어, 영어, 일본어, 중국어, 프랑스어, 독일어, 아랍어, 스페인어 등 30개 이상 언어를 지원합니다.
보이스 에이전트
대화형 애플리케이션을 위한 엔드투엔드 음성 에이전트 솔루션을 제공합니다.
공식 사이트 2026-04-19 검증
영상 가이드
💰 요금제 (2026-04-19 기준)
Free
$0/mo
- · 월 7분 생성
- · 500자/회 제한
- · 음성 슬롯 3개(공개)
- · 월 8,000 크레딧
Plus
$11/mo
- · 월 200분 생성
- · 15,000자/회 제한
- · 무제한 공개 + 비공개 10개 슬롯
- · 상업적 사용 가능
Pro
$75/mo
- · 월 1,620분 생성
- · 30,000자/회 제한
- · 팀 시트 3개 포함
- · 월 2,000,000 크레딧
Max
$749/mo
- · 월 6,250분 생성
- · 30,000자/회 제한
- · 팀 시트 10개 포함
- · 월 25,000,000 크레딧
🇰🇷 한국 사용자 안내
- 한국어 UI:
- ✅ 한국어 UI 지원
- 결제:
- 확인 필요
공식 사이트가 /ko/ 경로로 한국어 UI를 완전 제공하며, TTS 엔진이 한국어 음성 합성을 지원합니다.
❓ 자주 묻는 질문
Fish Audio는 무료로 사용할 수 있나요?
무료 플랜에서 월 7분, 회당 500자까지 개인 용도로 사용할 수 있습니다. 상업적 사용은 Plus($11/월) 이상 유료 플랜이 필요합니다.
보이스 클로닝에 필요한 최소 음성 샘플은?
최소 10초 분량의 음성 샘플이면 자연스러운 보이스 클론을 생성할 수 있습니다. 15초 이상이면 더 높은 충실도를 얻을 수 있습니다.
한국어 음성 생성이 가능한가요?
네, 한국어를 포함한 30개 이상 언어의 TTS를 지원합니다. 사이트 UI도 한국어로 완전 제공됩니다.
API를 통한 개발자 통합이 가능한가요?
Plus 이상 플랜에서 REST API와 SDK를 제공하며, 실시간 스트리밍과 pay-as-you-go 방식을 지원합니다.
전문 성우 대비 비용은 어떤가요?
공식 사이트 기준 전문 성우 대비 90~95% 비용 절감이 가능하다고 안내하고 있습니다.
감정 표현이 가능한가요?
화남, 슬픔, 흥분, 속삭임 등 감정 태그와 웃음, 탄식, 군중 반응, 일시정지 등 특수 효과를 삽입할 수 있습니다.
2026-04-19 검증 · 변경 가능


