开始

导言

Welcome to the documentation for Dubbix. A powerful solution designed to revolutionize the way you approach audio localization and content creation.

我们的 API v2 包含哪些内容?

我们的 API 简化了内容翻译。只需上传视频,即可轻松获得翻译结果。

API v1 过时通知

在 API v2 发布后,对 APIv1的支持已正式停止。

截至 2025 年 5 月,API v1 已完全废弃,无法再访问。

所有集成现在都应使用 API v2。

开始

局限性

第 2 版应用程序接口限制列表

我们一直在努力改进我们的应用程序接口,以下是目前存在的限制:

1.目前我们支持以下上传视频的方式:

通过链接上传,使用 Youtube、Google Drive、S3、Vimeo上的视频链接或直接访问链接;

从设备本地上传

2.我们的文档平台不支持上传文件(如本地文件上传端点srt 上传端点)。请使用 Postman、curl 或任何编程语言进行测试和执行。

3.目前还无法通过 API 生成带字幕的视频。在此期间,您可以使用我们的网络平台获取带有目标语言字幕的翻译视频版本。

应用程序接口文档

文本到语音 (TTS)

文本到语音(TTS)应用程序接口提供翻译和语音合成功能。它接受源语言文本,将其翻译为目标语言,并以原始音频字节或 WAV 文件的形式返回合成语音。

基本 URL:** `https://api.example.com`

终点

WebSocket /tts_stream/bytes

实时文本到语音流终端,可接受文本输入并在生成音频块时将其流回。

**URL:** `ws://api.example.com/tts_stream/bytes` 或`wss://api.example.com/tts_stream/bytes`。

**协议:** WebSocket

#### 连接

建立与端点的 WebSocket 连接。每个连接都会自动分配一个唯一的用户 ID。

#### 信息格式

发送具有以下结构的 JSON 信息

应用程序接口文档

语音转换


由您提供:

- 参考音频文件 **(您想模仿的声音)**
- 输入音频文件 **(您想用该声音表达的内容)**


该应用程序接口会返回一个转换后的 WAV 文件,其中包含以参考语音播报的输入内容。

## 端点

POST /voice_convert/vc

## 请求

### 页眉

accept: 应用程序/json
Content-Type: multipart/form-data

### 表格数据参数

reference_file (文件,必填) - 包含目标语音的参考音频文件(.wav 或 .mp3 input_file (文件,必填) - 包含要转换内容的输入音频文件(.wav 或 .mp3

## 示例请求

### cURL

发送具有以下结构的 JSON 信息

#### Python(请求)

``python
导入请求

## 限制:

- 参考音频文件应在 4 至 20 秒之间,建议在 12 至 15 秒之间。

## Notes

- Both files must be short enough for processing (recommend < 30MB each).
- Output is always returned as WAV.
- The endpoint streams the file back — remember to save the binary output.

应用程序接口文档

音视频摘要器

该应用程序接口允许您**上传音频或视频文件**并接收:

- **记录誊本**(发言内容的文本)
- **时间戳**(与记录誊本片段对齐)
- **摘要**(内容的简短版本)

1.总结音频/视频文件

**终点**

accept: 应用程序/json
Content-Type: multipart/form-data

**说明**

上传音频或视频文件(如".wav"、".mp3"、".mp4"),并获得誊本、时间戳和特定语言摘要。

## 使用建议:

+ Always include a unique `request_id` for better tracking.
+ Keep file sizes reasonable (<100MB recommended).

应用程序接口文档

配音/翻译

该端点对上传的音频或视频文件执行从源语言到目标语言的语音到语音翻译(配音)。如果输入的是视频文件,还可选择应用唇语同步。
应用程序接口文档

语音转语音

语音到语音 (S2S) API 提供实时音频翻译功能。它接受各种格式的音频文件,转录语音,将其翻译为目标语言,并返回目标语言的合成语音。该应用程序接口还支持说话者语音克隆,以保留原始说话者的语音特征。

**基础 URL:** `https://api.example.com`

## 端点

### POST /speech/translate

将语音从一种语言翻译成另一种语言,并将翻译后的音频以 WAV 文件格式返回。

**URL:** `POST /speech/translate`

**Content-Type:** `multipart/form-data`

Select Your Dubbix Account

Dubbing App

Essential AI tools for creators

The perfect app for fast, quality AI tasks. Great for creators needing quick dubbing, translations, and voice tools.

AI Creative Studio

Enterprise production tools

A powerful workspace for teams. Create, collaborate, and launch AI video projects like a pro.