Начать

Введение

Welcome to the documentation for Dubbix. A powerful solution designed to revolutionize the way you approach audio localization and content creation.

Что находится внутри нашего API v2?

Наш API упрощает перевод контента. Просто загрузите видео и получите переведенный результат без особых усилий.

Уведомление об устаревании API v1

Поддержка API v1 была официально прекращена после выхода API v2.

По состоянию на май 2025 года API v1 полностью устарел и больше не доступен.

Все интеграции теперь должны использовать API v2.

Начать

Ограничения

Список ограничений API v2

Мы постоянно работаем над улучшением нашего API, однако здесь приведен список текущих ограничений:

1. В настоящее время мы поддерживаем следующие способы загрузки видео:

Загрузите видео по ссылке, используя ссылки на видео на Youtube, Google Drive, S3, Vimeo или прямую ссылку;

локальная загрузка с вашего устройства.

2. Наша игровая площадка документации не поддерживает загрузку файлов (например, для конечной точки загрузки локального файла или конечной точки загрузки srt. Вместо этого используйте Postman, curl или любой другой язык программирования для тестирования и выполнения.

3. Пока нет возможности генерировать видео с субтитрами через API. Эта функция будет добавлена в будущем, а пока вы можете воспользоваться нашей веб-платформой, чтобы получить версию переведенного видео с вписанными в него субтитрами на целевом языке.

Документация API

Передача текста в речь (TTS)

API Text-to-Speech (TTS) предоставляет возможности перевода и синтеза речи. Он принимает текст на исходном языке, переводит его на целевой язык и возвращает синтезированную речь в виде необработанных аудиобайтов или WAV-файла.

Базовый URL:** `https://api.example.com`

Конечные точки

WebSocket /tts_stream/bytes

Конечная точка потоковой передачи текста в речь в реальном времени, которая принимает текстовый ввод и передает аудиофрагменты по мере их создания.

**URL:** `ws://api.example.com/tts_stream/bytes` или `wss://api.example.com/tts_stream/bytes`.

**Протокол:** WebSocket

#### Соединение

Установите WebSocket-соединение с конечной точкой. Каждому соединению автоматически присваивается уникальный идентификатор пользователя.

#### Формат сообщения

Отправляйте JSON-сообщения со следующей структурой:

Документация API

Преобразование голоса

Эта конечная точка выполняет преобразование речи в голос.
Вы предоставляете:

- Эталонный аудиофайл **(голос, который вы хотите имитировать)**
- Входной аудиофайл **(контент, который вы хотите озвучить этим голосом)**.


API возвращает преобразованный WAV-файл с входным контентом, озвученным эталонным голосом.

## Конечная точка

POST /voice_convert/vc

## Запрос

### Заголовки

принимать: application/json
Content-Type: multipart/form-data

### Параметры данных формы

reference_file (файл, обязательно) - Эталонный аудиофайл (.wav или .mp3), содержащий целевой голос input_file (файл, обязательно) - Входной аудиофайл (.wav или .mp3), содержащий контент для преобразования

## Пример запросов

### cURL

Отправляйте JSON-сообщения со следующей структурой:

### Python (запросы)

``python
импорт запросов

## Ограничения:

- Референсный аудиофайл должен длиться от 4 до 20 секунд, рекомендуемый диапазон - 12-15 секунд.

## Примечания

- Both files must be short enough for processing (recommend < 30MB each).
- Output is always returned as WAV.
- The endpoint streams the file back — remember to save the binary output.

Документация API

Сумматор аудио и видео

Этот API позволяет **загружать аудио- или видеофайлы** и получать их:

- **Транскрипт** (текст устного содержания)
- **Временные метки** (выровнены с сегментами транскрипта)
- **Суммарка** (сокращенная версия содержания)

1. Резюме аудио/видео файла

**Конечная точка**

принимать: application/json
Content-Type: multipart/form-data

**Описание**

Загрузите аудио- или видеофайл (например, `.wav`, `.mp3`, `.mp4`) и получите в ответ расшифровку, временные метки и краткое описание на конкретном языке.

## Рекомендации по применению:

+ Always include a unique `request_id` for better tracking.
+ Keep file sizes reasonable (<100MB recommended).

Документация API

Дубляж/Перевод

Эта конечная точка выполняет перевод речи в речь (дубляж) загруженного аудио- или видеофайла с исходного языка на целевой. При желании можно применить синхронизацию губ, если в качестве исходного материала используется видеофайл.
Документация API

Переход от речи к речи

API Speech-to-Speech (S2S) предоставляет возможности перевода аудио в режиме реального времени. Он принимает аудиофайлы различных форматов, транскрибирует речь, переводит ее на целевой язык и возвращает синтезированную речь на целевом языке. API также поддерживает клонирование голоса диктора для сохранения характеристик голоса оригинального диктора.

**Базовый URL:** `https://api.example.com`

## Конечные точки

### POST /speech/translate

Переводит речь с одного языка на другой, возвращая переведенный звук в виде WAV-файла.

**URL:** `POST /speech/translate`

**Content-Type:** `multipart/form-data`.

Select Your Dubbix Account

Dubbing App

Essential AI tools for creators

The perfect app for fast, quality AI tasks. Great for creators needing quick dubbing, translations, and voice tools.

AI Creative Studio

Enterprise production tools

A powerful workspace for teams. Create, collaborate, and launch AI video projects like a pro.