AI数字人AI视频工具

DUIX

duix.ai是一款智能数字人交互平台,支持开发者自行接入多方大模型、语音识别、语音合成能力,实现数字人实时交互,并在Android和iOS多终端一键部署,应用场景广泛。

标签:

什么是"DUIX"?

duix.ai是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

"DUIX"有哪些功能?

1. 支持数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力。
2. 实现数字人实时交互,并在Android和iOS多终端一键部署。
3. 轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

产品特点:

1. 部署成本低,无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。
2. 网络依赖小,适合地铁、银行、政务等多种场景的虚拟助理自助服务。
3. 功能多样化,可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。

应用场景:

1. 视频行业:支持视频内容的数字人交互,提供智能化的视频服务。
2. 客服行业:用于客户服务的虚拟助理自助服务,减少人力成本。
3. 金融行业:应用于金融领域,提供智能化的金融服务。

"DUIX"如何使用?

用户可以通过开源的数字人交互能力,自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

常见问题:

1. 免费形象模型是否可以商用?可以支持数字人定制吗?是基于照片还是视频?
答:免费提供的形象模型不可商用!如有需要可以支持数字人定制,我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务,您可以通过微信扫码与我们联系。
2. 如何定制形象?
答:定制硅基数字人需要拍摄一段3-5分钟的真人出镜口播视频,具体出镜姿势、口播内容,可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频,即可选择正装出镜,口播法律相关内容,这样整体情景比较一致。
3. 定制形象如何收费?
答:我们提供与SDK开源接口配套的数字人定制,包括形象+声音,若有更多定制需求,可以联系客服邮箱。
4. 数字人形象怎么更新?
答:目前开源的主要提供公共模特,有需求可以定制
5. 形象克隆有API接口么?
答:训练服务目前只支持部署在我们的内部服务器进行调用
6. 播报的wav文件,支持流式数据吗?
答:流式驱动正在做改造优化,暂时还不支持;
7. 播报开始结束有没有相关回调方法?
答:播报开始结束的回调方法详见sdk文档
8. 数字人动作有没有相关api控制?
答:数字人动作API,暂时还不支持
9. 下载的文件如何替换?
答:下载文件的替换详见代码

数据统计

相关导航

暂无评论

暂无评论...