腾讯混元开源语音数字人模型

快讯零壹财经零壹财经 2025-05-28 阅读：2270

关键词：腾讯 混元 大模型 人工智能

5月28日讯，腾讯混元联合腾讯音乐天琴实验室发布并开源语音模型HunyuanVideo-Avatar。该模型基于混元视频大模型（HunyuanVideo）及MuseV技术，支持头肩、半身、全身景别，覆盖多风格、多物种及双人场景，为视频创作者提供高一致性、高动态性的生成能力。
用户仅需上传人物图像与音频，模型即可智能解析环境与情感（如海边场景、抒情音乐），自动生成唇形同步、表情自然且动作协调的视频。例如，输入“沙滩弹吉他女性图片+抒情音频”，模型将输出人物弹唱的动态视频。
此次开源旨在推动AI视频创作工具普及，助力内容生态创新。（腾讯混元公众号）

上一篇>苹果推广iPhone Tap to Pay功能已在欧洲八国上线

下一篇>Anthropic 为 Claude 聊天机器人推出语音模式