首页 > 快讯

腾讯混元开源语音数字人模型

快讯 零壹财经 零壹财经 2025-05-28 阅读:543

关键词:腾讯混元大模型人工智能


5月28日讯,腾讯混元联合腾讯音乐天琴实验室发布并开源语音数字人模型HunyuanVideo-Avatar。该模型基于混元视频大模型(HunyuanVideo)及MuseV技术,支持头肩、半身、全身景别,覆盖多风格、多物种及双人场景,为视频创作者提供高一致性、高动态性的生成能力。  
用户仅需上传人物图像与音频,模型即可智能解析环境与情感(如海边场景、抒情音乐),自动生成唇形同步、表情自然且动作协调的视频。例如,输入“沙滩弹吉他女性图片+抒情音频”,模型将输出人物弹唱的动态视频。  
此次开源旨在推动AI视频创作工具普及,助力内容生态创新。(腾讯混元公众号)

上一篇>苹果推广iPhone Tap to Pay功能 已在欧洲八国上线

下一篇>Anthropic 为 Claude 聊天机器人推出语音模式



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 156ms