腾讯混元宣布并开源图生视频模子:让照片启齿
发布时间:2025-03-07 09:40
快科技3月6日新闻,本日,腾讯混元发布宣布图生视频模子并对外开源,同时上线对口型与举措驱动等弄法,并支撑天生配景音效及2K高品质视频。企业跟开辟者可在腾讯云请求应用API接口,用户经由过程混元AI视频官网即可休会。开源内容包括权重、推理代码跟LoRA练习代码,支撑开辟者基于混元练习专属LoRA等衍生模子,现在在Github、HuggingFace等主流开辟者社区均可下载休会。据先容,基于图生视频的才能,用户只要上传一张图片,并冗长描写盼望画面怎样活动、镜头怎样调理等,混元即可按请求让图片动起来,酿成5秒的短视频,还能主动配上配景音效。别的,上传一张人物图片,并输入澳门永利官方登录入口盼望“对口型”的笔墨或音频,图片中的人物即可“谈话”或“唱歌”;应用“举措驱动”才能,还能一键天生同款舞蹈视频。腾讯混元表现,此次开源的图生视频模子,是混元文生视频模子开源任务的连续,模澳门永利皇宫官网入口子总参数目坚持 130 亿,模皇冠体育官方网站子实用于多品种型的脚色跟场景,包含写实视频制造、动漫脚色乃至CGI脚色制造的天生。【本文停止】如需转载请务必注明出处:快科技义务编纂:拾柒