Insert Anything:开源图片无缝插入编辑框架
Insert Anything[1] 是一个开源的图片编辑框架,能够将参考图中的人物、物体和服装等元素无缝插入到目标场景中。
效果非常不错,佬们可以在 HF 的在线演示[2]亲自试试。
腾讯 FlexiAct 视频动作克隆:真人/动漫/动物全支持
FlexiAct[3]是腾讯 ARC 实验室推出的视频动作克隆技术。
该技术能够精准地将参考视频中的动作迁移到目标角色上,实现跨类别动作克隆,包括真人、动漫角色和动物之间的动作迁移。
演示效果不错,目前数据集和代码均已开源。
HeyGen 发布 Avatar IV 数字人
HeyGen 发布了 Avatar IV 数字人模型,只需一张照片、一段脚本和语音,用户即可快速生成高度逼真的数字人视频。新模型采用“扩散式音频驱动表情引擎”,能根据语音的节奏、语调和情感,合成自然的面部表情和微动作,支持侧脸图像、多角度变化及唱歌节奏同步。
除了精准的唇部同步外,Avatar IV 还能'理解'语义与情感,自动生成暂停、点头等细腻动作。目前支持最长 30 秒的音频或文本脚本输入。
所有人每个月都能免费生成 3 个视频(免费用户最长10秒),官方还有一个简单的教程[4]也可以看看。