Insert Anything：开源图片无缝插入编辑框架

三花AI

于 2025-05-08 10:10:22 发布

阅读量292

点赞数 5

CC 4.0 BY-SA版权

分类专栏：三花AI 文章标签：人工智能 AI作画开源数字人

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51674085/article/details/147781672

三花AI 专栏收录该内容

834 篇文章

订阅专栏

Insert Anything：开源图片无缝插入编辑框架

Insert Anything[1] 是一个开源的图片编辑框架，能够将参考图中的人物、物体和服装等元素无缝插入到目标场景中。

效果非常不错，佬们可以在 HF 的在线演示[2]亲自试试。

腾讯 FlexiAct 视频动作克隆：真人/动漫/动物全支持

FlexiAct[3]是腾讯 ARC 实验室推出的视频动作克隆技术。

该技术能够精准地将参考视频中的动作迁移到目标角色上，实现跨类别动作克隆，包括真人、动漫角色和动物之间的动作迁移。

演示效果不错，目前数据集和代码均已开源。

HeyGen 发布 Avatar IV 数字人

HeyGen 发布了 Avatar IV 数字人模型，只需一张照片、一段脚本和语音，用户即可快速生成高度逼真的数字人视频。新模型采用“扩散式音频驱动表情引擎”，能根据语音的节奏、语调和情感，合成自然的面部表情和微动作，支持侧脸图像、多角度变化及唱歌节奏同步。

除了精准的唇部同步外，Avatar IV 还能'理解'语义与情感，自动生成暂停、点头等细腻动作。目前支持最长 30 秒的音频或文本脚本输入。

所有人每个月都能免费生成 3 个视频（免费用户最长10秒），官方还有一个简单的教程[4]也可以看看。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。