今日精选的前沿 AI 信息,欢迎阅读 👇
📹 AnchorCrafter:通过人物图像 + 产品图 + 动作视频,,即可生成自然逼真的电商带货视频,人物与产品互动效果出色。
👗 TryOffDiff:创新服装摘取技术,能从人物照片中提取穿着服装的形状和纹理,生成标准化服装图,可与其他虚拟试穿技术配合使用。
🔊 Auralis 开源高性能文本转语音框架发布,支持多语言和语音克隆,速度快且内存占用低,10 分钟可转换整本《哈利·波特》有声书。
前沿技术
1、一个可生成逼真和具有交互的电商带货视频工具:AnchorCarfter。
只需提供人物图像 + 产品图 + Pose 动作视频,即可生成让人物拿着产品进行介绍的逼真带货视频。
详细介绍:https://cangcz.github.io/Anchor-Crafter/
看到演示视频效果非常好,人和物体交互协调,动作自然真实,看起来像真人在介绍产品一样。
不过目前代码还未开源,但值得关注一下。
2、一种高保真服装重建的虚拟试穿技术:TryOffDiff。
与以往的虚拟试穿有所不同,该技术是通过捕捉照片上人物穿着服装的形状、纹理和复杂图案,从而转换成标准化的服装产品图。
详细介绍:https://rizavelioglu.github.io/tryoffdiff/
在线体验:https://huggingface.co/spaces/rizavelioglu/tryoffdiff
可搭配此前的虚拟试穿技术,先利用 TryOffDiff 将人物身上的服装摘取下来,然后再穿到另外一个人身上。
开源项目
1、一款高性能的开源文本转语音框架:Auralis。
能够以超快的速度实现文本转自然语音,并且支持语音克隆,内存占用低,可同时处理多个请求。
GitHub:https://github.com/astramind-ai/Auralis
支持多种语言,包括英语、西班牙语、法语以及中文等,另外还可以进行音频质量增强和噪音消除。
官方在 3090 显卡上测试,能够在 10 分钟内完成整本《哈利波特》小说的语音抓换。有需求的值得一试。