今日精选的前沿 AI 信息,欢迎阅读 👇
🎭 GaussianSpeech:输入语音即可生成高保真 3D 人物头像动画,支持多语言且面部表情丰富自然。
🧍 PSHuman 单图 3D 人体重建技术,可保留人物身份特征和服装细节,但人脸重建效果有待提升。
🎬 ComfyUI-LTXTricks 开源 ComfyUI 节点,增强 LTX 视频模型控制能力,支持图像转视频、风格迁移等功能,效果出色。
前沿技术
1、一种创新性高保真的 3D 头像动画生成技术:GaussianSpeech。
只需要通过输入一段语音,即可生成高保真、3D 一致的人类头部形象动画,具有丰富的面部表情和细节,如嘴唇动作、皱纹和眼睛的光泽等。
详细介绍:https://shivangi-aneja.github.io/projects/gaussianspeech/
人物的表现自然逼真,包括嘴型同步、面部的变化,甚至还能让它唱歌也没问题,支持多种语言(中文、英语、西班牙语等)。
看起来非常真实,目前代码还没有发布,感兴趣的可以留意下。
2、一种 3D 人体模型重建技术:PSHuman。
只需要一张人物图像,就能重建出高度逼真且保留身份特征的人体 3D 模型。
详细介绍:https://penghtyx.github.io/PSHuman/
效果看着一般,人脸型有些变形,不过衣服保持得挺不错的。
开源项目
1、一组用于增强 LTX 视频模型的控制能力 ComfyUI 节点:ComfyUI-LTXTricks。
主要为 LTX 视频模型提供了额外的控制选项,包括图像转视频、视频风格迁移以及视频局部编辑等增强功能。
GitHub:https://github.com/logtd/ComfyUI-LTXTricks
从给出来的效果来看,效果非常好,得益于强大开源 LTX 视频模型,感兴趣的可以试试。