12 月 02 日

今日精选的前沿 AI 信息，欢迎阅读 👇

🎭 GaussianSpeech：输入语音即可生成高保真 3D 人物头像动画，支持多语言且面部表情丰富自然。

🧍 PSHuman 单图 3D 人体重建技术，可保留人物身份特征和服装细节，但人脸重建效果有待提升。

🎬 ComfyUI-LTXTricks 开源 ComfyUI 节点，增强 LTX 视频模型控制能力，支持图像转视频、风格迁移等功能，效果出色。

1、一种创新性高保真的 3D 头像动画生成技术：GaussianSpeech。

只需要通过输入一段语音，即可生成高保真、3D 一致的人类头部形象动画，具有丰富的面部表情和细节，如嘴唇动作、皱纹和眼睛的光泽等。

人物的表现自然逼真，包括嘴型同步、面部的变化，甚至还能让它唱歌也没问题，支持多种语言（中文、英语、西班牙语等）。

看起来非常真实，目前代码还没有发布，感兴趣的可以留意下。

2、一种 3D 人体模型重建技术：PSHuman。

只需要一张人物图像，就能重建出高度逼真且保留身份特征的人体 3D 模型。

效果看着一般，人脸型有些变形，不过衣服保持得挺不错的。

1、一组用于增强 LTX 视频模型的控制能力 ComfyUI 节点：ComfyUI-LTXTricks。

主要为 LTX 视频模型提供了额外的控制选项，包括图像转视频、视频风格迁移以及视频局部编辑等增强功能。

从给出来的效果来看，效果非常好，得益于强大开源 LTX 视频模型，感兴趣的可以试试。