11 月 29 日

今日精选的前沿 AI 信息，欢迎阅读 👇

💡 阿里发布 QwQ 推理模型，多项能力与 OpenAI o1 相媲美，在数学理解与解题方面表现更优，但仍存在语言切换等局限性。

🎥 ConsisID 模型实现根据单张人物照片生成保持角色一致性的视频，目前生成质量一般但角色一致性表现不错。

🎬 Google 推出 Generative Omnimatte 视频分解技术，能将视频拆分为带透明度的 RGBA 层，实现背景修改、角色更换等功能。

1、阿里推出基于 QWen 的推理模型：QwQ。

多项能力与 OpenAI o1 模型相媲美，甚至在解决数学问题以及理解数学的测试中，评分超越 o1 模型。

目前处于预览版，存在一些局限性，如语言切换、推理循环、安全性、能力差异等问题。

1、一个能保持角色一致性的视频生成模型：ConsisID。

只需提供一张人物参考图，即可通过文本生成高质量的视频，同时能保持人物的一致性。

测试了下，生成的视频质量一般，但角色一致性保持的还不错，值得关注下。

2、Google 发布一种视频分解技术：Generative Omnimatte。

能够将输入视频分解成一系列具有透明度的 RGBA 层，每层包含一个完整的对象，可以是物体或人物。

该技术可以应用到很多场景，比如修改背景、更换角色、移除指定区域等等。