今日精选的前沿 AI 信息,欢迎阅读 👇
💡 阿里发布 QwQ 推理模型,多项能力与 OpenAI o1 相媲美,在数学理解与解题方面表现更优,但仍存在语言切换等局限性。
🎥 ConsisID 模型实现根据单张人物照片生成保持角色一致性的视频,目前生成质量一般但角色一致性表现不错。
🎬 Google 推出 Generative Omnimatte 视频分解技术,能将视频拆分为带透明度的 RGBA 层,实现背景修改、角色更换等功能。
前沿资讯
1、阿里推出基于 QWen 的推理模型:QwQ。
多项能力与 OpenAI o1 模型相媲美,甚至在解决数学问题以及理解数学的测试中,评分超越 o1 模型。
详细介绍:https://qwenlm.github.io/zh/blog/qwq-32b-preview/
在线体验:https://huggingface.co/spaces/Qwen/QwQ-32B-preview
目前处于预览版,存在一些局限性,如语言切换、推理循环、安全性、能力差异等问题。
前沿技术
1、一个能保持角色一致性的视频生成模型:ConsisID。
只需提供一张人物参考图,即可通过文本生成高质量的视频,同时能保持人物的一致性。
详细介绍:https://pku-yuangroup.github.io/ConsisID/
在线体验:https://huggingface.co/spaces/BestWishYsh/ConsisID-preview-Space
测试了下,生成的视频质量一般,但角色一致性保持的还不错,值得关注下。
2、Google 发布一种视频分解技术:Generative Omnimatte。
能够将输入视频分解成一系列具有透明度的 RGBA 层,每层包含一个完整的对象,可以是物体或人物。
详细介绍:https://gen-omnimatte.github.io/
该技术可以应用到很多场景,比如修改背景、更换角色、移除指定区域等等。