今日精选的前沿 AI 信息,欢迎阅读 👇
🎧 Eleven Labs 推出 AI 播客功能,支持将各类文本转换为 32 种语言的播客内容。
🎨 IC-Light 更新 v2 版本,增强了照明效果和修改功能,可在 Hugging Face 上免费体验,但暂未开源。
📹 Google 发布 CATD 模型,可将单视角视频转换为多视角,并构建动态 4D 场景,对影视制作和 VR/AR 领域具有重要意义。
前沿资讯
1、Eleven Labs 推出 AI 播客功能。
现在可以在 ElevenReander iOS 客户端上将任何 PDF、文章、电子书、链接或文本生成 32 种语言的 AI 个人播客。
详细介绍:https://elevenlabs.io/genfm
不过,Eleven Labs 的中文一直都比较拉垮,个人觉得费曼的中文口音稍微好点,可以试下。
AI 绘画
1、 IC-Light v2 版本有所更新。
可以生成更强烈的照明以及进行修改,不过目前没有开源。
在线体验:https://huggingface.co/spaces/lllyasviel/iclight-v2-vary
目前可以在 Hugging Face 上体验,效果很不错,有需求的值得关注下。
前沿技术
1、Google 推出多视角视频生成模型:CATD。
利用模型,能够从单个视角视频生成多个视角视频,并利用这些视频构建动态的 4D 场景。
详细介绍:https://cat-4d.github.io/
此外,它还能处理和操作视频中的相机运动和场景中物体的运动,这对于电影制作、虚拟现实和增强现实有很大帮助。