今日精选的前沿 AI 信息,欢迎阅读 👇
🎵 豆包团队发布音乐生成框架 Seed-Music,媲美 Suno,支持克隆音色和细粒度风格控制!
🚀 OpenAI 提升 o1 模型使用额度,Plus 用户每周可用次数大增!
🎥 Luma AI 上线 AI 视频 API,首个开放可用的 AI 视频产品!
🖌️ InstantDrag 技术框架,通过拖动直接编辑图像,1 秒内交互式生成效果!
🎨 OmniGen 统一图像生成模型,无需额外模型实现绘图条件控制,期待开源!
前沿资讯
1、豆包团队发布音乐生成框架: Seed-Music,媲美 Suno!
除了支持歌词生成歌曲、歌词到乐谱再到歌曲以及歌曲编辑等多功能外。还有额外两个亮点:
- 支持克隆原歌曲音色并生成新歌曲,直接将以前爆火的 AI 孙燕姿产品化。
- 支持细粒度的风格控制,能保持旋律不变,仅修改歌词。
详细介绍:https://team.doubao.com/en/special/seed-music
目前暂时还没有放出体验入口,仅仅发布一些演示 Demo,看了下效果,似乎比 Suno 更加强!
2、OpenAI 提升 o1 模型的使用额度。
17 号宣布对 Plus 和 Team 用户,使用 o1 Preview 模型从 30次/周 提升到 50次/周,而 o1 mini 模型从 50次/周 提升到 50次/天。
3、Luma AI 上线 AI 视频 API 功能。
成为首个开放可用 API 的 AI 视频产品,之前可灵也上线 API 功能,但是需要特殊申请。
官网:https://lumalabs.ai/dream-machine/api
前沿技术
1、一个可通过拖动控制图像编辑的技术框架:InstantDrag。
直接在图片进行拖动要修改的地方和方向,无需输入提示词,约 1 秒内即可看到生成效果,进行交互式编辑图像。
详细介绍:https://joonghyuk.com/instantdrag-web/
AI 绘画
1、一个统一的图像生成模型:OmniGen。
旨在通过一个模型解决多种图像生成任务,不需要额外的 ControlNet 和 IPAdapter 模型,即可实现绘图条件控制。
GitHub:https://github.com/VectorSpaceLab/OmniGen
论文:https://arxiv.org/pdf/2409.11340
目前仅发布论文介绍,后续将会开源。