今日精选的前沿 AI 信息,欢迎阅读 👇
👨💼 OpenAI Sora 项目负责人 Tim Brooks 宣布离职,加入 Google DeepMind 团队。
🖼️ OpenAI 推出 Canvas 新功能,类似 Claude 的 Artifacts,提供独立窗口辅助写作和编码。
🎨 Flux 1.1 Pro 版本发布,性能提升 6 倍,并推出 BFL API 测试版。
🎧 ebook2audiobookXTTS:开源 AI 工具,将电子书转为高质量有声读物,支持多种语言和格式。
🌐 materialYouNewTab:高颜值浏览器主页插件,采用 Google Material You 设计风格,支持多种自定义功能。
前沿资讯
1、OpenAI Sora 项目负责人离职。
Tim Brooks 是 OpenAI Sora 的项目负责人,今天在 X 上宣布离职,跳槽到 Google DeepMind 团队,致力于视频生成。
原帖:https://x.com/_tim_brooks/status/1841982327431561528
Sora 迟迟不发布,现在熬到负责人离职...估计团队内部也存在一定问题。
2、OpenAI 推出新功能 Canvas。
类似于 Claude 的 Artifacts 功能,在侧边新增一个交互界面作为独立窗口,以直观的方式协助我们进行写作和编码等工作。
官网公告:https://openai.com/index/introducing-canvas/
目前处于 Beta 测试中,逐步向 Plus 和 Team 用户推送,等 Beta 测试结束才向免费用户开放。
AI 绘画
1、Black Forest Labs 发布 Flux 1.1 Pro 版本。
相比上个版本,在性能上提升了六倍,同时也提高了图像质量、提示词遵循度和多样性。
官方介绍:https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
此外,还推出了官方 BFL API 的测试版,提供了高度的定制化选项、可扩展性和极具竞争力的定价。
开源项目
1、一款能够电子书转有声书的开源 AI 工具:ebook2audiobookXTTS。
利用 Calibre 和 Coqui TTS,将电子书转换为高质量的有声读物,支持多种语言,并提供可选的语音克隆功能。
GitHub:https://github.com/DrewThomasson/ebook2audiobookXTTS
具有如下特点:
- 多格式支持:支持 epub、pdf、mobi 等 20 种常见电子书格式,几乎涵盖了所有主流类型。
- 声音定制:支持声音克隆,可选自定义 TTS 的声音。
- 高质量输出:使用 Coqui XTTS 进行高质量的文本到语音转换。
- 多语言支持:支持 16 种语言,包括英语、中文、日语等主流语言,默认英语。
- 易于使用:提供了详细的安装指南和多种使用方式,包括命令行、Web 界面和 Docker 容器。
- 轻量运行:仅需 4GB 内存就能流畅运行,对硬件要求较低。
- 输出格式:转换后的有声书输出为
.m4b
格式,包含了元数据和章节信息。
2、分享一款颜值颇高的浏览器主页插件:materialYouNewTab。
采用 Google Material You 的设计风格,提供了自定义搜索引擎、自定义快捷网站图标、主题切换等多种功能。
GitHub:https://github.com/XengShi/materialYouNewTab
无需任何权限,保证用户隐私和安全,感兴趣的可以安装体验下。