8 月 10 日

每天花 1 分钟时间，获取精选的前沿 AI 信息。

内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。

关注 AI 日报，紧跟 AI 潮流，希望对你有所帮助。对于重要信息，会独立发帖进行详细介绍。

以下是 8 月 10 日的最新 AI 信息。

1、阿里的音频模型 Qwen2-Audio 放出在线体验 Demo。

可以通过语音输入与模型进行交互，并根据语音指令执行音频分析和解读各种类型的音频信息。

目前支持中文、粤语、英语、法语、日语等 8 种语言，让我挺意外的是，竟然支持粤语。

1、谷歌的图像生成模型 Imagen 3，正式开放给所有人使用！

支持局部重绘功能，可用画笔和提示词对图片进行二次编辑。

注意部分地区暂时不支持使用，亲测日本可以。

2、图像生成王炸产品 FLUX 的 ControlNet 可在线体验了！

目前仅支持的 ControlNet 的 Canny 模式。

1、一个 Transformer 可视化交互式学习工具：Transformer Explainer。

以 GPT-2 为例子，通过输入文本来实时观察各个组件（嵌入层、自注意力机制、MLP等）如何处理，最终预测下一个 Token。

这种通过可视化和交互功能带大家了解 Transformer 的内部组件，特别适合教学，非常形象。感兴趣的看看。