每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 8 月 10 日的最新 AI 信息。
前沿资讯
1、阿里的音频模型 Qwen2-Audio 放出在线体验 Demo。
可以通过语音输入与模型进行交互,并根据语音指令执行音频分析和解读各种类型的音频信息。
在线体验:https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
目前支持中文、粤语、英语、法语、日语等 8 种语言,让我挺意外的是,竟然支持粤语。
AI 绘画
1、谷歌的图像生成模型 Imagen 3,正式开放给所有人使用!
支持局部重绘功能,可用画笔和提示词对图片进行二次编辑。
使用地址:https://aitestkitchen.withgoogle.com/zh/tools/image-fx
注意部分地区暂时不支持使用,亲测日本可以。
2、图像生成王炸产品 FLUX 的 ControlNet 可在线体验了!
体验地址:https://huggingface.co/spaces/DamarJati/FLUX.1-DEV-Canny
目前仅支持的 ControlNet 的 Canny 模式。
学习工具
1、一个 Transformer 可视化交互式学习工具:Transformer Explainer。
以 GPT-2 为例子,通过输入文本来实时观察各个组件(嵌入层、自注意力机制、MLP等)如何处理,最终预测下一个 Token。
GitHub:https://github.com/poloclub/transformer-explainer
学习地址:https://poloclub.github.io/transformer-explainer/
这种通过可视化和交互功能带大家了解 Transformer 的内部组件,特别适合教学,非常形象。感兴趣的看看。