每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 8 月 9 日的最新 AI 信息。
前沿资讯
1、阿里推出 Qwen2-Math 系列的模型,专注于解决数学问题。
分别有 1.5B、7B、72B 三种参数,其中 72B 在基准测试中数学能力超过了 GPT-4o 和 Claude 3.5。
详细介绍:https://qwenlm.github.io/blog/qwen2-math/
模型下载:https://huggingface.co/collections/Qwen/qwen2-math-66b4c9e072eda65b5ec7534d
不过,目前模型只支持英文,中英双语的模型后续再推出。
2、谷歌宣布 Gemini 1.5 Flash 降价!
输入成本下降了 78%,输出成本下降了 71%,同时 API 语言的支持添加 100 多种,
详细介绍:https://developers.googleblog.com/en/gemini-15-flash-updates-google-ai-studio-gemini-api/
3、苹果开源了一个新的图像生成模型和训练方法。
通过使用包含 1200 万张图像的 CC12M 数据集进行训练,得到一个高质量的图像扩散模型。
GitHub:https://github.com/apple/ml-mdm
在 GitHub 仓库上提供了代码库的结构概览、核心概念、教程等内容,感兴趣的可看下。
开源模型
1、一个针对角色扮演和对话优化的语言模型 Peach-9B-8k-Roleplay。
基于 Yi-1.5-9B 模型使用超过 10 万条合成对话数据进行微调,专门针对角色扮演和对话场景,支持中英文双语。
模型下载:https://huggingface.co/ClosedCharacter/Peach-9B-8k-Roleplay
学习教程
1、手把手教你实现多模态语言模型的视频教程。
时长约 6 小时,每一步有详细的图文并茂解释,手把手写代码,带你了解多模态语言模型的核心机制。