每天仅需 1 分钟,全面获取 AI 技术发展、行业动态和市场趋势。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 7 月 17 日的最新 AI 信息。
前沿资讯
1、Claude 推出了 Android 客户端。
与 iOS 和 Web 端类似,可以使用视觉、多语言处理以及高级推理等功能。
下载地址:https://play.google.com/store/apps/details?id=com.anthropic.claude
2、OpenAI 前联合创始人 Andrej Karpathy,宣布成立 Eureka Labs 新型的 AI+教育 平台。
此前已在 GitHub 上放出的首个课程 LLM101n,手把手教你创建 LLM,仅仅只有目录,目前已经拥有了 18.3k Star。
3、Mistral 发布一个 MathΣtral 数学模型。
专为数学推理和科学发现而设计的特定 7B 模型,拥有 32k 上下文长度,以 Apache 2.0 许可开源可商用。
在多项基准测试中,均超越同类型的模型,如 DeepSeek Math 7B、QWen2 7B、Llama3 8B 等。
详细介绍:https://mistral.ai/news/mathstral/
模型下载:https://huggingface.co/mistralai/mathstral-7B-v0.1
前沿技术
1、又一个可在手机上运行的小型语言模型 SmolLM。
提供了 135M、360M 和 1.7B 三种大小参数,多项基准测试中,均优于其他同类型的模型。
详细介绍:https://huggingface.co/blog/smollm
3、阿里发布最新音频语言模型 Qwen-Audio。
能够接受各种音频信号输入,并根据语音指令执行音频分析和直接相应文本。提供两种不同的音频交互模式:
- 语音聊天 voice chat:可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入。
- 音频分析 audio analysis:可以在互动过程中提供音频和文本指令对音频进行分析。
目前只是发布论文,很快会提供模型下载以及在线体验。
详细介绍:https://github.com/QwenLM/Qwen2-Audio/blob/main/README_CN.md
开源项目
1、一个基于 GraphRAG 的本地模型适配开源项目 GraphRAG-Ollama-UI。
通过对微软 GraphRAG 的本地化适配,与 Ollama 集成,并提供了可视化交互的界面。
支持上传、编辑以及删除等文件管理,可实时可视化知识图谱,支持使用本地模型,提供 Docker 一键部署。
GitHub:https://github.com/severian42/GraphRAG-Ollama-UI
学习教程
1、从零开始实现 Stable Diffusion。
在 GitHub 上发现一个项目,作者系统性讲解 Stable Diffusion 和扩散模型的工作原理以及它们背后的数学。
GitHub:https://github.com/juraam/stable-diffusion-from-scratch
并且,提供了一系列步骤来帮助大家理解这些信息,最终以训练完成一个扩散模型结束教学。