每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 7 月 31 日的最新 AI 信息。
前沿资讯
1、OpenAI 推出 GPT-4o 长输出版本。
每次请求最多可输出 64K Token,API 使用者可通过 “gpt-4o-64k-output-alpha” 模型名称进行访问。
价格方面,每输入百万 tokens 收 6 美元,每输出百万 tokens 收 18 美元。
详细公告:https://openai.com/gpt-4o-long-output/
2、字节来卷 AI 音乐赛道了,推出一款名为 “海绵音乐 ” 的 AI 音乐产品。
直接上线了官网,放出了很多由 AI 创作的音乐,试听了下效果非常好,人声没有杂音,完美支持中文,感觉可以媲美 Suno 了!
目前可以在上面免费创作,对想生成什么样的歌曲简单描述一下,由 AI 一键创作填写歌词,生成速度非常快。
感兴趣的可以去体验下。
3、OpenAI 宣布开始推送 GPT-4o 高级语音功能!
GPT-4o 高级语音模式能够提供更自然、实时的对话,允许你随时打断,并能感知和响应你的情绪。
不过只是向一部分 Plus 用户推送,推送全部 Plus 用户要等到秋季。
如果你是 GPT Plus 用户,更新到最新版本,赶紧看看自己是不是那位幸运儿。
前沿技术
1、Meta AI 发布了 Segment Anything Model 2 (SAM 2) 模型。
可同时对图像和视频中的对象进行实时检测与分割,有了该技术,视频中移动的对象,可以快速替换掉了!
GitHub:https://github.com/facebookresearch/segment-anything-2
详细介绍:https://ai.meta.com/blog/segment-anything-2/
开源项目
1、一款可根据文件内容自动批量重命名的 AI 工具 ai-renamer。
基于 Node.js 构建的命令行工具,默认使用 Ollama 本地模型(如 Gemma、Llama 等),对指定本地目录下的文件、图像或视频智能识别,并根据内容进行自动化、批量的重命名。
GitHub:https://github.com/ozgrozer/ai-renamer
同时提供了丰富的自定义参数,如语言、定制提示词、文件名长度、模型等。
学习书籍
1、一本开源且免费可在线阅读的英语语法学习书籍:《语法俱乐部》。
该书的编排采用了循序渐进的方式,从初级的简单句,经过中级的复句、合句,再来到高级的简化从句,共分为三大篇幅,细分为二十二章节。
GitHub:https://github.com/llwslc/grammar-club
在线阅读:https://llwslc.github.io/grammar-club/content/Introduction.html
简单概括下篇幅内容:
第一篇:介绍简单句的基本句型及其各个部分,包括名词、动词、形容词、副词等,并探讨不定词词组、动名词与分词。
第二篇:探讨复句与合句,强调在掌握简单句的基础上,通过连接词将多个简单句组合起来,形成复杂句子。
第三篇:介绍简化从句,基于复句与合句,将复杂的句子简化为短小精练的高级句型,使表达更加准确和简洁。
通过阅读该书籍希望能够培养出大家的英语能力,建立大家对英语的信心,并增强大家阅读英语的兴趣。