今日精选的前沿 AI 信息,欢迎阅读 👇
💻 阿里发布新一代编程模型 Qwen2.5-Coder,提供 4 种参数规模,32B 版本性能媲美 GPT-4,支持 Cursor 集成和可视化 Artifacts。
🤖 OpenHands 多智能体平台让 AI 化身程序员,可执行代码修改、命令运行、API 调用等开发任务,提供 Docker 部署。
🎙️ Voice-Pro 开源工具集成语音转文字、翻译和 TTS 功能,支持 100+ 种语言,提供降噪和字幕导出等实用功能。
前沿资讯
1、阿里发布最新编程模型:Qwen2.5-Coder 全系列。
一共有四个不同参数,分别是 0.5B、3B、14B、32B,全部都可以和 Cursor 集成,并且具备生成类似 Claude 的可视化 Artifacts 面板功能。
详细介绍:https://qwenlm.github.io/zh/blog/qwen2.5-coder-family/
模型下载:https://huggingface.co/collections/Qwen/qwen25-coder-66eaa22e6f99801bf65b0c2f
其中 32B 参数模型在多项基准测试评分中媲美 GPT-4o,具备强大且全面的代码能力以及数学能力。
前沿技术
1、一个基于 AI 驱动的软件开发多智能体平台:OpenHands,号称取代 “程序员”。
由多个智能体组成一个 “AI 程序员”,能够执行现实中各种开发任务,包括代码修改、命令运行、网页浏览、API 调用、甚至是从 StackOverflow 复制代码片段。
GitHub:https://github.com/All-Hands-AI/OpenHands
项目提供了详细安装部署教程,可通过 Docker 快速启动。有一点像开源版的 Cursor 或者说 Bolt。
开源项目
1、一款集转录、翻译和文字转语音为一体的开源工具:Voice-Pro。
提供简洁直观的可视化操作界面,可一键安装,支持实时转录和翻译,以及批量处理模式。
GitHub:https://github.com/abus-aikorea/voice-pro
主要功能:
- 提供 YouTube 下载器、噪音去除、字幕、翻译和 TTS 的集成环境;
- 支持 100 多种语言的语音识别和文字转语音;
- 支持使用 Whisper、Faster-Whisper 等进行语音转文字;
- 支持 TTS 语音速度、音量和音调调整;
- 提供单词级高亮功能以及降噪功能;
- 支持导出多种格式字幕文件,如 ass、srt、tmp、ssa 等;
- 支持输出多种音频格式,如 wav、flac、mp3 等。