今日精选的前沿 AI 信息,欢迎阅读 👇
📱 Agent S:新开源的自动化智能体框架,支持 OpenAI、Claude 等模型,能与计算机界面自主交互,实现复杂的图形操作任务。
📚 ToastFish 是款巧妙的背单词工具,巧妙利用 Windows 通知栏实现碎片化背单词,支持自定义词库和单词测试功能。
🤖 Cerebellum:基于 LLM 的浏览器自动化工具,可通过智能体控制键鼠完成网页数据抓取和自动化测试,支持 Selenium 所有浏览器。
前沿技术
1、又一个开源的自动化智能体框架:Agent S。
通过智能体与计算机接口实现自主地与计算机进行交互,能够执行复杂的图形界面操作任务。
GitHub:https://github.com/simular-ai/Agent-S
支持多种主流大语言模型,如 OpenAI、Claude等,还支持使用 Paddle-OCR 进行 OCR 识别。
开源项目
1、一个利用摸鱼时间背单词的开源工具:ToastFish。
想学英语的同学,通过该工具可以利用 Windows 通知栏背单词,无论你在上班还是上课都能安全隐蔽地背单词。
GitHub:https://github.com/Uahh/ToastFish
而且,还支持自定义词库、设置背诵单词数量、单词测试等这些颇为实用功能。
2、一个基于智能体的浏览器自动化工具:Cerebellum。
通过使用 LLM 构建的智能体,实现自动化操作键盘和鼠标,在网页上完成数据抓取、自动化测试等任务。
GitHub:https://github.com/theredsix/cerebellum
支持与任何 Selenium 的浏览器兼容,不过目前仅支持使用 Cluade 3.5 Sonnet 模型。