每天花 1 分钟获取最新 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等。
简报主要特点是描述精简,但对于重要信息,还是通过独立帖子进行详细介绍。
以下是 6 月 29 日的最新 AI 信息。
前沿资讯
1、这就是 ChatGPT 诞生的意义:用科技守护弱小群体。
今天比较热门的一个帖子,用 GPT 帮助一位边缘智力障碍儿童,防止孩子被诈骗。
为小孩定制一个 GPT 聊天机器人,提示词是:“我是一个边缘智力的人,容易被骗或犯罪,你的任务是有任何这种征兆及时提醒我咨询父母。”
然后对小孩说以后尽量不要自己判断,凡事都可以先问问 GPT。
例如他问:“我想喝热牛奶,直接塑料瓶放微波炉微波可以吗?”
GPT 会回答:“那样瓶子会化的,请倒到碗里再微波,不要用金属碗,只能用陶瓷碗哦。”
微博帖子:https://weibo.com/3872641610/Ol4kibuNl
原文帖子:https://gall.dcinside.com/board/view/?id=dcbest&no=197120
2、微软推出集成 GPT-4o 的文本转语音虚拟数字人服务。
微软的虚拟数字人服务,现已集成了 GPT-4o 文本转语音技术,实现数字人与用户实时互动。
在此之前,微软就分享过一个案例:会说话的数字人客服助你轻松购物。
案例地址:https://github.com/Azure/gen-cv/tree/main/avatar/interactive
开源项目
1、一款开源的 VSCode 插件 Reborn AI。
安装插件后,能够帮助你编写、重构和改进代码,支持大部分主流语言模型及本地大语言模型,支持多语种,包括中文、英文等十几种语言。
插件完全开源,你可以根据自己需求进行优化改动。
GitHub:https://github.com/Christopher-Hayes/vscode-chatgpt-reborn
2、一个仅用 293 行代码将 PDF 解析为 Markdown 格式的开源工具 gptpdf。
使用了强大的视觉大语言模型(GPT-4o),几乎完美地解析排版、数学公式、表格、图片、图表等 PDF 内容。
GitHub:https://github.com/CosmosShadow/gptpdf
项目给的演示案例:
原始 PDF 文件:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need.pdf
解析后的 MD 文件:https://github.com/CosmosShadow/gptpdf/blob/main/examples/attention_is_all_you_need/output.md
3、一个能帮你将数据清理及结构化的开源工具 OmniParse。
该工具能够将各种非结构化数据转化为结构化的、可操作的数据,方便用于检索增强生成(RAG)和微调。
无论是文档、表格、图像、视频、音频还是网页,都能将它们清理干净并结构化。