今日精选的前沿 AI 信息,欢迎阅读 👇
🗣️ 有消息透露 GPT-4o 高级语音模式将于 24 号全面开放!
🎨 DrawingSpinUp 无需训练,将手绘图生成高质量 3D 动画!
📄 开源免费文档扫描工具 OpenScanner ,快速易用功能强大!
🗺️ Real-Address-Generator 基于 Cloudflare Workers 生成真实随机地址!
📚 吴恩达推荐《实践大语言模型》书籍,涵盖 LLM 实践精华并附开源代码!
前沿资讯
1、有消息称,GPT-4o 高级语音模式将于 24 号全面开放。
从春季发布会一直期待到现在,希望能如期到来,要不然都要被超越了。
来源:https://x.com/testingcatalog/status/1836523671554527472
前沿技术
1、一个能将单角色手绘图生成可动的 3D 动画工具:DrawingSpinUp。
无需训练,可直接使用,将一张手绘的单一角色图生成高质量的 3D 动画,同时能保持图画的风格和细节。
详细介绍:https://lordliang.github.io/DrawingSpinUp/
GitHub:https://github.com/LordLiang/DrawingSpinUp
目前代码已开源,可部署使用,通过该技术能让小孩手绘的图画动起来,非常有趣。
开源项目
1、一款快速、易于使用且开源免费的文档扫描工具:OpenScanner。
GitHub:https://github.com/pencilresearch/OpenScanner
具有如下特点:
- 自动文本识别生成页面抄本; - 自动文档命名; - 扫描件按当前地理位置标记; - 添加从其他设备导入的签名; - 原生支持 Vision Pro; - 将扫描的文档保存在 Open Scanner 库中; - 编辑并重新排序扫描文档页面; - iCloud 同步您的库至所有设备; - 注释并编辑扫描件; - 使用 Apple Pencil 在 iPad 上标记扫描件; - 轻松分享和导出扫描文档为 PDF; - 100% 原生 iOS 应用,完全不依赖第三方账户; - 开源免费,无广告无需订阅。
2、一个基于 Cloudflare Workers 的真实地址生成器:Real-Address-Generator。
可以生成不同国家地图上真实的随机地址,包含了姓名、性别、电话号码、地址等信息。
GitHub:https://github.com/Adonis142857/Real-Address-Generator
学习书籍
1、分享一本得到吴恩达老师推荐过的书籍《实践大语言模型》。
共十二章,涵盖了语言模型的基础知识、文本分类、提示工程、语义搜索、多模态语言模型以及如何创建和微调文本嵌入模型等内容。
每个章节涉及到的案例代码均已开源到 GitHub,可通过 Google Colab 直接运行。
GitHub:https://github.com/handsOnLLM/Hands-On-Large-Language-Models
此外,书籍通过定制 250+ 精美插图,并辅以可运行的代码、时间线以及引用关键论文,帮助读者更深入理解并使用大语言模型。