7 月 8 日

每天仅需 1 分钟，全面获取 AI 技术发展、行业动态和市场趋势。

内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。

关注 AI 日报，紧跟 AI 潮流，希望对你有所帮助。对于重要信息，会独立发帖进行详细介绍。

以下是 7 月 8 日的最新 AI 信息。

1、发现一个新的实时物体检测器 RT-DETR。

它是第一个实时端到端目标检测器，在速度和精度方面都优于相同规模的 YOLO 检测器。

2、VAST 开源了一个 3D 角色生成模型 CharacterGen。

可将单张图像转换为高质量、外观一致的 3D 角色。非常适合游戏和动画的工作流程。

1、可用于图像生成和编辑的 ControlNet Plus 模型。

基于原始 ControlNet 架构扩展开发，能够在条件文本生成图像中支持 10 多种控制类型，并且能够生成视觉效果媲美 Midjourney 的高分辨率图像。

1、斯坦福开源的 Prompt 编程框架 DSPy，目前已获得 14.1k Star。

具有如下特性：

提供了详细的入门教程，官方用的是 Python 语言，还有一个非官方 Typescript 版本，可以看下。

2、用 160 行代码实现 GPT-4o 发布会的实时音视频通话能力。

使用 OpenCV 搞定视频画面捕获，再使用 GPT-4o 来进行文本处理和多模态，而音频则是基于 Whisper 和 TTS 处理。

目前代码已经开源到 GitHub，并且作者还录制了一条教程视频，感兴趣的可以看看。