今日精选的前沿 AI 信息,欢迎阅读 👇
💡 OpenAI 发布 sCM 文生图方案,仅需两步采样即可生成高质量图像,速度提升 50 倍,或将用于提升 DALL-E 生图速度。
🎥 Meta 开源多模态语言模型 LongVU,通过创新的压缩技术实现长视频内容理解和描述,已开放在线体验。
📺 一份持续更新维护的 m3u 直播源收集列表,涵盖电视、直播、MyTV 和体育等多个领域。
📱 开源新闻阅读工具 NewsNow 聚合微博、知乎等多平台热点,支持部署到 Cloudflare Pages 和 Vercel。
前沿技术
1、OpenAI 分享新 AI 文生图方案:sCM,速度是传统扩散模型 50 倍。
与传统扩散模型相比,sCM 仅需两步采样即可生成高质量图像,号称能够将文生图效率提升约 50 倍,且生成质量能与目前较强扩散模型相比。
官方介绍:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/
有可能 OpenAI 会将此技术用在 DALL-E 图像生成,后面生图可能会更快些。
2、Meta 开源一个用于生成长视频的多模态语言模型:LongVU。
通过跨模态查询和帧间依赖关系,实现了对长视频的适应性时间和空间压缩,有效地减少了视频令牌数量,同时保留了视频的视觉细节。
详细介绍:https://vision-cair.github.io/LongVU/
在线体验:https://huggingface.co/spaces/Vision-CAIR/LongVU
提供了 LongVU 的一些应用示例,如描述视频内容、识别视频中的动作和物体等,可以看下其在实际应用中的效果。
开源项目
1、一份 m3u 直播源收集列表,涵盖了电视、直播、MyTV 以及体育等订阅列表。
GitHub:https://github.com/YanG-1989/m3u
看项目 Commit 提交记录,一直在持续更新,有需要的可以看下。
2、一个非常优雅的实时热门新闻阅读工具:NewsNow。
主要分为包括国内、国际、科技、财经几大类,包括微博、知乎、抖音、澎湃、GitHub、华尔街、Hacker News、IT之家等平台。
GitHub:https://github.com/ourongxing/newsnow
感兴趣的,可自行部署到 Cloudflare Pages,Vercel 等平台。