7 月 30 日

每天花 1 分钟时间，获取精选的前沿 AI 信息。

内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。

关注 AI 日报，紧跟 AI 潮流，希望对你有所帮助。对于重要信息，会独立发帖进行详细介绍。

以下是 7 月 30 日的最新 AI 信息。

前沿资讯

1、生数科技发布端到端文生视频大模型 Vidu。

基于 U-ViT 架构，能够一次性生成长达 16 秒的 1080p 的高清视频，具备高一致性、多镜头生成、强烈的连贯性和想象力丰富等特点。

详细介绍：https://www.shengshu-ai.com/vidu

在线体验：https://www.vidu.studio/create

目前可直接使用 Google 账号登陆，赠送 80 个积分体验，每次消耗 4 积分，生成时长最多 4s 的视频。

体验了下，生成速度很快，视频画面稳定，内容较符合描述词，不过普通用户只能生成 4s 视频，没法测长视频的画面连贯性。

2、苹果开始推送 Apple Intelligence！

在 iOS 18.1 Beta 系统上正式推送 Apple Intelligence，适用 iPhone 15 Pro、Pro Max 或 Apple M 系列芯片的 iPad。

演示视频：https://www.youtube.com/watch?v=OHU20Ygypy0

注意：需要设置为英语（美区）才能加入候补名单。

3、Runway 发布了 Gen-3 Alpha 图生视频功能。

允许你使用任何图像作为视频生成的第一帧，可以单独使用或着配合问题提示词引导使用。

使用地址：https://app.runwayml.com/video-tools

前沿技术

1、高清增强模型 AuraSR 发布 v2 版本！

基于 GigaGAN 的 4x 开源超分模型，速度快，对细节有较好的放大效果，而且可以商用。

模型下载：https://huggingface.co/fal/AuraSR-v2

AI 绘画

1、炸！一款效果非常好的商品广告图生成工具 Fotographer.ai。

能够将一款商品的前景图元素与任何背景无缝融合，同时能保持商品的形状和风格的一致性。

详细介绍：https://t.zsxq.com/OQoKe

亲测，拿一张小米汽车 SU7 的图来测试了下，先填写背景提示词，再填写产品提示词（纹理、光照、风格）等，最后根据情况控制下融合强度。

开源项目

1、一个实时交互流式数字人开源项目：metahuman-stream。

实现音视频同步对话，基本可以达到商用效果。

GitHub：https://github.com/lipku/metahuman-stream

具有如下功能：

支持多种数字人模型: ernerf、musetalk、wav2lip；
支持声音克隆；
支持数字人说话被打断；
支持全身视频拼接；
支持 rtmp 和 webrtc ；
支持视频编排：不说话时播放自定义视频；
支持 ChatGPT、Qwen 和 Gemini 等大语言模型实现数字人对话。

2、一份开源公务员考试的最佳实践指南： developer2gwy。

由一群从程序员上岸成为公务员的朋友共同编写，分享记录了他们的上岸经历，体制内生活以及心路历程。

GitHub：https://github.com/miss-mumu/developer2gwy

涵盖了公考的基本知识、备考最佳实践、常见的问题、面试手册以及大家比较关心的一些问答等内容。

3、一份带你深入了解 Spring 源码系列学习资料 Spring-Reading。

涵盖了资源加载与访问、Spring 表达式语言、Bean 定义、Aware 接口、核心注解和 Spring AOP 等 Spring 框架的核心概念和关键功能介绍。

GitHub：https://github.com/xuchengsheng/spring-reading

希望这份资料能够帮助到大家更透彻地理解 Spring 内部的工作机制，以便更好地应用到实际工作中。

前沿资讯 ​

前沿技术 ​

AI 绘画 ​

开源项目 ​

前沿资讯

前沿技术

AI 绘画

开源项目