每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 7 月 30 日的最新 AI 信息。
前沿资讯
1、生数科技发布端到端文生视频大模型 Vidu。
基于 U-ViT 架构,能够一次性生成长达 16 秒的 1080p 的高清视频,具备高一致性、多镜头生成、强烈的连贯性和想象力丰富等特点。
详细介绍:https://www.shengshu-ai.com/vidu
在线体验:https://www.vidu.studio/create
目前可直接使用 Google 账号登陆,赠送 80 个积分体验,每次消耗 4 积分,生成时长最多 4s 的视频。
体验了下,生成速度很快,视频画面稳定,内容较符合描述词,不过普通用户只能生成 4s 视频,没法测长视频的画面连贯性。
2、苹果开始推送 Apple Intelligence!
在 iOS 18.1 Beta 系统上正式推送 Apple Intelligence,适用 iPhone 15 Pro、Pro Max 或 Apple M 系列芯片的 iPad。
演示视频:https://www.youtube.com/watch?v=OHU20Ygypy0
注意:需要设置为英语(美区)才能加入候补名单。
3、Runway 发布了 Gen-3 Alpha 图生视频功能。
允许你使用任何图像作为视频生成的第一帧,可以单独使用或着配合问题提示词引导使用。
使用地址:https://app.runwayml.com/video-tools
前沿技术
1、高清增强模型 AuraSR 发布 v2 版本!
基于 GigaGAN 的 4x 开源超分模型,速度快,对细节有较好的放大效果,而且可以商用。
模型下载:https://huggingface.co/fal/AuraSR-v2
AI 绘画
1、炸!一款效果非常好的商品广告图生成工具 Fotographer.ai。
能够将一款商品的前景图元素与任何背景无缝融合,同时能保持商品的形状和风格的一致性。
亲测,拿一张小米汽车 SU7 的图来测试了下,先填写背景提示词,再填写产品提示词(纹理、光照、风格)等,最后根据情况控制下融合强度。
开源项目
1、一个实时交互流式数字人开源项目:metahuman-stream。
实现音视频同步对话,基本可以达到商用效果。
GitHub:https://github.com/lipku/metahuman-stream
具有如下功能:
- 支持多种数字人模型: ernerf、musetalk、wav2lip;
- 支持声音克隆;
- 支持数字人说话被打断;
- 支持全身视频拼接;
- 支持 rtmp 和 webrtc ;
- 支持视频编排:不说话时播放自定义视频;
- 支持 ChatGPT、Qwen 和 Gemini 等大语言模型实现数字人对话。
2、一份开源公务员考试的最佳实践指南: developer2gwy。
由一群从程序员上岸成为公务员的朋友共同编写,分享记录了他们的上岸经历,体制内生活以及心路历程。
GitHub:https://github.com/miss-mumu/developer2gwy
涵盖了公考的基本知识、备考最佳实践、常见的问题、面试手册以及大家比较关心的一些问答等内容。
3、一份带你深入了解 Spring 源码系列学习资料 Spring-Reading。
涵盖了资源加载与访问、Spring 表达式语言、Bean 定义、Aware 接口、核心注解和 Spring AOP 等 Spring 框架的核心概念和关键功能介绍。
GitHub:https://github.com/xuchengsheng/spring-reading
希望这份资料能够帮助到大家更透彻地理解 Spring 内部的工作机制,以便更好地应用到实际工作中。