今日精选的前沿 AI 信息,欢迎阅读 👇
🎬 字节发布豆包视频生成模型:PixelDance 和 Seaweed,支持复杂动作和多镜头视频生成。
👤 HelloMeme:新面部迁移模型,提升图像和视频质量,可接入 SD1.5 的 Lora 模型。
📱 BBackupp:开源 iOS 设备备份工具,支持外置硬盘备份和加密,便于设备迁移。
🖥️ Compiler Explorer:交互式编程语言编译器探索工具,支持 30+ 种语言,实时查看汇编代码。
前沿资讯
1、字节发布两个豆包视频生成模型,看演示 Demo 很牛!
分别是 PixelDance 和 Seaweed 模型,其中 PixelDance 更为先进,都是基于 DiT 架构。
能够实现对人物的复杂连续动作生成,以及多镜头组合视频,甚至对运镜的极致控制。
列举几个亮点:
- 支持在一个 Prompt 中实现多个镜头的平滑切换,同时保持主题、风格和氛围一致性;
- 支持一次性生成 10s 完整故事的视频;
- 支持生成多种视频风格,如黑白风格、3D 动画、2D 动画、国画等等;
- 支持生成多种视频比例,包括 1:1、3:4、4:3、16:9、9:16、21:9 六种比例。
详细介绍链接,以及查看演示 Demo,如下:
PixelDance:https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-pixeldance
Seaweed:https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seaweed
目前仅在火山引擎开启对企业用户邀请测试,至于在即梦全面开放给个人用户还需等待一段时间。
前沿技术
1、又一款效果不错的面部迁移模型 HelloMeme。
基于 Animatediff 模型微调,提升了图像和视频生成的质量和连续性,可无缝接入基于 SD1.5 的 Lora 模型。
详细介绍:https://songkey.github.io/hellomeme/
此外,还可以将生成的图像通过语音驱动生成说话视频,口型对齐,看起来还不错。
开源项目
1、一款开源免费的轻松备份 iOS 设备工具:BBackupp。
支持备份到外置硬盘、监控备份进度、加密备份更安全,同时可以无缝迁移到新设备。
GitHub:https://github.com/Lakr233/BBackupp
最近换了新 iOS 设备的同学,需要备份的可以试试这款工具。
2、分享一个交互式编程语言编译器探索工具:Compiler Explorer。
在网页浏览器中交互式地运行和探索多种编程语言编译器,支持超过 30 种语言,包括 C、C++、Rust、Go、Python、Java、Swift 等。
GitHub:https://github.com/compiler-explorer/compiler-explorer
在线体验:https://godbolt.org/
并且,提供了多种编辑器、工具和可视化选项,可以在线编辑代码并实时查看编译后的汇编代码。