每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 9 月 4 日的最新 AI 信息。
前沿资讯
1、Luma AI 视频生成增加镜头控制功能。
输入 Camera 触发触发选择镜头运动的方式,支持左右/上下移动、推进/拉出、左右平移、左右环绕、上下/升降这几种方式。
在线体验:https://lumalabs.ai/dream-machine
看演示效果很好,这下生成视频的玩法又多了一样。
2、百度文心一言更名为 “文小言”。
同时宣布 9 月文心 4.0 大模型将免费使用。
我已经不太记得上次使用它是什么时候了,大家还在用它吗?
AI 绘画
1、快手开源的肖像动画框架 LivePortrait,有 ComfyUI 插件了!
能够将一张静态的肖像图里的人物面部表情动起来,支持各种各样风格的图像,能很好保持角色的一致性,面部表情控制非常好。
有关 Live Portrait 详细介绍:https://liveportrait.github.io/
今天在 GitHub 上发现有 ComfyUI 插件了 ComfyUI-AdvancedLivePortrait。
速度更快可实时预览,直接编辑图像中的面部表情并插入到视频中,相信用它能做出很有趣的视频来。
GitHub:https://github.com/PowerHouseMan/ComfyUI-AdvancedLivePortrait
现在可通过 ComfyUI-Manager 安装,感兴趣的玩下。
开源项目
1、一款专为 10x 工程师打造的开源 AI 代码编辑器:Melty。
它能够与开发者的整个开发流程集成,理解你从终端到 GitHub 的操作,协助你更高效地编写和重构代码,同时能对多个文件进行大规模更改。
GitHub:https://github.com/meltylabs/melty
其主要的目标是:
- 帮助开发者更好地理解代码和维护代码;
- 能够像结对程序员一样观察您所做的每一个改动;
- 能够学习并适应你的代码库;
- 与编译器、终端、调试器以及 Linear 和 GitHub 等工具集成。
小科普:10x 是指完成任务比别人快10 倍的工程师。
2、一份整理了关于大语言模型中检索增强生成(RGA)的精选列表:awesome-rag。
涵盖了近 4 年具有代表性的 RAG 相关研究论文,以及与 RAG 相关的讲座、研讨会、教程、工具和其他相关集合等资源。
GitHub:https://github.com/coree/awesome-rag
3、一款开源免费全自动化的 AI 视频剪辑工具:MoneyPrinterPlus。
借助 AI 技术,能够一键生成和批量混剪各类短视频,并自动发布到各个视频平台,全自动化完成,助力大家变现。
GitHub:https://github.com/ddean2009/MoneyPrinterPlus
主要特点:
- 支持本地语音模型有 ChatTTS、FasterWhisper、GPTSoVITS 等;
- 支持视频批量自动发布到各个视频平台;
- 支持视频批量混剪,批量产出不重复的短视频;
- 支持本地素材选择,支持各种分辨率;
- 支持使用本地大模型 Ollama 或 API 服务的模型;
- 支持 100+ 不同的语音种类和语速调节;
- 支持 30+ 种视频转场特效和字幕特效。