每天花 1 分钟获取最新 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等。
简报主要特点是描述精简,但对于重要信息,还是通过独立帖子进行详细介绍。
以下是 7 月 2 日的最新 AI 信息。
前沿技术
1、Runway 已开放 Gen3 使用!
目前仅支持文本生成视频,付费用户可用,效果跟 Luma、可灵不相上下,各有优缺。
Runway 主要价格太贵,算下来每 5 秒钟视频需耗费 1 美元。还是可灵比较香。
不过,今天有网友使用 Gen3 实现了人物一致性,可在多次生成保持角色不变。
2、微软悄悄更新了 Phi3-mini。
模型各方面能力都有所提升,如指令遵循能力、代码能力等。
模型下载:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3
前沿技术
1、腾讯开源了可指定动作视频生成项目 MinmicMotion。
与阿里的 AnimateAnyone 类似,同样输入指定动作+角色图片,生成该角色的动作视频。
效果看起来比阿里的好很多,面部特征保持一致以及唇形同步,不但可以搞跳舞视频还可以做数字人。
项目介绍:https://tencent.github.io/MimicMotion/
GitHub:https://github.com/tencent/MimicMotion
非官方 ComfyUI 工作流:https://github.com/AIFSH/ComfyUI-MimicMotion
AI 绘画
1、有人花费 3 个月时间,完全使用 SD 制作了一本漫画小说。
作者分享的制作教程:
- 绘画模型是 iComix;
- 提示词中混合著名演员以保持人脸一致性;
- ControlNet Reference 模型实现服装一致性;
- ControlNet OpenPose 模型控制人物姿势;
- 使用 Photoshop 处理对话气泡。
学习教程
1、手把手教你从零开始构建 AI 视频生成模型。
在 GitHub 上发现一篇教程,作者详细介绍了如何使用 Python 语言,从零开始构建一个文本到视频生成模型。
涵盖了从理解理论概念到架构编码,最终实现输入文本提示即可生成视频的全过程。
GitHub:https://github.com/FareedKhan-dev/AI-text-to-video-model-from-scratch
感兴趣的可以看看。
开源项目
1、一个可以帮助你构建一系列网站的智能体 WebDesignAgent。
支持使用文本描述、图片和视觉线索转化为功能完备、设计精美的网站,用 AI 简化网站创建过程