每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 7 月 22 日的最新 AI 信息。
AI 绘画
1、轻松实现图像风格化迁移 B-LoRA。
可以对图像进行风格和内容的分离,以实现高质量的风格与内容混合、调整以及在两张风格化图像之间交换风格与内容。
经过训练的 B-LoRAs 可以作为独立组件,用于各种图像风格化任务,包括图像风格转移、基于文本的图像风格化、一致风格生成等。
详细介绍:https://b-lora.github.io/B-LoRA/
对此感兴趣的,可以使用如下 ComfyUI 工作流尝试。
GitHub:https://github.com/liusida/ComfyUI-B-LoRA
2、腾讯的 PhotoMaker 更新到第二版本了,拥有更好保真度及可控性!
无需训练 LoRA,只需上传几张人物照片,即可生成多种风格且逼真的人物图像。
v2 对比 v1 版本,拥有更高的保真度,以及支持使用 T2I-Adapter 适配器,提升对图像的可控性。
GitHub:https://github.com/TencentARC/PhotoMaker
在线体验:https://huggingface.co/spaces/TencentARC/PhotoMaker-V2
开源项目
1、一个快速将音视频转结构化笔记的开源免费工具 AudioNotes。
基于 FunASR 和 Qwen2 构建,可快速提取音视频内容,并利用大模型能力整理成一份结构化的 Markdown 笔记,方便快速阅读。
GitHub:https://github.com/harry0703/AudioNotes
工具支持搭配 Ollama 使用本地模型,并提供了 Docker 快速部署方式。
2、一款强大的交互式命令行(CLI)开源工具 Claude Engineer。
在命令行终端上整合了 Claude 3.5 模型,利用模型的多模态能力并结合文件系统操作、网络搜索等功能,协助完成各种软件开发任务。
GitHub:https://github.com/Doriandarko/claude-engineer
具有如下主要功能:
- 提供了与 Claude 便捷交互的聊天界面;
- 功能全面的文件系统,可创建文件夹、读取和写入文件等;
- 可进行网络搜索,获取最新信息;
- 协助开发者智能管理和创建项目;
- 提供了智能代码分析和修改建议;
- 支持图像直接拖拽到终端并进行分析;
- 可自主完成任务,支持迭代跟踪和管理。
总的来说,是一款强大的软件开发辅助工具,相信有了它对我们开发效率和代码质量有所提高。
3、在 GitHub 上发现一个专门收集主流软件的开源替代列表 OpenAlternative。
收集了各种知名主流软件的开源替代,并且对工具的优缺点进行详细介绍,同时还列举与其类似的更多开源替代。
比如 Google Analytics,就列举了 Umami/Matomo/Plausible/OpenPanel 等这些开源替代。
GitHub:https://github.com/piotrkulpinski/openalternative
还有提供了在线网站,进行类别划分,方便大家进行搜索筛选查找所需的软件。