每天花 1 分钟时间,获取精选的前沿 AI 信息。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 8 月 18 日的最新 AI 信息。
AI 绘画
1、Half_illustration 是一个很有意思的 Flux LoRA 模型。
基于 Flux.1 训练,可以生成结合照片和插画涂鸦的风格图像,一半是真实照片一半是融合了插画涂鸦的元素。
模型下载:https://huggingface.co/davisbro/half_illustration
在线体验:https://replicate.com/davisbrown/flux-half-illustration
开源项目
1、一份精选机器学习系统的入门资料集合:awesomeMLSys。
收集了一系列有关注意力机制、性能优化、量化、长上下文长度和稀疏性等方面的论文、视频和代码库。
GitHub:https://github.com/cuda-mode/awesomeMLSys
2、一个基于 LLM 的 OCR 扫描 PDF 开源工具 LLM-Aided。
旨在通过利用多模态大语言模型(LLM)将原始的 OCR 扫描 PDF 文本转换成高准确度、格式正确且易于阅读的 Markdown 文档。
GitHub:https://github.com/Dicklesworthstone/llm_aided_ocr
具有如下特点:
- PDF 转图像:使用 pdf2image 将 PDF 转换为图像,支持处理特定页面范围;
- OCR 处理:使用 Tesseract 进行 OCR 处理,从图像中提取文本;
- 高效错误纠正:通过 LLM 进行 OCR 错误修正,可以使用本地 LLM,也可以使用 API(如 OpenAI、Anthropic);
- 智能文本分块:将全文分割成更易于处理的 chunks,保留自然句子边界;
- Markdown 格式化:将文本转换为标准的 Markdown 格式;
- 质量评估:使用 LLM 比较原始 OCR 文本和处理后的输出,提供质量评分和解释。
3、一个基于 GitHub Action 的自动化工具:Product Hunt 每日中文热榜。
每天定时爬取并生成 Product Hunt 上热门产品榜单的 Markdown 文件,帮助大家快速查看每日的 Product Hunt 热门榜单。
GitHub:https://github.com/ViggoZ/producthunt-daily-hot
功能如下:
- 自动获取数据:每天自动获取前一天的 Product Hunt Top 30 产品数据。
- 关键词生成:生成简洁易懂的中文关键词,帮助用户更好地理解产品内容。
- 高质量翻译:使用 OpenAI 的 GPT-4 模型对产品描述进行高质量翻译。
- Markdown 文件生成:生成包含产品数据、关键词和翻译描述的 Markdown 文件,方便在网站或其他平台上发布。
- 每日自动化:通过 GitHub Actions 自动生成并提交每日的 Markdown 文件。
- 可配置工作流:支持手动触发或通过 GitHub Actions 定时生成内容。
- 灵活定制:脚本易于扩展或修改,可以包括额外的产品细节或调整文件格式。
来自