今日精选的前沿 AI 信息,欢迎阅读 👇
📖 开源 OCR 2.0 模型发布,支持多种内容识别,效果惊人!
🕺 GVHMR 技术精确提取视频中人体动作,应用于虚拟现实等领域!
🌟 awesome-LLM-resources 汇总 LLM 优秀资源,值得收藏学习!
前沿技术
1、一个端到端的开源 OCR 模型,号称 OCR 2.0!
支持场景文本、文档、音符、图表、数学公式等内容识别,拿到了 BLEU 0.972 高分。
GitHub:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
模型下载:https://huggingface.co/ucaslcl/GOT-OCR2_0
模型大小仅 1.43GB,从给出的效果演示强到离谱,感兴趣的可以试试。
2、一种能从视频中提取出人体运动的精确信息技术:GVHMR。
比如说,给 GVHMR 一段美女跳舞视频,它能分析出这位美女的在视频中的每一个动作和姿势在空间中的分布,并转换为数字信息进行复刻。
GitHub:https://github.com/zju3dv/GVHMR
详细介绍:https://zju3dv.github.io/gvhmr/
应用的场景有虚拟现实、电影制作、运动训练、甚至是医疗领域的运动分析。
开源项目
1、一份整理了与大语言模型相关的优秀资源:awesome-LLM-resourses。
涵盖了数据集、微调、推理、评估、RAG(检索增强生成)、Agents(智能体)、书籍、教程、论文等资源。
GitHub:https://github.com/WangRongsheng/awesome-LLM-resourses
项目目前在持续更新,致力于收集最全面最新的大语言模型资源,值得关注下。