每天仅需 1 分钟,全面获取 AI 技术发展、行业动态和市场趋势。
内容涵盖但不限于前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程等等。
关注 AI 日报,紧跟 AI 潮流,希望对你有所帮助。对于重要信息,会独立发帖进行详细介绍。
以下是 7 月 4 日的最新 AI 信息。
前沿资讯
1、 Perplexity 发布 Pro Search 高级搜索功能。
通过多步骤推理来提供更复杂的问题解决能力,同时显著提升了其数学和代码执行能力。
详细介绍:https://www.perplexity.ai/hub/blog/pro-search-upgraded-for-more-advanced-problem-solving
2、法国一家 AI 实验室 Kyutai,将开源对标 GPT-4o 的模型 Moshi。
Moshi 与 GPT-4o 同样是一款实时语音多模态模型,能够听、说、看,可随时打断。
从演示效果来看,比 GPT-4o 要差一点,但已经很接近了。
Kyutai 官网:https://kyutai.org/
在线体验:https://moshi.chat/?queue_id=talktomoshi
去体验了下,完全不可用,有可能是目前使用的人数过多,感兴趣的可以去试试。期待开源。
3、ElevenLabs 推出声音去噪功能。
只需上传需要包含噪音的音频,即可去除噪音只保留人声。目前可免费体验。
使用地址:https://elevenlabs.io/voice-isolator
前沿技术
1、快手又开始整活了,贼好玩!
发布了一个高效的肖像动画框架,可将人物面部表情迁移到另一个静态人物的表情,生成表情丰富的视频。
支持各种各样风格的图片,同时能保持角色的一致性,面部控制的非常好。
GitHub:https://github.com/KwaiVGI/LivePortrait
详细介绍:https://liveportrait.github.io/
开源项目
1、发现 GitHub 上一个很有意义的开源项目「遇见李白」。
该项目旨在通过构建李白知识图谱的 AI 智能体,以生成式对话应用的形式,推广及普及李白古诗词文化。
GitHub:https://github.com/BinNong/meet-libai
最终目标是开发一款生成式对话应用,实现与你的实时互动,同时提供个性化的李白诗歌鉴赏体验。
2、一款开源免费且功能强大的图片编辑器 Image ToolBox。
提供了你能想到的图片编辑一切功能,包括批量裁剪、滤镜(超过 180种)、图片提取文本、图片拼接与叠加、背景移除,水印添加、各种格式转换等等。
GitHub:https://github.com/T8RIN/ImageToolbox
工具是使用 Kotlin 语言开发,目前仅提供 Android 客户端。