00:00 / 12:16
连播
清屏
智能
倍速
点赞86
5月14日AI技术速报:清华放王炸手机AI 第一则:清华大学THUNLP实验室和面壁智能,刚刚放出来了一款端侧的GUI Agent:AgentCPM-GUI,可中英文操作APP,GUI元素定位能力出色,覆盖了包括高德地图、大众点评、B站、小红书在内的30多个主流中文APP,其基于MiniCPM-V构建,总参数量8B,手机屏幕图像作为输入,可自动执行用户提出的任务,通过RFT增强了其规划推理能力,让模型输出动作前先进行推理思考 第二则:继MCP、A2A之后,出来一个ag-ui,用于AI Agent与前端应用交互的一个协议,解决Agent与前端应用连接和通信的问题。比如说,你想在网站上加一个AI客服,以前需要写很多代码来处理AI回复、显示等,现在用AG-UI比较便捷就能搞定,并且也不用为每类AI助手写一遍代码。ag-ui协议采用轻量级、事件驱动设计,定义了16种标准事件类型,支持简单的输入参数格式。它有一个中间层,用来兼容不同的环境,可以用SSE、WebSocket、webhook等不同的方式传输事件。支持实时聊天流式传输、双向状态同步、生成式UI和结构化消息、实时上下文扩充、前端工具调用、人机协作等。 第三则:针对播客场景的一款TTS:Muyan-TTS,0.33秒生成1秒音频,零样本语音合成,适合处理长内容,支持说话人适配,可深度定制个性化语音,也可以用来做有声书、视频配音等,目前只支持英文输入。 第四则:OpenMemory MCP:统一的 AI 记忆管理平台 ,本地运行 存储、组织和管理你的“记忆” ,提供一个统一、结构化、私有的“记忆层,通过权限模型,用户主导数据流动,支持扩展,适用于多类 AI 客户端生态让你的记忆可以在各个AI之间流动,可以让你在 Claude、Cursor、Windsurf 等 LLM 工具之间持续使用历史信息、对话风格、偏好和项目状态,从而实现真正的跨平台、连续性 AI 交互体验。可以理解为:你的 AI 个人助理第一次有了一块真正“属于你”的持久记忆模块,还能在各种AI之间来回调用,同时确保隐私和控制权掌握在用户手中。 #人工智能[话题]# #大模型[话题]# #OpenMemory[话题]# #App分享[话题]# #人工智能 #chatgpt应用领域 #ai #一分钟干货教学
00:00 / 02:40
连播
清屏
智能
倍速
点赞9
00:00 / 11:14
连播
清屏
智能
倍速
点赞20