00:00 / 17:25
连播
清屏
智能
倍速
点赞108
一川AI1周前
今日AI新闻2025.11.13 1. 百度世界大会推出原生全模态大模型文心 5.0,采用统一建模技术同时处理文本、图像、音频和视频。该模型多模态理解能力达国际顶尖水平,图像视频生成全球领先,现已开放文心 App 体验和千帆平台 API 调用。 2. 可灵 2.5Turbo 视频模型上新 "首尾帧" 功能 —— 精准控制视频开头结尾状态 该模型在动态效果、文本响应和风格保持方面全面升级,新增功能允许创作者设定视频起始与结束画面,为专业内容生产提供更精准的控制工具。 3. 微博 VibeThinker-1.5B 开源 —— 小身材大能量,7800 美元训练成本惊艳业界 基于阿里 Qwen2.5-Math 调整的 15 亿参数模型,在数学和代码任务上超越 6710 亿参数大模型。采用创新训练框架实现高效推理,已在 Hugging Face 等平台开源。 4. OpenAI 推出 GPT-5.1—— 更快的响应速度,更自然的对话体验 新版本强化语言表达和情绪感知能力,新增自适应推理功能可动态调整处理时长,并提供多种沟通风格选择,使 AI 助理更具 "人情味"。 5. 李飞飞团队发布商用 3D 模型 Marble—— 文字描述秒建 VR 场景 World Labs 推出的首款商用 3D 世界模型支持多模态输入生成可编辑环境,内置 AI 编辑工具兼容主流 VR 设备,适用于游戏开发和影视制作。 6. 东北大学开源 NiuTrans.LMT——60 种语言 234 方向自由互译 该模型突破低资源语言翻译瓶颈,采用中英双中心架构避免二次失真,在 FLORES-200 评测中表现卓越。 7. 谷歌 Gemini Live 语音升级 —— 语速口音自由定制 新版本实现语音实时调节、情绪感知和个性化口音注入,为语音交互设立新标准。 8. 阿里启动 "千问" 项目 —— 基于 Qwen 模型打造个人 AI 助手 阿里巴巴秘密推进对标 ChatGPT 的 C 端 AI 产品,将消费者市场作为战略重点展开布局。#今日AI新闻#文心一言 #可灵 #李飞飞
00:00 / 02:20
连播
清屏
智能
倍速
点赞9
今天我们聊聊百度文心大模型5.0的发布,都升级了哪些? 今天我们聊聊 #百度文心大模型5 的发布,都升级了哪些? 2.4万亿参数 :业界公开参数最大模型 · 文心5.0采用超稀疏混合专家模型结构,总参数量达2.4万亿,激活参数比例低于3%,在保持高性能的同时显著降低推理成本。 全模态能力:文本、图像、音频、视频融合 · 原生全模态统一建模技术,支持多模态输入输出,实现文本生成、图像创作、视频理解、音频解析等全方位能力。 核心技术突破:原生全模态建模 · 从训练初始即融合语言、图像、音频、视频等多模态数据,统一理解与生成,突破单一模态能力限制。 理解生成一体化 · 通过精细语义特征建模,实现理解与生成相互增强,提升回复的人性化与精准度。 超稀疏混合专家 · 采用超稀疏混合专家模型结构,激活参数比例低于3%,显著降低推理成本,提升运行效率。 智能体能力增强: · 基于真实与模拟工具环境的长程任务轨迹数据训练,提升模型工具调用能力和复杂任务处理能力。 能力实测展示: 1、文心5.0生成图片示例 2、文心5.0生成的超写实图像示例:通体发光的白色小鹿,鹿角缠绕淡粉樱花与银线 文本生成能力 1、创作流畅故事,逻辑清晰,细节准确 2、高情商情感支持,如压力缓解建议 3、个性化生活推荐,如火锅店详细信息 多模态理解 1、视频内容总结:人物观点提取与对比分析 2、数学题解析:步骤还原与图像对应说明 3、厨艺视频分析:制作流程梳理与对比总结
00:00 / 06:27
连播
清屏
智能
倍速
点赞3
大模型与智能体的异同 一、概念与定义 (一)大模型 大模型通常指基于深度学习架构构建的、拥有海量参数的预训练模型,如 GPT 系列、文心一言、通义千问等。这些模型在大规模多样化数据集上进行训练,以学习数据中的通用模式和知识表示。它们的设计初衷是为多种自然语言处理、计算机视觉等任务提供强大的基础能力,通过对输入数据特征的提取和处理,生成相关的输出,如文本生成、图像识别结果等。 (二)智能体 智能体是一种能够感知其所处环境,并根据感知信息自主采取行动以实现目标的系统。它可以是软件程序、机器人或其他具备决策和执行能力的实体。智能体具有自主性、反应性、主动性和社会性等特性。在人工智能领域,智能体通过算法来处理环境信息,决定自身行动策略,例如在自动驾驶场景中的汽车智能体,它通过传感器感知路况、交通信号等环境信息,自主决策行驶速度、方向等操作。 二、能力特点 (一)大模型 强大的知识储备与通用能力:大模型经过大规模数据训练,在知识储备上极为丰富,能够对广泛领域的问题进行理解和回答。在自然语言处理方面,可完成文本翻译、文章撰写、问答系统等多种任务,且表现出较高的语言理解和生成能力,能够生成连贯、逻辑合理的文本。在图像领域,能进行高精度的图像分类、目标检测等任务。 缺乏自主性和情境适应性:大模型本身并不具备自主感知环境变化并主动调整行为的能力。它的输出主要依赖于输入数据和预先训练好的模型参数,对于动态变化的环境和复杂情境,需要人为重新调整输入或进行额外的微调才能更好适应,缺乏根据实际情况实时自主决策的能力。 (二)智能体 自主性和情境适应性强:智能体能够实时感知环境变化,并基于内部的决策算法自主决定行动。在复杂多变的环境中,智能体可以根据不同情境快速调整策略,以实现自身目标。例如在智能家居系统中的智能体,能够根据室内温度、光线、人员活动等环境因素的变化,自动控制家电设备,提供舒适的居住环境。 知识储备和通用性相对受限:智能体往往专注于特定领域或任务,其知识储备和应用范围相对大模型较窄。虽然在其特定任务领域内能够高效运作,但面对跨领域、综合性的复杂问题,可能无法像大模型那样利用广泛知识进行处理,除非经过特殊设计和多领域知识集成。 三、应用场景 (一)大模型 内容创作与生成:在写作辅助方面,大模型能帮助创作者生成文章大纲、段落内容,甚至完整的新闻报道、故事小说等;在图像生成领域,可根据
00:00 / 06:42
连播
清屏
智能
倍速
点赞114
00:00 / 00:05
连播
清屏
智能
倍速
点赞0
00:00 / 01:14
连播
清屏
智能
倍速
点赞20