🚀OpenAI重磅开源gpt-oss系列模型!本地部署+客观深度测评!开源模型中的王者gpt-oss-120B和gpt-oss-20B!从幻觉测试到代码生成,从逻辑推理到文档分析,全面碾压现有开源模型 🚀🚀🚀视频简介: ✅【客观测评】OpenAI开源gpt-oss-120B和20B全方位对比测试:谁是真正的开源之王?117B参数模型性能逆天,20B小钢炮表现惊艳,免费使用Apache 2.0协议! 🔥本期视频详细演示了OpenAI史无前例发布的两款开源大模型gpt-oss-120B和gpt-oss-20B的全方位性能测试! 📊 我们从多个维度进行了深度评测: ✅ 幻觉测试:6道精心设计的题目全面验证模型真实性 🧮 数学推理:空瓶换饮料、青蛙爬井等经典难题挑战 🧠 逻辑分析:农夫过河史上最难推理题完美解答 💻 编程能力:Bootstrap响应式导航栏一键生成 🗃️ 数据库操作:复杂SQL查询语句精准输出 📄 文档解析:大语言模型论文深度分析 🎯 测试结果令人震撼! 🔥120B参数模型单卡H100即可运行,20B小模型在某些任务上甚至超越大模型表现!两款模型均采用Apache 2.0开源协议,支持Ollama、LM Studio等多种部署方式,128K超长上下文,可调节推理级别。 🔥🔥🔥时间戳: 00:00 开场介绍 - OpenAI发布史无前例的两款开源大模型gpt-oss 00:35 模型规格详解 - 120B和20B参数版本技术规格对比 01:14 部署方式演示 - Ollama、LM Studio等多种部署方法 01:34 幻觉测试环节 - 6道题目全面测试模型真实性表现 03:23 数学推理能力 - 空瓶换饮料和青蛙爬井经典难题挑战 05:14 空间推理测试 - 正方体数字推理题验证逻辑能力 05:44 代码理解能力 - 斐波那契数列识别和功能分析 06:10 农夫过河难题 - 史上最难逻辑推理题终极挑战 08:09 编程实战测试 - Bootstrap响应式导航栏完整代码生成 09:33 数据库SQL能力 10:51 文档分析能力 11:41 提示词遵循 12:43 综合评价总结 #openai #gptoss #gptoss120b #gptoss20b #ai
00:00 / 13:02
连播
清屏
智能
倍速
点赞155
00:00 / 00:36
连播
清屏
智能
倍速
点赞76
00:00 / 02:54
连播
清屏
智能
倍速
点赞412
Deepdick1周前
openclaw无限记忆150元搭建真实项目协作 【硬核分享】我用150块钱的服务器,手搓了一个拥有无限记忆的跨平台 AI 贾维斯 大家好,今天想和大家深度分享一下我最近基于开源项目 OpenClaw 折腾的一套个人 AI 系统。起因很简单,我不满足于仅仅是在网页上和 ChatGPT 对话,我想要一个真正属于我自己的、能干活的、还能记住我的 AI Agent。 最关键的是,这套系统的核心硬件成本,我只花了 150 块钱淘来的一台二手小服务器。 一、 核心大脑:150元服务器 + OpenClaw 这台 150 块的服务器是整个系统的心脏。它不需要多强的显卡,因为推理计算都在云端,它主要负责运行 OpenClaw 的核心程序、管理数据库以及维持网络连接。 OpenClaw 是一个非常出色的开源 AI Agent 框架。你可以把它想象成一个“中枢神经系统”,它一端连接着强大的 LLM(大语言模型),另一端连接着你的本地环境、终端、文件系统以及各种通讯软件(如 Discord、Slack 等)。它让 AI 不再是一个只会聊天的窗口,而是一个能执行命令的实体。 二、 模型双雄:OpenAI 的稳与 Google Antigravity 的新 在模型选择上,我采用了“双核驱动”: OpenAI 模型 (GPT-4o 等):这是我的主力输出。在处理复杂的逻辑推理、代码编写和通用任务时,OpenAI 的表现依然是最稳定和强大的。它是系统的“压舱石”。 Google Antigravity 模型:这是一个非常令人兴奋的新尝试。Antigravity 是 Google 推出的一个原生 AI IDE 和智能体开发平台,它的模型在理解复杂的工程上下文和自主规划任务方面展现出了惊人的潜力。 心得注: 不过要提醒大家,最近 Google 对第三方工具(如 OpenClaw)调用 Antigravity 后端的管控越来越严,可能会出现接口不稳定的情况。我目前的策略是让它处理一些特定的、非紧急的辅助编程任务,把它作为一个强大的“副驾驶”来培养。 三、 突破限制:我是如何实现“无限记忆”的? 这是我最得意是一个功能。传统的对话模型最大的问题就是“健忘”,上下文窗口一超,前面的话就忘了。我的解决方案是给 OpenClaw 外挂一个向量数据库 (Vector Database
00:00 / 10:13
连播
清屏
智能
倍速
点赞66
00:00 / 01:21
连播
清屏
智能
倍速
点赞84