00:00 / 02:21
连播
清屏
智能
倍速
点赞6
00:00 / 00:18
连播
清屏
智能
倍速
点赞14
00:00 / 03:41
连播
清屏
智能
倍速
点赞4
00:00 / 00:52
连播
清屏
智能
倍速
点赞131
实测 Kimi K2:最擅长 Agentic 任务开源模型? 本期视频将对月之暗面(Moonshot AI)最新推出的开源模型 Kimi K2 进行一次全方位的评测。 Kimi K2 在官方介绍中号称其在代码和 Agent 任务上表现卓越。 我将从官方公布的性能跑分入手,详细解读其模型架构、API 特点,并进行大量的上手实测。 内容包括: - 代码生成与可视化: 从 3D 峡谷、粒子银河到财务报表,再到像素游戏和复古打字机,我们将通过十余个不同难度的任务,深度测试 Kimi K2 的代码生成和数据可视化能力。 - 推理与逻辑: 通过精巧的逻辑推理题,考验 Kimi K2 在复杂指令下的理解和执行能力,并与 Gemini 和 o3 等模型进行横向对比。 - API 与工具调用: Kimi K2 同时兼容 OpenAI 和 Anthropic 的 API,我将展示如何将其集成到 Agent 和各类工具中,并分享我个人在调用 API 时的经验和遇到的问题。 - 横向对比: 在多个环节中,我会将 Kimi K2 的表现与 Claude Sonnet 4、Gemini 2.5 Pro 等业界顶尖模型进行直观比较。 Kimi K2 究竟是名副其实的开源强者,还是有所夸大?它的实际表现能否挑战闭源的顶尖模型?看完这期视频,你就会有答案。 时间戳 00:00 Kimi K2 核心亮点与性能跑分 00:58 模型架构、API 特点与使用门槛 03:01 创意写作与可视化测试 08:29 更多官方示例 09:41 指令遵循+推理能力测试 #kimi #moonshot #AI
00:00 / 11:42
连播
清屏
智能
倍速
点赞75
00:00 / 02:15
连播
清屏
智能
倍速
点赞47
DeepSeek下滑?KimiK2开出“王炸”? 今天聊聊中国AI大模型领域的“双雄争霸”——一边是用户量最大的#DeepSeek ,一边是刚刚技术爆发的月之暗面#Kimi 。 先说DeepSeek:尽管用户使用率从年初7.5%降到3%,但1.69亿月活仍稳坐国内第一,超豆包、元宝。创始人梁文锋志在AGI(通用人工智能),他说:“当前是技术创新期,不是应用爆发期。”团队130人,多是00后技术狂,背靠幻方量化“不差钱”。 产品上小步快跑:5月升级模型支持“拍照识文字”,6月新增微信登录,90天服务在线率超99%!但对比友商,DeepSeek的Agent布局稍慢——豆包、Kimi已推深度研究功能,它却默默在4月急招“下一代智能体产品”人才。 再看Kimi:媒体报道说,Kimi7月突然扔出“王炸”,开源万亿参数模型Kimi K2!上线两天,海外平台用量就碾压马斯克的Grok 4。 三大杀招震惊开发者:代码能力匹敌Claude 4,成本只要20%!用户实测:“用K2驱动Claude Code,效果平替85%原版”。Agent工具调用封神:前Anthropic工程师盛赞“首个让我放心的非Anthropic模型”,能并行调用多工具,还“知道何时停”。中文创意写作超越DeepSeek-R1,网友惊呼“开源模型的胜利”! 技术突围更震撼:1万亿参数靠算法创新突破硬件限制——优化注意力头、增加MoE稀疏性,用MuonClip优化器解决训练稳定性。开发者感叹:“中国团队在芯片卡脖下重新设计一切,这是压力下的创新!” 有趣的是:两家竟三度“技术撞车”!2月同改Transformer注意力机制。4月齐推数学证明模型。如今Kimi K2与DeepSeek-V3架构高度相似,但路径迥异:DeepSeek建生态、求稳定,梁文锋说:“希望行业直接用我们的成果。”Kimi选择开源技术奇袭,联合创始人张宇韬喊出“Make Kimi Great Again”! 启明创投周志峰预判:2025年是技术向应用转换的关键节点。 中国信通院魏凯提醒:超级APP不一定能造数据飞轮,但Agent可建用户壁垒。 如今,DeepSeek手握用户,Kimi凭技术破圈。双雄并进,正努力改写全球AI格局! #凤华年 #Ai
00:00 / 01:13
连播
清屏
智能
倍速
点赞37