查看AI文稿
养龙虾的Dex
养龙虾的Dex

粉丝2129获赞2821

相关视频

  • Hermes新发0.14 确实好用,但几个点要先知道 #hermes #hermesagent #创作者中心 #AI新星计划  
Hermes Agent 0.14 发布了,新功能确实很好,但我这次不想无脑吹。 
我最关注 3 个点,每个都有亮点和隐患: 
1. Windows 原生支持 + PyPI 安装:门槛降低,但 Windows 还是 Beta,复杂任务要实测
2. Computer Use 招标网页面实战:登录后的复杂网页,普通抓取不一定拿得到,但它可以像人一样看页面并整理信息
3. /handoff:从 `--tui` 里的深度讨论,交接到飞书协作摘要,但摘要质量决定别人能不能接住 
0.14 还有 prompt cache、background review、本地代理、x_search、LSP 诊断这些功能点,我后面按评论区选择继续实测。 
我看好 0.14,但真正决定 Agent 能不能日常用的,不只是功能表,而是安装门槛、真实场景能力和协作交接质量。
    01:50
    Hermes新发0.14 确实好用,但几个点要先知道 #hermes #hermesagent #创作者中心 #AI新星计划
    Hermes Agent 0.14 发布了,新功能确实很好,但我这次不想无脑吹。
    我最关注 3 个点,每个都有亮点和隐患:
    1. Windows 原生支持 + PyPI 安装:门槛降低,但 Windows 还是 Beta,复杂任务要实测
    2. Computer Use 招标网页面实战:登录后的复杂网页,普通抓取不一定拿得到,但它可以像人一样看页面并整理信息
    3. /handoff:从 `--tui` 里的深度讨论,交接到飞书协作摘要,但摘要质量决定别人能不能接住
    0.14 还有 prompt cache、background review、本地代理、x_search、LSP 诊断这些功能点,我后面按评论区选择继续实测。
    我看好 0.14,但真正决定 Agent 能不能日常用的,不只是功能表,而是安装门槛、真实场景能力和协作交接质量。
    查看AI文稿
  • Hermes 告别 WSL,Windows 原生一键安装 Hermes Agent v0.14.0 更新,原生支持 Windows,告别 WSL。本期演示完整配置流程并对接 DeepSeek 模型。 
#HermesAgent#Windows配置#DeepSeek#AI工具#智能体体
    04:28
    查看AI文稿
  • 每期认识一位神话神祇——众神的信使,赫尔墨斯#赫尔墨斯 #古希腊神话 #神话
    01:48
    查看AI文稿
  • 火星已经介入  我们终于可以见面
    17:48
    查看AI文稿
  • #诡秘之主#网文设定 #梅林赫尔墨斯 #什么是奇迹 #小说推荐 @抖音小助手
    00:47
    查看AI文稿
  • vLLM 昨晚发布了 v0.20.0,这一版动静真不小,与其说是版本更新,不如说是把推理引擎的天花板又往上顶了一截。 
先看几个最硬的点。 
第一,DeepSeek V4 首日支持,国内做大模型部署的朋友这条最关心,新模型刚出,vLLM 这边初始化就跟上了。 
第二,CUDA 13 成为默认,PyTorch 升到 2.11,Python 3.14 也进了官方支持列表,老环境直接 pip install 大概率翻车。 
第三,FlashAttention 4 重新成为 MLA prefill 默认后端,跑 DeepSeek 这类架构会有肉眼可见的提速。 
第四,TurboQuant 2-bit KV cache,等效容量翻 4 倍,长上下文场景下,这就是降维打击。 
第五,在线量化前端落地,以后跑量化模型不用提前折腾权重,加载阶段就给你量化好。 
要不要升?跑 DeepSeek V4、Hunyuan v3 这些新模型,直接上;生产环境稳定的 v0.19,等 0.20.1 出来再说。 
折腾一次环境,换未来半年的部署红利
    01:10
    vLLM 昨晚发布了 v0.20.0,这一版动静真不小,与其说是版本更新,不如说是把推理引擎的天花板又往上顶了一截。
    先看几个最硬的点。
    第一,DeepSeek V4 首日支持,国内做大模型部署的朋友这条最关心,新模型刚出,vLLM 这边初始化就跟上了。
    第二,CUDA 13 成为默认,PyTorch 升到 2.11,Python 3.14 也进了官方支持列表,老环境直接 pip install 大概率翻车。
    第三,FlashAttention 4 重新成为 MLA prefill 默认后端,跑 DeepSeek 这类架构会有肉眼可见的提速。
    第四,TurboQuant 2-bit KV cache,等效容量翻 4 倍,长上下文场景下,这就是降维打击。
    第五,在线量化前端落地,以后跑量化模型不用提前折腾权重,加载阶段就给你量化好。
    要不要升?跑 DeepSeek V4、Hunyuan v3 这些新模型,直接上;生产环境稳定的 v0.19,等 0.20.1 出来再说。
    折腾一次环境,换未来半年的部署红利
    查看AI文稿
  • 【无口喵新神典2】哪吒VS赫尔墨斯,哪吒:你想怎么死啊,杂碎#动漫解说 #漫画解说 #终末的女武神 #原创 #无口喵新神典
    09:34
    查看AI文稿
    4.7万无口喵