deepsea two a, 一个在终端里运行的 ai 编程代理,它基于 deepsea v 四模型,能在你的终端里读写文件、执行命令搜索、网页管理、 get, 甚至协调子代理完成复杂任务,一行命令启动直接开始干活。安装方式非常灵活,用 n p app 异形搞定,也可以用 cargo 从源码翻译。 mac os 用户还能用 homebrew 支持 linux、 mac os、 windows 三大平台,包括 arm 六四四架构。中国大陆用户可以配置镜像加速下载。 安装完成后运行 deep seek version 验证,第一次启动会引导你配置 api key。 deep seek two i 的 核心能力非常全面,文件读写和编辑, shell 命令执行、 get 版本管理、网页搜索和浏览 apply patch 补丁应用,还有 mcp 协议支持和子代理协调。最厉害的是原声 rlm 功能,可以用便宜的 flash 模型跑批量分析, 每次编辑后还会通过 l s p 自动检查错误。三种工作模式适应不同场景。 plan 模式是指读探索模型,指看不动,先制定计划再动手。 agent 模式是默认的交互模式,每步操作都需要你审批。通过 o o o 模式最刺激,自动批准所有工具,调用适合你信任的工作区,按 tab 键就可以在三种模式之间快速切换。 autopilot 模式是 deep sea ui 的 杀手级功能,它会在发送真正请求之前,先用 flash 模型做一次轻量级路由判断,自动选择最适合的模型和思考深度。简单的问答用 flash 就 够了, 复杂的代码调试会自动升级到 pro 模型,加上深度思考,这样既省钱又高效, api 端收到的永远是具体的模型配置。 deepseek v 四,支持一百万 tokin 的 上下文窗口,配合智能上下文追踪和前缀缓存机制,能高效处理大型代码库。 内置实时费用追踪,每一轮对话的 topic 用量和费用估算一目了然,还能看到缓存命中和未命中的详细分解,思考深度。支持关闭高核最大三档,用 shift 加 tab 随时切换,整个系统的架构非常精巧。 deepseek 命令型工具作为调度器,启动 deepseek toy 办理进程,通过 raata toy 构建终端界面,异步引擎处理所有工具调用。最后通过 open ai 兼容的流式客户端与模型通信工具调用。走类型化注册表,支持 shell 文件操作、 git 网页子代理、 mcp 和 rlm 七大类别。还内置了持久化任务队列和 http sse 运行式 api。 还有更多实用功能, 绘画、保存和恢复长任务,不怕中断工作区回滚。用独立的 side git 做快照,不会污染你的仓库。 skills 技能系统可以从 github 安装社区技能包,也可以自己编辑。 支持多语言界面,包括中文、日文、英文和葡萄牙语。还支持 nvdia、 nim、 fireworks、 sklam、 voll 和 alama 等多种后端提供商,赶紧试试吧!
粉丝1839获赞8671

快来看,我实测了 deep seek t u i 这个免费的 ai 编程 agent。 最近美国有个小伙,几天功夫就手搓了一款专门为 deep seek v 四打造的编程工具 deep seek t u i, 非常类似于 cloud code, 上线没几天就收获了一点一万多颗星,超级火爆。我今天实测了一把, 感觉效果非常好,给大家分享一下我的实测过程,并请大家亲自点评一下。安装和使用非常简单,首先我注册了 deep seek 的 账号并充值,然后创建了一个 api key。 接着我到 github 上搜索 deep seek to y, 就 到了这个项目的首页。 这个项目的开发者叫 hunter bone, 项目是一个星期前才开源的,目前已经收获了一点一万颗星,一周冲到一点一万 star, 太牛了!好,我们来看看它到底好不好用, 想安装的朋友可以看这里,这个小伙还专门准备了中文版的 readme, 因为我一直用 node js, 所以 就用 npm 安装,一行命令就搞定,很轻松。 npm install deep seek t u i 你 看这界面真简洁,一句废话没有,连 successfully installed 的 都没有。安装好了,直接输入 deep seek, 回车就开始了。开始时需要配置几个选项,非常简单,关键是语言设置,在需要 api key 的 时候,把 deep seek 的 key 拷贝进去就好了。 然后我让他接手我一个没完成的项目。这个项目是一个谷歌浏览器的插件,功能包括网页局部翻译、 pdf 局部翻译,还有视频字幕翻译。下面请你们自己观看效果。我只辅助说明一下, 因为这个项目已经放了很久了,我已经记不清进展到什么程度了。于是第一个任务,我让 deep seek 查看我们的几个开发计划文件,然后扫描所有原码,看看还有哪些没完成的任务,并让它不要修改代码。注意,在这个 t u i 工具里, deep seek 的 思考模式是默认打开的,你可以看到它是如何思考的。 很快, deepseek 就 输出了整个项目的分析报告,分七个部分,尽管思考过程是英文输出,但报告竟然是中文的,非常友好。报告详细分析了原计划目标、已完成任务、未完成任务、超额完成的任务。最后还有一个综合代办清单,把有待完成的项目按类别一一列出, 备注中还给出了任务难度,给出的信息相当靠谱,看来他完全理解了我的项目计划书和现有代码。查看了这些输出报告后,我选择了三个任务,请他完成第一个任务,项目图标缺失。 deep seek 打算用 python 生成一个图标,但尝试好几次不成功,因为我这台电脑没装 python。 他 发现这个问题后,改用 node js, 然后成功写了代码并运行完成了图标生成。好像一次生成了好几个不同尺寸的图标, 一会儿给大家展示的时候可以看看,图标设计挺不错的。第二个任务,提高当前代码的鲁棒性,也就是让代码不容易崩溃,程序更健壮。它修改了好几个地方的代码。 第三个任务,改进网页 dom 的 便利,也就是更好理解浏览器中的网页结构,从而决定在哪里注入翻译项。它还修改了关于视频上下文中按钮位置的相关函数。完成任务后, deep seek 生成了一个简单的摘药, 总共增加了两百多行代码,新增了十个函数,修改了六个函数,生成了三个图标,还修改了一个非代码文件。 思考过程中还显示 deepseek 对 代码进行了测试,并确认十三项功能通过了测试。确认没问题之后,他还清理了中间过程代码和一些脚本文件,总体感觉效率很高,对问题的理解也很到位。在这个对话框的最下端,显示了当前所有操作的开销,总共花费零点二七美元,大约合二块人民币。 小伙伴们,你们觉得这个价格怎么样?请打在评论区。好,现在我们来看看这个代码的效果。在 chrome 里面加载我这个扩展,然后把图标放到工具栏上,这个图标就是 deepseek 写的脚本生成的,感觉还是挺不错的。现在你看,当我浏览网页时,有一个小图标跟随我的鼠标 在想翻译的段落旁边停下来,点击这个按钮,等一小会儿,你就会看到这段文字被翻译好了,显示在该段落的下方。 如果你打开的是一个 pdf 文件怎么办?来看,点击这里,我们就在侧面开了一个副窗口,显示同样的 pdf 文件。当你的鼠标划过 pdf 的 段落时,也会看到小图标,点击一下,原来的英文被替换成了中文,神奇吧! 好,再来看一个 youtube 视频,这个视频全英文,听不懂怎么办?当你把鼠标划过视频时,会看到这个蓝色小图标,点击稍等一会,它会把视频的语音转成文本,再翻译成中文,然后给视频加上字幕。当然,你需要重新播放才能看到字幕,是不是挺方便的? 看来这个 chrome 插件原来的 bug 基本都修复了,基本可以用了。好了,今天给小伙伴们分享了如何使用 deep seek v4 pro 进行编程。 你看完这个视频,对 deep seek 这个工具有什么感觉?你觉得 deep seek v4 pro 的 编程能力是不是很在线?请把你的想法打在评论区。

deepsea toothy 今天在 get up 冲上二点三 k 星,这简直就是 deepsea 玩家的 cloud code。 同时 openai 和 antropic 都在搞企业级合资公司,商业化路子越走越远了, deepsea 也有了自己的专属 coding agent。 这个叫 deepsea toy 的 项目刚刚在 get up 冲破二点三 k 星,作者 hunter bow 用 rust 撸出了这个工具, 主打一个在终端里流畅运行,且专门针对 deepseek 的 a p i 做了适配优化,它像极了 cloud code。 但对国内开发者来说, deepseek 的 性价比和响应速度配合这个 t u i 工具,生产力直接拉满,只能说这波是金鱼兄弟们的狂欢。 聊完工具,来看看巨头们的商业化变阵。 opennine 和 antropic 最近都在低调推进企业集合资公司计划,简单说就是不再只卖 a p i, 而是要和垂直行业的巨头深度绑定,成立合资实体来提供定制化 ai 服务。这种模式能绕过很多合规和数据隐私的弯路。 看来在通用模型卷不动的时候,下沉到企业深水区搞合资成了大家共同的财富密码。说到企业级 ai, brettaylor 创办的 sierra 刚拿到了九点五亿美金的巨额融资, 这公司主打的是能帮大企业构建自主 agent, 不是 简单的聊天机器人,而是能处理复杂业务逻辑的智能体。这笔钱砸下去,意味着硅谷对 agent 替代传统萨斯的信心已经爆棚。 对于开发者来说,这预示着未来企业应用的架构将全面转向 agtech 工作流。 a w s 这边也在猛攻基础设施。 stage maker ai 连发三个更新,首先是 agent core 优化环进入预览,解决了 agent 性能评估的闭环难题。 其次是 agent 引导的工作流降低了模型定制的门槛。最后还上线了自动实力回退功能,当算力资源紧张时,能自动切到备用节点。这套组合拳下来, ados 是 想把 agent 的 全生命周期管理都锁死在自己的云生态里。 一个有趣的行业趋势, tech crunch 报导显示,现在驱动移动应用增长的已经不再是聊天机器人的升级,而是图像 ai 模型。用户对能生成图和能改图的需求明显比能聊天更愿意掏钱 多。 dash 刚上线的 ai 菜单修图工具就印证了这一点。看来多模态能力的商业化落地图像还是走在最前面。最后照例吃个瓜。马斯克和 openai 的 诉讼案又有新进展, openai 声称马斯克在寻求和解后给 gribble、 rockman 和奥特曼发了不祥的短信。 马斯克的唯一专家证人也公开表达了对 a g i 军备竞赛的恐惧。这场硅谷顶流的互撕,已经从技术路线之争演变成了充满悬疑感的个人恩怨剧。 观众老爷们,这关你们怎么看?以上就是今天的 ai 早报, deep seek 挑起的出现,再次证明了 r s 的 垂直领域适配才是生产力工具的正确姿势。巨头们搞合资公司,说明 ai 已经从实验室玩具变成了生一场利器。 你觉得合资模式会是 open nine 的 救命稻草吗?在评论区聊聊,记得点赞关注,咱们明天见!

炸了!今天 github 全球趋势榜第一就是这个 deep sync t u i, 一 天狂涨六千加 star 直接登顶!它是一款运行在终端里的原生编程智能体,专为 deep sync v 四量身打造。如果你想用国产最强模型开发项目,一定要试试! 项目是由 rust 翻译单二定制文件无依赖,不装 node, 不 装 python, 开箱即用。并且支持全平台 linux、 macos、 windows, 同时还带简体中文界面, 能一次性吃透整个代码仓库, ai 思考过程实时看得见,还带智能缓存,响应更快又省 token。 支持三大模式,只读审批,全自动,能直接读写文件执行效管理、 get 搜索网页,调用子 agent 绘画续作、快照回滚,实时费用统计。而且现在正好赶上 deepstack v 四官方折扣活动,这个时间段用,性价比很高。一行命令启动 ai, 直接接管你的整个工作区,不用浏览器,不用复制粘贴,直接提升开发效率。 项目地址放评论区了,欢迎评论交流,关注科技区角,看见更全面的科技世界!

兄弟们,老外已经开始给 deepsega 写赛博外挂了,你看史大数都爆了。而且最离谱的是,这个美国小哥为了中国用户居然发推求微信拉群,甚 至还专门为中国用户研究国内镜像源,方便你安装使用。这个项目名叫 deepsega t u i, 它本质上就是一个运行在终端的 ai 编程 agent, 你 可以理解成把 ctrl cloud code o 喷扣的全部塞进一个黑客电影界面里,它能直接读代码、改代码、跑命令管理 get, 甚至还能开紫 agent 帮你并行干活。重点是,它可是专门为 deepsea 深度优化的,这已经不是一个 ai ide 了,这是一个真正的 terminal ai 操作系统。关注我,每天解锁更多前沿 ai 知识!

美国独立开发者爆火全网,非计算机科班出身,仅凭业余爱好打造开源项目 deepsea tui, 完美平替 cloud code 冲上 github 热榜,收获六点二 k 新标。作者特意适配国内阿里云、腾讯云下载手写中文致谢,细节拉满,太暖心。

最近开源圈的五一黑马 deepsea tui 你 刷到了吗?美国音乐加法律背景的开发者直接杀疯了!扑克 cloud code 的 核心能力,用 deepsea 做了个免费终端编程 agent, 五一假期直接狂揽二十 k s 档。它最炸的亮点就是把 deepsea 前沿模型直接接入你的终端工作区。 browse 原声编辑适配 deepsea v 四点读写文件好 share 命令管理 keep 仓库一键搞定全程键盘驱动的 t o i 界面,零锐于图形界面,速度快到飞起。

deepsea 又放大招了,开发一个应用竟然只要不到十块钱!一款叫 deepsea t u i 的 神器直接杀进 get 榜第一,为什么他这么火?一句话,他把开发的门槛直接从月薪三万拉到了不到十块。以前你想开发个应用得学编程,买服务器没个几万块根本下不来。现在你只需要十块钱的 a p i 额度,连代码都不用写,直接在中单跟他对话,小白也能上手。 此次开发一个记账插件或者天气,入手成本甚至不到一顿早餐钱。当大家都盯着硅谷的奥特曼 g p t 时,却没发现家门口的 deepsea 已经悄悄把 ai 的 价格战打到了地板以下。它不是在做模型,它是给全球 ai 行业做了一次暴力降本, 同时也是为了证明 ai 的 主权不该只在几家巨头手里。这种技术平权的狠劲才是二零二六年最硬的国产光芒。

如果不想再交各种 ai 工具的月租费,那么你可以试试我的这种玩法。我把 deepsea v 四接入到了 windows 电脑,准确地说,不是把大模型装进电脑,而是在电脑上安装了一个开源项目,叫做 deepsea t u i, 让 deepsea 变成了个运行在本地文件夹里面的 ai agent。 这个有什么用呢?他可以在你授权的情况下,直接读取电脑里面的施工合同、招标文件、项目资料,可以帮你写联系函,整理资料清单,生成审计风险提示,甚至可以帮你提交施工组织方案。更有意思的是,他不用再写复杂的提示词,直接用大白话指挥他就可以了。 比如我让他去官网查一下驻建部门最近有什么政策,有哪些他就自己去找,自己去整理,再把结果汇报给我。如果我把自己做的施工组织技能 skill 给他,他就可以按照我的工作逻辑,一步一步帮我写施主方案。 这个东西有几个好处,第一,开源项目本身是免费的。第二,只要你去 deepsea 申请一个 api k 安装,配置好之后就能用。第三,他的使用成本比较透明,你不用再买一堆看不明白的会员套餐, 只需要按照自己的 a p i 调用量付费,用多少花多少,后台都能在 deepseek 的 a p i 里面看到。当然,它也有一个门槛,界面不是网页的,是终端的。刚开始看还有点不习惯,需要花点时间。保姆级的教程以及需要的软件和代码我都给你准备好了,等你来拿。

deepseek 刚有了自家版 cloud code, 没想到竟演变成今年最魔幻的开发者名场面。这个项目叫 deepseek, 是 一款基于 deepseek v 四打造的开源终端原声 ai 编码工具,短短几天就在 github 上爆火。 据相关数据显示,五月六日他登顶 github 趋势榜单,日狂揽两千四百三十四颗星,总星数突破一万零二百颗。而当天早些时候的另一则报道显示,他的星数还在八千七百颗左右, 足以看出这波热度涨得有多疯狂。前一秒它还只是个不起眼的 deepsea 封装工具,下一秒 github、 reddit x 平台以及国内科技社区就全在讨论它。先把核心逻辑说清楚,主打一个懒人福音,以前写代码得打开浏览器,复制代码、粘贴到聊天机器人等,建议 在手动应用所有修改步骤繁琐到劝退。而 deepsafe 二直接让你在终端里和 deepsafe 对 话,不用切换窗口就能读取编辑文件,运行 shell 命令、搜索网页管理、 get 仓库应用补丁处理任务,还能通过键盘驱动的终端界面协调子智能体。这也是它和 cloud code 最明显的相似之处。 它和 cloud code、 ader、 client open code 同属一类编码工具,但不同的是,它全程围绕 deep seek v 四深度设计,没有走通用多模型工具的路线。这种原声适配 deep seek 的 定位,或许正是它爆火的关键。要知道, deep seek v 四本身就自带一百万 token 上下文窗口低价优势, 其 pro 版和 flash 版也一直备受关注。而 deepsea 拓一正是把这些模型优势实实在在转化成了开发者能用得上的编码工作流值得一提的是,它并不是 deepsea 官方产品,而是由美国独立开发者亨特邦德打造的,它在 github 上的账号名为 bob。 这个项目于二零二六年一月十九日首次发布,到五月初已经经历了数十次更新。有技术文章提到,它已更新至零点八点八版本,累计发布三十七个版本。 而相关数据显示,五月六日早上,他刚更新到零点八点一三版本,重点修复了运行时和 t u i 相关的问题。更魔幻的是,开发者本人 亨特邦德可不是常规的 ai 研究员,他有着多年编剧开发经验,但专业背景却横跨音乐教育和法律。二零一五年,他从北德萨斯大学获得音乐教育学士学位,二零一九年又从南非理工大学获得音乐教育硕士学位。如今,他正在该校的戴德曼法学院攻读专利法硕士,据报道,目前是二年级学生。 有意思的是,它是靠 ai 辅助编码完成了 deepsea 二的开发,还把这个工作流程形容为早期版 ai 自我迭代,用 ai 帮自己打造工具,而这个工具又能帮其他人用 ai 编码。这个细节让这个项目更具话题性,也让它不只是一个简单的编码工具,一个有着音乐背景的专利法学生,做出了一个基于 rust 语言的 ai 编码工具, 登顶 hiphop 趋势榜,还吸引了中国开发者的关注,甚至为了和 deepsea 社区沟通,开始自学中文。五月三日,邦德发文称,两天前他还默默无闻,而这两天堪称他人生中最疯狂的日子。 他还表示想和中国开发者建立联系,并称他们为鲸鱼兄弟。这个称呼瞬间成了小梗,有人觉得好笑,有人好奇幽兰。后来 x 平台上有网友透露,他已经注册了微信,开始和中国开发者直接沟通。 这个项目也处处透着对中国开发者友好的细节。邦德专门写了中文 readme, r e a d m e dot z h dash c n dot。 开源主页还提供了适合中国开发者的镜像友好型安装版本。就连贡献者列表都成了讨论热点。列表中出现了 clop 和 gemini 的 名字, 这大概率意味着项目中存在 ai 辅助开发的痕迹。从技术层面来说, deepsea cleveland 可比普通的封装工具有意思多了。它采用双二进置 rot 架构,包含 deepsea dispatch c l i 调度器、命令行工具和 deepsea t o i run time 运行时工具。调度器负责身份验证、配置、模型选择和绘画管理, 运行时负责实际的智能体循环和终端界面,两者必须同时运行,缺一不可,否则会抛出缺失配套二进置文件的错误。它的用户界面 ui 是 用 ready to e 构建的,属于原生 rust 终端应用,不是 electron 应用 open 守护进程,也不是后台运行的 node 进程,运行起来更流畅、更轻便。安装方式也很灵活,可以通过 npm install 既 dyp 一 点 koey 和 dyp 二 koey 和 dyp 二 koey 用户还能通过 homebrew 安装 其中一个版本,还修复了 windows 路径分割符和 ar 六十四、 linux 二定制文件可用性的问题。可见开发者确实在用心维护跨平台支持它的内部流程很简洁, deepsea dispatch 启动 deepsea tui 配套运行时, 将 ready tui 界面与异步引擎 open ai 兼容的流逝客户端连接起来。工具调用通过一个类型化注册表进行,包含 shell 命令、文件操作、 get 操作、网页搜索、 u i o i o 获取紫智能体绘画、 m c p 服务器连接和 r l m 等功能。 结果会实时流逝回检到 transcript 中,用户能实时看到进度,不用等到最后一次性接收完成响应。 deepsafe v 四的优势几乎全在这个工具里体现的淋漓尽 致。很多编码应用都说支持 deepsafe, 但大多只是简单连接 deepsafe 的 a p i 把它当成普通模型对待。而 deepsafe two 也不一样,它完全围绕 deepsafe v 四的特色设计,一百万 token 的 超大上下文窗口、更便宜的缓存 token、 低成本的 v 四 flash 模型, 以及推理能力更强的 v 四 pro 模式,甚至还能跟踪缓存命中和缓存未命中的情况,让开发者清楚知道模型何时再使用更便宜的缓存输入,避免每次都支付全价。它还解决了 ai 编码工具最头疼的一个问题, 规划体积过大。当智能体长时间处理一个项目时,会不断积累文件工具,结果命令输出错误信息、修复方案和解释内容。 久而久之,绘画会变得混乱且成本高昂。 deepsea 初尾能跟踪上下文的使用量,并压缩绘画中较旧的部分。在零点八点一三版本中,它新增了更智能的清理系统,不用花钱让 ai 总结所有内容,工具自身就能先压缩旧的工具结果, 比如不会保留完整的大型旧命令输出,而是只保留一行简短版本,同时保存最新的重要数据。如果这样,就能缩小绘画体积,甚至可以完全跳过付费的 ai 总结步骤。除此之外,它还能解决 ai 编码工具另一个烦人的问题陷入循环。 有时候, ai 编码工具会反复运行同一个工具或命令,哪怕已经失败了好几次, deepsea two 也会实时监控这种情况。如果同一个工具带着相同的参数在一次用户请求中出现,第三次就会停止重复操作并插入纠正信息。 如果某个工具连续失败,第三次会发出警告,第八次则直接停止。这听起来很技术,但直观重要。当 ai 智能体能访问你的文件和终端时,你肯定希望它足够智能,不会浪费你的时间和金钱。最吸睛的功能当属实时推理流, deepsea v 四 pro 能将推理过程与最终答案分开发送, 而 deepsea toy 会把这个推理过程直接显示在终端里。也就是说,开发者不只能看到最终结果,还能实时观察模型如何分析问题, 决定要检查什么,调用什么工具,最后得出答案。由技术文章提到更新日制,甚至考虑到了模型在调用工具前进行推理的情况,哪怕此时还没有显示常规消息这种细节,大多数普通的封装工具大概率会忽略。 deepsea 还有三种主要工作模式,适配不同场景。一、计划模式 play mode 安全模式智能体可以读取你的代码、检查文件、搜索项目,解释它要做什么, 但不会做出任何修改,适合前期调研和分析。二、智能体模式 agent mode 正常模式可以使用全部工具级,但如果要执行重要操作,比如编辑文件、运行命令修改, get 会先请求用户批准,兼顾便捷性和安全性。 三、优漏模式在可信项目中,智能体可以自动执行操作,这听起来有风险,确实也存在风险,所以权限检查直观重要。更新日期中甚至提到修复了优漏模式下 get 命令太容易被批准的问题, 可见这类工具的开发需要极其谨慎。它还有自动模型选择功能,用户输入 model auto 工具就能为每一步操作选择最合适的模型, 还能调整模型的推理强度。通过 shift 加 tab, 可在无推理、高推理、最大推理之间切换。如果任务简单,就用更轻便、更便宜的模式。如果任务复杂,就让模型进行更深层次的思考,兼顾效率和成本。另外一个让它区别于普通 cloud code 克隆版的功能是 i l m, 在 工具中显示为 i l m query 不会把所有任务都交给一个主模型,而是可以将工作分配给一到十六个更小的子智能体。这些子智能体通常运行在更便宜的 deep sec v 四 flash 模型上。一个子智能体检查一个文件,另一个尝试不同的方法,再一个负责调研,还有一个查找漏洞。如果某个子任务需要更强的推理能力,就会升级到 v 四 pro。 这个设计灵感来自亚利克斯,将 alex jang 的 i o l m 研究和 sakana ai 的 新奇搜索研究,但在这里,它被转化成了实用的编码功能,而成本优势正是这个功能最大的吸引力。 deepsea v 四 flash 不 够便宜,让同时运行多个小型智能体变得可行。 有报道称, v 四 flash 的 折扣恢复后,每百万 token 输入成本约零点一四美元,输出成本约零点二八美元。还有报道称,运行最多十六个 v 四 flash 的 任务成本大约是用 pro 模型完成类似工作的三分之一。对于需要控制 a p i 账单的开发者来说,这绝对是一大卖点。 除此之外,它还支持 m c p 模型上下文协议,简单来说就是可以接入其他工具和服务。和现在其他现代 ai 编码工具接入外部系统的方式类似,它还支持技能功能。所谓技能,本质上是一个小型指令包,能教智能体如何处理特定类型的任务。开发者甚至可以从 github 安装社区技能,不需要单独的后端服务。 针对长时间工作场景,它也做了贴心设计,可以保存绘画,后续继续操作。处理大型任务时,可以创建检查点,自带回滚系统,每次工作前后都会创建项目快照。如果出现问题,用户可以用 restore、 reverse turn 等命令回滚,不用改动项目正常的 get 设置。 还有持久化任务队列,重启程序后,未完成的后台任务可以继续执行。在代码诊断方面,它能与 rust、 analyzer、 pureite、 type script language server、 go plus、 clangit 等工具连接,编辑后能实时显示真实的编码错误和警告。 而且,他显然在努力跳出小众开发者圈子,走向更广泛的用户。支持持久化个人笔记,让偏好设置在不同绘画中保持一致。支持英语、日语、简体中文和巴西葡萄牙语,还能自动适配系统语言。通过 deepsea service t p 命令,还能通过 http 和 sse 运行,不用打开完整的终端界面,就能用于更多自动化工作流。 所以,尽管 deepsea two 目前还是一个快速迭代的开源项目,但它已经不满足于做一个简单的终端聊天机器人,而是在努力成为开发者日常能用得上的实用工具。现在的问题是,它会一直停留在 github 爆火一时的热度里,还是能真正成为开发者每天都会用的工具。 爆句实在的,这个项目的爆火,本质上是 deepsea 微四的优势加开发者的真实需求碰撞的结果,低价高效原声适配解决了编码中的实际痛点,再加上开发者的传奇背景,想不火都难。你觉得它能从网红工具变成刚需工具吗?评论区聊聊你的看法。

deepseek 甩出王炸,直接把开发应用的门槛砸到了一顿早餐钱,月薪三万的岗位一夜之间变成了人人能做的副业。一款名叫 deepseek tui 的 工具中上 getpop 全球榜首,不用写代码,不用买服务器, 只要十块钱的 a p i 额度,在终端跟它对话就能做记账插件,天气助手实测,几分钟就能开发一个完整应用,而且成本不到六块钱。当所有人还在追叉 g p t 的 高价工具时, deepseek 已经把 ai 价格战打到了地板。用技术平权打破巨头垄断。

deepseek 已装好了,先别急着改代码。第一次上手最稳的是先读项目,先进入真实项目目录,再启动 model auto, 别在空目录里测试,然后用 plan 模式只读项目, 直接问他。先看目录结构和启动方式,不要修改文件。计划出来后,先检查三件事,项目定位,入口文件启动命令, 确认没跑偏,再切 agent 做小任务。比如先找 readme 问题,只提建议。想看真实修 bug 评论,修 bug 收藏转发关注临近未来。

devic 微四硬件配置全解析中小企业本地部署落地指南二零二六年四月二十四号凌晨, devic 突然扔出了 v 四预览版,震动了开源大模型圈。很多人刷到官方参数的第一反应还以为这数据是不是标错了, 毕竟一点六万亿的总参数摆在那,一百万 t 开源的上下文还全系标配,而且直接采用了幺幺三零进防炮扫射了。 社长这两天把大家最关心的硬件配置问题都整理清楚了,接下来我会从模型本身的核心参数,到华为升腾全系列显卡的实际表现,再到英伟达显卡的部署门槛,还有整机的硬件搭配,一项一项跟大家说清楚,大家一定要耐心看完,看完之后你就清楚该怎么配硬件了。 特别让人兴奋的是, deepsea 微四没有像过去那种单纯的事后移植,而是从模型设计阶段就跟国产算力深度绑定了,华为团队直接驻厂,双方联手重写了大量底层代码,硬是把这套万亿参数的大模型从英伟达的扩大生态转移到了华为自研的 c a n n 框架上。 升腾那边也完成了推理和训练的全方位适配,开箱就能用。发布当天,华为升腾就完成了首发适配,全系列超节点产品都跑起来了。当然,英伟达那边也没丢,技术报告里两家芯片是并列验证的关系,但可以说这是国产顶尖 ai 模型与自主算力底座深度融合的重要突破。 这次 deepsea v 四开元模型一共出了四个版本,对外提供服务的主力是 v 四 pro 和 v 四 flash, 另外还有两个不带对齐的 bios 版,专门给开发者做二次微调用的,它采用了新一代混合注意力加 d s a 稀疏注意力技术, 能做到一百万 talking 内基本不丢信息,这代表了什么呢?代表了他一次性读入整本书或者整个中型代码库都没问题,不管是长文档分析、法律合同审查,还是百万字小说创作,都能轻松搞定。在讲硬件配置之前,我们要先搞懂两件事情。首先是参数量和显存占用的关系。 deepsea v 四 pro 总参数量是一点六万亿, deepsea v 四 flash 总参数量是两千八百四十亿。这两个总参数量都是 f p 十六原生精度基准值, 直接决定了本地部署的显存占用。 f p 十六 b f 十六是原生满血精度,每个参数占两字节, f p 八 ink 八占一字节显存减半。 f p 四 q 四 int 四占零点五字节显存百分之二十五, q 二 int 二占零点二五字节显存百分之十二点五。因此,在 f p 十六净度下对应的显存占用分别是一点六 tb 和两百八十四 g b 显存八净度下对应的显存占用分别是八百 g b 和一百四十二 g b。 q 四进度下对应的显存占用分别是四百 gb 和七十一 gb。 在 极限压缩的 q 二进度下对应的显存占用分别是两百 gb 和三十五点五 gb。 也就是说,哪怕是运行最小的 deepsea v 四 flash q 二模型,单模型的显存占用就要达到三十五点五 gb。 除了模型本身的显存占用之外,还有上下文, k v 缓存框架开销和中间张量预留都会产生显存占用,上下文越长,显存占用越大。如果要达到一照超长上下文, 单频发 k v 缓存的显存占用就要达到二十到三十 gb。 其次, deepsea 微四全系都是 m o e 架构模型, m o e 是 混合专家架构的意思。以 deepsea 微四 pro 模型为例, 它的所有专家模块加起来的总和是一点六万亿参数,每次推理的时候只会激活四百九十亿参数,让这很小一部分的专家来干活。但并不是说显卡每次只要运行四百九十亿参数才能运行,不能只加载单次推理的激活参数, 这是我们在后面计算显存需求的核心前提。好,搞懂了这两个核心问题,那我们就正式进入硬件配置解析环节。因为 deepsea 微四 pro 参数量过于庞大, 需要几十张顶级显卡才能流畅运行,这巨额的成本支出基本上不是给中小企业准备的。所以我们这一期把重点放在中小企业最关心的 deepsea 微四 flash 高效谱绘版上面。 它的 f p 十六总参数量是两百八十四 b, 单 talking 激活参数量是十三 b, 定位、日常兑换、轻量化业务部署、高并发推理和低成本落地场景 契合绝大多数中小企业需求。我们先来看一下 d p c v 四 flash 对 应的显存占用模型本身叠加 k v 缓存、框架开销等之后, f p 十六精度需要六百二十 g, 显存 int 八精度需要三百二十 g, int 四需要一百六十 g q 二需要九十 g。 在这些精度中,社长推荐有一定实力的中型企业上, int 八精度模型性能损失较小,推荐小型企业上 int 四精度模型,虽然有一定的精度损失,但性价比较高,不太推荐 f p 十六和 q 二精度, f p 十六性价比不高, q 二精度损失较大,性能偏弱。 除了上述的精度模型之外,社长还推荐 d p c 官方推出的 f p 四加 f p 八混合精度模型,只需要一百二十 g 显存,而且一张华为升腾、阿特拉斯三五零一百一十二 g 显卡就能实现适配,也是目前性价比比较高的方案。华为升腾是怎么做到的呢? 因为这一次 deepsea 微四与华为升腾实现了原声适配,这就是它在升腾显卡上表现出色的核心原因。在华为升腾的显卡芯片型号里,比较适配 deepsea 微四的是升腾九幺零 b 四、升腾九幺零 c 和升腾九五零 pr。 其中升腾九幺零 b 四对应的显卡是阿特拉斯三百 i a 二六十四 g, 升腾九五零 c 对 应的显卡是阿特拉斯三五零一百一十二 g。 其中比较适合中小企业的是二零二六年三月刚刚商用的阿特拉斯三五零推理加速卡,它搭载 scent 九五零 pr 芯片,标配一百一十二 g 自研 hbm 高宽带显存,宽带一点四 t 每秒, f p 四算力一点五六 p flops, 是国内率先原生支持 f p 四低精度商用的 ai 加速卡,单卡就能实现高吞吐、低延迟推理。据 d p 四个官方实测,综合性能约为英伟达 h 二零的二点八七倍,升程速度显著提升。再来看英伟达平台在具体部署要求上, f p 十六精度需要八张 a 一 百八十 g 显卡,英特八精度需要四张 a 一 百八十 g 显卡,英特四需要两张 pro 六千九十六 g 显卡或四张四零九零四十八 g 显卡。 q 二,需要一张 pro 六千九十六 g 显卡或两张四零九零四十八 g 显卡。目前英伟达的 blackwell 架构是原生支持 f p 四精度的, f p 四精度的 dipstick 模型跑在 blackwell 架构的显卡上性能会有大幅提升,这也是为什么最近几天采用 blackwell 架构的 pro 六千九十六 g 服务器版显卡价格飙升的原因。从部署成本上说, f p 十六精度成本过高一般不是中小企业可以承受的, note 八和 f p 四是中小企业比较可行的精度,整机在十几万到三十万之间, q 二,精度损失比较大,不建议采用。接下来说说服务器整机配置硬件的要求,显卡是核心关键瓶颈, cpu、 内存、硬盘也要严格匹配,不能出现短板。 q 二,测试级配置推荐 cpu 十二和二十四线城以上,主频大于等于两点五 g 二卡以上需要十六和三十二线城 内存一百二十八 g 起步。硬盘推荐 nvme 三点零固态五百一十二 g 以上机械硬盘和赛道固态无法满足模型运行需求。 intel 四以上的生产级配置,双路服务器 cpu 二十四和四十八线层以上,主屏大于等于两点六 g, 支持至少六十四条 pci 四点零通道,内存两百五十六 g 以上,一兆上下文需要升级到五百一十二 g 硬盘用企业级 nvme 四点零固态二 tb 以上, 连续读速大于七千兆每秒,硬盘配小了连模型都装不下。最后说说个人消费级配件,因为消费级 cpu 最多支持两张显卡跑满速。也就是说,如果用消费级硬件来跑, deepsea 微四目前最高可以配两张 pro 六千九十六 g 显卡,显存合计一百九十二 g, 可以 流畅运行 it 四以下版本的模型,但整机成本高达十五万以上,这已经超出大多数个人用户的承受范围了。 好,以上就是关于 deepsea 微四的硬件配置全解析,如果你也有个人工作室或小企业的 ai 本地部署需求,不管是硬件配置搭配还是软件的部署调试开发,都可以来找社长聊聊。

前几天,一个美国老哥在网上求助中国程序员,帮他扫码微信辅助验证,他用 deepseek 翻译了一段中文,管咱们叫金鱼兄弟,而且发誓,我实手抓到的卡国安装,决不让中国兄弟受 n p m 的 苦。 这老外到底想干嘛?他来给咱们送外挂了!写了一个叫 deepseek tv 的 终端工具,五一假期期间狂揽十七个 star, 你 的终端直接变身顶级 agent, 文件读写、 get 操作, mcp 全支持,而且有两个变态功能,第一,智能路由,用极便宜的 flag 模型做调度,遇到复杂代码自动切换 pro 模型,帮你把 api 账单压到极限。 第二,思维流透明,终端里实时渲染 ai 的 内心独白,绝不搞黑客,这不叫玩具,叫伸展级武器。最离谱的是,做的是个搞音乐的文科生,全靠 ai 辅助写出了这个神作, ai 时代门槛真的碎了。链接在评论区,去给金鱼兄弟点个 star 吧。

企业 ai 本地部署,第一步不是买机器,是先把你的数据洗干净。企业想落地 ai 怕的是什么?不是预算少了,也不是硬件买错了,而是老板的想法跟 ai 真正做的事,他压根就没对上。就前阵子,一个做食品批发的老板找到了我,他姓蔡,做调味品和粮油生意的, 我们就叫他蔡总吧。蔡总刚加我的时候劲头特别足,为什么呢?他觉得自己的需求特别清楚,上来就跟我说,社长,我要搞本地部署, 你帮我配台机器就行。我一听好像需求挺明确的,结果我们前后聊了好几天,他的需求变了三回,最后我们发现他真正需要的东西,跟他一开始说的完全是两码事。那这中间到底发生了什么呢? 一个带着明确需求来的老板,怎么聊到最后才发现更应该做的其实是另一件事。今天社长就还原一下我们当时是怎么跟蔡总一步步聊下来,最后帮他找到真正问题的。 我们刚认识的那天,聊得其实挺干脆的,蔡总说想做 excel 数据分析,每天投喂数据,让 ai 出逻辑,结果出使就几万行,后面每两天还得加几千行。我一听数据量不小,就问他系统有没有 a p i 接口,有的话能自动抓取,他说应该没有。我又问那数据的格式统一吗?他说第三方导出来的应该还行吧。 当时我的脑子里已经在帮他算硬件了,三十二 b 的 推理模型差不多就能胜任选存,四十八 g 左右,给了两套方案让他参考。聊到这,你是不是觉得挺顺利的?一个要搞数据分析的客户需求明确,硬件方案也有了,就等着掏钱了,对吧? 别急。过了不到一天,蔡总又发消息来了,这回他开始讲真正的业务流程了。他说,社长,其实我的客户都是在微信上下单的,客户发来的消息什么写法都有。然后他举了个例子,他们 e r p 系统里面有个商品叫韩国泡菜,但客户发来的消息可能是泡菜,可能是韩泡,有时候干脆就是错别字 单员全靠经验,在系统里模糊的搜索效率不仅低,还老出错。蔡总的想法是,先有人工在微信上收单,然后把这些下单信息扔给 ai, 让 ai 自动把商品名、客户名全部清洗干净,匹配成 e r p 系统里一模一样的标准名字,这样开单员就能直接用了。 你看到这事情就开始变味了,他一开始说的是数据分析,但现在讲的分明是数据清洗,是翻译。他要的不是一个会算账的 ai 大 脑,而是一双能看懂乱七八糟订单的 ai 眼睛。 故事还没完,又过了一天,我们开了个线上会,蔡总在会上又冒出来一个新想法,他说他每天都有销售数据,哪个客户哪天买的,什么数量多少,单价多少, 他想全部喂给 ai, 让 ai 帮他分析。比如哪个客户三十几天没来拿货了,哪个商品平时五天拿一次,这次七天还没动静, ai 要能够主动提醒他去跟进。 说实话,蔡总提的这个想法,我估计在看视频的很多人都会有。现在 ai 的 宣传铺天盖地,很容易让人觉得他就是权能大脑,数据未进去,结论自己就出来了。但我们一听就知道这又是一个坑。我们当时就在会议上跟蔡总说的很明确,蔡总, 这其实不是 ai 的 活,这是数据统计的活。我给大家翻译翻译。翻译这句话是什么意思?大语言模型,它本质上是文字接龙,擅长理解和生成文字,但让他去精确的做加减乘除,算天数,做统计, 相当于逼着张飞去绣花,他天生不擅长做这个。早期大家说 ai 连一加一都算不对,就是这个道理。所以我们在会议上就跟蔡总讲的很清楚了,这件事情 e r p 系统自带的看板功能就能干。您需要的不是让 ai 去算, 而是让 ai 去看、去理解、去翻译。我跟他打了个比方,您要的可能不是一个更聪明的大脑,而是一双更精准的眼睛。把这双眼睛按到您现在的这个流程里,他不用去算什么客户,多少天没拿货, 就专注干一件事,把你微信上收到的那一堆乱七八糟的订单信息看准了,翻译对了,变成 erp 系统里一模一样的标准名字。这步走通了,您手头最头疼的那个问题 基本就解决了。蔡总是个明白人,当场就反应过来,说他有点被各种 ai 的 宣传信息带跑偏了,当务之急还是先把订单清洗这件事做好。他说这些销售分析的事,他回头去研究研究 ai 系统本身有没有这个功能。你看,这就是我们解决问题的第一把火,把不属于 ai 的 火果断砍掉,让 ai 只做他最擅长的事。 这一步帮客户省了多少时间和钱先不说,至少避免了他为了一个错误的不切实际的数据分析需求,去部署一套根本用不上的昂贵硬件。 好了,需求终于理清了,方向也对了,蔡总自己都说我要的就是这个把订单信息洗干净,匹配成 erp 的 名字,那接下来是不是就可以聊硬件出配置单了?到这一步,方向是有了,但通过这个方向的路怎么走,也就是具体的软件技术方案,还得仔细琢磨。为什么呢?因为蔡总在会议上反复强调自己是个技术小白方, 方案一定不能搞的太复杂,他担心部署之后不好上手。同时我们又了解到,他公司商品有数千种,客户也有几千个,这么多名称要做映涉,准确率要求极高,不能搞到后面让 ai 自己瞎猜,一旦匹配错了,那开单员还得人工去改,等于白折腾了。这就要求我们在设计软件方案的时候, 不能光顾着技术多先进、多画上,必须要把应用性和准确性放在第一位来考虑。比如说我们用大模型纯粹的去模糊匹配,靠猜,还是结合一些规则知识库,搞一个印刷表,让它识别的更准。这个底层方案怎么选,直接决定了后面需要多大的显存,多高的算力。所以当蔡总在会议上又提到我之前跟他聊过的那个四十八 g 显存的机器方案时, 我们并没有立刻点头说行或者不行。我们当时是这么跟蔡总说的,蔡总四十八 g 显存可能够,也可能不够,但现在真的不好说,得等我们把具体的技术方案模拟通了,真的跑一遍,看它到底是多少资源,到那个时候才能推出一个最适合您的硬件配置?硬件它不是起点,硬件它是终点,是跟着你最后确定的软件方案走的。 蔡总听完说了一句话,让我印象挺深的,他说社长,我之前去别的地方询价,人家要么直接给我推最贵的配置,要么就一句你要跑多大的模型,然后直接甩个单子过来说能跑。你们是第一个跟我说现在定不了,得先验证软件方案的人,这样他心里反而踏实了,说明我们是真的在替他想事。聊到这,社长想跟大家说, ai 落地硬件是最后一步, 思维的转变才是第一步。很多传统企业想拥抱 ai, 主要的障碍真的不是预算够不够,也不是能不能买到好的显卡,而是脑子里那个模模糊糊的全能型的 ai。 想象我们的价值,不是客户说要什么我们就点头开始做,而是在他没想清楚,甚至想法已经跑偏了的时候, 想帮他踩一脚刹车。而且告诉他,这个活 ai 不 太适合做,但那个活 ai 可以 给你干的很利索,最核心的目的还是为了企业能够真正把 ai 用起来。如果你也有企业部署需求,心里有个用 ai 解决实际问题的想法,但又怕踩坑,欢迎来找社长聊聊。

程序员又又又搞出大动作了!今天是二零二六年五月八日, gig hop 今日涨新,最快的十个项目来了,第一名 gigic two e 单日涨了五千七百九十九个 star, 一 骑绝尘。今天 ai agent 生态大爆发,隐身上网工具也冲上来了,我按新增 star 排好了,直接带你看。 这一波最明显的几条线是 ai 编程与 agent、 ai 研究与推理、金融与后端基础设施,以及效率与安全工具。你不用自己刷榜,我直接讲每个项目是什么,它今天涨了多少 star? 又能帮你解决什么问题? 第一个是 deep seek to e, 在 终端里用 deep seek 写代码的编程助手,今天新增五千七百九十九个 star, 它可以让你直接在终端里用 deep seek 编程,清量高效零配置。第二个是 agent skills ai 编码 agent 技能库,今天新增三千零六十二个 star, 它可以给 ai agent 注入生产级工程技能,让代码更靠谱。 第三个是 financial services entropic 官方金融服务 sdk, 今天新增一千三百四十三个 star, 它可以给你 entropic 官方的金融服务 sdk, 合规的集成 cloud。 第四个是 flash 快 扩散推理加速工具,今天新增六百七十一个 star, 它可以用快扩散技术加速 l l m 推理,让模型响应更快。第五个是 hello agents data will 出品的智能体教程,今天新增六百四十五个 star, 它可以带你从零构建智能体,系统化的教程,让你快速上手。 第六个是 local deep research 本地深度研究工具,今天新增五百五十九个 star, 它可以让你本地运行深度研究,一张三零九零就能跑,数据全加密。第七个是 hope browser 隐身 chromium 浏览器,今天新增四百八十二个 star, 它可以给你隐身浏览器通过所有机器人检测, play right 无缝替代。 第八个是 openreal video 开源浏览器端视频编辑器,今天新增二百三十三个 star, 它可以提供开源的专业视频编辑器,自托管无限制。第九个是 ai trader 全自动 ai 交易系统,今天新增一百八十九个 star, 它可以给你开箱即用的 ai 自动交易系统 agent 架构,轻松部署。 第十个是九 rocker 无限免费 ai 编程网关,今天新增一百四十九个 star, 它可以让你免费统一接入主流 ai 编程工具,一个网关管理所有编码 ai 关注我不是为了看我抱抱,而是我每天帮你晒 tiktok 里真正能解决问题、值得收藏的项目。