马年开市第一天,市场给了个开门红,算是图个好彩头,就是不知道大家账户收成怎么样?那今天呢,想来也给大家聊一聊,在春节假期里边,投资圈讨论热度最高的一个全新的概念 top 看出海。这个 top 看呢,简单来说就是一个 ai 处理信息的最小单位,在 ai 的 世界里边,谁用的 top 看最多,就说明在 ai 竞赛当中排名最靠前。在我们过年期间,海外有一个特别火的模型聚合平台 open loot 发布了一组数据,在平台 top 肯用量前五的模型里边,有四个都是来自于中国公司,分别是 minimax、 kimi、 智普、 ai, 还有大家现在很熟悉的 lipstick, 也就是说目前中国大模型已经是在全世界占据了一个主导地位。而 top 肯的出海呢,本质上就是中国大模型企业里边,通过 api 将境内的电力和算力 直接输送到海外,而海外的用户每一次调用模型的接口,每一次生成文本或者图片代码等等,实际上消耗的是中国数据中心的算力以及电力。那么这种出口的好处就是由于没有实物形态,所以不用受到海关关税的限制,那基本也不会被传统的贸易摩擦围堵。所以 我们就能够看到,现在我们各种加大力度对外卖的算力资源,卖模型,卖接口,而这本质上都是在出口中国的电力, 并且这种出口模式呢,要比以前来的更加高级。以前我们电力过剩,只能依靠钢铁、电节、铝、水泥等等高耗能产业出口消化,但现在不一样了, ai 赋予了每一度电全新的生命,现在电力可以转化为高价值的数据服务,并且这一种需求是可以长期持续的,所以出口效益会远远高于初级产品的出口。更加重要的是在于,在这个出口模式里边,我们现在手里还握着两张王, 一个是极致的性价比,一个就是可持续性的绿色电力。相比较欧美的电网老化、环保压力大等等问题,我们的竞争优势是非常明显的。不过看到优势同时我们也要保持 清醒,目前这一切的优势的底座还是建立在芯片上面的。所以呢,只有未来国产芯片能够真正实现突破,这个优势才能够维持下去。而一旦中国新能够真正实现突破,这个优势才能够维持下去。而一旦中国新能够崛起的话,那将会形成一个非常完美的闭环, 绿片加国产芯片加国产算力,再加本土的模型加 a p i 的 出口,到时候我们所输出的就不单单只是一个 ai 模型了,而是一整套绿色、低碳、高性价比的全球 ai 基础大设施。这个意义不仅仅只是赚外汇这么简单了。本质上呢,是将人员的安全、产业的升级、绿色的转型进行了有机的结合,则做一条可 持续性的增长路径,既消化了绿电产量,也提升了我们在全球数字经济当中的话语权。现在中国的 ai 出海已经是落地见效,但是电力赋能全球的进程才刚刚开始。
粉丝52.4万获赞61.0万

今天拆解一下假期都在热议的 talk 出海产业。 talk 出海是指中国 ai 厂商向国际市场输出大模型推力能力, 其核心是以 talk 为计量单位,实现中国算力和智能化服务的全球交付,属于跨境服务贸易的新模式。 talk 出海产业主要是各家大模型厂商,其中包括了 minimax 设计公司包括鸿博股份、首都在线提供算力服务。 timmy 设计公司包括润泽科技以及亚康股份,间接提供算力服务。 deepseek 设计公司有润泽科技、航钢股份、 清华智普设计公司有网速科技、尤克德、奥菲数据字节豆包设计公司有润泽科技、字节跳动第一、大 a、 i、 d、 c 服务商,东阳光光环新网、阿里千问设计公司有数据港、航钢股份、润建股份、 腾讯元宝设计公司有刻画数据、润泽科技、群星玩具、百度文星设计公司有奥飞数据。数据港。近期的光纤光缆由于受到 ai 驱动导致涨价,其中长飞光纤试战率全球第二, 恒通光电全球第三,中天科技全球第六。最后敲黑板 token。 珠海产业分为大模型厂商光纤光缆两大部分。

中国有一种看不见摸不着的东西,正在疯狂占领全球。 overruler 最新周度数据显示,平台前十模型总 token 量大约八点七万亿,中国模型直接拿下五点三万亿,占比高达百分之六十一。 mini max m 二点五以二点四五万亿 token 空降榜首, kimi k 二点五以一点二一万亿紧随其后,智普 glm 五和 deep six v 三也稳居前列。这是中国大模型第一次在全球开发者市场吃下六成以上的份额。很多人还没反应过来,这背后藏着一个绝大多数人都没看懂的新趋势。 token 出海,才是中国真正意义上的电力出口。先把最关键的概念说清楚,这里的 token 和虚拟货币,你可以把它理解成 ai 的 计件工资。 用一个 token, 就是 让 ai 处理一段文字,跑一段推理,生成一段内容,是完全合法合规的数字服务凭证,也是全球 ai 服务最通用的结算单位。一个美国用户调用国产大模型的 api 数据,从加州出发,穿过太平洋海底光缆,到达国内的数据中心,数据依靠中国的电力完成,计算结果在原路传回去。整个过程里,一度电都没有走出国境线, 但是电力的价值已经通过 token 完成了跨境交付。这就是最颠覆认知的地方,电卖不出国门, token 可以, 电有损耗、有边界,有地源限制, token 没有。 token 的 成本结构里,电力加上算力占比超过百分之七十, 也就是说,每一个 token 的 价值,一大半都是由电和算力支撑的。中国的低电价优势,正在实实在在转化成全球 ai 服务的定价权。欧美地区数据中心电价是国内的三到五倍, 土地人工环评成本极高,算力紧张到排队。而我们拥有西部海量廉价的水电、风电、光伏电,拥有全球最完整的数据中心产业链,服务器、光模块、散热、电力设备全部自给自足。 同样的 ai 服务,我们的成本只有海外的几分之一,价格更低,响应更快,稳定性更强,全球开发者自然会用脚投票,纷纷转向中国模式。这笔隐形的电力出口生意,没有集装箱,没有海运,没有关税摩擦。 wto 规则里,数字服务跨境免征关税, 相当于给我们开了一条绿色通道,一根光纤就是一条跨国电力高速,把国内原本消纳不掉的绿电转化成数字服务卖到全世界,比传统商品出口更轻松,附加值更高,也更安全。那么,在这条看不见的产业链上,到底谁在闷声发大财? 首先是国产大模型厂商 mini max、 kimi、 智浦、 deepsea 这些头部玩家,靠着效果过硬、成本极致的模型在全球市场快速抢占份额, token 掉用量指数级增长,商业化直接落地兑现,从以前的烧钱研发,变成现在的全球赚钱。 其次是算力服务商和数据中心。全球抢 token, 本质就是抢算力,数据中心必须二十四小时满负荷运转, 西部绿电数据中心成了最稀缺的资产,产能供不应求,订单一签就是几年,躺着享受行业红利。在网上就是整条电力设备产业链,这也是最直观、最确定的收益环节。见数据中心跑满算力,都离不开稳定供电,电加器、开关柜、光模块、光纤机柜、冷却设备全线爆单。 国内大量变压器工厂已经处于满产状态,订单排到二零二六年甚至二零二七年,产线三班倒机器不停工,门口货车排队拉货。看似火爆的背后,其实是全球 token 需求一路传导上来的结果。 以前我们总觉得中国电力这么便宜、这么清洁,为什么不能出口装外汇?现实很残酷,电是物理资源,不能存、不能装箱,不能远距离跨境运输,跨国高压线审批难、损耗大、风险高,电天生就走不出国门。 现在,投资者终于彻底想通了,根本不用把店送出去,只需要在国内把店变成算力,再把算力打包成 token, 通过互联网卖到全球,就完成了电力价值的跨境转移。 这不是简单的生意,是国家级的能源变现新路径,是把能源优势转化为贸易优势、科技优势、外汇优势的关键一招。百分之六十一的全球占比只是一个开始。 随着全球 ai 需求持续爆发, ai 应用从互联网向工业、金融、医疗、教育全面渗透, token 的 消耗量会越来越大。中国模型的技术还在不断迭代, 低成本电力加强,大算力加优质模型的组合优势会越来越明显, token 出海的规模只会越来越大,更多的中国电力会通过这种隐形方式,源源不断地卖到全球各地。这不是短期的题材炒作,是实打实的产业改革。 以前我们出口衣服、家电、汽车,靠的是实物制造,赚的是辛苦钱。现在我们出口电力加算力加 token, 靠的是数字服务,赚的是高附加值的能源钱。物理的电有国界,数字的 token, 没有国界 电走不通的路。数字帮他走。电做不到的事,算力帮他做。电赚不到的钱, token 帮他赚。当全球还在关注传统贸易格局的时候,中国已经悄悄打开了一条全新的出口通道。 token 正在吃掉全球市场,电力正在以一种全新的方式走向世界。 这笔无声无息却规模巨大的数字能源生意,正在改写中国出口的结构,也在重塑全球科技与能源的格局。 未来几年,大家会越来越清楚,真正支撑起 ai 算力,支撑起中国新出口优势的,不是概念,不是故事,而是藏在每一个 token 背后,来自中国的一度度稳定而廉价的电力。这就是投资者最终想通的最硬也最长久的产业逻辑。

咱们今天来聊一个特别有意思的话题,一种你看不见也摸不着的出口。他没集装箱,也不走货轮,但他正在用一种我们可能都还没意识到的方式,悄悄改变着全球的经济格局。 来,先给大家看一个数字,绝对会让你大吃一惊。摩根大通有个预测,说到二零三零年,短短五年时间,中国市场的透肯消耗量会增长超过四百倍。你没听错,是四百倍,年复合率高达三百三十倍, 这什么概念?这根本就不是普通的增长,这简直就是一场爆炸呀!好,那问题就来了,这个即将要暴涨四百倍的东西,这个所谓的透肯到底是个啥? 我给你打个比方啊,咱们都听过一句话,叫数据是新时代的石油,对吧?那偷看呢?它就是 ai 世界的硬通货,是驱动整个 ai 世界的钱。 说白了,它就是 ai 世界里的度量衡,你跟 ai 说的每一句话,下的每一个指令,让他写的每一行代码。其实啊,背后都是用偷看来计费和计算的 啊。你想想,四百倍的增长又是个什么概念?这可能就意味着,几年之后,咱们每天跟 ai 互动,让他干活的次数可能会比现在刷微信的次数还要多。这可就不只是个技术问题了,他会彻彻底底改变我们的生活和工作方式。 哎,说到这,你可能就好奇了,这个 token 跟咱们中国的电力能有什么关系?嘿,别急,最有意思的部分来了,咱们来拆解一下这个看不见的出口到底是怎么一回事? 来,咱们来想象一个画面啊,一个在旧金山的程序员,深夜里啪啪啪敲下一行代码,想让 ai 帮他干活,他可能觉得,哦,这请求是发到硅谷那个福气上了吧。 但实际上呢,这些数据啊,嗖的一下,穿过太平洋海底的光缆,直接就跑到了咱们中国,比如贵州的大山里或者廊坊的数据中心,然后成千上万的 gpu 瞬间被点亮,开始疯狂计算,用的可全都是咱们中国的电, 算完之后,结果在原路返回,啪出现在那个程序员的屏幕上。你看啊,整个过程,电没出去, server 也没搬家,但真正出口的就是这个叫 token 的 东西。 所以你看华泰证券有个说法,我觉得特别到位,说 token 是 最纯粹的电力衍生品。为什么这么说呢?你想啊, 一个 token 的 成本里头,超过百分之七十都是电费和硬件,这就厉害了,对吧?这就意味着,咱们中国现在正在用咱们一直以来的一个巨大优势,便宜的电去撬动一个未来最值钱的东西,全球 ai 服务的定价权, 这就把我们带到了一个全新的战场。如果说 ai 竞赛的上半场,大家比的是谁的芯片牛,那下半场我跟你讲,比的就是能源,比的是谁家的电更便宜更足。咱们来看看中美现在的情况,这个对比就非常有意思了, 美国那边技术是强,但现在碰到个大麻烦,缺电,电网老旧,想建个新电厂,那个审批流程能拖死人,搞的那些科技巨头都急了,琢磨着自己建核电厂了。 你再看咱们中国这边,情况就不一样了,咱们有全世界最大的清洁能源电网,有成熟的特高压技术,能把戈壁滩上那一望无际的光伏板 这么一对比,能源成本上的差距一下就成了这场比赛里最重要的升幅首。而且啊,这种能源上的差别已经不是纸上谈兵了,它已经实实在在的开始影响全球的云计算市场了。 你听听这个消息,谷歌允前段时间突然宣布,在北美一些数据传输服务的价格直接翻倍,涨了一百趴, 亚马逊的 a w s 也跟着涨了百分之十五。哎,你可别小看这个涨价,要知道,在过去快二十年里,云计算这个行业的主题永远只有一个字,降! 大家都在疯狂打价格战,现在突然掉头涨价,这说明什么?说明风向彻底变了。全球的算力已经从一个谁都能来挑挑拣拣的买方式场 当算力成了稀缺品,那谁的成本低,谁手里有货,谁就说了算,谁就有定价权。好,那咱们把刚才说的这些点全都串起来,看看这背后到底是一盘怎样的大棋,一场多大的改革正在发生。 这里有一个核心概念叫工业电力的金融化。听着有点绕,其实很简单,你想想,过去咱们是怎么用电的呢?我们把电变成电视机、冰箱、衣服这些看得见摸得着的东西,然后出好到全世界。 但现在呢,我们把店变成了看不见的算力,变成了 token, 再卖给全世界,这本质上是一次价值链的巨大升级啊。那这对我们来说意味着什么呢?我觉得至少有三点。 第一,定价权。咱们从以前那个只能给别人代工被动接受价格的角色,变成了现在可以参与制定核心服务价格的玩家。 第二,我们得重先看看咱们的家底了,那些电网啊,数据中心啊,以前觉得就是些基建,现在呢,它们就是 ai 时代的新油田。第三,未来可能会有一种新的通货膨胀, 以前咱们老盯着猪肉价格、石油价格,以后啊,说不定大家都要开始关心偷啃通涨了,因为全球的钱都要来抢这点算力。 所以你看这场用电驱动的算力出海,他虽然看起来静悄悄的,但背后是一场非常深刻的产业变化。 好,那最后也留给大家一个问题,咱们一起思考一下,你觉得咱们中国在电力和能源上的这个优势到底能保持多久?在未来的这场全球算力竞赛里,他会是我们真正的沪深核吗?欢迎把你的想法打在评论。

啊,今天咱们来聊一聊国产的 token 啊,这个被称为中国真正的电力出口背后的一些故事啊,咱们来一起解密一下,这个 token 到底是个什么东西?为什么它会成为电力出口的一种新的形态? 然后中国的 token 在 全球到底是一个什么样的市场地位,以及 token 到底给我们的经济带来了哪些机遇和挑战?好的,那我们就开始今天的讨论吧,咱们第一个板块,先来聊一了解密 token 啊,这个电力出口新形态的核心密码。 ok, 首先第一个问题, token 到底是个什么东西?它在 ai 领域到底意味着什么?那 token 其实它就是一个信息的主体, ok, 就是 它是一个最小的单位, ai 能够去处理和理解的, 那它可以是一个字母,也可以是一个单词,也可以是一个中文的字,甚至有的时候是一个符号, 它是根据不同的编码方式会有不同的。哦,原来它比我们想象的还要细致啊,没错没错,然后呢,因为它是这样的一个基本的单位,所以 ai 的 整个运行其实都是靠它,所以现在大家也会用 token 来作为一个衡量算力的一个消耗计费的一个标准, 甚至大家会说这个是 ai 领域的一个新的通货。你说这个 token 这个新的出口的方式和我们传统的电力出口到底差别在哪呢?就是传统的电力出口,你要靠这个高压线路啊,或者是说这个电池运输啊,那这个过程当中呢,会有很多的能量的损耗, 而且你还要去协调各个国家的这个电网,那这个成本也很高,效率很低,听起来又慢又复杂, 对,没错,那这个 token 呢?它就完全是另外一个路数了,它是通过这个数据中心和这个海底光缆把这个计算任务发到全球, 然后呢它就是几乎是没有什么损耗的,也没有什么海关啊,什么关税啊这些,所以它是一个更高效、更灵活的一个出口的方式。中国这个 token 出口到底是凭什么能 这么厉害,在全球能够占据这么强的竞争力?就是中国的这个 token, 它的这个出口,其实它是把这个本地的这个便宜的电力和这个非常庞大的算力,通过这个非常高效的这种封装啊,直接就变成了这种 ai 服务, 然后卖到全球。那因为他的这个电力和算力的成本就占了大头嘛,那这个时候呢,就可以把这个价格压的很低很低哦,等于说用这种方式就把我们的资源优势就直接变成了市场优势。没错没错,那中国厂商就是靠这个低电价和这个 大规模的这个数据中心就做到了这一点啊,就是把这个 token 的 成本压到了全球最低。然后同时呢这个整个的这个出口的流程也非常的灵活,就是你这个 传统的这个壁垒对他来说几乎是没有什么作用的,所以他现在就是已经抢占了这个全球六成以上的这个市场份额, 而且这个还在不断的增长。我们接下来就进入到这个实力见证这一部分啊,就是来聊一聊这个中国的 token 在 全球到底是一个什么样的地位。然后呃,二零二六年这个中国的 token 在 全球到底有多强?最新的数据是非常震撼的,就是中国的模型在这个全球最大的这个 多模型的调用平台上面,一周的 token 的 处理量就高达五点三万亿,就是全球每消费一 token 有 六成都是中国的服务,哇,这个这个占比真的是高的惊人啊。更有意思的是,这个平台的 top five 有 四个都是中国的模型, 然后第一名就是一个中国的模型,他一周就干了二点四五万亿的 token, 超过了所有的欧美厂商的总和。 另外呢,就是这个全球的这个开源社区的下载量,中国的模型也首次超过了美国,就是彻底的拿下了这个 开发者的生态,所以就中国的 token 已经是全球市场的绝对主力,就是说中国的 token 为什么能够在全球市场有这么强的定价权?首先就是中国的这个数据中心,他用的电特别便宜,就我们的工业电价是欧美的三分之一。 然后呢,很多数据中心都是建在这个风力和太阳能资源特别丰富的地方,比如说我们的上海的这个 临港的这个海底数据中心,它的绿电的使用比例超过了百分之九十五,怪不得成本能压那么低,没错没错。然后再加上就是中国的这个 vi 公司在这个硬件的调度和这个模型的优化上面做的也特别好,就我们的这个推理的成本,每百万头肯只要零点一四美元, 就是欧美同类的服务的几分之一,甚至十几分之一。再加上我们的这个工程师的这个高效的团队,还有就是这个 api 出口的这个零关税, 所以就是这一系列的优势,就导致了中国的这个 token 成为了全球的这个 ai 市场的一个定价的风向标。就是说中国的这个 token 的 出口,它的这个模式到底有哪些独特的地方?然后带来了哪些深远的影响?首先就是我们的这个 token, 它是通过 api 的 形式 就可以瞬间送达全球,那这个就完全没有了传统的这种物流啊和关税的这种障碍,所以它是一种数字的服务的出口,然后它又因为这个 wto 的 这个免税的规则,它是可以非常自由的流通的,这个确实就比传统的这种出口要高效太多了,没错没错。然后我们的这个 token, 它又把电力、算力和这个 ai 的 这种专业的能力都打包成了一种标准化的这种数字的商品, 所以它是让全球的这些开发者都可以像用水用电一样的去灵活的调用中国的这种 ai 服务,所以这个就是一个全新的一个出口的范式,也大大加速了中国的这个在全球的数字经济的这种影响力。咱们来聊第三部分啊,就是这个机遇与挑 战,就是 token 其实它是一个包装纸,它把中国的这个便宜的电力和强大的算力 包装成了一个可以在全球流通的数字商品,那现在通过这个海底光缆就可以把这个 token 发往世界各地,那 这就彻底解决了这个电力难以长距离输送的这个难题,那现在中国就变成了一个全球的这种智能服务的一个动力引擎。哦,那这确实是一个全新的一个出口的赛道,没错没错,而且 token 他 不光是在技术层面,他其实还带动了 整个能源的这个基础设施的数据化。你看我们现在有很多这种绿电的项目,他就是通过这种区块链和 token 化,把他的这个资产变得更透明,更可以在全球流转。然后同时呢就是国内的这些数据中心, 也因为这个全球的需求暴增,所以他们也加速了这个硬件的升级和这个自主创新, 整个这个算力的产业链也会被推上一个新的高度。哎,那现在就是说国内的这个脱坑经济现在目前遇到的最棘手的难题有哪些?首先第一个就是这个技术迭代太快了,对,就这个芯片啊,包括这个算力的架构,它更新换代太快了, 所以我们现在有一些核心的高端的芯片还是需要依赖进口的,那一旦国际局势一紧张,这个东西确实一时半会很难突破。 然后除了这个技术的壁垒之外呢,其实这个 token 他 在跨境的时候也会面临很多数据合规的问题。那这个时候呢,就不光是各国的监管政策你要去满足,包括你的这个安全也是一个非常大的隐患。 再加上这个行业发展太快了,所以导致这个店价的波动啊,包括这个市场的竞争啊,也让这个整个行业的利润变得非常的不稳定。 你想要去做大规模的话,你还要解决这个基础设施的投资,以及不同领域之间的协调的问题,你觉得未来中国的 token 会在哪些方向上会有新的突破,或者说会有新的改革? 呃,我觉得可能就是未来中国的 token 会在高效节能的芯片,然后以及这个大规模的绿色的制算中心,还有就是完善的数据的监管和资产的流转的规则,这几个方面会持续的发力 来巩固我们这个全球的领先的地位。这些决策感觉都是在为这个数字经济打一个更牢的地基,没错没错,就是政策和技术的创新,会不断的去推动这个 token 跟实体经济的深度的结合。然后同时呢我们也会去积极的参与到全球的数字的规则的制定, 让中国的这个 token 成为全球数字经济的一个关键的枢纽,对,也会去带动我们的产业升级和国际影响力的提升。聊到这,其实我们可以看出来就是 token 它不仅仅是一个新的风口,它更像是一个连接中国的能源优势和数字经济未来的一座桥梁, 他能不能够引领我们腾飞,关键还是要看技术创新和这个规则的完善能不能够齐头并进。今天的分享就到这里了,然后感谢大家的收听,咱们下期节目,再见!拜拜!

说工业时代最好的生意是做水电没收租的生意,而 ai 时代最好的生意呢,就是 tok 出口。 很多不理解 ai 的 tok 是 什么意思,其实呢,你可以简单理解成就是 ai 时代的流量计费单位,相当于互联网时代的买流量的意思是一样的。而在这方面呢,其实我们已经是遥遥领先了,你看嘛, mini max 的 tok 使用量呢,是全球排名第一 前呢,我们往全世界出口什么鞋子啊,帽子啊,服装这些,现在呢,我们换了一种形式,向全世界出口我们的电力芯片,包括 ai 工程师的劳动,这个生意才是决绝子。上个视频跟大家说了,在 ai 时代呢,我们更加要关注中游还有下游。 其实这个领域呢,我们已经是遥遥领先了,我们缺 g b t 啊, jimmy 啊,全部不够 mini s 打。而且更重要的是,这么优质的公司呢,它居然在港股上市,而且短短一个来月呢,翻了五倍,期待未来有更优质的 ai 公司在港股上市。

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。

你敲下回车,人家那边两千个字已经拍你脸上了,这事你敢信?就在二零二六年二月,农历大年初六年还没过完,一家加拿大只有二十四个人的小公司叫 talas, 突然扔出一枚深水炸弹, 他们搞出一款芯片,推理速度直接干到了每秒一万七千个 token。 什么概念?现在市面上最火的英伟达 b, 两百每秒也就三百五十个 token, 也就说这枚小芯片的速度是英伟达最新款 gpu 的 将近五十倍。成本呢,直接砍到二十分之一, 工号降到十分之一。最狠的是,这帮人为了追求这个速度,干了一件反常识的事,他们把 ai 大 模型直接用物理的方式焊死在了芯片里。你没听错,是焊死。 就像把一首歌直接刻在黑胶唱片上,这张唱片这辈子就只能放这一首歌。这到底是一次改朝换代的宣战,还是一场注定沦为电子垃圾的豪赌?英伟达的芯片神话,是不是要被这二十四个人撕开一道口子了?今天就用一条视频把这个事给你讲清楚。 咱们先聊聊英伟达这些年是怎么封神的。其实过去三十年,不管是 cpu 还是 gpu, 硅谷那帮巨头就一个信仰,造一个通用的计算平台。什么叫通用?就是我这个芯片得是个万能舞台,你不管是跳芭蕾还是唱摇滚, 不管什么软件什么模型上来都能演。英伟达最牛的地方就是它造了 gpu, 这个舞台还搭了个叫库达的生态架子, 任何模型甭管是 chat、 gpt 还是 lma, 上来就能跑。所以过去十年,大家心甘情愿掏空钱包买英伟达的卡,图的就是这个万能,这个省心。但是这个万能舞台有个要命的硬伤,叫内存墙。我给你打个比方, 你是个大厨,你的灶台是计算单元,你的食材仓库是显存,每次炒菜,你都得从仓库把食材搬到灶台上。 以前炒个小炒搬一趟就行,但现在模型大到几千亿,参数等于你要办一桌满汉全席,得来回搬几百趟食材,这搬来搬去的功夫和力气,早就超过炒菜本身了。整个行业包括英伟达,为了保住这个万能舞台,只能拼命把仓库盖大, 把搬运工练壮,但永远解决不了来回折腾的这个过程本身。这时候那二十四个加拿大人站出来了,说,你们累不累啊?既然这个舞台天天只演罗密欧与朱丽叶,咱还天天搬布景干嘛?直接用水泥把布景气死在台上不就完了吗? pass 的 思路就是这么简单粗暴。他们做的芯片叫 hce, 出厂的时候就把 mate 的 lama 三点一八 b 这个模型,每一个参数每一个权重直接对应到了芯片上特定的晶体管。你问他问题,压根不需要去内存里加载数据,电流一通过,答案啪的一下就出来了, 这就是速度暴增五十倍的秘密。那问题来了,把魔性焊死,到底是神操作还是骚操作?网上已经吵翻了天,正方说这是未来,你看他那个速度, 那不是回复,是直接未卜先知把答案砸你脸上。有人甚至说,这种速度根本就不是给人准备的,是给以后无数个 ai 智能体互相聊天用的。那个世界不需要等待,这就是把灵活性换成了极致速度。 就像你听歌是愿意听现场交响乐团,还是愿意听灌好的黑胶唱片,黑胶唱片音质完美,而且想听就听,不需要等乐团就位。但反方的话更难听,他们说你这是引阵止渴,是制造高级电子垃圾。 为啥?大模型现在十八个月就迭代一次,今年是拉玛三,明年拉玛四出来,你这块号称速度第一的芯片瞬间就变成一块废铁, 为了追求那点速度,把升级的路全堵死了,这不是自己把自己玩死了?这种分裂本身就说明行业共识已经被打破了,以前大家都信通用,现在有人开始走专用这条道了,而且走的这么极端, 那这场路线大决裂之后, ai 世界会变成什么样?咱们普通人能得到啥?或者会失去啥?我个人觉得未来的 ai 硬件会走向一个两级分化的世界。一边是云端,那些通用神灵就是少数,像英伟达这样的巨头,供养着几千亿参数的通用大模型, 他们负责思考,负责创造,负责给你写诗画画。他们像发电厂的高压电,庞大昂贵但无所不能。 另一边就是像它拉斯这种被死死刻进龟片里的电子牛马,他们会以百亿计的数量钻进你的手机,你的汽车,你家的扫地机器人,工厂的流水线上。他们不懂什么是诗和远方,他们生下来就只会干一件事,比如语音唤醒或者人脸识别。 但干这件事他们是光速,而且成本低到可以忽略不计。网上有个评论特别扎心,他说其实大部分人类一辈子也就说一种语言,做着一份固定的职业,这和大脑里刻死了一个模型有什么区别?想想还真是,我们在绝大多数场景下,根本不需要一个全知全能的神。 你家里的扫地机,它只需要认路避障,你管它是 gpt 六还是 cloud 五呢?这时候,一个永远不需要换代的钉子一样的专用芯片就是最好的答案。所以你看扎克伯格,如果看到这个芯片,他眼睛得发光。他手里有拉玛模型, 如果他能用这种技术把拉玛固化到每一台设备里,他就能彻底摆脱对英伟达的依赖,实现硬件及模型的终极梦想。这对麦塔是天大的好事,但对那些靠卖通用算力的云厂商来说,就是噩梦。 这场决战让我想起了当年的 intel 和 a r m。 pc 时代, intel 的 x 八十六芯片一统天下,啥电脑都用它, 这是通用。到了移动时代, a r m 走了一条完全不同的路,它允许每个手机厂商定制自己的芯片, 功耗低,专门为手机服务,这是专用。结果呢?两者共存至今,今天的 ai 芯片可能就站在这样一个历史岔路口。所以回到咱们开头的问题, 一个二十四人的小团队掏出一万七千 tokens 每秒的芯片,这不是一次简单的技术突破,这是用一种全新的物种对旧世界发出的挑战书。它不是要取代英伟达,它是要告诉你,未来的世界不需要一个神,而是需要无数个各司其职的牛马。 你觉得人类的科技树应该往哪个方向点?是继续追求那个全知全能的通用神,还是拥抱这些光速干活的电子牛马?欢迎在评论区谈谈你的观点。

炸裂! ai 算力加偷天史诗级爆发,全链涨价加需求暴增,主升浪已开启,摩根大通重磅预判,二零二五到二零三零,中国偷天年复合增速百分之三百,三十五年狂增四百倍, ai 需求彻底炸穿天花板。点赞、收藏、关注、解锁相关核心概念,一、御能控股 二、华盛天城三、润泽科技 四、东阳光五、大卫科技 六、利通电子七、川润股份八、首都在线。

二十四个疯子三千万美金打造出了一款恐怖的怪兽级 ai 硬件。近日,塔拉斯公司发布了旗下最新的 hce ai 芯片,该芯片可以极高的效率运行 lama 三点一的八 b 模型,运行速度达到了恐怖的每秒一万七千个 token。 你 没有听错, 对比其他硬件产品,它的运行速度提高了十倍以上,制造成本降低了二十倍,而能耗也仅为十分之一。 从图中可以看到, nvida 的 最先进的 h 二百和 b 二百在它面前简直就像上个世纪的产品。塔拉斯芯片之所以能实现这么恐怖的运算效率,是因为它是一款完全定制化的硬件产品。它 把 ai 模型用硬连线连接到了专用芯片,模型指令和硬件电路设计是完全一一对应的。你可以理解为芯片把大模型的功能一比一映射到了专用硬件电路里。 虽然这样做避免了传统硬件带来的数据延迟和性能损失,但代价是塔拉斯芯片不具备通用性,它只能对应单个模型, 如需运行新的模型,则需要重新设计整个芯片电路。而且由于容量限制,目前塔拉斯芯片还只能运行三比特或是六比特的量化模型版本。塔拉斯的产品设计可以说是颠覆传统 ai 推理逻辑的革命性创新,但是否有客户真的愿意为自己的模型去购买专用芯片来提升产品竞争力,这仍需市场验证。 目前,塔拉斯正在筹备第二款芯片 h c r, 预计在年底前可以实现硬件部署。如果你对这款神奇的芯片感兴趣,可以访问 demo 地址来实际体验它在真正意义上做到了毫秒级回复。网址在评论区,欢迎各位实测并给出您的反馈。

大家都知道,现在搞 ai 服务器和算力的全都在盯着英伟达的卡,不管是 h 两百还是 b 三百,算力确实猛,但价格也是真的贵,而且功耗和散热让人头皮发麻。今天给大家聊个实在的,一家叫特拉斯的加拿大初创公司,搞出了一张思路完全不一样的芯片,直接把大模型的推理速度干到了每秒一万七千个头啃。 这是什么概念?基本上一眨眼的功夫,几万字就出来了,延迟低到不到一毫秒,他们是怎么做到的?目前普遍在使用的 gpu, 本质上都属于通用计算芯片, 跑大模型的时候,计算单元得去显存里把参数权重翻过来,算完了再把数据塞回去。这就好比干活的工人不停的去仓库拿物料,大部分的时间和电力全浪费在了跑腿上。行业里管这个叫内存强, 现在数据中心里那些几千瓦的机柜,百分之八九十的电都耗在了搬运数据上,最后全变成了费热 tales 的 思路,简单粗暴,干脆不要这个搬运过程了。他们最新搞出的这块 hce 芯片,直接把一个八十亿参数的拉玛三点一模型物理固化成了硅片上的真实电路。 模型本身就是芯片数据通电进去,顺着排好的晶体管走线流过去,数学计算就自然完成了,软件直接变成了物理硬件。这么干的结果就是极其省电,因为省掉了显存来回读写的步骤,这张卡跑满状态下的功耗只有大概二百五十瓦, 这也就是一台普通家用电脑的水平,随便拿个普通的风扇吹吹就行,根本不需要上什么昂贵的夜冷服务器机柜。听到这,懂行的朋友肯定要问了, 大模型叠带这么快把拉玛三点一直接刻死在物理电路上?明天要是出了新模型,或者我想自己微调一下,这卡不就直接变成了电子垃圾吗? tels 的 团队也考虑到这一点,所以他们搞的是一套混合架构。大模型里面,最底层、最庞大、最不需要变的基础权重,确实被永久刻死在了底层的硬件线路里。 但在这些固定线路上面,他们留了一层可以擦写的高速缓存,也就是 sram。 这层空间虽然不大,但刚好够干两件事, 一是用来存放聊天时候的上下文记忆,二是用来跑微调的 loo 模块。也就是说,硬件底座提供了基础的大模型能力,但你可以随时在上面换不同的微调插线。哪怕退一步脚,就算开源模型真的大换代了,他们重新造新卡的速度也很快,因为芯片底层那海量的晶体管,全都是标准化批量生产的。 出了新模型,把芯片最顶层的两层金属走线重新定制一下就行。从拿到新模型到新芯片出厂,只需要两个月,完全跟得上软件更新的节奏。不过现在的问题是,真正厉害的前沿模型都是几千亿上万亿参数的, 受限于光刻机的物理极限,不可能把几千亿参数全部刻在一张龟片上。对付这种超大模型, taylor 的 方案也非常接地气,他们把模型做水平切分,例如一个有一百层的 transformer, 把前五层放在第一张卡上,第一张卡算完后,只传递一个很小的状态包给第二张卡,第二张卡接着算下去。 这个流水线式的做法对贷款的要求相对较低,普通的 pci 通道就够用,也就是说不需要昂贵的高贷款。互联不用专门的超级服务器机架, 普通机箱里插上几张这种低成本的卡,就能以更低的成本运行一个万亿参数级别的系统。总结一下,把模型直接做成硬件的方案,并不会完全取代 gpu 厂商在训练环节的地位,因为你要从头训练一个大模型,还是得老老实实的买 gpu, 这没得选。 但是在模型训练好之后的推理阶段,也就是真正拿给大规模用户去调用的时候, tels 的 这种方案的成本优势是碾压级的,据说在这种架构下,跑一百万个 tik 的 成本连一美分都不到。 如果未来推理算力真的能变得像自来水一样便宜,那整个 ai 应用的商业模式和落地玩法可能就要彻底变天了。你怎么看这款芯片评论区,聊聊你的看法。

聊聊我感觉最震撼的 top 出海,很多人没有意识到啊,中国最便宜的出口商品不是衣服,光伏板或者电节铝,而是一种大多数人还没有意识到的东西。他不需要集装箱,不走海关, 通过海底光缆呢,就能完成交付。它叫 tokun, 一个美国用户呢,调用 deepsea 的 api, 数据呢,从加州出发,经过太平洋海底光缆,到达中国的数据中心。 gpu 消耗的电力完成推力,结果再传回去。 整个过程中呢,电力从未离开中国的电网。但电力的价值呢,通过托肯完成了跨境支付,没有输电线路的损耗,没有电池自放电,没有地缘政治谈判,光缆传输的信号呢,损耗相比电网,输电呢,可以忽略不计。 电力终于找到了它的出口形态,不是交安,而是托肯。新的趋势呢,意味着天花板呢,为之打开。

如果问二零二六年最具潜力的中国制造是什么?很多人会想到新能源汽车、光伏电池。但在另一条看不见的通道里,一种新的出口品正在形成规模。 这种出口品叫 token, 它不像汽车装进集装箱出海,而是通过光缆和数据中心,以 api app 的 形式进入全球的系统里。你可以把它理解为一种数字劳务,不是派工程师出海,而是输出可按需调用的算力与智能。 token 本质上是被封装的算力由三层构成。能源硬件算法第一,能源优势。西部巨大的风电、水电与光伏,让单位算力的能源成本占据绝对优势。 第二,极高的利用率。算力是重资产,国内采用全球轮转调度,让设备接近满负荷运转,摊薄了折旧成本。 第三,工程优化,简单任务少耗资源,复杂任务才火力全开,进一步压缩了单位 token 的 能耗。二零二六年, token 已经像电力一样,成为隐形的基础设施。它们不占集装箱,不交关税,却无处不在。 过去我们用衬衫换飞机,今天我们用 token 换回美元数据和影响力。只要世界的尽头还需要计算,中国的 token 就 永远有买家。因为在这个数字时代,廉价的算力就是绝对的权力。

烧了十几万美金,几十亿投客,会拿到怎样的认知?这两天 croissant、 open air、 ansorobeek 都放出来一些文章,大概就是讲让 ai 长时间运行两个多星期,人类少量参与,能否开发出一个可用的软件。看完这些文章,我大概拿到了四点认知。 一、在公司里边只做协调、沟通交流的管理角色大概率会消失不拍。有一篇文章讲,在一个工程师把需求发给 ai 之后, ai 会在第一时间把公司所有相关的聊天记录和文档全部总结在一起。整个过程当中工程师只需要阅读和确认, 所以说能很明显感觉到未来一个强大的团队根本不需要那么多协调和管理的角色, ai 基本上能够把方方面面所需要的信息都给你拉齐,所以公司只需要十倍工程师和 ai 协助就好了。第二点认知, 懂审美,同时懂 agent 交互的设计师是非常稀缺的一个 ai 软件,能让人觉得使用起来很美很舒服,同时能够和其他的 ai 软件非常轻易的可以沟通协助,这样的 ai 软件才牛逼,能够设计出这样 ai 软件的设计师,绝对是稀缺人物。 三、公司的组织形式会发生深刻的改变,并且现在已经在改变了,公司只需要专注自己的赚钱业务,其他的业务都可以外包给 agent, 只需要留一部分工程师检查这些 a 证的结果以及提出改正意见就好了。最后的一点认知, ai 还是太贵了,电贵、 gpu 贵、降价,这个过程可能会持续五到十年,在这个过程当中也会涌现出很多机会。四点认知,以上。