哎,养这个 open color 和 hermes 的 新手小伙伴都看过来,你看现在国内的大厂订阅包都在涨价,对不对?你看这个企鹅的九十九块一个亿的托肯, 这个是云百链的新套餐幺九八,这个算下来应该是两亿多的托肯, 对吧?然后里面的模型还给你缩水了,你像企鹅的这里面只有一个五点一能打的,现在的国内的大厂的价格是真的不划算,对吧?然后你像这个 cloud office 四点六一千万的 top 才两块五吧,应该是两块五左右啊, office, 四点七一千万的托盘才三块多,对吧?然后你看这个五点四,一千万的托盘才两块多,这不比大厂的那些订阅包舒服啊,对不对?你看那个大厂的订阅包, 对吧?一千万的托肯要十块,而且只有这一个五点一能打的,剩下的都什么鬼,新新模型都不给你用。然后这个云摆链的也是 这个云摆链的里面就只有一个千万三点六 plus 稍微能打一点,其他也不太行,感觉现在大厂的吃相有点难看。
粉丝1833获赞1.3万

toker 出海怎么出?四种模式,你会如何选择?一、传统模式,你通过电话邮件或者是聊天工具告诉海外的云服务商,你有一个定量的 toker 包,比如一千亿的千万 g l m 或者 cds 的 toker, 然后让海外的小伙伴线下去销售。但这个沟通商务时差,老外的效率、邮件方式和收付款都很低效,在做这件事情的时候未必划算,只适合大客户和大订单才能这么做。 二、聚合分发模式,把你的 token api 接入到大的聚合分发平台,它们根据稳定性和价格进行调用,低价就多调用一些,高价就少调用一些。 c 端统一一个 api 可接入的平台, 我们其实已经做好这些平台的接入要求,但在缓慢的排队中,接入的效率以及商务其实不太开放。 三、打包借通道的模式,这个需要你的 token 包很大很稳定,这几个小的 token 工厂的包 打包在一起,通过大厂和运营商进行一个合规的备案,出海到海外的大 b 端或者 c 端。四、 toc 模式,哪怕你只有几十亿的 token 价值在数千,你可以通过电商或者社交媒体进行少量的 toc 转售。 总结一下,托肯出海和磁源经济是一个三月份才开始进入大众视野的事情,还很早期受制于 openroot 的 不 open。 我 们团队决定做一个中国版的 openroot 是 有很多挑战,但我认为磁源经济和托肯需要一个更开放的生态和宅体。月十一号的广州线下沙龙,我们将发布这个中国版的 openroot。

想要使用大龙虾 openclaw 啊,也就是 cloud boot, 但又担心消耗的 topic 太多,花费太多钱,同时呢也担心一些安全性的问题。那么接下来这个视频教你使用 openclaw 连接本地的大模型,这样咱们就可以免费无忧地去使用你的 ai 助手了。好,那么接下来它怎么用啊?一个视频给你讲清楚 它这个实现呢,其实比较简单啊,总共分为三步。第一步呢,首先咱们先去安装一个本地大模型平台,然后安装完成之后呢,在本地大平台里面去安装 你想装的大模型,然后装完大模型之后呢,第三步,使用特殊的命令来启动 open cloud 就 可以了,只有三步,非常简单。好,那么接下来呢,我就带大家一步一步的实操一下。咱们首先先给本地的电脑去安装本地大模型平台欧拉玛,也就是这只可爱的羊驼啊, 为什么我本地的大模型需要去安装欧拉玛呀?欧拉玛就相当于一个平台,比如说啊,我需要在网上买东西,那这时候我先要去下载一个某宝 某多多,类似于这种电商平台,那么这些电商平台呢,其实就和欧拉玛是一样的,然后在欧拉玛里面有各种各样的 model 啊,各种各样的本地模型,我们是可以安装的,这时候呢,我们点击 model 啊,就可以看到像最近比较火的 k 二点五智普的模型啊,这些模型都是有的, 那我们可以去选择相应的模型安装到本地。好,那么首先呢,咱们点击 download 啊,然后下载一个文件,根据不同的电脑下载相应的文件,然后下载完文件呢,他长得就是这样啊,咱们双击一路下一步就行了。然后安装完成之后呢,他会打开这样的一个界面, 然后在这个界面里面,你可以在右下角去选择相应的模型进行下载啊。这块呢就给大家去说一下啊,模型的参数越小,那么他占用的空间 也就越小,对于你电脑配置的要求也就更低,但是他回答的质量可能相对来说就不会很好,所以大家要根据自己的情况来选择合适的模型进行使用就可以了啊。但是他其实还有比四 b 模型更小的,有个零点五 b 的 模型,那么这块呢,你是搜索不到的,但是咱们在他的 平台网页上是可以去找到的,然后咱们可以使用这个命令去安装,也是可以的啊,那我这时候去复制这个命令好,然后去打开咱们的命令窗口, 然后使用 olama raw 啊,然后这个时候呢就加上咱们的这个更小的模型,零点六 b 的 啊,然后把 value 值进行一个替换好撬回射,这时候它就会去下载咱们指定的模型,并且进行安装,等它的安装完成之后呢,咱们本地的模型就有了,好, ok, 那 么等待一段时间之后呢,等它出现这个 su success 啊,安装成功就说明它已经安装完了,这时候咱们可以去问它,你是什么大模型 好?敲回球, ok, 那 这时候他就会去思考,思考完了之后呢去回复啊,我是,呃,谁是什么什么大模型啊?我拥有什么什么样的能力,对吧?好,那到这儿咱们已经安装好了,安装好了之后呢,接下来咱们就可以使用 open claw 大 龙虾了啊,那么怎么使用啊?这个时候非常简单,我们只需要使用 oalanama launch open claw 这个命令就行了。啊,那我复制这个命令,打开一个窗口,它的意思是啥呀?就是使用 oalanama 来启动 openclaw 啊,你启动的时候,那自然而然它就帮咱们会进行部署的啊,你,你不需要使用 openclaw 改头位来启动了,你就使用欧拉玛 launch openclaw 启动就行了。好,咱们来启动啊。 好,然后启动的时候呢,它让你去选择本地的模型,那我本地的模型呢?撞的就是某问三啊,这时候咱们敲回车,敲完回车之后呢,那么是否继续啊?这时候要按 table 键呢?所以咱们按 table 键啊,选中,然后再回车,这时候它让你选择是否去保存一个存储的路径啊,那我们选择 继续啊 y 就 行了。好,选择完成之后呢,这时候大家可以看到了,他就开始去打开 opencloud 的 这个服务,并且给它设置本地的某问三的模型了。 好,那么这时候选择完成之后,咱们稍等片刻之后,咱们就可以使用 web ui 的 这种方式来访问了。好,这时候咱们来试一下啊,在 web ui 里面, ok, 这个界面啊,可以看到他目前是在线的,那我这时候问他,你是 你是什么大模型,然后点击 send 发送。好啊,这时候, ok, 他 说了我是大模型。这时候呢,虽然他没有告诉咱们他是什么大模型啊,但我这时候可以继续问他,你是本地大模型吗?好,然后点击发送。 ok, 他 说了我是本地大模型,对吧?啊?他没有告诉你这个名称啊,然后,但是呢,我后面问他是不是本地大模型的时候,他就说他是本地大模型了。 那么咱们其实从日制里面也能够看得出来,它的这个模型以及像 agent 的 调用都使用的是本地欧拉玛千问的这个模型啊,这个时候如果你把欧拉玛的这个服务你给它关掉啊,你给它服务给它停掉,停掉之后这个时候你再和它对话,问它在吗? 这块是没有任何信息的,这块就说明你的模型是有问题的。那这也从侧面上去证明了咱们现在调的就是啥本地的这个大模型。 那么使用本地大模型有什么优点和缺点呢?它的优点就是我在本地调用的,所以我不需要花费任何的费用,消耗再多的 talking 我 也不怕。然后其次呢,是使用本地的大模型的隐私性相对来说是比较好的,因为我用的都是本地的嘛。但是它的缺点是本地大模型回答的质量,它可能比商用大模型 执行任务的能力要差一些,回答的质量要低一些。另外呢,本地大模型它对于电脑的配置是有一定的要求的,所以呢,大家就根据自己的需求来选择,到底是要调用线上的大模型还是本地的大模型。我是磊哥,每天分享一个干货内容。

赶紧薅羊毛,英伟达免费送无线头肯免费用缤米 k 二点五, mini max m 二点五,流量无上限。一个视频教会你怎么免费注册领取,怎么接入锅锅捞小龙虾,使用干货两分钟,先收藏后观看,总共分为三步,第一步,我们先访问英伟达的官网,接受 我们的 qq 音箱 autolok 邮箱,点击下一步, 点击进去,点输入我们的密码,选择我们的验证模糊,点击创建。去邮箱,接受我们的验证码,粘贴验证码,点击确定,点击下一步, 这里随便取个名称,点击创建账号。第二步,获取免费 ipikey, 这里需要认证过后拿到我们的 ipkey, 这里点击 wordify, 这里就需要我们填写我们的手机号,加八六,一定要加上八六点深扣子, 输入我们的短信验证码,点击 word。 好, 这下我们就成功注册,接下来我们去得到 a p i t 我 们选择我们需要的模型, 这里选择 mini max 二点五,选择右上角的 vioq, 点击 jerry 的 api key, 生成我们一个秘钥,我们需要保存 api key model 备用。第三步,接入我们的小龙虾,我们打开 opencloud, 点击 ai 与代理,点击 model, 点击添加 entry。 划到最后,我们看你这个名字,取一个名称, 选择 open api competition, 输入我们的 api key, 打开我们开关,输入 base url, 然后添加, 选择我们的 open api complete id, 名称就是我们的模型名称,点击添加,这里要选择 text 好, 名称选择好,点击保存,这儿点击 open, 打开我们的接收文件。我们可以搜索 primary, 在 models 中添加和我一样的内容,然后再更改 primary 为我们的新节点名称, ctrl s 保存关闭,重启我们的 get, 选择我们新加的模型,询问它。 如果这个视频帮助了大家,请点赞收藏,关注我,多一个程序员男朋友点赞收藏。

open 可乐最火的时候,全网都在教你怎么安装,但现在热度下来了,我发现一个非常尴尬的事,百分之九十的人根本不知道怎么养它。这又导致现在 mac mini 高价抢了 taco 也买了龙虾,反而没干啥活。 所以这期视频没必要再去讲什么安装流程,我反而想认真聊一聊,怎么才能把这只野性的龙虾驯化成一个真正能干活,越来越懂我们的 ai 生产力助手。 首先我想说一个反常识的点, skills 不是 越多越好。你想啊,同一个层级下,功能相似的 skills 有 好几个,如果你这个也装,那个也装,那碰到同一个需求,这两个 skills 都觉得这是我的活,那就很容易打架了。就好比一个部门有两个老大, 谁都想自己说了算,最后也只能失控了。所以 skills 不 在于多,而在于边界清晰。那在起步阶段,有一个基础的 skills 清单就非常有必要。我把它分成了四层,第一层,安全层,它的名字叫 skill writer, 这个建议大家都先装上哈,它可以帮助我们审查接下来要装的 skills 的 安全性到底怎么样,比如来源审查、代码审查、权限范围、风险等级评估,只要是低风险,那这个 skills 就 可以放心大胆装了。第二层,其实就是要给它一个搜索功能,这个我用的是 brave, search 到官网注册申请之后呢,每个月有五 w 的 免费搜索额度,对于个人的网络搜索来说,这个白嫖额度基本上也够用了。第三层,我觉得要让龙虾能读懂资料,你可以把最常用的文件格式, pdf 啦, word 文档啦, ppt 这些格式的读取功能,让他先学会这些 skills, 用 i s i p 和官方出品的就行,他已经有九十多万个 star 背书,稳定性和安全性都是有保障的。第四层,你可以给他基础文件的操作能力,让他在特定的文件夹里读写、删改。 先记得先不要给他系统级的权限哈,比如终端命令行执行这类的高危权限,一旦你授权了,他很可能就会默默的修改你的系统配置。这里再分享一个我自己使用 skills 的 方法,那就是自己做一个。比如我把第二层那个 blue search 重新做了一个,因为我当时安装的时候 app 上面的原版博友 search, 它在 reddit 里面说需要一个 api 蜜月,但实际上呢,并不需要。这种描述的不一致就让我觉得,哎,可能没那么可信,哪怕收藏使用的人特别多,那可能跟我的需求也不一样,所以我就重新建了一个。 当然,这个建的过程也不是说我自己就在那吭着吭着写哈,而是让 ai 帮我写 markdown 文档。所以我觉得大家在安装 skills 之前,先了解清楚这个 skills 干啥的,你什么时候会用到它,怎么用它,然后它最大的权限是啥?不求多,但求精。 我们都知道,龙虾的能力上限很多时候在于你用的是什么模型,如果是最顶级的 cloud, 它就非常强,那用一个普通的模型,它就会回归到一个非常普通的状态,甚至有些任务你会觉得,哎,它怎么还没平时对话的通用大模型厉害啊。 但这也不是说以后干啥都用最顶级的哈,那你可能还没驯化龙虾这个账单,就把自己给驯化了。所以我觉得性价比高的玩法是顶级模型和普通模型组合使用。把最顶级的 cloud 当作一个 ceo, 把难题、战略规划类的写 skills, 给 bug, 风险判断这活交给它。 那剩下那些重复性的杂伙,像整理文件啦,整理图片啊,文档总结。那就交给普通模型。我用的组合是 cloud、 obox、 四点六和 mini max。 很多人觉得 openclaw 不 懂自己,是因为他们就把这只龙虾当成一个开箱就能用的工具。但 openclaw 的 定位其实是一个定制化的私人助理,就像你招了一个哈佛毕业的助理,你俩见面的第一件事肯定是告诉他 我是谁,我的任务是啥,底线是啥。那给出这些信息,其实就是给 openclaw 建立上下文,这一步就让他从一个普通的 agent 变成你的 agent。 你也可以提前配置好 user、 identity、 soul 这三个核心文件。 soul 是 关于你、你的个人说明书,你的名字、职业、目的、喜好、红线都写在里面。 identity 是 给 open cloud 身份的地方,比如它的名字,它的角色定位。 soul 是 龙虾的灵魂,你可以定义它的做事风格、价值观和行为边界。但在写的时候,不建议用太多聪明、温柔、冷静这些很虚的词儿, 而是尽量写成可执行的指令,比如把冷静写成永远不使用感叹号和已默契的表情。那面对用户的抱怨呢?直接提供解决方案。因为 oppo 可乐他是一个 a 阵的,他不仅能像 g p t 那 样跟你聊天,还能替你行动, 比如接管你的电脑,替你群发消息,如果你没有配置,删除、发送发布之前必须先确认这些具体的红线,他可能就会为了表现聪明和高效,帮你整理桌面文件,结果不小心删掉了你的资料。 我经常刷到各种 open class 的 视频,我看到屏幕上有很多个 agent, 但我觉得呢,对于普通小白来说,不要一上来就想着建立一个什么 agent 足球队,我们应该先把一个 agent 养明白,再 再去让他开分店,因为只有当你把一个 a 阵的调教好了,你才知道他是什么脾气。当出现问题的时候,怎么借助通用大模型去解决,像养孩子一样,先把他养熟,这样你才能轻车熟路的养。第二个具体的分工,可以设置成一个总管加 n 个专业型 a 阵的的形式。 总管呢,就让他负责一些基础性的总管性的工作,比如搜索啦,轻度的整理专业型的 a 阵的,可以让他写文案,做研究生产图片提示词。 对于这些不同的 a 阵的,我建议是搭配使用不同的模型。像研究型的 a 阵的,可以使用最顶级的模型处理基础事物的 a 阵的,比如图片整理、文件规档,可以用普通的模型,那涉及到创作内容的 a 阵的,像我需要文案和脚本的创作,那我会两种模型搭配使用, 搜集热点信息,用普通模型输出,搞建大纲,用顶级模型组建这些 a 阵的军团,其实就像组建一个团队一样,要让他们有清晰的边界,各司其职,以后你也会越用越顺手。 最后呢,我想分享一下 opencloud 的 权限问题,我觉得我们不要把 ai a 阵呢当做一个资深牛马, 也不要把他当做一个小学生,而是把他看做一个潜力巨大的超级实习生,他非常聪明能干。但是你刚开始跟他接触的时候呢,不要上来就把所有的权限都给他放开,而从紧到松,一步步来。 比如刚开始只是让他们帮我们读取文档,查看文件,做一些总结和轻度的搜索工作,那熟悉了几天或者一周以后呢,可以让他建一个工作区的文件夹,创作文档,写一些草稿之类的,感觉更稳定。之后呢,就可以让他去归党整理, 给他一些删除格式化的权限。最后啊,最高级的权限,比如说发消息,发布视频,或者执行系统性的命令,这些必须经过人工确认。最后,我们总结一下,到底该怎么养好这只龙虾呢?我觉得真正养法就是四个词,少一点,慢一点,看清一点,克制一点, 少一点对全能 ai 的 幻想。慢下来去打磨它的身份和规则,看清它作为工具的边界,那在赋予它电脑的权限时保持克制。 在 opencloud 被炒得最热的时候,不要为了大家都在玩而焦虑,当热度下来了,也不要把它当做过期的玩具扔在电脑里吃灰,毕竟它不是追风口的社交货币,而是你花时间亲手调教出来的真正懂你的数字搭档。

兄弟们, token 焦虑从今天开始就可以告别了。 github 上面有一个项目叫 open rely, 突然聚合了三十六个免费 ai 额度, loft, opus, gpt 最新版 japanese pro 都可以免费用。不仅如此,还可以一键接入 coser, 还有 cloud code 原型,用完自动切换下一个写代码,全程零中断,本地部署技术加密,安全是没问题的。零成本白嫖顶级模型。想要地址的评论区回复 token 我 发给你。

大家好,讲一下怎么把这个小米的 mimo token plan 呢?接入到我们这个国内版,吹啊,大家可能已经申请到了 mimo 这个套餐,那段时间不是他有一个活动吗?现在还在继续啊,大家可以继续去申请,我这个作品里面有。然后 首先呢打开以后滑到最下面,打开这里,然后去如果如果这样子的话,你把这个 auto 取消掉就可以了。然后 找到这个添加模型,点击打开,然后必须要选择 open ai, 然后选择的这个是要选择这个 自己填的这个没有默认的,然后就是必须就是这个小写 m 啊,小写 m 千万不能忘记了,不然的话就会错误,就会报错,然后要特别注意这个自定义请求地址, 大家记一下,就是用这个地址,而不是用这个其他,或者说这个其他地方获取到地址,必须要用这个地址,不然的话就不行啊。添加成功了, api k 我 刚放放进去了,然后现在就可以开始正常的使用它了,比如说你好, 然后谢谢观看,祝大家成功的这个,把这个模型接入到 tree。

全网首发,今天一条视频教会你获取 token 的 四种渠道,搞定中转站上游。 第一种, azure open ai, 作为目前大陆获取 open ai token 的 主要合规渠道, 虽然目前已经不再是获取 open ai 模型的唯一云渠道,但阿塞尔在大陆的特殊地位不变。微软也明确强调,在大陆提供的 hr open ai 服务没有变化,获取的一线货源稳定性与合规性极强,持有大量企业级合规认证。 第二种, safar ipi, 手动搭建,借助 safar ipi 等开源工具,将自己的网页订阅额度转换为 ipi。 如果账号很多,甚至可以调用 safar ipi 的 管理 ipi 编辑脚本,实现批量自动导入。但是这种方式只适合个人学习与技术探索。 第三种,逆向。这种方式极不推荐偷看,有效期非常短,只适用于私人且低频非重要的技术测试。逆向是验证想法的快速途径,但需自行承担风险。第四种,薅羊毛。 利用海外企业的免费试用额度或建立大量耗时赋用分发羊毛党滥用免费额度,且有巨大的时间沉没成本。 最后获取 token 推荐大家还是选择官方云厂商的直联或者 ai api 聚合平台,用激进官方的稳定性换来极低的价格。最后,祝大家创造力不断,用 ai 探索出更多惊喜!

oppo 可浪呢,是我目前用过最强大的软件和工具,但它的 togg 消耗量也确实让很多人望而却步,甚至呢,因为高额成本不敢完全释放它的潜力。 今天呢,我就教大家四种方法,在性能完全不打折的情况,就是前提下把成本降到最低,实现 top。 四。在讲方法之前呢,我们要先弄明白 top 到底花在哪。 其实呢,你每问 ai 一个问题,发过去的就是并不是一句话,而是一个巨大的工作包,它包含五部分, 一、系统规则,他是谁,能干啥。二、工作去文件, a 阵 g 文件等等。三、对话历史会形成滚雪球效应,越聊越贵。四、工具的输出,抓取的网页,论文日制等等。 最后才是你当时的问题。这个呢,就像你雇了一个员工,然后每次想让他工作,你都得把员工手册,公司章程,岗位职责先从头到尾的就是跟他说一遍,然后再问他今天你中午吃了什么,你说这能不会吗?对吧? 那如何节省掏根呢?就是我们今天要告诉他步骤,而不是问题。第一种方法, qm, 传统情况呢,就是把整个资料像填鸭一样,整天给报大模型,就会呢导致输入 token 的 爆炸。 qmd 的 逻辑呢,就是在本地把 make down 数据库建立,所以你问问题的时候,它只提取最相关的几个片段和摘录给部分框,也就是模型,不再读全库,只读需要的部分,那它是如何工作?所以库是如何建立的呢? 第一个是 update, 所以 文件刷新。第二个呢,是向量的更新,以及向量的投,就是投射。重点呢是这两件事全是在本地跑,不消耗云端的投币,也就是说 qmd 把云端投币用来读所有文件和信息的成本都转化为了本地所有的成本。 那如何安装 qm 币呢?你可以让你的 opencloud 帮你安装,或者呢你想就是手动的安装,那么也只有这三步。首先呢就是运行这些命令到我们终端里安装 qm 币,之后呢,我们去到 opencloud 点 json 文件, 确保我们的 memory 是 这样的,然后呢我们就重启网关,这样呢就结束了。还有一点呢,值得一提的就是 qm d 还允许你精确的去控制你的预算,通过三个参数来实现,还是在我们的 open file 边最顺,这个文件形式就是里面 可以看到厘米的,下面呢有三个参数, max result 是 最多可以注入几段, max snivetime charts 是 每段允许多长,而 max injector charts 是 每轮总注入最多允许多长,也就是总的预算阀门。 接下来呢,我们来看第二种方法,就是用本地模型跑心跳,心跳呢就是 open clock 定时的唤醒行为,他呢按照你配置的频率把 a 阵的叫醒一次,让他呢执行一段心跳清单,他的屁的心跳本身就是走一次完整的 a 阵的回合, 他呢可以当监工,比方说你给我们可到一个特别长期的任务,他做就是承诺做完之后可能做一步就不会往下推进了,这个时候呢,我们就可以使用心跳, 定期的呢,每三十分钟的去刺激一下,触发一下我们 a 阵,疼,让他呢没有完成任务之前不准停下来。 这样呢我就保证了我们整个这阵的 open cloud, 我 们 ai 助手有一次性能确保完成我们的长期任务。那为什么心跳呢?会花费很多的 token 呢?因为每次心跳的输入通常都会包含系统提示词, worker space 文件的输入,尤其是 memory 点 md 和 agent 点 md 可能会变得很大,还有可能的对话历史。还有呢,就是 hadbeat 心跳本轮的提示词或清单,所以它的输出可能会很短,可能就是 ok 没有问题,但是输入可能会很大很长。 那如何减小心跳的成本呢?除了增大时间间隔这种常规的方法外呢,最根本还是直接让本地的大模型,小的大模型来跑心跳这种低智商的任务。 心跳呢,只用来触发,不用来执行任何任务。如果用本地的模型呢,大家需要下载一个欧莱吗? 然后呢,根据你电脑内存的配置来选择相对比较好的模型,比方这里的千万的各个参数的模型。然后呢,大家可以去告诉 openclock 心跳呢,触发任务 用本地小模型来做。然后呢,第三种方法,也就是最简单一种方法,就是尽量用订阅,而不是 api 用量。值得注意的呢,是很多的厂商是不支持这么做的,比方说安卓配,比方说谷歌, 他们的订阅呢,是严禁禁止使用到 open klo 的, 避免的,但是 open ai 目前他们是收购了 open klo 的, 所以呢,他们还是开放状的这个状态。如果呢,想要极致的稳定 走 api 用量而不走订阅,这个时候呢,你要注意了,如果你用最新的模型,不论是 azure 还是 open ai 的 模型,你的账单可能会成倍的增长。 最后呢,第四种方法,直接呢给你的 overclock 发指令,让他呢给你生成一个成本的体检报告,不用固定形式, 让他给你一份靠谱起的消耗驱动清单,可以是百分比的形式,看看到底哪项任务呢,最烧钱,最高的消耗来自于哪里找到不合理的地方。因为你刚开始利用 overclock, 总是会有很多不合理的地方, 比如说一个简单的轻任务,却携带了巨就是巨大的上下文。其实呢,有很多不合理的地方是可以被优化, 而高消耗其实不一定是必要的成本,很多很可能是那种就是流程和配置的浪费,我们呢是要根据我们自己的用处和任务来杜绝掉,那发现问题呢?如何优化呢?这里可以分为流程和模型两个方面考虑, 流程方面呢,能不能有一些轮询的任务改成就是事件触发符不符合条件。然后呢就是我们刚才讲的 gdp, 也是一个非常好的减少上下工序, 就是注入的一个方法。第二点呢就是从模型方面,有一些轻任,我们能用更便宜的模型或者小模型来替代,就像我们刚才说过的,用本地模型来做心跳也是一个非常好的方法。 最后呢就是由 openkey 给出的任务清单,和他讨论有哪些任务可以就是优化来减少成本。最后呢我们总结一下 大幅减少就是成本的四种方法,分别呢是使用 g m d 大 幅减少上下文的注入,心跳呢用本地的模型。第三个呢就是尽量用订阅,而不是走 a g i 消耗。第四个呢就是跟你自己的 openkey, 让他列出所有的就是 消耗投款的任务,由大到小。然后呢,跟他讨论优化的可能性以及如何优化,按照这个方案,保证你的欧文克劳既聪明又省钱。如果呢,你的理论别忘了点赞关注,我们下期再见。

中国的 tokun 出海是一个比较热门的话题,而且这件事情呢,不仅仅影响这些大魔性的公司,可以理解为对中国在 ai 产业上,甚至其他行业上都有比较重大的影响。中国的 tokun 出海在过去的 二月十六号到二十二号这一周,全球的 tokun 调用量按照 a p i 的 平台公司 open wrote, 全球调用大概八点七万亿的朋, 那么中国大概占了五点三万亿,达到了百分之六十一的比中,这是第二个礼拜超过了美国,而且超过的比例比较大。那么这件事情反映了一个什么问题呢?这就相当于中国的制造业出口是一样的,我们中国的制造业通过低成本的竞争获得了海外的大量的, 也就是说中国制造甚至让全球人产生惊慌。那么 tokin 出海呢,就带来了一种服务贸易方面对中国出口方面重大的变化。 什么是 tokin? 可能大家想了解,你可以理解为就是一个计量单位了,大概一个汉字是一个 tokin, 那 么你调用的 tokin 从输入到输出就决定了你使用的这个算力中 新的量,你可以把它理解为电费多少度,这么理解也可以在过去的十六号到二十二号这一周呢,我们中国的全世界前十大的模型公司的前五大, 我们的前四名全部是中国公司,从 mini max 到月至暗面的 mini, 还有智浦,包括我们大家都说像 deepsea, 尤其是 mini max, 它在二月份整个被调用了大概四点四五万亿的 top, 那 么达到了全世界掉油量最大的一块。 那么为什么中国的 token 掉油量会在二月份出现突破性的进爆发呢?说实在的,还是我们中国一直强调实验,强调基础建设。 token 出海的一个底层的逻辑是我们中国的基建能力,我们中国的算力的能力,我们中国的电力的能力, 实际上他是一个算力加电力的出口,我们不是把电出口到了海外,而是我们通过电力带来的算力中心的算力,把这个算力通过太平洋底下的个电缆出 口到了海外。海外的公司,他调用中国的大模型,然后输入信息,然后再通过这种信息产生的生存的内容再输回去。那么这种输入输出实际上是通过大模型 把中国的电力转化成了 token 的 这样一种服务性的产品,又出口到了海外。为什么中国的 token 出口会是这么一种状态呢?核心的问题还是我们中国的成本。 据我所知啊,那个 mini max, 它的输入端一个百万 token 大 概是零点三美金,而美国的 cloud 大 概需要五美金,那就有十六倍的差距。 而在输出端呢, mini max 大 概一点一美金,而美国的 product 大 概需要二十五美金,这是二十多倍的差距。不管是资本还是作为企业来讲,它一定会去想,达到我合理的用途的情况下,达到我的功能需求的情况下,那成本最低当然是最好的。 其实跟我们太白粉出口也差不多一个逻辑,中国的太白粉能这么出出去,可能很大的一个背景也在于我们中国太白粉 的性价比高。那么我们的 top 跟主板代表着我们中国大模型公司从算里到店里这么一个组合的性价比,应该在国际上已经有了明显的优势。另外一个呢,因为美国在限制英伟达的芯片 gpu 出货到我们这里来, 所以我们的算力中心很多其实都在已经用中国国产的算,尤其是华为的升腾系列,又变通的让华为的升腾的芯片产生的算力,也让海外的公司, 尤其是美国公司用起来了。所以对华为的一些制裁和限制,其实他也是限制不了的。其实我们不是这方面的专业人士,但是我觉得呢,给我们带来一种从 企业,或者说从我们这些在这个大模型局外的旁观者的角度来看这个事呢,我自己得到一点体会是什么?我们作为一个企业来讲,我们要把企业的成本降下来,要把东西做好,你就不要担心你没有客户, 我们投奔出海。其实对未来来讲啊,我觉得可能是中国服务贸易走向世界获得较大发展的一个很好的一个例证。当然呢,也有人觉得中国用便宜的店和便宜的算法,便宜的劳动力成本,把这个出口到海外去了, 又降低了中国人的财富,让外国人享受。但我自己是这么认为的,最终呢,可能大家比拼的是规模化以后,谁先有市场份额,等你在这个市场上有了话语权了,我觉得我们中国人挣钱的日子是在未来的,这个机会是很大的。

家庭一样 ok, 可乐小龙虾的福利来了,国家超算互联网平台放大招,直接发放一千万的免费头啃,专门给养龙虾的用户使用,不花一分钱。今天给大家演示一下如何去领取这一千万的免费头啃,赶紧收藏,我们稍稍作。首先我们打开我们的超算互联网平台,然后点击登录注册微信扫码注册,再填手机和短信验证码 就登录成功。点击控制台,直接点击跳过这里可以体验直接点过去。 新人注册大礼包,点击领取,领取成功,我们可以在用量信息中查看赠送的余额。龙虾如何对接我们的超算互联网平台的话,大家如果有兴趣的话可以在评论区留言关注我,多一个程序员男朋友点赞收藏。

说这个 open curl 烧 tokyo 的 问题,咱们找到了非常具有性价比的方案,结果视频发出去之后,好多人在评论区里说这个方案很贵, 有两个说我还没有在意啊,结果说的人有好多,我就认真的看了一下啊,结果发现问题在哪呢?我们工作人员把这个单位啊设置成了倒了符号,其实它只是一个计量单位啊,并不是倒了。所以说 这么多优质的大模型,在你预期价位的基础上,你觉得还差不多的情况下,我还能再除以七,这就叫性价比。

最近最火的新名词词源是 ai 时代真正的印钞厂,那词源也就是 token 工厂到底是怎么运行的呢?今天这个视频我准备分三步让大家彻底理解 token, 并且呢,开启属于你们的 token 工厂。 黄仁勋在 gtc 二零二六有一句话说的特别经典,他说未来的数据中心不是存文件的仓库,而是二十四小时不停产 token 的 智能工厂。什么意思呢?就是你往里面投电力,投数据,投模型,他就往外产出 token, 而你拥有的计算能力呢,就直接等于你的收入。这个呢就是 token 工厂的核心逻辑。 既然是工厂,咱们就从开工厂的第一步说起。看懂啊,怎么开这样一家印钞厂,就是先定产品,也就是选对 token 赛道,这一步呢,我觉得直接决定你以后赚多赚少。开工厂首先要知道自己生产什么, token 工厂也是一样的。 那第一种呢,就是通用 token, 就是 用千问啊, deepsea 这些开源大模型,生产门槛特别低,谁都能上手,价格呢也特别透明,大家都在买,那竞争呢,已经杀成红海了,这种铜壳呢,单价低,只要靠走量,利润特别薄。第二种就不一样了,就是做垂直高附加值的 token, 简单说呢,就是不贪多,你专门盯着一个行业做深做透,比如说专门做代码生成的头肯给程序员用,专门做影视动漫的头肯给设计师用。还有医疗诊断呀,工业设计这些领域,用专用的模型产出的头肯,价格呢是通用型的三到五倍,而且客户特别稳定,利润高,竞争对手也少。 这里呢,我给大家一个核心原则啊,就是千万不要去通用市场瞎选,选你自己有客户资源的垂直领域,比如说你懂医疗,你就要做设计领域的,这样呢才能稳稳赚钱 好产品呢。接下来就是第二步就是选设备,买对真正能干活的生产力工具。 tok 工厂的核心设备呢,就是 ai 服务器,大家一定要记住啊,不是训练机,而是推理机,这两者差别很大, 优先呢,要选这个推理型 gpu 服务器,比如说 h 两百、 rtx 五零、九零,这些机器的优势特别明显,单位时间里产出的 tok 呢,是训练机器的两到三倍,更适配现在大模型推理的刚需,能够帮你多赚钱省时间。 还有成本结构,我也给大家算一笔明白账, gpu 硬件呢,占百分之五十,电力加散热占百分之三十,运维加网络占百分之二十。 而且咱们国内呢,有个天然优势,就是电价和工程师,成本呢,只有美国的五分之一,这是咱们中国偷看工厂能够在全球立足的关键。当你设备选好了呢,第三步就是建工厂了,也就是搭建 a i d c。 建这个工厂呢,有几个核心要求缺一不可, 一个是要高密度电单机柜呢,要达到六十到八十千瓦,不然呢,带不动这么多 gpu。 一个呢是夜冷散热,传统的风冷呢,根本扛不住高密度 gpu 的 热量, 今年夜冷的渗透率呢,已经直接破百分之五十了,降温快,能效高,还能把蒜粒跑满,不浪费。选址也非常有讲究啊,像西部的这个绿电基地,比如青海、内蒙、宁夏,定价便宜,适合大规模量产,偷啃走量为主。东部的枢纽城市,比如说上海、深圳实验低,适合做低延迟高价值的偷啃业务, 比如说实施的 ai 客服啦,或者是在线设计啊,这样就能赚更多的溢价。工厂建好了,设备也装好了。第四步呢,就是装生产线,也就是做模型部署和调度优化,相当于给工厂装上了大脑。然后呢是智能调度系统,也叫 token hop, 作用呢就是统一管理所有的模型和服务器,相当于工厂的调度员。简单的任务,比如查天气啊,写短句就用小模型,便宜的算力。 复杂的任务呢,比如说写论文,做工业设计就用大模型,高算力,动态分配资源,不让 gpu 闲着,把控载率呢,压到百分之五以下,最大化利用每一分算力。生产线装好了呢,托肯也能稳定生产了。接下来第五步就是拓市场了, 把生产出来,托肯卖出去,变现赚钱。一台 h 两百服务器呢,成本大约是二百四十万,满负荷的运转,一年呢,能生产大约十到十五万亿的托肯,按现在的市场价,每 每百万十元的托管算呢,一年的收入就是一百到一百五十万,去掉电费啊,运维费啊,设备折旧费,静态回本时间大概是两到三年。如果做的是垂直高附加值的托,可能价格更高,回本时间呢,能压缩到一点,五年以内还是很可观的。 但是这个行业呢,看着暴利,风险也非常大,最关键的呢就是芯片迭代风险,大家看 h 一 百刚出来没多久, h 两百就来了,现在又有了 b 三百,一年以换代,硬件贬值特别快,如果你三年内回不了本,那这些服务器啊,就直接报废了,血本无归。所以呢,一定要控制好回本周期。

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。

你是不是也经常听到别人说安装了 openclaw, 感觉自己也没怎么使劲用,结果一个月的账单就是几百美金甚至上千美金,很多人第一反应是偷工太贵了用不起。但是真相往往是你把计费模式给搞错了。今天我就把 openclaw 里面最容易搞混的两个部署方式讲清楚, oof 和 api key 用完你就知道为什么同样在用 openclaw, 有 的人稳稳一个月几十美金,有的人直接爆单上千美金。 先讲本质区别,你可以记成一句话, os 更像是包月套餐, api key 更像是流量计费,如果你没有设置上线的话,它就没有上线。 os 的 全称是 open authorization, 意思是授权登录。在你部署 open cloud 的 时候,有几家大模型公司都是允许你用 os 来关联你的账号。比如说 open ai, 如果说你有叉 g p d plus, 也就是那个二十美金的会员或者是两百美金的会员的话,你大可以使用这个二十美金或者两百美金的会员来使用 openclaw, 那 么你一个月的使用上限就不会超过二十美金或者是两百美金,不管你是用了哪个会员。再比如说 google, 现在你在 openclaw on board 的 时候,你还可以看到 google 这里也允许 off, 但是据说这个不是官方允许的,所以它不稳定,不确定在我这个视频发布过去一段时间,会不会这个功能就没有了。但是 open ai 这边是可以的,毕竟 open ai 跟 openclaw 现在已经是一家人了, cloud 是 绝对不行的,它就只能让你使用 a p i t 去使用 homecloud, 那 么你的账单就有可能很贵。为什么说使用 off 能够省钱?是因为你本来已经给 open ai 交了订阅费,那么你日常的这些跟 opencloud 的 交互呀,调 agent 啊,反复试错啊,那你所有的消耗呢?都是算在你的 这个二十或者是两百美元的这个订阅费里面,你的账单就不会超。那 off 的 这个路径适合什么人使用?如果说你每天是高频写内容,写代码,调流程,跟 agent 长时间的来回互动,也就是说你是本人在前台不断地去跟 agent 的 对话去调用,那么你就优先使用 off。 那 apikey 又是什么?为什么很多场景大家会用到 apikey, apikey 呢?是你在平台的后台去申请 apikey, 拿到的一串很长的英文字母和数字结合在一起的一串像密码一样的钥匙。如果说你在部署 opencloud 的 过程中,在选模型的那一步 是直接用 apikey 去关联 opencloud 的, 那么你使用 opencloud 的 过程中的所有使用全部都会根据你的 token 使用量来计费。这也就是为什么有些人他的账单非常惊人,几百上千美金。那这么说 apikey 就 很坏,大家都不应该用吗?不是的, apikey 的 优势不是在于它便宜,而是在于它可控,可以审计,可以扩展,你可以精确地知道自己每一个任务花了多少钱,你也可以去设置你的 apikey 使用量的预算上限。一句话,如果说机器自己在后台干活,那么你就首选 apikey。 比如说前段时间我部署上线了一个网站叫 covermagic dot site, 这个网站呢就是可以给大家去生成视频封面的,那在用户,不管是我还是其他的用户,在使用这个网站的时候,就会调用我后台的 google 的 gemine 的 apikey, 那 每一次的调用呢?都有每一次的花费,没有调用的话就没有花费。我也在 google 的 后台设置了每个月使用这个 apikey 的 上限,以防我的信用卡被刷爆。所以如果说你是做了一个下数软件给到客户用,如果说你每天有很多定时的自动化的工作,那么这种自动化的自动执行的工作 后面也应该是关联 a p i t, 因为这些都不是你本人在跟 ai 聊天,而是 ai 在 自动帮你跑任务。如果在这种场景下使用 off, 那 么无论是在稳定性上还是合规上,还是成本上,后面都会出问题。所以呢,这样的场景就是一定要用 a p i t 给大家一个最实用的落地建议。对于你日常的工作跟 ai 的 对话,让他帮你干活儿。这个场景呢,咱们使用 off, 那 你可以使用叉 h b e 的 会员,你可以使用 google 的 会员,这个呢,待定。然后如果说你是使用像 mini max monoshala ai, 或者是像智普 ai, 它们都是有自己的 coding plan, coding plan 呢,相当于是流量包,每个月呢,你有多少个 prompt, 或者你能使用多少 token, 你 不会是完全按 token 来计费,然后你的这个成本你知道是有一个上限的,你不会超过它, 如果超过他们,你再去买更高一级的会员,更高一级的 token plan 就 好了。但是对于已经上线的产品和你需要定时定期去自动化在后台运营的批处理任务这种场景呢,咱们使用 a p r key 配置好预算,上线设置好成本的预警,以防超标。你学会了吗?我是发力,我只分享有价值的思考。

现在全球 ai 界正在发生一场硬核的跨境套利,而这场风暴的中心正从硅谷的算力实验室悄然移向我国的 ai 产业生态链。很多人还在争论我国大模型到底能不能追上 open ai, 但全球最大的模型聚合平台 open router 已经给出了一个反直觉的答案。 就在今年二月九号那一周,我国大模型的 topen 调用量达到了四点一二万亿,正式超越同期每模型的二点九四万亿,拿下世界第一。 到了三月初,这个领先优势进一步扩大,掉用量排名前五的模型中,我国占据四席。如果你去看最近三十天 openclaw 上的 token 掉用量数据,排在前三的正是我国的 step 三点五、 flash kimi k 二点五和 mini max m 二点五。 我国大模型爆发式崛起的背后原因是,当 ai 从聊天机器人进化到智能体后,全球开发者发现美模型的使用成本太高了。在今年年初 opencloud 这类开源 agent 框架爆火之前, ai 对 大多数人来说只是个聊天工具,你问一句,他回一句。单次交互消耗几千个 token, 每月二十美元的订阅费大家还能轻松承担。但现在的 ai 已经进化成能真正干活的全自动数字员工,你给一个指令,它能在后台自主运行数小时,查资料、调工具、反复推理,单次任务的 token 消耗量直接从几千飙升到几百万。这种 token 通账对开发者而言简直是财务黑洞。 如果调用每头部模型 cloud opus 四点六,每百万 token 的 输出价格约二十五美元,输入也要五美元。一旦让 ai 全天后自动运行, 一个月 a p i 账单可能突破上万美元。一边是全自动 ai 带来的效率诱惑,一边是美模型高到离谱的成本,硅谷开发者只能集寻替代品,而我国大模型凭借好用又便宜的双重优势,刚好填补了这个缺口。 同样是百万 token 输出, mini max m 二点五价格仅一点一美元,不到 cloud opus 四点六的二十分之一,输入价格更是低至零点三美元,便宜十倍以上。 更关键的是,模型的性能差不了多少。这种极致的性价比,让全球开发者集体倒戈我国大模型。 那么问题来了,同样是大模型,同样消耗算力,我国凭啥能把 token 卖的这么便宜?很多人说是因为店比美便宜一半, 其实这不是主要原因。咱们拆解一下 token 的 成本构成。 token 的 背后是算力。算力的成本包括芯片折旧、电费、运维等。其中芯片折旧和算力租赁是大头,占比大约六成,而电力和冷却的成本约占两成。 也就是说,即使电费降为零, token 成本也只能降百分之二十,不可能做到比美模型便宜十倍以上。 真正的答案藏在两个更深层的逻辑里,第一,算法优化上的降维打击。既然我们拿不到英伟达的高端芯片,那就在模型轻量化和推理效率上拼命优化,用更精细的算法把每一分算力都榨干。比如 deepsea 通过 dsa 稀疏注意力机制,在处理长文本时大幅减少计算量, 显著降低了推理成本。结果就是 deepsea 二一的训练成本仅二十九点四万美元构建基础大语言模型也只花了约六百万美元,连 openai 的 十分之一都不到。 这种由于资源受限而逼出来的算法创新,反而成了我们成本控制的杀手锏。第二,竞争策略的生态围角。每头部模型走的是币源加高价加企业优先路线,追求的是单位 token 利润最大化。 他们的定价逻辑围绕品牌溢价、 s l a 服务保障、合规支持等高附加值要素展开。而我国厂商的策略完全不同,我们走的是开源加低价加开发者生态路线,牺牲短期利润,换取全球用户心智与生态绑定。 正如 a 十六 z 合伙人所说,如今硅谷百分之八十使用开源模型的创业公司都在用中的模型,这不是偶然,而是主动设计的结果。 先让用户用起来,让开发者离不开把生态做厚。当全球程序员每天调用你的 a、 p i 写代码、跑 agent 建应用,你就成了 ai 时代的数字底座。这不仅是定价策略的问题,更是一场生态位的争夺。当然,话说回来,虽然电力不是我国 toc 成本低的主因, 但它确实在这场生态争夺中起到了锦上添花的作用。作为全球唯一的电力王国,我们去年的年发电量突破了十万亿度,是美的两倍多,电力充沛且稳定, 全国工业用电平均仅六七毛钱,一度仅为美得一半。新疆、甘肃、内蒙古等西部地区,光伏和风电成本能压到两毛钱左右,甚至因为电网消纳能力不足,经常出现气风气光和负电价。 巧合的是,美开发者的工作时间恰好对应我国用电负荷最低的后半夜。这意味着美开发者花钱买的 token, 烧的其实是我国电网原本要浪费掉的甚至是负成本的电。这虽不直接决定定价,却为低价策略提供了安全边际。 所以总结下来,我国 token 成本远低于美的真相是极致的。算法优化加激进的生态策略,加低电价的锦上添花,三者合力共同造就了这场波澜壮阔的 token 出海潮。 如果说过去四十年,我国出口的是衬衫家电,这十年是电动车、锂电池,那么下一个十年, token 将成为我国最具爆发力的数字出口。它不需要海运,不受贸易壁垒限制,却能将我国的算力、算法和能源优势直接转化为服务贸易收入。 这不仅是一次技术输出,更是一次产业出口的代际跃迁,也是我国从世界工厂迈向全球智能服务商的关键一步。 聊完 token 出海的整个逻辑,我们再来看一下投资机会。有这几个方向值得关注。首先受益的是模型厂商本身,现在 mini max 已经有百分之七十的收入来自海外了。 二月二十三号月之暗面发布消息说,近二十天的累计收入已经超过去年全年的总和。 token 出海给这些模型厂商带来了实实在在的营收。其次是高端 gpu 算力租赁和核心枢纽的高功率 idc。 随着 token 消耗量暴增,电力和机贵成了硬通货,供不应求的格局已经形成。更深远的利好是国产 ai 芯片随着应用的爆发, ai 发展的重心将从训练转向推理, 推理算力的需求规模远超训练,这给了已经适配国产主流大模型的华为、升腾、韩五 g 等国产芯片一个弯道超车的绝佳窗口。 与此同时,像液冷光模块、高端电路板、先进封装等算力配套产业,以及背后空间巨大的电力设备和储能赛道,都将随着 token 出海的浪潮水涨船高。接下来,往上游走,离不开各种前沿技术的突破。往下游走,各类 ai 应用会迎来爆发式的机会。 需要注意的是,下游应用的核心壁垒不是 ai 技术本身,而是场景理解能力、数据积累能力、产品落地能力。 很多企业拥有 ai 技术,但由于不了解行业场景,缺乏行业数据,无法推出适配场景的产品,最终被市场淘汰。而那些深耕行业、积累了海量行业数据,能够推出 ai 加行业定制化产品的企业,将获得持续增长,甚至实现十年、十倍乃至百倍的回报。 机会已经摆在那里,但能不能抓住就因人而异了。如果你想把握这波趋势中的确定性机会,而不是在下一个周期到来时,依然是个局外人。欢迎加入我的趋势研习营。很多人跟我说, ai 赛道太复杂,芯片、算力、模型、应用每个领域都深不见底,根本不知道从哪下手。 这说明你缺少一套看懂整个 ai 产业发展趋势的底层能力。二零一二年我开始研究英伟达,二零一六年上车持有,到现在,回报已经翻了几十倍。这十几年来,我对 ai 行业的研究一天都没有停过, 曾经上百次飞往美餐会调研,也曾深入国内数百家 ai 企业的一线探访,这种内场视角让我总结出了一套看透 ai 产业趋势的方法论。正是靠着这套逻辑,我压中了国内外不少优秀企业,并实现了财富自由。 二零二一年,我创办了趋势研习营,希望把这套方法传递出去,让更多人过上更好的生活。在研习营里,我不讲空洞的理论,我会把这些年沉淀下来的不对称的产业信息全部分享给大家,带大家系统拆解、算力、算法存储、光模块、 ai 应用等细分赛道,告诉你谁握有真正的技术壁垒, 谁切入了大厂供应链即将产能爆发,谁只是在蹭热点割韭菜。我希望带给你的不是零散的信息,而是帮你建立一套独立判断趋势、识别早期上车机会的底层能力。 拥有它,你就能在一些细分赛道起飞前,灵敏的捕捉到那些打双闪的信号。果断上车!欢迎报名趋势研习营试读课,点击左下角二十九块九拍下,拍下后记得查收短信点赞关注不迷路!

最近盛行一种观点,中国诞生了一种新的出口产品, talking, 出海如何如何有优势,如何是下一个暴富的机会?有一件事没做,这种观点就是异想天开,你听我用两分钟分析一下自己就得出结论。 这种观点啊,无非有这么几种支撑理论一,爆发论。二零二六年二月 open rotor 平台中国模型周掉能量占比百分之六十一,首次超越美国。 二,成本优势论。电价差是中国的核心优势。中国企业用电均价较美国低约百分之二十五,较欧洲低百分之五十以上。 talk 成本中,电力占比占约百分之七十。 中国绿电加算力集群形成全球领先优势。持上述观点的大多数为财经类博主,可能对 ai 技术了解有限。 token 不是 书电线里的电子,不是自然界中的物理存在, 甚至不是英伟达的算力 token 是 通过 ai 大 模型进行数学数据在国家间的流动是受限的。 我们不说欧美这种地缘政治上就有障碍的国家了,就是与中国友好的一代国家来分析啊。俄罗斯拥有世界上最严格的数据本地化法律之一 d 二四二 f z 号。法律 要求,处理俄罗斯公民个人数据的数据库必须务理位于俄罗斯境内,将数据传往中国训练 ai 在 回传 talk 在 法律合规上基本不可能,且俄罗斯正致力于建立本国的主权 ai。 哈萨克萨数据保护法要求包含个人数据的系统必须在哈境内运行。 乌兹别克斯坦二零二一年修改的个人数据法明确要求涉及本国公民的个人数据必须在物理位于境内的服务器上处理。越南 网络安全法和第十三号法律二零二三极其严格要求电信和互联网服务提供商必须在越南本地存储数据。 印度尼西亚第七十一号政府条例要求公共服务机构必须在印尼境内处理和存储数据。因此,看到了吗?跨国数据出 talking 进的模式在法律层面面临数据主权审查、个人隐私保护、算法合规性三重障碍。 对于政府金融、医疗的高毛利行业,这几乎是不可能逾越的红线。我们国家的绿电优势促成的算力资源丰富的地区主要是新疆和内蒙古, 而他们临近的国家正和正是上合组织成员国的俄罗斯和中央。这些国家同样拥有丰富的光照和便宜的土地,比新疆还便宜,还利于发展绿电。 如果他们需要 tok 资源,会优先进口中国的光伏和风电设备,一方面完全无法律障碍,一方面可以自建算力中心。而且中亚国家还不是美国,限制着英美达芯片的出口地区,干嘛从中国买 tok 呢? 哈萨克斯坦本来就是世界第二大比特币矿场集中地,就是因为用电便宜,当然现在由于挖矿太多,电也不够用了。而东南亚国家距离新疆太远,输送托肯除了法律障碍,延迟也够呛。那么托肯出海是否有可能呢?当然还是有机会的。

孙宇辰和猎豹的富盛也开始做资源中转站了,会带来哪些影响?有三点值得我们思考,一、他们为什么会参与?孙宇辰是拍过巴菲特午餐的男人,二、五年也成为亚轨道飞行的华人企业家。富盛是 ai 行业的企业家和网红,两个人都有敏睿的流量和市场嗅觉, 意味着磁源开始进入顶尖智囊的视野和射程范围。机会来了,竞争也来了,机会有多大?三月十六日, gtc 大 会,黄连勋全场围绕 tok 工厂在布局英伟达的芯片和生态,随后是 tok 被定名为磁源,三大运营商也改为 tok, 运营商风有云也都接连成立 tok 部门。 然后是孙哥和富顺的高调加入,这发生在一个半月以内,可见资源的机会。三、竞争怎么应对?由于资源工厂建厂的资金高门槛和销售代理的认知,高门槛资源赛道也不是人人可以来的,资源赛道的增长速度会略大于参与者的增长速度,所以拥挤度不会像其他行业那么大。富 顺的战略也是套壳,利用 api, 并且没有做版权声明的大佬们参与,不是胡乱砸钱的,大家是平等的。总而言之,大船和小船各有优势吧,加油吧,资源赛道的小伙伴们!

今年啊, ai 应用行业有个特别奇怪的现象啊,一方面就是这个 oppo 可乐小龙虾热度迅速下降啊,没有什么新的 ai 应用出现。另一方面就是这个头壳的热度啊,特别高啊,你在各大平台搜着 a p n 众转站什么的哇,到处都有人在搞这事, 而且现在质朴的销量非常好,现在这种什么小客户啊什么的,压根都不理,不卖给你。哎,这个事太奇怪了,没有新的应用场景出现,那到底用在哪了呢? 最近我这个事我觉得稍微有点想明白了啊,我给大家算一下账啊,以我自己为例啊,现在我每天 ai 编程 啊,销量已经下来了啊,但是也每天要超过一个亿,我算了一下,这一个亿的托克如果用在我自己的这个产品短视频工具箱里面啊,我短视频工具箱生产一个短视频大概要十万的托克, 要耗掉一亿的拓客,大概要一千个人,每天每个人上来做一个视频,做一千个视频才能把这些量耗掉,大家能想象吗?我开发这一个短视频工具箱产品,前前后后差不多一个月时间啊,每天平均消耗拓客三到五 五个亿。但是上线以后,我的用户啊,现在用户当然少啊,刚上线,但上线以后,在我用户低于一万个用户之前,可能我每天的 平台的销量都抵不过我编程的这个销量,你们能想象吗?我想明白这个事以后,我我知道啊,为什么对没有新的场景出现,但是销量在增加,就是其实还都是在 ai 编程这个场景下消耗掉了, 对,这是一个观察啊,还有一个观察就是 ai 编程这个场景啊,对于 token 的 消耗太理想了啊。首先一个大家知道,那么因为 get 它不上各种代码,对,所以 大模型在预训练,在后训练的时候,这些数据都可以用,所以今天 ai 编程确实是大模型能力最强的一个场景啊。这以二的话,更重要的是我们 ai 编程,你看我们程序员打开一个电脑,在上面写代码,所有的上下文,所有依赖的东西都在这个电脑里面,不需要依赖任何外部的东西。 但实际上 ai 应用我认为最有理想,最可能成为第二第三名的,你看,就是短视频内容行业啊,内容行业因为所有企业,中小企业都需要,大企业其实也需要做短视频,要写文章,要搞营销,搞传播,是吧? 理论上他消耗量应该很大才对,是吧?但实际上呢,这些行业的问题在哪呢啊?今天我收到一个小胡说这边的一个警告,说啊,你使用了 ai 的 一些工具创作了, 哎,你想想这什么意思啊?你理论上 ai 的 技术和能力都是够的啊,但是你想好,你今天想要批量的让 ai 去帮你操作这些东西,平台不允许 是吧?那你要克服这些平台的限制。哎,这些知识都是水下知识, ai 不 掌握,所以呢,对于绝大多数人来说,这件事他就没法实现自动化, 那么这和编程就不一样。还有一个场景啊,大家都知道微信这个场景,中国的几乎所有的中小企业的数据库就在微信上面,他呢,什么数字化,什么东西都是微信上面的,有多少人在上面做销售、做客服、做售后,是吧? 但是好,你想让微信自动化,你想让 ai 来自动化操作这件事,我觉得绝大多数场景其实 ai 能力也是够的,但是 腾讯会允许你这么做吗?啊?当然我知道很多人他有能力,他能找到些工具,找到些方法去做这事啊。我自己其实也在用,但是对于绝大多数人来说,这就是水下知识, 只要他的 ai 不 掌握这个知识和能力,他就没法去使用这个。那你想刚才说的短视频和微信这个场景,那他的通过消耗他自然就上不去吧?对, 所以就延伸一下,就是我觉得对编程这个场景就是太理想,太适合了,而你还刚才这样场景不适合。而且我认为还有很多行业都类似于 这个短视频和微信一样,他遇到了一些卡点啊,可能是行业的这个平台的卡点,也当然也可能是平台需要行业专家和 ai 专家一起去去打造一些东西,去这个法规啊、制度啊等等那些东西吧。所以你看没办法,就是 编程今天用的最好,其他行业都会比较慢,还需要点时间吗?