粉丝822获赞7295

前两天,我在抖音分享了两款大模型的核心原理,很多朋友点赞收藏。今天,我们把镜头对准大模型背后最真实、最硬核的成本密码。 token 消耗的真相。当你和大模型对话,让他写文案、做总结、 写代码时,你看不见的算力洪流正在奔涌。而计量这一切的最小单位就是 token, 它不是虚拟货币,不是积分,而是大模型理解与深层语言的原子级单元,是帅力、显存、电力的统一计量标尺。从技术本质看, token 是 文本被模型分词后的最小片段。一个汉字、一个标点、一个英文字词 都可能是一个 token。 中文语境里,一个汉字约等于一个 token, 英文中约四个字母或零点七五个单词对应一个 token, 空格标点换行, 五一例外,全部计入消耗。每一次交互都在消耗双重 token 输入。 prompt 的 token 加输出, completion 的 token 输入是你提出的问题。上传的文本历史对话,上下文输出是模型逐字逐句深层的回答,这不是简单相加,而是算力的真实对价。输入决定理解深度 输出主导计算强度。为什么输出 token 更贵?因为大模型生成文本是自回归推理,每生成一个 token, 都要基于全部上下文做一次完整计算。上下文越长,计算量呈平方级增长, 险存、债用、电力消耗、 gpu 折旧都随 token 数量同步攀升。 token 就是 大模型世界的算力通货。你必须知道三个关键真相。第一,上下文窗口就是记忆边界,八 k 三二 k 一 二八 k。 token 决定模型能记住多少,处理多长文本,超出上限,内容被截断,逻辑必然断裂。第二,多轮对话会累积消耗。每一次追问都要把历史对话重新带入计算,聊的越久, 投肯消耗越快,成本限性上升。第三,计费按真实消耗结算。国内模型多以签投肯为单位计价, 国际主流模型输入输出分离定价,输出单价往往是输入的数倍。一次长文深沉,一次深度分析,背后都是精确到 token 的 资源消耗。很多人以为 ai 是 免费的,是无限的, 其实每一次思考,每一行文字都在消耗真实的工业级算力。 token 的 背后是数据中心的灯光,是芯片的运算,是电力的流转,是技术谱汇背后 沉甸甸的工程成本。理解 top, 你 就看懂了大模型的效率、边界、成本逻辑与能力上线,它让我们更理性地使用 ai, 精简指令,清理上下文,聚焦核心需求,既提升效果,也降低消耗。 ai 的 智能 藏在模型的架构里,而 ai 的 真实代价藏在每一个 token 的 流动中。敬畏技术,理性使用,让每一次交互都物有所值。本地部署 vs 云端 token 讲到这里,很多人会问,本地部署大模型是不是就没有 token 消耗了?答案是, token 依然存在,但计费逻辑彻底消失。本地模型同样会计算 token, 占用上下文窗口, 它的理解逻辑生成机制和云端模型完全一致,区别只在于云端按次付费。本地一次性投入 云端大模型用的是别人的显卡,别人的贷款,别人的电费。所以用 token 计价,本地大模型用的是你自己的硬件,自己的电力,自己的存储空间,所以没有优次计费,没有额度限制,没有隐私泄露风险, 你可以无限生成无限对话,无限处理长文本,不用担心 token 超标,不用担心对话被记录,更不用担心突然涨价, 服务下架,但代价也很真实。本地模型的性能上线,由你的显卡决定,显存不够,模型跑不起来,算力不足,生成速度就慢。一句话总结,原端,模型买的是服务,按 token 付费。本地模型买的是自由,靠硬件支撑,没有绝对的好坏,只有场景的选择。我是小白,持续用专业与温度 拆解大模型的底层逻辑。关注我,下期我们讲如何高效优化 token, 让你的 ai 使用更省钱、更强大。

听好了,一个月赚两万美刀,基本上是零成本,方法还合规,国内的 ai 托克一分钱,国外能卖到三倍的价格, 这中间的差价全是机会,只是很多人不知道怎么把握。今天给你分享三个玩法。第一个搬砖玩法,去对接国内的头部大模型厂家的千万级 api 授权,把他们做成本地化的 ai 工具套装,卖给东南亚的电商,他们那边把托克当成核心力的生产工具,抢着采购, 毛利率能达到百分之六十五,你赚的也是这波信息差,他们不清楚国内的成本这么低,觉得性价比已经拉满了。第二个玩法,就是压缩降本,把两百亿参数的大模型压缩到四十亿,丢到东南亚的廉价算力上去运行,每托肯的成本低至零点零零八美分,一天跑个十一亿,托肯净赚两万美刀,一天 挖矿,跟这比起来,哼,都不值一提。第三个玩法,识趣套利,这个玩法门槛高,就把推理任务 调度到蓝美的夜间,低成本计访处理完再卖给亚洲白天的刚需用户,成本直接再降百分之四十,这不是普通的赚钱,这是降维式的打击盈利。所以你看这种信息差的玩法,很多人还不知道。

做 tik 上目前哪些 ai 工具最好用?今天直接告诉大家答案,这是我们过去一直在摸索试用,摸索试用反复得出来的结论啊,分别分为文图,视频三类。那文的话,就比如说像脚本,文案,标题这些,目前最好用的还是 jimmy 的 或者 gpt, 就是 美国原生这种大模型效果会最好。 那关于图片的话就只有一个啊,永远的王, none of none 的 two。 最后一个视频视频呢,现在目前最好的是 cds 二点零,它对于整个 t k 短视频的生态还是最好的,也毕竟是自洁自己的嘛, 所以整个大数据什么的都在。呃,目前来讲会比 zara two 要好一些。 zara two 现在慢慢说也不能用了嘛。其他的关于一些 agent 类, agent 这个东西呢,目前还属于一个刚刚开始起步,大家都在试用的一个过程,目前还没有说是一个非常好的一致性的,最好的最牛的一个 agent, 呃,小龙虾呀,包括这种很多就是专门做跨电商的一些脐橙的一些 agent, 呃,等等看吧啊,等我们多多试用一下,然后在成本和好用之间做一个取舍。

ai 时代所有的萨斯公司都将消失,托肯将成为 ai 时代新的数字商品。就十七号晚上凌晨两点半,黄仁勋站在 sap 的 台上面,但这一次他卖的不是显卡,而是 ai 时代的生产的账单。 我熬夜看完了这场演讲,发现英伟达早就已经不是那个卖显卡的公司了,而是一家为数万亿美元 ai 基建时代搭建完整技术站的总包工头。 很多人只盯着飞马架构这些硬件名词,觉得又是性能提升。但我觉得这次最关键的信号是,老黄把数据中心定义成了 ai 工厂。 过去数据中心是纯数据的,未来是生产托肯。衡量标准不再是算力有多少,而是美瓦特能够生产多少。托肯。这意味着什么?意味着托肯将成为新的数字商品,而计算能力直接决定企业的价值创造能力。 更值得开发者关注的是软件生态啊。整场演讲中,对软件开发者影响最深的是老黄对于龙虾现象的评论,他高度评价了开源项目 open club, 他 认为 open club 的 意义类似于过去的 nix。 未来,所有科技公司都会面临一个问题,你的 open club 战略是什么?因为企业软件正在从传统工具型转向以智能体为核心的 es 模式, 甚至未来招聘工程师,除了薪之外,还会提供托管的配额,因为拥有更多 ai 计算资源的工程师,能够获得更高的生产效率。 就在最后,老黄总结的那句话,其实点破了整个行业的未来。 ai 产业正同时经历三大改革, ai 推理与 ai 工厂、智能体系统革命,以及物理 ai 与机器人时代, 这意味着我们不再只是聊天啊,而是让 ai 去工厂生产拓客系统里面自动干活。随着这些技术逐渐成熟啊,计算能力、 ai 模型和技术设施将共同推动全球产业进入新的发展阶段。

很多人一听到 token, 第一反应是,这又是啥技术术语?即使把思维转个弯, token 就是 ai 世界的计算单位, 或者更直白点说,它是你购买 ai 智能的货币。你想想看,以前我们用电是按度来算的,现在你用 ai 就是 按 token 来算的。你输入的每一个字, ai 回复的每一句话,本质上都是在调用算力,而算力就是钱。所以 token 就是 ai 服务的计价器。但更深层的逻辑在于, token 的 消耗速度决定了 ai 应用的 级速度。现在的阶段,就像当年四 g 刚出来,流量还很贵的时候,大家都不敢随便刷视频,因为心疼流量费。现在大家用 ai 也是小心翼翼,生怕对话太长,烧的太多 token。 但历史的规律是什么?技术越发展,单位成本就越低,就像现在流量几乎免费一样,未来 token 也会变得极其廉价。到那时候真正爆发的是什么?不是卖流量的,而是那些能帮你省 token, 或者是能用 token 创造更大价值的应用。所以,理解 token 就是 理解 ai 商业化的第一步,谁能让 token 花的最值,谁就是赢家。

七 p l t 肯 a p i e c n y 结算体系对 ai 智能体新政 t 肯转化效率、数据精炼能力三大核心点,它是如何赋能承接并放大政策红利的? 一、先铆定核心信号三个关键判断也是市场当前的核心主线。一、政策导向 三部门 ai 智能体新政落地, ai 正是从技术概念进入应用为王的产业落地时代。二、竞争逻辑。 ai 的 比拼不再是模型参数,而是偷看转化效率。三、核心壁垒,真正有价值的企业必须具备数据精炼加场景落地加合规闭环的综合能力, 这套体系正好踩中了这三条主线的全部要求,甚至能成为 ai 智能体新政的落地。在体二、体系如何赋能承接政策红利? 一、给 ai 智能体新政提供了合规可落地的产业结算底座,解决 ai 的 落地痛点 ai 智能体新政鼓励 ai 在 产业场景落地,但很多企业缺的不是模型,而是能承载 ai 决策的合规结算闭环体系。用七 p l 全链路信用做风控底座, api 做开放接口, ecny 做合规支付通道, 给 ai 智能体提供了从决策到执行的完整闭环。合规闭环天然适配政策、数字人民币结算、七 p l 全链路数据流痕完美匹配新政对数据安全、资金监管、风险可控的要求,解决了 ai 金融应用的合规顾虑, 让政策导向能真正落地到产业场景里。二、把 token 转化效率从概念变成了可量化的落地能力,定义了 ai 时代的 token 价值,拼的是谁的 token 转化效率高,但绝大多数企业只有模型,没有 token 化的再提 体系,直接把七 p l 全链路的供应链数据、交易数据、信用数据,通过 api 接口接入 ai 智能体,自动完成数据精炼、信用评级、偷看、资产化、易减、 c o i 结算的全流程,真正实现了数据及资产、资产及结算的高效转化, 效率优势碾压传统模式。传统结算需要人工审核、多级对账、线下确权。 而这套体系通过 ai 智能体加 token 化,把信用评估、资产确权、资金结算的周期从天周压缩到分钟秒,直接兑现了 token 转化效率的核心竞争力。三、完美匹配数据精炼能力,形成 ai 时代的核心壁垒。 其 pl 全链路数据是 ai 的 高质量燃料, ai 智能体的效果取决于数据质量。 七 p l 体系覆盖了从生产、物流、仓储到交易的全链路数据,自带时间戳、不可篡改,是天然的高质量精链数据级,能大幅提升 ai 智能体的风控、定价、决策能力。 偷啃化,让数据价值可沉淀、可流转,普通企业的数据是零散的、不可确权的。而这套体系把精炼后的高价值封装成可交易、可结算的偷啃资产,既保护了数据隐私, 又实现了数据价值的变现,真正把数据精炼能力变成了可落地的商业模式。三、这套体系就是 ai 智能体新政的产业落地样板, ai 正式进入应用称王时代。七 p l token api 减一减 c n y 结算体系,就是把 ai 智能体从技术概念变成产业里真实可用的结算风控、资产化工具的完整方案。它承接了政策的合规导向, 它兑现了 toc 转化效率的竞争逻辑,它用数据经验能力构建了不可替代的壁垒, 这也是为什么他能成为全球首创的核心原因。他不是单一的技术创新,而是 ai 加产业加金融加合规的完整闭环,完美适配当前政策和市场的全部要求。

到现在干这个大模型应用开发也有十个月了,我对自己的工作呢有了一个全新的认知,想要跟大家分享一下。就是我们是根据客户的需求去做一些大模型训练的数据。 这份工作里有一个好处就是非常的紧跟技术潮流吧,因为当下什么技术最火,那么大厂肯定是要去追这个潮流,然后对我们就会提出需求,所以说接触的技术也非常多,就有 agent 相关的,还有音频里面的 asr、 gts, 再像一些图片编辑,就是会调一些什么 gmail、 三 pro image 这种模型去处理图片数据。感觉这份工作有大部分时间,其实 处理并不是难事,就是在开始做之前要有一个方案怎么去做这件事情,主要就是对模型要求比较高的话,就是调人家 api 嘛,然后也不需要这些代码,就全部 ai 帮你写好就行了。 我们是希望国内这些模型能够慢慢的去追赶国外的那些模型,所以我们其实就是相当于把国外的那些顶尖模型,他们的知识给蒸馏出来,然后为给国内的这些大模型插上来,助力国内大模型的发展。 但现在确实也在某些方面有一些问题,像我们最近 astropok 不 带中国玩了嘛,就直接对中国就是有非常严重的封禁, 所以这就是就导致我们没有办法去蒸馏他们的模型。之前我们主管跟我们分享一篇文章,就是说既然不能蒸馏模型,那就去蒸馏人才蒸馏成果, 反正就肯定是要调整现在的一个生产方式的。所以我想说到现在其实我的工作模式已经是挺固定的了,我感觉我最重要的工作就是在 嗯,思考这个 pipeline, 然后调 api, 用 api 写代码,然后跑,最后 对结果进行一个质检和筛选。当然不同的这种搞大部型的公司业务肯定是很不一样的,和 agent 的 开发就完全不一样, agent 的 话可能就会去搞一些 r a g on chain 这种框架,但是我们就不太需要用到这个, 我到现在是没有说哪个业务需求是要求我们去打这个框架的,当然我也比较懒呃,没有在闲暇之余去学习一下更加高级的完成这个业务的方式。 然后就是这个岗位也不需要去微调什么大模型,这种应该就是那种大厂算法才会去干的工作,或者说你干这个大模型干到了资深的程度, 像我们这种入门基本上是接触不到大模型微调的,一些小公司也没有卡给你跑这个这么大的模型。 总的来说呢,这份工作其实计算机行业的所有工作都是这样,就是一直要去了解一下前沿的技术,最新的一些东西,要不断的去学习。 现在大模型发展也真的非常快,像去年卖的东西,今年就可能只能卖到百分之十的价格,真的是要不断的去提高,去迭代的。嗯,今天分享就到这了,拜拜。

二零二六,一种狠心的 token 出海正在悄然暴利。不出国不运货,靠家里的显卡做 token 出海,这门生意,今年或许真的能跑通。现在,美国硅谷正陷入一场前所未有的电力饥荒。 一边是 ai 算力的需求爆炸,一边是老旧的电网根本承载不了这么大的负荷。在弗吉尼亚州和加州,很多数据中心想要扩容并网,排队已经排到了两三年后。这种有钱买卡没电开机的窘境,正在推高全球的 ai 产业的底层成本, 而这恰恰给了一种全新的跨境贸易模式留出了巨大的套利空间。它不是简陋的倒卖硬件,也不是复杂的软件外包, 这本质上是一场利用两国资源禀赋差异进行的数字能源套利。我们来做一个最直观的对比,在美国,工业电价受限于能源转型和基建之后,很多核心地带已经涨到两三毛美金一度。 而在国内,一托完善的能源工业体系,我们的电费成本只有人家的几分之一。更重要的是人的红利。 同样一套分布式算力集群,美国聘请专业运维工程师的成本极高,而国内拥有大量懂架构、会调优的自动化和计算机专业人才。这种工程师配置的性价比是全球任何地方都比不了的。 你用最低成本的店,配上最高效率的人,跑的是国产最强的 mini max。 开源模型生成的 token, 通过云端 api 卖给对价格敏感的美国独立开发者。你在境内完成生产,他们在海外完成消费,赚回来的是真金白银。 算力正在变成像煤炭、石油一样的基础商品,美国虽然在芯片制成上领先,但是在 ai 竞争中拼到最后,拼的是单位算力的综合成本。未来,谁能把低廉的电费和高校的人才红利转化为全球通用的 api token, 谁就掌握了印钞机的摇杆。这种分布式数字出口,正在打破地理和政策的边界, 这不仅是技术的较量,更是能源效率和人才密度的对撞。当然,这种路子对一般人来说也是有门槛的,跨海传输的延迟如果控制不好海外客户的体验就会直接崩掉。美国最新的法案虽然复杂,但是只要搞清楚服务贸易和算力租赁的界限,空间依然很大, 更别说还有资金回笼时的合规审查,每一步都得踩准节奏。这门生意是留给一些既懂底层技术又懂国际贸易规则的国际数字玩家的。

之前不是做麦克斯丢丢的本地算力吗?很多人用它来养龙虾,我也教大家如何用它来养爱麦斯,说这个麦克斯丢丢,他是我的运营总监,帮我负责分析平台的一些数据,同时帮我去写文案,比如说我问他,我最近账号的这个数据 直接按回撤,我什么都不用管,他自己去执行了,看到数据已经出来了,这个我全程不用管,直接去跟踪我的账号数据, 可以看得到。然后如果只是这样的话,只是帮我分析数据还是不够啊,我为了让他的潜力完全被挖掘出来,然后除了能帮我去分析数据,他还能帮我去做数据,那就这叫什么?帮我做视频? 现在不是有很多线上平台吗?你会发现有个问题,他根本完成不了你的需求。就是比如说我给他一张图,然后我给了一些提示词, 你看他就给我生成了这样一段视频,而且你要知道这一段素材可以看到他的品质各方面是非常高的,全部是本地蒜泥,你完全不用依赖于线上平台,只要你把这个东西弄回去,他就可以二十四小时不停的跑。这样一个素材大概只需要一分钟不到的时间就完 生成出来了,而且清晰度是非常高的,完全可以用到商用的目的。然后很多人说这个素材是假的,是吧?那我今天现场用这个生成一个 max 六六的,生成一个他自己的视频给你看一下。像我现在的工作流程,我就说把这个设备放到黑色桌子上,背景是白色的窗帘,远景自然光线,就点击 可以看一下他已经正在工作了,我们可以点击这里,可以看到整个工作流的运行情况,这个都很简单,并不复杂。 ok, 可以 看到他已经完全生成出来了,他那一张生成的并不是我理想中的状态,这样没关系,我直接在这里输入五, 直接让他生成五张,后续我在五张中抽一张我认为好的,这就是无限算力的价值,他直接去跑, 可以二十四小时一直生成,你看这一张效果明显比上一张要好很多了,那后期生成的这些资产可以全部在这里,一个有个 资产可以看到生成的所有的图,这样的话一晚上我跑一个大几百上千张图在里面挑的好的,然后直接用它生成一个视频,你们看一下我之前生成的,把我这个麦克斯九九放到了火星的 啊这个表层,然后放了一张黑色的桌子,然后现在我就用这一套解决方案来生成一个视频给大家看一下。 ok, 现在他已经在开始跑流程了,可以看到正在生成这样的一个视频,大概生成只需要一分钟左右,然后为什么要去做这样一件事情呢?这样的视频到底有什么用啊? 我们可以生成很多这样的短视频,然后配合你的口播和主播就可以生成很多电商的视频,这样就可以完成一个完全的闭环。我的小龙虾可以帮我运行,他可以调用我的这个 copy u i 的 工具通,根据我的这个生成 效果图在帮我不断的去优化这个视频。那么每天早上起来我就收到一堆视频,我只要挑到一个有爆款潜力的就可以发布,而且后期基本上是零成本的,只需要用它二十四小时跑,完全可以压榨它的潜力。那现在大概过了一分钟,我们来看一下这个效果。 这个旋转的运镜,你要知道你的产品可以直接突然到火星上以及到热带丛林,可以完全根据你的想法去改变 需要任何成本,这个就是非常牛的。后期我会直接把 open club 小 龙虾和爱马仕直接对到这个 copy u i 上,你只需要跟他说我要什么视频,或者直接传个视频,他就能帮你做成这样的视频。

前几天啊,有个粉丝朋友说他的询盘啊都承接不住,我看了下他店铺的询盘情况啊,一个工厂店三十天啊,来了六百八十九个客户,询盘和客户对话呢,有一千五百多次,两个客服的不同回复啊,最终的结果啊就不一样, 我连夜啊要用了他六十天的聊天记录,看完之后啊背脊发凉。今天这条视频啊,我建议所有老板收藏起来,以便后期要用到的时候呢,找不到了,因为他撕开了循环转化的那条血淋淋的真相。我们来看一下啊,他的这家店铺啊,我是拉了两个月的数据, 然后我们可以看到呢,我这个数据统计出来之后呢,我们是根据十大的一个模型,八大建议去做的一个分析的。 那么首先第一个他的店铺里面呢,总共有六百八十九个客户有来问过,然后真实对话客户数呢,有将近一千五百多次,那中客服表现呢?其实他的客服的能力啊,其实还是可以的,但是问题是在于什么呢?他的后期的跟进是比较的一般的,那么主要的问题是在哪里呢? 一般高品质的问题有这么五个,那么很多客户呢,可能会问,哎,多少钱,什么样的价格,这个是问的最多的。那么第二个呢,就是你的规格,容量,尺寸要跟你确定的。第三个能不能寄样,哪样的一个需求,就是你什么时候发货?第五个呢,是我这个能不能改款等特殊要求。 那么这里面呢,我列了高频次高频啊,低频等等这样的一个呃问题,做了一个汇总。好,那下面的话,我们明显的问题呢,他是有两个客服啊,其中有一个的话是叫小慧,他的话有个即兴回复, 里面的话有很多的数字,就回复了之后只发数字,那么当然另外一个呢,可能就是自动营销回复的这个数量呢,就是比较的多,这个也是不太好的一个地方。那么下面的话,我还给他分析了客服的一个话术的一个具体分析, 比如说像小习贵,他常会用什么直接进入问题,比较寒暄的比较少,那么郑小姐呢,是比较礼貌的,哎,开头会用个你好啊亲啊等等的,那么这里的话,他就缺少了一个标准化的一个开场的一个模板。 好,那下面的话,我们这边给话术做做了一个改进的一个分析,比如说这个不包邮的,那问题是什么?稀缺少了解释生硬,那优化的方式是什么呢?哎,亲,你这边这款的数量是要多少?量大的话我可以给你申请包邮等等这样的一个方式。 小辉的话在面对客户技术性的问题的时候呢,经常会回复一,然后呢让客户等,那么等了之后呢,可能后面就很长时间才会去回复客户,其实是我 这里就是我们帮他做了一个分析,哎,我在问师傅,稍等两分钟,那么这样子的话,客户可能也会去等你,然后你尽快的话再给他回复。 那么优化的话,我们是从价格咨询啊,包括寄样的流程,压价的应对,售后的安抚,这边的话给他列了一套详细的一个话术这一块啊, 那下面的话,我们高频的问题怎么提取出来啊?那么这个多少钱啊?这个是问的是最多的,那我们这边的话给他有了一个推荐的标准的一个回答是怎么样的啊?那包括他的一个能否寄样啊?也会有一个详细的一个话术, 那包括他这边的话是能不能再优惠点啊?我们也给他出了一个话术,然后呢在响应的速度上面呢,我们也做了一个详细的一个分析, 那么他的响应速度里面呢,有几个客户情况下是等了有五分钟的啊?那么客户的反馈啊,是有办法吗?催了才回复,不催的话他就不回复。 然后呢有一笔呢是多处的啊,是有自动的催付消息啊,这个你有一笔未付款等等啊,这个是正常的一个 催付的一个策略啊,那么这个人我们也做了一个详细的一个分析啊,后面呢也给他了一些建议啊,小慧这边的话,在问客服技术的时候应该怎么应答 啊?然后客服的一个绩效的一个对比,那么对于小惠来说的话,基本上百分之七十的客户啊,是他对接的啊,亲和利亚各方面都是比较不错的,我们总总体打分呢,给他打了七分。然后呢 在表现评价上面呢,销售能力比较强,但是服务细节呢,还是需要提升的。那另外一个郑小姐呢,他服务的客户数量只有百分之三十, 比较的规范。然后呢吹风话术呢,也比较成熟,他的分数呢比小慧要高一分啊,相对是比较稳定的。成交量呢,可能就是比较偏少啊,当然可能是跟他的一个接单 比较少有关系啊,所以说郑小姐的话整一个各方面的表达啊什么的话,其实还是比较 ok 的 啊,那么这个是一个客服的一个 分析方面的。那么第六个板块呢,我们做了一个售后问题的一个分析啊,客户问到的是有投诉类型的,比如说,哎,这个蜜蜂落叶的工艺瑕疵的啊,包括我们签收争议的,甚至像就是货品问题的,那么这里的话我们给他做了一些呃,说明啊,比如说什么样品 啊,瓶盖啊怎么样的,然后的话是喷色工艺笔啊,各方面掉色的问题啊,没有得到解决等等的。那么这个我们也给他做一个 详细的一个分析啊,比如说可以做一些退换货的处理啊啊,然后的话,如果说密封问题啊,应该怎么样去处理啊等等之类的,那么这样子的话就是给客户的体感啊,他就能够更好啊。那么第七个的话,我们做了一个转化率的一个分析 咨询,客户呢有六百八十九个,这个是去存的,那大约的话可能会有三十到五个人是成交的啊,可能转化率在百分之五到百分之八啊,这个其实也还是 ok 的, 但是的话我们怎么样去挽留更多的一些客户 啊?那么这里面的话,我们最多的就是客户说后面再看看啊,就没有回复了啊,甚至的话就是有些客户觉得价格贵啊,想换一家等等这样的一个情况。那么其实这个时候呢,我们还可以在 去做一些调整,比如说这里面的话,我们给他分析了,哎,有一个客户的话说要一到两万套滴管啊,那么你这边会反复比价之后小费只报过两次价格的,客户说再考虑之后就 没有联系了啊,那么这种客户情况下,我们要怎么样去跟进啊?这里我们也是给到了一些建议啊,以及客户在犹豫的时候,我们应该怎么样去应对 啊?这个就是提高转化率的一个建议。那么第八个呢,是我们的客服的一个画像分析啊,比如说像小贵,他是怎么样的一个人,他的优点是什么?不足点是什么?这个我们做了一个详细的一个分析这一块,那比如说像郑小姐,他的优点啊,就比较明确啊, 有话术规范啊,催促话术的成熟啊,情绪也稳定啊等等的。但是不足点就是他的销售位可能比较淡一点,客服呢做的比较好,所以这两个人如果说能够结合一下,那这个店铺的成交率还能够再上来 啊。那么下面第九个的话,我们是做了一个深度的一个分析,比如说在针对不同的场景,小慧在回复一是什么样的情况下,他是回复一的,比如说客户问工艺问题后,他回复了个一,这种的话其实就不合理了啊。那如果说在确认收到消息,你回复个一还勉强, 那么说到平台小二的通知呢,这个回复一是正常的啊,客户在催促的时候呢,回复一这个就不太合理了啊,这个会让客户更加的困惑啊,最后一个的话就自动回复啊,这个的话就是呃,也是不太合理的一个表现 啊,所以这个的话就是我们就给他分析了,根本原因可能就是说要么就是说他呃经常习惯性的去用数字化的进行回复,那我们也列出来改进的这个建议 啊。那最后的话有第十个,我们产品的一个需求的一个挖掘,这个是我们做了一个排序,很多客户呢对价格 啊是最关注的,然后价格的匹配啊,规格的匹配啊,样品的质量,胶漆啊,包括量价的一个关系等等啊,反馈的问题,反馈呢,我们也做了一个详细的分析,那么未满足的一个需求 是有哪些?然后呢给到了一个详细的建议。那么如果说你今天有这么一套详细的一个针对我们的巡盘客服回复的一个方式,那么今天你的幺六八八的整体的巡盘转化率一定是会再上升的。看完这条视频啊,现在立刻去翻翻你家客服的聊天记录, 看看有多少个在吗无人应答的,有多少句,我问一下厂长,问下技术之类的,然后再也没有闭环了。如果你想改评论区打客服两个字,我来帮你分析你的询盘转化为什么低客服的问题还是其他问题?

一百万 token, deep sec 两块钱, gpt 五点五,两百一十六块,差了一百倍。普通人做生产力工具到底怎么选?今天帮你算清楚。我把主流模型的 api 输出价格全部拉了一遍,做了个对比图,一眼就能看出来,国外旗舰模型和国内模型之间隔了一个数量级。 注意看最右边那几个绿色的短条,那就是 deep seek 和质朴但便宜不代表差。看性能指数, deep seek v 四 pro 打到了五十二分,跟千万 max 和 g l m 五点一一个水平,但它的价格是 kimi 的 五分之一, g p t 的 十八分之一,这个性价比没有对手。 而且还有更夸张的,智普的 glm 四点七 flash api 调用完全免费零元,不是本地部署免费,是你调它的云端 api 就 不收钱。当然,它是轻量模型,跑日常对话和简单任务绰绰有余。 算几个实际场景,你就知道这意味着什么。用 deepseek v 四 pro 写一个中型代码项目总共不到三块钱,写一部十万字的小说九毛钱。 如果你跑 agent, 做多轮任务,缓存命中只要两分钱,每百万 token 多轮调用的成本几乎为零。 为什么能这么便宜?本质就一个原因,开源模型在倒逼整个行业降价。 deepsea 开源了 v 三和 r 一, 小米 miimo 开源自部署,成本为零,千万也在全面开源。当开源的性能追上 b 源 api, 价格就只有一个方向,往下打。 最后给一个实操建议,如果你现在想用大模型干活,不管是写代码、做 agent 还是做内容,最简单的方案就是直接用 deepsea 的 api 注册就能用,按量付费,模型能力足够强,成本低到可以忽略。对大多数人来说, ai 的 壁垒已经不是模型了,而是你拿它做什么应用。关注星探 ai, 明天见!

为什么我给粉丝做本地大模型,硬件只推 max studio? 选它从不是看颜值,是它跑 ai 的 硬实力。 m 系列芯片加统一内存架构,说白了就是别的机器跑大模型,又要外接显卡,又要折腾散热,甚至得专门腾地方。 max studio 往桌上一放就能用。安安静静跑模型,二十四小时不间断工作,甚至连风扇声都听不见。功耗低,性能稳,体积小,部署起来省心太多了。 这套方案刚给一个医美老板配了两台,他把销售订单、采购记录、库存数据、直播数据、员工信息全部喂进去。平时在手机上直接问, 帮我分析一下最近的销售订单,这个月业绩比上个月有什么变化,员工绩效怎么分配更合理?整理一版逼单话术给我,全在这台 max studio 上,跑不掉任何外部, a p i, 不 花一分钱偷坑费。最主要的是,本地部署后, 所有私有化存储,不上传云端客户信息,订单数据牢牢掌握在自己手里,锁在他自己的设备里,谁也拿不走,根本不用担心泄露硬件。你的模型,你的数据,你的能力,你的,你是老板,不是租客。 报价我打好, c 格我写好, max studio 配好直接寄收到之后有工程师一对一陪你跑通。你拿到的是整套解决方案,不是一台冷冰冰的机器。想自己养 ai 部门的老板在评论区扣方案。

大模型必须训几百亿参数,调几十张卡。二零二六年鼎会里大量录用的工作,根本不是从零训模型,而是在开源的拉玛困上做小手术。七哥今天直接给你三条大模型发论文的降维路径。 第一条,别训模型,只做垂直领域微调,去开源社区下载拉玛三或昆纳二的权重,用 lara 或 q lara 在 你的专业数据上微调法律文书,再要医疗问诊、生成代码补全都行。 你只需要几千条标注数据,一张四零九零跑两天,就能训出一个比通用大模型更准的垂直模型。把通用模型 vs 你 的微调模型做对比,实验精度涨了就是创新点。 第二条,不改架构,只改推理策略。微调太常规,就做推理优化, cut two two、 self consistency 这些策略,你把它移植到你的任务上,基线 vs qt vs two t。 只要推理策略让准确率提升,你就可以写首次将推理策略应用于任务二零二五年 a、 c、 l 上大量收入这类工作。 第三条,不做深沉做评估与对齐。大模型怎么评估,怎么对齐?人类偏好是二零二六年的学术热点,设计一套评估指标,或用 r、 l、 h、 f 做偏好对齐,对比几种对齐方法 在你的任务上的效果。跑几天就能出数据,发大模型 s、 c、 i 拼的不是谁卡多,是你会不会借力发论文。但很多同学卡在第一步,不知道选哪个开源模型,不会设计对比实验,写不出审稿人认可的创新点。这三条路径的具体操作、论文结构拆解和审稿人话术,我都整理在 ai 科研论文缝合大法里了,评论区扣大模型,七哥安排。

家人们,今天我们聊一个这几天超火的新名词, token, 中文名叫词源。我们用最简单、最接地气的方式聊清楚什么是 token, 它是干什么的,有什么价值。聊完我们去运动跑步。 首先,什么是 token? 简单地说,就是 ai 算账和收费的单位。你问 ai 一 句话, ai 回你一段话,都是按 token 算的, 字越多, token 越多,成本就越高。原理是什么呢?你的请求输入数据,系统 服务器启动 gpu 开始计算,电力币被消耗,算力被使用,最后生成答案。整个过程就是算力到电力到智能服务, token 都是这些算力生产出来的。算力的背后就是电, 训练一次大模型,耗电量大到吓人,后期天天推理天天用,更是无底洞。所以谁有电,谁电便宜,谁就能玩转 ai。 这时候,咱们国家的东数西算就起到了大作用。 东部数据多,需求大,但电费贵。西部分电、光伏、水电充足,电价低。国家把算力中心往西部建,用西部的绿电带东部的数据,直接把大模型的成本打下来。应从 ai 从聊天机器人 进化到智能体以后,全球开发者发现,美国的大模型的成本使用太高了。在今年年初 openclos 这类开源智能体框架爆火之前, ai 对 大多数人来说只是个聊天工具,你问一句,他回一句, 单次交互消耗几千个 token, 每月就二十美元的费用,大家还能轻松承担。而现在, ai 已经进化成能承担工作的全自动化数字员工你给一个指令,它能在后台运行几个小时,单次任务 从几千飙升到几百万,这种消耗量对开发者来说简直就是财务黑洞。如果调用美国头部模型,每百万 token 的 输出价格约为二十五美元,输入也要五美元。 一旦让 ai 全天候自动运行,一个月的账单轻松突破上万美元。而我国大模型凭借好用又便宜的双重优势,成了硅谷开发者的首选,我们的价格是美国二十分之一, 这种极致的性价比,让全球的开发者集体倒戈我国的大模型。所以大模型比拼到最后,拼的是电力规模、电力成本、电网调度能力。而这些正好是我国的强项。我们的发电量世界第一, 装绿电装机量世界第一,特高压电网独一份, 东数西算,又把算力和电力完美结合。我国去年发电量是十点四万亿度电,什么水平呢?接近 美国加印度、加日本,加欧盟加俄罗斯,妥妥的电力帝国。 之前我们从出口衣服、家电、玩具,到这几年出口电动车、 锂电池,拿下个十年, token 成为我们最具爆发的数字。出口不需要海运,不需要受贸易壁垒限制, 却能将我国的算力、算法和能源优势直接转化为服务贸易收入。换句话说,我们正将我们的电力通过 token 卖向全球。那问题来了,我们最终卖了多少钱呢? 这个账我们来算一下,一度电约为三百六十万焦耳,在 ai 推理的情况下,一块 gpu 生成一个 token, 大 约消耗零点三九焦耳,除去损耗, 保守计算可以至少生成五百五十万个 token。 再看我们的大模型 deepsec, 一 百万个 token 收费 二元人民币,那五百五十万个 token 收费就是十一元,相当于一度电卖了十一元。如果纯卖电,一度电只能卖到五毛左右,如果进到算力再到 token, 一 度电就可以卖到十一元,这还是充分竞争后的价格, 电力价值被放大二十倍以上。这就是为什么我们都在疯狂地建设数据中心。之前类似的就是比特币,我们用便宜的店生产比特币,再卖向全球店,没有出国,但以另外一种形式以高价值卖出去了。 过去是矿机加比特币,现在是 gpu 加 ai, 过去是生产数字资产,现在是生产智能。逻辑是一样的。 看到这个,我们现在新能源的生态光伏加分电加电网加数据中心,形成一个新的形态,算电协通,把新能源的波动用算力中心吸收进去,这样我们就可以通过生产出的 token 被全球消费, 也可以说中国的分店和光伏被全球消费,成为最抢手的资源。所以最后的结论很简单, ai 的 尽头是算力,算力的尽头是电力,电力的尽头是中国,我们的新能源发展有大有前途。

好,大家好,今天我们来聊一下从奥拉玛上面下载一个模型,下载这个模型的话,我们能不能说也对它进行一个微调,让它能够识别我们公司的一个实有的一个业务数据。 我们先看一下,这是我们传统的一个界面,那么像像这个数据概括这一边呢?像这个表格,然后这个多条件查询,那么这个是我们很传统的一个查询的方式吗? 那么现在有了人工智能之后呢?我们可以做一个什么事情呢?就比如说我现在这个地方要加加增加这么一个界面,一个界面,然后我在这里同样的输入,呃,购买了什么东西, 花了多少钱?那么这种呢,就是调用了在奥拉玛下面 这个工具部署的一个千万七币的一个模型,然后进行一个查询。那么这种方式呢,就是说跟以前我们传统的方式有一个根本上的一个思维的一个变化,我们传统的一个一种类似于我们的呃, e r p 系统啊,类似我们传统的 e r p 系统的话,都是这种表格,然后加一个搜索,然后加一个导出嘛?那我们现在有了那个智能体之后,那么同样的一个查询,然后导出,我可以通过一个问答的方式跟他完成。 那我们之前的话我们聊了,用 bug 模型啊,用那个 g b t 模型啊等等进行一个微调,又改变他的一些参数,然后再通过训练级进行一个 训练,然后让它能够识别我们公司的一个业务数据。我们先回到今天的一个主题上,就我怎么样用一个 alamo 的 一个模型,然后进行一个微调呢?这里的话我提供了两个思路, 就第一种就是我们用 alamo 下载了那模型之后,然后通过下单库的方式嘛。第二种呢就是通过 alamo 的 模型下载了之后呢,通过创建一个基础的一个模型,然后划分训练级、验证级,然后 给它生成一个新的一个模型。嗯,我先给大家说一下一个,如果大家有兴趣自己去做的话,他的思路是这样的,首先我们要出实化一个微调的器,这个呢就 写他这个模型名称啊,模型的一些呃链接等等参数设置好了之后,我们要加载我们的一个准备训练的一个业务数据。 加载了之后呢,我们最重要的是说构建那个训练级跟那个验证级,这里我可以做个转换,这个这个不是,这个是可选的,我们不看了。然后下一步是必须的,就是划分一个验证级跟测那个测试 训练级跟那个验证级。然后这里我们需要设一个随机的一个种子,然后就要进行一个随机的一个打乱吗?那打乱的话我们这里要固定,不然每次打乱都不一样,训练出来的效那个效果我们很难评估。然后这里呢就进行一个 啊分割,然后划分一个训练级跟一个测试级,这里就完成了数据的划分。然后呢再把保存训练级、验证级的一个追溯的一个文件,然后保存起来,然后我们要创建一个用于微调的一个模型的一个文件, 这里就这里是,这里是那个提示词,这里是创建那个文件,然后下面就设一个训练的一个参数,还有它停止的一个标记,要不然它永远不会停止。这里弄完了之后,我们这里需要写一个微调的一个命令,我们,嗯, 这里有一个关键的点,就是我们需要执行利用这个工具,然后执行一个模型的一个微调,这个方式的话,我自己其实更倾向于用那个,呃, bot 模型加那个,更倾向于这种方式吧? ok, 大家看一下, 我其实我更倾向于利用那个。 嗯,算了,先先,今天先不看了,我们先往下面走,就是刚才讲那个思路呢?也可以。 然后奥拉玛的话,它的常用的一些命令的话是比如说,呃,奥拉玛 run 啊,运行这个模型啊,奥拉玛 push 啊,下载模型啊,奥拉玛历史啊,查看模型的列表,然后奥拉玛创建一个模型,就是我们本质上的话就是用创建一个新的模型嘛,训练好的一个新的模型就用到这个命令, 好到晚上的话就是模型的一个微调跟它的神经网络层。然后呃配置式的一个微调呢, 就是奥莱马的一个微调,它是一个轻量级而且比较容易使用的一个方式啊,它定义了一个模型文件,就允许用户直接定义模型的一些行为啊,预设的一些提示词啊,还有关键的运行参数啊, 就是主要是做这个就定义模型的一个行为提示词,还有运行的参数。然后它的微调的话是用的 l r a 这个技术,然后大模型它是由那个神经网络组成的嘛?那我们在 直接更新的权重的话,这个是很难的,因为他有小最小的这个模型,七 b 的 话这里都有四个 g, 我 们全部更新他的呃权重 w 和偏置 b 的 话还是比较麻烦的,而且还可能训练的不好,算力很高,要求特别高了。 然后我们这里就用一个低置适配的一个方案,他就是不再修改原有的一个很大的一个权重了,然后在旁边生成两个比较小的一个低置的一个矩阵,然后参数量呢就缩减很多,然后实现一个低成本的一个微调嘛。 然后奥拉玛系统的话是支持 l r a 适配的一个适配器的,就我们不需要再关心那个非常呃复杂的一个训练的一些逻辑,我们直接就是 直接就运行集成了 l i a 能力的一个特警领域的一个模型,就可以使用它微调号的一个专业的能力,它整体的逻辑就是这样。好,今天的分享就到这。

抛开出海,最近火到离谱,有人倒腾 a p i 月入百万,有人骂这个是新瓶装旧酒,自己的算力还不够,出什么海。还有人说店里出海,听着像概念炒作。 今天我们不站队这期视频就把这两个最狠的质疑来拆开聊,只有看懂质疑,才能抓住真金白银的红利。好,先看一组反常识的数据。根据 openroot 平台,这个是一个聚合了全球两百多个模型的 api 市场, 他显示,五月最新一周,中国模型的调用量飙升到了九点四万亿头,粗略算一下,相当于是每天一点一万亿,是美国模型的二点四倍,而排名前五的模型里,中国占了四个。 那虽然这个平台本身只占全球投客流量的一小部分,但是呢,它是价格最敏感,开发者最活跃的一个风向标。那从这里你也能看出来了,算力明明不够,调用量却反超了,这个辩论怎么破?答案就一个字,分。 训练和推理根本不是一回事。 ai 训练可以打个比方,像是造发动机,它可能一次性的去砸钱,堆卡烧电。而 ai 推理,我举个可能不是很恰当的比喻,它就像是你跑滴滴, 那你车买了,每天烧多少油,接多少单,赚多少钱,这个才是日常。那我们在 ai 训练这件事上确实还在努力追赶,但是说到跑滴滴这件事,我们突然发现,成本我们可能比别人低至十倍。 那你可能要问为什么?为什么偏偏是中国抓住了推理的窗口?有三个优势,环环相扣,却一个都不行。第一个就是电, 那西部的绿电两三毛一度,而欧美一度电的钱在这里可能可以买到三到六度电,而推理成本里,我们知道电费是占大头的。那第二个就是算法, 像 deepsea 的 mo e 架构,简单说它就是该用大力时用大力,该省算力时省算力,结果就是同一个任务,算力消耗可能就降到了原来的十分之一。第三个就是心魔咬合, 那以前模型和芯片是两层皮,可能模型做出来,那你的芯片能不能跑?或者说跑的效果怎么样,要看具体的情况。而现在 deepsea v 四发布的当天呢? 八加国产芯片呢?同时就适配了,这个不是说能跑就行,而是他们在研发阶段就一起干,在底层可以深度的咬合。你看电便宜,算法给力,芯片咬的紧,那这三个撑起来,才实现了那个恐怖的数字 综合推理成本做到了海外的十分之一。好,现在再来拆。第二个质疑。最近行业里流传一张图,是某个国产 gpu 公司拆解了一座数据中心的账单, gpu 占了百分之四十五,电力不到 百分之十。于是就有人说,你看,算力才是核心,电力在数据成本中的占比根本没有这么高,所谓的电力出海,根本就是炒作。 没错,这个数据本身是真实的。不过我们要注意一下,这张图回答的是说建一个数据中心,大头花在哪?而数据中心投产之后,每天的运营成本中,电力就占了百分之五十到百分之七十,也就是说,一个是建设需要花的钱, 一个是刨起来的钱,那分母不一样,答案当然不一样了。好,这两个之一拆解完了之后呢?我们究竟该如何看懂投垦出海这件事呢? 其实 token 出海是四层生意,从轻到重,从虚到实。首先第一层就是卖模型,像 deepsafe, mini max, 还有 kimi、 智浦,他们直接是把 api 卖给海外开发者,这个相当于是轻资产出海,靠代码去实现全球发货。 第二层呢,就是卖算力,像阿里云、腾讯云在海外建数据中心,这个是重资产出海。那当然也有轻的,像九章云集、林克志华这些智算服务商,他们卖的是调度系统还有运营能力, 也就是说帮别人去管算力,而自己不背资产。那第三层他们卖的是聚合能力, 就像 openroot 这种模式,它是向上游去采购各家的模型,下游打包成统一的接口,赚的可以说是路由费,简单说也可以把它理解成是模型界的携程。那到了第四层就是物理 toc 工厂, 这个是目前最前沿也是最硬核的,像在汕头这种有海上风电,有跨境光缆的地方,去建专用的数据中心,电进来偷看出去,把能源优势直接锁死在出口里 那所以回到最初的问题,偷看出海究竟是不是伪命题,数据在跑,模式在跑,钱在赚,你说是还是不是呢? 最后我想引用一位从业者的话, made in china 时代,我们向全球输出商品,而到了 ai 时代,我们可以输出 token, 实现 ai made in china, 让中国成为世界的 token 工厂,这个是中国能够给世界人工智能发展带来的独特价值。好,关注董欣,看懂 ai 背后核心价值,下期见。