粉丝10.7万获赞499.4万

前面的几期视频,我们聊了奥拉玛的相关技术,并在奥拉玛中安装了大模型。今天的话,我们来看一下如何在 openclaw 里面来连接奥拉玛里面的大模型。首先的话我们打开命令提示符。 好,首先的话我们先看一下 openclaw。 好, 这里安装的是二零二六五点幺二。接下来的话,我们看一下奥拉玛 奥利码的版本是零点二四点零,我们看一下奥利码里面安装了哪些大模型, 这里我安装的是天文三八 b。 接下来的话,我们来看一下我们安装的大模型是否支持在其他工具里面来进行调用奥利码 show, 然后我们把这个大模型的名称给它拷贝过来。 好,我们粘贴一下。好,敲回车。好,这里的话我们要看一下那个 capabilities 里面有没有这个 tools, 如果有的话,我们在那个 openclaw 里面就可以直接调用了。 如果没有这个 tools 的 话,大模型是不支持在 openclaw 里面来进行调用的,那么我们使用之前的话,我们先通过奥拉玛秀,然后加上那个大模型的名称,我们看一下有没有 tools, 有 的话我们就可以在 openclaw 里面进行调用了。好,接下来的话我们给它配置 openclaw。 openclaw 好, 敲回车, 这里的话我们选择 local 这一项,这里的话我们选择 mod 这一项。好,这里的话我们选择木,然后我们来找到那个奥利码。 好,在这里。好,我们敲回车。好,这里的话我们就用本地的奥利码就可以了,我们选择最后这一项 local on 这一项。好,那么奥利码的那个本地的这一个地址的话,就是默认的这一个,我们敲回车。 好,经过一段时间的等待的话,我们已经找到那个我们安装的这一个大模型,那么我们选择那个奥乐玛下面的千万三八 b, 这里好,往下面移动,然后我们在那个呃千万三上面我们敲一下空格,选中,然后我们敲回车, 好,这里的话我们选择那个 down, 就是 我们已经设置完成了,我们退出来。好,接下来的话我们把网关给它启动起来, open close get away run, 好, 我们的网关已经启动完成了,我们通过命令行来打开 open close dashboard。 好,那 openclock 已经打开了,我们把这里关闭掉,然后我们选择一下我们的模型,这个是我们通过奥拉玛在本地安装的大模型,请问三八 b, 然后我们选择一下,然后我们来跟它对话。 好,到这里的话,我们用 openclock 连接本地的大模型就已经成功了,那么我们在使用之前的话,首先要安装那个奥拉玛,奥拉玛安装完了的话,我们要下载那个对应的大模型, 那么我们使用之前的话,首先要把那个奥利码给它启动起来,有没有启动的话,我们看一下就是那个右下角这里有没有这一个图标,那么这个是奥利码的图标, 那么启动完了的话,我们要看一下我们下载的大模型有没有那个 toos 的 功能,如果有的话,我们就可以在那个 openclaw 里面来使用,如果没有的话,我们就要换一个版本再来进行使用,那么这个就是在那个 openclaw 里面连接本地大模型的一个简单的步骤。

想养一只龙虾,太烧 tokens 怎么能省钱?这里六个实操技巧立竿见影!首先第一点,降低心跳频率,默认五分钟就调用一次,改成三十分钟, 单这招就让空闲挂机降低八十个百分点的基础消耗那。第二点,经典系统提示词,删掉荣誉描述,每次调用的都能下降约八千的 tokens 开销 啊!第三点,限制上下文长度,并定期清绘画,避免历史对话堆积。第四点,重度用户一定要起用 qmedd, 用本地语义搜索替代大段权威注目,然后又快又稳省。 第五点,多 agent 分 工协助,各司其职,杀机不用牛刀,整体成本再降二十五个百分点啊!第六点,性价比替换,要么就是换便宜的 api 接口,要么就是换 nano boot 这类清亮容下 功能够用,还能直接把单次调用成本砍半。这六招搭配用的话, open core 整体使用成本能降五十到九十个百分点。大家还有什么好妙招,就评论区一起交流。

你是不是经常看到这几个字已消耗三千两百八十五 tokens 模型上下文一百二十八 k tokens api 价格,每一 k tokens 零点零零二元。 token, token, token! 到底什么是 token? 今天一分钟说清楚。 翻译通俗点就一句话, token 是 ai 认识世界的最小单位,你读中文最小单位是字, ai 读语言,最小单位就是 token。 大 概什么概念呢?中文里一个 token 等于一到一点五个汉字,你写一篇一千字的文章, ai 就 要处理一千个 token, 就这么简单。知道这个概念有什么用?三个用处,第一,算钱,每个 ai 工具背后都是按 toon 计费的,免费工具也有成本,只是平台帮你扛了。 你用 api 的 话,每一千个 toon 几厘钱,积少成多。第二,管容量,每个模型能处理的 toon 是 有限度的, gbt 一 次最多一百二十八 k, deepsafe 一 次最多一百万,超过这个量, ai 就 记不住了。所以你跟 ai 聊天,聊到后面,他开始忘事,不是他傻了,是你把他的内存撑满了。第三,省成本,同一个意思,五十个 token 能说明白?别用两百个 token 绕来绕去, 不是 ai 听不懂,是你的钱包扛不住。说个真实数字,小王老师一个月消耗的拓客量大概五百万到一千万,如果全部走付费, a p i 一个月光拓客费就上千。所以省钱的办法就一条,提知识点精一点,废话少一点。最后说个冷知识, 你现在听到的这条视频,如果让 ai 来算,大概已经用了八百多个头克,包括这个句号,我是小王老师,关注我每天拆一个 ai 知识点,明天见,记得关注再走哦!

ai 领域常说的 tokens 到底是什么意思?这个视频彻底给你讲清楚。 token 是 ai 大 模型处理文本的最小单位,也是 ai 大 模型的最小计费单位。 一个汉字,一个单词,一个标点符号都是一个 token。 一 段文本会被大模型分成多个 token, 我 们称之为分词。不同的大模型会有不同的分词方式。以 gpt 五为例, how are you 被分成四个 token, 三个单词加一个问号,这是 gpt 五的计费表格。注意,这是每百万个 token 对 应的价格。你可以算算向 gpt 五输入这么一句话需要多少钱。 我们再看看中文如何分词。黄仁勋是我表舅,这句话被分成了九个头肯。明明七个字,怎么就九个头肯呢?这是因为常见汉字在训练语料中出现频率较高,被完整收入进词表向我表示,黄仁这五个字,一个字对应一个头肯, 而就勋这两个字在训练语料中出现频率较低,每个字被拆分成了两个 token, 这些加起来刚好九个 token。 而且那些更不常见的汉字,一个字会被拆分成三个 token。 有 人就又问了,我用豆包 deep sync 元宝也没收费啊? 注意,你用的不论是 app 还是网页端,它们本质上都是 agent, 用户与 agent 交互,而 agent 调用大模型, agent 调用大模型必然消耗 tokens。 不 过这几个产品调用的都是自家的大模型, 而 agent 面向用户可以免费,也可以像拆拆 gpt 那 样分为免费订户和按月订阅收费用户。现在大火的 open call 也是, agent 只是调用哪个大门型需要自己配置,你如果调用服务商提供的大门型,就要按照所消耗的 tokens 付费。 当然,你如果调用的是自己部署的大门型,也会消耗 tokens, 但不计费就是了。最后,关注我,带你了解更多 ai 知识!

这几天有一个非常值得关注的新信号,中国电信、中国移动、中国联通三大电信运营商相近,面向西端推出了 token 套餐,那上海移动甚至是推出了一元四十万 tokens 的 套餐,而且呢,支持一个额度一个价格任选模型。那这是什么意思呢? 过去咱们买的流量套餐,比如说多少 g 流量,多少分钟通话,但是现在呢,运营商开始试水一种新的 token 套餐。也就是说,未来我们 呃在使用 ai 大 模型的时候,可能不再是单独的去买一个模型平台充值了,而是像买手机流量一样,直接买 token 额度。那这背后反映出来的是,三大运营商正在从过去的流量经营逐步转向 token 经营。 如果 token 算力套餐化这件事情跑通了,那它很可能会催生一批新的 ai 基础设施公司,这也说明 token 经济正在加速进入下一个新的阶段。当前市场正处于一个非常关键的窗口期。从过去的算力租赁逐步上 token 工厂, toker 运营商切换,为什么焦点会开始转移呢?从商业逻辑来看,焦点有望逐步的导导到 toker 工厂以及 toker 运营商。核心原因呢,主要有三个。第一个原因呢,是商业模式升级带来的估值重供。 那过去的算力租赁本质上更像是出租 gpu 服务器,收固定的租金,那这种模式 虽然现金有稳定,但估值通常不会特别高,一般呢就是给到十几个 p e 来定价。但是 token 工厂不一样, token 工厂可 不是简单的出租机器,而是把算力模型推理优化、 api 调用能力整合起来,最后按照用量分成,那 token 工厂的毛利率可以达到百分之五十以上,并且具备更强的平台属性 以及技术含量,因此呢,它有机会享受更高的 ps 估值。那第二个原因是海外已经开始有验证了。 那海外现在呢,已经出现了几个非常典型的对标公司,比如 callif, 它呢,主要代表的是算力租赁模式, 也是通过大量的 gpu 资源为客户提供算力服务,市场已经给了他比较高的定价啊。再比如 nebules, 它呢,原本也是和算力服务相关的,但是 现在通过收购 egen ai 啊,强化推理优化能力,开始向 token 工厂方向转型。还有 together ai, 它也是 token 工厂方向的重要代表。那 openroot 更像是 token 运营商,它把很多的模型把它聚合起来,让用户可以通过统一的入口调用不同的大模型。 openroot 最新一轮的估值大概去到十三亿美元。 这说明呢,在海外市场,算力租赁、 tok 工厂、 tok 运营商这三类角色已经开始逐渐形成比较清晰的产业路径。那第三个原因呢,是国内催化剂开始密集出现。 从五月以来,国内出现了很多起重要事件,比如说最近这几天运营商推出的 tok 套餐啊,中国电信启动一百七十四亿 tok 工厂集彩, 无锡建设、华为升腾 token 工厂,建润股份,以和字节签订 token 分 成合同。那这些呢,说明 token 你 不仅仅是概念,而是从这个预期走向落地。 也就是说,市场过去关注的是谁有 gpu, 谁能够出租算力,但是接下来市场会更加关注,谁能够把算力变成 token 服务,谁能够把 token 服务卖出去,谁能够形成平台化的入口? 接下来我们看海内外的对标。那第一类是 i d c 公司,海外的代表企业有 equineous, digital wallet 啊,还有万国数据。这这类公司的核心特征是大规模数据中心运营,长期稳定租金收入,那 重资产属性非常明显。国内的对标企业包括润泽科技,万国数据,四季互联啊,数据港,官邸,新网,还有大卫科技。那这些公司呢,更偏向传统的 idc 以及数据中心运营。主要逻辑是数据中心资源啊,机房机柜, 电力和网络基础设施。那第二类呢?是第二类呢,是算力租赁公司。海外代表企业包括 call with nebules, 还有 apply digital。 算力租赁,这一类公司的核心特征是裸 gpu 租赁,通常呢要签三到五年的合同,这种资产属性非常强。 呃,行业格局非常集中。那国内对标企业包括协创数据,红景科技、利通电子、节创智能,那这类公司呢,目前主要还是围绕算力资源、服务器、机房、客户订单和租赁模式展开。那第三类呢,是 token 工厂,也就是重资产生产端。那还会代表企业包括 knabels, together ai, firework ai 以及 call with。 这里要注意的是, call with 虽然呢起点是算力租赁,但是它也可以往 token 工厂方向延伸,所以我很看好它好。 together ai 呢,是 token 工厂的重要代表, 那 token 工厂呢?这类公司的核心特征是自己有算力,同时呢跟模型公司来进行分成, token 的 比例分成大概是三比七,八比二,也就是说它不是单纯的出租 gpu, 而是呢, 利用这个收入分成,这类公司的毛利率可以达到百分之五十。种技术壁垒,种这个推理优化能力,种平台的交付能力。国内对标企业包括润健股份、品质信息、红杏电子、 呃,商汤软件、云天利飞。其中呢?尤其是润健,它的 token 工厂模式是率先落地。那第四类呢?是 token 运营商,也就是轻资产聚合平台。 海外的代表企业主要有 openroot。 那 它是全球最大的 token 运营平台,它的 a p i 接入了所有的主流模型,并且采用 按照充值金额收取百分之五点五平台费的模式。啊, token 运营商的核心特征呢,是不自持算力,主要是做分发聚合和技术路由服务。那这种模式是轻资产,高成长,更适合 ps 估值。那国内目前呢,还没有对标的 企业。国内更接近的角色包括华盛天成、力昂技术以及一点天下未来呢?呃,这个运营商 mars 平台,以及阿里的 a t h。 呃,电信的 token hop 可能会承担一部分 token 运营商的角色。 那为什么这件事情值得大家重视?因为它背后其实代表的是 ai 基础设施商业模式的变化。 那第一个阶段呢?市场关注的是 idc, 谁有数据中心,谁有机柜,谁有电力,谁就有价值。那第二阶段呢?市场关注的是算力租赁,谁有 gpu, 谁能够拿到英伟达的芯片,谁就能够签下大客户,谁就有价值。 那第三阶段呢?市场开始关注 token 工厂,也就是谁能够把 gpu 算力服务、模型推理优化、 api 调用 整合起来,按 token 用量来赚钱。那第四个阶段呢,就是 token 运营商,也就是谁能够啊,成为 ai 调用的入口,谁能够聚合更多的模型,谁拥有更强的分发能力,谁就有可能成为 token 经济时代的 平台型公司。所以呢,这不是简单的算力故事,而是从卖算力到卖 token, 从租机器到运营 ai 流量的变化。 我们来总结一下,三大运营商推出 token 套餐呢,不仅是一个简单的新业务,而是 ai 基础设施商业化模式的变化信号。那过去我们看的是 idc, 看的是机柜,看的是 gpu 租赁,那接下来呢?市场可能会越来越关注 token 工厂以及 token 运营商, token 工厂负责把算力加工成 ai 调用服务,而 token 运营商负责把不同模型和 token 能力聚合起来,卖给开发者、企业以及 c 端用户。 当 ai 调用像手机流量一样被套餐化之后,谁掌握 token 生产力,谁掌握 token 分 发入口,谁就有可能在下一轮 ai 基础设施重估中占核心地位。 那所以呢,当前正处于算力租赁一项 token 工厂 token 运营商切换的初期窗口,那这一轮变化值得 我们持续,最终大家可以重点关注具备大厂绑定能力啊,推理优化能力的 token 工厂,以及具备平台化潜力的 token 运营商。以上就是本期的所有内容,我是派我们下期继续聊。

ai 大 师智能交易分析系统,给大家介绍一下我们前的这个多一症的架构啊。呃,第一个就是 ceo, ceo 它主要作用就是做调度,然后新闻行业和个股他们仨是研究团队的人, 然后接下来短线和长线他们又配有不同的这种 red 的 知识库和 lm 的 知识库, vk 的 知识库,然后他们去做一些对应的个策略,然后交易员主要就是选标的,查实时价格, 然后算仓位,然后给建议,然后军师和三眼乌鸦呢?军师主要就是一些各种各样的大师的这种语料,他就学习,学习之后去做一些研判。三眼乌鸦主要就是做这种盘后的一个复盘, 然后最终交易员军事和三眼乌鸦的内容会给到这个投资经理,然后做最后的一个决策。好交易记录员主要就是记录一些交易的内容,放到数据库里面模拟进行一个执行。好量化程序员的话就是做数据的一个清晰和 qmt 接口的一个接入,然后这个就是目前核心的一个工作流,就是刚提到的 啊这个新闻行业和各股分析,其实他们都会通过一定的规则去触发啊一个信号,然后给到一个信号的聚合引擎, 然后再由这个短线和长线的策略员根据这个信号引擎去执行最终的一个策略来策略执行,执行完之后生成一个交易计划, 然后交易计划会给到就是军事和三眼乌鸦他们是双盲的一个研判,他们各自发表一些观点,然后给到投资经理,投资经理根据他俩的观点,然后还有自己的一些观点,一起做一个最终的交易记录, 然后教育机构员去更新这个持仓库和复盘库,然后以及给到这个量化交易员去做 qmt 的 一个模拟。然后这就是一些定时任务,这个就是大概目前我当前做的这个 hermes 啊多 a 诊特的 ai 交易的这个系统。

最近啊,那个 a p i 中投上炒的火热,然后关于合规性呢?也就说说,很多人说赚钱能赚很多啊。其实啊,你没有什么下游的啊,没站点的这一块我建议你别去碰。

前面呢也发了一个视频,讲这个怎么从这个 in video 平台里面去调用这个免费的模型,可以利用这个 workbody 去进行一个批量测试,然后呢嗯,再返回它那个 平均值,这样能够列出前十个这个模型的一个反应时间这样子一个方法。那么首先呢,我们去给那个呃平台里面去获得一个 api key, 有 了 key 之后呢,我们就一起发给这个 workbody, 我们先借一下啊,然后就直接复复制给他。因为这个平台里面有一百接近一百五十个那个模型嘛,所以它运行起来会比较慢一点, 我在运行的时候中间其实是卡死了啊,卡死了以后呢,我就给它停掉了,我停止了运行,然后把它改为了每个模型这个让它测一次,希望能够快一点 啊,最后结果出来了啊,我们能看到他这里列了一个清单,就是排名前十的那个响应比较快的这个模型的名称 啊,这里有这个平均的响应的时间,然后他说一百三十三个模型里面仅有五十八个可以正常访问。所以说为什么大部分的这个朋友啊,就说选中的模型就说连不上,就是说太慢的原因。 那么我们可以从这个这个模型就进行一个测试啊,看它到底效果怎么样。 我们把这个模型就配置到这个前面里面,前面视频说过的这个代理路由器里面去测试一下,没问题。然后呢再到那个 cc switch 里面,把这个模型再添加到这个里面去啊,这里都给它改掉。 好,这样的话就啊基本上就可以了,我们保,我们保证这个服那个代理服务器在后台运行,然后在这里输入这个 cloud 命令,然后看一下它的这个一个详情时间,这里模型已经改掉了啊,改成这个 mr smile 那 个模型, 然后你看他反应是很快的啊,他说是只有一秒钟时间 啊,这里他用了三秒应该还可以。那这样的就是交互啊,就说基本上可以用,而且这个模型也是比较比较新的。 我再问他是什么模型啊?这模型还可以啊,那么通过这样的方法啊,我们结合物理量平台里面最快的一个模型。

在这个人人都要为 token 买单的时代,你见过 token 长什么样吗?今天呢,我们不聊虚的,直接把它下载下来,一起看看这个神秘的 token 到底长什么样。为了好理解,你可以把每一个 token 想象成一本魔法书,封面就是对应的字或词语。比如苹果 hello 这类 书,里面则是机器才能读懂的一长串神秘数字。像 deepsea 里,每串数字足足有七千一百六十八个,打印出来能铺满十五张 a 四纸,而整个 deepsea 有 超过十二万份这样的 token。 这么多 token 怎么精准查找?很简单,模型会给每一个 token 编上专属 id, 就 像书本编号,只要按 id 解锁,就能瞬间调取出来。 今天咱们就拆开看一看 token 里面到底藏着什么内容,咱们直接实操。 deep secret 是 开源模型,词表文件可以从官方代码库直接下载到本地, 打开文件搜索关键词,就能看到全部记录。一共一万二千九百二十八个 token, 前三个是特殊标记,分别代表句子开头、句子结尾和空白填充 感叹号 id 是 三,数字零的 id 是 十八, hello 的 id 是 三三三幺零。但有意思的是,直接搜中文,苹果却找不到。这也是很多人容易蒙的地方, 因为 ai 底层根本不认识完整汉字,只识别原始字节,相当于 ai 世界的最小原子。一个汉字通常由三个字节拼接而成,苹果各自对应一组字节编码,所以在词表里,苹果是以字节组合形式存在, 搜这串编码才能查到它的 id 是 幺九四幺六。这种设计好处特别大,不管是生僻字、生僻符号,还是换行这类看不见的字母,都能用字节自由拼接组合,任何文字都能被 ai 识别解析。 要注意的是,这份词表只是解锁目录,相当于图书馆的缩影系统,只有编号和名称,并没有 token 真正的核心内容, 真正的关键藏在另一个五点二三 g 的 向量文件里,大小堪比一部高清电影,需要用程序才能读取,咱们用苹果的 id 幺九四幺六就能取出它的嵌入向量,整整七千一百六十八个数字, 每一个数字都代表一项特征,强弱、颜色属性、能不能吃、常见程度、情感倾向全都包含在内。 ai 就是 靠这组数字读懂文字,理解抽象语义。更有趣的是,用余弦相似度算法,还能算出不同 token 之间的关联度。 苹果和梨相似度很高,同属水果,苹果和手机相似度也不低。受苹果手机关联影响,苹果和电话关联就很弱,梨和电话更是几乎毫无关系。我们虽然没法精准拆解每一个数字的含义,但组合在一起就形成了完整的语义逻辑 词。嵌入向量一旦生成,就跳出了人类的文字和图像认知,进入纯粹的数字世界,那里没有文字,没有画面,只有海量数字在流转。而 ai 就是 靠这些 token 推演文案,读懂人心深层万千内容。好了,以上就是本期视频的全部内容,关注我,和我一起探索 ai 的 奥秘!

黄人训,放狠话,不会用掏恨的人直接淘汰到底啥意思?歪普桑大白话,欢迎大家,我是徐院长。朋友们,最近科技圈彻底炸锅了,英伟达老板黄人训直接放出一句狠话,堪称给所有打工人敲了一记警钟, 说不会用掏坑的人,未来直接被淘汰。这话一出来,好多人第一反应都是蒙的,掏坑是啥?我一个普通的上班族跟这个玩意有啥关系?黄仁勋是不是有点危言耸听,故意制造焦虑? 今天我就用大白话给大家深度拆解透,听完你就知道这不是吓唬人,而是 ai 时代最残酷的生存法则。 首先先给大家把 tucker 讲明白,听着像高科技就害怕。说白了, tucker 就是 ai 的 口粮,是你使用 ai 工具调用算力的计量单位,你用拆的 gpt 写文案做方案,用 ai 做设计写代码, 甚至让 ai 帮你分析数据,整理工作,每一次操作,每一次对话都在消耗钞票。他就像你开车要烧油,手机要充电一样,是 ai 干活的核心成本,也是你使用 ai 能力的直接体现。黄仁迅为啥敢说这么狠的话?人家可不是随口说说, 背后是英伟达实打实的用人标准。他直接表态,一个年薪几十万美金的工程师,要是一年连一半薪资的 talk 都用不出来,那这个人在英伟达根本待不下去,完全跟不上时代。在他眼里, 不会用滔肯,不会高效使用 ai, 就 跟几十年前的会计不用 excel, 非要用纸笔做报表一样荒谬,完全是职场原始人。很多人觉得我又不是程序员,不是科技从业者,用不着 ai, 滔肯跟我没关系, 大错特错!现在早就不是 ai 可选的时代,而是 ai 必备的时代。 不管你是做文案、做设计、做销售,还是做行政、做运营,甚至是做自媒体、做小生意, 不会用 ai, 你 的工作效率就比别人差十倍百倍。黄仁训这句话本质上不是淘汰不会用 talk 的 人, 而是淘汰拒绝使用 ai, 拒绝跟上时代的人。以前职场拼的是学历、经验、加班时长,现在职场拼的是你能不能用好 ai 工具,能不能用 top 换效率换成果。你吭哧吭哧干一天,老板不淘汰你淘汰谁? 咱们普通人别觉得这事离自己很远。现在已经有大批公司开始效仿英伟达,把 ai 使用能力、 top 消耗情况纳入绩效考核, 不是让你乱花钱买套本,而是看你会不会用 ai 提升自己的价值。那些觉得 ai 没用,懒得学的人,慢慢就会发现自己的工作越来越容易被替代,薪资上不去,岗位还岌岌可危。最后给大家一句实在话, ai 时代没有稳定的工作,只有稳定的能力。学会用滔,肯,学会驾驭 ai, 不是 加分像,而是保命像,别等到被淘汰了才后悔。现在开始放下抵触去学 ai, 用 ai, 把 ai 变成自己的职场利器,才不会被这波时代浪潮拍在沙滩上。 你身边有没有人还在抵触 ai, 觉得 ai 会抢饭碗?评论区聊聊,咱们一起聊聊普通人该怎么快速上手 ai, 抓住这个时代的机会。此视频内容不涉及任何虚拟货币的推荐和交易,不涉及任何投资建议,只是做科普和政策解读。 想知道你的生意怎么对接 f 三点零可以找我,咱们聊聊。关注我,我是徐院长,我带你在 f 三时代弯道超车。

上海电信开始出幺蛾子了,现在推出了 talking 套餐,一块钱二十五万 talking, 九块九一千万 talking。 那 么 talking 是 什么呢? talking 是 计算能力,我们现在用的是流量,流量是字节,表示的是内容的多少。 目前的主流套餐单位是 g, 而 talking 是 计算能力。也就是说当你把一个问题提交上去之后,用的是流量。如果不经过计算处理的话,那就跟传统的搜索网站一样,你提交上去它给你一系列东西,但是经过计算处理之后,它给你的是一个答案。

养虾第二天开发这么一段需求,花了十二分钟,那开发完之后呢, 龙虾呢,给我了我一份变更清单,这里呢就是告诉我们它做了些什么事情,那我觉得呢,龙虾呢,它相当于是 deep sea 的 一个手脚,那 deep sea 呢,相当相当于是脑袋, 那给我感觉这两个的区别呢,就在于龙虾可以把生成的代码需求代码直接变,直接放到你的一个项目文件夹下面,不用像 dbc 一 样再用手动去 组装接代码。那首先呢,我们把这个安卓 studio 打开看一下,又随便找个文件 openin 进去文件目录下,加完类,看看刚才的变更清单里面是不是真的存在这些文件。看了一下,确实是的, 真的太强大了。那三个文件就是刚自己创建进去的,那我们肯定要先测一下功能。 呃,这个模拟器打开登进去之后,找到我们开发的这个页面, 进去之后呢,看到这个时间呢,可以直接选择挑选这个年份,增加了选择的一个效率,那年月呢?日月呢,也是可以选择的啊,这个满足需求了。再看一下使用部门,下拉也是 我命名的,资产名称也是我在需求里面命名好的,完全一致, ok, 非常棒。那开发这样一个需求,看看花了多少钱, 我充了个五块钱啊,尝了一下鲜,然后看看这里面我用的是 v 四 pro, v 四 pro 看看 这个需求消耗了多少个托克,一百七十多万,这些托克呢总共花费是六毛五分钱,那这样一个需求花费六毛五分钱,各位觉得值吗?如果对养虾感兴趣,评论区留言,下期出教程。

你是不是还在用线上 a p i 消耗 token, 不 仅消耗大,还不稳定,数据还要上传到云端,被别人当做参考资料。所以我做的这套本地 ai 大 模型,这一套的优势就在于,公司数据都在本地,不会 上传到云端,分享给别人,也不需要消耗 token, 更不会出现降智和幻觉的情况。这是我给浙江客户配置的本地大模型,主机,用的是 m r ultra 的 max studio, 用它的好处就是,六十四 g 的 内存 全部拿来当显存用,拿来跑三十五亿的大模型刚刚好。公司的订单、合同、报表都可以交给 ai, 哪些合同快到期,哪些品类目前是亏损状态,哪些 s k u 往年的销量最好, 都可以问他。你也不用学技术,我手把手教你怎么新建 skype, 怎么跟 ai 沟通,把它训练成你公司的专属 ai, 跟公司业务相关的词条都可以上传到本地大模型,建立企业私有知识库,图文、表格、网页他都认识,竞品的产品信息,往年的销量对比, 他能自动帮你整理成表格,告诉你主要的差异在哪里。几千篇图文,几万张表格,本地大模型分分钟都能帮你总结明白,这也是人力所做不到的。