粉丝99.9万获赞1237.3万

给大家看一下我这几天用 colossal 的 大概花了多少钱啊?首先说明一下, colossal 的 本身不需要收钱,但是调用模型的时候需要耗费 tokyo, 所以 模型的话需要花钱。 首先给大家看一下,我大概是五月二号充的十块钱,然后五一这几天也一直在用, 嗯,总共的话,我看了一下,我总共用的 tokens 的 话,大概用了三千多万 tokens, 那 么总共消费呢,也才四块四毛,所以说呢,还是比较划算的啊。在五一这几天我也一直做了好几个项目, 现在看一下,这,这都是五一在跑的一些项目,嗯,然后这也有这五一,五一这还跑了好几个项目, 然后,然后当时还做了一个类似 b 站的一个网站, 这大概就是我的 tokyo 的 一个花费情况。其实相对来说,目前国内的大模型还是还是很划算的啊。

朋友们,大新闻来了,谷歌四月初放了个大招, gemmas, 一个能跑在你手机上的开源大模型,不是云端那种,是真的可以本地运行,鼻线也能用的那种。今天咱们就来扒一扒这玩意到底有多香。 先说说他最骚的几个点,第一,本地运行,手机、电脑甚至互联网设备都能跑,没网没关系,照样用,数据隐私全在你自己手里。这波主打一个 ai 自由。 第二,多模态全开,图片视频音频他全都能看懂,给他一张图,他给你写代码,给他一段音频,他能听懂你在说啥。 这技能点满了,属于是第三,性能很顶,单位参数效率超越一堆大模型。三 e b 版本,跑赢不少比自己大的多的选手,谷歌这波确实有点东西。 第四, apache 二点零协议划重点,免费商用,开发者狂喜,谷歌这次一口气发了四个版本版本适合谁?能干啥?二 b 四 b, 手机党,低延迟,多模态,跑得快, 二十六币三十一币,有显卡的推理强,会写代码,你有张十六到二十四 g 显存的显卡,二十六币三十一币,量化版直接起飞,显存只有三 g 也能跑,量化技术了解一下,门槛比你想的低多了。 部署三步搞定,第一步,下载欧拉玛客户端装上。第二步,打开终端,敲一行命令,欧拉玛 round gemma 四,第三步,等他下载完直接开聊,就这么简单,小白也能上手, 光说不练假把式,来看看他到底能干啥。测试一,写文章,让他写描写春天的文章,五百字指令下达后,看他已经嗖嗖的运行了。测试二,看毒片, 给他张图片,也能快速的识别出图片内容。测试三,改剧本,给他一个剧本,让优化也能很快的给出建议并改好文本处理还是非常不错的。 总结一下, jam 四这波是认真在做, e i 性能强,门槛低,能商用,关键是真的能在你自己的设备上跑,想体验本地大模型的朋友冲就完了。好了,今天的分享就到这,我们下期见。

总有人说龙虾费钱, tokens 不 够用,其实有没有可能是你不会用啊?别生气,毕竟好纲要用到刀刃上,跟风乱装技能,瞎提问、乱试功能,当然啥结果都跑不出来。所以飞书 openclaw 懒人包不只是给你足够的上手额度加七天体验窗口期,更是给你一套正确入门的用法和 思路,不瞎事、不浪费、不绕弯路,手把手教你装对技能,问对问题、跑对任务,让每一份 tokens 都花在看得见的效果上。别再盲目烧额度了,先学会正确用法,再谈高效提效。想提高和龙虾的沟通效率,低门槛搞懂真正有价值的用法,现在就点击头像进直播间或点击下方链接直接下单吧!

这个视频呢,记录一下啊,在 cloud 的 qq 里面配置这个免费的 e p i k 就 来自于这个 n v d 二平台,参考的是这个 c s d n 的 leo 幺二五的这个一片薄壳。 首先我们看一下这个这种效果,我们先打开这个代理路由,保持后台运行,然后再点击 c m d, 调出命令窗口,然后输入 cloud, 然后这里是连接到了这个 g p t 的 这个幺二零 b 的 这样一个模型,我们测试一下 啊,这样通是通的,然后我们问他一下,现在是什么模型 啊?都没问题 啊,下面就介绍一下这个全过程吧。因为 in video 它结果是 open ai 的, 所以要做一个返乡代理。首先我们先到那个 in video 这个平台里面去获得它的一个免费的这个这个 a p r key, 那 么这里大家就前面有视频介绍过来,我们先注册一下啊,然后通过邮箱注册啊,然后手机号的一个 啊,绑定确定啊,完了之后,我们就可以在这个后面这个这个个人中心里面去创建这个 api, key 我 们拿到,我们先申请一个 key, 这里随便命名一下啊,我们把这个 key 先复制下来,我们先放到我们自己的这个记事本里面,先把它存一下,因为等会还会用到。 好在这里输入 gpt, 寻寻找一下这个模型,我们就选择这个二零 b 这个模型啊,进入模型我们这里看一下它的这个代码是怎么调的,我们把这里的这个地址和这个 model 的 这个名称到时候会用到, 我们先保留在这个界面,然后来到第二步,就是安装这个,呃,代理代理路由,我们登到这个安装的这个页面,好的,我们下载一下,根据我们电脑操作系统的一个呃相匹配的版本, 这里解压以后我们就得到一个文件夹,然后呢首先呢我们去进行一个设置这个 config 这个文件,把这个名称先改,呃改为这个中间这个 example 给它删掉, 然后我们把这里面这条命令的这个 false 改为 true。 然后第二条就是这里有个叫 secret key, 就是 相当于是代理路由这个密码,我们随便设一二三。然后第三个地方就是把这个 and video 设到那个 key 啊,复制到这里面, 我们保存一下,然后就可以关闭了。那么第三步就是我们启动这个代理路由,然后呢登录这个网页去设置这个 a p i, 打开这个 exe 文件,然后让这个在后台运行就可以了。页面这个网址复制一下, 然后这里的管理密密钥就是我们刚才设置的这个代理路由的密码。我们进去之后啊,我们看到这个仪表盘里面,就看这里 ai 提供商这里点进去,我这里已经设置了一个呃 in video 那 个 a p i 的 一个供应商,那么大家第一次进的时候可以点击这个添加供应商那里, 然后这里面我就在这里编辑一下,其实一样的,主要是一个供应商的一个名称,然后一个网址,然后提供的模型的名称,然后这里就输入我们刚才得到的那个安全密钥 api key, 就 把这四个地方填好就可以了。我们分别把这几个几行代码复制到刚才那个代理路由那里去, 我们测试一下啊,这状态是打绿色勾的话,就说明这个已经通了。好,这样这边这个反向路由就已经设置好了,然后我们再来到这个 c c switch, 如果没有装的话,呃,就登录到这个网址去安装一下啊。进入到这个网址安装, 我们也是点到这个安装,然后到下面这个 release, 然后再次拉到最后根据我们电脑版本去安装一个适合我们的这个版本。 啊,我这里已经安装好了,安装好之后我们就把这个 n b 六的这几个参数都给它放进去,前面都是呃常规的把这个 e p r k 密钥附在这里,然后这里填的这个地址啊,要注意是写着 local house 的 八三幺七, 然后下面就常规设置,然后这里的主模型就根据我们刚才调用的代码里面这个模型,把它靠边键贴一下,这四个都一样,然后就可以点击保存, 然后这里给它启动一下。好,那这样的话就整个流程都全部设置好了,那这时候我们就可以启动 cloud code, 我 们点击 c m d, 打开命令,行 cloud, 我 们测试一下。大家看到这里这个模型已经啊已经输入好了,那么模型是通的,那就是没问题了。

小龙虾和硬件结合消耗多少 tokens? 其实试了一些方案吧,就是首先先说一下,如果说我们用 gemini 的 话啊,这种单次的 token 消耗应该是在一千左右,然后,呃,但其实如果说你把所有的任务都交给多萝和大魔仙来做的话,这个事情是非常非常的繁杂的。你可 所以说其实我们做陌陌 h 呢,还有另外一个非常重要的工作,就是我们先把一区一堆这种小模型全部整合成了一个中间件,然后教大模型如何去非常好调用这些小模型,然后再做一套 skillset, 把它全部都封装起来, 那这样的话其实很多的任务你就不需要用多么太大的模型去做了。就比如我现在想要做一个人脸追踪的任务,那可能我就放一个 google 的 mini pad 在 里面,而他们却只要理解说,哎,我这个能够调用这个这个这个模块去做人脸追踪, 那我接下来这个即时性的交互就交给小模型去做了,他做了更多还是上层的语义理解的啊这个事情啊,所以说这样就可以大幅降低你对整个 token 的 消耗。而另一个层面吧,就是其实我们前段时间也试了一下咱们新华信另外一个做 ipc 的 公司,这个本地部署大模型的 特点就是引数计算,帮友商算是这个提个名儿就是他们他们应该是可以在本地部署一个这个 gptos 一 百二十币的模型,还能跑到四十二 tokens per second。 然后但我们当时应该是装了一个千万的啊,三十几币的一个模型,然后试了一下,其实简单的任务效果也是不错的,所以如果有条件的话,你用本地部署一个大模型也可以比较好的去 降低你的整体成本。但是确实就做一些非常复杂任务部署的时候还是直接用 gpd 或者这个啊 jammer 或者一些其他的,就咱们国内的一些大模型会效果更好一些。
![5天3亿tokens极限开发 AI音乐平台kemo 3亿token消耗,400块钱支出,5天每天开发16个小时。搞出来的AI音乐平台你们可以来玩一下哦:https://app-ba1hiuo34741.appmiaoda.com/[doge]或者 www.kemo.net.cn](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/32cb64611bfe7ca39a1c70b3f69ac000~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094656400&x-signature=NBznatp%2BRd85xSkgTD4YK%2Fv8ld8%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260521012027C6454E372C499B7F02BD)
兄弟们,给你们看一个好玩的东西啊,这是我用 ai 花三亿头肯四百块钱,五天时间,整整五天时间,在五一期间开发的一个 ai 音乐网站,你看甚至还可以复制复刻泰勒斯韦的歌,然后还可以玩非常好玩的一个艺术视觉项目, 这是一个歌曲的详情页,我也是花了五天时间迭代了一百四十多个版本,才达到了现在这个效果,非常炫酷的一个 ai ai 粒子视觉, 然后这还可以改变颜色, 然后这还可以改变这个栗子形状啊,我们直接在这里形态就可以切换切换,然后歌词也是可以浮在上面的,我们直接点击 这个设置设置,然后关闭背景,哇,真正的全沉浸式的音乐播放器啊, 这个视觉效果也是非常的震撼啊,而且还可以投影到屏幕上,投影到墙壁上,更加震撼,完全的一个三 d 立体视觉的形态。 然后想听什么歌呢?你也可以在前端生成,想听什么歌就生成什么歌, 然后我还集成了类似于抖音的一个十五秒的短视频,然后小红书的一个卡片式的一个呃,音乐传播,就后端也是连接了 solo 的 a p i 迷你 max a p i, 大家可以去调用,完全可以用自己的大冒险来生成音乐, 这里也是给大家做了一个非常喜闻乐见的音乐生成平台, 这个代码量真的是非常大,现在已经写了几十万行的代码,这是我之前把我的艺术视觉项目整合进来了,所以可以看到是非常震撼的。 然后打开摄像头呢,他还是可以支持你手势隔空交互,我们这里可以切换他的粒子形态。 看了这个粒子引擎呢,我是采用这个 table square 写的,后来感觉如果想实现更加丝滑流畅,或者说一百六十帧以上的高帧率运行的话,我又用那个 rest 语言写了一个 web assembly, 呃,也就是所说的 w a s m 一个引擎将可以实现两百帧以上的运行。然后我还写了一个基于抖音的算法机制, 然后自己重新开发了一个音乐平台的流量推荐机制,这样也可以让新的用户呃,加进来,也可以让你们的作更快的被推荐。虽然这个产品好看是好看,但是对你的性能, 电脑性能还是有点要求的,最好是带一个显卡三零六零以上吧,就可以最大程度上的还原这个粒子视觉,而且最好要关灯,关灯,沉浸式来看,它真的就是天堂般的存在。 你现在所听到这歌呢,全都是我借助哎 d p c 豆包或者说元宝呃,跟他提问生成的。其次呢,我还做了一个克拉克的助手,把他原码上传到这个网站。助手 eric, 其实你接其他大模式的 ai 助手也都可以,但是我这里是自己内置了一个他甚至可以帮你写歌,真正的智能化助手啊。 最近我新写的一些歌呢,基本上都是用我这个 ai 助手写的,因为我是花了万字长文呃,大模型微调了一个专属的 ai 音乐模型,所以说他做的歌词就特别特别有水平,这个完全和没有微调过的模型差别还是非常大的。 像这种情况下,我甚至只要动动嘴,你跟他说话,他就可以帮你生成音乐,真正的下一代 ai 基建产品。 我觉得未来的产品一定就是他会自进化、自成长,能够完全的理解你,甚至有生命形态的一个 ai 产品, 这也是我非常想做的一款 ai 产品。然后像这一款 ai 音乐,呃,网站呢?也是植入了我这样的思考,就未来 ai 接管一切程序员可以凌云为, 然后我现在也在开发这样一个 lab 协议的生态,呃,一个让网站还有 app 有 生命的一个协议,所以这就是我最想做的基于我 lab 协议的 一个 ai 生命网站的一点零的雏形,真正做到了一个具体的应用的 mvp 的 一个产品。

全网都在刷到 openclaw, 号称装完以后你就一键致富了,你就什么都不用干了,解放生产力,释放双手了。是,你是什么都不用干了,因为之后你的所有时间将会花在调整那个什么都干不了的 openclaw 上。 这就是国内 openclaw 热潮下百分之九十九的用户画像。作为国内最早接触最早使用 openclaw 的 博主之一啊,我在当时视频我就说了, openclaw 有 两个人几乎是形同虚设,到现在你可以在互联网上查到各 各种关于它的安全事故。第二个就是它的 token 消耗量啊,到现在为止,它的 token 消耗量还是非常非常非常恐怖的,那么 为什么热度还是持续走高?到底是谁在赚钱?到底是谁在推?答案很明显,你看一下 kimi, 你 看一下 mini max 的 财报啊, kimi 好 像两个月赚了有一两年的钱吧,然后 mini max 在 今天收盘的时候更是赶超百度 市值啊,什么概念?一个三百六十人的 ai 公司竟然赶超了百度的市值?还有一个就是我在之前视频提到里面说三个月前两千多的 mac mini 被炒成了三千多,到现在 五千多卖断货呀,我的妈呀,我想说的就是普通人啊,当然,不过我在内自己业务都还没个闭环,就不要被那些 ai 博主啊打 公司啊带偏了节奏,然后割了韭菜。说难听点,你以为你是在创业,其实你是在给 ai 行业做捐款的。而且就现在这个连老头老太太都参与进来的热度,真的非常怪,让我觉得和历史上的某一个事件有高度的相似啊。或许我们下期可以展开聊聊。

很多企业现在为了鼓励大家使用 ai, 搞了一个叫 tokens 排名的,就是把每个员工消耗了多少 tokens 给他做一个排行榜。 这个东西啊,就一点价值也没有啊。任何东西你一旦成为 kpi 绩效,他马上就会失去了真正他本来应该扮演的那个考核价值。比如说 met 最近就开展了这个工作, 然后呢,突然发现,哇,每个人的使用量都暴增,那个马克扎克伯格和他们的 c t o, 这个每天 toc 使用量连前二百五十名都排不进去。 为什么会这样呢?因为为了刷这个数据啊,好多开发工程师直接写了一个死循环的程序,不停地翻过头,掉过头来去跑这个程序,然后不停地消耗 tocs, 最后呢,那些数据啊,都是刷出来的。 所以说啊,我觉得这种搞排名的方式,其实根本就无助于提高大家投肯使用的效率。那要怎么做呢?更多的应该是从结果上面来进行考核。比如说我们最近服务的一些企业,他们也在做这个开发的 ai 转型,那最后你是要从 开发的效率啊,你的产品迭代的时间等等这方面去进行考核。当然你前提是要提供很多培训和托克斯的补贴这些服,这个才能有价值,而不是一刀切搞一个所谓的排行榜就解决问题了。这个就是管理 跟人工智能的能力要巧妙的结合在一起。所以以后呢, ai 转型,它不仅仅是一个技术问题,它更多的是技术结合管理结合领导力的一个综合性的一个行为,这个就更需要跨界的能力了, 我们最近呢正好也服务了很多企业,下次会拍个视频专门来说这方面的话题。点个关注,这里是哲老师有话说,带你穿透现象看本质。

你是不是还在用线上 a p i 消耗 token, 不 仅消耗大,还不稳定,数据还要上传到云端,被别人当做参考资料。所以我做的这套本地 ai 大 模型,这一套的优势就在于,公司数据都在本地,不会 上传到云端,分享给别人,也不需要消耗 token, 更不会出现降智和幻觉的情况。这是我给浙江客户配置的本地大模型,主机,用的是 m r ultra 的 max studio, 用它的好处就是,六十四 g 的 内存 全部拿来当显存用,拿来跑三十五亿的大模型刚刚好。公司的订单、合同、报表都可以交给 ai, 哪些合同快到期,哪些品类目前是亏损状态,哪些 s k u 往年的销量最好, 都可以问他。你也不用学技术,我手把手教你怎么新建 skype, 怎么跟 ai 沟通,把它训练成你公司的专属 ai, 跟公司业务相关的词条都可以上传到本地大模型,建立企业私有知识库,图文、表格、网页他都认识,竞品的产品信息,往年的销量对比, 他能自动帮你整理成表格,告诉你主要的差异在哪里。几千篇图文,几万张表格,本地大模型分分钟都能帮你总结明白,这也是人力所做不到的。

谁能想到,如果算年初至今出口暴涨最多的门类或许是 ai token。 在 全球公认的 open router 最新榜单上, mini max 以恐怖的二点二九万亿 token 空降榜首,而前五名中国模型独霸四家。 在 openclaw 这只龙虾的搅动下, kimi 近二十天的收入就超过了二零二五全年总额入,并且它的海外收入早已超过了国内收入。而智普发布顶着 pony 名号预热许久的 g l m 股后,竟然底气十足的涨价了百分之三十,结果上线即售,清流量远超预期,甚至还得跟蜂拥而来的用户致歉赔偿。 跟智普和 mini max 剧烈奔涌的是疯狂的股价,上市一个多月接连暴涨,市值一度占上了三千亿港币, 刷屏海内外下的拥有全球最强法务的迪士尼紧急出动的字节跳动 c box 二点零,以及阿里在出现在当天开源发布的性能媲美谷歌正版三 pro 的 千万三点五 plus, 都广受海外用户真金白银的追捧,引发近期中国头盔消耗指数级别上升。而与之截然相反的画风是 claud 母公司安 sirpik 酸溜溜的指控三家中国模型争流了。他们家的模型先不说是不是捕风捉影,他们自己也经常争流别人,被马斯克嘲讽贼喊捉贼。 还有消息人士透露, openai 意外的将未来算力支出目标从几个月前信誓旦旦的一点四万亿美元大幅下调至六千亿美元。 再深入查看,虽然二零二五年的收入总额达到一百三十亿美元,大幅超过了一百亿美元的预期,但其模型推理的相关费用在二五年增加了四倍,导致其调整后的毛利率从二四年的百分之四十下降至三十三 就巨亏,市场份额也从二五年初的百分之五十大幅下降至二五年底的百分之二十七,被 anselpic 以百分之三十二的市场份额超越。但随着 opencloud 借着 调用 cloud 的 a p i 抑军突起,进而全球刷屏后, anselpic 反而压力山大,因为它的 a p i 卖的实在是太贵了,五分钟就能烧掉三十美金。可以七乘二十四小时工作的 opencloud, 加上调用 cloud 的 a p i, 堪称破产套餐。 硅谷的极客富哥们也吃不消,他们满世界寻觅性价比更高的替代方案,很快就发现,性能完全不输 token, 便宜实惠、量大管饱的中国大模型完全可以接替,可好地完成各种提效任务,等同于遍地黄金。 于是,继去年春节的 deep six 时刻后,中美 ai 的 底层格局在春节再次上演。中国时刻,中国 ai token 的 出口暴增,甚至有可能颠覆之前美国 ai 的 很多趋势,比 如尖端 ai 芯片的卡脖子程度,比如叉 j b t 这种 ai 聊天工具的收入模型和估值模型,都有待重新思考。而中国头恨出海的本质,是中国能源电力的出海,工业综合实力的出海。 原因很简单,美国花了一整年时间证明缺电问题无解。按理说,美国 ai 巨头们拿着英伟达先进显卡 运行成本理应远远低于中国同行才对。可事实上,因为缺电和缺水,综合成本比国内贵好几倍,不敢报价就不可能降的下去,而且因为缺电,大量算力中心建成后无法使用成堆的先进显卡摆在机房吃灰。 如果把均未上市的 openai 和 kimi 对 比,看似二五年收入差了几十倍,估值差了几百倍,但二十六年可就不好说了,毕竟 kimi 短短二十天的收入,就超过了去年手里的现金储备。看似 openai 手里的一百七十五亿美金,比 kimi 手里的一百多亿人民币,算上汇率多了十倍。 不要论实实在在的购买力,尤其是买电,还真就不好说有多少差距,毕竟中国的电要多少有多少,风光何处清,取之不尽用之不竭。而奥特曼还惦记着投资核聚变公司,指望着远水来解近渴呢。 除了电,更颠覆的是模式,过去一年,很多用户坚持给拆 g b c 充值的理由,悄悄地从最强智能变成了他有我的全套记忆,切换成本太高。 oppenai 似乎也很满意这样的护城河,放心大胆的插进了广告,无视用户。 opencloud 出现后,所有记忆全部保存在本地电脑。用户从被 ai 聊天工具圈养的羔羊,翻身成了主人直接调用大模型的 a p i, 哪家聪明用哪家,谁的性价比高用谁的,完全是真金白银投票。于是,性能不拔尖、价格又死贵的 g、 p、 t 模型自然不受欢迎。而 随着 open cloud 云电脑、 kimi cloud 等模式的普及,对模型性能和推理成本的要求自然越来越高。而这背后的胜负手,依然是电力成本和电力供给。中国显然乐见其成,毕竟往外出口电力成本太高,损耗太大,转化成 ai token 通过光缆出口,没有损耗,附加值还超高,还能带动产业链的整体发展。 比如智普和 deepsea 的 最新模型,都已经广泛适配了华为升腾韩五 g 等国产 ai 芯片。而阿里的通一千万大模型,阿里云 ai 芯片平头哥更是构建起 模型云服务芯片闭环生态通云哥这都会进一步降低成本,增强综合实力。显然, openai 也看到了这一趋势,才会短短几个月就大幅调降了未来的算力支出,毕竟形势比人强。而 ai 竞赛的下半场才刚刚开始。


这几日爆火的 cds、 二点零的视频、深沉疯抢的龙虾、 open club, 都使得 tokam 一 词爆火。一条视频看懂 tokam 到底是什么? 主公,往昔我等缴纳水费、电费、燃气费,此乃维系肉身生存之必需,然不久之后,您便会发掘账单之中,将新增一项不可或缺之支出 toker, 这 toker 已然成为人类于数字化世界生存之第四大刚需。想必主公一有疑问,这 toker 究竟是何物?简而言之,它便是 ai 之数字口粮,恰似汽车行驶需燃油, ai 为您纾写报告、翻译语言,乃至辅助您六岁孩童练习口语, 皆需消耗头肯。他乃是衡量算法带您脑力劳作之最小计费单位,为何延其为刚需?盖因未来家电、办公软件乃至您之手机,皆会内置 ai, 带智能驾驶成为标配。 a i 医生为您解读片子,数字助手替您过滤无效信息之时,每项服务背后实则皆在消耗算力。而 tucker 便是智能时代如影随形之服务费。 既然此乃不可避免之趋势,又当如何应对?陈宋主公两条锦囊妙计,其一,严习投喂之术,切莫将 token 耗费于无效提问之上, 学会精准之 promise 提示词,便如同节省未来之账单。其二,树立杠杆思维,以 token 处理重复性、低价值之繁杂事物,将节省下来之时间用于决断大事 未来人与人之差距,将由这般公式决定。不善运用 tucker 之人,恰似身处争气时代,却依旧坚持手拉肩扛者, 终将被效率之巨浪拍落于案。若主公愈于这 tucker 时代抢占先机,不妨关注臣。