查看AI文稿
Token就是词元
Token就是词元

粉丝1.3万获赞5.1万

相关视频

  • 用Mac Mini能分币不花的养龙虾吗? 用Mac Mini部署本地算力,能实现分币不花的养龙虾吗?养龙虾最大的成本token的费用,也就是算力。那现在最简单的方式就是接入阿里云 腾讯云 火山云上的大模型,你每次使用都会消耗算力,所以这是一个持续付费的过程,要是使用频繁一个月花个几千块钱买token,也是稀松平仓,然后另外一种所谓分币不花的方式呢,就是一次性投入买一个硬件,然后在里面部署一个开源的大模型,类似Kimi/千问/DeepSeek这种,为了省下token费用,我花了将近4k买了个丐版macmini,经过尝试 想分币不花的使用本地算力养龙虾基本没戏,下面我说说原因啊,我选的这个90亿参数的qwen3.5:,算是能力比较低的模型了。但要想让他发挥全力大概需要18gb显存。而我这款钙板macmini最大调动显存也就13g左右,好在Ollama这个工具可以量化压缩模型,所以勉强能跑这个千问3.5,但是因为算力不够,你随便问他一个问题,真的是等到天荒地老…时间久到你都怀疑是不是卡了。。。最后还接了云龙虾才正常运行起来。但是如果要接云模型,我就没必要新买macmini了,云模型龙虾对配置要求很低的。基本常用的笔记本电脑都能运行,完全没必要为了龙虾新买电脑,所以这个macmini算是又交了一笔AI学费#openclaw #养龙虾 #ai #大模型 #macmini
    02:19
    用Mac Mini能分币不花的养龙虾吗? 用Mac Mini部署本地算力,能实现分币不花的养龙虾吗?养龙虾最大的成本token的费用,也就是算力。那现在最简单的方式就是接入阿里云 腾讯云 火山云上的大模型,你每次使用都会消耗算力,所以这是一个持续付费的过程,要是使用频繁一个月花个几千块钱买token,也是稀松平仓,然后另外一种所谓分币不花的方式呢,就是一次性投入买一个硬件,然后在里面部署一个开源的大模型,类似Kimi/千问/DeepSeek这种,为了省下token费用,我花了将近4k买了个丐版macmini,经过尝试 想分币不花的使用本地算力养龙虾基本没戏,下面我说说原因啊,我选的这个90亿参数的qwen3.5:,算是能力比较低的模型了。但要想让他发挥全力大概需要18gb显存。而我这款钙板macmini最大调动显存也就13g左右,好在Ollama这个工具可以量化压缩模型,所以勉强能跑这个千问3.5,但是因为算力不够,你随便问他一个问题,真的是等到天荒地老…时间久到你都怀疑是不是卡了。。。最后还接了云龙虾才正常运行起来。但是如果要接云模型,我就没必要新买macmini了,云模型龙虾对配置要求很低的。基本常用的笔记本电脑都能运行,完全没必要为了龙虾新买电脑,所以这个macmini算是又交了一笔AI学费#openclaw #养龙虾 #ai #大模型 #macmini
    查看AI文稿
  • 千问3.6新鲜实测显存占用8G qwen3.6 ,5060TI可跑,35BA3B,22TOKEN/秒,智商超上代千问3.5  #qwen36   #qwen36实测   #qwen36本地部署  #qwen36开源  #qwen36硬件要求
    00:52
    查看AI文稿
  • OpenClaw一句hello花了5毛钱? 2个命令排查token消耗
#openclaw #我的养虾日记 #skill #上下文
    01:04
    查看AI文稿
  • 2026年免费Token汇总#Token #ai #人工智能 #Agent #智能体
    02:14
    查看AI文稿
  • 在之前的视频里有观众问我:为什么我的缓存命中率这么高?
基于这个原因我出了这期视频来分享我使用AI的一些提高缓存命中和节省token的小技巧。如果大家有更好的技巧和方法欢迎在评论区分享出来!#DeepSeek #token  #agent #ai知识分享
    01:38
    查看AI文稿
  • 新QWen3.7-max速测 #QWen #千问
    01:11
    查看AI文稿
  • openclaw龙虾本地部署大模型,不消耗token workbuddy搭配本地gemma4或者千问大模型,用本地电脑资源做算力,实现不消耗积分不消耗token,真正的AI私人超级助理  #openclaw #openclaw龙虾 #gemma4 #千问大模型 #token
    08:07
    查看AI文稿
  • 别再被所谓的“Token暴富”骗了。我把这笔账给你彻底拆明白 #AI #TOKEN #庞氏骗局
    02:33
    查看AI文稿
  • 解密多轮对话Claude Code如何计算token消耗 这一期视频我们尝试用claude-tap拦截了三轮Claude Code对话的API请求,逐条对比cache数据。 
第一条消息,48654个token全部写入缓存,0读取——冷启动。第二条消息,48654个token直接从缓存读取,只有24个新token写入。第三条,48678个缓存读取,新增29个。 
规律:每一轮cache_read = 上一轮cache_read + cache_creation。缓存滚雪球。将近五万个token只在第一轮计算,后面全部复用。 
cache读取只要普通input价格的十分之一。对话越长,省得越多。 
#claude #命令行 #个人开发者 #AI工具 #张司机
    08:01
    查看AI文稿
  • 纯个人分享,调用千问大模型过程中,阿里云售后服务的真实体验。我们在使用AI过程中,选择调用哪家大模型?除了看大模型的技术性能,token消耗价格,还需要看售后服务质量如何。#千问大模型 #阿里云售后服务 #codingplan #大模型api #claudecode
    02:27
    查看AI文稿
  • openclaw的token消耗太大?一招就解决,你得知道它是干啥的,本体就能帮你解决,为什么还有好多人网上搜答案呢?#openclaw #openclaw技巧 #openclaw应用
    00:54
    查看AI文稿
  • Token是什么 #萍姐聊聊天 #AI #观点分享知识分享#token
    00:57
    查看AI文稿
  • 三大运营商上线Token套餐,成为AI时代新流量!#ai #token #token套餐
    01:47
    查看AI文稿
  • 问了一个实习生和一个资深开发的每天token消耗,结果惊讶 为什么实习生2000万token不够用,5年经验的资深开发每天才消耗十几万token?
    00:30
    查看AI文稿
  • token暴涨
    01:05
    查看AI文稿
  • 让自己token自由吧 #token #模型选择 #API #AI
    01:26
    查看AI文稿
  • 大家都在问token是啥?ai能力变强未来token会便宜! #创作者中心 #创作灵感 #ai科普小课堂 #趣味知识 #token中转站
    00:40
    查看AI文稿
  • 论文实锤:Agent烧Token 几乎不可预测 我们有一次做OPC一人公司调研访谈的时候,有一个OPC提了一个问题,说这个智能体烧token这事儿,政府得出来管管。我这发个请求,模型平台给我计token消耗,他说多少就是多少,我觉得我没用那么多,他给我乱计多计我也没处说理。政府得出来监管一下。这个OPC说的问题很真实,但其实是也很无解。正好最近看到一篇论文,很严谨的研究了这个问题,拿了8个大模型,有GPT的,CLaude,gemini几家的闭源模型,也有kimi,千问这些开源模型,测了一圈,得出了几个明确的结论.#人工智能 #agent #token #AI成本#AI
    02:18
    查看AI文稿