粉丝1.1万获赞11.6万

从选购服务器开始,手把手教你搭建 ai 中转站。我们服务器应该要以大宽带大内存为主,因为我们主要是为了能支持多用户并发处理,你们可以参考这个 ai 回答,但是这么高的宽带价格一定很贵吧, 所以我们曲线救国,买美国的服务器,然后套 cloudflair。 我是 建议你们买 netcup 的 美系服务器,德国老牌服务商了, r h 四 g 加上两千五百兆的宽带,一个月大概六十四人民币,搭配上 cloudflair 的 优选 ip, 算是性价比超高的了。 除了网站设计有点反人类就没啥缺点了。在网上搜索 netcup, 找到官网,我们选择这个点进去,前面介绍过配置教程了, 你们选择喜欢的点进去就行了,岳父就点击这个 linux, 然后地点选择美国,跟着我选就行了。然后进入购物车,这就是我们刚刚选择的服务器了,你们填写我的折扣码可以减五欧元, 没有了,问我要就行了。信息如实填写就行了,只能英文,不能有标点符号,然后保存下一步,确认信息无误之后,勾选继续即可。 我们会收到邮件,等待审核完毕即可得到第二封。使用这个账号密码登录下方链接即可,跟着箭头走。国内建议使用 paypal 支付注册,简单,自己网上搜。支付成功之后,我们打开这个新的链接进行登录, 我们点击这里选择刚刚买的服务器,这就是我们服务器所有的信息了,我们在这获取服务器登录,现在我们下载息效进行远程登录, 我们点击右上角添加个连接。为了方便,我买了个测试服务器,给大家演示,三连一下不过分吧各位。然后我们点击右边的连接,跟着我的操作走, 密码就是我们前面获取到的密码,这就登录成功了。然后我们去安装一 pano 面板,复制这个,直接去执行傻瓜式操作,跟着我的步骤,这就是面板的登录方式了。 然后我们登录面板,跟着我的步骤来, 然后我们去搜索 sub 二 api, 找到他的 github 仓库地址,复制这个链接到服务器,打开服务器的终端,下载指令,粘贴之后回车,跟着我步骤来 复制这个链接,打开,我们去新建个 post 个 c 过数据库,跟着我的步骤来, 这几个对象就行,看不懂多看。然后我们去下载一下 reddison, 复制一下 reddison 的 密码,看我步骤, 自己设置个账号密码,等待安装后我们进入,恭喜你有了自己的站点。然后打开暮雪 ai, 点击 a p i 密钥,之后创建一个密钥,然后按照如图操作,然后点击复制之后即可。账号管理中,我们点击添加账号,跟着我的步骤来, 上面这个是我们的 api 地址,下面的就是我们刚刚复制的 t, 然后开启池模式,你们可以找我,当你上游更有保障。然后点击创建,我们测试一下能不能正常回复,正常的话就代表我们成功了。我们开启注册模拟用户试试, 刚刚忘了分组,现在回到管理员账号分组,这样就行了。然后我们到账号管理中,让他只能在规定分组中被调用 到用户管理中,给这个新用户充点余额,然后登录刚刚的账户,新建一个 key, 然后我们现在有了接口和 key, 就 能对接第三方了。测试一下 复制密钥还有接口填入之后获取模型列表。这次只配置了一个模型,我们是有很多模型的哦。对话测试配置成功了, 接下来 codex 配置教程,也就是对着抄就行了,点击获取模型就能获取到模型列表了,选择相应模型即可,别忘了启用哦。发消息测试成功,配置 new api 和域名相关教程看我这一期,你们最好结合一起看,有任何问题看我主页哦!

啊,出一个 codex 如何进入 deepsea v 四 pro 的 最简单的教程啊?首先首先是在这个网上下载啊,下载自己电脑对应的版本就可以了,把这个下载下来之后,有一个这个,这个装上就可以了,然后需要第二个工具, 第二个就是需要下载一个这个 cc switch, 这个下载之后呢,还需要先把它下载下来啊,还需要另外一个东西,还有另外一个东西,主播写了一个中转的一个一个工具,因为这里面是不能 codex, 是 不能直接用, 不能直接接入 deepstack 的, 然后需要写一个中转的服务,然后在这写了个中转的服务,大家能看到这个地址吧? 这地址要说呢,这是 get 它的一个地址啊,然后就可以把这个把它克隆下来,克隆下来直接 n p m initial, 然后再 n p m 是 大,然后就运行起来了,运行起来之后,然后再回到这个 c c c 位区里边, c c c 位区里边,第一个是客户的,这个先不用管,然后进入这个,第二个,这个这个拆的 g p t 这个, 然后进去这个里边呢?然后点一定要先选中这个,然后再点这个加号,再点这个加号,你主播已经添加了,然后和这是一样的,然后这个里边这个自定义的名字啊,这个这个贴什么都可以,这都不贴,不贴这个屁,随便贴一个这个,这个没有什么用啊,然后然后就这这个地址,这这个地址 就是刚才刚才 github 上边这个项目,这个项目的里面运行起来的地址啊,就贴这个,因为它运行起来就是这个,就是个端口啊,就贴这个,然后这模型名字我们就写的这个 vise pro。 好, 下面把这个勾上, 然后然后这里边有一个内幕啊,往下滑,这有个内幕,内幕这个地方,这个地方的名字是可以自定义的啊,它显示的是在这显示出来的,你希望他让他显示 dsp 和 vga pro, 那 你就把它改一下,如果你这显示成 d s, 那 这个地方就会显示 d s, 那这就好了,把这个弄过去之后,然后点这儿让它启动,让它启动,这样就好了,这个这个它就把它可以关掉,它就常驻在后台就可以了。然后这个时候我们可以看一下啊,这手机这个,然后这儿我问他,你是什么模型, 对吧?他说他是 tiffany 版本,是 vsco 版本,是 vsco, 对 吧? 然后是什么什么什么他可以干什么,对吧?这个就是完全大好,大家可以点点关注啊,到主页加咱们的技术交流的粉丝群在里边,可以有什么问题啊?可以提出来,然后咱们可以一起交流讨论。

前面有一些这个朋友反映这个在那个给那个 cloud 配置 nvidia 那 个一拍的时候,有一些遇到问题, 特别是这个啊,由于在登录这个代理服务器的时候,就暂时登录的时候,然后出现这个密钥已失效这个问题,那它主要是什么问题呢?我们演示一下,就打开这个这个网址啊,我们在输入这个密钥的时候,登录它就提醒我们这个密钥已经失效了, 那么需要这样做啊,我们先把这个代理服务器关掉,然后呢再进入到这个文件里面编辑,我们能看到这个这里面的这个密码它已经改掉了,它自动改的,那么我们这里就是要把它改成我们想要的密码,然后呢再再次打开这个代理服务器,然后让它后台运行, 然后刷新一下这个页面,在这里输入我们刚才设置的密码,那么这个记住密码这个勾选一定要选上, 我们下次在基本的时候就不会有问题了,那么后面都是一样的,要配置这个这个 nvd 的 这个 api, 我 们点测试,点测试运行 icc switch 里面去配置这个啊,模拟名称啊,那尤其是这里啊,进行地址还是要注意是这个 logo house 的 那个地址啊,那么整个流程这样下来是通的,那就没问题,我们就可以启动这个 cloud, 那 么这样就是说,呃,我们能够 用到免费的这个 tokens, 我 们测试一下这里输入一个 hello 吧,对,这样有反馈就说明是通的啊。

mcp model context protocol 模型上下文协议这是一个让 cloud 实时连接外部工具和服务的标准协议。通过 mcp, cloud 可以 访问 github 数据库, slack 等外部系统,突破本地限制。 m c p。 提供三种核心能力, tools 工具让 cloud 执行操作,比如创建 github issue, 发送 slack 消息 resources 资源,让 cloud 读取数据,比如数据库查询结果文件内容。 prompt 提示预定义的提示模板,快速执行常见任务。 配置 m c p 很 简单,创建一个 m c p g s o n。 文件,定义服务器名称、命令和参数,比如配置 github m c p。 指定可执行文件路径和认证 token。 cloud code 会自动加载并连接这些服务器。 社区已经开发了很多 m c p。 服务器。 github m c p。 管理仓库 pr issue file system m c p。 安全的文件系统访问 database m c p。 连接 postger s q l my s q l。 执行查询 slack m c p。 读取和发送消息 google workspace m c p。 操作文档和表格 m c p。 让 cloud 的 能力边界无限扩展。下一期我们讲 hux 主机 m c p。 操作文档和表格 m c p。 让 cloud 的 工作流。

所以我体现下来,我觉得中转站也没什么不好的,但是我看到很多现象和评论都是对这个嗤之以鼻啊,所以我又深入研究了一下。我想了解一下为什么这么一个又实用又解决真实需求的一个东西, 像过街老鼠一样突然嫌弃,也确实是挖出来了。其实说到底还是利益相关的问题,答案很简单,就是不是模式有问题,是做这个生意的人太多,人只想赚快钱。第一种就是比较恶心的,他要给你玩货不对版, 他表面上告诉你,给你的是 cloud code, 是 off 四四点六,这是 gbt, 这是顶级模型,但是他底层给你偷偷映设一个更便宜甚至是免费的模型, 这个用户表面上看不出来利润直接翻了几倍。你以为你在买高端的 ai 能力,实际上你只是买了一个包装的比较好的错觉, 还有一部分就他自己的服务器,可能也是图便宜不稳,找那个便宜路子开的付费账号,用不了多久就疯了。 那下面的用户可不用起来就跟抽奖似的,那很不稳定,体验极差,说白了都是省那点小钱去牺牲用户体验呗。这也没办法,咱们这个环境,他就流行一个卷, 用户爱占便宜占涨又爱图便宜,那用户体验能好就怪了,靠便宜量大去吸引用户充值观战的跑路的也很多,就是太想赚波快钱了, 太想趁着大家都不知道,赶紧捞一波走人。我觉得这其实也是一种不自信,你赚钱嘛,你大大方方赚就完了呗,又不是什么丢人的事。你真实的解决了用户的需求,那用户为你付费是应该的, 不用搞那些货不对板。然后中转站所谓的上游就是提供 plus pro 一 些账号,这种号商就拿那个 gpt plus 来举例,便宜的八九块钱,十来块钱,二十块钱都有, 这种号咋来的咱就不细说了,但反正站长他要是能拿到这种又便宜又稳定的号,或者是人家就有合理的账号管理机制来保障自己用户的稳定性。那我觉得人家就是有能力 这个东西,要是运气好的话,你号稳定你可能就多赚点,你这号要是不稳,你就多花钱买点稳定的号,少赚点呗,反正我自己现在用我自己的中转站。嗯,这个使用体验跟之前账号登录是没什么太大区别的。 很偶尔的时候会慢一点点,但是已经很好了。那我之前买的国内的那种普通模型,可能会员也得几百块钱一个月,还经常卡断,还经常网络误,你说他在国内他也不用解决网络问题,还能经常卡断线, 所以我怀疑他说说不定也是一个中转套壳。人家声势大,能忽悠的住投资人,能忽悠的住用户,那就是有本事,这钱啊就该他转,道理一样的。

最近抖音又刷到一堆教程,教你把 cloud code 接到第三方模型。第三方 api 中转站里,看起来很爽,不用担心封号,不用折腾网络,还能省成本。但这里面有个坑,能跑通不等于真的省钱,能省钱也不等于真的安全。 保姆教程通常只教你怎么接,很少告诉你接完之后怎么扣费,怎么封扣。第一,先看他怎么计费。 你用的是官方订阅额度还是额外 usage bundle? 是 apikey, 还是某个中转站自己的余额?这四个东西不是一回事,你以为还在用订阅,实际可能已经在暗偷肯烧钱,评论区已经有人说晚上没用大模型,醒来还被扣了几美元。 所以别只看单价,要看完整账单。第二,别只看便宜,看它有没有缓存,原生 cloud code 有 自己的上下文和缓存机制,换第三方模型之后,有些列录可能每轮重新计算,表面单价低涨,任务反而更贵。第三,鱼类和中转不是护身符, 你代理直联没事,一换 crs 鱼类中转就封。不一定是你配置错了,可能是请求头客户端指纹调用频率, 模型行为画像都变了。第四,别把主力账号当自动化池。 cloud pro max 本质上还是个人订阅,你把它接到第三方 agent 批量任务拼车,中转里 行为画像就不像正常个人用户。所以今天别急着问哪个接口便宜,哪个中转稳定。先问四件事,按什么扣钱,有没有缓存链路和指纹变没变?会不会把账号变成任务池? 你现在是官方指点第三方 a p i 还是中转?雷雷评论区说一下,我帮你判断风险点。

就很多人舍不得用这个 cloud 四点六的大模型嘛?啊?我是这么认为的,就有一些朋友他喜欢用记着中转的大模型,我觉得没有问题,但是呢,这里面有一个很大的信息差,就是很多人他买的这个中转, 我说这个可能有点这个断人财路了,就是有的人买的这这个中转的 a p i 啊,它掺了多少的水分?它其实心里是犯嘀咕的,对吧?我,我前段时间我在想这个事,但我万万没有想, 现在的能人还是多,已经有专门的工具,你去测你这个中转的 a p i 到底掺了多少水分,不可能把这个东西分享出来 的,具体是什么样的一个操作我就不分享了,我觉得还是那句话,不能断人财路。就是我想说的是我们可以用中转,但是呢,我们这个钱不能花的太稀里糊涂,就是有的人他他其实他用的这个东西很拉胯,你知道吧?那到头来你被蒙在鼓, 我觉得这个东西就很难受了,对不对?然后到头来你还怪这个 cloud 不 行,对吧?我觉得 ai 时代真的有很多的这种被坑的地方吧,大家还是要谨慎一点啊,还是要谨慎一点。

如何在当前参差不齐的 ai 中转站中选择适合自己的?一、远离套壳掺水的低质量模型,比如用 gpt 映射 cloud 或者其他模型替换的,只要多检测一下就能发现。 二、明码标价的第三方按需求选择这种一般都会标出每个模型的具体情况,比如 cloud 的 q 逆向 ews, 或者 cloud 的 官方中转对应不同的价格。 三、自建耗尺的中转站,遇到只能恭喜你。这类中转站往往可选分组较少,一般都是两个分组,分别对应模型稳定性和质量,他们主要服务于量大的第三方中转。普通用户该如何选择? 用之前先询问是否支持测试,一般大部分都会支持多测几次,可以帮你筛掉哪些滥竽充数的模型。 测试后如果觉得可以先小额试水,看看模型的响应速度和稳定性,排除掉高延迟和报错频繁模型。如果你还要继续筛选,那么监测模型是否存在间歇性掺水提示词,是否存在污染,以及 poke 的 注入程度。 到这里基本已经可以满足你的日常使用需求了。还是那句话,不要想着让零点一倍率的模型达到零点五倍率的效果。最后敷上检测工具和实时监测可用性,方便让大家了解。

为什么我一直不建议大家用中转站去跑 cloud code 呢?很多人第一反应可能是模型产水、数据安全或者账号的稳定性。这问题当然存在,但今天我想讲的是一个很多人都忽略的点,就是提示缓存。 hello, 大家好,这期视频专门讲一下为什么中转站会让 cloud code 的 缓存率变差,希望大家帮忙点赞、关注收藏。 那什么是提示词缓存呢?模型服务端发现很多次请求的开头部分的提示词相同的时候,就会附用这部分已经预处理过的结果,避免每次都会从头处理。缓存的是提示词的前缀,而不是回答,它不会附上一次答案,也不会让模型记住东西每次输出还是重新生成。 缓存要写命中的要求就是前缀一致。所以 agent 的 提示词应该把稳定内容放在前面,把动态内容放在后面。工具定义 scam system prompt, 顺序也要固定。 agent 的 工具很多,规则也很多,上下文很长,每轮请求的时候都要带一大坨固定的内容 缓存,命中之后就可以很大程度地去降低你输入的成 token 成本跟延迟拷 code 的 每一轮对话,它其实并不是只是把你输入的那句话发给模型, 他会把很多东西一起带上。比如系统提示词工具描述 m c b 的 工具定义,查找点 m d memory skills 历史对话工具,结果读过的文件内容甚至项目结构信息。所以你在终端里可能只是打了一句继续修这个 bug, 但真实发出去的请求前面可能已经挂了十几万甚至几十万的 token。 如果每一轮都让模型重新读一遍这些东西,那一定就会慢,也一定会消耗更多的 token。 这就是为什么 cologne 跑长任务的时候,原生的体验会比较顺,因为它不是每步都从零开始稳存命中高的时候,你会有两个很明显的体感。 第一个就是它响应会变快,首字出来的更快,工具调用之间衔接也更顺。第二个是成本低,缓存读取通常会比普通的输入便宜很多,真正贵的是每一轮都重新写缓存,重新计算一大段的上下文。而中转站最容易破坏的恰恰就是提示词缓存。 因为提示词缓存有一个非常严苛的前提,不是内容差不多就行,也不是语义一样就行,而是请求开头的 prefix 必须精确的一致。 你可以你只要理解成请求,对前面一整段的内容必须一模一样。一个标点变了,一个工具顺序变了,一隐藏的字段变了,都可能导致缓存读不到。一旦读不到缓存, koot 就 会从接着上一轮继续工作,变成了这一轮重新读一遍上下文。这时候你看到的现象就是,首资变慢了,攻击调用变慢了,长任务也越跑越拖。 那为什么中转站的缓存率天然的很低呢?第一个坑就是账号,而是一堆账号搭建成的账号池。 为了加载均衡,第一轮可能把你的请求发到 a 账号,第二轮发到了 b 账号,第三轮又发到了另外一个账号。这对普通聊天可能影响不是很明显,但对 t s 缓存来说,基本上就直接断了。你这一轮换了路由,路由上一轮的缓存自然就堵不到了。第二坑就是模型路由不稳定, tt 缓存是按模型隔离的, sorry 的 缓存是不能给 oops 用的, oops 的 缓存也不能给嗨酷用。如果中转站后台做了模型映设,盲时降级自动化模型,你表面上还在请求同一个模型,实际上后面可能已经换了,那缓存链条也就断了。 第三个坑就是动态字断。 call to code 的 请求里会带一些动态的信息,比如每次都可能变化的 bing header, c c h 字断,或者其他的一些原信息。 官方的服务端他知道哪些子段应该参与缓存,哪些子段不应该影影响缓存,但很多第三方的 azure pivot 金融代理不一定能处理的这么细,他可能把这些动态子段也当成普通的系统推送的一部分。结果就是请求最前面的那一块,每一轮都在变,前面一变,后面再稳定也没有用。第四个坑就是 catch control 丢失 astropyg 的 提示词。缓存不是随便把一段文本存起来就行,它是需要 catch control, 也就是缓存断点。服务端要知道哪一段是稳定内容,哪一段应该被缓存,哪一段是每轮新增的内容。但中转站在做协议转换的时候, catch control 可能会被丢掉,被放错位置或者被简化。这个东西一旦处理错,缓存命中就会非常的难看。 你看到有些中转站,它也会显示缓存的价格,它会告诉你缓存命中更便宜。但问题是,如果它本身就很难稳定的命中缓存,那这个便宜其实也就没有什么意义了。你每轮都在重新读项目,重新算上下文,重新让模型进入工作状态。最后的体感就是可拷口的变慢了,工具调用变卡了,常人我不连贯了。 所以我对中转站的判断很简单,如果你只是偶尔的聊聊天,影响可能没那么明显。但如果你是把可拷口的当成主力开发的工具,长时间去跑项目, 读仓库,改代码,跑测试,那我不建议你用中软站。中软站一旦破坏了缓存,你损失的就不只是头肯的价格,你损失的是速度、连续性,还有 agent 词工作的稳定感。以上就是本期的全部内容了,关注我,了解更多 ai 编程工具的真实使用经验。

卡拉库德又出了一个托管 a 政团,简单介绍一下,这个东西呢,就是我们平常要搞 a 政的话,你可以在一些开源的基础上去搞,或者你从零自己开发都可以 啊,但是毕竟不管咋说还是有些麻烦,对吧?然后它这个东西呢,就相当于是把这个 a 政团所有需要的必要组建啊, 比如你的记忆系统,你的思维循环,然后还有技能啊, mcp 等等这一些这些东西啊,包括你要部署的服务器啊,包括你它的运行杀伤啊等等一系列东西, 人家全给你准备好了,你只需要干啥呢?就是你只需要去定义这个 a 人,他就可以了,系统提示自己可以自己写,然后他让调用哪些工具等等一些东西啊,你都是可以自己去定义, 大概就是这么个东西。然后收费呢,也还是比较合理的啊,我觉得就是除了 token 的 费用呢,然后再加上这个运行时长的费用,这个费用其实就是服务器的费用啊 啊,每小时八分钱,当然是美元啊,换算成人民币就五毛多,看上去也不贵,对吧?啊?这个东西怎么说呢, 我就想聊别的,因为我是个普通人,对吧?普通人现在在 ai 这个领域,他最难受的点在哪呢?就是你的 工作产生的价值可能是包不住 hogan 的 价格的。龙虾量的有多快,大家也都能看到,对吧?其实很多人试了一下就能发现这个事了,你每个月可能四十块钱去买一个 gucci 啊,觉得也还好,不是那么贵,那么 接下来呢?对吧?你一个月拿这些头肯,你能干出来点啥呢,对吧?你,你干出来的活,一个月拿这些头肯干出来的活,可能还顶不过那几十块钱, 这就是大多数人的一个现状吗?所以其实对于可靠的出了这个东西,我觉得就是他能够进一步的去拉大人和人之间的区别,能够进一步的去拉开企业和企业之间的区别。 之前你比如你是一个企业,对吧?你要不要上 ai? 你 可能还在犹豫,那这个 ai 到底能给你企业,对吧?哪些环节能带来哪些价值还不确定,或者说它的开发成本总是得在那摆着的, 对吧?你可以拿龙虾去试一试,但是龙虾能干的活呢?可能就是没有那么高的定制化,对吧?你要去定制,你还是得去做一些开发型的工作,那现在就是不用了,是吧?你直接买可乐,可乐这个东西啥都不用了,你直接去定义他就完了,成本非常低。 然后呢?你如果你这个企业或者人,对吧?你本身就是有利润的,你的业务就是有利润的,那你拿,你拿这么一点利润啊,去把这个投本的价格包住, 那你的业务就会怎么说?就他仍然是一个能够大幅度降低成本的一个东西了。但是对于普通人来说,如果你的业务还没有建立起来,那这个东西,对吧?在原有的投本价格上再加那么八分钱呢? 还是有点难受的,还是有点难受,所以说给普通人留给普通人的时间不多了。

最近 b 圈大佬、 ai 界明星 ceo, 甚至美国前总统家族都在做同一个生意, a p i 中转站。 但你可能不知道,百度、腾讯自结自家的 ai 编程工具,本质也是 a p i 中转站。今天聊三件事,大厂为什么都在做中转站?你花几十块买的包月 cloud 扣的额度为什么几下就没了? 还有最关键的,哪些中转站绝对不能碰?先说为什么会有这个东西,现在国内模型跟国外顶级模型,老实说还有三到六个月的代差,你写代码、做研究,跑 agent, 要拼效率拼上线,多数人还是会优先选 gpt、 cloud、 gemini 这几家国外的, 但用海外模型门槛贼高,中国 ip 直接被拦,账号要海外手机号,海外信用卡注册完还动不动给你封号。 这也是中转站火起来的根本原因。所以这时候中转站就出现了,他干的事就两件,第一,把不同家的模型包装成同一套接口,相当于一个万能转接头。第二,自己装了个计算器,实时记录你用了多少 token, 自动扣费,看看到底是谁在做。 个人开的小中转站,基本都是单模型的,绝大多数就是个 cloud code, 中转只卖这一家。国内大厂做的才是真正的聚合平台,多模型,一站式,而且都是商务合规过的号,也不会被封。对你来说就是不用注册海外账号,价格比官方便宜,要是用大厂的,还能一个 key 叼多家。 听上去是不是有点太美了?但市面上的中转站根本不是同一类东西,我把它大概总结成了三类。 第一类,白色是大厂亲自下厂做的中转站,百度 comet、 腾讯 code, buddy, 字节 tree, 还有海外的 cursor 等等,这些你装了直接订阅就能用,模型该是 cloud 就是 cloud, 该是 gpt 就是 gpt, 基本不会掺假。第二类,灰色 是用开源框架搭起来,但货源来路不正的,可能是从低价区套利搞来的,可能是开了一堆新号薅免费额度,也可能是挂个反向代理,把订阅账号当 a p i 卖。 这类应该是最多的,从某鱼上一搜一大把全是。第三类,黑色就是诈骗了,往你电脑注入恶意代码,偷你密,要盗你信用卡。这一类可能是极少数,但是大家也不能不防,同样一个中转站,三个字,行为差着十万八千里。 这里有个反直觉的点,白色中转站和黑色中转站底层技术其实一模一样,都是一个中间转发器,差的不是代码,是一道商务合规线,大厂凭什么能做?这里其实卡了两道合规线,第一道在海外, antropic 和 openai 早就明确把中国市场排除在外了,国内大厂没法直接谈,走的是中间代理路线。美国或者其他国家有家合规企业先跟模型厂签合作,国内大厂再跟这家代理公司谈,把模型引进来,中间可能还欠套两三层。第二道在国内, 这些大厂还得按国内的数据合规要求来,内容审查,数据出境备案,这些一个不能少,两边都合规了,国内用户才能合法用上 cloud、 gpt 说白了,大厂用自己这块招牌做了一回信用中介,你不直接信 openai, 你 信百度,信腾讯就行,剩下的脏活合规活他替你扛了, 私人小站凭什么不行?他没招牌没合通,过不了任何一道合规线,只能用灰手段省钱。省着省着就把自己活成了黑的。 那大厂为什么愿意花这力气做这件看起来像中转站的事呢?因为模型层正在变成大白菜, gbt、 cloud gemini 互相替换的成本越来越低,明年又有一批新模型出来,你这家不行,换那家, 真正的护城河正在往上跑,跑到 ide agent 工作流这一层。 commit code, buddy, cursor 这些工具表面看是 ai 编码助手,实际是在抢入口,只要你天天用它写代码,模型谁家来?你根本不在乎。 大厂在用假装做中转站的方式占坑,那黑色的小站到底有多狠?讲三个研究数据, 第一,暗改倍率 a c m。 互联网测量大会有篇论文实测真实商业网关,比官方计费高出百分之六十二点八,页面写一套,后台扣一套。 第二,偷换模型,九家供应商里近一半在掺水,你以为调的是 cloud opus, 实际给你跑的是 sunet, 甚至是某个开源小模型,给你按旗舰的钱算,给你跑青春版。第三,数据安全 agent is mine。 这篇论文对四百二十八个中转站做沙盒测试,九个正在向用户注入恶意代码,十七个触发了 a w s 密要盗用,甚至有一个直接把研究员的私要钱包资金抽走了。 你以为在跟 cloud 对 话链路上?四五个中间人早就把你的代码密钥文件看了一遍?那作为普通用户该怎么选?我给三个建议,第一,能用原厂,直接用原厂, cloud code codex 都是月付订阅,特别是赶上活动用量翻倍那种, 我自己一天用 cloud code 跑过六亿多 toc, 按 api 值掉差不多是一千多刀的算力,这只是一天的用量,但月付订阅一个月也就一百二十刀,原厂这是直接打了一折都不止。灰色中转站再便宜也比不过,关键是不会被掺假。当然敏感数据类的工作是不能用的,我们个人也要保证数据合规。 第二,求省心求安全,用国内大厂的工具, cold, body, tray, comit 这些都能接入海外顶级模型,关键是合规稳定,不会偷你数据,代价就是要装他的客户端,按他的工作流来。 第三,强烈不建议碰私人中转站,不光是不稳定,动不动跑路的问题,模型大概率还给你掺假,你以为省了三折,实际跑的不是你买的那个模型,时间和判断力都赔进去了。最后说点更深的,九十年代国际电话费贵催生过 ip 电话黑卡。 二零一零年代,海外服务难访问催生过各种代理工具。二零二六年,大模型 api 又贵又封,催生了今天这一轮 api 中转站 历史每一次都是同一个剧本,官方入口跟不上需求,灰色中介涌入大厂合规收编,灰色被挤出,我们现在就在第二步往第三步走的路上,白色中转站才是终局。关注五哥通俗科普,下期接着聊 ai 时代的真问题。

我昨天不发了一条视频,说这个卡扣扣的马上要推出人脸识别认证,然后对于国内用户来讲,你使用起来会越来越困难嘛。然后 这下面评论区就有很多的网友在那里炫耀啊,说啊,他注册就很顺利啊,他怎么就不会被封呢?同时呢,也有很多中转站的朋友来我这下面打广告啊,说他家中转站啊,什么模型都有啊,价格都便宜啊。那这里呢,黑胡子就不得不澄清一下啊, 其实我自己本身呢,也运行了一家 ai 中转站,而且运行时间也不短,已经差不多一年了。我当时搞这个中转站呢,主要是因为我自己本身是讲这个 ai 编程课程的,为了给这个没有账号的同学提供一个方便接受的方式,所以我当时就搞了这个中转站。 然后当你真正的去运行一家中转站之后,然后你就发现这里面的水其实是非常深的,这里面猫腻其实也是非常多的, 就有很多朋友,他说他用中转站接住了人家卡欧扣的,价格非常便宜。那我就想问一下你,你怎么知道你接住的这个卡欧扣的是官方满写版的,是 max pro 订阅的, 而不是给你掺了水的,或者是第三方逆向的呢?你怎么测出来的?你有没有这个分辨能力对不对? 包括这里面的计费公式,其实也是非常复杂的,什么输入投币、输出投币、缓存倍率、补全倍率、消费倍率、充值倍率,这些名词你真的知道是什么意思吗?关注黑胡子,接下来我会更新一个系列,给大家 深度揭秘 ai 中转站里的各种玩法,各种内幕,让你以后无论接入哪一家中转站,你都能一眼看出来它给你的模型有没有参假,有没有水分。

奉劝大家不要装 codex, 也不要装 cloud code, 会上瘾,会沉迷,会昏倒,会生病。我已经好多天没好好睡觉了,然后严重的睡眠不足导致我今天昏了,然后到现在都还没有缓过来。所以奉劝大家千万不要装!千万不要装。

你可能听说过 cloud code, 但觉得它跟你没关系,因为名字里面带一个 code, 感觉像是给程序员用的。 其实不是, cloud code 是 一个通用的 ai agent, 它能操作你电脑上的文件,能应命行命令,能上网搜索,能一步步地帮你把事情做完, 且代码只是它能干的事情之一。比如我最近用它做了一个 ai 资讯日报系统,每天早上它会自动去抓取各个渠道的 ai 新闻,筛选、整理 升沉、记、咬,最后输出一份排版好的日报。整个过程不用我动手,他自己跑完。这还只是其中一个例子,整理文件、处理数据、批量改图、自动化那些重复的工作, 只要你能用文字描述清楚,他就能帮你干。本期视频会教你如何安装并使用 cloud code, 不 需要任何技术背景,跟着做就行。如果你用过 qq 的, 和 cos 有 什么区别?核心区别就有一个,写作方式不同, 渴死式、对话式写作。你说一句,他做一步,每一步都要你确认,你得全程盯着,像带一个实习生。 code, code 是 任务式写作,你把需求说清楚,就可以去干别的事情了。 他自己执勤完,你回来看结果就行,向交代任务给一个靠谱的员工。接下来我们来讲具体怎么安装,分成两步。第一步,先安装 cloud code。 对 新手来说,最简单的方式就是用 tree 来装。 tree 本身也是一个 a i a 阵,可以帮你处理那些烦人的依赖和环境配置,而且可以免费使用。 我们来到官网,先点击这里下载安装 tree, 装好以后打开它,在对话框输入帮我安装 cloud code, tree 接着会自动帮你装好,中间可能会弹出一些确认弹窗,点击确认就行。怎么验证安装好了呢?打开终端,输入 cloud 高的 option, 如果能显示版本号就说明安装成功了,然后再输入 cloud, 能看到主界面就对了。第二步,装一个格式化界面。原生的 cloud code 是 在终端里面用的,对新手不太友好,推荐在 vx code 里面装一个插件界面,会友好很多。具体步骤,先下载 vs code, 然后打开它,点击左边的扩展图标, 搜索 cloud code, 点击安装,装好后点击 cloud 图标会自动完成登录。现在你就有一个格式化的 cloud code 的 操作界面了。接下来我们来讲怎么配置 cloud code 的 ai 模型。 cloud code 就 像一双手,它需要一个大脑,这个大脑就是大语言模型,所以装好之后你得给它配一个模型才能用。有两种方案, 第一种方式是订阅制,直接订阅开 out 的 call 的 官方会员有三个档位,二十美元一个位月,一百美元一个月和两百美元一个月,主要区别就是使用量, 订阅之后登录账号就能用。不过最近 call 的 订阅分号比较多,如果不想折腾的话,可以考虑下面这种 api 模式。 api 的 来源有两种渠道,第一种渠道是官方 api, 比如国外的就像 cloud openai, 国内的就像智普 mini max, 去官网注册充值就能拿到。第二种就是第三方中转一个账号能用多种模型支付,方便,有些比官方还要便宜,但稳定性就具体看平台了。购买 a p i 后,你会获得 a p i k, a p i k 就是 一长串字母,你在平台充了钱,平台给你一串 k, 你填写了 key 以后,他就知道该找谁扣费了,用多少花多少更灵活。那么怎么配置呢?推荐使用 cc switch 来管理 gay hop。 上面搜 cc switch, 拖到底部,点击 release, 找到适合你的版本, 然后下载,打开后可以添加多个 api, 点击右上角加号。如果你选的是官方 api, 比如像是 glm, 那么你就在这里直接填写你的 api key 就 可以了,其他信息都已经自动填好了。如果你选择的是第三方中转站,就选择自定义配置,然后这里需要填写,呃,供应商名称,供应商名称你就自己写,写一个你自己能记住的就好了。然后这里要写 api key, 还有默认的模型。具体怎么填写呢?一般 api 中转站都会有一个开发者说明文档,你可直接把这个链接丢给你的 ai, 然后 告诉 ai 你 哦,在 cc switch 里面配一个 api, 然后让它给你对应要填写的信息就可以了。配置好后,点旁边的魔术棒图标测试一下,只是运行正常就说明成功了,点起用就可以。现在你可以打开 cloud code, 输入你好你是什么模型, 他会回复你,能正常对话就说明一切配置完成了。接下来你可以试着给他一个简单任务,比如帮我看看当前文件夹有哪些文件,按列表类型给我一个清单,他会真的去执行,然后把结果告诉你。到这里你已经装好了 cloud 扣,配好了格式化界面,接好了模型。 下一步建议从简单的任务开始,比如整理文件,总结文档,过程中遇到报错也不用慌,截图丢给任意一个 ai 聊天工具问基本都能解决,慢慢熟悉以后再来尝试更复杂的任务。这是 cloud code 系列的第一篇,后面我会继续讲如何用它来做更复杂的事情,有哪些进阶工。