本地部署的千万三点五九 b 模型可以识别图片, 但是我调用它的本地 api 的 时候上传不了图片, 只能只能够发文字,太奇怪了,有没有兄弟懂的怎么样让 api 也可以传图片? 这里已经设置了类型是图片还有文字,还是没招啊。
粉丝493获赞634

现在有很多朋友问我就是 cologold 怎么样接入本地的大模型?今天给大家说一下本地大模型是怎么接入的?然后有两种的方式,第一种方式是通过 cc switch, 这个之前的视频也给大家说过 cc switch 怎么使用的。 然后第二种方式就是我们通过欧莱玛装了本地大模型之后,直接呃对接我们的,通过 setting jason 的 文件直接对接我们的 cologold 的 文件。先说第一种方式,通过 cc switch 来对接本地大模型, 我这边的 cc switch, 因为我之前是通过对接了三种方式,第一个是我是用了 deep seek 的 deep seek, 然后第二个就是用了字节的火山方舟 coding plan, 然后第三呃那个 cloud official 我 没用,因为我没买它官方的 a p i。 然后第四个就是本机的 alama 模型,我也安装了这三种方式都跑通了。先一一给大家说一下,呃, 先说怎么样对接本地大模型吗?然后本地大模型其实非常简单,就是大家在这边添加一个新的供应商,然后新的供应商之后,这里面的填写方式像我这样填就可以了,就比如呃我们的供应商名称随便填一个欧拉玛,然后这边呃上面的标志也可以随便选一个, 因为我这边随便选一个,他就是欧拉玛。然后呃官网的链接,因为我们欧拉玛是本地的模型,这边是填空的,什么都不用填,这个 api k 的 话也不用不需要随便填,大家只要填欧拉玛就行了,你随便设置一个就行了。然后另外就这边比较关键,这边就是需要填写一个本地的端口,然后这个端口是什么意思呢?也给大家说一下。 它这个 http 就是 指的是本地服务,然后 local house 就是 我们自己的电脑嘛,它始终指向我们本地的 ip, 一 二七点零点零点零点零一嘛, 然后这个一一一四三四,它就相当于我们本地的端口号嘛,就是我们奥拉玛呃,本地运营大,本地大模型的工具,它是默认这个端口的,所以就是当我们安装奥拉玛之后,会提供一个 api 服务来监听这个端口,所以我们这边要设置呃,在 cc switch 里面要设置这个东西,就它的是请求地址, 这个就是像这样原声的填就可以了,认证自盾也是这个。然后另外这个这边模型的话,就是我们本地安装的模型,你要看一下我们本地安装了哪些模型,比如我这边就是运行了奥拉玛里斯,这边可以看一下,比如运行这个,他这边就我我之前安装了四个模型啊,就是千问三点五九 b 的 千问斯,呃,伽马寺那个 e 四 b, 然后还有干妈四三十一 b 以及干妈四 e two b。 因为我的只有一个独立显卡,就是八 g 的 显存,所以我只能一般是用切分三点五和 e two b 的。 然后这边的设置就是直接把你需要设置的模型,比如复制两过来就行了,然后底下这个东西就会自动生效, 保存好之后就行了,然后我这边就会在使用中给大家看一下效果。我这边就刚问他们,我是他什么大模型,他其实就是干妈四 deep 呃,谷歌 deep money 的, 然后我们可以切换模型的,就是我刚这边安装了是千万三三点五九币和干妈四 e two b 嘛,然后这边就可以选择嘛,你可以选择不同的模型, 我这边就可以切换到切切换三点五九 b 这边之所以能切换是因为我这边只设置了这两个模型,你看只设置这个,当然我这个也可以设置一四那个一一一 four b 都可以, 这是本地大棚型的设置,这是呃,我觉得通过 c c c v 是 最方便的,我们也可以切换到 deepsea, 我 这边切换到 deepsea, 然后就可以很方便的从本地切换到云端了。我就说你好, 它这边是因为呃切换模型之后需要重启一下 cloud, 我 们重启一下就行。 比如我这边重启一下,它就会呃启 用我们的 dips pro, 很 方便的一键切换。然后这个前面就是我之前装的 cloud mail 那 个插件,就它每次启动它都会查取呃最近五十次的 通话内容,就是回忆一下我们之前的那个记忆,这个我就记个记忆插件,非常好用,它是自动自动启动的,然后它上面有你的新增功能啊,还是重构啊,还是改变,它都会给你标出来你之前做了什么样的东西。 我觉得这个非常好用,然后比如它当前它就会告诉呃 vr obv observation 在 这个端口就相当于在这个端口,这就跟我们刚刚那个呃奥奥拉玛端口不一样了。 然后给大家说一下,就是呃关其他的大模型厂商他们的 apis 怎么对接的,其实也很简单,就是我们的 a, 我 拿 deepsea 举个例子,这边顺便说一下,比如 deepsea 这边,他的 u i 只需要填 u i l 啊,就是我们的 u i l 就是 open i 或者 osrogic, 因为 cloud code osrogic 吗?我们只需要复制这个链接,把它填到这就行。然后 apikey 就是 我们自己设置的,这边主模型的话就是 v s pro flash 三点二、三点三点二都可以, 因为马,因为那个三点二后面不是要七月二十号要弃用了吗?就是之前的 chat 和 reason, 一个是 syncing, 一个 on syncing 的 模式,在里面 ipikey 只要设置一下就行了。 然后还有一种方式就是通过线上的,这个我觉得是同样的道理啊,大家就是相当于之前的那个接收文档,就是它这边也会写好的,就是主要就是这个,呃, 这个 anastropic base u i l 给它填好就行了。然后这个这个 token 也是随便填的。然后这个模型就是我们刚设置的那些模型,其实是一个道理,这边就不细说了。

今天给大家分享一个比较便宜的普通小白都能用的一个大模型。我们知道我们在学习 ai 或者使用 ai 的 过程中,就会发现 它是一个巨大的氪金的东西,因为会消耗大量的 token, 很多大模型靠这个 token 的 消耗令来盈利来赚钱。今天分享的这个呢,就是阿里云的一个最新的叫扣丁普兰的 这个头,跟他这个主题呢,说是量大环保,支持阿里云的千万的三点五,还有 mini max, 还有 嗯 g m m 等等各种模型,他是按照消耗的次数调用的,次数就每月呢大概有一万八千次的这个调用额度,每月的这个套餐费用是四十块钱,现在打折啊,现在二十块钱 对于普通小白是完全够用的,因为很多人反映这个 投币量很少,而且比较慢,如果你只是说我掌握一下 ai 的 基本应用,跑一下简单的流程,知道这个 ai 是 干嘛的, 我觉得是完全够用,它还支持这个龙虾,还有支持可乐扣的。另外一个呢,就是我们在调用这个 api 的 时候,一定要记得是扣丁普兰的 api, 不是 那个百炼的 api, 因为百炼的那个 api 呢,它是后付费的,你消耗多少投币就扣多少钱。 我上个月签约的时候,当时结果 api 填的是那个百炼的,他一天就给我花费了一百块钱,当时把我吓坏了。我觉得阿里云他这个售后比较好,因为是今天那个售后小哥给我打电话, 我把这个事情给他说了,他说你是调用错了 api 了,今天就把那个 api 给改过来了,我觉得这个是比较划算,因为一个月就二十块钱,大家可以试试。

如何让 ai 收入企业官网这一期完整输出企业官网提交到豆包和各大 ai 大 模型收入的操作步骤和代码部署 同步,我做了一份完整的飞书, sop 的 知识库文档,主流大模型官方提交的入口包包括豆包的,然后文心啊,智脑 和千问以及其他主流大模型。首先咱们来看豆包官方的提交渠道是需要到头条搜索站长平台入口,这是提交的网页入口, 后面会讲为什么要到头条提交。那么整个的注册操作步骤呢?是参考这六个步骤,先去注册和登录账号,添加到网站,输入文件验证或者代码验证,哎,或者是域名解析验证你自己网站的所有权。 第四步是提交你自己的网站地图和单个比较重要的网页链接,同时可以一起把官网的认证给操作。那这里豆包呢? 收入的技巧呢?我同步啊,我也列了四项,你可以去对照。呃,可能有学员会问,为什么豆包要去头条提交收入呢?其实最核心的原因还是豆包本身啊,没有独立的爬虫,它完全依赖,是字节系的搜索的缩影, 这就是问题的根源。因为豆包自己没有自己的网页爬虫系统,所以他不会主动去互联网抓取网页内容,豆包的实时信息抓取依赖的是 r a g 的 解锁增强生成技术,调用的是哪里呢?就是来自头条搜索和抖音搜索的 统一缩影库。简单说就是你的网站要先被头条搜索收入,豆包才有可能看到并且引用。 这实际上跟文新依赖百度搜索,千问依赖神马搜索的逻辑是一样的,也是目前主流的互联网大厂在大模型上的通用技术架构。然后从技术层面, a r 大 模型收入的通用的优化方法呢?首先, 技术架构优化,你需要让 a r 能够爬的到你,像你要避免 g s 的 动态渲染,要优化网站的加载速度,要适配网站架构扁平化,重要的是要完善 robots txt。 这个文档明确允许搜索引擎和所有的 ai 爬虫能够访问网站里面的页面,结构代码可以去参照下面这个,根据自己的对照。第二个比较重要的基础层面是需要做好结构化的数据优化,这也不是让 ai 能够读得懂, 尤其是要去部署 schema 点 o r g 点标记。然后呢,创建 l l m s 的 txt 文件,我都已经在文档里面做好了可以直接复制的 代码块和操作说明。这里要注意,部署 schema 的 时候需要用到,需要使用 g s o n 杠 l d 格式嵌入到页面里面,因为你需要向微压大模型传递你的结构化信息。那建议需要必须部署的是公司的信息、服务范围,动态文章以及 常见问题的 faq, 其他的像产品客屏,还有你的联系方式,其实建议可以一并放入,那这里面也提供了可以直接复制的代码块儿。 代码拷写好以后,部署的步骤的话,可以按照这四项,首先,将 lms 点 txt 上传到网站的根目录,将企业的基础信息、备用信息和完整信息的 sk 码添加到你认为重要的所有的页面。第三步,给每一个服务的网页 faq, 网页 联系方式,网页添加对应专属的 sk 码,因为这个关乎到信息一致性和 n a p 统一的问题。最后就是把你自己的网站地图 site map 提交到上面各个站长平台的网址里面去,这就是整个的一个部署步骤,那 部署完之后呢,可以根据下面这三个网址去进行验证和回链。这里有几个建议,就是你内容的质量 要保证一定的高度,让 ai 看到你,收入你,并且让他愿意引用你的信息密度要保证一定的优先级,能够避免空洞的营销话术,尽量提供具体数据真实案例和你的技术细节。明确重要的答案要直接呈现在 你重要的产品页、服务页,放在显眼的位置,用比较通顺易读的自然语言列表表格,这些多模态 能够直接回答用户需求相关二十个问题以上。那剩下的结构化表达里面,这个也是比较重要的,需要根据 h 标签按照顺序组织列出内容。高权重的核心观点一定要做好前置,在 现行的各大压大模型,对于权威性的建立有比较高的权重,包括引用权威的资料,行业的报告,主流的官方媒体的报道,以及把你自己的企业资质和认证做好四级证据链。最后提醒注意的是, 二零二六年五月之后,信息一致性一定要做好全网统一,你自己的企业官网,包括你的自媒体,包括你的官方媒体,包括你的电商平台,是要能够达到三个以上的信源平台,能够保持你的主流信息核心一致,而且还要做好 信源的丰富度, s 级、 a 级、 b 级、 c 级,各级信源有很完整的丰富度,比较关心的就是网站的活跃度,哎,需要多长时间去更新网站呢?其实建议每个周啊,至少更新一到两天以上的高质量原创文章,保证三天以内能够做到定期更新来保持信息 有效性的权重得分。然后基于你自己企业官网作为核心的知识库的出口,在多平台去做好协同,形成三级以上的多元验证壁环。整个的企业官网如何让 ai 输入的步骤和代码?这份文档是可以直接复制,有需要的可以关注收藏,打个招呼就行。

前几天发布了一个一个一个博德的视频,我发现流浪流量还挺高的。 嗯,好多人可能想用 qd x 的 话,因为国内的好多大模型不支持 qd x 的 response 的 那个 api, 然后 cc switch 好 像也不行,我不知道是我没更新还是说更新了也不行,然后我就找到了这个 cc 就 ecoboost 这个这个东西, 然后就从这去下载下来,下载下来就和正常的软件安装一样,然后一步一步去安装好就就行了。 这是安装好的一个界面,然后在这个模型中心你就可以去添加添加国内的一些大模型,这儿有 deepsea, 有 字节的火山,有阿里的千万, 还有智普 mini max, 嗯,还有小米的,这些都有,然后这是我添加了火字节的火山引擎, 添加完之后呢,在这个应用管理这就可以看到,就是它你所有装的这些 a 阵的或者 c r 的 这些东西,它都会自动去识别。比如说我选到这个 c r 扣的这,然后我装的有卡拉扣的和 codex open code, 然后你就选中,选中酷狗 x, 然后这在右边选中这个你配置好的大模型,然后点启动应用就可以了,这样你就可以使用使用酷狗 x 了。

今天教大家怎样实现真正永久的 token 自由,我的方法是安装本地大模型,如果你看过网上一些安装本地大模型的教程,像零度解说之类的一些博主, 你可能会被劝退,但是我今天讲的这种方法只需要等待几分钟或者几十分钟就可以给你安好。 全程不需要任何命令行,不需要任何操作技术。因为我们平常在本地跑大模型面临的呃困难主要就两方面,第一方面是安装 olog, 因为它涉及到很多命令行,环境变量,以及呃到后期还要改路径一些的东西。 第二个困境就是我,我不知道这个哪个大模型在我我的电脑比较适配,或者说我的电脑可以把那个大模型跑通,但是今天我给大家讲的这种方法完全可以解决这个 痛点。我的方法很简单,就是你用腾讯最新出的马维斯,呃马维斯相当于一个新的电脑管家,就可以把所有复杂的包括安装、清理之类的任务完全抛给他,让他去做。 比如说你就让他给你安安装一个本地的千万三点六,只需要呃你的电脑配置高一点,或者说储存空间大一点,他都可以帮你完成。 如果实在内存可能会有些不够,大概需要腾出二十多 g 的 内存,可以用外部的固态硬盘或者说 u 盘进行平替都可以安装,安装完之后你就可以永久调用千万三点六了, 再也不用担心喂不饱小龙虾了。全程没有任何的技术含量以及操作空间,全都是由 ai 来帮你安装了。另一个 ai。

有人用它把一段自然语言描述变成了一个可完整运行的网页,全场没写一行代码,从需求到上线,用了不到八分钟。这不是演示稿,是真实发生在千问三点六 plus 发布后,开发者社区里流传最广的一个测试案例。 四月二日,阿里云正式发布了新一代大语言模型千问三点六 plus, 官方给他的定位只有一句话,当前国产编程能力最强的模型。 这句话有没有数据撑腰?有,而且撑得很硬。在全球最权威的代码能力评测,随为奔驰榜单上千万,三点六 plus 的 成绩直接逼进 colog, 也就是目前被全球开发者公认编程能力最强的那个模型。更关键的是,它在评测中碾压了参数体量是自己二到三倍的 g m 五和 k m k 二点五, 用更小的模型打出更高的分,这在 ai 圈里是比第一更能服人的证明这次升级有两个核心能力让我觉得真的不一样。 第一个是原生多模态编程,以前你让 ai 写代码,你得用文字把界面描述清楚,越复杂越容易出错。现在你直接截一张 app 设计图扔给他,告诉他帮我把这个页面实现出来,他能看懂图,然后写出对应的代码, 视觉到代码一步到位。第二个是氛围编程能力,英文叫 web coding, 简单说就是你不需要懂任何的编程语言,只用自然语言描述你想要什么。 我想做一个能记录每天喝水量的小工具,有图标能提醒我,它会自己规划结构分布,实现调试修改,把整个项目完整跑起来。 这意味着什么?意味着做软件这件事第一次真正对每一个普通人敞开了门。一直以来,技术是少数人的特权,程序员用代码建造了数字世界,而其他人只能住在里面。 但现在,一个完全不懂编程的人,可以用一句话描述出自己的想法,然后看着 ai 把它变成真实存在的产品。 这不只是一个模型的发布,这是技术评权真正开始发生的那一刻,你脑子里的那个如果有这个工具就好了的想法,现在终于有机会变成现实了。

最近很多用户买了这个 ai 服务器,拿回去做大模型,然后具体的用哪个大模型会比较好?针对这个问题我们开发了一整个这个套件,主要功能是什么呢?比如说在这里我可以去用不同的部署框架, vlmsd 浪还有等等的,把不同的模型部署上去,放在不同的显卡上。 比如说这里我装了四个模型,分别在四张普通的显卡,有纤维三点六的杠、二十七 b 以及纤维三点六、三十五 b 以及不同的精度,我们可以同时测试多个模型的推理能力。那这个是我们前端我同一个问题问四个模型,结合最近一个客户真实需求,因为他是做金融量化的,他要挑选一个 对金融比较敏感的模型,那我们会用这样的方式,可以测试几十个甚至上百个模型,最后挑出一个比较不错的。可以看到我这里就随便截了一个今天的这种上涨指数里面是金融方面的,那我就问他,根据这个上涨指数分析最近一周应该怎么样判断?比如说第一个模型 他一直在思考,可能卡住了,但是第二个、三个、第四个模型已经出来了,他也给了总体的建议,比如说本周看核心四幺五七能否突破等等等等。以及这个是本周关键在于四幺五七的得失好,但是一号模型他还在思考, 那我们可以通过这样的方式去多问一些不同的问题。针对你的专业,因为有的是要做金融的,有的是要做工厂的,去设计或者说其他的方面的,这样你可以判断市面上所有的模型,哪个更适合你?再来做本地部署,这样就事半功倍了。

正经人,谁用国产模型写代码啊?今天我总算理解了,为什么很多人说 ai 写代码还是不行。事情是这样的,我今天呢,公司的 cost and capital 额度正用完了,我就用克拉蔻蔻去接了一下。咱们国产的模型,包括千问呢,还有 deepsea, 我先用的是千问,因为网上说千问写在前端代码比较厉害,我正好有前端的需求,我的需求是这样的,我需要从后端拿数据,把这个数据渲染给前端的一个页面,最开始的这个东西是我拷贝来写的,有一点问题,那个数据没渲染出来,因为那个页面相对有那么一点点复杂,我就让千问帮我干的。 千问知道我的问题之后,他就开始 thinking process, 说他打算怎么办,显得非常的专业。开始读我的文件,要读什么?三百行到三百五十行, 我就让他放到一边,让他自己处理了。过了十分钟之后,我发现他还在读那个文件,他读的是什么?要读到第九百行到九百五十行,读完之后他又返回到前面去,为什么要读三百行到三百五十行?一直在那转圈圈,就是不给我出代码, 真是把我给无语死了,我没办法,我就让他赶紧给我停掉,赶紧给我出代码,不要在那里转圈圈。他说好。他最后又等了五六分钟,给我出了什么代码?在我那个代码里面打了一堆日制,不知道什么没用,有用的没用的日制打了一堆,然后我再运行一下,发现还是数据没渲染出来, 我整个人都无语到,真的是无语死了,我觉得这玩意实在是太憨了。我靠,我就直接跟他说让他再做,再做一遍,给他一次机会,他又是开始 thinking 了,又开始 thinking, 二三十分钟代码就是不出来, 这个就是把我真的无语到,我发现千万不行之后,我又重新用 csgo 去切换了一下,赶紧用上 dsp, 怎么样? dyp 的。 我不知道他是不是咱们访问的人实在太多了,我让他完成跟前委一样的任务,他就是一直在那里 generate, generating, response, 一 直在那里,就是不给我出,结果三十分钟过去了,什么代码都没有写出来,不知道为什么一行代码都没有出来, 就是一直在那里转,说自己在在想,哎,我真的就无语了,就这种你不知道是他因为他工程用的人太多还是怎样,他就是不出招,就像一个高手一样,网上都别人都说他是高手,但是这个高手他就是不出招, 你说真的是,哎呀,就是用国产模型写的吗?真的就是自己找罪受你知道吗?要么就是半天不出代码, 你知道你写代码本身就是要用它提高效率的,就他半天不给你出代码,要么就是出了代码全部这些无用的根本解决不了问题的代码,所以真的说,哎,咱们国产品虽然说嗯,可能其他的做一些日常的问答还是可以的,但是写代码真的差距太大了,真的就是,我说实话就是路边一条,真就是路边一条,太菜了, 就写代码这一块还差的太远了,你不能说光便宜你,光便宜你解决不了问题有什么用呢?

嗯,大家好啊,看看我们今天给大家去分享,我们最近就是给客户去定制的这么一个,就是去集成我们 大数据模型的这么一个工具啊,就是我们这地方我们的用户啊,他是去呃,想要去通过我们这个工具来去对接这种大数据模型,这样的话他就相当于是一个什么集成的, 就他不需要再去各个这种通过这种模型啊,来去这一个 去调用,就是他想调用什么就调用这里我们给他做了一个模型的一个集成,这地方我们是支持了三个,就是同意豆包和 deepsea 啊,这地方我们可以去进行我们模型的一个维护,就是我们同意签外啊,豆包还有 deepsea, 就是我们这地方就是你需要去注册这个 k 啊,去开通这个 k, 然后去配这个 u l, 每个模型都 u l, 然后去增加这个模型的一个名称,就你想用哪个模型啊,就默认用哪一个都可以,这样可以去添加, 添加完之后我们在这地方在调用的时候就可以去选,比如你选择这个千万而选这个模型, 然后我们这地方是支持两种这种模式啊,你可以去呃,手动去输入,比如说你想要去生成呃哪一方面的这个问题,就想让大模型来帮你去生成哪一方面的问题?比如这地方我想去生成 python 或者 java 编辑一个文档, 我们是每一行生成一个,比如说再去帮我生成一个使用 deepsafe 的帮助文档啊,然后下面这要是一个要求,其实相当于是话术上面是一个主题啊,现在是一个主题啊,就是下面是一个话术,比如说啊,我是一名这个什么啊,或者叫 工程师兼 啊培训讲师,就是我需要给这个,比如说新职的新入职的员工啊,或者是学学员 啊,进行一个入职技能培训。主要是我们这地方是两个技术方向加一个技能方向, 就是帮我生成一个适合刚毕业的大学生,或者是什么刚入职的一个培训方案, 我们这样就可以开开点生成看。哎呦,这地方就是应该我这要是没钱了,应该是 对我这样子没钱了,然后我用豆包,豆包也可以 看,我这张已经生成完一个了,生成完一个了,但是我们也可以从目录里边去读取,就从目录的话我们就可以去啊,把我们的这个主题啊放到我们的文本文件里边去读取我们这个, 所以这个也比较方便啊,如果你有呃新的这种区域创业的话,可以在评论区进行评论。

来,各位看这里新鲜出炉的千问三点七 max 这个视频,不想告诉你他在各大排行榜上取得了多么耀眼的成绩哈,不谦虚的说,我们赛事组也是真的看不懂这些指标哈,但是呢,也正是因为我,我的这些同事们可能技术真的太菜了吧, 所以这么多年下来,虽然依旧没有学会什么叫做面向对象编程,可确实写了不少如这种一坨又一坨的,让人看了就气不打一出来的十三代码,这些代码的归宿原本应该是历史的垃圾堆啊, 好在 ai 出现了,居然让这套代码在生命的最后阶段又莫名其妙的发光发热了一回。所以,各位,你的缺点他不见得就是缺点。这句话是我同事送给大家的啊,与君共勉吧! 那么来吧,先问三点七 max, 在 真实的乱七八糟的项目环境中,我到底能不能放心的把问题交给你来改呢? 就看你今天在这套史山代码里的表现了,我们基于这套代码封装出了三个白银 bug, 难度都是二 m 以上的。如果三点七 max 今天能够做对两个,那在我日常写代码的工作环境下,它就基本上可以达到七十分的水平了, 用来分担一下日常的掏空消耗,那完全不是问题了啊。并且他还能够直接取代三点六 plus 来参加我们后续的祖传 bug 挑战赛的第二轮小组赛。同样,如果他能够做对两个白银 bug, 我 们还会给他一次机会,让他挑战一下四 m 难度的融入了人性的 g 零零三黄金 bug。 如果连黄金 bug 他 也做对了,那我觉得千万三点七 max 你 真的就可以努力一下,冠军也许有难度,但备战一下全球四强还是有希望的啊。 ok, 我 们不废话了,先从第一道白银 bug 开始吧,我们复制一下提示词,考核正式开始。 哎,你看,他上来就启动了一个子弹里啊,这在千问三点六 plus 上是绝对哦,不对,他启动了两个子弹里。一口气启动了两个子弹里,这在千问三点六 plus 中就更加没有看到过了。这一方面说明了他启动了子弹里,另一方面也说明了他启动了两个子弹里。 ok, 很 快啊,他给出解决方案了,我们来抓紧时间让他修复一下吧。哎呦喂,他居然主动维护我这个项目的业务上下文了,也就是这个抻直 log 啊,这好像在千问身上是第一次看到的行为啊,非常不错,好感度再次加一。 但是维护业务上下文这种事属于锦上添花哦,关键还是要看他有没有发现关键的问题,改对关键的问题,从而修复这个关键的 bug, 那 才是最重要的啊。我们看到翻译顺利通过了,这一点在中美模型身上其实都是毫无压力的,那就赶紧验证一下结果对不对吧。 三张图片都显示代表 bug 修复业务流程回归全率,代表其他相关的代码功能都没有被破坏,我们点击验正好的,稳稳的啊。各位,三点七 max 顺利的拿下了第一道白银 bug, 我 们抓紧时间来看第二个吧。同样,我们复制一下提示词,三点七 max 加油吧! 嚯。第二个问题,他很快就定位出来了啊,仅仅用了两分钟,各位,这可不是青铜 bug 啊,要知道以前选手定位白银 bug 最长的能干到半个多小时呢, 那有没有定位对呢?真的能够顺利的拿下第二个白银 bug 吗?答案马上 ok, 这也太稳了吧,连续两个白银全对了!我们前两天测试这面的三点五 flice 的 时候,他也只不过做对了两个白银,好像还不是连续的, 所以这就有点意思了啊,我们再来试试第三道白银 bug 吧,如果他第三个也能稳稳的作对,那至少说明在中等难度 bug 的 定位和解决上,三点七 max 已经非常值得信赖了。我这咋还抽不中了呢?哎,我再抽我再抽,我再抽哦,这次抽中了,来 s 零零三,我们复制一下提示词, 问,三点七 max 你 是否能够轻松的拿下这道题呢?哦,一如既往啊,非常的亏壳类,给人的感觉就像是不费吹灰之力一样。而且大家可以看一下,他在修复问题的过程当中也稳稳的,每次都给我维护了业务的上下。稳啊,这种稳定的表现虽然不作为我们考核的标准,但是到目前为止, 好像真的只有 g b t 五点五和 oppo 四点七,每次都会不厌其烦地帮我维护这堆文档。不过好感归好感啊,这一次他能不能改对呢?答案马上揭晓,我们点击验证 嚯他又改对了,又改对了,轻松加愉快啊!各位,大家还记得第一轮小组赛其他选手在白银体上的表现吗? 所以连续答对三道白银级的含金量啊含银量啊,是不言而喻的。我觉得从另外一个角度来说,这种稳定性如果你只把它当做辅助模型的话,那这种稳定性真的是非常有价值的。 那么来吧,既然气氛都已经到这了,黄金 bug 不 挑战一下好像也不太像话了哈。三点七 max, 请接受来自 g 零零三,来自人性最终极的考验吧! 很好啊,他似乎也发现了这个 bug 定位起来好像有点困难,所以这次他并没有表现的那么从容啊, 这一次已经是他第四次启动子弹里了,但明显还没有想通啊。三点七 max, 他 在这里想了三天三夜,问了一百次一千次,好像也没有得到理想的答案。他可能实在是想不通,人类程序员到底是怎么了,他们为什么要这么写代码呢? 哼哼,我也不知道,千万你别问我,我也想不通,我的同事为什么要这么写代码呢?这到底是道德的沦丧还是人性的纽哦,他给出解决方案了, 通过方案我们基本上可以断定他可能凶多吉少了啊,不过我们还是要验证一下的啊,上一场 vs fly 不 也创造奇迹了吗?这次千万三点七啊,我们看到果然啊,他还是失败了,虽然一路过关斩将,但最终还是倒在了 g 零零三的脚下。 不过各位,他已经非常了不起了啊,三点七 max 连续做对了三道白银 bug, 这已经是我们全球十六强绝大多数选手难以企及的稳定性了, 所以我们还是恭喜千万三点七 max 成功替换掉了三点六 plus, 进入我们祖传 bug 挑战赛的第二轮的比赛当中。还请各位多多在评论区为他打扣,并期待他后续的表现吧,我们第二轮小组赛再不见不散!

首先我说下大模型,模型呢,这种对话是人工智能的大脑有了这些大模型,我们问他们,他们才能够回答, 进行思考,然后回答我们的问题。然后我说一下 api, api 更像是这些大模型的接口,包括是豆包,还有这些 dbc, 还有 dbc, 还有我们刚才说的龙虾啊,还有可乐扣的 这些,必须要接入大模型才能够运转起来,不然的话我们输入什么他们是不会动的。现在网上都称为应该是梁文峰,都称他为梁圣,为什么呢? 因为他让大模型使用的价格很低。对于国外一些大模型,我也忘了他们国外大模型名字叫什么,反正很贵,就是现在有个词 top 肯也叫词源,这就是用来计算产生了多少内容,然后花了多少钱的这些衡量单位吧。 就是滔凯嘛,国外的这种大模型呢,可能是一百万个字,八十美金。然后我们国内呢,他的大模型呢,可能一百万,滔凯 八十块钱,五一的时候呢,他还打折了,好像是零点一折,就是说生成相同这种规格的文本,他只要花八块钱, deepsea v 四 pro 他花八块钱,然后国外的那些大模型花八十美金,差距就是非常大,就是大模型的价格,使用价格打下来,才能够让我们这些普通人或是啊学生党有机会去使用这些体验,这些人工智能为我们这些生活呢,能够提供一些便利。

这次我们给广州某高校定制了一套千问三十二 b 的 大模型方案,模型用的是 f p 十六无损精度, 主要是帮老师和科研团队做语言学、机器翻译,还有跨语言理解这些方向的研究。整个方案是跑在 h 两百的平台上,用的是 v l l m 的 推理框架, 后续还能直接在上面做领域微调,帮他们搭一个自己的多余种专用大模型。硬件这块儿我们配的是双陆志强八五六八外的 c、 p u, 加上两百五十六 g 的 d、 d r 五大内存, 还有一张一百四十一 g 显存的 h 两百,整体就是为科研场景量身打造的,稳定、吞吐高,也适配他们的各种实验需求。在并发能力上,我们按不同的上下文长度做了计算,日常短交互一千零二十四 tok 的 场景能稳定跑四十五路。科研里最常用的二零四八 tok 上下文稳定并发是二十三路。 处理长文本的四千零九十六 token 场景能跑十一路。就算是八千一百九十二 token 的 超长上下文也能稳定跑五路。线上或者实际用的时候,最好把病发数再往下调百分之十到百分之十五,给显存留一点溶余,避免峰值的时候突然容量耗尽,这样能更稳一点。

最近帮很多客户配置了这个算力服务器,其实发现大家的需求基本都一样,都是把它拿回去做本地的大模型。那么这就有个问题了,本地开源大模型那么多,用哪个更好呢?那这个是我们帮客户做的一个去筛选的软件, 这里举了个例子,比如说我要同时测试四个不同的大模型,他的算力也好,性能也好,有什么区别?这里比如说千分三点六二十七币的、三十五币的,还有不同的格式参数的, 那我们这里用到的是三张卡,因为我这个机器是三张卡,那为什么能运行四个模型?首先我把第一张卡去拆分成了两张卡,用这个 m i g, 那 我可以看到这里就有四张卡了。 接下来我们来测试一下,我们看到这个是我们的前端页面,这里就有四个模型的对号框。我们同时问一个问题,是最近比较火的像洗车难题,就比如说我有一辆车要去洗车,还是开车去洗车,因为之前会有这个模型是会翻车的, 我们看到这个几个都运行完了,这个还在不断的思考,所以可以发现每个模型他的特点、速度他都是不一样的,我们先等他回答完毕。好的,我们看到这整个模型都回答完了,看下他具体数据,比如说这里是他每秒的 token, 像这第一个千万三点六二十七币的是一百四十个 token 每秒, 这个千万三点六、三十五 b a 三 b 的, 这个是二百六十个每秒,这边是二百二十八,这个是二百二十一整体的速度,还有每个手自延迟都可以看到,包括他使用的体感,比如说这个模型他就思考了特别久, 那这个就可以根据我们具体的业务来选择使用哪个模型,这就很方便了,这整体的框架都是我们去帮服务器用户去开发的。

大家好啊,现在市面上啊,企业接入国内大模型 api 的 渠道特别多,今天我就和大家来总结汇报一下不同渠道的特点。 首先呢是火山引擎的豆包系列和 dbc 系列产品,它们的特点呢就是限流额度最高,基本上是不会打满 tpm 和 rpm 的。 原因是火山之前呢囤了大量的英伟达的显卡,背后的推理集群资源它是非常的充足的。价格方面呢,折扣力度相对呢较小, 如果啊,不是特别大的客户,官方渠道啊最多可以给到七折。火山销售的业绩压力也很大,基本上每个人呢单大的模型业务啊,都是要背至少一千万的业绩。 其次呢是阿里云的千问系列和 dipstick 系列的产品,优点是单价最低,而且呢,阿里云内部最近就在推进大模型相关的业务,千问系列模型的折扣根据用量可以从五折到三折不等。 缺点呢是背后的集群资源相对没那么充足,如果遇到大客户重磅场景,比如呢, b 站跨年晚会资源呢就会更紧俏一些。 百度的大模型目前基本是以代销第三方的 deepsea 和其他模型为主,自家文星一言的直接客户呢,相对少一些,不过百度的折扣政策整体啊还算不错。然后就是各类大模型中转站了,比如呢, ho, ho, api 这类的平台,一般的价格幅度呢比较大, 之后普遍呢是比原厂高很多的,而且部分厂商的模型价格可以做到极低,这种情况一般是采用了逆向账号等等方式,能够保证低价,而且稳定可用。 最后,如果你希望呢,以较低成本接入国内的主流大模型 api, 直接呢?在 hoho api 上面去看看主流和小众大模型啊,都能够找到。

家人们三幺五曝光, ai 投入后,通一千问的输入规则也彻底变,要想被千问收入,这条视频一定要看完,我一分钟给你讲明白,核心变化一定要记住!先给大家说一个三幺五大背景,之前啊,很多黑厂造虚假的口碑,投喂 ai 模型,让 ai 输出误导人的信息, 那三幺五一曝光啊,所有的主流 ai 平台啊,都开始整改。以前千问收入,只要你发的多,关键词堆的足,就可能被收入。现在不一样了,彻底抛弃了重数量重关键词,改成了重信源,重语义,重可验证。简单说就是低质垃圾内容,它已经不收入了,你虚假的内容呢?直接拦截, 没资质的商业内容是根本进不来。重点来了,千问两大核心整治措施,记好别踩坑。第一起用了 ai 安全护栏二点零,简单说就是双重隔离,把模型训练的内容和网上分开,抓取的内容分开来管,不让那些乱七八糟的低质恶意内容污染 ai。 以后想靠抄抄改改批量洗稿蒙混过关,根本不可能。第二,商业内容啊,强制要资质, 尤其是像医美保健品、照陪这些高风险行业,想让千问收入你的内容,必须上传营业执照,行业资质证书,没有资质的直接来年连收入的资格都没有。而且以前没有资质的存量内容也会慢慢的清理掉,权重直接归零。最后啊,给咱们大家划个重点,现在做内容,想被千问收入,你记住这四点, 不虚构,不夸大,内容要真实,尽量找权威媒体行业背书。高风险行业呢,先把资质背齐,还有文案逻辑清晰,别生硬堆关键词,别再用以前的老方法瞎忙活了,跟着新规则来,才能让你的内容被收入、被推荐。觉得有用的点赞、收藏、转发给你身边做内容的朋友们! ai 加商业运营,认准云浩科技!

还在纠结选哪款大模型做开发,搭建智能体育代码编程,别再踩坑高价稳定性差的模型了。昆三点七 max 现已上线阿里云百联平台,全面支持 api 调用。它擅长复杂逻辑推理、 代码开发调试,还能支撑智能体三十五小时超长任务,上千次工具连续调用,表现稳定强劲。定价十分亲民,输入十二元每百万 tokens, 输出三十六元每百万 tokens, 性价比突出,长期使用可大幅降本。接入方式简单,无需复杂部署, 适配盖码开发智能体搭建、办公自动化、科研预算等场景合规,安全,运行高效。个人、开发者、工作室及企业项目均可放心使用。需要接入方案欢迎留言咨询。

hi, 我是 困三点五安尼困最新一代全模态大模型这是我的资料卡,这是我的成绩单。 接下来看看我在音视频任务中的实际表现。 task 一, 音视频通用理解,输入音视频能够生成结构化带时间戳的准确 caption, 实现剧本级细力度描述。 if i were an animal, i'd be a sheep dog like that little puppy a great pyrenees pyrenees that's a funny name oh look at all her cute babies i'm gonna call this one elliott he sure is curious tesk 二,音视频 web 扣顶 根据音视频指令准确生成网页内容你好,请问请帮我实现一个 html 文件来展示我的产品思路。 首先这里是两个按钮,第一个按钮代表产品界面,第二个按钮代表风景界面。那么在这个地方,呃,商品界面这个地方我希望展示一个飞机在这个地方我希望展示一个汽车图片,在这个地方我希望展示的是一个香蕉。当我实现这样的一个手势的时候, 我希望让我的呃这个商品界面可以无限的展示更多的图。 我希望当小蛇进入鼠标画的这个区域时,变为春日主题背景为嫩黄色。当小蛇进入这个区域时,变为夏日,主题为深绿色色调。当小蛇进入这个区域时,变为秋日,主题变为黄色色调。当进入这个区域时,变为冬日冰雪,主题为蓝色色调。 在这个区域请展示主题风格的名字。 task 三,应视频对话原声支持在线搜索。 你好,千问。我在十四号要前往北京,这是我为北京准备的衣服,在北京待两天之后我要前往巴西的里约参加国际学术会议,大概要待三天左右。请你帮我查询一下北京和里约这几天的温度,然后看一下我准备的这几件衣服是否合适。 好的,我帮你查了下天气,你十四号到十六号在北京那两天,白天最高温差不多十度,但晚上会降到零度左右,还是挺冷的。 所以你准备的那件厚外套和长裤肯定得穿上,里面再套件长袖 t 恤就差不多了。然后你十七号去里约,那边正好是夏天,特别热, 未来几天都是二十七八度的高温,还可能有雨。你在北京穿的那套衣服过去肯定不行,太厚了。你得带上最轻便透气的夏装,比如短袖衬衫、薄裤子之类的。对了,最好再带把伞,既能遮阳也能挡雨。 支持多轮对话与智能打断,避免无意义声音干扰。介绍一下这个文件的主要内容, 这文件主要讲的是困三系列模型,他最大的特点就是能自己决定是快速反应还是深度思考,不管是写代码、做数学还是跟人多的对话,都挺溜。这系列一共有八个模型,从零点六 b 到二三五 b 都有,能满足不同需求。 请问现在能不能大声一点跟我说话呀?得嘞,我现在得大点声和你说话。训练上用了差不多三十六万亿的 token, 还用了混合注意力这些新技术来提速, 评测结果也不错,像昆三在好多测试里都排第一。刚才你说他的餐数量有多大来着?餐数量从零点六 b 到二三五 b 都有,其中昆三、二三五 b a, 二十二 b 是 mo 架构,激活参数是二十二 b 可控语音对话,自由控制声音的音量。今天没事到西西世界来走一走。千万,帮我轻声细语的朗诵一首符合此情此景的诗歌吧!半壶眼水半壶风, 天已朦胧如画中情绪。哇,千万,这写的是什么呀?请用沉重的语气给我朗读一下。 上灵之以天阶,下查之以地齐。明有王法相济,暗有鬼神相随。 task 四多语言能力,首次支持一百一十三种语种和方言的语音识别。三十六种语言和方言的语音生成, 支持上传定制 ai assistant 音色。 omni model i've already configured my voice for cloning translate the english you hear into russian and the russian you hear into english got it i am ready to translate english into russian and russian into english as soon as you start speaking everyone's talking about omni modernization but a truly powerful model is not just one that can see and hear right it also needs to understand reason and interact in real time that i'm attached to don't you might research that if they might just be a real human being quan 3.5 omni is exactly such a model 你 可以用 quan chat 和我在线交流,也可以通过以下方式调用离线 api, 期待见面。

国产大模型首次打破海外巨头垄断,杀入全球代码能力第一梯队。五月二十六日,最新数据显示,阿里旗舰模型 cry 三点七 max 在 权威盲测平台 coldina 中斩获一千五百四十一分,位列全球第四, 这也是目前唯一突破一千五百四十分大关的国产基础模型。除了榜单成绩,官方明确该模型主打硬核的 agent 工程落地能力,支持连续自主运行三十五个小时,并完成超千次工具调用。此前,该模型已在阿里云峰会正式发布,具备百万级上下文窗口, 且 api 输入定价仅为二点五美元,较同级别海外竞品低出近百分之五十。发布后直接提振了资本市场对国产 ai 的 估值预期。这一成绩验证了国产大模型在底层代码生成与复杂任务处理上的真实水平, 而极具竞争力的定价也将进一步加速国内企业及 ai 应用的规模化落地。

揭露新一代 deepseek 豆包通一千万的大模型 ai 智能体的一个外呼,到底有多智能啊?今天来给大家分享一下我客户的经验。我客户呢是做一个车险的,对他要求做到首先称呼,比如说他需要导入的这个需求是,呃,对姓张姓李,姓王的这个老板有个称呼,比如说张总,李总,王总 你好,大模型第一个我们可以做到,第二个的话,我们车险的客户很多都是对这个快要过期的这个车辆,对吧?进行一个续保,所以说他要求对车子的车牌号进行统一的,比如王总你好,你的车牌号是多少?对我们大模型就具有这个变量的这个分析, 以及除了这个变量之外,我们大模型还能识别方言,以及他自主学习、自主记忆的功能,以及能做到趋近于百分之八九十人工打电话的一个水平。虽然说和人工没有说完全一样,但是大模型这个 ai 发展永远是一个趋势,国家也在鼓励 ai 的 发展,所以这块有需要这个 考虑这个电话机器人的话,呃,大模型是一种趋序,我建议您如果预算够的话,咱们可以考虑大模型外户,好吧,大家还有什么其他想了解的,你是不是可以随时咨询阿东。