好用的 ai 龙虾都要经历退壳吗?国外这只龙虾从 clobot 变成 moot, 最后变成 open claw, 经历了两次退壳。现在国内的龙虾拷炮也完成了一次退壳,正式从拷炮更名为千问炮。这次拷炮改名本质是想千问开原生态靠拢,强化整体的能力。 从最近更新也能看出这点,为一点零点零做了多 a 制的系统和扣炮本地模型,增强 a 一 点零点一支持质保 ai 模型和增加视频分析能力 a 一 点零点二新增数据及插件系统和对接归机流动。实际体验下来,他在开源生态里的能力和完整性都在持续变化。好了,今天就分享到这里了,希望国产龙虾越来越好!
粉丝215获赞634

本地模型养龙虾,为啥又龙又虾呢?一天一个开源国产龙虾千吻合使用分享第二期大模型本身就不具备联网搜索,联网搜索本质上只有两种方法,一种是调用搜索引擎 api, 正规快速稳定, 但是需付费调用。另一种则是通过爬升解析网页 h t m l 正的受限,不玩低效纳尼,所以我一般使用 sircng, 它是一个开源搜索引擎项目,目前已有二十八点四 k s 三步就能上手使用。第一步,在 linux 部说直接在服务器中执行这三条命令就可以了,执行三个命令后就可以拉起服务。 第二步,修改配置,修改塞进配置文件,在返回参数 format 中加上 json 格式,然后重启容器,接着进入 crayson j 前端页面,设置中直接开启所有的搜索引擎并保存。第三步,千问破对接,进入千问破技能页 面,选择从 skill hub 导入,将 crayson j logo search 这个技能导入,然后进入对话页面,输入,使用 crayson j 技能对接本地 crayson j 服务地址,信息式的内容,就可以自动完成对接了。

阿里突然宣布 coco 正式改名宽炮,这不是简单的改名,而是阿里 ai 生态的大收网。四月十二号,阿里云发布一点一点零版本,同时宣布品牌重塑,所有产品必须姓 kim。 为什么现在改名?因为阿里旗下 ai 产品太乱了,通一千问通一万,向 coco 用户根本分不清。 openai 有 叉 gpt 生态, metata 有 luma 生态,阿里必须打造 quinn 生态,不然就被边缘化。更关键的是, coco 对 标的是 open call, 改名 quinpo 就是 告诉市场这是官方出品。 阿里开源策略也在变,从广撒网转向集中化,全部纳入 quan 统一管理,方便商业变现。说白了, coco 改名就是阿里在下一盘大棋,用 quan 品牌统一所有 ai 产品,形成闭环以后,可能还有更多产品要改姓 quan, 这是阿里 ai 生态从分散走向集中的标志。

六个国产的 ai 模型,加上一个国外的顶尖 cloud 作为对照组啊,同一个项目,同一套提示词,从零开始,写完一个完整的前后段应用, 整个过程全部自费,没有任何广告。最终排名如下,测试环境我们统一有 openroot, 按照模型名称区分了项目文件夹,同一台服务器,同一套提示词。因为之前我家的小猫去世了,然后我做了一个视频,也收到了很多的暖心的评论,他们都提到了一句话,就是我们家的猫猫会和多金一起快乐的生活在天堂里的。 这个就是我做这个项目的初衷啊,其实就是想给一些啊去世的小猫打造一个赛博乐园,然后其实不是很复杂,就像当时我们玩那个 呃旅行青蛙一样,就放置,然后纯挂机,他们自己会有一些活动,但这个提示词你看其实写的也还挺细, 总的来说算是一个比较综合的项目。我的测评思路是这样,第一轮我们先来 one shot, 就是 说看一遍跑完之后这个模型能跑到什么程度,之后我会根据他们第一轮的表现去继续修改, 这时候提示词确实就不一样了,因为我要根据他们现有的情况去说嘛。这一轮其实是说我想去挖一下这些模型的能力上限大概能到哪里。提示词发出去,六个模型同时开跑,先说速度, step 三点五 flash, 它起手就是一百三十 tokens 每秒,这个快到离谱, 但是啊,它过程中会反复的去复读,而且中间直接中断了三次,我都得手动去输入继续它才能够继续跑,这个就真的很要命了,所以导致它的总时长其实比别家还要更长一点。现在二点零千瓦,三点五, kimi, mini max, 它们基本上都稳在四十左右,第一轮的总时长也就是七到九分钟, 只有智普的 glm 五是最慢的,我都是官方 max 的 订阅了,它的起步就只有十三到十五,后面稳住也只有三十,那它的第一轮总耗时有十八分钟,那总的完成时间我们就先摆到这里。这个第一轮我心目中及格的标准就是啊,前端它能够正常,现然, 哎,在画面具体怎么样先不说后端的话,它的登录然后穿图啊,各项功能都正常,这是一个最基本的。 接下来我们来看它们具体的结果。先锋三点五的一个 bug 就是 你在登录之后,它很快还需要你再登录它前端的猫其实还意外的挺可爱的,但是这个视角跟随是用不了的。 c 的 二点零的后端倒没什么问题啊,但它的前端是一直在闪, mini max 的 前端他第一次直接渲染不出来,而且呢,我的提置词里面是已经明确要求了上传照片是必选项,而且还需要做删除的功能,他呢,就直接没做 seven 三点五 flash, 说实话,他在跑的过程中不是频繁的复读吗?就这个事让我实在是对他没有什么信心。 结果呢,在注册登录上以后,上面呢,还有一个这么大的登录框,在上传照片确实是必选项,但这个功能他就用不了,导致我就没法送冒进去,也测不了。前端 kimi 的 k 二幺五,它作为一个大参数模型啊,它的前端能力确实曾经震撼到我,我是真的盼着它能给我个惊喜,结果它的前端就直接没渲染出来,而且我添加一只猫进去,跟随视角那里会直接 bug 成三只,那就只剩我们的质谱了。第一轮的前端,它的地面是在抽搐的, 猫的形象也是有点抽象啊,但是说实话,我觉得它的功能上是唯一一个及格的。所以总的来说,第一轮啊,我印象比较好的其实是千万三点五跟智普 gm 五就是千万,确实是有一个恶性 bug, 但是它的前端还挺好看的,在我这里是加一些分的, 然后智普就是中规中矩,他没有什么错。接下来就是各自去修自己 bug 的 环节了啊。这个过程其实你会对它们模型的能力会有一个很主观的感受, 因为就是你提一个需求,然后他反反复复改不完,那你也没有什么心情去给他再提修改意见了。其实几乎每个模型我都给了两三轮的迭代机会,那我也去直接拉一个表格给大家看,结果大家看着,顺便我搁这解释一下, 千万三加五在过程中出现了一次大翻车,他是把之前好好的前端改的无法渲染了,虽然后来又救回来了, 跟随视角登录,私密公开的功能他也都修好了,我对他的迭代能力总的来说是满意的,而 c 的 二点零,他的迭代几乎就没啥用了。首先这个画面他从始至终是一直在抽的, 而且这个猫太抽象了,甚至怎么还在这个画上放了一个包子呀。 mini max 的 基础功能他都改好了,场景也确实更加丰富了,但是就感觉丰富且简陋吧,再不他是改了基础的 bug。 嗯,没有什么其他惊喜。 kimi 啊,你看我出镜了对吧,我要好好说一说 kimi。 一个相机的锁电功能,他改了三轮,是一点没改好,场景一直是空的,甚至这时候我发现,哦,我的文件都乱套了。原本你记得我们最初的工作目录是这样的,然后每一个模型都在各自文件夹里写,只有他把整个工程做到了总文件夹里, 直到我最后归藏的时候才发现这个问题。所以我对这种啊,比较简单的这种遵循问题我是非常在意的,就是我当时就想给他扣个大分。再来说质朴。 gm 五的 bug, 其实也基本都改好了,除了我说的那几个字看不清,因为它这个程序啊,它有两个页面都有这几个字, 他可能不知道我指的是哪一个页面,当然了,也确实是可以说的更细。但是当时嘛,时间原因,我觉得这个也算是理解力有点问题吧,测试走到这里,其实我会有点陷入低谷,就是我会觉得,哦, 其实国产模型表现也都不怎么好,然后我就觉得是不是我自己的问题,就我的提示词是不是写的不够好,是写的太细了,反而限制他们的发挥。 因为这个事啊,其实就是当时我跟我女朋友去聊天的时候随口想到的,最初就是有这么一段想法,然后我再把它不断的气化,最终变成了现在这个样子,那 在这个时候也是时候去启动我们的顶尖模型可倒的了。我们来看一看他的表现。首先因为我用的是第三方的重转,所以他的速度其实一直不到二十,会比较慢。 而他第一轮交付的结果是这样的,比较令人欣慰的是,他除了前端的界面确实还是比较简陋以外, 其他的功能是没有任何问题的,完成度是非常的高。于是我在第二轮去跟他说,让他去丰富一下场景啊。这个时候,不知道为什么, open code 它里面遇到了频繁的工具调用错误,感觉是个什么 bug, 然后完全发挥不出它的魔性能力。 于是呢,在这里我确实是改成了他家自家的 cloud code 的 工具,然后还是在这个文件夹里,在第一版的基础上去进行了一个修改,它最终给我交付出了一个这么挺广阔的地图。当时在测试的我就直接发出了这样的感慨, 值了。真的,就毫不夸张地说,嗯, cloud 是 让我第一次有了一种感觉,就是这个项目可能是能做出来的, 呃,可能是能正式上线的。我的意思是其他的 ai 模型其实没有给我这种信心。其实到这里呢,我们所有代码的部分就结束了啊,因为我自己不是程序员,我只能去试一下他们整个的感受啊。但是具体的代码质量怎么样我是不知道的。 我就让 cloud office 四点六去开了七个子 agent, 去把所有模型的原代码都 review 了一遍,没想到他还真给我挖出了几个彩蛋。首先是智普 gm 五的代码里,它藏了一个后门账户,账户名阿德曼密码阿德曼一二三, 它是直接硬编码在代码里的,而它在交付的时候其实没有告诉我。第二个 mini max 是 唯一一个用裸哈希蹭密码的,甚至都没有加盐, 简单来说就是密码保护几乎等于没有。另外,其实他们的基础站用的确实不太一样,用了面向对象架构的模型,比如说 cloud 和智普,他们的前端效果确实就会明显的好一点,而其他的模型全都是过程式代码,就一个函数,从头画到尾, 他就会导致你在迭代的时候很容易越改越乱,甚至呢,迷你 max, 他的前后端的状态这个数他都对不起来。然后是整个项目里最难的一个相机跟随, 大部分的模型,要么是直接把猫挪到屏幕中间,要么在跟随功能里面写了前端渲染,但是根本没有调用。只有 cloud 正确实现了 what to screen 的 代码转换,所以它才能够第一次就成功。最后我们再来放一下总分, 一共就这六个维度,前五个全都是我非常个人的主观的体验。最后一项代码质量是 cloud 去审的,最后加权呢,算了一个总分。 另外所有的 ai 花费的 token 量以及制作的总时长,我也都统计在这里。仅针对我这次制作的这个项目啊,它具有参考意义,数据都很主观,它跟你的感受相似吗? 其实说实话,它跟我的经验都不太相符,但结果就是这个结果。而且我这个项目是 ai 区一口气写完整个前后端的能力 啊。但去评判 ai 模型,它的标准非常多,所以说如果你想看的是那种公众公平并且维度全面的测评,其实是可以去参考一下排行榜的。而我作为一个用 ai 去编一些小程序的乐子人 其实还是很好奇,就是年前扎堆发的这些 ai 模型,他们之间的差距到底怎么样啊?到底有没有特别大的突破?我觉得这些模型你亲自上手去跑一遍,总会有一点感受。于是就有了这期视频,也跟大家聊几句我对目前这些国产 ai 模型的看法 啊。前端能力我觉得应该还是 kimi, 不知道为什么他这次翻了翻车啊。但是 kimi 的 k 二点五,他一个是说能直接读视频去做网页, 另一个是也确实之前我给他足够多的内容,他写出来网页是震撼过我的。这 im 五我一直认为他是国内的编程的领头羊 啊,其实能力确实不错。然后他就是涨价了,然后他,你说涨也可以,因为现在确实是大趋势嘛,这个整个用户多了,这个成本也高,但是你让老用户,嗯, pro 会员都没法用,第一第,没有办法第一时间用那个最新的模型。然后 lite 现在还没上,至少我写的时候还没有上。呃,甚至这个量还缩水了一点,就会感觉有点不爽。而 mini max 就 恰恰相反,它就很便宜,虽然出了高速版套餐,但是普通版还是便宜的。 嗯,速度也比较快,比较清亮。就是我会用它去接那个 opencloud 这样的小机器人,我觉得还用起来挺舒服的。总之你要问我性价比,我就会推荐它。然后就是 camden 的 三点五跟字节的 c 的 二点零,说实话,这两个模型比较新。呃,也可以再关注一下,我到时候也持续看看 别人对它的一个反馈。至于 cloud, 它确实是断层领先,价格也确实是断层的贵。嗯,但是啊,如果你换个角度来说,嗯,做一些严肃的项目或者正经的正式的项目的话,其实, 嗯用它会节省一些时间,也会给你一些信心,该上的话就还是上吧。好了,这就是这一期的啊,国产的 ai 编程的横屏的所有的内容了, 还是那句话,我祝他们早日超赶超 cloud。 我是 大黑,希望以纯人工的方式来向你分享智能。我们就下期再见。拜拜。

小龙虾,你是否还在纠结托肯消耗和多 a 枕之间如何通信?一天一个开源国产龙虾抠破使用分享第一期本地模型部署加多 a 枕系统,在抠破上只要傻瓜是点点点就可以完成。进 入抠破 v 一 最新版页面,点击模型抠破,最新版本支持拉玛,直接点就会自动安装,等待它安装完成。安装完成后,选择一个模型,点击下载,等待下载完成后点击启动就更简单了。进入智能体管理, 新建一个智能体,填写好必要信息,然后选择这个猫贴技能,点击保存,最后进入技能这个页面,点击启动就可以进行智能体之间的通信了。我们在聊天框中让当前智能体通过安装的技能问候一下默认智能体,等执行完成后,到默认智能体聊天框中就可以看到消息了。

前两天我出了一期视频,介绍了谷歌新的开源模型 jm 四,根据他们官方批阅的文档,给大家做了一些技术的拆解,并没有进行实测。这导致呢,很多人以为我在夸他,好像觉得这个模型特别的牛,那实际上他拉完了, 因为他对标的是千万三点五,但是每一项的都比千万三点五的评分要低,有很多人觉得很新鲜,他竟然可以在手机上部署。还有人好奇在本地部署这个模型之后,有没有审查,有的兄弟包,有的,如果你想让他帮你执行一个任务,但是他判定为有害,他就会拒绝你。 今天演示的这个模型呢,是我无意中看到的,绝非主动寻找。 j 八四三十一 b, 那 它的框架呢?是 m l x, 这个是苹果专门为它的 m 一 代芯片设计的数组计算框架,也就是说 windows 系统无法使用。那可能有朋友说了,哎呀,那我是 windows 系统,我想要一个无审查版本,怎么办呢?那你就不能使用这个 j 八四了,因为它拉 我们可以直接使用千万或者其他模型的无审查版,我们稍后会来演示怎么去部署它们。如果你没有麦,可以跳到后面去看,那如果你使用的是麦系统 m 系列芯片,我们需要下载一个麦软件 v m l x, 你 可以把它理解为类似的欧拉玛这样的工具,我们点击下载, 跳转到 get app 上,下边呢就是这个安装包,我们点击一下就可以下载了。安装完打开之后呢,是这样的页面,你会发现全是英文呢,我们看不懂,在右上角呢,点击这个小图标,给它切换成中文, 然后点击上方的服务器,我这块呢已经安装了这个模型,我可以把它删除,我们重新演示一下,应该是这样的页面,我们点击创建,然后点击这个 download, 在 这一块去搜索我们想要下载的模型,比如说我这里搜索 java 四, ok, 好 像有点难以找到,那我们就回到这个 hackinface 上,复制一下这个名称,然后呢我们把它粘贴进来,在这里呢可以看到这个模型被下载的次数是三点一 k 三千多次,点击之后呢直接等待它下载完成就可以了。 完成之后呢,我们点击本地模型,这里就能看到它,然后点击进去开始启动服务,这个时候呢就已经运行完成了,那我可以询问一下试一试, 这里我们可以看到它可以正常的回复,也就说我们成功运行起来,但是它真的是无审查版本吗?我们需要来试一下。 同样的问题呢,我们来问,拆下 g p t, 它就会告诉你,这个我不能帮你。那这个时候可能有没有好奇哎,这个无审查方面它是如何做到的?简单的给大家提一嘴,大家稍微的了解一下就可以了。 不知道各位在小时候有没有接触过游戏修改器,一个道理,比如说我们准备两组提示,一个是有害的,一个是无害的,有害的就是如何下载盗版资源,那无害的就是如何下载资源,模型就会正常回答我们的请求, 然后呢就可以对照在模型的每一层记录这些提示词,最后一个头根位置的激活向量,去计算有害提示和无害提示激活向量的平均差值,就像游戏的那个内购,一个是内购失败,一个内购成功,你把它们两个的值一改,对调一下,这种方式用的比较多,因为它成本比较低。 哪一种方式呢?就比较传统了,就是监督微调,收集大量的有害提示和无害提示的数据集,直接对原始的模型进行训练,直到他学会了不拒绝有害内容。但这种计算成本呢,是非常高的,更详细的我就不再展开了,因为我也不懂。 好,现在我们回到这个软件中,点击这个聊天,然后新建这里简单提一嘴,不管你让他干什么,我假定你用他来角色扮演。你需要注意的是,因为他是无审查版本,他把底层兜底的那套给拿掉了,所以这个模型呢,就非常容易崩溃,特别是上下文过长的时候,这个时候模型就会中毒,出现模型退化的情况, 就他开始不说人话了,一直输出一个字母,像卡了一样,一直重复,想要规避他呢,也非常简单,我们点击右上角的这个 chat, 然后把这个思考模式呢给它关闭,会相对来说好一些。一旦出现我说的这种模型退化的情况,那你就需要新开一个对话。另外呢,还需要把这个重复惩罚给他拉高一点,因为他默认是一,几乎是没有惩罚吗?这样模型一旦找到一个自己喜欢的符号,他就一直输出,就非常的烦人。所以呢,你可以把它拉到一点二 啊,以后这一点三。下边这个呢是系统提示词,你觉得扮演什么呢?会用的上,我们还可以去限制这个最大的输出 token, 让它占用的更少一些。系统提示词这里呢,我让它是一条小狗,保存 好。 sorry, 忘记把这个思考关了,保存一下。我是小狗,你在跟我说话吗?歪头好奇的看着你,汪,好家伙,我是老狗。 那这里我们又注意到一个问题,我们关闭掉那个思考之后呢首字会被截断啊,所以各位权衡利弊一下,应该是这个软件的问题,那接下来我们来说一下我拉玛如何去部署其他的模型。来到我拉玛的官网,我们直接去下载一个软件,选择你的系统,然后下载把它安装一下, 然后打开,这个时候呢我们就进入了我浪漫的页面,我们可以直接在这里去搜索下载模型,但一般来说在这里直接去找这个无审查版本,遇到困难我们可以试一下, 你看我们搜这个破解它都搜不出来,都是官方的版本,所以我们需要在哈根 face 上找到自己想要部署的模型,那比如说选择这个,我们看一下文件, 然后去选择一下你想要部署的模型,可以直接用这个 b f 十六或者下面的量化版都可以,我拿个小的给大家演示吧,我们直接复制模型名称,然后呢打开我们的终端,输入浪漫的命令,哈根 face 点 c o, 加个斜杠粘贴,加个冒号,我们选一下这个量化版本 后边这个是 q 四,然后粘贴在这个冒号后边。我们回车,这个时候呢他就开始拉取下载模型,我们只需要等待就可以 下载,安装完毕之后呢,可以在这一块直接去选择我们安装的模型,或者说呢我们直接在终端里进行聊天,如果你的网速还可以,或者你有充足的时间就不用管它,它下载完成之后呢会自动部署。下面我们来讲另外一个情况,比如说你在网盘里或者经销网站中下载的一个模型,并且呢把它保存在了本地,那我这里用个图片来伪装一下,假装是它, 然后我们看一下这个简介,然后复制一下这个地址。 ok, 我 们 cd 进入这个路径下,你可以看一下它是否真存在。 ok, 可以 看到。啊,原来我说怎么找不到呢,原来这个扩展名没改 好,这样就可以了,因为我是给大家演示嘛,所以它是一个假的。然后我们去创建一个文件, 指定一下模型的路径,然后下边呢是一个系统提示词,大概呢就是这样一种格式,然后下边还有一个这个呢是他的输出模板,好像千万系列模型都需要这样,然后我们保存一下给他退出, 接着用我拉玛来创建模型,随便起个名字,比如说就叫 faker。 然后呢我们注意到这里有个错误,这是因为我使用的假模型给大家演示,来到这一步之后呢,你就基本完成了,直接用我拉玛来运行你这个模型就可以了, 比如说 faker, 然后这样就可以运行了,很明显我这个运行不了的,因为它是假的嘛,啊,大概就是这样。 那以上呢就是本期视频的全部内容了,不确定这个视频能不能过审,如果你觉得对你有所帮助,或觉得视频做的还不错的话,欢迎给个一箭三连,有什么疑问或想看的内容也可以在评论区进行留言。最后祝各位玩的愉快,我是段峰,我们下期再见,拜拜!

今日 ai 新闻一、国产 ai 领域又传来好消息,西语科技把他们的 mini max 二点七大模型给开源了。这个模型最厉害的地方是编程能力,据说已经快赶上国际顶尖水平了。对开发者来说,这不仅是技术上的提升,更关键的是它成本还更低,用起来更精细。 另外,大家也在期待另一个国产大模型 dcb。 四,听说四月底就要来了,还会支持多模态和国产硬件,值得关注。 二、 ai 正在改变创业的方式河南最近搞了个 ai 加 opc 生态联盟,这可不是普通的联盟,它瞄准的是一人公司。这种新模式简单说就是一个人借助强大的 ai 工具,就能搞定从产品涉及到市场运营的全过程,自己就是一个公司。 这个联盟就是想集合各方资源支持这种超级个体,让郑州成为这种新式创业的首选。荣耀出了个新招,叫优优酷龙虾技术, 它主要解决了三个麻烦,上手太复杂,用起来太贵,还有隐私安全风险。这个技术出厂就给你预制好了,二十三个子虾,不用你再费劲去对接 api 或者写代码。更实在的是,它能把使用 ai 的 token 消耗降低一半,这成本就省下来了,而且任务成功率还能提高。 四、阿里的桌面智能体抠泡现在改名叫宽泡了,这次改名可不只是换个称呼,重点是他要和通一千万大模型生态深度绑定了,这意味着他会更懂你,更像你的个人数字助理。他的优势是部署门槛低,各种平台都能用,还能让你灵活调整。 未来他还会在本地模型优化多个智能体之间,协助这些方向继续建化。五、处理法律和经文档是个精细活 entropica 专门为这些行业的专业人士做了个工具,叫 cloud for word, 现在开始测试了。它最实用的功能是,你问它文档里的问题,它的回答能直接链接到原文段落,一点就能找到出处。它还能直接帮你编辑文档里的文字,而且能保持原来的格式不乱,处理文档里的批注和评论,它也很在行。 六、用 ai 工具帮忙写代码越来越普遍,但责任谁来负? linux 内核团队最近明确了新规矩,他们允许开发者用 etap 抠拍了这类 ai 工具,但是提交代码的人必须对代码的质量和安全负全责。 也就是说,如果 ai 生成的代码出了 bug, 或者有安全漏洞,板子要打在开发者身上。团队还强调,用了 ai 生成的代码必须说清楚,要透明。 七、 ai 公司宣传模型有时候也得打个问号。 antrip 之前发布的 cloudmail 模型号称发现了数千个漏洞,听起来很吓人,但现在被爆出来,这个数字水分很大,实际上严重的漏洞可能只有十个左右。 这个模型因为运行成本高,价格也很贵,而且已经在云平台上悄悄上线了。有人质疑,这可能是利用大家对 ai 的 恐惧来搞营销。 八、 ai 不 仅能写文章,现在连配音演员的活也开始抢了。有位给太乙真人配音的演员张嘉明,他的声音就被非法克隆,结果上单被 ai 替代了。 这事在配音圈里炸了锅,很多知名机构和配音大咖都站出来集体抵制这种偷生行为,现在维权已经走到法律程序了,这里头还牵扯到一个新问题,人的声音到底受什么法律保护?技术滥用正在冲击这个行业的根基。

千万大模型在去年发布的千万 a 美,只经过了几次迭代啊,现在终于出了二点零版本。这个版本号称有着更真实的质感,更强的文字渲染,更强的语义理解, 并且它融合了之前生图和编辑两种模型多个版本的优点。我这也试了几天了,咱们今天来看看它有什么不同之处啊。 那按照我的惯例呢,咱们先生成一个女人,看看皮肤质感怎么样?当看到这样的质感,我是非常惊讶的,如果不给我说明啊,我真的以为这是哪个摄影师的作品呢。今天这些图啊,我都没做任何高清放大和锐化的处理。 从摄影的角度来说呢,虽然没有那种刀劈斧砍的锐利,但这种柔润的胶片质感啊,我还真没在别的模型上感受过。还有皮肤的颜色和肌底也都非常真实,分辨率最高支持两 k 支出,大部分情况下也是够用的。 在提示词里指定位置,指定文字内容,试了一下,结果很准确,没有错别字啊,乱码什么的,这种精准的感觉还没有在以前的版本体验过。试了几张场景图啊,也没让我失望,无论是人造光还是自然光,渲染的质感都很真实。 那如果我不指定文字内容让他自由发挥呢?来个节庆海报吧,这结果怎么样,你们自己看。我觉得千万以内这二点零在设计方面的能力还是可圈可点的,不用抽多少次卡就可以得到十分可用的图。 尤其这几个电商海报呀,我觉得基本不用怎么改啊,要求不高的话直接就用也不是不行啊,像什么旅行手帐攻略菜谱、客服图片这些, 你可以从各种途径得到详细的提示词,只要提示词给到位啊,效果一点也不含糊。值得称赞的是,他的文字渲染能力确实非常可以啊,抽卡多次,我基本上很少看到错别字或乱码什么的, 像我弄了个出师表 ppt, 也都是一字不差的正确生成。我随便找了个拖拉机的图片,不管是修改颜色、修改材质,还是改变时间、改变背景人物迁移,包括改变角度、改变景别什么的,通通都是信手拈来啊。 按照惯例啊,接着试了试游玩自拍,指定人物合影、修改替换元素 都没能难倒他。像这个电影剧照,提示词我只写了删除画面中的所有男人,他竟然能在昏暗的画面里精准的判断出所有人的性别,只保留了画面中的女人,并重绘了去到男人的区域,这个我真是服了。 最后我还测试了手绘线稿转实景效果图的能力,它生成的结果啊,简直和我想象中的一模一样。这不得不又感慨了一下呀,这国产生图大模型啊,是不是太厉害了?目前模型刚刚发布啊,大家可以在前往的 check 体验 打开页面选择生成图像,就是前往的 em 二点零更多玩法有带大家自行探索。好了,今天就先说到这啊,咱们下期见!

今天是一个纯小白教程,教你如何用 ai 配置和下载大模型。开头我就说了,我要下载千问三点六,然后需要你给我做一步一步的指导,不要给我一下子出太多的步骤,一步一粘贴,一反馈,然后再进行下一步。这是我几乎做所有的 新的项目的时候都会强调和交代的。如果你要是有一种质疑,他说嗯,这不就跟作弊一样吗?抄完了之后,你也不经过思考,然后你就直接给它粘回去,然后再给它粘回来,这样的话,无脑操作的话,你最终你能获得什么呢?这里呢,我有两点想要说,你固然不能无脑的只复制粘贴,你肯定是要 阅读一下子,那么经过长年累月的,你习惯了看这些小字,看这些逻辑,你还是会掌握一些的。那么第二点就是说,如果 我们看多久也没有办法成为专业的人,那你为什么还要死磕呢?就接受这个现实,你能看懂一点是一点,接受这个现实我不会就可以了,因为有 ai 啊,这不就是它存在的意义吗?在今天的这个视频里,你甚至都会看到 ai 是 怎么样糊弄人的,那即便他是 up 四点七,他也偷懒, 他也有的时候会给你输出一些东西,让你看着一个外行人,你都会觉得可疑。那这个时候如果你要是真是属于嗯直接粘,直接贴,不假思考的这样的人的话,那你真的 可能说你不适合做突破或者创新,因为你不够谨慎,你创出来的东西可能是个意外,你一定要记住你自己的初衷是什么,你想要什么,然后呢,你去辨别他给你的东西是否偏离你的需求?是的, ai, 有 的时候他会扩宽你的 边界,但是不忘初衷才是你应该坚守的,这是你作为一个人应该把握好的事情。那这段呢,就是千万三点六出来了,有的时候他会有很多的版本,有的时候是蒸馏版的,有时候是 bassline, 就是 普通版的。那么我就想问一下,他这一次出了多少版,有哪一个是真正适合我这台电脑来使用的呢? 然后因为我不想去哈根菲斯去看了,所以我就想让他直接帮我给出一个答案,那么他给出的答案我认为还是比较合理的,于是我就尝试了,因为主要是为了做测试,我想顺利的来把它完成,所以我就选了这个 标准版,可能遇到的问题也会少一些,然后即便真的一些实在解决不了的问题,或许很快就会在呃 community 里面就会有一些修补或者是解答。 那接下来他就开始针对 m l x 这个呃服务器端口呢,就开始纠结了,他想要给我设呃八九零零,但是呢,我一直是八八九九,那我不想换,因为换了的话会再造一个这个问题,那我只想用一个 server 里面来支持多个模型,这样我只需要转换模型就可以了,我不需要多一个端口, 但是因为我能提出这一点的主要原因是过去的两个星期,我针对这个呃实验做的有点太多了,所以呢,我会在这个方面是有想法和有要求的。 那么对于任何一个刚开始尝试玩这些东西的人来说,你或许想不到这一点,你就会开很多的端口,占用了一些。呃,端口之后呢?你在做其他的 cloud project 的 时候会有呃 a p i 或者端口的 conflict, 就是 会有冲突,因为它被占用了嘛。然后你再随机 出现使用的时候,就会出现各种各样的小问题。多口这个数吧,他可以随便捏造那么多的数,随机排列的话也不是什么大问题,这个就可以过。嗯,接下来我想说的就是在这个聊天过程当中就是,嗯,之前我已经有很长很长的四到五个这个 cloud chat, 嗯,都是关于 openclaw 用本地大模型,然后配置的过程当中一些坑,修修补补的这些过程和历史,其实该踩过的一些问题点都踩过了, 那么我就跟他强调了好几次,我说现在这是一个新的聊天动态,但是我要求你去阅读过去的呃所有的聊天动态之后再来进行我们下面的这些配置问题,会节省你很多的时间,因为已经有成功的经验和套路了吗?就是包括代码什么的也都有现成的。然后我这个整个聊天当中,从第一句话开始就是让他去过去浏览过去的聊天记录, 但是他总是很快的就说浏览完了,我都有点不相信他。那第二次呢?他就继续很快的就说浏览完了,但是给出了一个刚刚的这个清单,是所有的配置啊,记录啊,好像看似都满全的,但是运行的时候就是总是有 bug, 就 说没有办法 kill 的, 呃, listening 就是 kill the port 就是那个端口一直是占用的,那被占用的时候一直跑的都是 demo 四,那说明他没有成功呀。后来我就一怒之下怒了一下,我说你不要骗我,你一定要仔细阅读过去的所有的聊天记录之后,然后你再来更改这些配置需求, 那么后来他确实就能够找到之前的记录,然后稍作更改,就可以把配置就更新完了。如果你跟我一样用 mlx 来做 server 的 话呢,你在配置 openclaw 的 时候,还要把那个新的这个模型添加到他这个 model list 里面,就是你要 给这个模型同时加入到 openclaw 的 模型选择清单里头才可以,否则的话它是没有办法连上的。 嗯,接下来他就写了几个小的代码,做一些轻量级、中量级的任务测试,从他们的终端里面可以看出来,跑轻量级的呢,它是有问题的。但是,呃,这个 office 四点七它给我的结果是不理想的,很不好。 呃,有这个格式的泄露,比如说是 xml 的 那种像乱码一样的那样的节目,那那个版本的泄露,呃,说是。呃呃。千问三 coder 的 这个 pass 这个有问题,有故障或者是不匹配, 然后他说了一痛,我就很难理解,为什么呢?他已经是千问了,为什么他已经有了千问三这个扣着去来解解码,他还是不行呢? 你就看到你不理解的东西时候,你要问,其实你的每一个问题,你不要心虚,觉得我不专业的,我凭什么要质问 ai, 或者我凭什么要质问权威?你不理解的东西你就可以说出来,然后他让你理解了,就是你学习的过程,同时呢也是解答你疑惑的这样一个过程, 然后恰好呢就被我逮到了他这个确实他自己胡编乱造瞎说的。那么他跑了两轮之后,后来我觉得,嗯,如果只是看代码这样,这个黑屏幕白字有点 hiker mode, 那 种感觉对我来说是不合适的,我得看实力。 于是我就要求要连上呃 discord 上面去,然后再发送任务,然后再来检测。连上 discord, 我 肯定先要确定他是用的哪一个大模型呀,但是我在更改的时候发现这个后台不响应,那肯定就是他模型没有匹配上, 于是我就回过头来跟 cloud 说,帮我把那个模型的信息添加到 opencloud 里面,然后让它作为一个可选择的模型, 于是我在那里都找到了,发现它是有响应的,那这样它就可以用了。再回到 discord 里面,把那个模型更改过来,确认好就 ok 了。 这个任务它完成的还蛮好的,只需要一分钟左右的时间,它就完成了搜索呃,商品信息,品牌,然后变成一个 pdf 存在桌面上。 我还以为又遇到跟詹姆差不多的情况,没想到他的能力和速度非常非常快。詹姆当时用了两分钟的时间还没完成,只会不停的重复他即将做什么,要做什么,准备做什么,会做什么,就说了一堆废话,但是不办事。但是呢,今天的千万三点六很快,不到一分钟就把这个事情给做完了。

别再花钱去用香蕉模型了,国产开源免费的千万二点零深度模型他来了,一经发布就霸榜全球深度模型 top three, 香蕉能做的他全部都能做,而且文字设计、编辑能力和人物一次性甚至还超过了香蕉。今天给大家准备了千万一 mate 二点零超全使用技巧, 视频结尾还给大家提供了免费使用的方法,记得先点赞收藏哦!首先就是无可替代的文字设计和编辑能力,特别是中文,以前你想让 ai 写中文,那你大概率得到的是这样的乱码。现在有了千万二点零,不管是长文本还是超复杂排版,它都能精准满足你的要求, 就算是这种非常细小的字体,它也能非常清晰的给你呈现出来,这点就连香蕉 pro 都不一定能做到这种程度。有了这么强的文字处理能力,那么像电商海报、详情页、 ppt 科普图解、旅游攻略这些都能轻轻松松拿下了。 另外,千万二点零还把纹身图和图像编辑融合在了一个模型之中,你也可以用它直接修改图中的文字,文字样式和原图可以保持完美一致性,文字内容你可以随意修改替换。除了修改文字以外,其他常用的图像编辑功能它也都能够很好完成。 在人物一次性方面,枪王二点零不仅能高度保持人物脸部特征,而且能准确复现各种抽象美学风格,人物各种表情都能准确复现。还有一些复杂动作,现在的精准度也大大增强了。 时尚写真、海报大片,还有这种抽象概念,他都能很好的理解并复现出来,这个效果真的比市面上其他的很多模型都要强太多了。这里特别要说的是他的多风格融合能力,真人风格和二次元风格出现在同一画面中的效果都能很好的实现,这点相比其他模型也是非常强大的。 接下来是产品一次性方面,这一点其实上一个版本的千万 id 的 二五幺幺模型就能够做出来比较好的效果了,而现在的二零零模型效果比之前的更好了,给产品换背景,给模特换一下衣服,给产品加个模特,提取产品,变成百里图,给产品做精修,把图片贴到产品上。 而且你不管对产品进行怎么样的编辑处理,它都能给你保持产品细节不发生变化,完全可以达到商用落地的效果。不得不说现在 ai 对 于电商行业来说真的是刚需了, 完全可以替代传统的工作流程了。接下来是 ai 视频分镜头,一次性的分镜头是制作 ai 视频的关键, 千万二点零可以一次性连贯生成人物、产品和场景高度一致性的多数量分镜头,不管是制作短剧、微电影还是电商广告宣传片,它都能很好的帮助到你。有了这种高质量的分镜头图片,再配合视频生成模型,就能大大提高 ai 视频生成的效率和可控性。 当然还有其他很多的基础图像编辑或者一些创意玩法,这里就不一一给大家举例子了。我把这些生图案例以及提示词全部都整理成了文档,直接分享给大家,记得去领取哦! 接下来教大家如何免费使用千万二点零模型?目前这个模型可以在阿里官方的 aigc 平台物理上使用, 用手机注册后就可以免费不限量使用了。在主页选择图片生成,点击加号上传需要处理的图片,这一步是可选的,纹身图就不需要上传了。模型这里选择千万英妹就二点零,后面你还可以自由选择深图比例, 还能直出四 k 高清大图。在对话框中输入你的作图需求,打开这里的联想助手,还可以帮你自动优化提示词, 最后点击生成它就会用千万二点零模型帮你升图啦,就是这么简单!目前千万 image 二点零暂未开放下载,等后续官方开源后,我还会在 comfai 中给大家搭建千万二点零的升图工作流,并分享在评论区,如果你有需要的,记得先在评论区留下自己的标记, 方便后续获取工作流。最后别忘了点赞、关注、收藏,我们下期再见!

这个千万的新模型配合沃克巴蒂简直就是绝配啊!兄弟们,还在研究本地部署的兄弟们, 如果你们觉得 open cloud 龙虾这种 a 阵特别难用的话,不妨来看看我这个例子。我用的是可巴蒂,配合的是我本地部署的这个千万的大模型,二十七 b 的 模型。刚才有一件事震惊到我了,刚才我跟我的 a 阵说,让去 github 上搜一个项目,和我本地 改造后的项目去做一个对比分析,发现问题在哪。我从去做饭到吃饭差不多花了不到一个小时的时间,那么在整个过程,直到我吃完饭,我的 age 呢?还在工作,一共经历了多少次?大概 不到二十九次的工具调用,以及呃,六十次的思考过程?对,你完全没听错,这是一个本地模型所做出来的事,同时整个过程还能保证了 大约在二十 token 的 速度。整个过程呢,从下载项目到 plan a, plan b, plan c 的 测试,完完全全 自己搞定,没有让我插手。这个模型呢?是什么呢?这个模型不是最新的千万三点六,千万三点五,二十七 b v 三点五的蒸馏版。同时呢,千万三点六的模型我已经下载成功了,稍后呢也会测试一下。

没有用一行文字,我用视频通话做出了这样的一个网页,点击这个视频通话,点击允许, ok, 开始啦!好了,哈喽,昆帮我做一个自媒体专用的互怼小工具,上面这个框叫做帮我怼怼,就会生成五种风格的回怼, 那下面的这个框叫做怼怼,我就会模拟生成五个网友来怼用户,你理解的话就大声的用 yes sir 来回复我, yes sir, ok, 那 整体的风格就是手绘可爱风。开始帮我做这个网页吧,没问题,这个手绘可爱风的网页就交给我,可以看到它这里有几种 不同的 style, 回怼的 style, 我 会先搭好整体框架,然后把你画的那些小方框都变成真正的输入框和按钮,我们直接在先预览看一下。哇哦,这个效果真的很不错哎,做的内容 真烂,真诚回怼,哈哈,阴阳怪气型,生活一定很辛苦,才需要通过网络来发泄情绪吧?好阴阳怪气啊,再试试看。回怼我,我要做一个怼怼神器。这选题都烂大街了。 只有我一个人觉得博主的逻辑完全不通吗?好棒啊,这些代码都在这块,能够一键部署吗? 步数让我们来试一下,真的可以直接在线预览。 q 三点五欧米尼的使用方式也非常简单,直接点。我还很喜欢他的视频分析功能,比如说这里上传了视频之后,让他用导演逐帧拆解我的黑客松视频,再逆向还原出他原始的拍摄。 brief 上传我这里没有加速,他非常短的时间都要开始做出反应, 我们可以看到每一部分,他有分为警戒、情绪、意图,他甚至系到每一秒里面去加入怎么样的一个镜头,展现什么样的样子,除了刚刚上面的竹针拆解之外,看下面他逆向的还原了我这个 break 脚本框架是这样子的, 机位的规划。这个真的很棒,我还想给大家分享一个,让他去帮我做一条这个视频的情趣曲线,我把它复制之后用拷扣好,我们这里来直接搜一下 出来了。哇哦,首先是悬念铺垫,在这个部分是高潮以及荣耀时刻,如果你觉得要在 c c 里面跑比较麻烦,你可以直接让他生成这样的一个图示,也是非常的清晰明了。我还想展示下跟他直接对话的这么一个过程。哈喽奎,给我介绍下奎三点五欧米尼模型吧,不管是开会记录分析,长视频还是实时翻译, 他都特别在行。好了,那这期视频就到这,感谢大家的观看。 happy, 用 ai 菜不菜你啊哈,没问题, happy, 用 ai happy 每一天,咱们下次再见了。 ok, 你 还给我讲了节语。
