现在的 ai 真的 好强大,只需要给 ai 提供一张图片, ai 就 能给你制作出各式各样的图片, 效果是不是非常逼真,跟在现在拍摄一样,关键是免费用。就是左下角这个千问 app, 搭载着千问三一米二五幺幺满血版。找到 ai 生图, 上传你的原创图片,可以是人物,也可以是场景。选择一个人物照片里的人物八十岁以后的样子,稍等片刻,就给你生成四张不同的图片,是不是很好玩,并且还是免费使用?你也赶快来看一下你八十岁以后是什么样吧!
粉丝1.7万获赞58.1万

三月四号凌晨的时候,阿里千万团队的核心负责人林俊扬在推上发文宣布离职,就他离职消息传出来的前两天,才刚带队发布了千万三点五系列小模型,马斯克还给他点赞了啊。所以现在外网和 ai 圈都在疯狂的讨论这件事情, 就很多 ai 圈的研究者在社交媒体上其他发声,甚至有人喊出了没有林俊扬就没有千问的口号。那个 mini max 的 官方账号也在他的推文下面留言说感谢他对开元社区的贡献。这个林俊扬呢,确实是个人才,他是阿里巴巴目前最年轻的 p 十级技术负责人, 也是他牵头推进了那个千问系列大模型的开元工作。就阿里千问现在已经是属于全球顶级开元大模型了, 斯坦福大学去年搞了一个报告,里面说中美顶级大模型的那个性能差距已经大幅缩小了,现在只差百分之零点三。其中阿里谦问的重要模型贡献度是位列全球第三,第一和第二分别是谷歌和 openai。 英伟达的老板黄仁勋,他在二五年的时候也在公开场合说 千万在全球开源模型市场的实战率是最高的,而且还在持续增高。林俊阳离职的原因目前流传最广的一种说法 就是阿里,他在千万团队内部进行了一个组织的重新调整,然后削了林俊阳的权,还外派了一个新官过去。就原来的千万团队是什么样的,他是从预训练到后训练, 到多模态开发啊,到基础设施配合,他的所有的环节都是由一个核心团队 携手推进的,有这种模式的好处肯定非常明显,他的团队的敏捷性很高,自主性很强,就迭代效率就很高嘛,对吧?但是现在管理层要打破这种模式,就打散原来一体化的千万团队, 推动另外一种水平分功能模式,就是说要把林俊扬带领的统一的团队拆成什么?从域信链到后信链到文本到多莫泰,全拆成平行的那种, 多个平行的小组,对吧?然后还空降了一个新的领导过去嘛?我们刚刚说了这个,他一方面削了林俊扬的权,一方面又和他的理念冲突,所以这个人就离开了嘛。因为这个人他更像是那种典型的技术理想主义者, 然后他有一个模型级产品的理念,就他坚信只有预训练、后训练乃至基础设施团队都紧密地结合在一起,才有可能高效创新。而且他对 ai 的 态度是什么?就说如果你的目标不是你的想法,不是说去帮助全人类,哎,那你就不如不做大模型, 从这个角度上看就是千万,确实做到了帮助千万类。关键的问题就是企业管理层看事情的角度,他本来就不会和研究人员是一样的,你对于研究人员来说,你做出一个先进的模型啊,推动了开源,缩小了中美差距,或者说为行业的基础设施做了贡献,对吧? 这都是价值。但是对于管理层和股东来说,那就不一样了,他们的问题会更现实,他会关注我公司已经投了多少资源,我什么时候能看到回报,对吧?商业化的落地在哪呢? c 单的声量够不够?用户规模能不能打出来?而且站在阿里的角度, 这个就是这次事件最核心的矛盾,技术理想主义,他在追求能力上限和行业贡献,大厂管理逻辑呢?在追求投入产出比和业务比划。而且站在阿里的角度,这种压力其实不是不能理解,因为大模型训练我们之前说过,他本来就是重资产,然后长周期确定性又低的那种投入, 就是训练阶段,他就是会消耗很多的资源,消耗大量的算力啊,需要大量的服务器,然后还要招聘很多顶级人才,但是他短期之内又很难变现,对吧?据我所知,阿里内部反对林静瑶声音最响的一种就是他只知道伸手要服务器啊,总是要买很多机器。这个情况确实是真实存在的, 首先千万的迅速崛起就离不开阿里不计成本的支持,就在那个 ceo 吴永明和创始人马云的默许下,阿里他们买服务器就是不计成本的。 就我了解到了情况,阿里就买了接近一万台的 h 一 百 h 两百就我知道了,就有一万台了, b 三百也买了两千多台,都是给他们这个团队用,这些机器一台都要几百万, 而他们私下还很想买那个 g b 系列,那更是天文数字。这些全都是资本性支出,就没有回报的。之前在陆小龙的那些视频里面我就讲过,就投大模型的训练没有回报嘛,因为你投训练是一种社会责任,你赚钱一定是等到推理阶段 对吧?等推理成本下降了,才可能会有商业闭环。就投训练的公司比如谷歌、亚马逊、微软,哪个都不被股东拷问,对吧?哪个不被花姐质疑? 你训练这件事,他本质上就是为未来铺路嘛,就是为全行业修一个基建,对吧?他可能有很大的公共价值,但是一定不会立刻体现在财报上。所以呢,就林俊阳这一类人,他是更容易相信我先把通用能力和开源底座做好,那是一件很有价值的事, 但是管理层他就一定会去追问,我给了你这么多资源,你什么时候把商业结果做出来了?这两种视角其实天然没有对错,也没有谁更高尚的说法,只是说他们 关注的焦点不一样,解决的问题不一样,所以考核的周期也不一样。尤其在今天这个时间点,外部竞争是非常激烈的,就现在这个时间点,前不久字节的 cds 二点零刚出来,对吧?获得了非常巨大的成功,成功到甚至压热度, 然后豆包日活也高了下,而马上那个 deepsea 也要更新了,而且腾讯就是说还没有怎么发力的情况下,它的利润又猛增了百分之四十。 我估计阿里的管理层都已经开始汗流浃背了,就同行模型也搞得很好,应用也搞得很好,然后营收也搞得很好,用户数据也搞得很好,是吧?这个时候你阿里的管理层对商业化焦虑是吧?对日活焦虑,对声量焦虑,其实完全可以理解,但是问题也就出在这里。我认为 阿里他很有可能在用一种不是特别适合自己的方式去衡量千万的价值,因为阿里这个公司的强项本来也不是特别适合自己的价值他牛逼的产品,比方说淘宝天猫 u 六八八本质上都是 tob 的, 他擅长服务商家,就是把主要的功夫下在商家身上,然后让商家去服务用户,然后他再跟商家收这个稳定的服务费嘛,然后产品产生数据去反补支付宝和菜鸟。不过支付宝现在不在阿里的经营部分里,他是蚂蚁那边的阿里,他现在真正稳定赚钱的核心还是淘天集团,淘宝和天猫, 然后阿里云也才站稳脚步吧,然后菜鸟还是微传,其他什么本地生活,什么虎鲸文鱼还是亏的,就盒马,阿里健康,跨国网盘,飞猪钉钉这些大盘子还是整体亏损的。我认为你一家本来就是 to b 强的企业,没有必要急着跟字节腾讯这种 c 端巨头去争用户。日货呀,对吧?你拿千万去和豆包这类强 c 端产品比存在感比日货,哎,比什么社交传播效率不是没事找事嘛。阿里完全是可以把千万做成一个全球行业推理模型的基座嘛,你就做成一个叫大模型时代的安卓对吧? 你何必一定要把它搞成一个全民的 ai 应用呢?而且大模型时代的安卓这条路我觉得跟 r a i 里的基因是更相配的,因为阿里本身也擅长服务企业, 就阿里他本身就擅长做行业解决方案,他擅长跑 tob 销售和那个搭建生态嘛,擅长推动上下游合作,就这套能力,他正好可以适合在 ai 时代复制成给呃行业提供模型底座,或者说去推动那个行业头部公司基于千万做一个二次开发,把 通用模型改成更适合他们自己各行各业的版本,对吧?比方说银行可以基于千问做一个金融风控助手,哎,医院可以基于千问做一个什么辅助问的系统等等等等,就玩法很多就至于赚钱的话, 不用急啊,以前谷歌怎么赚钱,以后阿里怎么赚钱不就得了吗?那我路线都给他规划好了。那你从这个意义上来看,千问的价值他就 不能局限于所谓一个 a p p 能不能冲高入伙,也不能说我这个团队能不能做出下一个热搜级别的那种发布,对吧?而是说它能不能继续的作为中国开源大模型的基座,而为整个行业降低门槛, 要为整个行业释放创新力。因为你只有像千万像 d o c 的 这样的开源模型,持续的把基础能力往前推,行业里大量的架构师, 大量的创业团队和企业用户,才不需要每次就都从零开始烧十几亿上百亿做原始训练,对吧?才可以站在一个相对成熟的底座上,用相对可控的成本去做场景化适配合二次训练。 这个才是开源模型真正改变行业结构的地方吗?这个才是真正有意义的事。所以就林俊扬离职这个事情, 我觉得真正值得关心的不是说什么核心人物的趣流,因为虽然这个林俊扬的能力确实很强,但是阿里确实不是非他不可,中国多的是聪明人, 而且林俊扬来说,他离开阿里一样可以发光发热,肯定有别的 ai 团队给他提供更好的位置,对吧?那这是事件,我们更应该关注的是 阿里接下来到底会怎么定义千问?就他究竟是把千问定义为一个需要尽快证明日活和商业回报的业务部门,还是一个值得长期投入,值得继续开源服务整个产业生态的底层能力平台?如果阿里的管理层继续用偏运营、 短周期的指标去驱动他底层的技术研发,那么千问的团队后续一定会存在进一步的动荡和分崩离析的风险, 对吧?如果阿里他能够认识到自己的优势,继续支持开源,就给核心团队保留一定的技术自主权,并且把千问就坚定地放在那个模型底座这个位置上,那他是非常有机会成为中国乃至全球 ai 生态里面最重要的基建的。 就阿里现在仍然有极强的算力资源,还有很强的运营能力,还有产业协调能力,我觉得千问真的不一定非要成为另外一个豆包,它是完全有机会成为 ai 时代的安卓的。

最新 ai 工具,千问秒变大神!最近啊,咱们网上又出了一款全新的 ai 工具,叫做千问,它是我们阿里巴巴集团研发的最新的 ai 工具,它集合了 give-say、 吉梦加上豆包三款工具的功能。接下来小马这期视频就带你领略一下我们千问这款工具的一些实用功能, 如果说你怕记不住给视频呢?点赞保存收藏,当你有需要了随时观看。好了,废话不多说,直接进入实操。 首先我们这边打开咱们的千问工具,千问呢是我们最新出的 ai 工具,很多同学没听说过,但是呀,我告诉你 千问的功能呢,非常好用,而且呢它的绝大多数功能呢都是我们经过加强的。来这边打开千问之后,今天我这期视频就教你使用咱们千问里面的这个 ai 生图以及 ai 生视频功能。我们这的技能在千问首页这把下方的 ai 生视频打开, 打开之后呢,下方这里呢能点生视频也可以点生图,咱们这边就先生图,咱们选择 ai 生图,然后在这儿可以去导入一个图片,咱们直接点击导入,把我们手机相册里面准备好的照片选中导入进来, 照片导入过之后,他就会去自动识别,然后帮我们去自动的推荐风格,你看这里面有很多风格都是他帮我们推荐的,咱们可以直接选择直接使用,如果说你不想使用他的风格,你想自己更改,那我们可以先观察一下图片,这张图片他是一个这种旧照片,那我想让照片 重新上一下颜色,并且修复成高清的,能不能做到我告诉你轻而易举,我们只需要在这里呢直接去做描述,你想打字打字,不想打字的可以跟我一样使用我们的语音速度来,咱们点击这个麦克风,按住这里直接给千问进行对话。 千问,你好,请帮我把这张黑白的旧照片先给他修复成高清照片,然后给照片去上一下颜色, 好的,这边去提出咱们的一个要求之后直接发送给千问,千问这边呢就会立刻识别我们的指定,然后使用他的模型帮我们去生成照片,而且呢他一口气会给我们生成出来四张照片,待 待会咱们四张照片四选一,我们选一张效果最好的,我们再去拿这张生成的新照片去给他做成一个动态的视频。 好,同学们,现在呢照片生成好了,来看一下,这是第一张,第二张,第三张,第四张怎么样?是不是每张感觉都差不多,但是呢又有点不一样,其实啊,他是在咱们这个人物的小妆容上,或者说人物的一个肤色上 做了一个微微的改变,包括他这个拍摄镜头呢,也稍微做了改变,把四张照片给区分开了,那现在我们就可以去选一张你认为效果最好的, 比方说我觉得第一张不错,那么我们现在就可以把咱们的第一张照片打开,下方这里呢还有一个 a i p 图 ai 修图, 我们可以点一下 ai 修图,现在呢我们还可以在这里进行一个二次创作,比方说你如果说不喜欢这个修复好照片里面人物身上穿的这个衣服颜色,它是一个绿色的,你如果说不喜欢这个颜色,也是可以跟刚才一样,点击麦克风,直接提出要求,让让 让,我们的千问再次帮咱们进行更改,来,我教你怎么说。千问,你好,请帮我给这一张照片人物身上穿的绿色衣服给他改成一个淡蓝色的。 好的,这一边咱们提出一个更改衣服颜色的要求发给千问,千问呢会跟刚才一样使用他的这个大模型帮咱们去把图片作为更改, 还是帮我们一次性的生成四张照片,待会呢,咱们四张照片还是选择一张效果最好的,我教你们把照片去变成一个动态的视频。 现在呢,咱们的照片已经生成好了,来看一下怎么样衣服的颜色是不是做出更改了。那么现在呢,我们还是使用第一张吧,下方点击 ai 修图变视频呢,你不需要单独保存,我们直接点完 ai 修图之后,在上方你就可以点击一个 ai 视频, 从这里呢重新导入照片,如果说你手机里面没有导入的照片,我们就把这个照片点击保存一下,保存过之后我们再点一页消图,然后选择一页视频导入我们刚刚修改过的这张照片 导入照片导入进来之后,咱们现在呢,你看可以去描述你视频的主题动作,运镜,你现在呢,可以从这三个角度去调整我们的视频,那比方说我给大家去演示一下,我们还是使用这个语音说, 千问,你好,请让镜头往左右运镜,然后我们的人物翻书页再看书,接着抬起头再看向镜头。好的,这边咱们提出了一个 左右运镜,人物翻页再看书,接着再抬镜头看一下,我们大概做视频的时间呢,需要一个两到五分钟,而且呢每天都有十四, 而且呢每天的次数呢有十次,咱们可以做十个视频,非常方便。咱们这边耐心等待视频做完,我们一会呢一起欣赏一下咱们的视频效果。那么现在呢,咱们的这个视频啊已经生成好了,我来给大家打开播放一下, 怎么样,同学们看到没有,他不仅帮我做运镜,还给我们的人物呢做了一个配音,怎么样? 视频非常真实,等你学会了我们这个千万的用法之后,你也可以拿上我们自己照片,或者说从网上找的照片去做出这样的一个动态的视频,还是自带声音的,不用自动配音,我们只需要把视频做好之后保存,然后呢再去我们用我们的剪辑工具去给他做一个配乐就可以了。配乐怎么做呢? 插入创作,把刚刚保存的视频选中添加,然后呢这里点音乐,从这里呢咱们大家可以使用一首推荐的,也可以于上方搜索一首背景音乐,咱们就使用一个简单一点的 五风纯音乐使用,使用过之后多余的音乐一定要记得分割删除,还可以呢去用我们的识别字母功能去把咱们人物说话这个字幕呢给识别出来,那 稍后呢,我会把咱们识别的一个成品效果放到结尾给你们看一下。听到这里同学感觉今天小马教你这个我们千万和剪辑工具相互配合的方法还不错,可以给视频呢点个爱心支持一下。 另外啊,如果还想学习更多的剪辑技术,我这里呢,也有一份完整版的剪辑笔记以及我的工具和方法, 同时想要领取。同学,点击画面右侧我的头像,来到我的主页,在我主页这里点击中间的关注,然后再点击右边的发消息,去给我发送一个数字。六,我看到之后,会把刚才讲到的完整版剪辑笔记以及工具和方法第一时间发给你。 这一页字迹已模糊。原来如此,有些故事藏在字里行间。

用千问 ai 生成原创视频,看一遍,学会!二零二五年,很多 ai 工具腾空出世,就连阿里巴巴也亲自推出了自己的 ai 大 模型千问 ai。 今天我来教你如何用它帮我们把照片变视频,然后再注一些自己喜欢的视频素材出来,不用开会员下载的素材还没有水印,接下来我手把手带你做一遍,新手同学认真的看完也都能学会。那我话不多说,直接上干货。好的,直接打开千问这款工具, 在首页下方功能栏向左去划,点击 ai 生视频这个选项,然后点一下这个正方块,从相册选择你想要变为视频的照片,这个照片可以是人物,可以是风景,总之你想把哪个变成视频,直接选哪个照片添加进来即可。 添加进来之后,首先第一步,我们在这里选择一个时长,你想变为多长时间的这个视频来,我选默认的,我的照片比例就是三比四, 后面智能音效和自动润色不用管,是来帮我们丰富画面内容的。然后直接输入想变为什么样的视频就行了。输入的这个描述呢,分为两两类,第一个是用大白话直接说,第二个是用专业的提示词。我先来演示第一个啊,用大白话直接说。在这里可以摁住这个扬声器, 让照片里面的人物对着镜头挥挥手。原地呢,可以走两步,要求整体视频自然,肢体动作灵活,看起来有质感。 直接发送给前文,让他帮我们去生成这个视频效果。这时候呢,他生成这个视频啊,时间呢?大概需要几分钟?咱们推出这个界面,你想干嘛就干嘛,他也不会影响视频的生成进度。 这里呢,咱们在生成视频的时候,再给大家分享一个小技巧啊,你看生成视频,咱们点下这里,把照片上传上来之后呢,有的同学可能你用大白话去说,你不知道怎么去说,把这个照片变成一个唯美生动的视频, 像刚刚那样的,只是最普通的一个效果。咱们有很多 ai 玩法,拿自己的照片呢,都是通过提示词,你能直接制作出来 这个提示词,如果你不会写的话,我这里有完整的提示词大全,需要的同学在评论区留言工具包三三个字,我看到之后给你分享一份,咱们可以直接去用刚刚的视频也生成好了,来看一下效果怎么样,点开这个视频播放, 看到没有,咱们人物的脸部没有发生任何变化,穿的衣服也没有发生变化,咱们这个人是不是按照我的要求了,对着镜头呢微笑,而且呢还走了两步。大家有些细节可以看啊, 他身体上的这些头发,包括衣服上的毛毛,整他的这个穿的靴子,看起来啊,就跟实拍视频的效果啊,几乎是一模一样,效果非常的真实。但是这里有水印该怎么办呢?我教你们下方直接点保存点无水印下载,把这个视频保存到相册就 ok 了。 这个呢只是一个最基础的玩法,用大白话告诉给他,我们想让他做出来各种各样的动作,让他去做一些神奇,奇思妙想的一些视频的话呢,是需要专业提示词的。这个我是我给大家分享的一个小技巧,咱们可以多去呢,来练习一下,学会这个方法之后,你想让照片变成什么样的视频都可以呢?直接去按照我的方法去制作, 这个就是我今天分享的小技巧。那听到这里的同学如果还想接着学习更多的剪辑玩法和视频变现干货的话, 我也准备了一份完整版的 ai 剪辑实操教程,以及我的一些工具和玩法笔记。 需要的同学在评论区留言数字六,给本期视频点个小爱心来关注支持一下我,支持我的粉丝都会单独给你发。今天的视频到这里也就结束了,咱们下期再见!拜拜!

尝试在这台老爷机上部署千万三点五,处理器是 i 五四五七零八 g, 内存无读写,我用的是 rms 对 d l 进行部署,打开官网下载安装即可。安装好之后下载千万三点五模型, 我们直接进行搜索,模型越大就越聪明,但是配置要求也越高,我就下载零点八 b 模型来演示,大家可以根据自己的需求和配置进行下载, 下载好模型就可以进行载入了,载入时可以设置上下横,长度也是根据自己的配置和需求设置, 到这里模型已经可以跑起来了,如果不需要联网搜索和本地知识库,做到这一步就行。如果需要联网搜索,就打开浏览器的插件中心搜索,配置 sis 插件进行安装, 然后打开插件设置,把语言改成中文, 搜索引擎可以改成百度搜索,结果按需修改,改好后记得点保存。然后回到 r m, 打开网络服务, 再回到插件,设置了 api 添加供应商, 选择 r m studio 保存即可。点击新聊天,选择千吻模型就可以在网页里进行对话了, 需要联网搜索就打开下面的开关,点击引用的网页就可以看到千吻通过网络搜索到的内容。 然后是建立本地知识库,先在设置里选择文本切入模型,那么会自动帮我们下载好,下了菜单里没有的话就等一会, 记得点保存。现在就可以在知识管理上传我们自己的知识库了, 等状态变成已完成,就能在对话里调用知识点进行回答,点击输入框下方的知识点,选择刚刚上传的知识点即可。

阿里在除夕夜终于推出了它的新一代的开源大模型 queen 三点五,这个呢,对于我们这些应用公司来说的巨大的福音真的是千呼万唤始出来。 queen 三点五呢,目前已达到了开源的模型里面的绝对的 sota, 整个的参数呢,只有三百九十七 b, 这个规模其实对于大模型来说是非常小的,尺寸, 就是 deepsea r one 近一半的这样的一个参数量,激活参数只有十七币不到。上一代的万亿参数模型 queen 三 max 的 四分之一性能呢还大幅提升,最核心的是顺带实现了原生多模态能力的一个代际的跃迁。那先看一下各项指标,目前的 queen 三点五不仅是当下的开源大模型的 soho, 而且在认知能力、指令遵循 通用 a 阵各项评测上呢,可以说是赶上甚至超越了 gbt 二点五、 cloud 四点五、 jimmy 三 pro 等同期的币源模型。 比如说直林遵循的 i f bench, 视觉数学的 math vision 这一图像来做数学题,文档理解的 omni dark bench, 数学推理的 wemath, 空间智能的 rough coco, 多元的 nova 六十三,搜索 agent browse com, 视频理解的 m l v u。 这几个指标上呢, 目前千万的三点五都是 sota, 除此以外呢,千万三点五是支持两百零一种不同的语言和方言,它在训练中呢,是直接把文本语料跟视频语料完全的在 day one 就 作为原生的树语言进行训练,而不是像前面几代一样先训练文本模型,再加上视觉理解能力。这个被称为原生的全模态能力 集,在训练中支持了原生的多 token 预测,就是在训练阶段就学会了对后续多个位置的 token 进行联合预测,而不是一个 token 一个 token 的 预测。这样的系列的提升呢,让 coin 三点五呢,整个变成了应该说是大模型生态里面目前最香的一个香饽饽了。当然, 然而它在有些地方呢,还是有待提升的,比如说在数学竞赛和极端推理方面呢, queen 三点五对比 g p t 五点二还有一定的距离,比如说 a m e 二十六, h m m t 这几个特别竞赛的测试级上,目前 queen 三点五对比 g p t。 五点二还差了几个版本点,但是目前我看呢,差距并不是 特别大。对于编程这个领域呢, g p t 的 三点五呢,也不是它的最强的优势,貌似在代码工程常识推理这边呢,反而呢, 这段时间出的 g r m 五更有优势。另一方面呢,从上下文角度来说, queen 三点五是非常惊人的,达到了 e m 就 一兆的上下文的空间,这个呢,是完全匹配了目前闭源的 gem library 和 grok 的 能力, 比 g p t 都会更强。所以呢,整体来说呢, queen 三点五除了一些单向的,比如说数学和编程能力以外,在各项能力上已经是全面赶超月模型,是绝对的开源模型的 soata。 另外一个非常惊人的就是它的性价比, 目前并三点五官方提供的 a p i 的 接口呢,是每百万头肯零点八元,这个成本呢,大约呢是 g b t 的 十到二十分之一,在它的运行速度上也实现大幅提升,目前整个的头肯的吞吐速度呢,比上一代提升了八点六到十九倍,一句话介绍呢,就是全面领先开源,媲美闭源,适用于多模态的各项能力, 持小成本的快速部署。那我稍微说一下,关于千问三点五成功出世,对于整个生态会有什么样的变化,我们认为呢,原来对于 ai 的 应用公司来说,其中的一个很大的成本就是业务模型的成本,因为成本的制约呢,导致应用市场可以选择的场景并不多,主要呢就是一个 to pro user 的 最愿意付费这份用户 les mansa laura 这类,他们的主要的场景就是需要找到最愿意为市场付费的这部分用户。通过封装更加完整自动化的产品, 即使建立在一个币源的高成本的结构之上,也可以带来一定程度的毛利。但是在千万三点五能把各项的成本降到一个非常合理的范围之内,以及呢可以支持自部署的基础上,绝大部分的应用公司呢,空间就会大很多, 不仅是选择多高的超级专业用户,也可以去不断的开展,付费能力稍微弱一点,但是整个受众会大很多的极端用户, 或者是偏专用红跟 c 端之间的金字塔的中间才能用。对于应用公司来说,最喜欢的状态就是开源模型,离闭源模型最接近的时间点,这个呢是通过产品的设计,通过限制场景或者通过后续率,可以快速的补齐模型上与闭源的距离, 从而呢实现应用层面的成功。所以我们说真正的 ai 应用呢,其实到了二零二六年可能才刚刚开始,在二零二五年之前,绝大部分的应用场景呢,是受限于模型的成本,大部分的毛利是在有模型的公司上才能运作成功。 以及最核心的应用场景是基于聊天框的这种最简单粗暴的入口级的产品的争夺。但它到二零二六年,随着各项模型能力不断的补齐,整个市场的竞争又回到了对于应用场景和产品设计领域的争夺上,整个的市场的受众和可以参与者这样的一个双边网络也会不断增大,对于 ai 应用公司来说,应该是真正的圆脸。

今天来测测两个 ai 怎么给小白讲懂继电器。先看 club, 我 就问一句解释继电器原理, 开门见山,第一句就是人话定义结构过程,都用最直白的语言和流程图列清楚。他不跟你让,就是来给你讲清楚的。但重点来了,真正让他封神的是下一步,我让他画个示意图, 然后他直接生成了一个网页交互式动画。电磁铁咔一下把衔铁吸下来, 大电流的电路啪就通了,电流一断,弹簧嘣给弹回去,电路断开,整个原理变成了一套看得见的机械动作。这还有什么不懂的,他不光告诉了你,还演给你看,从原理到动态演示,搞定。 这就好比一个老师不光课讲得利索,还随手给你做了个教具模型。同样的题目,我们交给千问,他的解释严谨的像说明书,但是得自己提炼出那个最核心的动作过程。 一开始让他画视意图,画了难以看懂的文字,描述视意图, 再让他用网页动画,他又忘记上下文了,严重跑题。 最后跟他说制作一个网页展示继电器的原理, 才勉强制作了一个网页出来。呃,可是这一根线都没有,跟文字有什么区别?所以千问这波操作属于指令理解有点飘,是意图的灵魂,他没找着。 我们回头再看一眼 cloud 的 那个会动的动画。

二点零三亿月活,千问凭什么成为国民 ai? 从薅羊毛到离不开这款 ai, 只用了半个春节,全国平均每十人就有一人让千问下单,超四百万六十岁以上用户第一次体验 ai 购物。当这些数据在三月初的 ai 产品榜上炸开时,所有人都意识到,二零二六年春节, 中国 ai 的 格局被彻底改写了。三月三日, ai 产品榜发布最新数据,千问以二点零三亿 mau 成为全球第三大 ai 应用,仅次于 chat、 gpt 和豆包,更以百分之五百五十二的增速 登顶全球第一。在这场被称为首个 ai 春节奥林匹克的大战中,阿里换来了一场堪称教科书籍的用户心智争夺战,但烧钱谁不会?真正值得追问的是,千问凭什么让用户留下春节超能力? 三十亿请客换回一点三亿人第一次说,千问帮我时间拨回。二月六日,当大多数人还在琢磨春运抢票时,千问悄无声息的扔出一颗核弹。三十亿春节请客计划首轮就是用 ai, 一 句话免费点奶茶,效果立竿见影。 活动首日,千问 dau 一 路飙升,次日达到峰值七千三百五十二万。短短几天,千问就在苹果 app store 免费绑上,霸榜八天。但这不只是流量狂欢,数据显示,截至二月二十三日,用户在千问上一句话下单 累计近两亿次,其中奶茶就点了超过一亿杯。更重要的是,超过一点三亿消费者首次通过千问 app 进行 ai 辅助购物。这意味着,千问以一己之力把上亿人拉进了 ai 办事的大门。为什么是千问?因为它是真的办事的 ai! 春节营销战中,三大巨头各显神通, 腾讯元宝主打现金红包加社交裂变自结豆包绑定央视春晚痊愈吸粉。而千问选择的路径最俗也最狠,直接发消费券,让你用 ai 点外卖、买电影票、订机票。 但这恰恰是千问最聪明的地方。千问帮我相比传统点选式下单,仅两到三轮对话即可完成, 操作步骤少一半。当别人还在让 ai 写诗作画时,千问已经帮你把奶茶送到嘴边了。这种 ai 加交易闭环的策略,让用户在使用过程中自然而然地完成从尝鲜到依赖的转化。数据最能说明问题, 春节期间,用户用 ai 买电影票的订单还比增长三百七十二倍,来自三四线城市的 ai 订单量更是暴涨七百八十二倍,机票、酒店、景区门票订单分别还比增长百分之五百四十、百分之一百六十一、百分之两千四百二十九。 这不是为了用 ai 而用 ai, 而是 ai 真正解决了懒得打开好几个 app 比价的痛点。更令人意外的是,超过四百万六十岁以上用户通过千问成功下单,近百分之五十的订单来自县域及农村地区。 当银发族和大爷大妈们也开始对着手机说,千问帮我买点年货时, ai 不 再是小众即刻的玩具,而是真正飞入了寻常百姓家。留存率之战,羊毛薅完,人还留下吗?烧钱容易留人难! 春节过后,各家流量纷纷回落,真正的考验才刚刚开始。截至二月二十三日,豆包日活首注一点零三亿,叫活动前增长约两千万千万,日活维持在三千两百四十五万左右,虽然叫峰值腰斩, 但叫活动前二月五日仍增长三点六倍。为什么千万能留下人?摩根士丹利在研报中给出了答案,千万一托阿里生态的深度整合,实现了惊人的订单规模, 消费券的有效期被多次延长,从二月二十三日延至二月二十八日,再延至三月三日。这种人为支撑,恰恰给了用户更多时间养成习惯。更重要的是, 千问 c 端事业群总裁吴佳在采访中透露,他们最看重的不是 d、 a、 u, 而是用户说千问帮我的次数,这代表了用户心智的形成。春节期间,用户累计说了五十亿次千问帮我,这个数字比任何 kpi 都更有说服力。双雄格局已定, 千问的未来不可限量。热闹的春节大战落幕后,中国 ai 市场呈现出清晰的豆包加千问 双雄并立格局。字节跳动的豆包凭借春晚流量和内容生态守住第一。而阿里的千问则依靠电商交易场景走出了一条差异化路径。但千问的野心不止于此,春节期间, 淘宝、支付宝、飞猪、高德、大麦等阿里系应用悉数接入千问,一个庞大的 ai 加生态正在成型。当你习惯了用千问一句话,订票、点餐、买电影票后,还会去切换其他 app 吗? 快思慢想研究院院长田锋评价到,阿里巴巴选择将千问与三十亿元免单计划结合,本质上是电商闪购加 模型加流量组合权,试图把 ai 变成新的生意入口。二点零三亿,月活百分之五百五十二,增速全球第三。这些数字对于千万来说只是开始。当 ai 从好玩真正变成好用,当它开始渗透到点奶茶、买年货、 订机票这些日常琐碎中时,它就不再是工具,而是生活本身,而这正是千万不可限量的未来。

问大家个问题,你手机里是不是也装了豆包千万这样的 ai 软件呢?结果除了让他写写文案做的表格之外,就不知道他还能帮你干什么了? 那全网为什么都在说 ai 能提效,甚至会说 ai 是 下一次工业革命的开端,可是你用起来呢,就总觉得每天除了跟豆包聊聊天之外,好像也帮不了你什么,不知道怎么能在工作中真的去结合起来,能真实的做到提效。 那我自己是大厂,做了十年左右,开发这段时间呢,也一直在深耕 ai 落地相关的内容,新手从零到一,做过一些完整的 ai 项目了,踩了不少的坑,也有些自己的理解。 那实际上 ai 从来就不是一个指望聊天的工具,它本质上更像是一个掌握了海量公开知识,执行力超强的聪明帮手。 他既能够成为你的职场分身,帮你解决到百分之九十的无效重复劳动,也能够成为一个灵活可定制的工程模块,帮你完成要么需要大量代码开发才能完成的功能。 那只有真正搞懂它的底层逻辑,才能在这个 ai 时代里真正把它用明白。那这也是我做白话 ai 这个系列的初衷, 尽量用大白话跟大家一起从零搞懂 ai, 看明白他到底是怎么样在真实的工作场景里面帮我们每一个人提效,帮企业创造价值的。在讲具体的落地方案之前,我们先用两分钟把大家天天在网上刷到的几个 ai 核心名词彻底掰扯明白。 今天呢,我们就拿咱们天天都在干的吃饭这件事情来打个比方,给大家理了一张 ai 四层核心关联图, 那第一层呢, ai 也就是人工智能,它就相当于是整个餐厅行业是个最大的框,它能够帮你解决吃饭的所有问题,不管是外卖、汤匙、楼下的便利店,都属于餐饮行业。同理呢,所有能让大模型模仿人的行为,帮你节省到时间和精力的智能技术, 它不是指某一个具体的 app, 也不是某一个单一的功能,就是这个所有这类技术的总称。那第二层呢,也就是大语言模型,就是大家常说的大模型, 他其实相当于这个餐厅的一个很厉害很专业的主厨,是整个餐厅能运转的核心根基。 那咱们常听的自己的豆包大模型,而里的千万大模型就指的是这个主厨。那当然了,不同的主厨擅长的菜系也不太一样,有的擅长做川菜,有的擅长做甜品。那对应不同的大模型能力侧重呢,也不太一样,有的擅长写代码,有的更擅长做文案创作。 咱们现在用的所有的 ai 底层全靠这个大模型做支撑,那没有它的话, ai 根本听不懂你在说什么。第三层呢,就是千问豆包这类的手机 app, 咱们还是以豆包举例啊,它是开发团队已经把它完整封装好了的一个 app, 给你做了个简单直观的聊天界面,你打开 app 打字提需求,他就能给你反馈一个结果,不用你懂任何的技术上手就能用他的底层实现,一样是对接了豆包的大模型。所以呢,他就像是一家很好吃的餐厅,里面还是那一位很厉害的主厨, 但他又有个天生的短板,他的菜单是店家提前固定好的,你只能在他给的选项里做选择,想让他完全提合你的个性化、深度化的业务需求,来到你的工作系统里帮你跑一套真正的流程就很难。 比如你想让他每天自动对接你公司的业务系统,定数据,生成定制化的周报,他就不可能做得到。那第四层呢,也就是咱们今天的核心啊, agent 智能体,他就相当于你的专业私人饮食助理,他才是 ai 能真正实现提效的核心。关键 在这里一定要大家理解啊,这是整个 ai 提效逻辑里面最核心的一环,也是他和大模型 app 的 最本质的区别。 餐厅的逻辑是,你点一单他店里提供的某个菜品,他给你做一单。但是呢,你的私人助理是你只需要跟他说清楚你最终的核心需求,他就能按你自己的需求帮你把吃喝搞定。 比如你跟他说,我今天晚上要减脂,晚上六点前呢,我要吃上饭,预算三十块钱,不要辣不要香菜,我还要配一瓶无糖饮料。那接下来呢,他就会帮你按你的要求完成这份晚餐。 a 神呢,之所以能做到这一点,底层还是依赖着大模型,但是他通过上下文工程,也就是我们常说的提示词、规则、业务知识库、长短期记忆管理,来完成对你的硬质化需求的理解和适应。你可以给他定好最终的目标和执行规则,让他自主拆解步骤,完成多轮定向大模型来完成不同环节的处理, 再通过 skill、 mcp 这些外部能力接口,对接到你要用的软件和系统,最终跑完一整套完整的工作流程, 那说白了,大模型是让 a 阵的能想明白我该干什么的。一个大脑上下文工程,是指让 a 阵的理解你的定制规则,工作上的要求、限制 skill mcp 是 让你能够落地干成事的手脚。所有东西组合在一起,你有没有觉得它很像是一个智能机器人,这就是它的核心力量所在了。 不过说到这里啊,我必须跟大家说句实在话,也是我自己从零落地 a 证项目的时候啊,最深的一个感受。现在的 a 证呢,根本做不到网上很多人吹的,你给他个目标,他就能完全自己闭环干活,都不用你管。 那些说能够完全无人化、全自动化的,要么是对未来发展方向的畅想,要么就是加了无数限制条件的演示效果,根本不是真实的企业落地场景。 那在真实的落地环境里面,人和 agent 的 关系其实非常明确的。人是定规则、搭框架、做最终决策的管理者。 agent 呢,是帮你干重复机械、不用深度动脑的执行活的助理。在真实的落地过程中,你必须先通过提词词和知识库,给他搭好一个完整的上下文工作框架, 定好清晰的执行边界,再配置好对应的外部接口,他才能相对稳定的完成工作。根本不是说我一句话他就能完全自己搞定的。遇到超出预设规则的异常情况,最终还是要靠人来处理。 那总之呢,他确实能帮你省掉百分之九十的重复劳动,但核心的决策、审核、规则制定,永远要靠人来把握,那搞懂了这些基础逻辑啊,咱们就回到真实的工作场景里面,看看这个 agent 到底是怎么来帮我们实实在在提效的。 我就举一个我们职场人经常会遇到的一个问题,就是写数据周报。那其实梳理数据做报告这种事情啊,大家都懂的,你往往就登录不同的业务平台,导出几分原始数据,登在 excel 里面,去做一些驱虫啊,补缺失值啊,算同笔还笔啊。这样的一些事情, 好不容易做完之后呢,你还要再写一个分析报告,那前前后后可能花两三个小时写完,你都快下班了对吧?那用 agent 到底是怎么能实现提效的呢?第一步啊,先搭好你的核心框架,就是上下文工程, 这是 a 阵的能稳定干活的根本,也是最核心的一步。你要把周报要统计的核心指标,同比环比的计算公式,图表的格式要求,分析内容的侧重维度,还要把你以往做过的优质的周报案例啊,全都写成标准化的提示规则,并且同步案例到制库里面。 要说白了,就是把你做的周报的所有经验、标准和逻辑完整的交给 agent, 让他能真正理解这份周报该怎么做。第二呢,给 agent 配好一个执行的手脚,对接外部的能力接口,光懂规则还不够。 agent 要拿到数据,就必须得通过 skill、 mcp 这些外部接口完成和你业务系统的对接。 你需要把业务系统的接口方正成对应的工具节点,给到 a 阵的配好权限,他就能够合法稳定的从你的系统里拉取数据了。每一次他要做周报的时候,你只要跟他说一句,帮我生成当月的业务数据周报, 剩下的工作呢, a 证呢,就会按你定的规则自己跑完了。那整个过程, a 证呢,只要十分钟就能全部完成。你要做的就是最后花五分钟审核一下内容和数据,在分析里面加上你自己对业务的深入思考,一份完整规范的周报就搞定了。 原本需要花两三个小时干的活,现在呢,只要花十五分钟就能全部搞定。这就是 agent 的 最真实的提效能力。那聊到这呢,大家就能明白了, agent 实现提效的核心从来不是解决某一个单点的问题,而是把一整套重复的复杂的工作流程实现了标准化和自动化。 那这里可能会有个疑问, ai 提效的本质到底是什么?为什么他能够做到传统工具做不到的事情?这是我自己落地项目的时候一直在思考的一个问题。那今天呢,我给大家拆透三层最核心的底层本质,每一层都是大白话。 那第一层呢, ai 用一种智能弹性的系统替代了固定的浆化的机械工程系统,那传统的软件系统本质上就是一种机械化的工程,你必须提前把所有的规则,所有场景,所有异常情况都用代码完完全全写明白,只要有一个场景没有覆盖到系统就会出问题。 而 a 阵的呢,就是一个智能的弹性系统,他的核心上下文工程,不用你写死所有的代码,你只要定好核心的目标和执行边界,他就能像人一样自主判断,适配突发场景。重点是他非常适合处理一些模糊需求, 彻底摆脱了传统工程里面写死规则、改需求、重写代码这样的一个死循环。而第二层本质呢,就是 ai 把系统开发的成本和门槛降到了非常低的程度。传统的工具开发,核心成本就是人的成本, 你需要产品开发、测试、运维一整个团队,花几个月的时间才可能把一个复杂的需求变成真正可用的系统。而 a 阵子把这个成本和门槛降到了非常低的程度。不用写大量的代码,也不需要很庞大的技术团队,只需要你懂自己的业务,能够用自然语言把规则和逻辑讲清楚, 搭建好对应的上下文工程,几天甚至几小时就能搭好一个可用的自动化工具,哪怕是小团队、超级个体也能用得起那么好。 那第三层本质呢,就是 ai 可以 通过标准的输入输出适配,无缝的融入原有的业务流程。你可能会问, ai 到底是怎么去替代传统的程序的呢? 其实核心逻辑很简单,传统程序的核心逻辑是输入标准化的参数,按写死代码逻辑运算,再输出标准化的结果。 而 agent 的 核心逻辑是你输入自然语言的目标,它通过上下文拆解之后,成为标准化的执行步骤,通过外部接口调用到系统和工具,最终同样也可以输出标准化的结果。 它是可以直接融入你现有的工作流程里,不用推翻你原有的系统,所有的业务逻辑就会实现,那么原有的业务逻辑就会实现效率上的颠覆。不过这里我必须再给大家提个醒啊, agent 不是 万能的, ai 更不是万能的, 他的核心是大模型,而大模型有一个天生绕不开的特性,那就是随机性。哪怕你把上下文工程搭的再完善,外部接口配的再齐全,他也可能会出现一个幻觉问题, 比如对数据的理解,编导不存在的分析结果,搞错指标的计算逻辑,也可能会出现执行失败的情况,比如接口的权限过期,数据格式异常,最终导致了攻击电网失败。 那这呢,也是企业 ai 落地过程中啊,一个真实存在的门槛,你不能只停留在该个 a 阵的价值的层面,必须对 ai 有 系统的应用层面的学习, 比如怎么写稳定的提示词,怎么搭建匹配业务的数据库,怎么管理 a 阵的长短期记忆,怎么能规避大模型的随机性?那如果出现错误,要如何设计回款方案,重置方案?到底方案 要跟我深一层思考。我甚至觉得传统工程工具啊,要和大模型有一定的分工,让大模型完成模糊复杂的无状态任务,传统工程完成固化的确定性要求更高的环节。 这样呢,我认为才是落地的核心,只有把这些东西都学明白了,你才能真正有 ai 实现稳定的体效,而不是让它变成一个添乱的工具。好,说到这里呢,希望这期内容帮大家捅破了 ai 落地的那层窗户纸,希望大家给我点个赞,也欢迎大家来关注我,我们下一期再见!

阿里天问翻车了,那一段提示词直接生成违规图片,毫无拦截。但离谱的是,我随便找了一家 ai 大 模型出来,之前就有的老牌图片审核服务,把这张照片上传上去,人家秒判违规。那也就是说,一个几年前的技术就能识别出来的东西,二零二六年的大模型反而放过去了? 那我用 ai 深度调研了一下,发现纹身图的审核其实有三道防线,第一道生成前对提示词做敏感检测。第二道生成中模型本身会有安全约束。第三道生成后再用图片审核服务兜底。那我还专门问了一下千问,他说自己会结合阿里绿网做内容安全审核, 三道防线一套都没拦住。而且这不是个例,从纹身图技术诞生到现在,各家大模型在这块频繁翻车,那补了又漏,漏了又补, 那网友们的脑洞远远比审核跑得更快,总能找到各种奇葩题字词绕过检测。但话说回来,生成钱拦不住。我理解那,毕竟自然语言千变万化,可图都已经生成出来了, 过一遍图片审核都过不去,这就有点说不过去了吧?那所以我就好奇,这个审核到底难在哪?是技术上真的做不到,还是根本没上心?你们觉得呢?

来了来了,这个很火的学校变身视频教程来了很多宝子问我难的能不能做主播,很负责的告诉大家都可以,不会提示词的朋友让我教会你。 方法很简单,首先点击下这个小云雀,找到这个沉浸式短片入口,替换铠甲图片和自己图片,贴入我评论区的,可以截图识别一下等等,很快就制作好了,快去圆梦吧!

阿里的千万最近频繁登上热搜,相信很多人刷到新闻的同时也在使用千万。作为一名从业十年的资产人,总是习惯性的会去关注这些企业背后的资产的布局,看完之后果然发现 行业的巨头对知识产权都具有超前的前瞻性以及强烈的保护意识。通过官网查询,阿里的千万商标是在二三年成功过户转让到阿里名下的, 在二三年和二四年期间呢,对方又密集售让了一批千万的商标,包括了广告、宣传、通讯、网站服务相关的内容。这里不得不说,商业上获取制产前的捷径就是直接买通,这条路 看似简单粗暴,实则精明到极致。为什么这样说?如果说阿里正常的去申请注册千万的商标顺利的话,也需要六到七个月时间左右, 如果说中间商标一旦出现了驳回,或者被第三方提出了意义,那么时间轴将会再次被拉长。 在互联网战场上,时间决定生死。而直接购买一个商标,转让流程只需要两到四个月时间左右, 省下来的这半年时间带来的价值是不可估量的。就像春节期间千万推出免单三十亿的营销, 这就是用金钱换时间,再用时间去换市场。其次,买下千万的商标只是布局的开始。 接下来对千万的商标进行了全品类围猎,不管我们能想到的,不能想到的类别,对方都注册了千万的商标,而且一系列衍生商标同时进行去布局,像千万万象你好、千万、千万云啊这些商标, 这不只是在保护一个名字,更像是在宣告,针对这个 ip, 真的 这个品牌的绝对主权 完美全释了,战略上的投篮战出新了,疯狂用最高效的方法来解决当下棘手的法律问题,然后再用严谨的手段去锁死未来可能发生的资产的风险。 这也是各行各业头部企业心照心照不宣的规则。就像喜茶因为商标问题花了七十万购买了喜茶这个商标, 企业接下来进入了快速发展阶段,接下来面对的就是全球商标的收购与布局。千万的商标案揭露出当下最物最务实的商业逻辑, 用金钱去扫清法律和时间上的障碍,然后把所有力气投入到真正的战场上去。 当我们在惊叹一个品牌崛起如此之快的同时,不妨去看一看这家公司背后的制产权布局,这可能不是一手创业时, 而是一份精美的收购合同以及更大布局的起点,这也是现代商业当下最真实、最务实的智慧。

国内前五 ai 大 模型第一名,你一定用过! number five 智普青研来自智普 ai, 搭载 glm 五模型,被评为最优开源模型,在推理效率与任务精度上实现双重突破,适配国产芯片,便于开发者快速落地应用。 number four kimi 来自月之暗面,是开发者风神级工具,十二秒解析十万行代码与 vs code 集成,综合得分稳居行业顶尖,成本低且有免费额度,适配个人和中小企业。 number deep seek 来自深度求索,零代码门槛,普通人用自然语言就能完成数据分析和预测,长文本处理出色,广泛应用于多场景,以实力赋能各行业高效升级。 number two 千问 来自阿里巴巴,凭借千问三点五 plus 登顶全球最强开源大模型,混合专家架构运算高效,今年春节,全国用户通过千问下单近两亿次,其中奶茶消费五千五百万杯,鸡蛋消费超三千吨,成为最热门的 ai 消费工具。 number one 豆包来自字节跳动,国民级 ai 王者,依靠自研云雀大模型领跑国内原声 ai 赛道,越活断层领先, 中文理解能力碾压同级,多模态生成,秒出成果,不管是职场办公还是日常需求,一键响应不拖沓,实力直接拉满。

家人们找工作面试慌?教你们一个神器千问,尤其是他的视频通话功能,直接帮你拿捏面试操作巨简单!打开千问 app 聊天界面,找到视频通话,一秒就能接通。不用复杂操作, 他能实时面对面模拟面试,画面清晰不卡顿,无延时。千问呢,会实时看你的仪态,听你的语气,当场指出问题, 还能对着视频练案例讲解,展示自身优势。他会给针对性建议,帮你克服紧张,快速适应面试节奏。二十四小时在线,不用预约,随时能练,面试稳赢!