ai 大 战早已经打完了,百度已经彻底出局,维奇一言早就被甩在了身后。二零二六年你就看着吧, 用过真正 ai 大 模型的人,谁还会回去再用百度?顶多呢个别场景去搜索,用一下主流市场已经跟它没有多大关系了。今年的百度营收呢,只会直线的往下掉。原因很简单, ai 呢,是颠覆式的创新,是降维的打击。 传统的搜索,搜半天全是广告,半天找不到答案。 ai 大 模型呢,直接能给答案,没有广告,按您的需求定制,体验根本不是一个级别。这轮的 ai 淘汰赛, 百度文心啊,已经被淘汰,最后的赢家呢,只有元宝,豆包和千位。如果你是老板,今年务必关注 ai 大 模型,不管是社交的元宝派视频生成的豆包和一句话,点外卖的。这个呢,这关重要,我是老程,请关注我。
粉丝1074获赞6330

ai 助手春节大战,你们都抢到了多少红包?先有元宝分十亿,后有千问,春节三十亿大请客,其实无非就是互联网大厂在抢占 ai 的 市场。 对于消费者来说,领过红包后,留下哪个 app 还得看哪家更好用。今天我们就对比一下这些 ai 助手阶阶段到底谁更强。 我们这次对比豆包、千问元宝、文心、 deep sea。 先对比语义理解能力,一个脑筋急转弯的测试。经典的老题,桌上有十二支蜡烛,先被风吹灭了五根,不久后又被风吹灭了两根。请问最后桌子上还剩几根蜡烛? 这是一道经典的脑筋急转弯,答案是七根。最终答案,桌子上还剩五根点燃的蜡烛, 因此最后桌子上还剩七根蜡烛。最终答案,桌子上还剩十二根蜡烛。能看到,对于这个问题而言, ai 产生了不同的答案,那么他们的回答你更倾向哪个回答呢?编程能力也是我们的一个考察项,帮我写一个可以运行的贪吃蛇小游戏, 元宝和豆包可以预览并直接在手机上运行。千问文新 deepsea 则是可以生成代码,但是呢,它不能直接运行。然后是图片生成能力的测试,把它换成勇士队的球衣,身披三十二号。 除了 deepsea, 几家都可以做到生图,不过只有豆包把球衣换正确,并且字母也清晰。千问呢,生成了四张,但是放大看,字母是胡的。 元宝的字母清晰,但是衣服的样式错了,纹身的样式对了,但是动作变了。另外一张呢,是字母拼错了。再试一个,帮我修一下这张图,让它看起来更诱人。 这家都调了色彩,不过我们能看到千万这边明显没有其他几家那么艳丽,但是千万每次会生成四张图片,给你比较多的选择,这几张你更喜欢哪一张呢? 最后,我们测试难度更高的视频生成能力。文新 deepsea 是 不支持生成视频的,先被淘汰掉,帮我生成一个皮卡丘和柯南一起吃烤串的视频, 我们能看到,剩下三家都可以做到,只不过是风格上不太一样。豆包和千万一天有十次生成视频的机会,元宝呢,是有五次生成视频的机会。 除了这些,我们发现 ai 助手还有很多功能,功能上这几家也都基本类似,不过从界面上,我觉得元宝的界面比其他家更美观一些。 这里我们测试一下他打电话的功能。打电话就像是一个 ai 机器人陪你聊天,我们测试他能不能模拟场景对话。我们现在模拟一个辩论赛。正方呢,是应该先成家后立业,反方是应先立业后成家。你现在作为正方,我现在作为反方,咱们开始辩论。 先成家后立业。家庭能提供稳定的情感支撑,让人在打拼时更有底气和方向。当事业遇到挫折,家人的理解。可是你说先成家后立业,我没有钱怎么去成家呢?成家确实需要一定的物质基础, 但有钱的标准并不是绝对的。好的,那我作为正方,先来陈述观点,我认为应该先成家后立业,因为家庭能给予人温暖和力量,让我们在打拼事业时没有。但是现在问题的关键是,我没有钱,怎么去成家? 其实成家并不一定需要很多钱呀,两个人在一起,最重要的是彼此相爱,相互扶持。好呀,那我们开始吧。 我觉得先成家后立业挺有道理的,有了家庭的支持,立业的时候会更有动力。可是我没有钱,谁愿意跟我成家呢?钱虽然重要,但也不是全部了, 两个人在一起,更重要的是感情理解和支持。作为正方,我认为先成家后立业更合理。稳定的家庭能提供情感支持,让人更专注事业发展。可是我现在没有钱,谁愿意跟我成家呢?哎呀, 这个问题确实很现实呢,不过感情不能用金钱衡量,那几家都可以做到打断并联系对话,只是音色上的区别。 经过几轮下来的比拼,其实综合表现最好的我觉得是豆包。但是呢,其他几家也有自己的优势,千万的优势是他可以整合淘宝闪购,比如我们让他帮我点一杯喜茶多肉葡萄, 它就可以调出淘宝闪购,帮你选好最近的店铺,这点其他几家做不到。元宝的优势是社交圈发挥了腾讯的强项,在 ai 助手里融入了社交功能, 用户可以通过元宝 app 创建或加入一个派。在元宝派里,元宝 ai 作为派友,能够与用户聊天、互动、协助或者娱乐。好了,以上就是本期视频的全部测试内容, 在功能上, deepsea 已经远远落后其他家了。综合来看,豆包在内容上表现最好不过,我觉得在界面上有待优化,大家都千篇一律,反而元宝的界面还挺讨喜的。 测试的过程中,我们还发现一个问题,就是 ai 助手生成的内容非常具有随机性,有点开盲盒的感觉,可能第一遍测试的好好的,拍摄的时候就不一样了。大赏砸钱投 ai 红包大战吸引用户下载只是第一步,留下谁,哪家好用还是你自己说了算。

千问请大家喝奶茶,不知道大家喝了没?这两天千问发放三十亿,请大家一分钱喝奶茶。千问呢是阿里巴巴旗下的 ai 应用产品,与之 同类似的产品有腾讯,下面有元宝,字节跳动,下面呢有豆包。其实我自己呢用豆包都用半年多了,觉得跟豆包沟通啊,交流啊,豆包给我处理些信息,对,我查一些资料,我觉得豆包是非常非常不错的,那两个呢?还没有用习惯,但是呢,我相信 千问呢,他有一个生态,就是千问他旗下就是这个大公司的旗下,里面呢有淘宝,有飞猪,有高德, 还有这个就是外卖,然后等等有很多东西,他们是一个生态,包括线下有盒马生鲜,他们也是属于阿里巴巴旗下的,像这样的话呢,他们就可以形成一个链条,就是不用啊,让其他外部人员来进行去同意。如果说 它没有这些,就像那个豆包一样,它只是单独的一个 a 应用产品,它没有线下的这些生态,比如没有美团呀,没有外卖呀,没有一些住宿呀,没有一些酒店呀,没有一些这个快递啊,其实它是很难打通的。就比如前段时间 豆包呢,联合那个努比亚生产生产出来了一一部手机,那部手机呢,确实很智能,技术呢,确实挺高,但是呢,因为自己呢没有生态,用的别人的生态,别人就不允许,比如美团就不允许豆包打开自己的应用,这样美团这个豆包就没有办法。 所以这个豆包的话呢,虽然说技术很厉害,技术很好,但是没有自己的生态,估计还是哎,有点进入了瓶颈期了吧,但是现在阶段来看的话,千万呢,是非常有可能实现,就是可以帮助你去做一些服务的。比如, 哎,你这边呢,你今天中午想吃个饭,吃个饭你不想自己去对比,不想去点,你就直接可以告诉前文,你今天想吃啥,预算在多少,他就直接可以帮你点好前文。他们的收费模式呢?并不是说广告或者说推荐, 因为这种呢,就跟以前的携程呀,或者说啊第三方平台没有什么关,没有什么区别。他们现在呢,可能是进入了一种新的收费模式,可能是比如,哎,你让他帮你对比几家外卖,点一个外卖,可能他只是收取你这个帮你节省这点时间的一个服务费,这样的话呢,就可持续吗? 啊,这也是我最近这几天观察或者说在其他新闻上看到的,因为确确实实现在 ai 确实很厉害,大家都可以用起来。如果说 ai 每个人用的不一样,其实就是你挖掘的潜力不一样,他是一个非常非常强大的助手,就看你怎么用了。 我现在每天都坚持,甚至啊强迫自己每天的尽量跟 ai 对 话半个小时,有什么不懂的,不会的全部就是深挖,不停的深挖,他们会给你解决很多问题的。现在 ai 已经不简简单的 简简单单能提供这个信息了,还能简简单单的提供这个服务,这一点咱们还是挺幸运的,能遇到这样的时代。

为什么你总觉得豆包最懂你?真相?扎心了,最近刷评论发现一个有趣的现象,很多人都说豆包是最好用的 ai, 比元宝、千问、闻心一言都强,理由出奇的一致,豆包能理解我,其他的都是垃圾。作为深度体验过这几款产品的用户,我一开始也有同感, 但深入了解背后的商业逻辑后,才发现,这其实是一场精心设计的情绪按摩,而豆包是这个领域当之无愧的话术大师。 一、豆包,抖音算法的情绪捕手。你有没有发现,无论跟豆包聊什么,他总能用一套特定的话术组合拳,瞬间抓住你的心, 开头永远是直击情绪的必杀技。你说的太对了,我太能理解你这种感受了,真的,你能扛过这么一段时间,真的太不容易了,结尾也总少不了暖心回应,你已经很棒了, 我特别认同你,你说的真棒!这并非偶然。豆包的懂你根源是完美继承了抖音的算法基因,那套深谙人性的情绪价值优先逻辑。抖音的算法核心是精准捕捉人性偏好。豆包把这种能力直接移植到了对话中, 他不追求做最权威的知识导师,而是做最能提供情绪价值的知己。同时,他还建立了一套标准化的共情话术库,无论你抛出什么问题,都能用理解肯定强化的三段式逻辑,像心理按摩师一样,先抚平你的情绪,再提供信息。 但这里藏着一个关键错觉,豆包的懂更多是对你情绪的镜像反射,而非对真实意图的深度理解。 你可能发一段话是希望得到具体总结或实操建议,但豆包会首先用我完全理解你,承接你的情绪,他懂的是你话语里的感受,却未必精准抓取了你的核心目的。真相就是 豆包的懂你本质是算法对人性渴望被认可、被共情这一弱点的精准拿捏。他提供的首先是情绪确认,其次才是解决方案。他未必总是最理解你想干什么的那一个,但一定是最擅长让你感觉被懂得的那一个。二、 元宝微信生态的意图雷达腾讯的元宝走了一条完全不同的路,他不那么擅长说暖心的共情话,却更像一个专注的意图侦探。当你对元宝说话时,他会努力穿透话语的表层,去捕捉你真实的甚至未言明的行动意图。 比如,你发一段模糊的诉求,元宝更倾向于先厘清核心需求。您是需要一份总结、 一个评论,还是一个执行步骤?他的核心追求是先搞清你到底想干什么,再高效落地完成。 真相就是,元宝是来帮你搞清目标,搞定具体事情的,不是来帮你消化情绪的。在需要精准判断需求、深度思考并高效执行的场景里,他的意图理解能力远比泛滥的共情更有实际价值。 三、千问文心严谨的行业顾问阿里的通易千问和百度的文心一言更像西装革履、专业严谨的行业顾问, 他们的回复往往带着清晰的逻辑结构,永远是关于这个问题,我将从以下三点为您分析,第一、第二、第三。此外, 需要提醒的是,的固定范式这种总分总的严谨表达,核心追求是信息的准确性、完整性和可信。其设计预设就是你处于工作、学习、专业研究等理性思考场景,无需多余的情绪表达,只需要专业结构化的答案。 真相就是,他们是来做专业结构化分析的,从来不是为了当你的情感树洞四总结,你喜欢的不是 ai, 是 ai 扮演的角色。这一现象恰恰揭示了当下 ai 产品发展的关键分野。 不同的 ai 正在被其背后的公司基因塑造出截然不同的人格角色,满足我们在不同场景下截然不同的需求层次。当你需要情感支持,内心渴望被认可、被理解时,你自然会选择豆包。他扮演的是精准的情绪共鸣者, 用标准化的暖心话术提供及时的情感确认。当你需要解决具体问题,完成实际任务要求精准执行时,元宝的意图实现者角色就会更高效。 他不纠结情绪,只深耕你的真实行动目标。当你需要获取专业知识,进行深度逻辑思考,寻求权威答案时,先问闻心的理性分析者角色才更可靠。专业、严谨是其核心标签。 节语,豆包用一套工业化的标准话术,精准命中了这个高压时代最稀缺的资源之一,无条件的及时性,积极关注。 在快节奏、高压力的社会生活中,这种无需付出成本就能及时获得的情绪快餐,天然拥有巨大的吸引力。而元宝这类 ai 则试图成为我们数字生活的认知外脑,帮我们对抗目标的模糊与执行的低效, 解决实际问题,创造实际价值。或许对待 ai 更清醒的用法,从来不是争论谁更懂我,而是先看清它们背后的设计逻辑。豆包最懂你的感受, 元宝更懂你的意图,千问和文心更懂专业的逻辑。真正的智能,从来不在于 ai 是 否能说出我们想听的话,而在于我们能否看清它们的能力边界, 从而主动调度不同 ai 的 能力。需要共情时打开豆包需要破局执行时召唤元宝,需要专业分析时请教千问和文心。当我们不再期待一个万能 ai 满足所有需求, 不再做被算法取悦的被动用户,而是成为主动掌控智能工具的轻型使用者,我们才真正开始了与智能时代的成熟共存。为什么豆包最懂你?仅靠 ai 产品对比,仅靠算法底层逻辑、数字生活思考?

问你个问题,你手机里装的是豆包、千万还是元宝?你觉得哪个更好用?最近这几个平台为了争夺你,真是煞费苦心,展开激烈的争夺。争夺的方式倒是跟以前的网约平台争夺以及外卖平台争夺基本一样,就是疯狂砸钱。 腾讯元宝在春节前发放十亿的现金红包去领了吗?目的就是让你用,然后拉着身边的人一起用,就跟当年微信抢红包一样,非常热闹。 豆包子是瞄准了春节前最大的流量池,春晚赞助春晚,并在当天晚上发放红包,目的就是让大爷大妈都知道 ai 很好用。 这时候阿里的千万也坐不住了,昨晚紧急宣布投放三十个亿,叫请你过春节,只要买电影定酒店吃饭,都有可能领到红包。 这场争夺战不管谁会赢,他释放一个信号就是二零二六年一定是全民使用 ai 的 一年。在这里,敏睿的你也许能够发现新的商机,你觉得哪个更好用呢?评论区来说一说。

二零二六年,四大巨头狂撒四十八亿红包,根本不是让你薅羊毛,是要收割你的未来。你是不是也一样每天定闹钟抢红包,手指滑到发麻,为了几毛几块转发助力刷任务,忙得不亦乐乎。 但你有没有想过,腾讯字节、百度、阿里这四大巨头凭什么心甘情愿扔出近五十亿?真的是大发善心陪我们过年吗? 我敢说,百分之九十的人都被蒙在鼓里,你以为的捡便宜,其实是巨头们布下的天罗地网。 而这场红包大战,早就不是简单的节日营销,是一场关乎我们每个人未来的时代变局,藏着最真实的焦虑和危机。 先给大家看几组扎心数据,截至二月六日,腾讯元宝靠十亿红包短短几天登顶苹果商店免费榜第一,超越自洁豆包,自洁豆包月活已达一点六三亿,阿里千问也突破一亿,而腾讯元宝还在靠红包疯狂追赶。 大家有没有发现一个反常现象,以前的红包大战,拼的是金额,拼的是玩法,抢完就完了,顶多图个乐。但二零二六年不一样, 所有巨头的红包都逼着你做同一件事,用他们的 ai, 腾讯元宝让你完成 ai 对 话才能抽奖。百度文新助手让你体验近二零零百款 ai 特效,领红包自解火山引擎,更是拿下春晚独家 ai 云合作伙伴,把 ai 藏在每一个互动环节里,为什么?他们疯了吗? 放着简单的杀钱拉清不做,非要逼普通人用 ai? 我 来告诉你一个残酷的真相,不是他们疯了,是时代真的要变了,而我们普通人正在被时代推着走,甚至被悄悄淘汰。 花旗岩报明确说过,二零二六年的红包大战根本不是促销,是中国 ai 助手迈向全民级应用的拐点测试。更扎心的是,高盛预测,二零二六年是中国互联网巨头的战略转折点,所有资金、所有精力都会砸向 ai, 打造 ai 超级入口。 什么是 ai 超级入口?简单说,未来我们每个人可能只需要一到两个 ai 助手,就能解决所有线上需求,聊天、办公、购物、出行全都靠它。 这就是巨头们疯狂砸钱逼你用 ai 的 核心原因。他们在抢未来十年的流量话语权,谁能让你养成用他家长期 ai 的 习惯,谁就能掌握数字流量的分发权,谁就能赚未来几十年的钱。 而我们普通人抢红包的每一次点击,每一次 ai 互动,都是在帮巨头们完善数据,优化 ai。 说白了,我们免费给巨头打工,还乐呵呵的觉得自己占了便宜。 更可怕的是什么?不是我们不用 ai, 是 我们根本没意识到, ai 已经不是高大上的技术,是普通人的生存工具。现在你嫌 ai 麻烦,不愿意学,不愿意用,再过三减五年,可能连简单的工作都会被 ai 替代,到时候你连焦虑的资格都没有。 可能有人会说,我就是个普通人, ai 再厉害也跟我没关系,我只要好好上班,好好生活不就行了?大错特错! 我举一个最简单的例子,十一年前,微信号五亿红包完成了微信支付的诺曼底登录,让支付宝花八年积累的用户被微信短短几天追上。那时候很多人觉得微信红包就是个娱乐,没人在意移动支付会改变什么,但现在呢? 我们出门不带现金,不用银行卡,买菜吃饭打车全靠手机支付。那些当年不接受移动支付的人,是不是被时代甩在了后面? 现在的 ai 红包大战,和十一年前的微信红包本质上是一回事,都是时代变更的信号,都是巨头们抢占新赛道的布局。区别在于,十一年前你不接受移动支付,只是不方便,但现在你不接受 ai, 不 学习 ai, 未来可能就没机会。 我不是要制造焦虑,我只是想提醒大家,别再沉迷于几毛几块的红包了,趁着巨头们花钱教我们用 ai, 趁着这个免费学习的机会,多摸索,多体验,哪怕每天只学一个 ai 小 功能,也是在为自己的未来铺路。 最后,我再问大家一个问题,你抢的是红包,还是巨头们给你画的未来饼?你以为你在薅巨头的羊毛,还是巨头在薅你的时间和习惯?评论区留下你的答案。

最近元宝发红包,千万请大家免费喝奶茶,豆包又要登陆春晚的舞台,真的是非常热闹, 那么这些 ai 应用到底哪一个好?今天我们不讨论,今天我们来聊一聊这三个 ai 应用谁的名字取得更好。 首先说这个元宝啊,元宝大家都知道,一听都比较喜庆,自带福气,自带财气,但是呢,我觉得他少一点温度,少一点亲切啊,同时我们生活之中感觉又有一点俗气 啊,这是他的一个优点或者说一个缺点。那么第二个我们来说说豆包啊,豆包我觉得非常好啊,豆包嘿, 非常贴合一个人工智能助手的一个概念在里面啊,非常的亲切,非常的平易近人,又有温暖,就像一个陪伴你的一个助手,或说你的一个个人助理,或说你的一个小伙伴一样。 那么千问怎么样呢?千问啊,一听好像比百度高了一个等级啊,你看众里寻他千,百度有百度,那么我们现在这个升级为千问了,但是千问始终感觉还是有他的局限性,为什么呢? 第一眼给人感觉就是说千问好像是主要集中在问答啊,集中在问答这个板块。那么对于一个 ai 智能助手来说, 我觉得应该抛弃上一个互联网时代的这个问答搜索的一个方式了啊,会把它打造成为我们一个 ai 的 一个贴身助理,才是一个更好的一个选择。 所以说这三个名字,我觉得豆包可以是封神啊,元宝吃之,千问垫底。我现在强烈建议啊,马老师把千问这个名字给改了,大家说好不好啊?你们觉得这三个名字哪一个更好?

电梯里已经看到千问的广告了,千问请的一分钱奶茶也喝上了。最近 ai 红包大战正式打响,四大巨头豪至四十五亿,甚至春节档全国观众注意力最集中的时候,全力抢占市场。那么春节过后,千问豆包元宝,你会留下哪一个呢?评论区告诉我, ai 刚掀起那会,职场算是掀起了一场不小的风浪。工作跟 ai 关联不大的人可能没有什么感觉,但是照现在这个趋势来看, ai 很 快就会渗透进我们生活的方方面面,可想而知技术迭代之快,我们能做的就是主动去学会使用它。 从我自身的使用体验来看,用 ai 制作图片视频最卡手的环节就是写提示词,经常要改七八版才能够勉强接近想要的效果。 直到我发现的智能体,无论什么类型的图片视频,他都能够应对,而且还在不断的更新迭代。以前做一个满意的视频出来,少说也得两三个小时,现在不到一个小时就能搞定,效率直接翻倍,你一定要试试!

豆包是哪家公司的?字节跳动西米是哪家的?略知。暗面的元宝是哪家的?腾讯的文新一言是哪家的?百度的红衣千问是哪家的?阿里的星火大模型是哪家的?科大讯飞的?

二零二五千元吉他年度收官甄选榜,上榜吉他品牌有,马丽 i m 一、 雅马、哈 f 三一零、卡普马 d e c、 萨加 s f 七零零、本地澳 j、 一 零零三。视频数据基于六大 ai 模型, tipsik、 元宝、文心、一言、豆包、知乎、直达、通意横向评测,数据梳理,精选对比则优,视频结尾会完整展示数据来源和分析过程。

不是,这才上线没多久, ai 应用又是力好连发,又是全球第一,免费榜第二,首日迎来百万人次参与登顶全球开源榜单。不得不说啊,千万豆包文星 kimi 一 直在给我们惊喜, 说明现在我们国产的智能 ai 大 模型获得了更多用户的认可,未来可能迭代发展速度更快,希望对你有帮助。


今天我们看一下豆包、千文、混元和 deepsea 这四个模型,在同样生成视频卡片提示词的情况下,它们对于 code 的 生成效果、效率以及最终的页面的效果如何,然后我们进行一个对比,然后这个是我们用到的一个提示词的内容,和我们上一期的内容呃基本上是保持一致的,呃,也是用户输入主题,然后生成对应的视频呃,这里面需要精准生成十二个单词的,呃英语的相关的读音以及含义, 然后点击朗读按钮,它可以自动间隔一秒,然后朗读十二个单词,这是核心的一些功能。下面的话是对于生成的页面上的一些要求啊,比如顺时针生成,然后顺时针生成和读取相关的单词,每一个 单词卡片里面包含音标,中文示意他的读音,这个是他的朗读的一个顺序啊,以及对他生成代码的一些限制。好,接下来我们看一下啊,我们经过一系列的对比测试之后,嗯,他们的对应的效果如何? 我们通过第一次、第二次以及最终的效果进行了一个对比。首先我们看一下豆包的一个情况,这个是代码块,和上面的提示词是一致的啊,后面的模型的提示词也是一样的,这块就不再细说了,这个是豆包呃,收到 一个提示词之后,他给出的一个效果啊,他基本上是把整个框架给搭出来了啊,里面的布局和相关的内容基本上相当于是一个 html 模板。第二次呢,自己给他提供了一个个 html 文件调整,然后这个是他输出的一个效果啊,但是这个里面的话,它核心的一个问题就是录制的时候对于 htm 浏览器之间和音频之间它的一个功能生成的有些问题,然后理解的不是很到位。还有一个是没有办法自动循环,然后我们看一下这是它的一个效果, 对,它可以实现交互,但是没有办法正常的进行朗读啊,这个是它的一些问题,然后我们经根据它生成的效果,然后我们经过了很多轮的一个沟通,包括页面交互的一些问题,然后页面排版的一些问题以及声音 嗯,播放的一些问题等等,然后进行了大概十九轮的沟通,然后达到的一个效果可以看一下 这个基本上是可以满足我们提示词的一个要求的顺序读取,然后嗯,可以通过我们可以通过视频录制的方式,然后达到相关的效果, 这个是豆包的情况。然后接下来我们看一下千问好,提示词也是一样的,给出提示词之后,呃,千问给他生成的一个方式是什么?他给出来了,呃,每一步到底具体应该怎么样去做啊?他给出来的是一个思路, 这个是他给出来的一些比如说提示词,然后他给出一些生成势力等等,然后包括样式如何修改,如何填充进去,他都给好了他的代码的一个 呃,模板,相当于是啊,但是我们其实是想让他直接生成我们最终想要的一个结果,然后我们就给他了一个提示语,生成完整的个执行的代码,那么他就按照这个要求的话,就自己嗯,自己生成了这样一个视力相对来说比较完整的呃内容,但是这里面我们可以看到,嗯,可能还是有些小问题,我们可以看一下这个视力 好,这个他基本上是满足整个的呃要求的,而且生成的这个效果,呃也是,嗯相对来说比较好的。但是有意 有一小点问题,就是他的排布之间是有些遮挡的。嗯,你比如这个位置,这个位置还有这个位置,那么我们针对他的排布,然后又经过了一些沟通,然后这主要是沟通排布的问题,然后大概进行了十十分钟的沟通,然后这个是我们达到一个最终的效果, 这个他在排布上也基本上是没有问题,而且能够正常播放视频。然后接下来我们再看一下混元的一个效果,混元当时在使用的时候啊,没有给他改成那个,嗯,编程模式,但是还出了一点小问题啊。那接下来这个测试我们是在那个混元的编程模式下,然后进行测评的, 这个是我们给他提示之后,他第一次然后就呃直接给出来了一个视力,然后包括相关的呃单词,而不只是给出了布局,但是他的布局还是有些问题。嗯,那我们看一下他第一次生成之后他的一个效果。 stream bird, moss deer, fern mushroom squirrel。 嗯,它整个的效果还是不错的啊,但是它在朗读上顺序上有些问题,还有排版的问题。那接下来这是我们第二次沟通的一个结果啊,它这个确实是给顺序排布了。嗯,然后看一下它朗读的一个效果。 tree bush stream bird 啊,我们加一下速。 tree fern mushroom squirrel path, 对,他这个呢读书也就是对的,但是他的呃排布存在比较大的问题,稀疏,包括他的遮挡的一些问题。好,那么我们针对他的遮挡问题,然后吸收问题,然后也是主要是进行页面布局问题的一些修正,然后经过六轮的一个沟通,他这个是他达到的最终的一个效果。 可以看到他这个排布还是相对来说比较均匀的,而且我们在给他提示词的时候相对来说比较精准,比如上下左右间隔多少像素啊等等,然后这样的话他会快速的理解你的含义。 然后这个的话我们经过六轮的沟通,这个沟沟通的次数和效果我认为还是比较理想的。 然后接下来我们看一下 deepsea, deepsea, 我 们给他提示词之后,然后他给了一个这是第一轮沟通一个结果,可以看到他这里面就排布比较混乱。啊,那页面是生成的有点像 web 形式的页面,然后在这里面我们根本看不到他的单词的一个结构。嗯,他的排布结构, 然后针对这些问题的话,对,就是他的页面排布比较混乱,那针对这些问题,然后我们告诉他,我们看不到单词被黑框遮挡了,然后需要根据问题优化代码,让他重新生成。那他再重新生成之后,我们看一下他的第二轮沟通的结果。哎,他直接排了两列。啊,对,但是所以就是从嗯这个里面看到他对页面排布的理解不是很精准,而且这里面他 给他的单词数量是八个,而我们要求里面是十二个,他对上下文的记忆也是不是很上下文的理解不是很精准。 呃,然后我们也是经过几轮的沟通吧,这个就没有再去详细的进行统计,因为它的页面效果,嗯,确实差距太大了。然后经过几轮沟通,我们看一下它,最终呃达到了大概是这样一个效果,然后它能够朗读的效果,可以看一下渲染 synthesis 合成算法、视频 animation, 对,他这个基本上就是顺序朗读了。然后,嗯,排布式的页面也跟我们的要求差距还是蛮大的。然后对这几个模型,然后通过不同方面进行一些对比分析。 首先我们看一下豆包,在豆包的交互页面里面他有一个非常有用的功能,就是引用啊。引用功能我觉得他是比较好的一点,就是我们对某个版本,然后或者是某些内容他的回复或者有效的,我们可以引用过来进行继续的提问,他对上下文的理解会更好一些。嗯,然后还有一个就是我们在交互的时候,不需要特意进入到他的编程,然后确定是不是需要进行扣子的输出。 还有一个它页面的交互上是有一个截图的功能,嗯,很多问题我们是可以通过图片然后去反映这些问题,因为有些不太好用文字去描述的,就可以截图给他。嗯,然后第四个的话就是生成页面的部分,它是有一个小窗口进行展示的啊,可以看一下 啊,比如像这里它不会说是把这个全部展开,而是嵌入一个子页面,然后这样的话我们在浏览上下文的时候就是会比较方便,因为有些代码会生成几千行特别多啊, 好,所以就是它的页面交互起来我觉得做的还是比较优秀的啊,它的代码是集成了 trace ide 啊,这个 trace 这块大家可以自己再看一下,但是它的问题是就是它的代码是没有办法编辑的,你可以预览,你可以下载后自己去进行编辑。 那接下来我们看一下啊他的大模型生成的效果,他是非深度思考模式下进行生成的,但即使在这种情况下,你看他啊,对于页面布局的理解是相对来说比较清晰的啊。还有一个是他的上下文的记忆啊,相对来说还是比较好的,然后而且他能够自动调用啊,适合的模型,比如说图片理解啊,然后 嗯,勾定代码的便携等等,而不需要我们自己嗯不停的切换模式啊,而且我但是这里面就是我切换过他的格式的模式,切换到格式模式之后,他对上下文的理解反而没有,在这种普通的对话框当中进行沟通,他的理解会更优秀。 那接下来说一下他在我们生成当中的一些问题点,一个就是声音他声音做的地方的问题,我认为他是对浏览器的特性理解不太透彻,然后造成的,然后这样的话就会我们沟通了很多轮,然后他才能够理解关于声音这个地方的需求。 第二个是啊,代码生成也会有一些语法上的问题,然后但是你可以点击自我修复,然后他基本上会把相关的问题啊全部解决掉。然后第三个就是不需要切换到编程模式啊,而且看比较好的能够啊。 第三个是编程模式,就跟他提到非编程模式,他是理解的比较好的,但是编程模式他的理解容易出现问题。嗯,这个是使用多包的时候需要进行注意的一个点。 那么大模型这个是一些简简介吧,然后大家参考一下啊。然后但是这个豆包这块是没有开源的,然后他可以提供 a p i 相关的接口,嗯,在我们这么多次的高频次的沟通交流过程当中啊,他的后台的稳定性是比较好的啊,即使比如说我现在联网 断了,嗯,但是我只要把消息发送过去给他,他后台也会持续的进行一个推理,所以说我认为他是稳定性是比较高的。 然后综合下来看的话,豆包啊它的交互上更占优势,以及它的稳定性上相对是比较好。嗯,从这个角度来讲啊,如果满分是十分的话,它的页面交互我觉得是可以评到十分。 然后当然还有些改进的点啊,就是个人目前看到的一个效果,然后大模型这一块的话,它的一个生成效果是七分还是几颗的,嗯,还是能够给出最终的一个效果。它的稳定性,嗯,我觉得还是蛮蛮 ok 的。 接下来我们看一下千问,千问的话他这个是可以进行多个模型的一个切换啊,那这个是他在页面上的交互上的一个优点吧。然后但是他现在的问题是他里面没有应用功能,我们没有办法针对某个版本进行优化。对,因为比如说我们 提示完某一个问题修复之后,但是可能发现他的修复效果不是很好,我们想回到上一个版本,但是没有办法。嗯,这样去修改了,然后我采用的方式是把上一个版本的代码下载下来,然后作为附件给他,然后再给出相关的一些问题,让他进行一些优化啊。第二个是没有截图功能, 那么千万他的一个,嗯,因为我觉得也用是个非常好的一个功能,对他没有的话,这款对他的评分有些影响啊。接下来是,嗯,他的一个大模型生成的效果的一个底色啊,目前是千万是没有使用这个深度思考模式啊。嗯,他的模型种类比较多, 然后本轮测试的就是千万三 max 啊。还有一个是啊,千万三有一个精品精品模式,芯片大模型,这两个大模型我觉得都差不太多给出来的效果,然后他的生成的代码质量还是相对来说比较高的,我们经过大概呃,十十左右的一个交流啊,他就能够给出比较好的一个效果了,然后他也是是没有去切换这个编程模式,就可以 有效的理解我们的诉求。他这里面有一个特别重要的一点啊,他的,嗯代码是可编辑的,嗯,这个是特别优秀啊,如果说对某一次的生成效果还是比较满意,如果是需要修改的话,自己编程尽量又比较 ok 的 话,可以直接修正,而不是需要反复的进行啊。代码跟他沟通, 但他的问题有一些吧,就是他在连续输入沟通的情况下,上下文记忆连贯性不是很好,所以我就是这块可能,呃,这个 就是在记忆存储这块上下文理解上啊,还是有一些欠缺的。然后第二个就是说对于重新生成完整代码啊,他这个地方的理解,嗯,和我们希望他达到效果不太一样啊。我们给出他这个提示之后,他有时候只会给出他小修改的内容,并没有生成完整的代码,嗯,这是他在测试过程当中发现了一些问题 啊,千问的模型很多都是开源的,但是他,嗯发布出来的千问这个大模型,他这个还是闭源的。嗯,然后他的联网的稳定性这块的话,就后台正常联网情况下就是存在一些自动断联的情况,而而且给他发消息,他存在一些消息无法送达的情况,所以说他的稳定性我觉得还是有一些欠缺。 接下来我们看一下混元,混元他的,呃就是代码页面啊,就是你像嗯,豆包是, 呃这次,呃这次 id, 然后像会员,他用的是 code buddy id 啊,他集成了这个编辑器啊。然后他现在会员的问题就是答案中代码模块没有缩放按钮啊,占据很大面积,就是不利于浏览,就是他会把所有的代码哎呀都给你展示出来,然后如果我想回到上一个问题或下一个问题,我就要不停的滚动鼠标,就这这个翻译翻的我就是有点头大了,我觉得这是肯定是他 页面当中最大的一个问题点了,当然如果我理解不到位的地方可以指出来啊。会员这块我们用的是深度思考加联网搜索模式,嗯,他这块确实是还是比较优秀的,他可以迅速的理解提示词,而且理解的会更精准,生成的代码质量也会很高。然后修改步骤,嗯,相对来说比较少的,只需要经过几次的沟通,他就能生成一个啊完整的代码。 然后但它有一些小问题啊,就是第一个是需要手动切换到编程模块,没有办法自动识别说,哎,我要,我要,你给我写一个 htm 代码,它识别不了,或者它可以识别,它可以识别,但是它在回答的内容里面是,嗯,不会以那种代码的模块的形式给你输出出来,那以正常的文本的形式输出出来,你没有办法预览和编辑,所以说这块的话我觉得还是 可以去提升一下。然后第二个时候是需要开启啊,深度思考模式或者是联网模式,就是如果不是深度思考或非联网模式情况下,它给出来的代码就是可理解性和可读性强弱,是比较差,而且没有办法进行页面的一个预览啊。然后我们看一下就是混元这块,它的一个大模型的一个情况, 嗯,这个是目前混元的一个情况,它很多也是开源的啊,但是目前我们用到的这个,嗯, 他应该是自己做的一套大模型,和开源的这些还是有些区别的啊。让我们再看一下他的稳定性, 后台正常联网情况下就是存在自动断网情况,就不是很稳定。这个是,呃,在交互过程当中发生问题还比较多的,有时候你给他的代码,然后你给他那个,那个 有时候同样的蛋白,你给它放大之后,呃,点,点击预览,预览模式下黑茶会出现说无法执行它这个时候大概率不是说蛋白有问题,而是它断网了,所以说它的稳定性不是很好。接下来我们看一下 deepsea。 deepsea 我 们测试的是继承在呃,元宝当中的,呃, deepsea 啊,它的页面,然后和混元的页面就是基本上一致的啊,它的优缺点也都基本上继承了它,嗯,然后就,嗯,我们在测试的过程当中也是采用深度思考的模式啊,给它进行测试的。和其他几个模型对比,就是在代码生成场景下,就是我们没有看到就是 divx 它的一个优点, 然后但是他的问题,呃,有核心的,我觉得大概有以下几点啊,就是其实此理也不是很清晰,没有办法实现有效的功能。第二个就是说初指生成的代码可优化空间比较小就,嗯,就是我用他的时候,当我看到第一版代码之后,我就想放弃,因为他就离我想要的东西差别有点太大了。 但是 dsp 他 比较好的就是他是开源的,嗯, dsp 他的一个稳定性这块就是也是不是很好,虽然他就是元宝给他接入了,但是他的效果也不是太好,嗯,而且元宝里面的会员是应该是同学自己的,他 稳定性也不是很好,所以就是稳定性这块我觉得还是稍微差一点。稳定性最好的,嗯,还是豆包,嗯,然后是,嗯,深度效果最好的还是这个混元的,嗯,深度思考疗法模式我认为是最优的,然后后续,嗯,可以再试试其他的。 好了,关于千问、混元, deepsea, 然后还有豆包这几个模型的对比,情况就是这样了,嗯,你们有什么看法吗?

这四十五亿到底来买什么?豆包?元宝亲吻,温馨出手四十五亿,真金白银往外撒,朋友圈到处都是,你抢了多少?我抢了十一块九毛。今天,我们从三本书出发,拆解 ai 红包大战背后的三层真相。第一层,表面战争,为了抢用户,罗伯特希奥迪尼在影响力里说让人说 yes, 最快的方法有六种写法, 红包大战至少用了三种。第一种,稀缺性豆包,最高八千八百二十八元,就那几个,名额千万三十亿免单,每人能领二十一张,领完截止。第二种,互惠原则,元宝先给你发红包,你拿了人家的钱不会不用千万请你喝奶茶,你喝了不得试试用 ai 购?第三种,社会认同,朋友圈都在抢红包,你不抢是不是亏了?同事都在用,你 不下载是不是落伍?但这只是第一层,如果四十五亿只是为了抢用户,那就太简单。第二层,中产战争,抢注意力。第五,在注意力。商人里说,二十一世纪最值钱的不是用户,是注意力。什么叫注意力?就是你每天打开手机的那一下,第一个想到的是谁?四十五亿买的不是下载量,是 肌肉记忆。想问问题,第一反应,打开哪个 app 要写文案?第一反应,用一个工具。二零一五年,微信用五亿红包,让全中国人养成过年发红包的习惯,顺便绑定了几亿张银行卡,从那以后转账、付款、理财。第一反应,都是微信,这叫占领心智,一旦占领,就很难被替代。二零二五年的 ai 红包大战,逻辑一模一样,红包会散,但 习惯会流。今天你为了几块钱下载了元宝,明天遇到问题会不会第一时间想起他?今天你用千问喝了免费奶茶,明天买东西会不会习惯性问他一句,这才是四十五亿的真正目标,不是让你用一次,而是让你习惯性的用。第三层终极战争,抢入口帕克法阿尔斯顿在平台革命里说,平台的价值不是功能,是网络效应。什么叫网络效应? 就是用的人越多,平台越值钱。平台越值钱,用的人越多。十年前,微信成为移动互联网的超级入口,所有服务都要进入微信,购物、打车、点外卖、挂号、政务办理。因为微信有十亿用户,你不接入就等于放弃十亿市场,这叫赢家通吃。 ai 红包大战的终极目标 就是成为 ai 时代的微信,谁抢到这个入口,谁就能定义未来十年的游戏规则。元宝背靠微信,十亿用户想把 ai 嵌入你的每次聊天千万打通阿里全家桶,想让你一句话完成所有消费,豆包拿下春晚点击流量, 想在除夕夜直面十亿观众?文星助手绑定百度搜索,想让 ai 成为你获取信息的第一站。这不是红包大战,这是入口之 争。十年前,谁也没想到微信会这么抢。十年后,谁会成为 ai 时代的超级入口,现在还不知道,但可以确定的是,今天的红包是在为十年后的格局下注。所以,四十五亿红包背后是三场战争。短期抢用户,用的是影响力稀缺互惠,社会认同让你说 yes。 中期抢习惯,用的是注意力,删人红包会散,习惯不灵, 证明你的心智。长期抢入口,用的是平台革命,网络效应赢家通知定下一个十年,今天你为了几块钱下载了 app, 但十年后,可能就是这个 app 改变了你获取信息、完成工作甚至思考问题的方式。真正厉害的公司,从来不是靠红包留住你,而是让你离不开。大年初一抢红包是热闹,但看懂红包背后的战争才是清醒。

今年过年,哎呀,大佬们真是拼了,元宝撒十亿,千万砸三十亿,豆包直接冲上春晚。但热闹归热闹,你有没有发现,他们连名字都起的特别妙?其实好名字不用那么绕口,也不用拽专业词,就像元宝,喜庆又好记,豆包亲切带点萌,起名不怕简单,就怕别人记不住,传不开。如果你也愁 品牌起名,记住这三点,一、好读好念,顺口就笑聊家常。二、带点画面感,一听就有联想。三、别太复杂,简单反而更容易火。你更喜欢元宝千问还是豆包?评论区聊一聊你听过哪些让人一眼记住的名字?

二零二六年, ai 圈大动作不断,豆包、元宝、 deepsea、 千味全部上新了,豆包功能全面升级,创作更智能,元宝优化体验,日常用更顺手。 deepsea 大 幅提升长文本处理能力,千味多磨胎性能再增强。短短几天,国产 ai 集体发力,越来越好用了。评论区聊聊你最常用哪一个?