粉丝4.6万获赞27.1万


中午一觉醒来,粉丝群里炸锅了,就是这个玩意,说是能定向换人脸,这可解决了某捉泥一直以来做头像不像的难题。然后大家都在问,怎么找啊?去哪找? 我去搜了一下,好家伙,出了视频的,搞的还是很神秘,我就不卖关子了。链接放在这里,打开之后登录 dsr 授权就可以使用了,有能耐的就直接暂停输入, 没本事的还是得进群看。用法也很简单,机器人加入之后,斜杠 cy 的上传想换的人脸保存,然后找到要替换人脸的图片按钮,放大 点,右键会多出来一个 app 放上去,出来的第一个选项就是自动换成你刚才保存的人脸,这个效果大家自己尝 尝试吧,只能说尽量选风格和角度一样的照片。最后说一句,这个插件应该是大神自制的,不知是否会进一步研发,只用来做人脸太可惜了, 如果能识别指定主体,比如说产品,那就是加速了 mojoni 的商业化使用啊,我们拭目以待吧。


哈喽,小伙伴们,今天给大家介绍一下如影的音赛啊,以及 honky 双兼容,然后呢,这个我视频呢,我们主要讲解如影介入小米,然后小米又介入 honky, 然后这个灯光的一个互通的爱迪生, 爱迪生,我在关闭玄关灯,玄关灯已关闭,嗯,我们现在在玄关的位置已经关了,那么苹果上的这个呢,他也关了,大家看一下玄关灯,比如说我们玄关灯,苹果这边打开, 然后呢,苹果这个亮度我们给他调到色温给他调到两千七,其实啊,你看如影这边也就是马上他就会开起来了,然后亮度百分百,然后呢色温是呃,六千多 k, 然后呢我们这边给他切 换下,切成呃,三千五百 k, 然后其实他已经同步啊,他已经马上同步回来了,两千八百 k 啊,然后这边都是可以同时互动剪容的。嘿, siri 关闭玄光灯, 好的,全关灯,目前已关闭。啊,其实这边如影这边应该也是关了啊,对,大家看一下,这边已经是关掉了,他默认状态且关掉了打开,然后呢啊,我们看一下 siri 这边,其实马上等会他也会打开了。好, 这个如影,苹果小米三件绒,然后呢,这个怎么做到呢?很简单,小米的设备把它接入到如影,同样小米的设备把它接入到苹果,用认证的 灯具或者是用三方 ha 的方式都可以实现。好,那么至于如影的这个大部分是百分之八十以上,小米的灯具是可以兼容的。好,喜欢的,点个赞,谢谢大家。

我觉得会有很多偏娱乐的 a 阵出现,当然也就是土溪,广益的土溪嘛。嗯,对,当然这可能就是接下来看怎么走吧。现在我也看了一些比较有趣的一些一些尝试,比如说对,比如说那个,我就不说具体名字吧,他们做的可能就是,呃,给每一个人做一个虚拟的 a 阵,然后让 a 阵以代理的形式之间进行社交,我觉得这都挺好玩的, 但我觉得我实在是没有这方面的 insight。 所以 啊,这种感产品感觉适合 openai 做啊。你说 openai 吗?我觉得 openai 适合做所有产品,你觉得 openai 会抢夺你们的身生态位吗?啊,我觉得一定是会有竞争的,但是我们现在观察到的现象是什么?首先就是在叉 gpt agent 出来之前, 我们可能要经常回答他的一个问题,就是 openg 做了,你们怎么办?他们做了,嗯,他们做了,对,但是很明显效果就不如 manifest 了。这我刚才讲的就是我们其实是能用世市面上所有最好的选择。嗯,而 openg 它仍然是在它的领域有所专长, 这是第一点。第二点是什么?其实跟他们的一个用户心智有关。叉 gpt agent 仍然是叉 gpt 的 一部分。叉 gpt 我 觉得它是一个打透了的产品,就是叉 boss 的 战争已经结束了, 所有的用户都在使用叉 g b t, 但实际上有 agent 的 需求的人客观来说是少了一个量级的。哦,对,所以我们其实一直是在自上而下去做,就是我们一开始触达的用户。其实你想 madison 美国是怎么火起来的?其实都是一开始像什么这个 patrick collins, 然后 jack dorsey, 就 这些硅谷精英们,他们发现这个东西真的好用,能给自己提效,所以一直都是在服务一个相对比叉 g b t 单价更高的用户群。 其实对于那种比如说快速的问答,或者一些低价任务,包括我自己,我也是不用 miniso 叉 gpt 的, 所以我觉得这是一个分层的一个市场,我们会长期专注为真正有高价值需求的人提供他能找到的最好的 ai, 而不是跟叉 gpt 去抢夺一个就是最广的底层的这个用户群。 所以叉 bot 和 agent 的 用户不完全是一拨人,他是不完全重合的,他不完全重合的,他包括你们 啊,对,他们包括我们,但是实际上我们一定要去满足的就是那些有最高质量需求的用户,就是他这些人肯定用过叉 gpt, 嗯,但是他们仍然会选择 max。 是 这样的一群人,其实是叉 gpt 没有把这个 部分的用户需求满足好。是的是的,或者就是说我们得保证我们永远能提供比叉 gpt 的 agent 更好的体验。那这是限阶段,未来呢?未来他们会赶上来吗?那我们也会赶上。这个就我常说就是 小公司怎么跟大厂竞争,就赶紧成为大厂,哈哈哈,你们现在距离大厂还有多远啊?还很远还很远,但是在做了,在做,在做,哈哈哈。长期来看,理想状态的 manus 应该是什么样的理想状态 manus? 其实我想回到刚才我们谈了一个问题,但没说完,就说 边界是什么这三件事。刚才讲到其实有三个系统,系统中有三个元素,一个是模型,一个是环境,一个是用户。其实我们觉得接下来我们就聊三个月后的事,都很慌,你就聊接下来这三个月内, 我们会关注一点,其实用户其实也是一种边界,也是一种瓶颈。是什么?就是现在无论 agent 有 多么智能,或者就说 manage 跟 chatbot 相比有一个最大的变化,就是它输出不简简单单的一段话是一个 action, 是 一系列 action 或者不同的产物,但实际上它的起点到目前为止大家看到的好像还是一个 prompt, 但实际上对于用户来说输入 prompt 是 很闹心的一个事,而且它有更多的问题是很多 context 没能带入进来,所以我们一直在想就如何去优化这样的一个事。 然后刚才提到的就是张涛涛哥的一个梦想是做一个七乘二十四小推二十四小时推理的机器,所以我们接下来会比较投投入的一个方向,也可能代表未来一段时间的 memes, 就是 我们在做 providence, 就是 主动性这个词,其实我觉得是 omi 带火的,不是这个词,其实应该是 agent 这个词的本意, agent 的 本意其实来自于 agency, 就是能动性、主动性。对,但是呢,之前的话,因为大家可能更关注的是一个结果的呈现,但是其实现在又到了该关注 context 这个这个问题了,就好比 opa 先做出了叉 gpt, 但 monica 关注到了输入 context 的 这个点, 现在我们也把这件事要做的更好,但是我们觉得不应该做成像叉 g b t 的 那个叫 pos, 对 吧?嗯,那种就是他每天给你推很多东西,这个其实在占用户的时间,而真正现在能够把为 manas 付钱,真正获得价值的用户,他其实需要生产力效率提升的。嗯,所以我们更关注的应该是如何 让 agent 主动去完成更多的事。嗯,对,这个东西现在我们内部已经已经有这个 pro 派,我们自己用的很爽,怎么主动完成?呃,这可能我先不方便透露太多,但我可以举例一个场景,嗯,就比如说我们自己,每天,比如面试完人之后,我们可能用一些第三方的下属,比如像 as 笔之类的东西,我们需要去写那个,就是 review, 就 写那个评价, 然后呢?当然评价我们自己评,但你要写很多这个,这个描述这些东西了。但其实我们在面试的过程中,我们可能用的是 notion 和 granola 进行记录, 那可能我们自己要干的事就是,假如没有这套新的这个 ai 的 话,那我们就得自己去基于我昨天的这 interview 的 记录,然后去填写这些评价。嗯,但实际上有了这个 productivity 之后, manus 其实可以每天早晨在我醒来之前先去自己看我的 notion, 帮我去直接把记录填到这个滚刀,填到 s b 里头,然后只让问我接受与否。所以其实应该解放出来的就是用户的这层瓶颈, 让 agent 的 能动性逐渐去发挥出来。嗯,这我觉得是一个短期未来关注的点,开始我觉得是你们想让大家能够更方便的去理解你们,所以你们用了一个通用 agent 这个概念。你觉得通用 agent 长期来看是是最合适的描述 mine 的 这个名词吗?呃,我觉得不一定,甚至说不是,为了让用户更好理解, 你知道我们这视频做的非常草台,整个这个工期大概就三天,是那块呢?因为他自己剪的,是吧?对,自己剪的,为什么那块要有一个黑屏?说什么 the world's first general agent 呢?因为中间那块其实发生了一个很傻的事。嗯,是,当时我们那是在我们办公室一楼录的,背后一个保洁阿姨走进来了, 所以我们必须在那掐一个,就是得得得剪一针,得有一黑屏。那完了,那这就只能给一个定义了。嗯,然后大家一想就是 madison, 如果刚才一开始说的,我们也没想好这玩意到底是这个, 你怎么定义它,对吧?它到底是为谁去服务的?因为我们想的是去观察,去做达人文,就想有一个壳,然后大家进来,不是一个壳,它是一个一个 playground。 然后呢?那好, 那就责任就到了,我,因为我得写那个视频的稿子,那这样我们管它叫什么呢?对,所以整个这个概念就我拍脑袋想的,然后是临时想的,对,然后就被大家采纳了,所以我觉得特别对不起大家,哈哈哈,对,但是我们觉得这个词其实它偏技术了,嗯,因为它来自于所谓的 general purpose agent, 这个看上去好像是为了占一个位置 设计的,这个词就是为了占,因为我都说二五年是 a 阵元年嘛,看上去你们想占占那个最大的生态位,然后取的这个词,其实不是,是因为利益性,是因为挡住保洁阿姨抢了这个词,哈哈哈,这,这是一个从市场角度来说,我觉得不是一个很好的选择,因为对于不了解技术人来说这是什么东西, 这是一个很奇怪的东西。所以我们现在接下来更想强调的一点就是说做通用的 agent 是 因为我们的一个技术选择,就刚才我解释了很多,对吧?就是你有一个更好的技术架构,其实你可以让不同的场景之间有很好的协同性,并且互相增强那个网络效应。比如说我们其实新的那个 madison 里头,我们一直在强调 website 标定这个能力吗? 但实际上这个功能我们只开发了不到一个月,但它效果目前绝对是搜它的。这就是因为我们其实在一套统一的一个 agent 架构之上长出来的那个最后一公里。对,但是这个对用户来说,其实我们没必要解释这么多, 我们未来对用户的沟通其实完全就根据客群去讲。嗯,比如说你是一个企业,那你可能更关注就是 internal tools 内部工具的构建。嗯,那就我们就跟他讲,就是 manage 是 一个非常好的内部构建的一个工具,同时它能帮你 去把各个环节串接起来。所以跟所有的垂直的产品相比,我就还想强调那一点,就是 manage 能做所有的事做的一样,甚至更好,且能多做一步,是这样的一个定义。我觉得 agent 这个词未来大家其实也不用太在意这个东西,它就是一种一种新的东西而已。 那比如说大家需要一个负责设计的 a 阵头啊,我觉得也许是需要的,因为它要融入你特定的工作流,就好比你设计领域如果没有 ai, 你 往回看也会从同时存在。 final cut pro 跟剪映就是这样的一个情况,你觉得 miniso 会收敛吗?啊?你说收敛是指收敛到某几个更垂直的领域?不会, 我们会是这样,就是我们会做很多的,我们叫做场景。嗯,就比如说现在,其实我们头部几场刚才讲的批量文件处理 网站生成, slice 生成,但我们从来没有单独做过一款产品,叫 minus slice 或者 minus what's the builder? 嗯,它仍然是在这样一个统一的 agent 架构之下,由我们产品团队去优化最终最后一公里的体验。所以 minus 永远是一个不断优化头部场景且保持很强场位能力的一个一个系统。 嗯,这是一个选择。对,这是一个选择,刻意的选择。嗯, minus 这样的 agent 呢?和像比如说 it 这种设计类的 agent, 你 觉得它们长期来看关系是什么样的?嗯,我觉得是这样,就是 loveart 一定会越做越专业。 manus 可能会有一定的设计能力,但是就像我刚才讲的,就 love art 是 给设计师用的,嗯, manus 是 给有设计需求的非设计师用的。啊,且同时还存在另外一种关系,就是为什么我们非常强调我们现在有一个概念叫 connector 或者叫 integration, 就是 连接与集成。 其实 menace 之所以它是一个通用 a 阵,它就能模仿一个人,它能模仿人用各种的工具,比如说自己内部,我们经常拿 menace 调试 menace, 那 实际上如果你是一个设计师,你其实你的工作每天也不是百分百都在设计。嗯,比如说有时候你需要,比如说基于一个设计稿,啊,不对,基于一个产品需求去做出一个设计, 那你甚至也许有一个用法,就是比如说你们在用,比如说 lark 或者 slack 来讨论一个产品,你可以让 menace 帮你盯着这个 slack, 然后让 menace 用 love art 去完成这个事。所以 menace 跟所有人我觉得都不是一个竞争的关系,我们是一个网络中的节点,但很多时候价值其实不是在网络节点,是在网络的边上。 你怎么看 krisy 和 cloud code 现在的关系啊?我觉得这个是比较尴尬一点,就是他们选择了一个最激烈的一个点,嗯,就是一个怎么说?就 ai coding, 它不是一个垂欲, 他是一个通用能力。嗯,但是呢,我觉得科斯这家公司非常厉害,所以呢,就是他一方面是启发了 many 很多,另外一点就是我觉得科斯的人才储备是不逊于这些 头部公司的。嗯,或者说就是头部公司中跟科斯直接竞争的那个团队的实力,嗯,跟科斯是可比的。这刚才我讲的一点就是创业公司跟大厂对比的方法就是成为大厂,我不说在规模上超越他,因为大厂不会倾注其所有资源于你一个人大, 我们现在要做到的就是我们在做 melissa 这件事的人,这个团队比,比如说某些大厂想做 melissa 人的这团队强得多,这就可以了。所以你现在多少人了?我们现在有将近一百 cursor 跟 cloud, 我 觉得还有一个点就是,嗯, cursor 的 选择空间还是比 cloud 要多一些。嗯,就是 cloud code 仍然是 cloud 的 一个延伸。当然就我现在还在说大家都在分化 cloud 在 coding 方面有一些独有的一个优势, 但实际上正因为 cody 是 主塞党,所以大家追的也都非常的快。比如说 gemini 三出来之后,大家会发现可能 gemini 在 eg 这个 cody 方面还没有完全追上,但再比如说静态前端的美学方面会非常领先。所以我觉得对于 cursar 来说有点类似于我们现在一个状态,就是大家都在盯着这一个方向打,所以它有一定的灵活度。 我觉得这个战争还没有结束。那你怎么看?你们像比如说 kimi, kimi 做了嗯,呃,阳性的 model, 嗯,他们就想走 coco 这条路。嗯,那你们作为一个应用型的 a 证公司,跟他的长期关系会什么样的?然后你觉得谁能赢啊? 我觉得首先我们跟 kimi 从来没有任何的竞争,因为我们没有业务。不一样啊。对,我们没有国内业务,国外的公司呢?国外的模型公司就是你们和国,你们应该也在国国外的模型公司主赛道上,对不对?主行?我觉得是的,是的是的,对,所以就是我认为最终一定是一个竞合类关系。其实我不觉得我们会输, 就像我们已经跟叉 g p t 打了第一仗,我们从效果上至少还是赢的。嗯,你们中间慌过没?其实基本就慌过了。焦虑没啊,我们肯定会焦虑,但焦虑不是源于这个。就是我觉得 nancy 整个从一开始就莫名其妙火了,到后来有太多事值得我们焦虑。所以其实 就竞争是一种最常态化的焦虑,他不会是占你生活中大部分的焦虑。好吧,你们焦虑的是什么?每个不同阶段当然就不一样了。嗯,那比如说我们刚才说到了二四年的,呃,九十月份,后面每个时期的焦虑是什么? 二四年的九十月份,其实在 madison 的 做完到发布前那段时间是没有任何焦虑的,因为很 enjoy, 对 吧?很快乐,很 enjoy, 而且就是我们也都就是所谓这个中登型连续创业者,就是我们去做完 madison 之后,我们知道这东一定会火, 是一个极有信心的状态,所以就对,就一定会成,所以就是并没有太多的焦虑。哎,你做的过程中哪个时候觉得一定会成?呃,其实就是当我们跑完了几个例子之后,嗯,就是我们当时也就自己内部也没想好做什么。其实当时我记得是涛哥吧跑了一个例子,是找办公室, 然后拿着自己去找资料,查地图,写程序,然后做做出交互式网站,还提供一堆这个选项之后,我们觉得这个太酷了,一定能成,哈哈。但是后来一次次的这个跑不同 case 之后,信心越来越强, 当时是觉得一定一定没问题。嗯,那段时间你们公办公室的状态是什么样的啊?就很嗨啊,就是当时我们是在北京的那个 e park, 是 一个共享办公室,而且很小。我记得刚开始的时候,对,我们那个工位只有六个啊,就是北京这边,然后对,我去过那个地方。对对对,但是那个地我觉得特别棒的,就是他们的一楼环境特别好,就是我们拍最早视频那个地。 啊,对,然后当时那个状态是什么?就是我们都特别对不起周围的邻居,他们就经常就听见有一个奇怪的办公室突然风,卧槽,哈哈哈,全都是我跟涛哥跟别的同事在嚎叫,哈哈哈,我去的时候那天没人, 好有可能,哈哈哈。嗯,整整个公区都没有人。嗯,对对对,所以那块就是完全不焦虑,那段时间 发布后就开始焦虑。嗯,说说你们发布的时候的考虑吧。你,你知道外部对你们最大的几个质疑之一就是为什么要弄邀请码,嗯, 以及是不是过度营销。嗯,好,这两个问题我终于可以回答了,就是我们其实很早就想去公开回应这个事,但我们觉得你瞎回应也没意义,我们当时内部就说你没做到一亿美金,而钱就不用答应这个事 啊。现在当然我们可以回答这个问题了,到了是吧?早到了。对,所以呢,我们想说啥时候到的?其实几个,呃,一个月以前应该是。嗯,对,然后现在的话我们就可以正式的回应这个这个事。首先我觉得邀请码这个东西 是我们为所有人趟了一条很重要的河,当然我不是说创造了邀请码这个概念,是这样,就当时我们以前不是做 chatbot 吗? chatbot 当时讲到了它的消耗量,可能是偷,就是 a 阵这个形态消耗量的这个几十几百分之一。 然后当时 nano 我 们做完之后,我们为什么要用邀请码这个机制且没上线前我们就决定了用这个东西,是因为我们在最后决定发布之前,我们跟所有的云厂商和我们这个 info provider 就是 推理供应商聊了之后, 我们惊讶的发现了一个事实,就是世界上能够在第二天立即到位的算力比想象中少太多了。所以就是当时的情况是所有我们使用的这云和模型厂商没法提供这个量。 所以当时比如我们用 cloud, cloud 说你们千万别放开,你如果放开我们会挂,所以对我们来说我们唯一选择方法就是去控量, 那控量的方法是什么?那你就只能选一个类似于邀请码这种机制嘛。所以当然确实我觉得有别的更好的做法,就比如说不应该有明确的一个码这样的一个东西, 比如我们可以定向邀请这这些东西。对,但是我们当时企业没有想太多,嗯,我们就去把这个东西给做了。但实际上我们后来就在跟所有的合作伙伴一起不断迭代这过程中,其实后来大家也意识到了,哦, agent 原来它这个消耗的算力这个模式跟拆包是不一样的。就刚才讲的这个 prefilling 跟 decoding 从三比一变成比如一百比一, 所以逐渐逐渐就因为 manas 的 出现,大家去适应 agent workflow, workload 这样的一个工作赋值。然后再后来我觉得再用邀请码的人,我就觉得有点奇怪了,就是我们已经帮大家趟出了这样的一条路,云场上也已经准备好了,你还何必去这样做呢?你想如果当时我们能直接放开,那其实我觉得可能体验会比现在还要好, 因为如果有充足的算力,大家不会遇见那么多的。比如说当时我还记得三月份你用着可能就崩了,对吧?因为你真的没有那么多算力,然后我们的 skill level 也没有那么好,就会崩掉。如果我们把这事提前搞好,那我们何必用又要去买这个机制?所以你觉得当时是因为云场上没有准备好,云和模型都没有准备好, 就是那句话就是,呃,我那如果他们准备好了,你们的成本是能够含得住的吗?含得不住,但是因为我们对产品极有信心,我们当当时一天烧 几十万美金吧,我们觉得没关系,因为绝对就是这个产品一定能成,你们当时账上多少钱?当时也没太多吧? 是之前还有融资额,反正是钱是够花的,但是其实也也很紧张,但是我们觉得这东西一定能是根本不慌,就是绝对没问题,使劲烧, 所以所以很野的。对,但是当时那个情况给你描述一下,当时比如我们跟云厂商打电话,我们说我们现在需要加到多少多少 tpm 的 上限钱,是吧?上限钱,上限当天, ok, 我 们说我们能不能临时加这么多,然后他们说没问题,你们是要下个月还是下下个月要,我们说今天下午要, 然后,但这没办法,所以真的就那头一段时间,就是真的是他们的物理层面上去搬卡插在机柜上给我们用,搬卡插到机柜上给我们用,我们当时就是,为什么后来跟 google 的 关系这么铁,就真的,我觉得 gcp 在 过程中,当然包括后来 ash 跟 devs 都非常支持我们, 就真的就是对我们来说是雪中送炭级别的的支持,甚至就从别的比如别的项目的可用区来把临时调资源给我们,然后这才让 madison 撑过了第一个月。 二五年初,大家都没有预预料到今年的偷控消耗量会指数级的增长。对,因为他的输入输出比例变了,失,失调了,这就为什么就是我说叉豹子,他的消耗量其实你是可以预测的,因为人参与的频率太高了, 就是因为你得人触发才会有下一次的行动。嗯,而 agent 首先他会持续自我工作,而且如果你按 react 这个模式去看的话,嗯,他的 context 其实一个 app only 就是 止增的状态。如果你你你,你从模型视角看,是每一轮迭代的时候,你需要重新 prefill 前面所有的输入, 当然你会有 k v cash 在 这,但是它的输入的投空量是非常大的,其实每一轮会越来越大,越来越大,所以当时就是没有这样一款真正的 agent 出来之前云场上没有准备好。 嗯,这是第一点,但是你说的是你们上线当天给他们打电话,那这个邀请码角色是在这之前就发生了呀?对,你们这个角色是怎么下的呢?就是我们需要一个控量的方法, 但是因为我们也没有更好的办法,就只能选择就是用邀请码或者定向邀请。但我们觉得现在可能定向邀请会是一个更好的一个一个做法。为什么呢?因为邀请码东西我们没有意识到这个东西,我们知道产品一定会火,但没想到会被炒, 这我觉得非常不好一点,提前邀请你不能吵,对吧?但是如果没有吵的话,可能烘托不出来这种氛围,但问题是我们在国内火没有意义。嗯,就是包括那个 nana 跟 monica, 就 我们上一款产品,其实我们都一直做出海的。 我这个其实也是当时我们觉得非常的冤的一件事,就是你想中国有这么多的企业在响应号召进行出海,无论是 ai 或者比如说基因,像这种做衣服,对吧?你其实你选择不同的 market, 我 觉得很正常的一件事,我们其实在中国比如突然火起来,其实对我们没有一个直接的一个作用,反而会让我们就承受很大的压力。 所以也是为什么 madison 当时上线是选择的晚上十点多,因为那是北美市场的早晨啊。对,所以就是我们是为了北美市场选择市场。对,是的,是的。 嗯,这个是邀请码,对,这是邀请码。炒作呢?炒作。好,这个问题要非常郑重的回答一下,就是我可以直接这么说,如果我们在三月份发布的时候,如果没有任何付费的宣传,我死全家。 对,这个事我可以说到这个程度,就是你想我们为什么要宣传?有必要吗?对吧?因为我们要做的是什么?我们要做的是海外的投资者市场,对吧?那我们该做的是什么?应该是去让那些真正我们要用的用户去用起来, 嗯,对吧?而如果我们在国内,比如说有人觉得我们买这些自媒体其实对我们来说没有任何的好处,那有人就问那这些文章到底是哪来的? 我觉得有两点回答很重要,第一点就是我们自己都觉得很酷的东西,我相信大家一定会觉得很酷,对他们来说这是一个内容,他们值得去写。第二点是什么?就是我觉得可以涛用涛哥的一句话说,这是我们多年广结善缘的结果。 我们都是不是第一次创业了,我们这么多年一直比说比较积极无私去分享很多东西,我们也会上,比如一些播课,或者经常写些文章去跟大家分享我们的见解。其实渐渐渐渐的以前可能跟我们一起成长的很多小伙伴,他也许成为了很厉害的投资人,他也许成为了一个自媒体人,那这时候他看见你的朋友在做一款产品的时候, 你是不是很很自然,就哪怕出于朋友的支持应该去写一下。所以我觉得大家把这个就是创业和媒体之间这些关系,他想的有点太复杂了。我可能也许我是叫什么这个一个偏见,我觉得好像这个整个这个市场好像挺单纯的,就是你做出一个好的东西,且刚好是你的朋友,大家就会愿意帮你一下。 这是一个广结善缘的一个结果。但是我觉得麦纳斯火了一天,嗯,他的热度好像迅速就降低了,你觉得为什么?因为我们在国内没有任何持续的这个就我们其实在国内是处于一个我们可以叫灭火的这样的一个一个状态。嗯,因为我觉得如果你把我们这个东西有过度的,比如说 进行一些曲解,或者怎么对我们来说没有好处,对吧?我们只是一款 ai 产产品出海的一个应用,不要给我们赋予太多的这些东西。所以你看我们当时在国内,我们所有团队没有任何的这个类似于对外这种发生,其实都是别人在以一个第三方的角度来表述我们, 所以我们觉得在国内的热度学降下来是好的。那在海外呢?在海外的话,我觉得这个就是我们想要看到的。就当时说有人在说我们在海外做营销,我拜托 androidcapac 你 能买吗?因为这些东西你不可能买到的,对吧?就是我们首先让我们的用户群就是最 pro 的 这些人看到这个产品的价值,他们先用起来, 然后他们去自上而下的去影响更多人去使用。 minus, 嗯,这是我们希望看到,所以这个流程肯定没有国内那种突然火的那么快,但其实也没有多长的时差,基本就是当时国内好像三月五号当天晚上莫名其妙就火了, 但其实美国基本就在三天之后就开始自下而上就火起来了。而且我们去看了,这两边炼炉基本完全不重叠。炼炉不重叠?对,是的,就是海外火起来完全就是靠,比如像 andrew kempsey, patrick collins, 还有 gary tan 这这些人他们先用起来了, 然后他们的影响力再去自上而下的去影响。嗯,而国内可能确实是,比如自媒体,还有一些朋友,他们就写了很多的内容,你们当时准备的邀请码有多少个? 邀请码其实在动态的加的,嗯,就说我们跟云上上播打电话,他说现在比如能加到,比如说二十 m t p s, 我 们算一下,那好,那大概能加出这么多码,然后更多,其实后来的码就已经变成,就是给朋友以外变成什么,就是那种找过了我们又不好意思拒绝, 所以就变成了一个谁跟我们比较熟,我们就给些。对,所以因为在国内我们知道其实我们也不指望他在国内能比如很大规模的靠邀请码传播或者怎么样,其实只是一种出于礼节性的给一下就给了。嗯,这个会让网络上很多用户的感受不好,因为你们说你们有邀请码,嗯,这好像也是一种承诺,但是后来这件事情就不了了之了 啊,我觉得邀请码不了了之,不是不了了之,是后来我们进进了,用了极快的速,大概不到一个月我们就把邀请码去掉了,就可以随便用了。所以我觉得这不是不了了之,我这是最负责任的一个做法,就是我们在云厂商和博兴厂商的支持下,终于不用邀请码了,并且我觉得很贵 啊。贵,我觉得不是我们的问题,因为真的就是当时可以说一个实话, miniso 是 亏本,嗯,因为当时的头款还非常非常的贵, 我们其实已经是在补贴用户,让他们来体验 a 阵这个形态的产品。你们当时的定价逻辑是什么呀?拍的,拍的。对,就是这个,是我们觉得我们非常有问题的,第一是商业化能力其实还是比较有限的,第二我们的 pr 或者说这个这个挖掘能力其实也很差, 就是我们当时定价的逻辑特别简单。就是哦,拆 gdp 好 像是二十美金一个月,而且我们死活想不通的为什么是二十美金一个月。后来当然也跟别人聊下,他们觉得拆 gdp 好, 当时也是拍脑袋拍的。嗯,但是没办法,人家就有一个毛在这嘛。所以当时我们想,那我们就是从二十跟四十开始呗, 然后就延续至今,因为这东西会有一个很大的惯性,就是你最好不要太随意的去调整你的那个价格,价格,对,让用户可能会就已有用户,你最真实的用户可能体感不好。对,所以这块我们就没有太大的一个变化。定价没有什么逻辑,是定价没有什么逻辑, 为什么不选择比比它便宜呢?因为是这样,就是其实这个定价没它的所谓,因为 manas, 其实你无论你,你是给多少钱,你获得的是一个数量,它是本质,其实是一个按量付费的一个东西, 所以只是就保证一个,就是基础订阅的一个价格在那就是,那现在你们已经跑正了啊,马上跑正,马上跑正,因为其实是你要区分不同的 tier 吗?对,因为我们还是有很多的免费用户, 我们认为免费用户也是,你可以说这是一种我们的社会责任或者怎么样,就是我们希望有更多的人能够体验 a 阵这个形态。在麦纳斯整个就是做出来到火的这个过程中,小红的决策是什么呢?我觉得几乎所有的决策的最终决策人都是他。嗯,比如说,嗯, 太多了吧,这你让我如何去美举啊?你这火的过程中还是说,嗯,就是从做到火,从做到火,那几乎所有产品的决策最终都是他了。 有什么是你们之间有一些争论的,然后最后谁听了谁的?哦,这其实我觉得我们之间的争论都是非常务实的一种讨论,就比如说这个一些关于,比如到底要不要做一个单独 chmod 呀这些东西,然后最后的结论其实都是我们赶紧做一个试试。 所以其实到现在为止不同用户用的 nice 可能完全不一样,因为我们可能海量的 a b test 在 跑着。嗯,当然就是最终的话,我们觉得最好的角色就是限制一下时间, 就是别为这个事,别一天一天反驳,一直犹豫一直犹豫。对,赶紧做做就好啊,现在在市场上去找反馈。对,是的, 你觉得你们今天的生态位是稳固的吗?我觉得不是稳固的,就是或者说对于大部分创业公司,包括我们在内,其实我们都没有活着的权利, 你们都没有活着的权利,活着的权利是自己持续跑才能争取来的。嗯,火了之后生活发生变化没有?有啊,就非常忙,尤其是就是那几天。那几天什么状态?呃,那几天其实就是颠倒黑白,因为我们其实非常理智,就是国内其实骂我们也好,或者这个就是称赞我们,我们都 怎么说,就是没有办法,我们也不想回应什么东西,但真正就是我们的客户在哪里,我们要关注什么,所以那段时间真正的痛苦来自于颠倒黑白。 对,因为我们要支撑,比如说这个各个时区,现在 max 用户其实遍布世界各地嘛,就真的是每一个大大周上都有很多我们的用户,所以那段时间我们团队也没有现在这么大家,可能真的就是在不断的救火, 就因为今天可能这个系统挂了,明天那个系统挂了,所以天天就是在救火,所以非常疲惫。能睡几个小时啊?那段时间,那天我记得从第一周到 第二周基本每天就是零散的,可能加起来睡个三四个小时,都是那种间断性的睡。间断性每天还是每周?每天?每天每每周,这就死了,哈哈哈。办公室状态也更嗨了是吗?还在内个内个小办公室还在内个小办公室。然后当时是这样,就是我们武汉有很大的一个团队嘛,然后大家就就 这也是我们经常反思的一点,就是我们好像跨区域写作能力蛮差的,所以当时大家想,那算了,大家赶紧出差吧,就我们赶紧在那个我们楼上租了一个更大的一个办公室,然后武汉同事赶紧能飞过来就飞过来,大家不要在什么线上工作,赶紧线下一起来来讨论方案吧。 然后那时候其实办公室氛围没有更嗨,真的就是非常非常疲惫,甚至当时我们那个书架上摆的更多东西就是什么补剂,营养品补剂,不是啊?对,反正就是那段时间真的就是大家精神状态都很差, 我听说你们那段那段时间融资给投资人开会,哦,对,那段时间很好玩,就是跟投资人的配处,我们都是站着开。对对对对,就是其实是这样,就是 当时我们还挺感谢投资人的,你知道吗?就是因为确实每天白天的时候,我们看到的网上大多是一些骂我们的东西,嗯,而真的就跟投资人好好讲的时候,得到正反馈,是我们一天中最最温暖的一个时候,你知道吗?懂的还是懂的?哈哈哈,对,你怎么看待?你为什么被骂? 哦?我觉得有几点。首先一点是我最近意识到的一个事,这是我觉得是最惨的一点,就是很多国内用户骂我们的根本原因是你用的根本不是 menus。 然后借这个机会我一定要非常非常郑重的强调一下,你在国企 app store 上搜到的所有 menus 都是假的,那都不是 menus, 那 都是来蹭我们的人。 所以就是我们有一部分被骂的原因是你用的那个东西就是一个山寨品。嗯,然后另外一点其实我也能理解,就是因为一个产品如果是突然火的话,大家天然会觉得你是一个,比如什么很营销或者怎么样的一个东西。那这我刚才我也回应了,如果我们当时有这种行为的话,我先死全家。 对,这是一个很关键的一个点,但是我其实站在用户角度我也能理解,因为你好,听说了有一个很新奇的一个东西,但是现在对我们来说就是 我们的团队能力是有限的,我们很难去说,比如说服务于所有的用户,比如说我们甚至说为了让大家能在一起,因为我们的沟通能力很差,那就大家都在一起。因为团队贷款有限,那我们先盯着有限的市场去做,所以这个东西我觉得不是一个, 就是虽然可能让一些用户没能用到,但这就是我们能力所限,只能先这样,中国市场未来会好好做吗?我觉得这个比较难,就是对于我们来说,我们也没有那么多的资金去进行一些怎么说?就补贴性这东西,嗯,就是我们之所以一开始选择出海,其实原因也非常非常简单,就是因为 大家可能海外的用户对于生产力工具的付费意愿就是更强。嗯,而 a 证就真的是非常贵的一个东西。像我们刚才讲到 a 证可能有点像工业生产,而不是传统互联网这个编辑为零的东西,所以那我们就会非常非常慎重的去做这件事,我们要先保证自己能活下去,再去讨讨论这件事。目前我们在活着的边缘。 那中国这部分的功能由谁提供?你觉得我觉得这个功能其实还是比较充裕的吧?就是在 max 出来之后,在接下来几个月中,我看见有大量类似于 max 产品出现, 而且很多也是我们国内团队去做的,所以我觉得这个挺好的。但是真正的我觉得难点就是他们会跟我们遇见一样的,就是你到底要补贴到什么时候?嗯,对,你如何去把你的这个产品的商业化跑通,嗯,这决定能走多远啊?见了什么有趣的人?呃,我其实见人非常少, 就是因为我们现在分工是这样,就是可能涛哥就张涛跟小红会去见更多的外部的合作,但是像我跟潘潘,我们还是要保证这个产品的持续迭代。嗯,所以刻意我应该去少见一些人。为什么海外很多 巨头都愿意见你们?对,我觉得几方面吧?一方面是这样,就是很多时候他们是同时具有云和模型业务的。嗯,比如说像 google, 比如像 microsoft, 就 那自然就是一个非常好的一个合作,相对于我们是他们非常大的客户,但与此同时他们其实也在探索新的这些 机会在哪。比如说我们前阵跟微软一块发布了新的那个 agent 三六五这个东西,那这样的话就是你能把所有的电脑从一个 pc 变成 aipc, 那 我们可能是这样生态版图中的一部分。然后更多的一些就是因为我们作为一个 agent 整个行业的一个代表,其实我们能给他们的一些一些东西,其实影响 未来它能服务更多人的一个范式的。像刚才讲到,比如说我们跟 deepmind 这些合作,跟微软这些合作,其实我们也在主动把很多我们在构建 nas 过程中学到的东西,以标准化的 api 的 形式提供给更多的开发者。比如前一阵那个 google cloud 的 开发者大会上,那个 google cloud ceo thomas, 他 直接就当着全场所有用户就所有开发者面说, 之前有一些只给 minis 用的 feature, 现在你们都可以用了,所以我觉得这还是让我们挺有成就感的,就是我们不仅做了一款很好的产品,且我们的技术也在帮助更多人更好的构建 agent minis。 一 点五,呃,中间有什么?农号吗? 哦,我觉得这有一个最大的诺号,就是通过一个新的版本号是最好的让用户理解有更新的一个方式。哈哈,对,这个很好玩,就是大家可能已经习惯了像机座模型,以版本来断代,嗯,就比如说 gpt 三、 gpt 四,对吧?但实际上我们做 a 种或者做系统的时候,你很多时候还是在一个 feature 来不断去强调说这一个更新,这一个更新,但用户的实感可能没有那么强。嗯,所以 max 一 点五它其实不是一个突变,它很好玩,它只是把我们过去一系列的东西 一一点五形式打包了。其实很多新的飞车都是在过去几月中迭代去上线的。嗯,但这个过程用户就能直接体现到体感。哎,好像非常不一样。但说实话,其实一点五发布那一刻的更新没有那么大, 就这是我们很好玩的一个发现。就是,哈哈哈,对,你得让用户意识到你有变化,用户才能才能真的去感受到变化。对,这是第一点,然后第二点就是 manz 一 点五非常大的一个技术的眼界,就是我们把任务完成的速度进一步提升了。嗯, 而且这个是一个无损的提升。就是说说简单点,就是 max 一 点五能够用更快的速度完成简单的任务,但在更复杂的任务上去投入更多的 inforce time 的 一个 compute, 这方面也是比较大的一个差别,但是放到这个平均体感上来说,应该快了三到五倍。 你那天还发朋友圈说今天 max 有 两件大事,一个是一点五发布,另一个恐怕要老了写回忆录再说了。是什么事啊?老了写回忆录再说,哈哈哈。 通用 a 证和叉 pad 未来会是什么关系啊?因为所有的叉 pad 也会变成 a 证的呀。啊,是这样的,但是实际上这个不是能力所决定的, 叉 pad 跟 a 证我们觉得是用户群决定的。嗯,就比如说对于所有人来说,他可能都有 chat 这个需求,但并不一定所有人都需要高价值脑力劳动的任务,但是我会自然的想通过它去做点啥呀。嗯,它就变成了一个可能在 ai 时代最大的入口。 这是 open ip 的 故事吧?对,这是 open ip 的 故事。嗯,但我觉得就是这仍然是一个传播链路的问题。就首先你在打的这个用户群,你所瞄的那个点跟 open ip 就 不一样。同时我们要保证就说对于这个用户群,我们能永远提供最好的体验,他们的需求跟叉爆用户是不一样。叉爆。可能很多人其实心里知道叉爆叉 gpt 也许此刻不是最好的叉爆, 比如实际上大家知道 gmail 三可能在某些场底下比叉 g b 还要好,但是对我来说无所谓,因为我只是拿它完成一些就 quick and easy 的 task。 但是对于 manis 要打这群人,他们的质量的敏感程度极高的。我们做过一些双盲测试,就比如说我们抽百分之五的用户, 我们悄悄会用另外一个模型,然后你就发现那会用户的用户的满意度直接就下降了。所以我们其实在服务最挑剔的一群人, 而他们永远要的就是此刻这一个时间点上 ai 能提供的最高的水平。嗯, madison 火了以后飘过没有啊?什么叫飘?飘过没有?飘就是飘人飘了啊。不会,因为我们其实每天受到的负面反馈会比正面反馈更多, 那会很悲伤吗?也不会,因为我们都是老灯啊,中灯,中灯。就其实就怎么说就有点心里憋着一口气,就说为什么现在我们可以站出来说这事,就还有就是我们之前觉得说什么也没用,你还得打铁,需要自身硬。你觉曼纳斯未来会有多大?嗯,他能服务多少用户? 我觉得不想用服务多少用户来说。嗯,而是我们还想说就是到底对于每个用户能为他产生多少的 aethetic hours。 嗯,也就是说对于一个高价值用户,他可能能把 manage 用的用量是一个普通用户的一千倍。事实实际每天都在发生,我们经常有一个用户,一个能付我们几千美金, 为什么?因为他有不断有很多的这高价值任务要跑。所以我觉得 max 追求的不是 dau, 这是我们很早就想清楚的一件事。嗯,而是把最有高要求的用户、高价值用户的高价值 task 做到最好。体现在的可能更多的是我们的营收,而不是 dau 上。 这个是小红的想法吗?这个我觉得就是大家依赖后的一个想法。所以你们的公司指标是营收,不是 dau, 不是 dau。 这个有趣。嗯,对,你觉得这个创业逻辑跟互联网时代是不是不一样?我觉得完全不一样,原因是因为 公司有偷坑消耗。呃,不是,就是两点嘛,就是可能刚才我们都多少 cover 到了。有,第一点就是 ai 其实不是一个平台变化。嗯, ai 是 一个技术增量。嗯,所以就是其实它怎么说?就是以前的优势是能够惯性发挥的,所以其实很多场底下是传统的强者,加上 ai 强者恒强,强者更强了。呃,虽然这词听起来比较悲观,但是应该说强者具有先发优势且较好的利用了这一点。嗯,对,这是第一点。然后第二点是什么?就刚才讲的这个编辑成本问题,就是目前为止 ai 还是更像制造业,而不是像互联网 啊。这个还挺理智的。是,是不理智早死了,哈哈哈。所以你们没有试图去讲一个我要做 就是全球第一的通用 a 阵子,或者是全球最重要的入口的这样的一个故事啊。这是两个命题,我们一定要做全球最好的通用 a 阵子,这是一定要做的最好的通用 a 阵子。最高质量就是在当今一刻,如果你抛弃一切成本或者什么东西,我们永远提供最高的质量, 这是第一点。那如果有一个人来用低价打你们呢?因为你们要,那我们用更低的价格打死他,那他们可以不要赢,大厂就可以不要赢手啊,大厂就不要赢手。哦,你说来卷是吧?对啊对,但这个东西其实是这样,我觉得对于一些用户来说,他们其实价格不是那么敏感, 就包括现在 max 用户,其实我们也觉得 max 确实挺贵的一个产品。嗯,但是我们用户问我的问题,你知道是什么?是说 max, 现在你收我四十美金一个月,你能不能让我看看?如果我愿意付两百美金,它效果能变好多少?嗯,所以我觉得这个 max 是 完全不一样的,所以就是这种定价的优化基本不在我们的路线图里。嗯, 你们没有想要做最重要的那个 ai 入口之一吧?这是,这是一个目标吗?我觉得首先一点就是可能不存在单一的 ai 入口吧, 就好比,比如说现在移动互联网的入口是什么?哦,好像确实存在一些。嗯,但我觉得就是对于我们所服务这个客群,就以我们自己为例,我们自己一定是 madison 用户,我们自己手机上也有叉 gpt, 这是一个当你足够的 consumer 市场的时候,这些人会自己知道什么时候用什么产品。嗯,之前那个 a66 有 一个很好玩的一个调查,就说如果你的手机上装有某些某一个软件的概率的最大异常值是什么? 这个书写可能有点绕,就说对于一般人来说,可能你安装某个软件的概率是怎样的,但是如果一个用户他手机上先装了一个软件,那突然哪个软件的概率安装概率突然提升?你发现装了叉 g、 v t、 cloud、 deepsea 所有这些用户,他们的最大异常值全是 menace, 所以 madison 几乎是在跟所有这些叉炮并存的一个状态。当然这其实是好的解读,坏的解读,就是我们觉得目前 madison 其实还远远没有渗透到所有我们想服务的用户。嗯,因为目前还是就是最业内或者相对来说比较这个科技权的人充分了解了 madison。 但这就是我们觉得我们在 marketing 方面还有很长的路要走,这方面我们的学习。 ai 产品有垄断效应吗?我觉得有,有,对,但是就是怎么说呢?就是 ai 产品的垄断是你能垄断一个 类型,嗯,但是这个类型吧,可能也在不断的产生,像比如叉 g p。 我 觉得啊,叉 g p 也许还真算不上垄断,因为 jimmy 最近势头也很好。嗯,但你能垄断一种心智或者一个类型的心智, 它能建立一个品牌,它能建立一个品牌,它能像比如说 google 这种搜索引擎这种,它可能一个人统治百分之九十市场,或者百度在国内叉爆,会成为这样的市场格局吗?我不敢说,但是因为就我对搜索引擎市场, 可能我的认知也还在,我还在做搜索那个阶段吧。就我觉得搜索引擎市场非常特殊的,因为搜索引擎其实一半是在内容里头, 就说你的这个数据供给是无法因为技术的迭代而而去被颠覆的,所以搜索引擎是一个非常容易强者横强的一个领域。嗯,对,因为你已经跟太多人产生了利益的关联。嗯,包括你的广告商,你的内容商, 但是拆报到目前为止可能还是因为到现在拆 gpt 也才哦,刚好,哎,三年。对,我觉得还是一个比较早的一个状态,比如如果你现在只是两千零二的谷歌的话,现在一切还不好说。是,而且好像还没有产生网络效应啊。对, ai 产品的网络效应,我觉得是。嗯, 好问题,我觉得没有看到任何一个真正网络效应的产品,这是为什么?嗯,因为所谓的网络效应,我觉得更多是你能有两种吧,一种叫 build on someone else's work, 就是 说你能基于其他人的产出进一步的去 贡献,嗯,这是一类。然后另外一类可能就是完全是由于用户关系所带来的网络效应。但这些东西其实在这两个场景里, ai 似乎都是附加值, 对不对? ai 是 附加值,对,附加值,不知道加了它为什么就能进一步的连接人类。没错,或者说 ai 不是 产生这两个要素的关键点。嗯,对, ai 是 能够帮你提效,能够帮你完成任务,能够给你产生结果,产生交付,那可能新的网络不是人和人的,是 ai 和 ai 的, 或者人和 ai 的。 哦,要这么说的话,我觉得是有的,就包括我刚才一直在强调一个词叫,比如说基础能力或者原子能力的网络效应。 就刚才我们像我们讲过,就是 melissa 其实增加能力是非常谨慎的嘛。嗯,但是我每次都要保证就是这个能力能跟别的能力形成组合权。嘿,用了组合权这个词,嘿就是什么意思呢?就比如说最早我们给 melissa 加入了一个看图的这个能力,嗯,看图能力其实一开始想法很简单,就只不过是说希望 melissa 能看一看它生成的图好不好。 好了,你发现加了看图或者多门太输入能力之后, madison 开始自己学会去检查自己做的网页是否能能玩的通。所以就是你增加一个基础能力,同时能跟你所有通用 a 证这个水平别的能力之间产生交互。嗯,这不叫做可能能力基原子能力的网络效应,这是我们已经观察到了。嗯,就是你可以让你的 a 证能力以个指数形式提升, 这是第一点。然后第二点就是如果你说 agent 跟 agent 之间的网络效应的话,那看怎么解读。像比如说我觉得 mannest wide research, 就 我们这个广域搜索能力,其实也是一种,也许是 agent 之间网络效应吧,就是一个 agent 可以 调度很多别的 agent, 它们也之间还能互相通信。嗯,去共同完成一个单独的一个 agent 无法完成的任务。 然后另外当然也有些人在尝试,就是说让 agent, 比如说加入到人的写作的上下文中,这我们也在做一些测试,比如说 manage 现在能跟 slack 打通,嗯,它能带来一个比较好的一个点,就是很多时候我们的讨论是不带着 ai 的, 嗯,但实际上更多的讨论都是在人与人之间去无形中产生的, 这块可能就是 agent 跟很多人之间的网络效应。嗯,但目前来看,这可能还是因为偏专业吧,没有大家想象中那种就爆发式的网络效应。 然后如果你说就是像,比如说 agent 之间社交的这个形态的话,那我觉得这可能不像是我们这种就做 consumer 市场的人所能看到,那可能更多是偏娱乐这个领域,就像我刚才讲的就是让 agent 代替人去社交,这可能也是一种网络效应 吧。如果一个公司要做某一种 agent, 他 可能希望被 max 调用,嗯,你对他有什么建议?哦?我觉得这个东西其实你不需要为 max 做任何的优化,这是我们非常坚持一点,就是其实是这样。你看现在,呃,我们觉得做 agent 最大的 难点是什么?我们可以反向来思考这个问题,嗯,是因为就像自动驾驶一样,自动驾驶是物理世界所有的基础设施是为人而设计的,而现在赛博世界 所有的这些基础设施,包括网站、网页,或者就各种 app 啊 api 都是为人而设计的。所以 minnes, 我 们想法是我们不能指望一夜间世界就为 agent 做好了准备,嗯,而实际上我们应该去不断地让两侧相向而行, 比如说最简单一点就是现在大家有 m c p 这个概念,嗯,但实际上 m c p 面临诸多的问题,比如说生态不成熟,很多就是开发者提供 m c p 服务本身质量就参差不齐。嗯,且大部分的服务其实是没有 m c p 的, 所以 manas 的 选择是说如果有 m c p 当然很好,我可以用 m c p, 但是别忘了 manas 是 一个通用 agent。 manas, 如果一个程序员能通过 api 的 形式去调用一个服务的话, manas 可以 去自己学习这个 api 文档,然后自己通过 api 来使用。如果再不记你这个, 你服务连 a p i 都没有,那你总是给人用的吧?那你大概率有个网页,那 menus 会再一次降级,通过浏览器去模拟人的方式去使用这个东西。嗯,所以我觉得对于第三方的 agent 来说,你不用为 menus 或者说未来的通用 agent 做任何的适配,应该是我们去适配你。 agent 的 网络可能会形成成什么样 agent 的 网络?我觉得这个词很大,就是我知道 oppo 有 一个它的 l one 的 l five 的 那个图,嗯,但我觉得 这可能只是 opai 的 观点吧,可能不算是一个非常共识的一个事,我们可能还是从更务实的一个角度去出发。嗯,我觉得就是如果你考虑 agent 有 更多的 proactive, 就是 它的主动性的话,嗯,那 agent 的 网络可能会 形成就是相对于有一部分垂直 agent, 它其实掌握一部分数据性的差异,嗯,比如说有些数据只能在某一个垂直 agent 那 儿获取,那可能我觉得它的网络 与其说是一个就是全联通的网络,更像一个新型的,就是说新型的,新型就 star star 啊。对,就是说他有一个调度者,有点像你刚才说入口那概念,他在利用不同的 a 阵。嗯,对,但是呢,他可能难以形成一种完全互通的这种全联通的网络, 所以通用 agent 呢?会成为那个入口。我想试了,为什么会是这种结果?你觉得因为就还是刚才那点,那点就是如果你做着垂直 agent, 你 在做一个工具,如果你在做一个通用 agent, 你 在模拟一个人,所以做垂直 agent 呢?应该是为像 madison 这样的公司做。为 agent 做还是为人做啊?我刚讲这就是两条路嘛。嗯,就是如果你想做一个 给专业人士,就刚讲的就是你就做的非常垂,非常专,这是给人用的。嗯,但如果你想做一个为 非剪辑师,但有剪辑需求的人做的产品,那你可以考虑做一个非常简单应用的界面,同时也暴露出足够多的 api, 然后我们一起把这个生态给这个给做好,对不起, api 或 mcp。 呵呵, 你说你坚信纯血派 agent? 什么叫纯血派 agent 呀?对,就是 agent 这个词的定义。其实这是一个很含糊的一个事,我觉得大部分时候大家会把两个概念混在一起谈一个叫做 agent。 这个词的定义其实比较清晰, 就说很多人说 agent 要追求一个稳定性的话,那你可能更多的是在以一个 work flow 的 方式去做 agent, 但在我们眼中这个不叫 agent, 这个就是 work flow。 而我们认为什么叫纯血的 agent, 就是 说它其实没有人为加的约束, 而是说完成一个任务的所有的过程和方式是由智能本身决定的,这样我觉得它的天花板会非常非常的高, 但是我觉得这是一个可以解决的问题, 所以我们非常坚信,就是要做纯写的由智能主导的 agent, 而不是以规则主导的 agent 的 agent group, 这才是更符合我们刚才讲的 the better lesson 的 这一个一个事,用通用的方法,投入更大的算力去解决问题,而不是加入更多的人为的知识, 这在你的实际工作中有做过这样的类似的选择吗?有的有的有的,这是我们每天都要讨论的一个事,就是可能比如你舍弃过什么啊?其实舍弃东西非常多,我举一个比较简单的例子,就说 你要让一个 agent 做数据可识化工作,对吧?那么比较简单的,比如产品驱动的,纯产品驱动的做法应该说好,那我要保证所有语言下的数据可识化的效果非常非常好, 你不能因为有不同的这个语言而产生,比如说有这个字体乱码这些问题,那只有他可能把这块写成一个叫你叫做 agent sub, agent as tool, 或者说你写很多的单独的 prompt, 就 说当你要这个,比如说数据可识化的时候,你应该注意什么?什么什么东西,写一大堆的这个 guard 表, 你每增加一条约束,其实你都在减小模型的 diversity, 减少模型的一个一个多样化。那这时候我们做法是什么呢?其实就刚才讲的,我们只不过是加入了一条查看图片的这个能力, 而这样的话,我们期望的是什么?是智能,能够通过自己查看这张图自己发现说,哦,我原来有字体,这个字体选择的错误导致中文渲染失败而去修改这张图,这样我其实解决的不是一个问题, 比如说他还能检查到,哦,不行,我这个画的这个图标,它其实有两个元素重叠了,那其实能够去修复它,所以这样的话,你应该能变成一个从就是我就打鸭子这种,就是在这堵塞的漏洞变成一种你在让智能的泛化性在帮你解决更多你还未发现的一个问题。 我觉得这是纯血派 a 阵的一个思维方式,当然你做这种直接去修补这个事永远很有吸引力的,而且这更符合传统软件工程和产品经理的直觉。那这时候就是我要站出来的,他的职责就要拦住所有人,哈哈,不要这么干。 你还说市场上关于 a 阵的做法都是错的呀?展开讲讲啊。没没没有,都是错的。像刚才我讲了一点,就是很多人啊,过于执着于让 a 阵的模仿,就是人类的分工这件事。嗯,我是非常 不认同这一点。嗯,对,我就说就是不要把人因为生而为人的限制搬给 agent, 你 应该站在模型的角度去思考问题,或者说我们在做产品的时候经常说一句话,就是如果你真的是在做一 agent, 你 同时在做两个产品,嗯,一个是给人用的,一个是给 agent 用的, 而这两个东西的思维模式是不一样的。嗯,但你就需要一个很好的一个技术架构,把两者融合在一起,给 a 神用会是什么样的啊?对不起,给模型用的。给模型用的会是什么样的啊?就这么说吧,就是模型其实它的思维模式跟人是不一样的,嗯,或者说它根本就不是人。嗯,而人的话,你是因为你有一些先天的训练, 所以说我是一个设计师,我更懂什么?我是一个程序员,我更懂什么。但讲真,大家用的模型现在其实都是一个通用的 lm, 那这块其实这个假设就是错的,对吧?那其实你应该做的事情是减小他犯糊涂的概率,嗯,而这块的话,你的做法不应该是说我赋予你一个人格,你怎么怎么怎么样,嗯,而你也是通过一些 context interviewing 的 技巧, 比如说可约束解码、 action space 的 设计,这这些技术来让他更好的去完成他自己分内的事,但又不让他丧失全能性。这我说的可能有一点空泛,但是可以参考我之前发的各种文章,哈哈哈。所以把 a 阵的人格化是一种人的自恋。对,是的, 这也是在贝特拉森里面说的。啊。是吗?贝特拉森里有这句话。好的,那我给他再去读一下这个,那我太同意了。你们的组织有发生过变化吗?曼纳斯出来之后啊,有的,而且我觉得这个其实不仅不该说叫变化吧,就是我们也在探索一种新的可能性,因为其实在此之前也没有所谓真正的那种,就是 就纯粹的 a 证公司。然后我们觉得现在我们结构的话可能有几个比较特色的点可以分享一下。就是,呃,比如我们现在还是大部分都是研发,但是团队的话会比以前的这种软件开发会更奇怪一点。嗯,当然你传统的就比如说移动端,前端都在,然后后端商业化,这些都有。但是呢,我们会有两个很好玩的团队,一个团队叫做 sandbox team, 其实就是负责这个虚拟化跟这个运行环境的团队。嗯,他们要维护的是一套给 agent 使用的操作系统,这刚才讲的就是负责给 agent 做产品的一群人。 然后另外还有一个我们就叫做 agent team, agent team 由这个就是所谓的这个 agent 工程师,他可能负责的就是说整体架构的开发, 然后还有一部分是 evaluation, 就是 评估团队,还有就是一个很小的 research team, 这三部分人共同组成了 agent team, 这个大概有这个十几二十个人。我觉得这个就是 agent team 跟 sandbox team, 可能是传统意义上来说可能会 被融入比如广益的后端研发当中,但我们后来发现他其实比较不一样,因为他在做的这个事情不是面向人的,是面向模型的一个工作。嗯,他们的工作主要会包括哪些我们意想不到的呀?嗯,意想不到的,我觉得 对我来说当然都是意想得到的事情,但我觉得有几点吧,就是好像三 boss 团队在做的事情,更像是在教一个 不会用电脑的人,嗯,如何更好的用电脑。哦,对,而这个 agent team 在 做的事情其实是说如何设计一套 稳健但统一的架构,让我们能够持续的跟上模型的进步。这个其实是很有意思的一个话题,就是因为模型进步的速度真的非常快, 可能如果你考虑到不同厂家都在迭代,那基本是一个以周为更新的一个变化,那 agent team 它主要的工作既然是 agent 的 框架,那我们如何去保证能跟上呢?所以我们自己有一套比较好玩的方法论,我们叫做弱到强的衡量。嗯,这是什么意思呢?就是 你其实整个 agent 中你有两个外部变量啊,对不起,不叫外部变量,就有两个重要的变量影响你的质量,一个是模型,一个是 agent study。 那 这块做法是什么呢?因为模型的未来的变化, 我没有保证每一次模型迭代我们的框架能够受益最多。那我们做法就是说我们先把一个当前版本的 a 帧框架进行锁死,然后呢,选一个同源的模型家族, 比如说同样你都选择 jimmy, 或者选择 cloud, 你 拿它的弱版本跟它强版本进行对比,跑同样的 benchmark, 然后你不断调整你的 a 帧框架,来让它之间的变化最大。嗯,这样的话,我们能够期望就说当下一代模型变强的时候,我的获得的增幅是最大的。这块就是我们的 agent team 维一定要经常关注的一点。嗯,文化有变化吗? 文化的话我觉得有一些,就是可能从 monica 那 款产品呢?它是一个非常大而全的一个产品。嗯,当然就是 manage 很 全,但它的做法不是说在单点击破 之前,可能更多是觉得用户有需求我就要去做。我的做法是用一个最快的路径点点到点,最短的一条路去实现。而 manage 法其实我们会有非常非常多的考虑,就说你这样一条路你是能走通,但你有没有跟别的原子能力产生网络效应。 所以现在我们做每一个新功能前都会非常非常的慎重,而是要保证说每新增的一个单点的能力,又不是一个单点。这句话说的好绕,就是每增加的一些能力都能让系统整体获得一个收益,嗯,所以是一个非常的节制的一个状态,这跟以前心态很不同。 你们放弃过什么 feature 没有?呃,放弃的 feature 我 觉得非常多,比如说呃,像很多语音相关的事,我们其实都放弃了,为什么?呃?语音输入,当然我觉得很有用。嗯,但比如说这种语音的输出或者主动就是调用一些东西,我们觉得首先这类东西 不一定要由我们第一方来全部做完,因为我们跟大家不是竞争的关系。比如说我自己,我会直接让 manasa 连接我的 granola and notion, 我 去使用, 这没有问题。然后还有一些功能,就比如说像生图跟生视频,虽然我们有这功能,但我们也没有非常非常的大力的去优化它。嗯,因为我觉得这个东西是一定会做的很好的一个基建上面,上面的事情我们没有特别多差异性的事,我们没必要非常深入的去做。嗯,然后更多的这些事情其实我们都是以一种非常开放的心态去做,就是如果这个 通用 a 证靠自己的泛化能力就能解决的话,那我们没必要去专门去做这件事,因为我们很可能投入不够去给用户做了一个次选, 这个是不好的,因为别忘了我们的用户是最高价值、有最高要求的用户,他们值得最好。为什么你一直在强调你们跟所有人都不是竞争关系,因为我觉得这是事实,这就是我们做海外市场之后发现的很好玩的一点,就是 他们可能因为之前萨斯领域做的实在是太成熟了,所以就是不同服务之间的互联互通,既是一个技术层面的事,其实也是一个你可以想涉及到 brandon 的 一个概念。就比如说我们经常会跟,比如像 notion 跟 microsoft, 还有别的这些创业公司,我们一起做联合的一个发布。因为很多时候都是一个,当我有一个能力,你有一个能力的时候,当这条边连通的时候,它产生的价值非常非常大的。而且 nanos 作为一个通用 a 阵,我们一次甚至能串接多个服务。 像我们刚才讲到的我自己的使用场景是 notion、 granola 和 aspi 三个服务之间, nanos 把它们都串在了一起。所以我觉得与其跟每一个竞争,你去做一个比不过别人的东西,你为什么不让大家一起去做呢? 这个我觉得就是我们获得的很大的一个从 monica 学到的经验,就是如果你要做很多单独的 feature, 做起来一时爽, 但是你要维护它并保证这功能是长期有竞争力的,是很累很累的,那可能会导致你的团队无限膨胀,所以这是一个不好的一个事情,应该去充分利用这种别人做的好的东西,并产生一个 synergy, 而不是去跟别人直接去硬碰硬。你过去这大半年做的最重要几个技术决策是什么?你作为首席科学家,嗯,我觉得有几个,第一个就是 我们没有盲目的去追 reason 这条路,嗯,对,就是刚才讲到的,就是其实你按现在比较朴素意义上的 reason model, 你 会导致 instruction following 跟这个 call of destination 的 增加,嗯,对,所以这个是我们当时做的比较重要一点。我们用了一个比较另类的方法,就有一个单独的 planning stage 来做的这个事儿。 然后还有一个比较大的一个点是我们对于 m c p 的 决策是非常保守的,这个其实 m c p 出来之后,整体业界都非常的嗨,然后很多人就开始去接,但实际上我们当时觉得这个会严重污染你的 action space, 而且会导致你的这个缓存命中率。就是因为你每次你去动态发现工具和这个 和卸载工具的时候,都会导致你这个缓存命中率下降,而缓存命中率下降会严重影响你的成本,所以当时我们也是花了一些精力,我们去研究了一套,就是不在原生 action space 内的 m c p 调用方法。嗯,这个后来当然也被 xarpatch 写成了博课,嘿嘿。然后还有一些像 我们其实整体对 contact engineer 做了非常多的工作了,嗯,而且这块我基本全都给共享出来了。像比如说对于文件系统的使用啊,什么这些东西。对,我觉得就是一些连续的技术方面的决策吧,我觉得没有哪一个是最重要的一点,嗯,对,因为我觉得做 a 阵其实跟训模型很像,就是你 其实更重要的是做对一千件小事,而不是做对三个大事啊,你有后悔的决策,嗯, 肯定也有的,比如说,但我觉得后悔的可能都是更细微这些事,嗯,就因为我们调整的非常快,所以很难形成真正后悔的东西。对,模型就是在模型决策上,你有什么后悔的决策没有啊?在用模型还是训模型?训模型是有一些啊,比如说一开始有点太盲性小模型, 哦,其实参数量还是很重要。哈哈哈。还还会盲性小模型?对,因为当时其实有一点是这样的一个假设,就说, 呃,对待会可以换一个方法来回答。这个我先说完这个吧,就是当时的想法是 agent 其实能更高频的与外界进行数据和环境的反馈的获取。嗯,那我们当时想是不是有一种可能性,就是小模型跟大模型里头一部分参数量都用在了参数化的记忆或者知识? 那对 agent 来说是不是参数化知识没有那么重要?而如果你小模型有足够强的工具使用能力的话,知识是可以动态弥补的,但后来发现 怎么说实验结果是不是的,但我们在反思为什么。也许是这样,就你很难去完全分离什么是知识,什么是记忆。嗯,哪些是泛化能力,哪些是参数化的背板,后来发现这是不现实去区分的,所以大参数量还是有用。 我听过一种说法,就是说他们觉得 minus 只有你一个是研究员,或者说你的研究工作是独立于所有人的,他们觉得这种研究员的配置和管理方式或者组织方式跟不上现在全球 from tla 的 竞争。 哦,我觉得这个问题首先它的一个技术假设是错的,不止我一个人对,我们是正常招 researcher 的。 另外一点就是说我觉得首先有一点是跟上所有 frontier lab 这件事 是不成立的,就是我们的目标不是说要跟上所有 frontier lab 在 模型方面的工作。我刚才一直在强调一点,就是说我们跟至少限阶段,跟所有 frontier lab 还是一个共建的关系,或者用一个更公利的角度来说,是我们成功的把模型训练这件事外包了出去, 那么这样其实就是用户给我们的钱,同时服务了用户,且让我们有影响力,让别人帮我们去模型。那我们内部 research 团队更关注的其实是一些非共识性的东西, 包括其实很多 context engineer 方面的工作是需要做大量实验的,这些东西不是一个怎么说就是纯靠工程能解决的事。你前段时间在做 online learning, 这个有没有什么可以分享的啊?是的,就是首先 online learning 这个词,它现在的解读有有狭义和广义的。嗯,就现在狭义上的 online learning, 大家可能会比较关注,说到底能不能通过持续的改变参数而获得一些改变,这是一个呃严格上的定义。但实际上 online learning 我 发现现在大家把三件事混在了一起,第一 种呢,可能就刚才讲的这是狭义的 online learning。 第二种应该是 mass personalization, 就 大规模个性化。嗯,第三种其实不是 online 的 learning, 而是更像我上一代创业做 maggie 的 时候,我们做那个应该叫 continuous learning 或者叫 lifelong learning。 这三件事解决问题是不一样的。比如说你如果要做这个 mass personalization, 就是 大规模的个性化的话,其实你并不一定非要用一个参数化的方式去做,比如说你可以像我们刚才讲那种基于用户的协商的一些行为的模式来,比如说甚至你以 prompt 的 形式 去动态注入一些东西,通过 in context learning 的 方式让模型的行为发生改变,这样其实更高效的。因为如果你为每个用户,即使你比如很小,像那个 multi-floor 解决方案,其实你也让每个用户有一个不可复用的参数在。

我觉得视频播客真的是有史以来我们普通人能够接触到最及时、最有 insight, 而且你还能听得懂的免费金矿。 很多人想要去获得这种所谓 insight, 你 去看投行,看券商研报,哪怕是去跟这些公司内部工作的人去聊,其实他都远远没有这一轮。我觉得这种视频播客爆发式的增长带来的信息密度和质量高, 它其实很像是以前这种咨询行业里面的专家访谈,以前你去跟这种企业的 ceo, 高管访谈的时候也是好几个小时,而且它多多少少考虑到观众啊,能听得懂还尽量去举例子,其实已经可以说是非常考虑大家的用户体验了, 比方说最近很火的这个,嗯, manas 被收购了一个事情,你会发现多数网友其实只会可能轻飘飘的,或者说有点酸的去讲一句,不就是套壳吗? 啊,其实如果你真的去看了那三个半小时的访谈,你才会对所谓什么叫做套壳有这种更细的颗粒度的理解,别人是怎么从产品角度考虑问题的。其实我们普通人 非科班出身的,你去学 ai 或者想要入门 ai, 它绝对不是从上课或者说从课程开始的,一定是从啊,你去整体的理解整个行业的上下游啊,整个的框架开始,从这种实操层面的去试怎么用 ai 来优化你的工作流这些角度去切入的。 如果你能跟得上这种被访谈人的节奏,四舍五入,其实你已经是在跟 ceo 这个级别的人对话了。而你如果听了十个这种行业里面的 ceo, 或者说是啊产品经理的访谈,其实以后页内的人说点什么,你高低可以回应上几句, 就达到这个效果,我觉得其实已经非常伟大了,关键其实是在于以前这些音赛都是非常非常难获得的,像罗永浩采访这个名创优品的创始人,我当时记得很多人评价说啊,就是这一期没什么干货,不好看,实际上人家讲的是这种零售业的很多这种业内的常识, 他就很平淡的,很丝滑的其实就讲出来了。但是实际上啊,你知道常识是有门槛的,对于没做过的人来说呢,就是隔行如隔山,但这座山 相对来说,我觉得二零二六年在视频播客和 ai 的 帮助下,这个山我觉得是在松动的。啊,下一期我们再讲一下怎么选播客以及如何听的问题,先这样。

哈喽,朋友们,今天呢给大家介绍这一台本田啊,那相信大多数人百分之九十以上的人不知道这台车叫什么车啊?这台车呢是纯进口的 本田英赛特,就中文名叫英赛特。那这台车呢是混动的啊,就是后面自带的电池包,跟那个丰田普锐斯啊,雷克萨斯 ct 两百那个差不多的。那这个车是一点三搭载的 一点三的发动机,八个火花塞,后面一个电池组啊,百公里油耗呢是四升。那这个车非常少见啊,因为全国就一共八十七台啊,目前据我所知啊,深圳就这唯一一台, 非常行驶,质感非常好啊,但是车头呢,就特别像那个九代思域,中间两个门的就像那个飞度,那后面呢又特别像哥斯图啊,有人说他是不像,但是啊这个车特别的 怎么说呢,它进口东西确实质感很好,当时落地不便宜啊,当时落地这个车接近三十三万,在幺三年的时候呢,三十三万可以买什么?可以买宝马三系,奔驰 c 级,有多少人会选择三十三万去买个本田。 这个后备箱是非常巨大的轩背式的车门,而且特别好一点啊,它后面有这块玻璃啊,你倒车的时候你仔细看的一清二楚这块玻璃,这块玻璃是黑玻璃来的, 看这个后备箱特别干净。这个车茶壶是 s 级啊,这个座椅是可以放平的,后排座椅放平,然后呢就可以躺下两个人,一米七八,没有问题的啊, 这个车的配置也是相当的丰富啊,双拼的一个座椅啊,这边是真皮的,这边是绒布的, 这个车你看全程电保,全程四级电保养。一手车深圳阿姨不能叫女士一手车阿姨,你看这个轮毂,他这个车还有个特别好一点啊,就是我们正常的本田不是要开里面的开关才能加油吗?这个不用这个感应的啊,这个直接可以加油了。那么看一下这个车到底有什么配置啊? 特别好开,他特别不像一个油车啊,特别像一个电动车啊。首先我们打打着火先,他已经打着火了,没有什么动静啊,还是冷车状态的。像这个车呢就搭配了啊,玻璃一降一键升降的, 包括这个,你说本身就很省油了,四升他还给你配了一个节能模式,还有这个后视镜折叠, 防碰撞预警,大灯清洗,防侧滑,多功能按键,定速巡航,包括行车电脑显示关键啊,换挡拨片啊,自动的恒恒温空调,它这个小夜景显示这里特别舒服的,你看特别好。 竟然还有那个座椅加热啊,看到没有?座椅加热,它很多设计也特别有意思,像这个阻力感一样,特别舒服啊,这是挡到它特别好啊,这座椅也是双拼的,座椅加热也是功能正常, 七档七速变速箱啊,整体的质感非常舒服。这个车这座椅 很舒服啊,这质感特别好。它这个仪表呢,它这个仪表是你现在它是蓝色的,你开动起来它变成绿色,然后开到红区的时候会变成红色,它是多一直会在变色的,看的按照你速度来变色的啊,所以特别好啊。下车我们看一下这个整体 搭配,是双拼的绒布的,然后这个是一个一个版,有点像模仿那个桃木还是什么东西来的,质感特别好啊。日本小智子进口的原装, 他这个车的很多配件呢跟那我们那个飞度啊,是通用的,外观键呢,也可以买的到啊,但是要从市里面定他这个镜子就特别像那个飞度运动版的啊,这镜子飞度的运动版就是这种镜子,所以是通用的,特别舒服啊。看着这个车 特别像九代思域吧。啊,看这个车身呢,两个门就特别像那个飞度,但是我觉得他这个车最性感的是他这个屁股和这个尾灯特别有感觉啊。看的特别有感觉。 你完全感受不出来这个车原来是个油车,因为它真的没有声音,你知道吧,它就是一个像个电车的行驶质感啊,但是比电车的驾驶质感要舒服很多。 太稀有了,太小众了。你可以说它稀有,也可以说它小众啊,毕竟当年花三十多万买这玩意的人,他的品味肯定是很独特的啊。好,交流交流。