粉丝1.0万获赞1.2万

如果你自称互联网人,但对 dau 还不知道的话,这条视频你要好好看下去了。 dau 就是日活跃用户数, 说白了就是每天有多少人来了。你这是电商位于这类行业喜欢用的 wau 是中活跃用户数,也就是每周有多少人来了。 omu 是每月活跃用户。还记得上条视频讲的 um 吗? dau 和 uv 的标准类似,都是去重后的数据挂了。牛逼,快回去再看一遍。

财经新闻中经常提到的 d a u 是什么? d a u 是 double uzi 的简称,表示日活跃用户数量,他是反映网站、互联网应用或者是网络游戏的运营情况的统计指标。人气越活跃啊,流量就越大,商业价值也就越大。所以说小 通过互联网赚钱,先想想怎么提高 d i u 吧!关注我,获得财经小知识!

如果有人说要带你去瓜分一万亿美元,你信吗?那如果这个人是黄仁勋呢?朋友们,就在昨天的 gtc 二零二六上,黄仁勋平静地抛出一个让全场窒息的数字,到二零二七年底,仅仅靠 blackwell 和 rubin 这两代 ai 芯片,就将催生一个一万亿美元的市场, 这个数字是英伟达去年辉煌战绩的整整两倍。凭什么?就凭他手握的下一张牌,足以彻底改变整个 ai 行业的定价权。 而这一切,从一个叫龙虾的开源项目开始,从一个走上舞台的雪宝开始,从依据你的 offer 带多少 token 开始。大家好,我是陪你解开财富密码的欧丽媛。今天我们就来看看,黄仁勋到底隐藏了多少我们不知道的底牌,又将怎样撬动那一万亿美金的世界。 先说第一张牌,他养的那只龙虾。咱们之前聊过 peter stanberger 的 open claw, 这家伙好用归好用,也确实存在的种种问题。 而现在,黄仁勋为他戴上了名为尼莫克拉的缰绳与缰铐,这不是束缚,这是为了让他能安全的走进每个人的生活。尼莫克拉到底干了什么?从技术层面看,尼莫克拉做了三件事,第一件事叫纱窗隔离,这一步很关键,甚至可以说他是个安全保镖。 不过这个保镖的实现原理却并不复杂。尼米克拉内置了一个叫 open shell 的 运行环境,这个环境提供了开源模型支持,同时把 ai 智能体关在一个透明笼子里,它可以访问数据,但出不去。它可以执行命令,但受监控。它可以调用工具,但有记录。 总的来说就是有了它,就可以防止 ai 们在公司内部随意执行指令,但这还不够。 nemo cloud 还有第二层安全城墙,本地加云端双模式。 它支持两种运行方式,本地模式跑英伟达自己的内幕创模型,数据完全不出设备云端模式,通过隐私路由器访问前沿模型,但所有敏感信息在传输前都会被脱敏处理。这意味着什么?意味着你可以让 ai 智能体访问最强大的云端模型, 同时不用担心隐私泄露,你可以用最先进的算力,同时守住最核心的数据。解决了安全问题,下一步就是该考虑普及的事了。要想大家都能用,首先就得足够简单。 openclaw 虽然强大,但部署起来并不容易,需要配置环境,解决依赖处理兼容性问题。开发者们调侃安装 openclaw 的 时间比用它干活的时间还长,那该怎么办呢? neemo claw 的 解决方案叫一键安装,它通过 mvdr agent 二 kit 软件把整个安装过程优化成一条命令,你想用 openclaw, 不 用折腾环境配置,不用纠结依赖冲突,一条命令全搞定。黄仁轩还特意强调, neemo claw 可以 跑在大部分有英伟达硬件的设备上, 从 jeffers rtx 的 个人电脑,到 rtx pro 的 工作站,再到 dji 和刚发布的 dji spark ai 超级计算机。 讲到这里,不少朋友是不是感觉比较耳熟?这听起来和英伟达的老护城河哭的怎么有点像啊? 同样是软件生态,同样挡定自家硬件,同样试图让开发者一旦进来就出不去。 c 的 花了二十年,把全球数百万 ai 开发者牢牢焊在英伟达的 gpu 上。今天你用 p u 拓式训练模型,底层调的是 c u d, 你 用 tensor flow 做推理,底层调的还是 c u d。 硬件可以抄,参数可以追,但开发者习惯和代码依赖是抄不走的。但如果你以为尼米克洛只是扩大的 ai 智能体翻版,你就低估了黄仁勋这部棋的野心。 cod 是 封闭的,尼米克洛是开源的 cod 绑定硬件,尼米克洛不调芯片,即使企业不用英伟达的 gpu, 也能接入这个平台。这听起来像不像在资敌? 如果你真这么想,那你就是被黄仁勋带进沟里了。因为如果 nimo clock 在 英伟达 gpu 上的推理速度、延迟表现明显优于竞品硬件,那么不绑芯片只是形式上的开放,实质上仍引导客户选择英伟达。 至于英伟达能不能做到这一点,我从不怀疑。咱们之前聊过黄仁勋每次面对大变格和危机时候的选择,我们会发现他是那种打出一招的时候已经准备好一整套连招的人。这次也是一样。先看消费级市场, 搭载 gforce rtx 的 个人电脑和笔记本,尼莫克拉能调用 tensor rtl m 推理引擎,把模型的每瓦吞吐量压到极限。 再看专业级,基于 rtx pro 的 工作站内蒙 cloud 可以 利用多卡并行,把大模型的预填充阶段,也就是智能体阅读理解几十万字上下文的那个最吃算力的环节,加速到让竞品绝望的程度。但这还不是最狠的, 真正的大杀器是那台去年底发布的 d g x spark ai 超级计算机,可以说它是为智能体时代原生设计的,也是英伟达提前布局的一枚重要棋子。 d g x spark 是 什么?一台可以放在桌面上的 ai 超算 是的,和以往那些占地庞大、需要专门机房的数据中心怪兽不同,它的身材只有一百五十立方毫米,不过里面却塞进了一颗强大的 g b 十 grace blackball 超级芯片。这台机器到底有多猛?让我告诉你几个硬核事实。 首先是内存大到离谱,配合 nv link c to c 技术,宽带直接干到了第五代 p c i e 的 五倍。这意味着什么?意味着你单台设备就能在本地刨起两千亿参数的大模型推理,甚至能对七百亿参数的模型进行微调,你的桌面瞬间变成了 ai 实验室, 而且它不只是单打独斗,而是组队王者。以前搞集群很难,现在不难了, 你可以把最多四台 d g x bark 无缝连接起来,两台就能跑四千零五十亿参数。四台组成了这个小集群,直接就能撑起七千亿参数级别的前沿模型推理,性能几乎是限性增长。而现在,这个你桌面上的私人 ai 超算,配合开源的 nimclor, 可以在自己的桌面上构建、运行,并验证那些需要长周期工作的自主 ai 智能体,然后无缝平滑地扩展到云端生产环境。如果你选择用 nimo clock 开发智能体,然后他发现同样的代码,同样的模型,同样的任务, 在英伟达硬件上跑出来的延迟是竞争对手的三分之一,吞吐量是五倍。那你还会考虑别的硬件吗?更重要的是,始终在线的智能体需要始终在线的算力,而英伟达刚好有这种算力。 这招跟当年库达的策略如出一辙,但又更上了一层楼。当年库达靠的是硬件绑定软件,你想用我的软件,就得买我的卡。现在尼莫克洛靠的是软件生态锁定 ai 产业,它不再仅仅销售、搞和铁产, 而是试图成为整个 ai 智能体生态的操作系统或基础设施提供方。黄仁勋比谁都清楚, ai 智能体的时代来了, 护城河自然也要重修。他在演讲中抛出了一个数字,到二零二七年,英伟达 blackwell 和 ruby 芯片的需求将达到一万亿美元。为什么能到这个规模?因为 ai 进入了推理拐点。 以前 ai 是 在实验室里疯狂训练,现在全面进入了推理和生成阶段。而推理是需要智能体的数据中心,不再是存储文件的地方,而是生成 talk 的 工厂。 黄仁勋给了一个数字,在即将到来的 a 阵时代,单个任务的 token 消耗量比传统问答高出四个数量级。 为什么?因为以前你问一句,他答一句。现在他要自己拆解任务,调用工具执行此任务,反复试错,每一次行动背后都是海量的推理。 他把 ai 服务分成五个层级,免费层、中级层、高级层、高速层、超高速层。最高级的服务,每百万 token 收费一百五十美元。 因为他的交互速度更快,上下文更长,能做的事更多。他甚至描述了一个让所有职场人都会愣住的画面,在未来,我们公司的每一位工程师都需要一个年度 token 预算,他们的基本年薪可能是几十万美元, 我会在此基础上再拿出大约一半的金额作为 token 额度给他们,让他们实现十倍的效率提升。 但黄仁勋看到的未来远不止于此,光有会干活的智能体还不够。智能体可以帮你填表格、写代码、订机票,但他还是活在屏幕里。 要让 ai 真正改变世界,他得走出屏幕,走进现实。黄仁勋在演讲里反复强调一个词,物理 ai。 他要让 ai 不 再只是你的聊天对象,他要变成真实世界里能帮你干活的同事。这就是那只雪宝要出场的原因。演讲进行到快一半的时候,黄仁勋请上了一个特殊的嘉宾。 那个来自冰雪奇缘的雪人,在舞台上笨拙的走动,嘴巴会动,眼睛会转,标识性的胡萝卜鼻子甚至能被拆下来又装回去。他的动作不是预设的动画,不是远程操控的木偶,而是一个真正能在物理世界里自主行动的机器人。 但如果你只看到了一个会卖萌的迪士尼玩具,你就错过了黄仁勋真正想告诉你的那件事。雪宝背后运行的是迪士尼、英伟达、 google、 deepmind 共同打造的一整套技术栈, 从到 newton 制定的物理规则,到 camino 基于 newton 构建的针对特定机器人的训练环境,雪宝他在虚拟世界里摔了无数次跤,学会了怎么走路、怎么转头、怎么平衡,然后才被放进这个真实的舞台。 这听起来好像不难,不就是模拟吗?但如果你知道这个问题曾是智能机器人研究中持续了几十年的噩梦,你就会明白雪宝走上舞台的那一刻意味着什么? 想象一下,你要训练一个机器人,学会轻拿轻放,你该怎么让他学会呢?大语言模型可以用互联网上海量的文本训练, 然而对于物理 ai 而言,获取真实世界的交互数据不仅成本高昂,效率低下,且存在不可忽略的安全风险。你不可能让一万个机器人同时去拿一万个杯子来采集数据,成本受不了,安全受不了,时间更受不了数据稀缺, 所以你只能让他在虚拟世界里练。于是第二个问题就来了,虚拟世界里的物理规则和现实世界不一样,微小的摩擦系数偏差会让机器人以为杯子很滑,结果捏的太紧,捏碎了。 传感器噪声模拟的不精确,会让机器人以为杯子已经拿稳了,结果一抬手臂,杯子滑落。材料交互动力学太复杂,仿真里跑得好好的策略一进现实就失效。这玩意在圈子里有个专门的名字, simple real gap。 仿真偏差。 几十年来,无数机器人项目就死在这条沟里,但这只是噩梦的开始。训练与推理的割裂,也是一个不得不面对的难题。模型训练要靠云端几千张 gpu 狂算,但真正干活的时候,机器人只能靠身上那块小小的芯片 算力差几个数量级,软件占还不一样,数据格式还得转换。开发一个机器人等于同时开发两套系统。而且还有一个很关键的问题,认知差。 传统机器人擅长感知,识别出这是一个苹果,但让他干活,需要的是推理。这是一个苹果,看起来很熟,我应该用多大的力气拿起他才不会捏坏?然后还要把这句话分解成一系列动作,伸手、调整角度、施加压力、抬起来、 感知和推理之间隔着一道看不见的墙。这四个问题困了机器人行业几十年。而如今雪宝能走上舞台, 是因为有人把这四堵墙一堵一堵拆了。砸下第一榔头的叫 newton 物理引擎。整体上看, newton 针对机器人进行了从头到脚的赋能, 其目标便是为巨深智能的世界观提供一套坚实可靠的物理定律。它的特殊之处在于,它是可微分的。 什么意思?传统的物理引擎只能告诉你这个动作做错了,但说不清怎么调整才能做对。可微分的物理引擎能算出梯度,告诉你往哪个方向调参数,下一次就能更接近正确结果。 这就像有个教练在旁边,每一次失误都能告诉你手再抬高三厘米。更关键的是, newton 基于 nvidia warp 和 open usd 框架构建,充分利用了英伟达最擅长的并行计算能力,解决了传统 cpu 物理引擎在处理大规模复杂场景时的性能瓶颈。 它被交给了 linux 基金会管理,成为一个开源项目。这意味着什么?意味着英伟达不是在卖一个产品,而是在制定行业标准,让 newton 成为机器人仿真领域事实上的地心引力。具身智能,有了可靠的物理基础,下一步就是创造能在其中学习和行动的智能体。 英伟达为此更新了两类核心模型,作为世界灵魂的 cosmos 世界基础模型和作为机器人大脑的 g r 零零 t 机器人基础模型 cosmos predict 二点五可以根据初始状态预测未来状态,生成长达三十秒的视频 cosmos transfer。 二点五可以把仿真器生成的数据渲染成带有真实世界纹理、光照造成特征的数据,两者配合构成了一条合成数据生成流水线。 开发者不需要让机器人在现实世界里摔一万个杯子,只需要在 cosmos 里生成一万个场景。而 g r 零零 t 就是 被 cosmos 训练的主体, 是连接、感知和行动的桥梁。作为常识思考大脑, cosmos 是 专为物理 ai 设计、开放且可定制的视觉语言模型,在 haagen face 的 物理推理排行榜上位居榜首,下载量已超过百万。 它的能力在于将人类模糊而抽象的高层指令,比如把桌子收拾干净,拆解为一系列可执行的具体动作步骤。通过注入鲜艳知识和常识,它让机器人具备了初步的推理与规划能力。 就这样,通过将强大的推理模型 cosmos 与多模态行为模型 gl 零零 t 深度结合,英 伟达正在打造出既能理解又能行动的机器人大脑,能执行预测程序,也能在陌生环境中依靠常识去推理、去行动。物理 ai 的 新时代正在被黄仁勋一点一点推动向前。雪宝只是其中一个, 波士顿动力的 atlantis 机器人已经用上了 isac lab 的 灵巧抓取工作流,在复杂环境下显著提升了操控能力。 nebius 正在和英伟达合作,把技术落地到工业自动化物流分拣服务机器人领域,那个在舞台上笨拙走动的雪人正在变成一支军队, 而是否看好这支军队,资本市场已经用真金白银给出了答案。三月十六日,黄仁勋登台演讲的两个多小时里,英伟达股价盘中一度直线拉升近百分之五,最终收涨百分之一点六五,带动纳指大涨百分之一点二二。 黄仁勋抛出的一万亿美元点燃了这场狂欢,但真正让机构兴奋的不是硬件卖了多少,而是黄仁勋重新定义了 ai 的 未来。 就在 gtc 开幕前一周,英伟达刚刚宣布向 ai 云公司 nabius 投资二十亿美元,双方将合作开发面向机器人和物理 ai 的 云平台,目标是在二零三零年底前部署超过五 g 瓦的英伟达系统。而在更早的去年十二月, 英伟达以斥资两百亿美元收购了推理芯片初创公司 groku, 为今天的 l p x 机架埋下伏笔。从硬件到软件,从云端到物理世界,从数据中心到桌面, ai 超算,英伟达正在用一套组合权告诉市场, ai 的 训练时代结束了, 推理时代才刚刚开始,而推理是需要智能体的,智能体是需要算力的,算力是需要一直在线的。最后回到那个穿皮衣的男人,丘吉尔在评价阿拉曼战役的胜利时说, 这不是结束,甚至不是结束的开始,但他可能是开始的结束。黄仁勋在 gtc 上的这一系列发布,对于 ai 领域而言,或许正是这样一个开始的结束的时刻, 他结束了。 ai 只会说话不会行动的时代,开启了 ai 既能思考也能做事的新纪元。从 openclaw 到学宝是一条完整的路径。 openclaw 负责的是智能能理解指令拆解任务调用工具。 学宝负责的是身体能感知物理世界,实时做出反应与环境互动,两者结合, ai 才真正完整。今年的 gtc 不是 一个机器人,一只龙虾在卖萌,是一个时代开始了。我是奥利维亚。 如果你也喜欢追寻科技的步伐,挖掘财富的密码,欢迎点赞关注,明天我们继续一起探索这个日新月异的世界。

如果你知道 project 是 项目的意思,那么两分钟后你将会记住这些单词准备好了吗?首先,它们都有一个共同的词根, jack, 它的核心含义是扔、投掷。 re 这个前缀有挽回的意思,把别人给你的东西原样扔回去。 reject 就是 拒绝的意思, 既然扔回去了,那就说明这个东西不是你想要的,所以 reject 的 名词就是废品的意思。 因这个前置有向内进入的意思。把东西 a 往东西 c 里扔,说明是在给 c 添加 a, 所以 inject 就是 添加的意思。 如果用针管把药水扔进身体里,那就是注射注入的意思。 ob, 这个前置有朝向反向的意思,把别人的意见反着扔过去,说明你不赞成。 object 就是 反对的意思。如果是你扔出去的、看得见、摸得着的东西,那就是物体物品的意思。 那你为什么要朝一个地方扔东西呢?肯定是由你自己想达成的目的,所以 object 还有目标的意思。 pro, 这个前缀有向前的意思,把光线向前扔, project 就是 投影的意思。如果把你的计划向前扔,说明这个计划需要落地实行,就是项目方案的意思。 di, 这个前缀有向下的意思。 我们之前讲过, depress 是 把心情压下去,那是使抑郁。而 deject 是 把心情扔下去,就是沮丧、丧气的意思。意,这个前缀有向外的意思,把东西往外扔,就是驱逐、排斥、弹出、喷出的意思, 比如从飞机里弹射逃生,或者从电脑里弹出 u 盘。 interject 表示在中间,别人在说话时,你突然扔进去一句 interject, 就是 插话插嘴的意思。 a d 这个前缀有靠近在旁边的意思。 i e v 是 一个名词和形容词的后缀。把一个东西扔在另一个东西的旁边,它就变成了那个东西的附属品。 如果是扔在名词旁边的附属品,用来给名词补充信息。 adjective 就是 形容词的意思,单词表里的 i g f 就是 adjective 的 缩写。你学会了吗?我最近正在用十大方法整理小初高的单词表,需要代背的可以加我主页的群。

十月十八日,科创版日报记者从字节跳动内部人士获悉,刚刚 tiktok 全球日活跃用户数突破十亿,前数人士称, 此举一度触发在线用户登录警报,开发人员临时扩容才允许新用户访问。目前全球日活突破十亿的 app 有四个, fastbook west app 和 youtube 微信日活约用户数在九亿左右。

欢迎回来,今天要分享的事,是不是老觉得听了一大堆 ai 术语,脑子里还是一团乱码?哎,没关系,就接下来这几分钟,我跟你保证,肯定帮你把大模型到底是怎么工作的给彻底理顺了, 你听完不仅能一下就想明白,而且以后用起来绝对比现在还要顺手。好,那我们马上开始,你可以把咱们这次的解析啊,看成是一张 ai 的 建筑蓝图, 我们会从最最底下的地基开始,一层一层往上盖,总共就六个部分,先看地基,然后是引擎和单元,接着是记忆和指令,再往上是感知与衔接,还有规划与手册。最后呢,咱们站远一点,欣赏一下这栋建筑的全貌。 行,那咱们就从这张蓝图的最底层,也就是地基开始动工。好,咱们先来挖地基。 这地基里啊,有 ai 最核心的两块砖,一个是它用来思考的引擎大圆模型,也就是 l l m, 另一个呢,是它思考时用的基本单位。我们管它叫 token。 来,先说 l m, 全称叫大语言模型,这名字听起来是不是特厉害,但它最核心的工作原理,说出来你可能都不信,就是咱们小时候都玩过的文字接龙,没错,真的就是这么个简单的游戏。 好,顺便说一句,现在市面上你看到的所有大模型,不管是谁家的,它们的底层架构基本上都是一个叫做 transformer 的 东西。那这个文字接龙具体是怎么玩的呢?你看过程是这样的,你先输入马克的视频 模型,就在后台疯狂计算,预测出下一个最有可能的词是真的,但最关键的一步来了,他不会停,而是马上把真的这个新词加到你的话后面,变成一句新的,输入马克的视频,真的。然后呢,再根据这句新话去预测下一个词,比如说很棒, 他就这样一个词一个词的往后接,直到自己觉得这句话说完了,就输出一个结束的标志。这下你明白了吧,为什么你用 ai 聊天的时候,他的回答总像是一个字一个字蹦出来的?因为他就是在玩这个游戏啊。 哎,等一下,这有个最根本的问题啊,大模型本质上就是个数学家,他脑子里啊全都是数字和矩阵运算,他一个汉字一个单词都不认识,那他到底是怎么跟我们玩文字接龙,又是怎么理解我们人类的语言的呢? 这就需要一位翻译官出场了,他的名字叫 tokenizer, 也就是分词器。他的工作特别纯粹,就干两件事,第一件叫编码,就是把我们说的人话翻译成一串串的数字,好让模型这个数学家能看懂。第二件呢,叫解码, 就是等模型算出来一堆数字结果之后,再把这些数字翻译回我们能看懂的文字。那这位翻译官翻译出来的最小单位就是我们刚才说的 token, 这个 token 它不完全等于咱们平常说的一个词,这里有个经验法则,大家可以记一下,还挺有用的,一个 token 大 概就相当于零点七五个英文单词,或者说一点五到二个汉字。 你记住这个以后,再看到模型的各种参数,心里就有数了。好了,地基和砖头都有了,现在咱们往上盖第二层,记忆和指令 ai 到底是怎么记住我们聊过什么的?它又是怎么听我们指挥的呢?你有没有好奇过, ai 的 记性好像特别好,总能接着你上一句话往下聊。但其实啊,它本质上就像个金宇记忆,算完一次就忘了,根本没有真正的记忆力。 那他是怎么做到的呢?哎,诀窍其实特别笨,就是每一次你跟他说话,系统都会把你俩之前所有的聊天记录,悄悄地、完完整整地再发给他一遍。这一整个聊天记录大礼包就叫做 context, 也就是上下文。 所以说,他不是真的记住了,而是每次都在复习功课。当然了,这个复习资料不能无限长,它的长度象限就叫 context window 上下文框状。那问题就来了,我要是想让他读一本好几千页的书,这窗口根本就塞不下怎么办? 这时候一个叫 r a g 的 技术就派上用场了,他特别聪明,不会把整本书硬塞进去,而是向一个图书管理员根据你的问题,精准地从书里找出最相关的那几页,只把这几页的内容交给模型去参考。 你看问题,这不就解决了吗?说完了记忆,咱们再看看指令,也就是 prom, 这个也分两种,我们平时在对话框里打的那些字叫 user prompt, 用户指令。但在它背后啊,还有一种开发者提前设定好的,我们一般看不见的幕后指令,叫 system prompt。 这个东西就像是给 ai 设定好的人设和行为准则。 比方说,开发者可以给他一条 system prompt, 你 是一位循循善诱的数学老师,绝对不可以直接给答案。那这个时候你再问他三加五等于几,他就不会直接告诉你八,而是会反过来问你,嗯,你是怎么思考这个问题的呢? ok, 到这里,我们的 ai 已经能聊会听了,就像一个特别聪明的书呆子。但问题是,他还是被困在自己的数字世界里,根本不知道外面是晴天还是下雨。接下来咱们就得给他打通一扇团虎,让他能连接到现实世界。 你想啊,大模型只会玩文字接龙,他怎么可能知道今天上海的天气怎么样,他自己是插不到的,这时候就需要给他工具了,也就是 to, to 的 本质其实就是个外部的小程序,比如说一个天气查询的接口 模型,可以自己判断说,哎,我需要查一下天气,然后他就去调用这个工具,拿到实时的天气数据,最后再用人话把结果告诉你。你看,就这么一下, ai 感知现实世界的这道壁垒不就给打破了吗?但是这里有个特别麻烦的事啊, 每个大模型平台接工具的规范都不一样,开发者要想让自己的工具在好几个平台上都能用,就得来来回回写好几遍代码,简直烦死。 为了解决这个接口不统一的世纪难题,一个叫 m c p 的 协议就诞生了,你不用记它的全称,你只要记住,它就是 ai 界的 type c 接口。有了这个统一标准,开发者只要写一次工具,就能在所有支持它的平台上无缝衔接,这个大大解放了生产力啊! 厉害了,我们的 ai 现在有了五官能感知世界了,现在我们登上这栋建筑的顶层,来看看到底怎么才能让它从一个听话的工具人,进化成一个能独立思考、自主行动的智能管家,也就是 agent。 到底什么叫 agent 呢?这么说吧,当一个 ai 不 再是你问一句,他答一句,而是能为了一个复杂的目标,比如说,帮我规划一次周末旅行,自己去思考步骤,第一步我得查查天气,第二步我得看看机票,第三步我得去定个酒店。 并且它还能自主决定调用哪些工具来完成这些步骤的时候,它就进化成了 agent, 也就是智能体。核心区别就在于两个词儿,自主规划或执行。 但是这个智能管家怎么知道你的个人偏好呢?比如说,你想让它当你的出门提醒官,但你有很特殊的要求, 只要下雨,不仅要带伞,还得穿上雨靴,空气质量一差,就必须带 n 九五口罩,而且提醒的格式必须是今日天气式、出门见异式等等。 通用的 agent 可不懂这些,这时候就需要你亲自出马,给他写一份专属操作手册了,这个东西就叫 agent skill。 别怕,这份儿专属手册写起来其实很简单,它就分两部分,上面是封面儿,也就是原数据告诉 agent 这个技能叫什么,是干嘛用的。 下面是正文儿,也就是具体的指令。你可以在这里用大白话儿清清楚楚地写下你的要求,目标是什么,要分几步走,遇到什么情况该怎么办?最后要按照什么格式输出。 有了这份你亲手写的指南, agent 就 能变成那个最懂你的贴心助理了。好了,到这里,所有的建筑模块咱们都看完了,现在让我们往后退一步,从下到上来欣赏一下我们亲手搭建起来的这栋 ai 大 厦的全貌。 咱们从地级看起, l o m 是 最底层的思考引擎,它思考用的砖块呢,是 token, context 是 他的临时记忆,让对话能够延续。 prompt 是 给他的具体指令, two 和 m c p 协议是他连接世界的窗户。而在最顶层, agent 扮演着总指挥的角色,通过你为他定制的 agent skill 来完成各种各样复杂的个人任务。 你看,每一层都建立在下一层之上,缺一不可。好了,现在这套 ai 的 底层逻辑和价高蓝图你已经完全掌握了,以后再看到各种 ai 新产品、新技术,你就能一眼看到它们的本质。

为什么把 dau 先拆成诸多的成用户组成之后再去看呢?是因为我们 dau 它是一个,比如说各个用户群里加起来构成任意指标,它提到 gmv 的时候,因为 gmv 它是一个从公式出发,哎,我通过什么乘什么乘什么过道有指标,但是 在这层逻辑之上也会是有一个有各个维度、各个层面、各个模块的这样没构成的这样一个大的指标。这个性质和第一个是有点类似的, 因此当涉及到和 gmv 差点相关的时候,其实他很考验的研究是,你知不知道我要研究的这个平台他本身的商业模式什么样子?什么叫商业模式?说直白一点就是我整体这个平台钱都有哪几种构成 gmv 从哪里来?我现在一拿到一个 gmv, 我都不知道他的这个 gmb 可以区分成哪几个模块,直接去拆成公式,那这样的一个拆分方式他其实是无效的,如果你拆完之后没有办法具体的解决问题,所以当 gm 发生下降,会有活动的时候。因此常见的我们 做 gm 拆解的时候,三个比较常见的思路会要求就是要做到结构化、公示化和业务关注,启动探秘大厂数据分析实战。

最近啊,图灵讲得主也是深度学习的三大巨头之一杨立坤发了一篇惊天动地的论文啊,他用了一个非常的冷酷,但是有证据确凿的分析来告诉我们的一个道理啊,他说我们一直在追求的这个 agi 啊,也就是通用人工智能,很可能就是一个泡影。 因为呢,他证明了一件事,他说你现在在用的这种什么都能聊的通用的 ai, 本身呢,它就是一条走不通的路。那杨立坤这篇论文啊,它的标题翻译过来呢,就是说 ai 必须拥抱智能化,它直接就宣判了 agi, 也就是通用人工智能的死刑。什么意思呢?我拆给你听一下啊, 我们现在所有整个 ai 行业都在追求一个目标叫 agi。 简单来说呢,就是造一个什么都能干的一个万能的 ai, 它能写代码,能写诗,能诊断疾病,能开车,样样精通。 但是杨立坤说这个目标从底层逻辑上有三个致命的漏洞。第一个漏洞呢,是人类本身根本就不通用, agi 的 定义是说能做人类能做到的一切事。但是杨立坤就反问了一个非常直接灵魂的问题,就是人类真的什么都能做吗?答案是并不能。 人脑啊,最初被设计出来,并不是为了去写代码作为积分,但人脑在几百万年的这个进化的终极使命就一个事啊,就是在原始的丛林里面去活下去。所以啊,我们擅长去看东西,走路、社交,是因为这些能力直接决定了祖先的生死,那这是自然选择的产物,根本就不是什么通用能力。 而且呢,一旦离开这个进化的舒适区,其实人类真的就很菜。论文中呢,他就举了一个非常狠的例子啊,就是国际象棋啊,他的世界冠军叫卡尔森。在人类眼中啊,他就是一个天才中的天才。但是面对一台电脑呢, 随便一台笔记本啊,他的象棋引擎就能把他撵成渣。那我们觉得他厉害呢,只是因为我们一直拿人类自己的标准来衡量而已。也就是换句话说啊,我们现在对智能的认知,一直都被自己的这个生物学的局限蒙蔽着,拿一个本身就不通用的物种呢,当做通用智能的这样的一个标识,那不就是刻舟求剑吗? 那第二个漏洞呢,就是数学上就根本不可能因为机器学习呢,它有个著名的理论啊,叫做没有免费的午餐,它就证明了一个残酷的事,就是不存在一个算法能在所有的问题上都表现最优。 举个例子啊,比如说有一个学生想在每一节课上都考第一,那理论上就做不到,那花在语文上的精力,必然会挤占学数学的时间。 那 ai 也一样啊,你让一个模型同时去学叠衣服,开车,写代码,还有预测蛋白质结构,它大概率每件事情都只能做到凑合。那机器学习呢?管这个叫做负迁移,就是当多个任务共用一个模型的时候,它的学习信号呢,会相互的打架,反而会拖累所有任务的表现。那 杨立坤呢,他在论文里呢,就说了一句非常形象的话啊,他说帮我们折叠蛋白质的 ai, 不 应该是帮我们折衣服的 ai。 那第三个漏洞呢,就是目标太低,因为 agi 的 天花板是什么呢?大家说的是人类水平,也就是说能做到人类能做的一切就算成功。 但是啊,杨丽坤说这里面呢,等于自己给自己画了一个天花板,因为人类的能力本来就是生物进化的结果,为什么要成为 ai 的 上限呢? 那 agi 走不通,那杨丽坤给出了一个什么样的替代方案呢?他提出了一个新概念,叫 s a i, 也就是超人类适应性智能。 那 s a i 和 a g i 的 区别呢?只要一句话就能解释清楚, a g i 呢,比的是你现在会多少技能,而 s a i 比的是你学会一个新技能有多快。如果说 a g i 是 一个十八般武艺样样精通的一个超级学霸,那 s a i 呢,就是一个学什么都学的极快的超级学习者。 他今天呢,可能不会做手术,但是你给他一天的时间,他就能够做的比最顶尖的外科医生要做的更好。然后呢,他掌握了手术之后,就能够做的比最顶尖的基因编辑。 那这里最好的一个现实的案例就是 alpha fold, 它就是专门针对蛋白质结构预测来设计的,它呢可以说是直接解决了困扰生物学家五十年的难题, 因为没有任何一个人类科学家能够做到,他的成功呢,就不是模仿人类,反而是因为他走了一条完全智能化的路。好,那么理解了这些之后,我们再回到最开始的那个问题,为什么 s a i 的 方向会让人和人之间的差距不是缩小,而是拉大?这才是这篇论文最细思极恐的地方, 你想想看啊,你现在用拆的 gpt 博士还有初中生的体验确实差不多。因为啊,现在的 ai 本质上就是一个通用聊天机器人,不管谁来问,那么他就会给你差不多的回答。但是如果 ai 的 未来不是通用,而是专业化呢?杨丽坤,他的技术路线呢,就是三个关键词啊,一个是自监督学习,一个是世界模型,还有一个呢,是模块化系统。 那简单来说呢,就是说,未来的 ai, 它不再是一个什么都能聊的一个万能的助手,而是一个专家模块,它是各有所长的专家。那有的模块就会专攻蛋白质折叠,有的就会专攻金融建模,有的就会专攻材料科学,那有的呢,它就会去专攻法律推理。 而且每一个模块,它的脑子里面都装着一个世界模型,不是靠猜下个词来回答问题,而是真正理解这个领域的底层逻辑,它能在这个脑子里面去模拟。如果我这么做,到底这个世界会发生什么?那这意味着什么呢?这就意味着未来 ai 的 强弱,它不取决于 ai 本 深,而是取决于使用者能不能精准调用正确的专家模块,能不能提出正确的专业问题。这就好比啊,现在世界上最好的手术刀已经摆在桌上了,但是对于一个外科医生来说,这个刀呢,就能救命。而对于一个完全没学过医的人来说,这个刀呢,其实什么都不是。 所以智能化的 ai 就是 这个刀啊,它越锋利,那么会用和不会用之间的差距就会越大。一个懂蛋白质结构的生物学家,用上智能化的 ai, 它的效率可能提升一百倍。但是啊,一个完全没有相关领域知识的人,面对同样的工具,它可能连问题都提不出来。 所以 ai 评权呢,只是一个属于通用 ai 时代的短暂幻觉。一旦 ai 走向专业化,真正拉开你差距的就不是你能不能用 ai, 而是你有没有专业的深度来驾驭专业化的 ai。 而且杨丽坤在论文里啊,还挑战了现在大语言模型的基础路线, 他认为啊,现在 open ai 还有 google 的 deepmind, 正在做的事情就是靠猜下一个词来训练 ai 有 一个致命的缺陷, 他举了个例子啊,就是一个四岁的孩子,他仅仅需要眼睛就可以看这个世界,就可以理解重力,就知道杯子从桌上掉下来就会碎,但是啊,你把同样的信息量的文本喂给大圆模型,他根本就学不到。为什么呢?因为这些文字只是现实世界的一层极薄的投影, 你用文字来描述苹果从树上掉下来,那模型呢,就只学到了这几个字的统计关联。但是孩子看到的就是重力、加速度,还有碰撞,是这些物理世界的因果关系。 所以啊,杨丽坤呢,主要要造的是世界模型,让 ai 的 脑子里面有一个物理世界的模拟器,能够真正理解因果,而不只是在文字的表面化。行, 最后啊,我说一下自己的判断啊,杨丽坤呢,他这篇论文,我觉得真正颠覆性的事情,并不是在于他提出了 sai 这个新概念,而是在于啊,他解释了一个反之觉的真相。也就是说, ai 越强大,他对于使用者自身能力的要求其实会越高,而不是越低。 过去我们总是说 ai 会让所有人都会变得更强,但是事实可能恰恰相反,它是一个放大器,它放大的不是所有人能力,而是已有能力的差距。 如果你本来就有专业深度,那么 ai 就 会让你如虎添翼。但是如果你什么都没有, ai 也帮不了你什么,这对我们每一个人呢?其实启示非常清晰,那就是不要再去幻想一个通用 ai 就 能打天下,而真正修炼的是你在某一个领域的专业深度,以及你快速学习新领域的适应能力。 而且有意思的是,这恰好就是 s a i 的 核心指标,并不是你现在会什么东西,而是你学新东西到底有多快。 所以在某种意义上啊,杨丽坤呢,他不只是在定义 ai 的 未来,他也在定义人类在 ai 时代的生存法则,成为一个在专业深度上不断进化的适应力极强的学习者。否则呢, ai 不 会拉你一把,只会把你甩得更远。好了,如果对你有帮助的话,别忘了点赞关注,这对我非常重要,我是 c 哥,咱们下期见!

新媒体运营黑化考试现在开始,今天都是英语听力题。用户生产内容,也就是普通人发的作品,专家专业团队发的内容, 品牌官方发的内容,各种用 ai 生成并发布的内容。网红生产线有点粉丝量的小博主找他们发馆子能便宜些。粉丝量大,在某个领域有影响力的头部博主找他们打馆子很贵,投一块钱能赚回来多少钱? 用户点一次要花多少钱?内容里植入关键词,不花钱就能提升搜索排名。

它读 w 吗?是因为 double 能和 u 连成了 li 的 声音吗?不是。你可以认为 w 本身就是这个字母固定的昵称,里面的 u 是 关键信息,所以我们母语者在说的时候会刻意把 l 保留在前面的 double 里面。保留一个语音便捷,通常中间会有一个非常轻微的停顿。 double u w 不 会让 l 划到后面。而且别忘了啊,词间的连读不是必须的,跟每个人说话习惯,当时说话的余流都有关系。 w 说得快,不会连成六啦。 从发音动作上看, double 结尾的呃是 dark out。 舌根太高,发音位置靠后,而下一个音。是呀,舌位一下子也要往前滑,跨度很大,所以在自然语录中,呃通常会被明显弱化。 basically it's just a slight raising of the tongue and all that's left is a transitional movement。 但它还是在 double 这个词里,不会和后面的音形成一个新的音节。或者 o 可以 完全去掉发成 w, w 两种情况都不会发成汉语里的六的音。 我们来听几个母语老师的读音, w w sound w w 那 又有人会问, value 这个词在词内它不就变成六了吗? yes and no。 在 比较正式清晰的发音里,你确实可能会听到一个连贯的声音, value value。 但你再仔细听一次, a 的 舌头动作并没有完整厚重的 dark l o, 它更不是汉语里的 liu value value value。 如果把 value 说快了, o 还会再进一步弱化,说成 value family valued with value, romney values, jenna values in value。 学会了吗?

今天啊,又有姐妹来问我啊,他说佩姐啊,现在干直播还能干吗啊?我做了三年主播,然后我今天给大家讲一讲啊,什么是直播?那很多朋友啊,都想做直播或者已经在做直播的,其实你们呢,都没有搞清楚啊,直播啊,他到底什么东西才最重要? 那我今天呢,给大家打一个非常简单的比方,来把直播带货这一个底层逻辑给大家掰开了,揉碎了讲一下, 其实直播带货的话呢,是有三个因素,大家知道吗?人或厂啊,简单的这三个字的话呢,他其实一点都不简单的, 那我们先从厂开始说啊。呃,首先呢,我们呢可以把直播间,把我们的直播间想象成一家水果店啊,想象成一家水果店,那什么是厂呢?厂呢就是你的流量入口,也就是说我们水果店的门面, 然后你直播间的封面呀,标题呀,背景啊,灯光布置啊等等,这就是你水果店的招牌,以及你室内的一些灯光和装修了,那你的招牌做的再精致,灯光打的再漂亮,如果不能把路人给吸引进来,那你这家店是不是摆设流量来了,却留不住人,那这一切都是白搭。 第二,我们场景搭建好了,流量也来了,那谁来承接呢?这个就是人了,也就是我们主播, 很多人以为啊,主播只要能说会道,能嘴皮子耍的溜溜的就行了,其实啊,真的没有那么简单的,主播的核心价值是什么?他的核心价值是要建立信任感啊,也就是他通过他的讲解,他的互动,他的展示来把用户心里的顾虑给打消掉, 其实直播带货的本质就是线上销售,只是线下客户呢,他可以在实体店通过鼻子去闻,通过肉眼去看,通过手去摸,可以主观的去达到要或者不要的主观意识。然后店里的营业员呢,再给他去传达一下店内今天在搞的一些活动,来促进更加深更加多的一个消费。 其实直播也是一样的,我们把用户当做我们老客户来对待就可以了,让他放心,让他心甘情愿的在你地方下单,这就是人的重要性。 但你要记住啊,人再好,如果你没有好货啊,最后呢,也是差评收场,还会把你的账号给作废是吧?所以第三点也是最重要的一点,货才是根本,你直播间再热闹,你主播再会说那用户是为什么来下单, 肯定是因为你的货,肯定也是因为你的性价比,肯定你为他解决了他的真实需求,他才会跟着你下单是吧?人和场呢,只是一个放大器,他能够把你的好货变得更好,也能够让你的次品的负面效果放很大,如果货不行, 直播真的做不起来。最后咱们要懂平台的规则是吧?我们是要依赖于平台的,平台怎么给你流量,我们也是要搞清楚,他是把同一层级的赛道里面去比,这就是所谓的赛马机制, 你的转化越高,成交额越好,哎,平台会觉得你还不错,是不是他才会给你推更多的流量进来?反之,如果你留不住人,你卖不出去货,流量肯定会被截胡,而且你自己的成绩还会掉。 所以总结一下啊,直播带货的话呢,不光开好直播就行了,他是一个以货为根本,以场为入口,以人为转化的一个动态系统。这三个环节啊是缺一不可的,入了哪一项都没法盈利。 你搞懂了人货场啊,那我们这个直播才算入门。点好,关注加收藏,让我们一起来学习直播。

每天一个互联网英文黑话 dau daily active user douyin's dau in two thousand twenty one has reached six hundred million。

抖音上线十七个月之后,我们发现 da 就突破了一个亿,这个也许是中国移动互联网记微信之后成长最快的产品了。就在上个月,我们刚刚也对外公布了抖音的最新的用户数据,超过了 dau, 超过了三点二亿。 而且我们在后台也发现啊,这个数据仍然在不停的增长,完全没有减缓的趋势。 所以我个人觉得大胆的猜测一下,也许到二零二零年,包括抖音、快手以及其他的短视频产品在内,可能仅仅在中国,整个短视频视频将会达到十亿的跌优。 十亿的跌优是个什么概念呢?他差不多等于今天的微信的日活用户。 其实我相信如果我不提这些数字的话,大家也能够感感受到短视频给世界带来的变化。呃,以前我们出去旅游,我们都会说拍个照片吧,现在大家会说拍个短视频,拍个抖音吧。 国外国内的这样的博物馆和一些景区,我就会发现说这些景区都提供了一种扫一扫的功能, 直接可以用短视频去看一些文物的信息解说,甚至有些地方可以直接用手机短视频浏览整个博物馆的收藏,这些都是一些科技带来的变化。