粉丝269.7万获赞2006.1万


什么是 web coding? 在 开发者社区里面,这个词呢是火的一塌糊涂啊,我前段时间也是作为嘉宾去参加了二十四小时的 web coding 的 一个 hackathon。 那 今天呢,我就想站在一个实战开发者的角度,给大家去聊一聊什么是 web coding, 以及那些让你歪不起来的一个神奇工具。 所以 webcoding 到底是个啥呢? web 在 英文里面叫做氛围啊,感觉的意思,所以 webcoding 直译过来就是那种叫氛围编程,或者说感觉编程,也可以叫呢沉浸式编程。但这里的沉浸不仅仅是让你沉浸在一个有仪式感的编程环境里面,更重要的是它颠覆了我们以前 去写代码的那种方式。我直接说杰瑞, webcoding 压根是不关心你的代码具体是怎么实现的,核心关注的是代码生成的结果 到底对还是不对。至于实现逻辑,底层细节这些反手活呢,都是去交给 ai, 我 呢只需要去盯着效果,觉得哪里不对哪里问题,哎,我就直接去改这个 prompt, 重新去提需求, ai 呢,就会自动帮你去调整, 然后去优化,直到最后我们出来的这个结果,也就是代码完完全全符合你的预期为止。所以整个过程呢,你都沉浸在一种说想法, 然后呢看结果,然后调整,再出结果这样的一系列的流程里面,你只需要去说我想要什么效果,对方呢,立刻去给你去实现出来,不满意呢,你就当场去改,直到完全符合你的预期。 举个例子啊,正常我们去写代码,我们大多数人要去想明白这个实现的一个思路流程,然后细节都得自己亲手去写,亲自去改,遇到 bug 呢,还得追根去溯源。而 web coding 呢,就完全不一样,流程变了。第一个我要用我自己的话,比如说自然语言, 或者画个图,举个例子,告诉 a i, 我 想要什么样的一个功能, ai 呢?不管你是用的 gpt code, 还是专业的 web coding 平台的一个 agent 自动会给你造出来代码和界面,你根本不用管他到底用了什么方法。那第三步呢,你就实际运行看一看,哎,这个代码加界面生成的这个结果是对的还是错的?对了呢,你就收下,不对你就吐槽,提要求,让 ai 再调,那这样你从提语言实现功能,给 ai 实现, 给出结果,不对呢,再去换语言,换功能,去提要求,如水循环,只要你看到结果完全符合你心中所想呢,那这代码你就交差了。所以说白了呢,人类去负责出题加审核, ai 呢,负责解析加改卷,全过程都可以沉浸在一个叫做及时反馈, 到调整,到再反馈,再到再调整的地方里面,你自己不用考虑怎么实现,整个就是极致的一个躺平式的生产力,然后更详细去表示外部人流程。我自己写个流程图啊, 第一个就是我想要的结果,或者呢是我的需求,然后呢?哎,告诉 ai, 然后我要这样 ai 自动去生成代码。好,那生成完以后实际效果出来了, 出来以后这个看,哎,是不是满意,如果不满意,那就往回让 ai 再去呃,重新的去生成。好,如果他实际效果满意呢,那就收工。所以你看整个流程呢,就非常简单,就像你在理发店去剪头发,你只需要说 我想一个清爽一点的短发,那 ai 理发师呢,就去给你开剪,剪到一半发现太短了,你立刻说再留长一点,那 ai 呢,马上就帮你去调整,直到照镜子,你点头,嗯,挺帅的,满意为止。所以这种方式为什么是爽的呢?第一步就是效率大幅提升的,你不需要再花大量的时间去纠结底层逻辑, 调试 bug, 查文档,所有经历呢,你都可以放在我到底想要什么上,执行细节全部去交给 ai。 第二个呢,就是零门槛上手,你不需要是一个资深的程序员,甚至编程小白都能去玩,你只需要去清晰表达自己的一个想法, ai 就 可以去帮你实现,想法呢是比技能啊更重要。 第三个叫做保持心流状态,你不会被代码的细节打断思路,可以完全沉浸在产品创作中,遇到这里好像是行云流水,这个呢就是真正的外部感。 第四个呢,就是快速的一个试错,验证想法对不对,你做出来看看就知道。从想法到可运行的原型呢,可能只需要几分钟,适合快速的去验证商业想法,做产品原型可示化的 demo。 ok, 那 再给大家介绍一些比较常用的 web 扣点工具啊, 只要能够去实现 ai 自动生成,加计时预览加快速调整的,我觉得就是好的外部控制的工具。下面呢,我就推荐几个当前最好用的。第一个我一直在用的叫做 ctrl, 它目前我觉得是最火的一个 ai id 啊,体验丝滑到起飞啊。 几个核心功能,比如说你按照 command 加 k, 可以 直接在代码里面去提需求, ai 呢,当场生成,按 command 加 l 呢,可以去开启对话, ai 帮你去写整个的功能模块。 第三个,还能理解整个项目上下文,生成代码质量也是极高的。第四个呢,还能自动去查 bug, 重构代码,优化逻辑。 我觉得这个是适合所有开发者,特别是去做外部开发以及做全站开发的。第二个呢,就是国内的一个工具叫翠,他是国产的 ai d 字节跳动推出来的,免费而且好用。核心几个功能呢,也是对话式开发,而且支持中文,可以去写代码,查文档,生成 api, 而且它是完全免费使用的,它比较适合的就是我们国内的一个开发者,也适合预算有限的一个个人开发者。第三个,如果大家很习惯 vs code 的 时候, 你可以用 vs code 加上 clone 这个插件,加上这个插件以后呢,就已经可以把 ai 的 能力完全无缝集成到 vs code, 同时保留原有的插件生态和习惯,也支持连接 mcp 的 server, 获取 api 的 一个文档。 这个呢,我觉得就适合 vs code 的 一个重度用户了。那最后总结一下, web code 的 一个本质就是让人去做最擅长的事,创造和判断,让 ai 呢,去做最擅长的事,执行和实现。但我们需要具备的关键能力就是有清晰的产品思维,有要会判断代码质量,要善于表达需求,要懂得去快速迭代。 所以呢,你可以现在就打开 excel, 打开 vs code, 连上你的 api 文档,开始你的 web 扣令之旅。 ok, 那 最后如果这篇文章分享对你有启发,也欢迎在驾校站 ai 学习圈里面继续去交流,同时我们也会有很多的实战嘉宾不定期去分享 ai 实操经验,欢迎你一起围观评论区啊,我们安排。

我是达摩院的数据决策部门。达摩院是做什么的?我们的标语是维斯尔播放,所以我们是一群非常热情的做研究的。一群人都是什么样的人啊?我的同事有来自清华的,北大的, ucla 的,浙大的,都是很厉害的。你也很厉害啊。 不敢当不敢当。他们都有什么爱好?我有一个同事,他特别有意思,老板问他你平时都爱做什么?然后他说他的爱好是读佩佩。我们真的是大为震惊。因为佩佩只是我们的工作嘛。但是他以读佩佩为乐,读到信徒上可以读到三四点钟。 不配谱。听起来像是个大龄年。不是的,九六年。天呐,我原以为四个秃头主力军都是九零后。你是应该是最小的吧?不是,我是九六的,我们还有九七年,然后我们刚来的两个实习生是九九年的。好年轻啊。

今天这期视频,我想先聊一个听上去就很离谱的事,一个开源的芯片架构是真开源,不是那种我给你看一点点原码,然后关键部分你自己去想办法。那种半开不开,而是那种谁都能用,谁都能看原代码,谁都能魔改的芯片架构。 这不算离谱,更离谱的是,就为了这么个开源的东西,达摩院这边做了七年,最后居然真的把它干成了地表最强。 事情是这样的啊,前两天我去参加选铁生菜大会,咱们频道的老观众看这个会一年一年半,也算是他的创世老粉了。那往年这个会的气质呢?就是那种标准的技术大会,聊愿景啊,聊布局啊,聊产品啊。但是今年呢,没聊梦想,直接给你端了盘硬菜,地表最强 respect cpu 选铁 c 九五零, 超过了龟仙人 jim keller, 公司不久前刚刚发布的得意之作,直逼叉八六 am 最新的一代产品,这种感觉就是啊,达木院不装扫地僧了,直接摊牌了,不装了, 我是亿万富翁。摊牌了这个事离谱的地方啊,不止在它跑分高,而是在它把 race five 这个过去长期被很多人当成低端平替小盒玩家、 mcu 专业户的这种架构啊,直接拎上了高性能,服 起主战场。那问题是,达摩院为什么要做这件事情,能给他们带来什么好处呢?这个时候啊,我脑子里突然想起了老黄这两年特别爱讲的一个词儿,主权 ai。 他说人工智能时代,各个国家,各个地区各个产业都在建设属于自己的 ai 能力,那如果 ai 有 主权,那芯片是不是也应该有一种更底层的主权?不是我能买到芯片的主权,而是我能决定芯片底层规则的主权。我们可以把它叫做架构主权。 risk architecture is gonna change, everything yeah, risk gets good。 那 我们为什么需要架构主权? risk five 这个免费架构能否扛起这面大旗?玄铁 c 九五零到底有多强? ai 爆发为什么会让这件事情突然变得比去年、前年,甚至比所有人预期的都更重要?以及这到底是不是中国芯片距离换道超车最近的一次呢? 剧透一下,答案可能没你想的那么乐观。 要说清楚为什么需要芯片的架构主权,就必须要先弄明白现在的架构有什么问题。 你可以把架构啊,简单理解成计算机软件和硬件之间约定好的语言,软件说一句加法,硬件知道该怎么执行,软件说一句保存,硬件知道去哪里拿数据。那现在的芯片世界啊,被两门语言统 一种呢?是叉八六,它统治 pc 和服务器几十年,以至于历史包袱都成了生态护城河。另一个呢,是 arm, 它靠低功耗起家,从手机到平板,从汽车到服务器,它基本已经完成了从移动端到数据中心的全面渗透。但问题在于呢,这两条路啊,无论选哪条,对后来者都不够自由。叉 八六就别想了,那是英特尔和 amd 的 自留地。 arm 呢,貌似开放,因为你可以买到 ip 授权,但那更像是买房,不是买地。 你可以选现成的户型,可以装修,可以把窗帘换成你喜欢的颜色。但是啊,你别想砸承重墙,更别想自己改地基。 这几年 am 和高空的纠纷,表面上看是授权和合同的争议,深层看其实就是一句话,在专有架构模式下,即便你有极强的设计能力,你的命脉依然可能握在别人手里。这就是为什么我们需要架构主权。意思希望来自十五年前啊,加州伯克利的教授们提出了 risk five, 他的目标很简单,甚至有点理想主义,就是做芯片界的 linux, 做一套任何人都能用,任何人都能扩展,任何人都不用交巨额授权费的开放指令级架构。 但是就像绝大部分学术项目一样,在很长一段时间里, race five 就是 一个瘦弱的少年,只能在嵌入式啊,互联网啊这些低端领域打打杂,跑跑简单的控制逻辑,大家也都觉得他只是个低端平替。 但是啊,这次达摩院拿出了玄铁 c 九五零,狠狠改变了人们的刻板印象。 spec 跑分二十二分,每 g 赫兹五纳米工艺下,主频达到了三点二 g 赫兹总分突破七十分,逼近了英特尔直强六、 amunus v 二、 amd 任五啊,这些友商的高性能产品,也超过了归宣人 jim keller 去年底刚刚发布的 sclor x 地表最强 race five cpu。 那 这次大会上,我碰到了达摩院首席科学家孟建义博士啊,他一路带着玄铁长大,带队搞了十四颗 cpu。 他 说啊, c 九幺零是让大家看到 race five 有 往高兴,能走的希望,而 c 九五零是要给整个行业打个样儿, 告诉大家 recife 可以 做到这么高的性能,而且这个东西你是可以拿到,可以授权,可以真正做产品的。 c u 九五零肯定是一个标杆性的产品,因为它整个来说在计算能力这块上面,其实已经能够跟国际上的这些通用的产品基本上能够对齐了。 那我们在做九五零的时候,其实也花了好久的时间一直在探索这个 t 一 结构啊。那我们其实在做的过程中有几个点,嗯,是比较重要的一个呢?就是说它微架构还是要持续的往上往上调啊,比如说它发射宽度还是要往上走,但是你发射宽度 宽了之后,必然带来的一个挑战,就是说你的工号,你的成本其实还是要控制相对比较好,才能够让这个产品能够真正的发不出来,所以微架构的创新其实是非常重要的。第二个其实还是要做软件啊,软硬件的协助创新, 在这个里面其实我们也做了啊,不管从变易器啊还是底层的那些库,都是在不断的跟我们的硬件打磨的,那这也是 vive 的 非常重要的一个给整个行业带来的一个机会啊,因为你通过软硬件的磨合,其实可以发挥出相比于纯硬件或者纯软件去做更好的一个 一个机会。 c 九五零里面除了这个通用性能之外,其实我们加了好多可扩展的东西,我们自己做了好多有意思的扩展,比如说我们对安全啊,我们已经把它加进去了,我们对这个矩阵 啊,很好的这个做了加速。还有一些呢,面向于我们一些业务场景,比如说云计算业务场景,其实我们也做了一些 软硬件系统的加速,那这些东西就是我们用瑞萨架构就可以做了啊,如果我们用个传统的架构啊,那我们其实就相当于给你的就是一个固定的一个一个模块啊,那这里面是个黑盒你也做不了啊,所以九五零里面的好多需求是非常有意思的, 所以芯片的架构主权建立在性能对等的基础上,只有你在性能上和别人平起平坐,你才有不被卡的底气。 ai 时代到底谁是主角?谁是配角?我是主角,浓眉大眼的老黄说,主角必然是我。之前啊,他把 gpu 推到风口,但今年的 gtc 话风一转,把自家的 cpu 推到了台前, 甚至说在 ai 一 阵的时代, cpu 会帮绿厂带来数十亿美元的收入,那原因到底是什么呢?孟博说, cpu 已经成了 ai 智能体时代的算力瓶颈,所以呢,需要更强大的 cpu, 这个尤其是最近大火的大家看到的龙虾,对吧?大家也把它称为新的这个 ai 时代的一个操作系统,或者啊新的一个底座,那实际上它就是在编排各种各样的任务。那么在编排这个任务的时候啊,这个大家都发现,其实 ai 处理能力很强,但是编排任务 它很慢,就是传统 cpu 现在也面临了一个挑战,说在编排这些任务的时候,是不是能够把 gpu 等待时间把它变短啊?不是说啊,这个 gpu 很 快,我 cpu 这边很慢,整个系统的效率就比较低了。 所以现在来说的话,大家都希望说面向于 agi 的 这些 c p u, 它也要面向于这个啊,新的把这种编排任务去优化,去做这个新的啊,这个架构的创新,所以 c p u 谈不了啊,因为我觉得 啊,这个世界来讲的话,从计算的范式来讲的话,肯定是通用计算加加速计算,通用计算是一个底座啊,加速计算就可以把这个面向应用做得更好。 说白了,大模型正在从回答问题走向替你做事,它不只是 to token, 它还要调 api, 要查数据库,要解释代码,要调度工具,要编排工作流,还要跨多个步骤迭代执行。 而这些呢,都不是 gpu 所擅长的,只有 cpu 才能做。但是现在 cpu 和 cpu 的 性能差距太大,那根据研究数据,在智能体的工作载里, cpu 处理工具调用这些任务的延迟占比高达百分之九十点六。 所以啊,玄铁走的路叫通推一体,也就是把通用计算和推理加速结合起来,这样既能保证 cpu 的 灵活性,又能提升 ai 的 性能实现既要又要。 我觉得推理本身来讲的话就是一种加速计算,我希望用推理这件事情去引领整个路由 life 啊,让它往更多的扩展的角度去做。 所以我们在 cpu 里面的话,会给他加上一部分的啊, ai 的 一个算力,那这部分的算力其实它就可以去作为我们整个计算系统啊, cpu 加 gpu 的 啊,这个过程中有一部分算力就在 cpu 上运行掉了,这样呢,就就不需要再 数据拷贝,任务迁移这个上面跟 gpu 来回的交换,它整体的效率就会比较高啊。当然在一很有些场景下面,其实它也可以独立于 c gpu, 它就可以单独就一颗芯片就可以运行了啊,所以通推一体的概念,其实就是想把推理的啊,部分功能放到 cpu 里面去 啊,也也有很多场景,它的模型呃,不是非常大啊,那它其实很多时候就在 cpu 上运行的效率远比 cpu 这样加个 cpu 要高得多。 根据达木院给出的数据, c 九五零搭载了达木院自研的矩阵加速引擎之后,已经跑通了千万三最强开源模型和 deepsea v 三满血版,输出速度分别达到了三十四陀刻每秒和十八陀刻每秒,那首陀刻延迟分别是三点四秒和 一点七秒。这就意味着 race five 在 ai 领域不再只是打杂的了,而是可以作为整个生产链条的一环。再进一步,旧时代叉八六和 arm 已经把很多地盘给坐实了,而 ai 时代还在快速变化,很多规则还没写死,这就是后来者最有机会的时候。 所以架构主权是适应变化的自由,那从架构到芯片到模型,再到应用,这就是 ai 为中国科技的发展带来的大机会。 刚才我们说到 am 的 授权协议非常严格,你买的就是一个黑盒,不能修改里面的任何一行代码,它就是一个精密但是无法拆解的劳力士。看看时间还可以啊,但是改里面的齿轮绝对不可能。 相比之下, race five 可以 做指令级扩展,就像乐高一样,可以随意的组装。那前面说的这些 ai 加速引擎的扩展啊,就是很好的例子。 在 ai 推理的过程中, race five 其实有两件事情一直在做,那 c 九五零现在也在不断地去尝试做啊。一个呢,在于是说如何把 resign r v v 就 vector 这个能够做得更宽啊,整个在 ai 的 这个处理过程中啊,能够变得更加高效啊,所以我们这一次呢增加了一个 vector 的 这个引擎 啊,那这个引擎呢?其实它的宽度可以做得很宽啊,可以做到四零九六啊。那么矩阵这一块来讲的话啊,也是这次呃九五零的一个一个亮点,所以我们准备就是说在矩阵这个上面, 哎,现在能够耽搁和我们其实已经可以做到了八 t 这个算力,所以实际上能够把这个计算能力进一步往上提升。为了让人们更方便的修改和定制, w m 这次推出了名叫 flex 的 软件平台,它提供了完整的处理器建模、开发环境和工具链,能让海尔、中国电信这些厂商快速定制出适合自己业务和应用的芯片。 它其实,呃也是说要在我们的选体的基础之上你再去做些定制化啊,也不是说完全推倒重来 啊,因为推导从来带来的是巨大的验证的工作量啊,您做验证就非常清楚,原来很多时候大家只开放了指令这一块,你可以定制, 现在你把存储啊,把这一些外围这一段都开放了之后,用户的整个定制的灵活性就非常高了,所以他在我们这个平台的基础之上去做定制就会相对比较容易。为什么不能?就只说,比如说我们配置一个 ip, 对, 然后我们让他有一些参数的变化就可以了,为什么还让他从这个架构的角度,微架构的角度做的定制? 这个其实就是跟刚才 rap 怎么样能够跟别人竞争走出来的这个逻辑有关系,如果通过配置,那基本上还是说 啊,就是一种传统思路啊,说我做芯片这个人,我把所有的事预制菜都做好了,然后你们来做,但实际上今天我觉得我们还是应该是让我们的应用的这些人能够现炒,能够把这个菜根据应用直接炒出来。 哎,以前是架构定义应用,你得适应 cpu 的 规则,那现在呢?是应用反向定义架构,尤其是在 a i a 阵的时代,每个公司都有自己的模型、形态、工具链、组合、场景约束,那别人家的最优解未必是你的最优解,所以芯片的架构主权是定义的,自 就是当你真的知道自己的应用需要什么的时候,你有能力在芯片最底层打补丁。这就是从租客到房东的区别,租客可以软装,房东可以改户型,而玄铁想要做的就是让更多中国企业第一次拥有改户型的权利。 那它有没有缺点呢? 一个芯片架构如果每个人都能随便用随便改,会不会造出来成千上万种 cpu, 让上层软件互相不兼容,语言不通呢?这个就是很多人质疑 race five 的 碎片化问题,那从我和孟婆对话中我能感受到啊,碎片化确实存在,但并非解决不了,关键就是不要让大家从头造轮子了。 reesiv 的 话,确实大家最担心的就是碎片化的问题,因为碎片化它就没有办法形成一个生态痕,所以对上层的软件是非常痛苦的啊。那今天我觉得如果说我们 resiv 是 沿着所有人都从零开始做, 那我觉得这个碎片化的是存在的啊,因为你对整个标准的理解有一个深入的一个过程啊,这个体系理解有过程。所以我们现在是说普通的这种 resiv, 你可以授权一个核啊,或者说你可以用一个已经被大家所认可的一些开源的核,你来做, 你要做的是什么?你要做的更多的是在这个核上面的那部分本身就是你自己掌控的,那可能是百分之二十的工作量,产生百分之八十价值的那部分东西。所以你刚才提到的我们这一次发的这个 flex, 其实就这样一个模式, 说白了就是底层的兼容性问题,你不用关心底层兼容性的事情,这个由玄铁这帮人去帮你搞定,你要做的事更多的是差异化那部分东西,把它做好。所以这个其实是我们今天在解决这个啊,碎片化和我们真正能够统一到一个生态里面的一个 啊,一对辩论的矛盾的啊,一个问题,为了打通芯片的设计、制造软件适配的全链路,他们还搞了一个无间联盟。墨墨认为生态的难点不再是基础软件,而是如何让下游应用感知到价值,这就是为什么他们要去支持 wps, 支持钉钉,甚至让 race five 笔记本给跑起来。 其实我们首先来讲的话,必须要具备一种基础能力,如果基础能力没有,就没有入场券,但是你入了个场之后,你在牌桌上依然要表现出非常强的竞争力,这个就是针对沃克罗的这种 这种的,所以我去说服这些应用厂商的时候,往往会说我们的应用场景下面是不是我们可以做的更好啊?能不能说有一些更好的定制化的,不管是架构也好,微架构这方面的机会能够帮助整个产品在竞争力上更强,所以 真正产品要落地,还是要在他的场景下面能够做出竞争力来。 回顾这七年,从二零一九年 c 九幺零发布时的没人相信,到二零二六年 c 九五零的地表最强, 达摩院做了十四款处理器,进入了两百五十多款量产芯片,总出货量超过了四十五亿颗。所以回到视频最开始的那个问题,达摩院为什么要做这件事? 我觉得他们图的啊,不只是做一颗更强的 cpu, 也不只是一条更完整的产品线,他们图的是一件更难,但是也更重要的是,让中国芯片第一次有机会在架构这一层,不只是使用别人定义的规则,而是参与定义规则,这才是架构主权真正的含义。 主权不是封闭主权,不是口号,而是在你需要的时候,既有平起平坐的性能,也有修改底层的自由,还有一个繁荣的生态去承接你的各 种想象。就像孟博说的,我们不应该以补位架构的眼光去看待它,它不是叉八六或 arm 的 备胎,它是为了满足今天那些全新未被满足的需求而生的未来架构啊,每一个架构都长在自己的时代下面, 那原来的不管叉八六还是 arm, 它也有自己的时代背景,它其实也做的是非常不错的啊。那他们今天服务于整个全人类的这些应用里面,他们也服务的非常好啊,所以说 reishi 应该走在 哎,今天一些全新的啊,或者说过去技术没有真正很好满足需求的这些地方率先去走出来,所以他们不是一个此消彼长的关系, 我觉得他们会长期共存,但是大家也相互之间也都在不断的借鉴和创新啊,然后在这个里面真正通过我们的技创新和我们的产品真正落地啊。能够真正走出来, race five 的 开源不是因为免费,而是因为自由。如果说过去几十年,全球芯片产业的底层地基主要是由少数几种专有架构铺出来的,那么接下来十年, race five 很 可能就会成为那个让更多国家、更多企业、更多创新者第一次有机会自己参与打地基的工具。 对于中国芯片来说,这不是一条容易的路,它只能靠一代一代标杆产品硬打出来。而从 c 九幺零到 c 九五零,我们至少已经看到有人真的在这样做了。好了,以上就是本期视频的全部内容,有用请点赞,喜欢请关注,我是芯片工程师老师,我们下期视频再见!

我是阿里巴巴集团的工程师,来自于天猫精灵事业部,我每天上班主要工作就是听音乐, 我之前就是做音箱,这个主要就是电子设计方面,然后我们刚好以前的公司是有金耳朵的一个培训计划 啊,现在带大家来看一下我们的升学实验室,我们先看一下啊,我们的萧生室。金耳朵是大家的一个俗称, 金耳朵正常来说是经过一定的培训,对音箱有一定的鉴赏能力,对声音质量的评判。金耳朵它其实分两种,一种叫艺术型的金耳朵,这个类似明星演唱这些过程中,他们对于声音的一些理解,我们是技术 步行了,从一个音频链路架构开发到整个音响怎么设计出来,到最后完美的音质体现出来,做的调试是整一个练录的过程。 这是我们用的一个吸音材料,这种三角锥的它里面填充了很多吸音棉,从而得到一个低底噪、低反射声标准的测试环境。比如说这是我们的一个标准麦克风摆位啊,我们要对准我们的出音面 啊,主要是把音箱放在这里,然后去做一个基准, 我们分客观测试指标和主观听感指标,那我们作为技术型的金额度可可能可以区分到零点五 db 的差异。然后主观部分的话,我们会又分很多细节,比如说你低音的下潜啊啊,低音的厚实度啊,还有就是中频人声的清晰度啊,还有高频的这种颜 真性啊,带来的效果,还会有一些心理声学的感受,对于音乐的理解,其实这部分啊,目前是机器是很难去替代,就是我们每时每刻其实都在欣赏着音乐,基本上工作时间不是听音乐,就是在调试过程中调试完再听,听完再调试, 还真没有这么羡慕过,我们要经过长时间的一些培训还有验证,其实这是一个很痛苦的过程,他们会觉得你们非常故障,好恐怖, 天,可能就是你脑袋瓜里面就那么几首音乐,在不断的训练你自己,深刻的映入你的心中,还有脑海会有一份考卷,类似于中考高考一样,他们是用文字,我们是用耳朵去解决这些问题, 去确定我们的评分。我们现在来看一下我们的混响式,或者也可以叫他是一个听音式, 我们正常就是会在这个环境下去做啊,声音的主观的一些评测,还有声音基于茴香石类似这种模拟家庭的,带有一定的反射的效果的这个测试提升我们的音质,标准的音乐就是市场上大家都能看到像蔡琴的渡口啊,加州旅馆之类的, 我们现在也会跟着时尚的潮流去用一些排名比较靠前的一些音乐,低频的话,渡口前面的十秒之前的啊,中频这部分主要还是以人声为主,那高频就是家族旅馆里面有些敲锣的这些声音啊, 而我们平时的话会对自己耳朵会做一些啊,各个保护,会很少用这种木耳式耳机,让自己的听觉不要有一定的下降,下一步我我的想法是希望就是说在人工智能这几个范畴啊,在深入的去 提升文字转语音的这个能力啊,我们整个团队其实都是金耳朵,我们的职业病可能比较简单啊,就是一听起来,哎,这个音乐貌似可以拿来做我们评估的一部分, 比如说我们走在商场上看到一些音箱,我们也会很有兴趣进去听一下,然后心里在低估的给别人评价出来之后,就发现我们的还是很不错的。

阿里巴巴全球数学竞赛金奖获得者最近,阿里巴巴全球数学竞赛初赛开始了,同学们参加了吗?老僧听说往年只有百分之一的同学可以进入决赛,而其中年龄最小的只有十三岁。题目难度到底如何?老僧找来了今年的试卷。 今年大赛共设置了八道题,从低题的雌性几何魔方到最后一题,在冬奥开幕式上布置无人机,只要耐心阅读,就会发现还是一如既往的有趣和生活化。哈哈哈,为了更直观的感受,老僧挑了一道在阅读理解上最容易上手的单选题,和同学们一起做一做。 题目是这样的,话说在春节期间,牛奶公司推出了一个新年吉福活动,每盒牛奶附送一张卡片,分别是虎生威。 只要能集齐虎虎生威四张卡,就可以瓜分红包啊!这个活动很常见吗?不就是嗯抽盲盒吗?那么理论上要买多少瓶牛奶才能集齐呢?仔细读题,要求的是数学期望。 什么是数学期望?他是概率论和统计学中的一个基本概念,粗钱点说就是平均值。对应题目来看,及其虎虎生威全家福,本质上就是一个不断集卡的过程,而数学期望就是平均需要集多少次才能够集齐? 平均?怎么理解?老僧举个例子,比如胖虎喜欢在睡觉前打游戏,并发誓再赢一把就睡觉,可胖虎的胜率只有百分之十,有时可能第一把就赢了,有时可能一直输到天亮。这是一个随机输,但统计来看,平均就是十把,那么十就是胖虎赢游戏的 数学期望。在这个简单案例中,胖虎赢比赛的局数满足几何分布,因此通过一个简单推倒,就可以将数学期望这个陌生的概念和非常熟悉的初衷、知识点、概率连接在一起。 a 是一个重复实验的随机时间, ta 是世界 a 首次发生的等待时间, 当 ta 满足几何分布时,他的期望满足一等于 pa 分之一,其中 pa 就是概率。因此在本题中所涉及的所有数学期望都可以认为等于概率的倒数。 理解了这一点,就很好计算了。现在再把题干中的概率信息加上虎生威三款红包,按均匀概率三分之一分布。老僧简化下问题,如果先凑齐虎生威三种不同的卡片,数学期望是多少呢?刚刚提到 几卡问题,本质上都可以想成不断得到有效的新卡的过程,因此与三张卡片对应,可以将整个抽卡过程粗略的分为三轮,每一轮都是为了抽出一张新的有效卡。第一轮 无论哪张都是有效的,概率为百分之百,相应的数学期望是一次。第二轮只剩下两种卡片是有效的,概率是三分之二,数学期望就是二分之三次。第三轮只有唯一没有被抽到过的卡片有效,所以数学期望是三次。 那么集齐三张卡,总体的数学期望就是三轮次数的总和,五点五次。这个简单模型就是概率论里的著名问题 couple character problem, 他的便是在游戏抽卡、开盲盒等行驶中都有应用,还有个小彩蛋。这道题目是今年阿里数赛首次 面向全球争题的入选题目,出题人顾陈琳老师的灵感正是源自小时候收集干脆面中的水浒英雄卡。还记得小时候集卡的经历吗?本质上也是这道题。集齐一百零八张水浒卡,梅轮抽到有效卡的概率一次是一亿到一百零八分之一, 数学期望就是倒数。如果抽象成公式,倒数排列后再提取 n, 就可以得到一个简洁的方程这一部分。记住 hn, 他的值约等于乱 n 加伽马 带入公式,就可以轻松算出一百零八张卡的数学期望确实是个大工程,但我们实际上感受到的难度可能会更大。为什么呢?一方面与运气有关,和概率一样,数学期望只是理论值,实际情况却各有各的不同。另一方面,电视在标准的 collector problem 中,只要稍微加一点点变势,情况就会变得极其复杂。比如 ssr 超级稀有卡,就是把某种卡片的投放比例调到很小。还有小朋友们的社交硬通货奥特曼卡,通过不断出新卡的方式,让 n 值不断上升,数学期望也随之增加。 此外,还有一种辨识,也就是题目中出现的情况重复。刚刚老僧只讨论了几起虎生威三张卡的情况, 而题目中瓜分红包的条件是要集齐虎,虎升为四张卡,其中虎需要两张便是。以后又要怎么计算呢?复杂情况不要怕,一招穷局走天下,下一个得分点分类讨论 在这里,部分同学可能会发现,如果用代码跑蒙特卡洛算法,其实很快就可以算出答案,选 over。 当然这样也行。根据老僧了解,低温的难度定位是高中生,咱们还是接着算一算。大致思路还是和之前一样,想要集齐四张卡,可以分成四轮来看,每一轮负责收集到一张新的有效卡,但不同的是,其中虎需要抽到两次。 具体来看,第一轮还是无论哪张都是有效的,数学期望记作一。但不同的出示牌会影响到后续情况,因此还需要分类讨论。如果运气好直接抽到了虎,那么往后的数学期望就是之前算过的基础模型,五点五次。这里用到动态规划的思路, 之前算过的问题输就不再重复了。接下来如果抽到生,火危情况就不同了。以生为例,现在进入第二轮抽卡,在第二轮中还有三种情况,每种情况的概率均为三分 之一。如果抽到虎,这一轮也是一次有效,数学期望记作一。接下来的两轮还是老面孔,二分之三次和三次,如果抽到威,也是一次有效。不过在后两轮中,就只剩下虎这一种有效卡了,数学期望均为三。 到这里都很简单,比较复杂的情况是,如果又抽到生怎么办?这时他相当于回到了原点,返回第一轮,重新开始循环。在这里还无法计算生的数学期望, 巧的是,可以在循环中发现一个等式两个声。无论是在哪一轮,他们本身的数学期望应该是相等的,都可以记做 x。 那么第一轮的 x 就等于三分之一。抽到生虎后的期望加三分之一,抽到生威后的期望加上三分之一 x, 再加上第二轮的一次,通过这个减 单的方程就可以解得 x 等于四分之二十七,到这里最难的部分就结束了,现在让我们把上述所有情况及每一轮抽到有效卡的数学期望都填进表格,是不是非常清晰? 将所有情况加权平均,就可以得到整个事件集齐虎虎生威全家福的数学期望选 b, 同学们答对了吗? 算完这一题,相信同学们面对大多数市面上的盲盒问题及卡问题都会算了。如果调整卡片的投放比例,数学期望会不会更小呢?凭直觉,最佳投放比例会是二分之一、四分之一、四分之一吗? 不卖罐子?当然不是!这就是本题的第二问,在这里老僧提供三种结法,感兴趣的同学可以参考看看。 从张师傅拉面圈到集卡抽盲盒数学大赛,和同学们一起发现生活中有趣的数学瞬间,也在每年期待着一场全球数学爱好者的神仙打架。或许数学理论很抽象,但每个人却都能真实的感受到数学的魅力。 我是老森,一个隐居达摩院的清洁工。决赛再见!

阿里最神秘机构达摩院成立三年都干了啥?很多人知道马老师曾经说过,阿里巴巴要做成一百零二年的百年老店,但你可能不知道,马老师还说过,希望一家科研机构要比阿里巴巴活的长,这家科研机构就是达摩院。 达摩院成立于二零一七年,主攻基础科学和创新性技术两方面,研究愿景是用科技来解决社会问题。近两年热度很高的平头哥就是达摩院徽厦的独立注册公司。在武侠小说中,达摩院是武学圣地 一项,痴迷武侠的马老师便给研究院定下了这个名字。如今三年多的时间过去了,达摩院经济内功修炼出了十八项科技绝学,我们来一睹为快。 此处艾特风清扬,不知达摩院这三年来十八招科技绝学有没有不如使命达成您的期待。

这是一场由机器人操刀的胃癌手术,在距离手术台几米之外,医生正在隔空操控这台价值两千万的手术机器人在北京大学肿瘤医院内蒙古医院,我们全程实拍了这场科幻的手术,但更重要的是,我们想知道胃癌到底该怎么治,到底可不可怕? 切不是目的,治好才是目的。嗯, 胃癌大家都不陌生,全球胃癌新发病例一半都在中国,很多人一听到胃癌就十分害怕,害怕手术要在腹部开一个大口子。有没有不那么恐怖的胃癌手术方式呢? 答案是有的。这次我联合阿里达莫院扫地森,在北京大学肿瘤医院内蒙古医院的帮助下,找到了一位愿意接受拍摄的胃癌患者。这位患者的胃癌长在胃窦附近,大概两公分。说实话,可能和大家想象中不一样, 胃癌它不是球状,也没有明确清晰的边缘,而更像是一块被开水烫伤表面的溃疡。 这次的手术方案是切除胃癌及周围的胃组织,大约占到全胃的三分之二,再把十二指肠接到剩下的胃上,这个过程叫做消化道重建。 这样的手术在以前要在腹部开一个二十五公分的切口,但这次使用手术,机器人仅仅需要开五个小孔,这不仅大大减轻了患者的痛苦,也大幅缩短了患者的康复时间。 达芬奇手术,我认为它最大的好处就是解剖更加的精准。再一个,它延伸了外科大夫的这种 手的这种灵活,灵活性可以在这种很灵巧的机械臂的帮助下,完成一些高难度的一些动作,一些特殊角度的一些吻合的这样一些动作,所以话他可能让手术可能在某种程度上 变得更加的精细和简单。就像这样,机械臂进入后,开始一点一点的把胃从周围的组织出来,这些密密麻麻的就是淋巴组织,他们需要被彻底清除,因为里面可能藏着转移的癌细胞, 这是本次手术十分重要的步骤,如果清除不彻底,就会极大增加复发的风险。胃癌的手术,实际上他应该算一个有一定技术难度的手术,因为他实际上对于这种淋巴结的清扫, 特别在这种全腔镜或者机器人下去完成这种手术重建,但是让他还是有一定的学习曲线的。紧接着就是把胃切开, 再把十二指肠和剩下的胃缝合,重建消化道,最后把切除的胃组织和淋巴取出,缝合伤口。到这里手术就结束了。大家听我这样子讲好像并不复杂,但事实上医生完成全部操作以后,时间已经过去了五个小时, 可见即便有了先进设备,胃癌手术的难度依然不能用简单来形容。我这里正好在强调一下定期做胃镜检查的重要性,尤其是体检发现幽门螺杆菌阳性的人,因为早期和晚期胃癌的记忆力是完全不同的,这一点我们可以对比我们的邻居日韩, 从这张图我们就能看到,在发病率和治疗水平差不多的前提下,日韩因为筛查的普及,大大提高了早期的发现率,也让胃癌的整体生存率显著提升。说回胃癌治疗本身,很多人会问,是不是所有胃癌患者都要手术,除了手术还有什么治疗方法吗? 首先可以肯定,随着越来越多新药的出现,手术已经不是唯一,甚至不是必需。关于这方面,我们采访了国内知名的消化道肿瘤内科专家张小田医生。 三十年前后,胃癌的治疗肯定是有了很大的一个进步,包括我们现在胃癌有呃 her two collin, 十八点二这样的靶点, 还有一些抗血管生成,还有免疫检查点抑制剂,它都会针对我们的 p、 d, l、 y 表达的这样的人群,结合我们刚刚又提到的 呃免疫治疗当中的细胞治疗,也就是铅核受体改造的抗克拉定十八点二的 t 细胞治疗,那它输入到体人体之内呢?它就会去针对性地杀伤表达克拉定十八点二的肿瘤细胞。 刚才听小田院长说了那么多专业词汇,屏幕前的你可能一头雾水, heart、 two claudine、 十八点二,这些都是我们俗称的靶向药,它们的特点是一旦基因检测显示患者是因为特定的基因突变导致的胃癌, 那么使用定向的靶向药就能使肿瘤熄火,停止生长。抗血管生成药物则是切断给肿瘤供应养分的血管,抑制它的生长,从而饿死肿瘤。 而免疫检查点抑制剂则是让体内的免疫细胞重新识别并攻击癌细胞,相当于让肿瘤再次现身。最后提到的细胞治疗,俗称 car t 细胞疗法, 目前这项技术在我国正在快速的发展,已经悄悄走到了世界前沿。比如去年发表在柳叶刀的论文,是全球首个实现 car t 细胞治疗的随机对照实验, 就来自美种的团队,结果显示,这项新疗法把难治胃癌的进展风险降低了百分之六十四。参加研究的一部分晚期患者获得了长期生存。 我们有一个患者,实际上在整个治疗的过程当中,呃,接受过两次卡替细胞治疗,嗯,接受过两次手术,在过程当中还发生了卵巢转移。这个患者的末次接受卡替治疗,嗯,所以至今为止没有接受任何治疗。 除了药物越来越多,胃癌治疗的另一大发展就是精准,从影像学到病理学到外科放射治疗,营养支持、心理支持、院外康复、水仿等等等等。每个人都不一样,要达到个性化的治疗,假定都是一期的患者术后,那么一个年轻女性的一期术后, 然后长在胃体的一个病变,和我们一个老年男性长在胃窦的一个病变。即便都是一期,他们都不需要做术后的药物治疗。我对他们未来的这个五年的关注和随访也是会不一样的。 您现在可以比较自信的说,咱们肥总也好,咱们这个团队,嗯,在世界上其实从胃癌的综合治疗来说都是 比较领先的了吗?我觉得还是可以很自信的说。领先地位我觉得是,呃,可以不需要再委婉的表达。哈哈哈,对,因为每年我们能看到像美国的 esco, 对 吧?欧洲的伊斯兰 这些会议上都有咱们的所谓中国好声音。我们其实做了非常多的从临床实际问题出发的去改变一些临床实践治疗策略的临床研究, 通过营养和心理干预,嗯,然后改善胃癌、食管癌患者的晚期的生存。那么这个其实没有新药的加入, 嗯,只是我们的临床实践的治疗策略的改变。像我们今年把这个 p d l one 筛选人群,通过 p d l one 这个标志物的表达来筛选人群的理念,嗯,从晚期也要潜移到新辅助的术前,嗯,我们也第一次探索了手术后不做化疗, 手术后不做化疗,对通过我术前筛选的人群,我对这一部分人群有信心。之后,嗯,我手术后呢,只用免疫治疗, 或者只用 pd one 单抗。这样的一个理念,其实对于大多数的胃癌患者,可能在以前是敢是不敢想的,对啊,可能不做化疗很担心复发,对,做化疗,那就觉得天天受罪。嗯,从整个胃癌这二十年 来去对比的话,我们整个胃癌的这个生存率是提升了二十个百分点。手术机器人,各种精准的放疗,靶向免疫药物层出不穷,让曾经可怕的胃癌变得有了希望。 有些原本无法手术的转移胃癌患者,通过药物治疗,让肿瘤缩小,又获得了手术的机会。有的患者手术前和术后都加入了药物治疗,通过这种像三明治一样的治疗方法,让肿瘤得到了更好的控制。还有一部分患者不用手术,仅通过药物治疗就实现了临床治愈。 越来越多的成功案例显示,通过早发现、早干预、科学治疗,多数患者都能获得长期的生存,回归正常生活。我想对大家说,不要怕,这也只是一个疾病,而且我们会在一起,永远在一起。 以上就是本期视频的全部内容,我们将在今后继续跟踪抗癌领域的最新进展,也欢迎大家在评论区分享关于癌症的故事,我们下期再见。 我觉得北种做内蒙研究最大的意义就是让内蒙的当地患者能够以最低的成本去接受到全中国甚至全世界最顶尖的这些肿瘤的资源,不仅省了路费,还有很多的远程的差旅,包括住宿,对吧?包括这种 异地的焦虑。因为北种是全世界应该是胃癌的临床研究最大的基地,它其实能让很多非常前沿的药物, 不管是完全没有上市的新的靶点的药物,还是说有国外的上市,我们中国也在跟进的。这些药物能够带给内蒙的患者,包括我们中国很多的这些中心,在欠发达地区开的这些联合的医院都能起到这个作用。

google 昨天发布了 gmail 三 flash 官方直接放了一个炸裂的 use case, 你 录了一段音频去讲一个概念, ai 呢,会识别你的知识盲区,然后生成定制的一个 quizz 来考你 每道题呢,还会给你一个详细解释,我立刻去实测一遍。所以呢,我将用三分钟带你去看我是怎么背 ai 啊,去教做人的。 这功能呢,基于的就是费曼学习法,流程就三步,第一步我们去用录音去讲概念。第二步呢,就是 ai 去诊断盲区,精准去找出你哪里是没有去讲清楚。 第三步就是定制 quiz 去答题,针对你的一个拨落点去出题。 ok, 那 现在我就用一个第一性原理,这个被撩烂的一个概念来进行一个实战。现在呢,我就打开我的一个手机的语音录音助手,然后按下录音, 我开始去讲啊,第一性原理就是马斯克常说的思维方式,不要用类比,要回归基础,用最基础的一个真理出发。 ok, 好, 录完了,我感觉呢,自己也讲的挺流畅的。然后马斯克的案例啊,也说的比较清楚, 但真的是懂了吗?我就让 ai 去给我去判断一下。 ok, 那 我就把我手机里面的录音去上传电脑,然后这样从电脑上上传到 jimmy, 等几秒, ai 的 一个诊断就出来了。首先 ai 给我的一个盲区依旧是逻辑跳跃,我漏掉了一个最核心的一步, 你看, ai 说的是你的描述是原材料很便宜,所以自己造,所以成功了。你把发现原材料便宜,直接等同于能够去做出便宜的一个火箭,中间其实漏掉了一个最痛苦最核心的一步叫做重构。 我看这个心里想,我靠,好像确实啊,我只说了他决定自己去造,但没有去说怎么造。你看,知道面粉便宜呢,并不代表你能够去做出米其林餐厅的那个面包。 ok, 我 们看, ai 区给我指出的第二个盲区,叫做概念源头缺失。马斯克呢,他不是一个发明者。 ai 说呢,第一性原理最早的是源于在古希腊哲学家亚里斯多德,后来被物理学家广泛去使用, 如果不去理解它物理学上的一个必然性这一层含义,你很容易把它理解为仅仅是一个省钱秘籍。 这里呢,我人也少了,我一直以为这是马斯克发明的一个思维方式,原来呢,他也只是一个步道者。 ok, ai 给我指出来的第三个盲区就是对类比思维的误解,我把它给妖魔化了。你看 ai 说的, 你说不要类比,但人类百分之九十五的时间都在去类比,因为审脑子效率高低性原理呢,是一种高耗能反人性的一个思考方式,你需要明白什么时候该去用,什么时候呢不该去用。 这个确确实实扎心了,我根本就没有去想过类比思维,其实大部分时间呢,都是对的,只是在某些场景上不适用。 所以你看,我以为啊,我自己讲的挺好的,但 ai 一 分析呢,全是漏洞。这个就是菲曼学习法的一个威力,逼着你去讲出来,才能够真正暴露你的一个伪知识。接下来我让 ai 针对我的盲区啊,也自动生成了五道测验题,包含了从概念理解到实际应用到思维陷阱的一个全方位考场。 你看, ai 给我出了五道题啊, spacex 火箭的拆解步骤,类比思维和低信原理的本质区别,外卖配送模式创新的底层思考,特斯拉生产线的教训和局限,以及职业转型中的能力重构方法。 这题目呢,可不是随机的,而是 ai 根据我前面的学习内容精准去生成的,既检验了我是不是真的去懂这核心逻辑,又测试我到底能不能灵活的应用到新的场景。你看,实验结果也出来了,五题五个正确啊,准确率是百分之百。 ai 呢,也立即生成了个性化的学习报告,包含了强项和落项分析,它能让我去查看、总结,了解我已经熟悉掌握和有待加强的内容。 以及呢,继续学习。工具自动生成抽论卡。这种呢,适合快速的复习和掌握重要概念和学习指南。这种呢,适合深入学习。而且 ai 之后也说,你已经从背诵例子进化到了一个理解逻辑。 所以你看到没,五分钟前我只会去讲马斯克的故事。现在呢,我不仅知道什么时候该用,怎么去用,为什么能用,还通过 ai 生成的测试啊,验证了我自己真的是学会了,这就是飞马学习法加觉美达的一个威力。最后呢,你还能让他去生成一个可式化的信息图,让你更容易更轻松搞懂定性原理。 所以说,为什么这是学习神器呢?你看,传统学习呢,就是看文章,记案例,感觉懂了,实际上也只是去记住了故事。 管你去用 gmail 三 flash 啊,你录音去讲一遍, ai 精准的去找出你的逻辑漏洞,概念误解、认知盲区,然后定制 quiz, 让你真正的去理解底层逻辑。全程呢,也就三分钟而已,你的学习闭环就完完整整的完成了。 所以你看,利用好一手信息源,掌握好最新的 ai 工具和玩法,学习东西能够让你去事半功倍。 最后也希望大家点赞收藏关注一下江学长,也欢迎呢加入江学长 ai 学习圈,我将持续为大家带来一手的 ai 工具使用技巧和心得,以及一手 ai 信息员。 ok, 我 们下期再见!

ai 真的 开始帮助人类延长寿命了?近期,一则来自宁波的医疗新闻刷爆了医学界,也给无数人带来了生的希望。 宁波一位五十七岁的患者因为糖尿病前往医院检查,腹部 ct 平扫影像显示未见异常,连经验丰富的医生都没能察觉异样。可是医院的 ai 辅助诊断却精准地发出警报,标记出胰腺上一处极小的疑似病变。 后续进一步检查,确诊为急早期胰腺癌患者,及时接受手术,彻底切除病灶,成功实现了临床治愈。而这正是我们今天要聊的核心, ai 协助急早期诊断,真的开始帮助人类延长寿命了! 这项由阿里巴巴达摩院研发的达摩潘达胰腺癌 ai 早衰模型相关研究成果还发表在了国际顶级医学刊 natural medicine 上,用硬核实力打破了胰腺癌早衰的僵局。 很多人可能不理解,不过就是查出一个小肿瘤,至于这么轰动吗?作为肿瘤医生,我可以很负责的告诉大家,这绝对是里程碑式的突破。因为胰腺癌向来被称为癌中之王,凶险程度远超其他癌症。 胰腺长在腹腔最深处,被胃肠、肝脏等器官包裹,位置及其隐蔽,加上早期没有任何的典型症状,既不会肚子疼,也不会有黄胆, 患者根本不会有丝毫的察觉。而临床数据显示,超过百分之八十的胰腺癌患者确诊时就已经到了中晚期,癌细胞要么侵犯了周围的脏器,要么已经全身转移,即便是全力治疗五年生存率不足百分之五,几乎被宣判了死刑。 一直以来,我们医生都在攻克胰腺癌的早衰难题,可现实困难重重,常规平扫 ct 分 辨率有限,微小病灶极易漏诊, 增强 ct 费用高,需打造影剂,没法大规模普及。而人工月片不仅耗时耗力,人眼对于细微病变的识别也存在局限。就像宁波这位患者,如果没有 ai 预警,大概率会错过最佳治疗时机,等到症状出现的时候,一切都晚了。 那么,这次 ai 月片技术到底强在哪里呢?结合临床数据和论文成果看,它堪称火眼金睛。 首先是精准度拉满,能在普通 ct 上揪出九毫米以下的急灶器,微小病灶减出率高达百分之九十二点九, aoc 值达到零点九九六,比人类的平均灵敏度高出百分之三十四点一。 其次是高效又普惠,十秒就能完成一次 ct 月片效率是人工的六百倍,筛查成本仅为一百七十八元左右比例,传统方式降低了成本百分之八十,适合全民大规模的筛查。 更关键的是,它能够弥补医生的视觉短板,像宁波这位患者的漏诊隐患, ai 就 能够快速捕捉,结合医生诊断之后,病灶识别率还能再提高百分之二十点五,真正实现了一加一大于二的效果。 那截至目前,这套 ai 系统已经在宁波大学附属人民医院完成了十八万余例 ct 影像筛查,成功揪出二十四例胰腺癌患者,其中十四例都是急早期,这些患者都和宁波这位患者一样,通过手术获得了治愈的机会,彻底摆脱了癌王的威胁。 很多人觉得 ai 医疗是遥不可及的概念,可事实上,它已经走进了临床,实实在在地救人了。它不是要替代医生,而是成为医生的超级助手,填补人类的医疗短板,把那些藏在深处、急于漏诊的早期癌症揪出来,让早发现、早治疗不再是口号。

阿里巴巴最神秘的达摩院是干什么的?近日,协助医生识别 ct 影像,准确率达到百分之九十六的先进 ai 诊断技术,让阿里达摩院这个神秘组织进入大众视野。 阿里达摩院目前有四千多人,所有人都是各个领域的硬核科学家,院士王坚、计算机博士贾杨清等都在其中。达摩院总共分为机器智能、金融科技、数据计算、机器人和 x 实验室。

最近,一篇来自达摩院医疗 ai 团队的论文在 c v p 二零二三的近万篇论文中脱颖而出,被评为 highlight。 这一篇论文重点关注图像分割,聚焦于视觉领域著名的 o o d 难题。 ai 能够识别癌症的基础原理就是从 ct 等医学影像中分割出疑似病灶,结合已有数据来判断是否存在病变。但现有的图像分割方法多数基于监督学习,存在先天缺陷,严重依赖于数据的收集和标注。一旦遇到完全没见过的长尾问题,也就是欧定, ai 的识别准确度就会大幅下降。 od 问题在真实世界里层出不穷,医学影像领域的各种疑难杂症、罕见病都容易让 ai 犯错。如果想真正取得人类的信任,实现临床上的应用, ai 必须能够处理这些棘手的问题。达姆院 提出全新的医学图像语意分割框架,通过 mask transformers 的剧类特性来定为 o o d 目标,能够让 ai 更准确的识别肿瘤中的疑难罕见案例。团队还提出 curate distribution loose, 加强了剧类分配的多样性,提高 o o d 肿瘤的分割和识别的准确性。 为了验证新方法的准确性,研究团队构建了胰腺肿瘤全病种和肝脏肿瘤全病种两个医疗影像的数据库,连续对比了一千零八十八名患者的增强。 ct 影像 实验证明,新方法显著提高 o d。 定位能力,在最重要的 a u p r 指标上平均提升百分之十四点六九。在常见肿瘤分割性能上,新方法叫业界标杆 n n u net 提升了百分之五点二七。 新方法在胰腺和肝脏中的常见肿瘤和罕见肿瘤的识别上也更加准确。据介绍,这项技术有望被应用于临床上的癌症精准治疗,帮助到医生和病人。