就在刚刚,你敢相信二零二六年二月 ai 最大爆点 google gemini deep think 重大升级! ai 正式加速科学发现!二零二六年二月十二日, ai 领域迎来了一波重磅更新, google deep mind 和 google research 联合发布了 gemini deep think 的 最新升级版本。这一专为科学研究设计的推理模式,被誉为重新定义科学研究的未来,迅速成为全球 ai 社区的焦点。它不仅在多项精准测试中刷新记录,还展示了 ai 从辅助工具向独立研究伙伴的华丽转变,标志着 ai 正式进入深度思考 时代。 gemini deep sync 是 什么? gemini deep sync 是 google gemini 系列的专属推理模式,专为处理复杂、开放式的科学研究问题而优化。它不同于普通大模型的快速回答。 deep sync 采用代理式 agentic 工作流,能够迭代生成假设、验证思路、解锁文献,甚至自主修正错误。在人类专家指导下,它能跨数学、物理、计算机科学等领域开展专业级研究。这一模式源于二零二五年七月的 i m o 国际数学奥林匹克金牌版本, 经过多次迭代,到二零二六年一月已显著超越前代。最新升级直接面向 google ai outsource 订阅用户和 a p i 早期访问程序开放定价约两百五十美元每月,惊人突破 ai 独立解决开放性难题 本次升级的最大爆点在于 deep think 的 实际研究能力,它不再局限于竞赛题,而是真正触及前沿科学难题。数学领域搭载 l c r 数学研究代里, deepthink 在 i m o proofbench advance 基础上达到百分之九十,并在 future math basic 博士级练习上大幅进步,他自主生成了一篇关于算术几何中结构描述 i g weights 的 完整论文,与人类合作解决了粒子系统界线问题。更令人震惊的是,他独立解决了 blue math errors conjectures 中的四个开放问题,包括 errors 幺零五幺,并给出泛化证明。物理与计算机科学 deep think 跨领域连接知识解决了多个长期瓶颈,例如 使用无关数学工具解决了 maxcat 和 steiner 质疑问题,反驳了一个十年旧的在线子模优化猜想,证明了机器学习优化中的新技术。甚至利用拓扑和续理论将一个经济学拍卖定理论扩展到连续时术语。代理式推理创新引入 i proving 迭代循环平衡提示、避免确认偏见、代码辅助验证等技术。 ai 能像人类科学家一样承认失败,解锁文献、跨领域迁移思路,成为真正的智力倍增器。性能数据同样亮眼, archaggi 二百分之八十四点六大幅领先竞争对手 humanity s l s exam 无工具新标准 code for c s l 三四五五,推理质量更高, 同时推理时计算成本更低。为什么?这是二零二六年二月的最大爆点。在二零二六年开年, ai 圈本就期待密集更新传闻中的 g p t 五点三 cloud 新版等,但 gemini deep think 的 发布直接实锤了代理式 ai 的 落地价值,它证明 ai 已能自主推进人类前沿研究。从生成论文到反驳猜想,再到跨领域创新,这不仅仅是分数提升,更是 ai 从聊天机器人向科研伙伴的致变。 与此同时, ai 监管话题也在升温。 antropic 刚宣布捐赠两千万美元支持 ai 安全法规,推动二零二六选举前的民主问责监管。但相比监管讨论, think 的 科学突破更具正面冲击力,展现了 ai 的 巨大潜力。展望 ai 科研时代的开端, gemini deep think 的 升级,让我们看到二零二六年 ai 发展的核心趋势。代理式跨模态深度推理未来 ai 将不再只是回答问题,而是与人类病兼攻克癌症、气候变化、量子计算等世纪难题。 如果你是科研工作者或 ai 爱好者,强烈建议体验 deepthink gemini app 中选择 deepthink 模式。二零二六年的 ai 革命,以从能聊转向能干,而这只是开始。
粉丝83获赞444

十天筛出新冷却剂,四个月合成验证, ai 正把实验室变成虚拟博士后团队。一句话结论, ai 不是 要取代科学家,而是让每个新人一走进实验室,就像带着一只虚拟博士后团队。几百年来科学遵循观察、假设、实验修正的节奏, 现在 ai 正在改变这套节奏。从读遍全世界文献开始, ai 先把公开与专有数据里的关键证据串起来,帮助提出更有依据的假设。接着,成千上万的 ai agent 可以 并行跑数百万次虚拟仿真,把看似无关的化学材料、物理、生物数据连成图谱, 迅速筛掉大量不靠谱的路径。简单来说,它不只是让我们更快,而是让我们有机会换挡,去想从未想过的可能。以微软的 microsoft discovery 平台为例, 约翰林克团队把 ai agent 嵌入科学方法的每个环节,前期做知识整合与动线抽取,中期由 ai agent 选择合适的计算与实验工具, 自动化地跑。实验与仿真,全城人始终在还。更重要的是可追溯与透明,像科研论文一样,系统给出、引用与注视,实验与仿真都有日之可查,科学家随时介入复合、质疑与调餐,确保不是黑箱一把跑,而是看得见来龙去脉的邪作。跨学科更不是盲拼, 当 ai 把遗传学与气候数据拉进来时,仍需要领域专家共同验证,这样的人机共研才可靠。这套方法已经产出过硬结果, 魏瑞用自己的工具去解决数据中心冷却问题,传统冷却器里常含永久化学物,不环保。他们用 ai 在 不到十天的计算时间里锁定了一个全新分子后,不到四个月就合成,并在真机里测试,电脑整机静默后依然保持热特性稳定。要是按传统路径,没有 ai 这种材料,发现可能要几年。类似地,他们做电解质优化时候,选空间达到三千二百万个,先用云计算求解薛定厄方程等重型计算,再用模型推理把空间快速收敛,最终得到前所未见的数据及制。地球历史不值一推,是机制地,是地癌的心。不是凭空造概念,而是把人力不可能覆盖的规模,变为可计算与可验证的发现。 the promise of ai。 更值得期待的是创新的规模化。 ai 不 止把成果规模化,更把创新过程本身规模化。任何有好点子的研究者,都能调动复杂多样的工具链。反过来,如果迟迟不拥抱, 既耽误了全球难题的攻克节奏,也可能在竞争中被甩开。可靠的量子计算正加速落地阶段。二,机器将被投入实际使用。二零二六年被称为可靠计算之年,这会进一步打开化学与材料模拟的上限。 给我们的启示,第一,尽快把数据实验记录与知识资产化,打通与 ai agent 的 接口。第二, 把人机共研的验证机制前置设计,确保全过程可追溯。第三,敢于跨学科设问,让 ai 帮你搭桥,但用专家把关结论,如果有一个 ai 实验搭子,你最想解决啥?

各位观众朋友们大家好,欢迎来到今日 ai 前沿素爆,让我们一同聚焦 ai 领域最新动态。 首先,中国 ai 技术取得重大突破,北京智源人工智能研究院主导,联合清华、北大等机构的多模态大模型一六三成果登上自然正刊。这可是我国科研机构主导的大模型原创成果,首次登陆自然正刊 imu。 三、通过预测下一个词源,单一目标完成文本图像视频的端到端统一建模,多项精准测试,超越国际标杆,为下一代多模态系统确定全新技术路线,展现了我国在 ai 科研领域的强大实力。模型发展方面同样亮点十足。 阿里云发布新一代图像生成基础模型 q n m h 二点零,实现图像生成与编辑功能融合。 它采用七 b 轻量化架构,具备专业文字渲染能力,支持超长复杂指令处理,在多项盲测精准中表现卓越,为图像领域带来新的变更。字节跳动的 ai 视频模型 c 的 二点零备受瞩目,其生成视频的精细度、音画匹配度极为出色, 被誉为改变视频行业的 ai。 虽人在小范围内测,但已引发行业高度关注。应用层面,各大企业积极布局,千万已通过淘宝闪购接入天猫超市、盒马以及全国连锁商超和便利店,进一步拓展了 ai 在 生活消费场景的应用。 爱心源自半导体股份有限公司在香港联合交易所主板挂牌上市,该公司专注为边缘计算与终端设备 ai 应用打造高性能感知与计算平台,为 ai 产业注入新活力。 英西智能与康城药业达成合作,借助 ai 技术加速中科神经系统及自身免疫疾病领域新药研发进程,让 ai 在 医疗健康领域发挥更大作用。产业发展上,中国人工智能产业迎来标志性节点, 多模态技术实现底层范式革新,国家级 ai 标准体系加速落地。工信部等四部门引发的相关标准体系建设 指南逐步推进,多模态交互、计算机视觉等关键标准已进入制定与宣贯阶段,为产业规范发展奠基基础。资本市场对 ai 相关概念高度关注。受 ai 利好消息影响, a 股市场中,影视院线板块单日大涨百分之十一点三一,光线传媒、中国电影等十余 股涨跌。港股市场中, ai 应用股再度领涨,恒生科技指数涨百分之零点六二,显示出市场对 ai 产业发展前景的强烈看好,政策与监管也不缺席。麦塔遭欧盟警告非要求向禁品 ai 助手开放沃债,欧盟委员会认为其行为 阻碍 ai 助手市场竞争,这一举动对全球 ai 市场竞争格局或将产生重要影响。在社会应用场景方面,深圳市七届人大七次会议首场代表通道聚焦人工智能话题,展示了深圳在 ai 技术应用 和产业发展方面的最新成果,彰显了 ai 在 城市发展中的重要地位。以上就是二零二六年二月十日 ai 领域的主要动态,感谢大家的收看,下期再见!

谷歌的 ai 数学家彻底杀疯了,不仅攻克了数学猜想,还独立刊写并发表了一篇高级数学论文。最近,谷歌打造了一款基于 gemini deep think 的 ai 数学家,叫阿拉萨亚。阿拉萨亚在博士级数学难题上取得了多项科研里程碑, 其中包括在专门评测数学能力的 i m o proof bench 精准测试中,拿到了百分之九十一点九的超高成绩,直接刷新了行业最佳。也就是说,在奥数级的证明题里,它的正确率几乎无敌。但是,比起单纯解析,阿拉菲亚最具颠覆性的点在于它掌握了人类科研的核心能力。 比如,在没有任何人类干预的情况下,阿拉菲亚独立完成了一篇算术几何论文,还算出了数学里特征权重的关键常数。在难题攻坚上,他对艾勒德时猜想数据库里的七百个没解决的数学问题进行了半自主评估,并自己独立解决了四个,甚至在其中一个艾勒德时问题上给出了全新解答,推动了另一篇相关研究。 与此同时,他还和人类数学家合作完成了一篇论文,证明了相互作用粒子系统的关键界限。在另外两篇数学论文里,他也贡献了中间命题,帮人类数学家打通了研究的关键节点。能做到以上这些,阿拉菲亚也不是纯靠运气瞎蒙,而是因为他具备了自我纠错能力,还能主动承认错误,不瞎编。 这一切的背后,也有三大核心支柱,一是一托 gemner d think 高级版,拥有顶级难题推理能力,能拆解复杂数学逻辑,突破思维瓶颈。二是独特的推理缩放法则,让它的能力跨度覆盖奥数级到博士级,专业研究且低算力也能实现高质量推理。 三是深度整合了谷歌搜索和网页浏览,解决了以前 ai 瞎编参考文献的毛病,做到了有据可依。巧合又必然的是,数学大神、费尔兹奖得主陶哲轩在最新专访中宣称,数学才是 ai 最容易发挥价值的领域。还有就是我们一定要把 ai 当成合作者,而不是简单的外挂。 可以说,谷歌的 ai 学家 alfia 直接就是把陶哲轩的预判变成了现实。当然,我们也不必担心 ai 会取代人类学家,因为 ai 在 独立完成工作的同时,还是需要人类去验证。另一边,他也能和人类合作去攻克数学难题和发表论文。 或许不用太久,那些遥不可及的数学真理,困扰人类的百年数学猜想,就会被 ai 和人类数学家合作破解,这是真的可以期待一下了。

普通的论文未来没用了,因为普通论文 ai 已经能够帮你生成了。当前软件已经分为六个子模块。首先介绍格式绘图,这里我提供了一份数据,我将它 ctrl c 复制下来,再 ctrl v 粘贴到内容框中啊,需求鲜艳的颜色,随机再选择十幅图,点击格式绘图, 现在即依据这个数据帮我们生成了相应的格式化。第二个版块给大家介绍文献综述。第一种方法,我们通过输入一句标题来生成综述报告,点击联网解锁, 接着点击智能综述,即可在一到两分钟左右输出结果,生成完后导出综述, 保存到桌面即可查看最终效果。分为了三个模块,第一个是研究现状啊,第二个板块是简要评述, 第三个板块是主要参考文献,未来一定是会更减的,所以我们需要更多有价值的东西。为大家举一个例子啊,大家可能不太了解什么样的论文是非常有意义的,我们还是回到减肥的这个话题。第一种研究是 不吃饭可以减肥,这是大家都知道的常识,已经有很多人的常识都已经证明了这个结论,那我们再来看第二类理论了,吃苹果比吃梨子容易减肥,嗯, 那这个其实比第一种更有价值。对我们来说,因为我们所有的研究过程,普通人是不管行的。你的第一个结论不吃饭能减肥,其实对我 没有任何的影响啊,因为我一直都知道你的第二个论文的模式对我有一些影响,我知道如果我想要减肥,我更多的会去选择吃苹果,因为吃苹果比吃梨子更容易减肥。 好,接下来再是第三类,你知道吃苹果比吃梨子更容易减肥,那能多减肥百分之多少是吧?还有就是 我在哪一个时间段的去吃,我可能更容易减肥。那其实第三类问题我是不是会比第二类问题我更关注了?嗯, 第四类论文和其他的都不一样,它是属于颠覆常识型的论文,比如说不吃饭不可以减肥,那这个和我们的思想观念是不一样的。 所以通过我刚才说的第一类、第二类、第三类、第四类,大家就能够简单易懂的知道哪一类的研究是更有价值和更有意义的。 那有了 ai 之后,然后我们现在的 ai 更多的也是第一类,那您的这个有什么特别之处呢?现在的第二类和第三类通过数据 还是能够起一定的辅助作用,但是并不准确。当然我们现在有一个方法是通过修改大纲的一个方式,能够让它生成的内容尽可能地具有创新性,但是这个创新性跟实际我们高校 要达到的要求其实差距很远。所以 ai 呢,我觉得目前给大家做的就是一些非常辅助性的一些工作。当然我们在这个趋势的过程当中, 还是一定要注意的就是学术论文的问题,尤其是越来越多的学生,他们都会去使用这个软件,如果哈他并不是做一个辅助,而是直接去交付最终的成品, 就会导致我们教育培养出来的人才就失去了一个独立创造的一个能力。

矿模态支持蒸馏基本可以确定为二零二六年科研的热门方向之一了,在这近放榜, a a i 二零二六上也是大放异彩了。 a a i 二零二六上,浙江实验室、中科院计算所与香港大学联汉团队提出的非对称矿模态支持蒸馏检测及配套框架三 plus, 为矿模态支持蒸馏研究开辟新方向, 成功突破传统对称跨模态支持蒸馏对配对数据的强大限制,解决落于一次性场景下支持传输成本高、模态对其难的核心痛点,成为摇杆等跨模态学习领域的重点探索方向。从实际科研角度上看, sckd 追在配对模态任务中表现优异, 但受限于教师模态采集成本高、数据稀缺的现实问题,难以是被真实场景中大量非配对模态的支持迁移需求,而 c k d 通过放松于一对其约束,允许不同来源乐于与关联的模态间进行支持蒸馏,但随之带来的传输成本激增问题严重影响性能。 samsung 创新集成学生友好匹配与与感知智智队集中模块,在自研的 s l s e u s r s g n m r s g l 三代遥感精准数据集上,适配 windows 三十四、 mobile 二 v 二等六种模型架构十分烈烈, k d 等七种经典方法的分类精度显著提升, 其中在 m r s g。 奥数聚集上 o a 值最高达百分之九十六点六,同时解决了一架购模态迁移的适配性问题,为落雨一矿模态学习提供了高效解决方案。为整理好十篇矿模态支持蒸馏相关点会论文及复现代码合集,覆盖遥感医学、自动驾驶等。需要的同学评论六百六十六,我来发你。

今天我们教大家三种方法把 ai 生成的图矢量化,现在我们这里有生成很多 ai 的 插图啊,然后大家如果想用我们的这个 ai 生成图的话,大家也可以来看看我们这个 ai 生成图,我们是用最新的呢 nintendo 和 jumbo 三 pro, 然后地址的话,大家看到这里大可科研绘图的拼音加上科研绘图点 top, 然后大家就可以访问, 然后我们这里生成的部分,比如说我们现在拿一个来矢量化,我们就拿这一部分来实验化,我们右键复制图片。第一种方法呢,首先我们打开的是 adobe e l s j 的, 这是一个专业的矢量绘图软件,所以它有一些功能是可以用上的,我们粘贴一下,粘贴完之后呢,我们这时候呢, 你粘贴过来的时候,我们这里会出现一个图片描模啊,如果大家找不到的话,我们这人窗口这边我们也是可以找到图片描模的,这里会有个参数,然后大家可以找到我们对应的预设的话,我们可以选择低保帧,然后后续的一些调整,我们选完之后呢,它就会立即进行运行了,然后这里现在我们运行完之后呢,这里点一个扩展 就可以了,点一个扩展好,扩展完之后啊,此时我们就需要去右键取消编组,取消编组的话每一部分现在就可以拖动了,我们只要我们只要把这一部分呢选中,把这一部分选中, ok, 这个每一个部分都可以拖动,比如说我们现在要把这一部分拿出来,那我们就可以把之后可以把 周围这一部分呢,按住 shift 键点击就可以选中这一些这些图形啊,选中这些图形就可以把整体呢就可以单独的进行编辑了,进行编辑如果需要对这里面的颜色进行调整,比如说我要把这三个颜色都换成其他颜色,那你就直接去吸取一个其他的颜色即可。好,这是第一种啊,第一种,第一种方法的这个精度啊,大家, 大家可以用这种方法来解决。首先呢我把这个图片放的很大很大,然后我只要,比如说我这次只要使用画这一部分,那我们就把这一部分的截截屏截出来啊, 截出来,然后重新再粘贴到这个地方,然后我们从我们对这一部小部分进行进行一个使用画,这样的话会更加清晰一些,更加清晰一些。然后我们也可以去尝试一下高保证的一个描模。好,我们现在高保证描模之后呢,我们点击扩展,这时候呢我们点击扩展完之后, 好,这首这首图我们就可以右键一定要右键取消编组,取消编组,然后把一些不要的东西删除就可以了,把这些不要不要的部分,比如说把这些删除 好,删除,这样的话也 ok 啊,也 ok, 所以 这个高保证和低保证大家可以根据自己需求来选择啊,高保证的话就是它非常多细节都会保留,但是它的整体的 面也会非常多,所以我们用第一个低保针再给他试一下,好,低保针的话会更快一些。然后这边的话我们右键取消编组,这时候呢周围这一部分呢,就可以直接把它删除了,直接把它删除了。好,这是第一种方法。然后第二种方法呢,我们也给他准备了非常多的适量,适量的生图,适量的一个转换图的一个 网址,大家可以来看看,然后这些大家都可以来试试,我们总共有五个,然后这里大家可以看到我们的这个地址,看到我们地址他的,他的逻辑其实就是你把图片放进来,我们直接随便找一张图片,我们随便找一张图片,然后把它放进来之后再下载就可以了,这是第二种方法。第三种方法呢?第三 种方法要么用 ppt, 要么用 ai, 我 们可以重新来做一下,比如说我们用 ppt, ppt 的 话也可以做一些矢量图的绘图。我们第三种方法就是手动的来制作,手动的来制作。 ok, 好, 大家现在看到的这个,我们现在要把我们的图片贴进去,然后,然后,然后来描摸,呃,我们全选,然后把它我们刚才那张图片粘贴过来。 好,这时候像这种图的话,其实描摸起来很快啊,你看我们只要点击插入,然后这里有图形状,然后我们这种圆形的话呢,就这样一个个画啊,一个个画,这个画就是第三种,最笨的就是最笨的,但是最好的一个方法,最好的一个方法, ok, 然后我们这样复制,复制这样的话就可以描摸出我们整个图形。 ok, 好, 把这个置于顶层,置顶层。 ok, 好, 接下来呢,把它们都换上一个渐变,我们可以把它换成渐变,我们右键 全选右键,然后我们设置对象格式,这边我们有填充啊,然后给它加渐变就可以了,这个渐变可能要用一个这个射箭渐变,然后我们用一个这种这样的一个效果, 那我们再用吸管工具去吸取它的这个颜色,首先中间的话是这种偏灰的,那我们就去吸取这个颜色,然后边缘的话它慢慢过渡到这种蓝紫色,那我们就去吸这个紫色。 ok, 这样的话我们就可以做出这样的一个效果啊,这样一个效果,当然你觉得这个颜色如果不够淡的话,我们可以再把它降低一点,点击确定好的,然后整体的描边,我们通过这个地方呢给他加一个线条, 拆个线条,线条的话这边可以调整它的粗细啊,我们可以往上涂好,这样的话我们就可以慢慢的就可以把我们整个图这样描出来,然后再调整一下图层的关系就 ok 了,就 ok 了。好的,这种方法的图是最高质量的,最高质量我们也是借助嗯 ai 来生成一些比较好的一些插图啊,比较好的一些插图, ok。 然后这次都是我们用我们的这个大可科研绘图点 top 这个位置生成插图,然后大家也可以来试一试。 ok, 我 们本期内容就到结束,我们下期再见,拜拜拜。

最近两周呢, ai 圈呢,被一个名字刷屏了, cloud bot, 就是 现在的 mod bot, 有 人说它是 javascript, 有 人说 capacity 点赞,有人晒三台 mac mini, 就是 跑自动的任务,那我们很多科研人其实开始紧张了,因为它能够操作电脑, 能够长期的记忆,能够自动地去执行一些复杂的流程。那我们说我们还要不要工作呢?在这里我想带你用科研人的这个方式呢,问一个更加重要的问题, 就是他有没有潜力成长成为平台型的 ai? 那 么 modbot 到底是什么呢?一句话说清楚啊,他不是聊天机器人, 他的 gpt 是 你问他一句,他答你一句。但是 modbot 的 逻辑是什么?就是说你给他一个目标,他能够自己去规划这个步骤,帮你去打开网页,下载文件,泡脚本,整理这个结果,然后再回来给你汇报。比如你说 帮我整理 nih 近三年的 r 零一项目的这个趋势,它可能真的去帮你去搜索数据库,抓 pdf, 做结构化的表格输出,一个非常详细的分析报告出来了, 这个叫在学术上叫做 agentient, ai 就是 会动手的这个智能体。那么说为什么科研圈对它这么敏感?因为科研真正好命的其实从来就不是想理论,而是 我们说去查文献,清洗数据投稿系统,去改革式,去回复审稿项目规档。如果 model boat 成熟了,就说等于你多了一个博士后级别的行政 加技术混合的助理。那么这也就是我一直在寻求,一直强调的。我们说 ai 的 这个终极的战场,不在于帮你写句子,或者是帮你去拓展这个段落,而是在于帮助你去接管整个科研的生产系统。 他如果想要成为巨头,那在这里冷静地说一句,其实百分之九十九的这个爆红的这个项目,其实都卡在了平台化之前。 motobot 它至少要跨五道门槛。 第一个就是安全的治理,那么说控制电脑没有权限的隔离和杀核的机制,企业根本就不敢用。第二个,可审机信,因为科研和企业要的是每一步能回放,出错,能够追责。第三个就是生态系统插件, a p i 行业的 a, 检测到模板的这个市场没有生态,它只是一个工具而已。 那我们讲第四个,商业的这个模式,向企业的订阅,私有的部署,还有合规的版本,否则现金流被比技术先死。 第五个与大模型巨头的这个关系,像 openai, astropica, 谷歌现在都在做这个 agent, 它要么成为入口级的一个霸主,要么被收购,要么被平台吞掉。说用科研判断方式说它这个就是 model, 它未来可能很难成为训练基础模型的这个超级巨头,但是 非常有可能成为 ai 时代的数字员工操作系统。就像它不是英伟达,但是它有可能成为这个 ces force 加上 zippo 加工作系统的这个融合体,那我们说这类公司一样能够做到百亿的市值。那么 这个 multiboot 跟我们科研人真正的启示是什么呢?这一波热潮其实最重要的不是咱们装不装这个 multiboot, 而是三件事,第一个 ai 正在从会写变成了真正的会干活。第二个,那么说未来人的核心的竞争力到底是什么?不是你会不会写指令词,而是说你能不能把科研的流程拆成一个 ai 可执行的工程系统。第三个课题组一定会出现 ai 薄厚, ai 助教、 ai 项目经理。最后我们说,其实咱们也不要被 ai 取代人类给吓住,真正会赢的,其实是你 最早学会把 ai 变成团队的人。 model bot 可能消失,可能被并购,也可能被改名,但是有一件事情不会变,就是 agentic ai 这条主线不会回头。 好了,关于更多的科研工具和好用的科研指南词,我们已经系统地放在了这个星球。我们下期见。拜拜。

你的论文正在引用踩雷叉 g b 找的文献看起来完美,实际上可能早就被撤稿了。这一课,教你用 set 点 ai 来开启上帝视角,一秒识破参考文献里面那些坑。你知道吗?很多被引用了上千次的神文,其实早就被撤稿了。如果你还在盲目的引进引用量,或者直接复制粘贴 ai 生成的参考文献,你的学术生涯可能今天就要画句号了。 三 d ai 根本不是普通的文献库,它是学术界的测谎仪,它不只是看引用次数,更看引用态度。它是支持,是反驳,还单纯提到,它比你的导师还要严厉。我们来看一下,这是切记笔记,给了我们深层的一个创好文献列表,找到之后呢,你会发现呢? 第二篇呢,是 ai 下边的幽灵论文。第三篇呢,虽然存在,但是已经被红牌撤稿了,这要是没查出来,后果不堪设想。 sata 的 核心科技叫 smart cities, 它能读懂每一条引用的上下文。如果一篇论文有一百次引用,但巴不得是骂它了, sata 就 会直接给它亮红灯, 让你避开这个深坑。现在呢, sata 已经能够无缝接入 word 和浏览器了,写论文的时候,它就在旁边实施安检,一旦引用了高风险文章,立刻弹窗警告。这才是二零二二年该有的科研效率。 流量只是面子, smart solutions 才是理智。别被那些被骂红的那些论文毁了你的心血。 static 的是科研人的保命符,也是学士院的照妖镜。别让一篇策稿论文毁了你的心血。我是安迪,教你用 ai 解决工作自由。

openai 在 一月二十七日发布了一个 ai 科研工具 prism, 集成了 gpt 五点二核心能力。在这里,你可以使用 latex 来纂写科学文档,同时通过对话界面随时提问,比如评估论点、修改文稿,或者查找之前的研究成果等。 当我第一次看到的时候,真的觉得非常酷,我们一起来看一看吧。你只需要上传自己的 latex 文件。 prisma 冷静一样, 他试图把我们日常科研中分散的工具,比如文本编辑、 pdf 编辑、文献管理、统计软件等集中到一个统一界面中,并支持实时预览。 在对话框输入,请从摘药开始,仔细教阅这篇论文,逐行检查。 gpt 五点二能够结合上下文帮你验证内容表达是否准确,同时提出更符合学术规范的修改建议。点击 keep 接受修改,整个过程都不用离开文档,可以边写边改,效率非常高。 ai 会自动把它转化为专业图标,比如持续图、医学领域常见的森林图、生存曲线等,并以 latex 格式直接插入到论文对应位置,是不是很酷? 在 prism 中,你可以直接搜索相关领域的文献,如果结果里有不合适的条目,也可以继续让 ai 调整。比如第四条并不是我想要的。去掉第四条,并将其余参考文献添加到参考列表里,点击 keep 后引用,会自动插入论文,并统一参考文献格式。 当你提出一个学术问题时, prism 会自动结合相关章节、公式和上下文进行推理和检查。这时候我不需要再解释背景, prism 会自己去读取 new symmetry 那 一节,理解公式定义,然后给出结论和推理过程。 不仅如此, prism 还支持无限数量的携作者团队,可以在同一个共享工作空间里一起写作。而且目前 prism 是 免费使用的,如果你也试用了,不要忘了在评论区分享你的体验。关注我,关注教育科技,我们下期见。

ai 画机质图也太像了,给你们实时演示一下!输入科学假说, ai 就 能理解其中的逻辑关系,自动生成准确、清晰且风格专业的图片。无论是经典的信号通路图,还是需要突出三维结构的分子互作示意,它都能够快速实现适配到你的标书里。但光有工具可不够, 有的人就算是用了 ai, 效果反倒是越用越糟糕。其实啊,本质就是没有掌握到 ai 在 科研里的核心逻辑和具体的课程。为让更多医学人开设了一门全新的课程, 由专业老师在线教学,带你解锁 ai 科研全新模式,教你用 ai 赋能课题设计、研究方案、文章写作等关键的科研环节,同步帮你搭建 ai 辅助科研的完整思维框架。关键是,现在报名还能领取机制图生成 ai 工具体验权限,边学边用!还在等什么?赶紧来加入吧!

哎,你看到昨晚那张 code forces 的 排名图了吗?我当时第一眼以为是哪个退役大神复出了,结果一看名字, google gemini three deep sink 三千四百五十五的 l e o 评分,这分数太离谱了,这意味着全球现在能稳赢他的活人可能就剩七个了。 嗯,其实最吓人的不是那个排名,而是他解析的过程。以前 ai 刷分是靠背,但这次谷歌强调的是那种没有唯一答案,数据特别乱的科研烂摊子。 呃,这么说吧,他在 a r c a g i 二测试中拿了百分之八十四点六,这个成绩基本上宣告了靠背题库来糊弄 ai 测试的时代结束了。他是真的在误逻辑。 误逻辑听着还是有点虚,但那个三 d 打印的例子确实把我惊到了。就你随手画个草图,它就能给你变出一个能用的电脑支架。 对,而且他不是只给你画张画,他是把物理建模历学结构全算好了,直接吐出一个三 d 打印文件。谷歌那个研发主管说,这让物理建模的速度直接快了十倍。你想啊,以前你要找个 cad 工程师磨半天,现在 ai 是 一边思考科学原理,一边直接上手干工程活。 所以他其实是把理科脑袋和蓝领工匠合体了。不过我看到他在那个人类最后考试 he 里才拿了百分之四十了 哦,你可别小看这百分之四十八点四,那个 h l e 考试专门抓现代模型的极限是不准用任何搜索工具的硬钢。在这种变态难度下,他已经是全行业的 s o t a, 也就是最高水平了。 罗格斯大学有个数学家拿他审论文,他居然揪出了一个连人类评选专家都漏掉的细微逻辑漏洞,你想想,在那帮顶尖大脑的眼皮子底下找茬,这难度 啊!这种感觉确实有点脊背发凉。就像是你请了个助手,结果他比你这个博导还先发现问题。没错,而且他现在已经开始帮杜克大学的实验室优化半导体材料了,做出了一种厚度超过一百微米的晶体配方。这已经不是在实验室里玩过家家了,他是真的在渗透科研的最后一公里。 明白了。所以谷歌这次其实是想说,别再把 ai 当成只会写诗写文案的文科生了,他现在能进实验室,能证明猜想,甚至能搞三 d 建模。对,他现在正通过 api 开放给那些最硬核的工程师和企业, 感觉压力真的全在 open ai 这边了。奥特曼如果再不拿点像样的东西出来,这最强推理的位子可就坐不稳了。神仙打架,咱们普通人就等着看这深思过后的 ai 还能折腾出什么新花样吧。

写好论文需要了解的 ai 工具,兵马未动,粮草先行,想要学会使用 ai 工具辅助论文写作,就要提前了解各类有助于提升写作效率的 ai 工具,为大家整理了可以运用于各个场景的工具,方便大家提前熟悉各类工具的主要特性。 我们按照场景将 i 的 使用进行分类。一、智能问答知识解锁类,叉 g p t 抠拍、冷嘲讽文新一言、讯飞星火通一千问、质朴青年心华、妙笔豆包 这类工具具备通用的内容生成功能,一般会提供插件和小助手辅助 ai 理解不同的场景需求,如文心一言的插件商城和讯飞星火的助手中心。二、学术翻译类, deep pro c n k 翻译助手这类工具通常支持翻译 word、 pdf 形式的文档,可以对方言 习语文言文、学术论文等内容进行机器翻译,并且准确率和流畅度都非常高。三、文献检索文献分析网页分析类, consensus research、 rabbit、 密台搜索、通易志文 timi 这类工具支持网页阅读、论文阅读、图书阅读和自由阅读等功能。四、会议记录类,通用效率非书妙技。这类工具支持实时语音转文字、同步翻译、智能总结要点音、视频转文字并区分发言人,一键导出等功能。五、 数据分析类,低数图表、低数图表的数声文功能提供八大常见分析维度,包括数据趋势综合分析、数据对比 维度解释、相关性分析、数据要点异常识别分布分析等,全方位辅助产出分析结论。六、思维导图类,妙棒画板这类工具支持 ai 一 键生成流程图,具有简单拖动和智能配色功能。 七、 ppt 制作类 ai ppt i slide 讯飞质文这类工具可根据文本、 word 文档或者视频一键生成 ppt。 讯飞智文还支持根据 ppt 生成演讲稿。八、图片生成类 the journey stable the fusion 通用万象、腾讯混元这类工具支持根据文本生成图片、根据图片生成图片、将图片解析为提示词等功能。 九、论文排版类 space 成篇提供定制化的论文模板和自动修改格式的工具,帮助研究人员快速且有效地创作出符合目标刊刊和出版商的特定格式要求的作品。

在学术写作的漫漫征途中,科研人常被繁琐的初稿拷写、语言优化和格式调整折磨得苦不堪言。不过,一场由 ai 工具引发的效率革命正悄然改变这一局面。 腾讯开发者社区评测的七款免费 ai 论文工具成为科研人的救星。据经写作堪称教育类文案的神兵利器,其独特的骨架填充法 就像为学术写作搭建好了稳固的框架,科研人只需输入关键信息,就能快速生成逻辑清晰的出稿动态。数据可视化功能更是锦上添花,让复杂的数据以直观的图标形式呈现,大大提升了论文的可读性和专业性, 真正实现了学术生产流程再造,让科研人从低效的马斯工作中解放出来。腾讯元宝也不甘示弱, 凭借强大的语言优化能力,能将晦涩难懂的语句转化为精准流畅的学术表达,让论文质量瞬间提升。同时,它还能精准适配各类奇看模板,为科研人省去了繁琐的格式调整时间。 而图灵论文 ai 助手则为社科研究领域带来了专项支持,其问卷调查专项功能能够根据研究主题自动生成科学合理的问卷,还能对回收的数据进行初步分析, 为社科研究提供了从设计到分析的一站式服务,成为社科研究领域的经典案例。这场由 ai 工具引发的学术写作效率革命,正以前所未有的速度改变着科研生态。 科研人不再为写作难题而焦虑,而是将更多精力投入到创新研究中。未来,随着 ai 技术的不断发展,学术写作必将迎来更加辉煌的明天。

一觉醒来, open ai 直接扔了个王炸!免费科研神器 prison 堪称 overlive 的 致命替代。 先看公式,处理复杂公式,拍个照一键转化成 latex 代码,自动插进论文对应位置,再也不用对着符号库一个个找了。更绝的是,论文全程托管找文献、写论文润色较对,甚至参考文献管理,一个网页全搞定, 再也不用在多个工具之间复制粘贴来回折腾了。多人写作也很流畅,能实时看到习作者的光标位置和编辑的内容,大大提升了创作者的效率。 最关键的是,它完全免费,而且深度集成了 gpt。 五点二, ai 能看懂你整篇论文的结构和内容。界面左边写 lighttext 代码,右边实时预览 pdf, 底部 ai 对 话框随叫随到, 生成公式、解释、报错、润色文本都能及时响应。现在只要有 check gpt 个人账号就能使用,有需要的科研党、论文党赶紧去试试吧!

谷歌最近搞了个大新闻,发布了一个叫 gemini three dip think 的 东西,听这名字就感觉不简单,对吧?它可不是普普通通的 ai, 它的目标说出来都吓人,专门儿为了解决咱们这个世界上最棘手最头疼的那些科学和工程难题, 听着是不是有点科幻?别急,咱们就来看看他到底牛在哪?哎,我先问你一个问题啊,你觉得 ai 这东西有没有可能比一整个顶尖专家团队还厉害? 就是说一帮最聪明的人都看不出来的问题,一个 ai 能给你指出来,你是不是觉得这听起来有点天方夜谭?但你还真别不信,这个问题恰恰就是咱们今天要聊的这项新剧组的关键所在。 所以,这个 deep think 到底是个傻,你可千万别把它跟咱们平时用的那种聊天 ai 搞混了,它不是那种只会帮你总结网站已有信息的知识搬运工,它更像是一个专门的嗯,思考模式或者说推理模式。 你想想看,当咱们面对一堆乱七八糟,缺这少那的数据,甚至连问题本身都没有标准答案的时候,它就是那个能帮你杀出一条血路的工具。 你看这个对比就特别清楚了,传统的 ai 就 好比一个超级厉害的图书管理员,你问他什么,他都能从海量的书里帮你找到答案,做好总结,这已经很棒了,对吧?但是 deep think 呢?他扮演的角色完全不一样,他是一个探险家, 他的任务不是整理已知的世界,而是要去探索那些地图上都还没现成答案的问题,这才是他真正厉害的地方。 好,那说了半天,他到底有多强呢?咱们光说不练假把式对吧?是骡子是马,拉出来遛遛。接下来咱们就来看看他在一些堪称地狱难度的测试里,到底交出了什么样的成绩单。 先看这个数字,八十四点六趴,这是他的一个叫 a r c 杠 a g i 二的测试里的分数。 你可能没听过这个测试,没关系,你只要知道这玩意儿被圈内人工认识,测试 ai 推理能力的珠穆朗玛峰难的要命。 拿到八十四点六趴,这个分数基本上就是直接把以前的所有积录都甩在身后了,可以说是重新定义了这个领域的最高水平。 再来看这个三五四五,这是他在 code force 上的一楼等局分,如果你玩过国际象棋或者一些竞技游戏,你就知道一楼分是干嘛的。这么说吧,三五四五分在编程竞赛这个圈子里,绝对是大神中的大神级别, 全世界能达到这个分数的人类程序员真的是凤毛麟角,等于说他写代码的能力已经超过了九十九点九九八八八八八的人类顶尖高手 还没完呢!除了写代码搞理科竞赛啊,他也一样在行,在国际数学、物理还有化学奥林匹克竞赛里,他的水平妥妥的达到了拿金牌的级别。 要知道,这可是全世界最聪明的那群高中生们拼尽全力的地方啊,他也能跟他们一交告下,甚至更胜一筹。 好,咱们把这些成绩放在一块看,不管是抽象的逻辑推理,还是超级复杂的编程,再到顶尖的科学竞赛,你看 deep think, 基本上是全方面的刷新了记录。 所以这说明什么?这不仅仅是数字上的提升,这可能意味着我们正在亲眼见证一种,嗯,一种完全不同量级的机器智能正在诞生。 不过,这些终究还只是考试分数,对吧?真正的考验还得看它在真实世界里能不能派上用场。 那么,当咱们把这么强大的一个大脑扔到现实生活中的科学难题里,又会发生什么样奇妙的化学反应呢?咱们接着往下看, 还记不记得咱们一开始提的那个问题, ai 能不能发现专家都发现不了的错?现在答案来了,你听这个故事,罗格斯大学有位数学家叫利萨卡喷,他当时就用 deep think 帮他检查一篇特别专业的数学论文, 结果你再怎么着,他真的找到了一个非常非常细微的逻辑漏洞,而这个漏洞之前经过好几轮人类专家的评选,都没人发现。这可不是小事啊,在前沿数学里,一个不起眼的错误就可能让整个理论大厦轰然倒塌。 再来看一个更实际的例子,在杜克大学有个实验室正在研究一种新材料,具体来说是一种晶体薄膜。他们碰到了一个大麻烦,不管怎么试都做不出想要的尺寸。 就在大家一筹莫展的时候, deep sink 上场了,他没有去试错,而是直接分析了所有数据,然后 duang 的 一下设计出了一套全新的制作方案或者说配方,结果问题就这么解决了。 你想想,这要是推广开来,我们以后发现新材料的速度那可就不是快一点半点了,可能是指数级的飞跃。好,看完了高大上的科学研究,咱们再来看看他在工程领域能帮上什么忙,这部分就更贴近我们的生活了。 简单来说,就是他怎么能把咱们脑子里的一个想法快速变成一个能拿到手里的真实物件, 整个流程简直是太酷了。你看,你只要在纸上随便画个草图,告诉他你想要个啥,然后呢,他就能看懂你的话,把它变成一个非常精细的三维模型。最后一步,他会直接生成一个文件,你把它扔给三 d 打印机,过一会东西就出来了, 你体会一下这个速度。以前从一个概念到做出样品,可能要好几个星期,现在呢,可能就是一顿饭的功夫。听到这儿,你肯定在想,哇,这东西这么厉害,那我们能用上吗?还是说只是科学家们的专属玩具? 别急,好消息来了,它已经开始走进我们的生活了。目前呢,主要有两种方式,如果你是个人用户,而且订阅了 google ai ultra 服务,那恭喜你,现在打开 gemini 应用,就能直接用上这个 dip 定模式了。 那如果是研究机构或者公司呢,也可以去申请一个叫 gemini api 的 东西,这样就可以把它强大的推理能力对接到自己的项目里去。所以啊,你看 deepthink 的 发布,它其实不是一个故事的结尾,恰恰相反,它是一个全新篇章的开始。 它就好像是给全世界的科学家、工程师,还有所有爱创造的人递上了一把前所未有的神兵利器。有了它,那些我们以前觉得遥不可及,甚至想都不敢想的难题,现在或许真的可以去挑战一下了, 那么最后我也想把一个问题留给你,既然我们现在手里有了这么强大的工具,有了这么一个超级大脑,你觉得我们最应该让它去攻克下一个什么样的难题呢?是去彻底解决气候变化,还是找到治愈癌症的方法?又或者是帮我们实现星际旅行的梦想? 这个问题没有标准答案,但我觉得它值得我们每个人都好好想一想。

好消息啊兄弟们,就在昨天, openai 推出了完全免费的科研写作神器 prison。 简单来说就是 兄弟们可以免费使用 twitter、 gpt 五点二大模型进行科研写作了。是完全免费啊,这羊毛必须得薅啊!写论文最崩溃的是什么?其实不是没有思路,而是哪怕即使改个公司,也需要在 twitter 界面或者 leave 或者 pdf 阅读器中来回切换个八百回, 思路完全被打断了。但是这个问题现在已经完全解决了。 prism 其实就是一个云端的 lantext 平台,为什么说它神呢?因为它搭载了全新的 gbt 五点二思考大模型, 跟普通 ai 最大区别是,它能直接看懂你整篇论文,不管是公司呢,图表还是引用,它完全都知道, 不需要我们再复制粘贴位给他了,这就是痊愈感知能力。重点来了哈,参考文献功能也集合在里面,它内置的 xp 搜索可以一键生成,引用格式,也可以直接排好。这个更绝, 画图太难,比如说我们在白板上随便画个神经网络草图,它直接给我们生成代码,甚至连 linux 翻译报错,它都能可以自动帮我们修复。 当然,因为这个是刚推出来的,也有相对的硬伤,相应的坑我也整理出来了。首先,这 ai 历史记录只能在同一台电脑上进行储存,当然这也有个好处,这也就意味着我们可以把所有的工作都放在实验室里,而不用带回宿舍。呃,第二个对数据隐私敏感的同学要注意了, 它会保留一段时间日记,默认情况下是不使用 api 数据进行训练的。然后我来快速总结一下,首先拿它来做一个头脑风暴,写出稿、改排版绝对是效率外挂。 更重要的一点,它是免费且无限制的协助模式,完全免费啊!要注意的点就在这边了。然后体验地址就是这个了,有需要的兄弟们赶快去试试吧!

大家好,相信经常关注我们罗亚罗同学公众号的朋友呢,会看到我们在首页置顶了这样的一个病例分析的软件, 当时呢我们是利用 p i q t 简单的写了一个 u i, 然后希望能够帮到想入门病例 i 的 医生朋友们去使用这个一些现在的这些主流算法。 那么到今天二零二六年二月十号,我们再一次把软件继续了更新,我们进行了这些网页版的美观设计,然后呢我们增加了更多的 啊多实体学算法,包括在整个流程里面,我们增加了很多的科研绘图以及到结果输出保存的这些功能。那接下来呢,我就带大家一起去看一下我们更先后的软件,并且呢在进行每一步讲解的时候,我希望 可以让大家直观的感受到我们每一步它究竟在进行一个什么样的过程。接下来呢我们就一起看一下。 打开这个网页版的界面之后呢,我们点击开始使用,就会来到我们主要的功能页面,那么在这个功能页面里面呢,我们是划分了七个模块, 比如说像切 pad, 然后提取特征模型,配置设定、训练测试、落图绘制等等。那第一步呢就是切 pad, 那 为什么要切 pad 呢?我希望结合一张并列切片 跟大家去简单的聊一下,比如说现在给大家展示的是 t c a 上面的一张并列切片, 我们可以看一下它的宽度跟高度是十二万乘以八万这样一个尺度,那达到了一百亿这样的一个像素级别。 我们通常呢去处理图像,可能常规的是二四五幺二一零二四等等,但是像一百亿几万乘几万的这样一个尺度的话,是没有办法被计算机直接处理的。所以呢我们通常来讲会把这一整个切片先识别出来组织, 然后在这些组织区域去呃切成这样的一些小方块,然后来进行 下一步的一个分析。那先分成这些小方块之后,因为每一个图像我们可以去自定义的设置,比如说你设置成五幺二的一个大小,或者说一千零二四这样的一个大小,那么 有了每一步处理好,通过一些基础模型去完成这样的一个信息压缩之后, 再去做下任务的话,那就会节省很多的这样的一个显存。这也是我们通常来讲为什么要千分派尺的一个原因。 那么回到我们的公共页面可以看到有几个需要设置的地方,第一个呢就是说你病例切片存放的一个目录是哪里?也就是这个 第一个选择光,那我们这里面虽然写的是 s v s, 但是像 t f 也是支持的,像一些可以被 open slide 读取的切片,那这里面都是可以的。然后保存的根目录呢就包含了。 呃,我们接下来会提供的一些,呃,比如说我们在切分派时的时候会识别这个组织掩码,那我们就会把掩码保存下来,然后呢 我们也会保存你提取这个派尺他对应的一个坐标。大家需要注意一下,就是在这一步呢,我们是不涉及到 把这个图像从这个病例切片里面裁剪出来这一步的,只是说我们需要他在病例切片里面的坐标是什么?那后面呢再结合他的派尺大小, 我们就可以完成这样的一个分割,就是从图并列切片里面找到这个小 pad 的 一个呃功能。 然后呢这个大家其实可以不用管,就是说你可以去设定哪些并列切片已经处理过了,那这里面其实我们也是支持,就是说你可以跳过已经存在的这些并列切片, 假如说你的病例切片特别多的时候,你可能没办法一次执行完,那么你下次启动的时候,你只要勾选,那么它还是会跳过你已经执行过的这些 呃病例切片。然后呢比较重要的是这个 preset 这个文件,当然呢我们也提供了一些默认参数,但是的话 大家的病例切片可能来自不同的中心,不同的扫描仪,甚至你的眼染色也是有差异的,那么可能这些默认参数对于你的切片效果就不会特别好。那么呢我们也可以去自定义的调整,可以选择这个 preset 这个 csv 文件,然后呢我们可以选择对它进行编辑,那这些参数都代表什么意思呢?我们可以去参考这个参数说明进行修改。并且呢我们也列了一些常规的情况,就是说你这个切片啊目前识别的情况,然后应该如何去调整, 然后的话下面就是你要切分派值一个大小,然后你切分的这个布长,假如说你的派值大小跟你这个切分的布长正好是一样的话,那么它就代表了一种 正好是紧挨着,然后不重叠的这样的一个情况,就仿佛是我这里面便利界面里边的一个小方块,挨着一个小方块去切割提取, 然后这个 patch level 呢,还需要结合我们并列切片去看一下。就是利用 q pad 这个软件的时候,你可以看到这个 你的并列切片它的一个尺度情况,比如说它第一个就是对应这个误经四十倍的,然后第二个尺度呢是这个四四呢,就代表它的长度跟宽度都 变为原来的四分之一。所以呢大家可以根据这个病例切片的这个尺度你可以自定义去调整,比如说我不想要最高倍,我就想要在这个 level 等一的这个情况下, 也就是变成了物镜为十倍这样的一个视野,那你就可以去自定义的设置,尤其是在你显存不够用的时候。那么我们通常来讲呢,会选择在二十倍物镜,然后 pad 大 小和布长都是五幺二这样的一个情况下去切分 pad 的。 然后呢在这一步呢会产生哪些文件呢?也就是说我们刚刚设置这个保存目录里面会包含哪些呢?那也带大家去看一下我之前提取过的这样一个目录, 那这里面呢这个 pcs 一 这个目录就是我们刚刚设定的这个保存的根目录,在这里面我们会有 mark, 就是 你可以去检查你分割的掩码是不是你想要的。 比如说这里面,因为我这个线设置比较细啊,可能不太清晰,我们可以放大看一下,这个呢就代表它组织一个轮廓。 然后这个 pcs 这个目录下呢就存放的是 h 五文件,那每一个 h 五文件呢,就存储了对应切片它所有 pcs 这样的一个坐标,然后这个拼接的图像呢,其实就是相当于, 呃,你把那些变图像的 patch 拼回原图像,它是什么样子的?其实这个呢,我们通常来讲也不需要预览,因为如果你的 mask 识别的比较好的话,那就可以呃自动地去, 那就他的切分效果肯定是可以的。然后呢还有这个处理的文件,他会包含你所处理的参数,然后处理的这个进度,那这个这个文件呢,也是会在我们后续的使用中,尤其在提取特征里面是要用到的。 然后呢第二步呢,就是去提取特征,那再次回到我们这个切片啊,为什么要去提取它的特征,以及结合这个 pad 的 切分究竟起了一个什么样的作用?其实本身来讲这个病例切片太大了,然后我们给他切成了 pad, 那 进一步的呢, 你针对每一个小图像其实是要处理的,如果你只是说把它切分成派尺,比如说你现在切分了一千个派尺,然后每个图像还是五幺二乘五幺二的这样的一个图像的话,他还是没有办法直接的被处理, 我们需要对每一个图像进行压缩,那并理基作模型,它本身来讲就是把你这个图像变成了一串数值的表示,比如说一千零二十四个数值, 那么这个呢,就像我们人的身份证一样,他可以表示你这个个人的一个身份,那这串数值呢,他就可以很好的表示这个派式图像的一个特征, 那么一个好的基础模型一定会尽可能的保留他原图像的一个特征,然后呢方便我们去做下任务,那也这也是 就是说为什么它能够发在这个大字刊正刊上的一个原因,因为它完成了这样的一个转换,不需要我们消耗非常大的现存,就能够把这个整个病例切片处理好。然后呢这一步呢就是这样的, 在进行提取特征的时候,我们需要指定 csv 文件,就是刚刚给大家展示的这个包含了 包含了你处理病历的切片,然后还有这个它的一些分割参数。然后这个 h 五的目录呢,就是我们刚刚设定的这个保存目录, 就是这个 pacis 这个目录,其实这个跟前面 patch 这保存的这个跟目录是一致的,其实也是相当于是它的一个上一级的这样的一个目录。 然后这个切片目录呢,就是你的这个病体切片存放的目录,这个跟切片 place 里面的这个原目录是一致的。 然后这个特征保存的目录呢,就是说你希望这些提取出来这个特征保存在哪里,那这个你就可以去浏览,去设定。我们在浏览的时候,假如说你这个目录里没有,你也可以去可以去选择这个新建,那再给大家看一下我们之前所提取好的一个特征目录, 这个没有空的, 比如说这个这个所展示的是八个,然后的话它是包含了每一个切片,它所它里面这些小 patch 的 这个特征,还有它对应的一个坐标。 然后的话这里面就是说你可以选择你想用哪一个几组模型来提取测征,我们这里面是包含了二十多种几组模型的这个接口都已经为大家写好了, 但是呢,每一个权重的使用,大家是需要遵守这个开源协议,从 hackinface 这个网站上去申请, 然后的话,你可以在一个账户上去申请不同模型的一个权限,然后最终把你账户的这个哈根 face token 设置在这里,然后保存,那么你就不需要再设定了,然后的话,你就可以自由地去使用不同的几种模型。 然后这个呢 pad size 呢,就是根据你显存大小,然后自定义的去设置一下,那如果你的 cpu 能力比较强,并且你的显存也比较大,那这个 pad size 就 可以设置的高一点。 然后 gpu 的 id 呢,就是你想用哪一个卡,比如说你如果你只有单张显卡,那你就设置成零就可以了。然后呃,你是多卡的话,你就可以自定义的去指定这个 id。 那 如果你是 cpu 电脑呢?那其实我不太推荐大家去使用这个软件,因为它会特别的慢。 然后这个 number google 就是 你要使用多少个这个县城来帮你去加载这个数据。那如果是 windows 系统的话,那这里面运行会有一个问题,我推荐大家,如果是 windows 的 话,你可以使用这个乌班图的子系统来完成。 那这一步的话,就是我们提取特征的一个作用,相当于呢,是把原来的这一整张并列切片,然后变成了呃,根据每一个坐标,然后他一串的这样的一个数值表示。所以这一步他所完成的过程不再是 呃还是原始的并列切片了,而是经过压缩后的这样一些数值表示。但是呢,这个数值是不可解释的, 他并不像我们这个传统的 bmi 里面,我们知道这个肿瘤的面积多少,然后这些纤维的面积多少,这些特征是可以就是被人为定义的。但是像深度学习他所提取的特征呢,是黑核的,他这个高维酱料,你是没办法去破译他每一个值代表是什么含义的。 那这个也是被大家一贯诟病的,就是说深度学习他的可解释性不是特别的好。但是呢这也不要紧,我们虽然没有办法去量化他每一个特征维度他究竟是什么含义,但是我们可以去量化出来在这个图像上 每一个区域对于你下任务他的一个贡献度的好。接下来呢是完成这个数据集划分, 那我们的这个啊,软件呢是支持两个主要功能的。第一个呢就是说去完成分类任务,比如说你去判断他是肿瘤患者还是非肿瘤患者,然后你也可以去设定啊,雅型分类,基因预测等等。 那这个通常来讲,我们的 label 呢,就是离散的类别零到类别数减一这样的一些数值表示它。然后呢我们也支持这个预后预测的这些任务,那 这里面呢,我们就需要包含这个事件它的一个进展情况,包含它的时间,包含它这个 event 这个列。 那总的来说呢,我们是支持分类任务还有预后预测任务的,那预后预测可以,你可以去做一些生存预测,可以做复发预测,只要你有对应的这个标签都是可以做的。那在这里面呢,我们首先呢是会 根据大家所提取的这些特征呢,去给你生成的标签自定义的人为修改它, 然后呢来达到这样的一个,就是说这个标签不再是随机生成的,而是你真实这个数据,它的标签是什么样的?那这一步呢,主要是为了方便去统计你的提取好的 pdf 文件有哪些,而不需要自己在一个个的录入, 那对应标签的时候还是需要大家去手动调整的。那么可以带大家去看一下我们这里面 之前生成的这个文件,比如说这个 c r s 文件,这是之前设定一个分类,在分类里面是没有 time 这个列的啊,只有这两列, 这个 time 是 我后加的,只有这两列是我们生成的。左边这个就是说你提取了哪些文件,它的哪些并体切片的特征,就是对应这些 p d 文件吧。然后这个 label 呢,就是我们呃随机生成的这些标签, 然后的话你需要根据 pd 文件和它真正的标签呢去进行这个设定。其实最简单办法就是说你把这个进行一个排序,然后把你这个自己的临床表格也排一个序,然后把这个 label 靠背到它这个 划分文件上就可以。然后第二个呢是这个 os 的, 就是这个生存的一个标签生成,它也会包含三列 路径,然后 time 跟 event 这个三师是我自己加的,大家可以忽略它,然后你也是同样的,可以根据字底的数据集对它进行修改。 那么有了这个文件之后呢,我们就可以去相当于你对整个数据集的情况已经了解了,然后的话你可以对你自己这个单个中心的数据进行划分, 比如说你可以进行这个交叉验证,比如说我这么连 k 设置是五,那就是进行五折交叉验证。然后如果你因为我们这里面提供了六种不同的画完方式,如果你对每一种画完方式不太了解的话,那你可以打开这个画完方式说明, 然后去看一下它每一步究竟是什么样的。那这里面呢也可以给大家去看一下我们生成这个文件,比如说这个分类的使用第二种换换方式,那么在每个 cv 文件里面呢, 我们会包含它训练的样本,然后验证的样本,还有测试的样本,那五折呢?每一折都是这样的一个情况, 每一折呢都是这样的一个情况,这个呢可以根据自己的需要去设定,那后面呢我们会就是呃展示交叉验证的一个结果,它大概是一个什么样子?然后这个 c s v 文件的路径呢?就是 刚刚所这个生成的,包括你对它进行修改后的这样的一个文件,然后保存目录呢,就是说如果你进行交差验证的话,它会存一个目录,然后这个目录里面会包含每一折的一个划分的 c s v, 就 像刚刚给大家看的这个一样, 那如果你是使用这种全 y o t s 这样的一个划分的话,那么它只会产生单个的 c s v 文件, 因为相当于进行交叉验证的时候,你是每一折它都有对应的串 y o test 的 嘛,所以的话它会产生多个 csv 文件,然后有了数据集划分之后,我们就可以对模型进行设定,那我们这里面支持非常多的模型,比如说 abml, 大家会特别熟悉,对吧?还有像 clem, 然后像串词 clem 等等。我们包含了二十九个多实体学习算法,大家可以根据自己的需要进行设定,但是的话有一些算法我们这里设定是不支持这个 预后预测任务的,比如说像 dft, 像 clem, 其实支持这也不太支持这个预后预测, 那像其他的算法对这个就不太敏感,大家可以去设定。如果你不太清楚哪一个不能进行预后预测,其实我们在训练的时候也会报错的。 然后的话,比如说我们选择 a、 b, m, i、 l 为 d, 然后我们可以加载这些参数,然后呢你可以去设定你本次训练所使用这个数据基名称是什么,它后面呢会根据这个日记目录,然后再对应 根据日历目录还有这个数据及名字,然后再保存它的结果。然后如果你是进行这个交叉验证的,那你就选择 kfold, 如果你选择如果你是单次划分的,实际上确不是交叉验证的,那你就选这个, 那这里面呢可以根据自己去修改。然后这个 kfold 的 这个目录呢就是,呃, 刚刚比如说我们展示的,那这里面呢是包含了五折交押证,每一折的一个换换方式的,然后呢我们也支持这个 啊,多模态的一个学习,然后这个时候呢,其实这个多模态的表格需要的格式就是说切片它对应的这个 p、 t 文件的名字,然后右面是它的特征,那我我们这里面呢也给也可以给大家看一下它的一个形式, 比如说我们打开一个表格,这里面呢左边就是 style 的 这个名称,然后右面是 i 这个它的特征,那么呢你可以根据这个特征呢进行人为的修改。 那这里面只是说给大家,如果你不知道怎么去设定的时候一个直观的一个展示,那这些列呢,你都可以自定义修,自定义也增加,然后只要跟你这个切片名进行一一对应即可。 然后这一块的话就是多膜态的部分,然后呢针对缺失值呢,我们也有一些预设的策略,但是我希望大家的特征呢都是尽可能完整的,但是的话临床过程中可能是有一些记录确实是删逝,这也没有办法。 然后的话我们目前只支持这个给它拼接在一起啊,后面呢我们也会增加其他的薄膜态融合的策略。然后如果你是进行分类任务,那这边呢你可以去设定这个你这个分类任务的类别, 然后选择训练模型的 gpu, 然后你说要训练这个模型的这个 epo, 然后你是预后预测的任务的话, 那这个部分就失效了,你是需要啊设定这里,那我们推荐的话,其实十到二十或者说少一点数字都没有关系,比如四,这都没有关系, 然后的话你可以选择保存,保存之后的话我们模型的配置就修改了,然后的话接下来呢你可以对模型进行训练,比如说我们选定刚刚配置好的,然后你就可以直接启动它对它进行训练了。 然后的话训练过程中呢它会打印一些信息, 比如说我们在完成的是一个分类任务的话,我们在这个过程中啊,其实会呃 计算这些我们常用的指标,比如说像 a c c 啊,像这个 a u c 啊,像这些 f 一 score, 然后精准率啊、召回率啊等等等等的这些指标,包括混淆矩阵,其实我们都会在这个模型训练过程中啊,帮大家计算出来。 并且呢我们也会在这个模型的这个训练的日记目录,比如说像刚刚的 这个是新产生的,它没有训练完,可以看一个我们之前训练过的模型。 我们在训练过程中产生这些目录呢,都会给大家存在这个表格里面,方便大家去啊记录啊,统计啊,包括你可能自定义的想会这些图,这些都会存储在这个表格里面,非常的直观。 然后的话我们对训练过程中的一些图表,比如说像这些不同的指标,我们也会进行这种绘图,方便大家去查看,比如像 吹蜡烛,你就会检查这个训练过程中他是否有一些异常情况等等。然后的话刚刚所展示的就是这个训练过程,然后的话带大家看一个呃 呃预后预测的这个训练过程,我们随便打开一折,那我们也会有一些图标,比如像 index 啊,像 loss 啊,还有像这个 py 六的这些变化情况,我们也会展示出来。 然后的话我们对这个训练过程中所产生的数据,比如说像 index、 像 loss、 像 pivot, 都会进行统计,包括它每一个 epoch 的 一个情况,所以的话大家可以自定义再画一些图标啊,做一些统计都是没问题的。 然后接下来呢就是维形的测试部分,测试部分我们是非常方便的,就是说你可以只需要选择你对应的这个 日字目录下,刚刚所产生的这些,呃,是这个日字目录,那它就可以自动的去呃完成这个推理,那为什么可以完成这样的一个作用呢?我们再回到它的目录下, 比如说叫来者,那这里面其实我们是包含了模型配置文件的,然后呢在每一折里面我们也包含了这个数据划分的这个情况, 所以的话它可以自动地定位到你需要测试的样本,然后完成推理,所以的话大家不需要再进行这个指定。然后呢我们也支持外部的这个 测试,因为我们通常来讲也不一定是做单中心的,我们会做多中心的这些数据嘛,所以的话第一步还是一样的,你去设定这个模型的这些配置文件,刚刚所 日制文件的这个目录下,然后你外部的 pdf 文件,其实外部 pdf 文件呢,你可以根据这里去生成,比如说你去选择外部数据集提取这些特征,然后你去给他啊 生成这个样的一个表格,那在这个测试的时候,我们只需要指定这个文件,那他就可以自动完成这个推理。 那假如说你这个是进行五折交叉验证,那会产生五个模型,那么我们会把这五个模型都对这个外部数据进行推理,那如果你是单次翠原外部 type 划分的话,那他只会产生一次的推理情况。然后呢你可以选择 在这里测试指目录,然后保存到这个日式目录下,那我们再具体的看一下, 比如说刚刚所进行的这个分类,我们这里面呢是进行了内部的一个验证,那在内部验证里面呢,我们可以看一下有哪些结果。比如说我随便挑选一只 这个是预后预测的,那我们会会制这一个 km 曲线,就是对它进行高低风险组的一个划分,然后我们这边会包含,哎,这个风险比啊跟 py 六。 然后的话我们也会包含,就是说每个患者他的一个风险系数 这边我们都会帮大家生成,因为的话你可能会根据这个他的临床表格去进行身体图的绘制啊等等的。所以的话我们这边是把患者这个枫叶 skull 帮大家识识别出来,你可以自定义的再去绘制其他你想绘制的图标。 然后的话我们还包含了这个一三五年的这个呃事件的一个预测,那这边也是有图表的, 总的来说呢这个是预后预测相关的,我们再看一下这个 分类模型,在分类模型那里面我们的测试呢也是一样的, 会包含很多的这个图标跟日期信息,比如说像这个回旋矩阵,因为我们这个所演示的这个数据量比较少啊, 所以的话它效果没有特别好。但是呢我们是可以绘制 k m 这个混淆矩阵,然后这个 rc 曲线,然后绘制决策曲线, 这个都是经常要用到的。然后如果你想自定一些图表呢?当然呢我们也是会把这个 分类模型里面它真正它它的真值是什么,然后模型预测的 label 是 什么,然后每一类预测的概率是什么都帮大家统计出来了,那你可以自定义的去再去复制你想要的 rc 曲线的风格,然后去统计一些其他的信息,都是可以支持的。 然后的话这个相当于是我们这个测试的一个环节,并且呢我们也是支持你使用这个最佳的权重,就是说在 while 上面筛选的模型权重还是使用最后一个, 因为的话有些时候我们可能没有 while 这个划分的话,那你就使用这个最后一个权重,然后如果你没有最佳,其实我们在这个 模型层面也会,代码层面也会帮大家去自动选择这个,使用这个最后一个模型它的一个权重去进行推理的,就是我们帮大家设计了很多这样一些可能会使用时报错的一些情况的, 然后的话这个部分就大概介绍完毕,其实是针对预后啊,针对分类,我们的结果罗列是非常清晰的。 然后的话接下来就是我们热图绘制的部分,热图绘制的话,其实我们也是提供了这样一些配置文件,然后你加载进来,加载进来之后呢, 你会设定这个热图保存的一个目录,然后 batch size 啊, number work 这些,就跟前面一样,大家可以根据自己需要去设定,然后的话你想要推理的这个, 呃,这些就是你想绘制哪些病例切片的这些热图,那你就可以选择 s v s 的 目录,然后去生成这个文件。那比如说你已经识别好了,那你这边就设定,然后使用预设的这些啊分割参数。 然后接下来呢是你这个派值大小,然后重叠率这个力可以跟大家去讲一下,我们在训练模型的时候,一般来讲是不重叠去切派值的,但是呢我们在绘制热图的时候,为了让它的力度更细一点,那我们通常会让派值重叠一点,然后这样的话,我们 呃再把热图叠加起来的时候呢,就会让他的力度会稍微更细一点,就是而不是一个个以派式为单位独立的这样一些方块的这些可解释的一个情况。 然后 patch 级别就是还是那个 level, 就是 你选择在并列切片哪个尺度上去切特征就切 patch, 然后的话这个就不用管,就是默认为一就可以了,然后这是拍的大小,然后记住的话你推理模型,还有会你就是你 绘制热图的时候,这个模型是要跟你训练的时候保持一致的,就你不能说你推理热图的时候使用 resine 的, 然后你训练模型使用的是 uni, 那 这样的话你模型训练那部分权重其实就失效了,所以的话这块是需要保持一致的,然后这个 r 四大小也不需要大家去修改,然后这个呢是模型参数,比如说我刚刚使用 a、 b, m, l, 然后它的这个权重所在的一个目录, 比如说你要进行五折加减乘,那我们绘制热图的时候,你不需要把五个模型都给他绘制好,你只需要选择最佳的那一个就可以, 然后的话这个是格式化的一个级别,因为我们假如说你图片真的像刚刚所展示十二万乘以八万这个尺度的话,那他的格式化会非常占线准,所以的话我通常来讲不建议大家设成零,设成一啊,设成二啊这些更小尺度图像会更好一点, 然后如果你想把这个图像再自定义的下彩样一下,那你可以在这里再调节,然后的话这个透明度呢,总的来说就是,呃,你这个热图跟原图像一个叠加的一个情况, 然后的话我们还会把模型所关注的这个 topk 的 图像给展示出来。那接下来呢,我带大家看一个具体我们获取热图的的一个例子。在 hitmap 里, 比如说像这个看一下 topk 里面就会展示模型所挑选出来这个非常重要的一些 patch, 那 你可以去再分析这些 patch 对 你这个所设定这个任务是起到一个什么样作用。 然后另一方面是这个热图,现在大家做这个病例 ai 的 都会在其他论文里面看到这样的一个热图展示,所以的话我们也是支持这个功能的,大家可以把自己的模型设定好,然后去进行这个热图的绘制, 然后因为我们的 pad 是 有重叠的,所以的话相对来讲呢它会连贯一点, 然后总的来说呢这个就相当于是我们软件的功能。然后再总结一下的话,就是说 我们支持预后啊,诊断啊,不同的这些几种模型啊,不同的多式立体算法,然后在训练过程中的这些指标我们会帮大家保存起来,然后也会做一些基本的图形, 所以的话我们相当于是提供了一个基础,并且也支持大家在这个基础之上完成进一步的功能。然后的话我们在交付的时候也是提供原码的,也是方便有一些编程能的同学再进一步的改进。好本期的话我们就到这里。