粉丝13.7万获赞118.7万

嗨,各位,欢迎收看我的频道,我是一个更新就掉粉的 up 主段峰最近掉粉有点慢了,所以加更新视频,争取让老狗的粉丝早日掉到零,加油。 今天呢,我们来看一下这个叉 gbt 的桌面版,不管你是付费用户还是免费用户,都是可以去使用的。稍后我们再来说一下怎么去用跟网页端呢?唯一的区别就是我们可以使用语音来进行聊天了。麻烦你告诉我周杰伦最近一次演唱会在什么时候啊?你可以查他最近一次,就是之前的也可以。 周杰伦最近的一次演唱会是在二零二四年十月二十六日,地点在马来西亚的吉隆坡国家体育场,然后就是他上传文件,这里你可以选择文件图片或者是下面这个屏幕截图,我们来试一下,我这里打开这个 vs code 或者点击截图, 他自动的就上传了这个。那我们可以给他说啊,帮我分析一下画面中是什么东西。 那我们可以在设置里可以看到有个置顶叉 tvt, 如果你把它打开的话,那么你就可以用这个快捷键来进行搜索,我们来试一下把它关掉,比如说有一段代码 我很疑惑,那我直接截图或者是复制,然后粘贴上去,这样就自动问住了这个问题,因为我们刚刚打开了置顶 啊,这就意味着我们可以再去看任何事的时候,这个窗口始终在最前面。像他这个新功能就是这个快捷搜索吧,有点像这个麦克版自带的这个聚焦搜索,以及大家耳熟能详的这个 youtubes 啊,一样的,是吧, 他这个语音阅读呢,增加一个快进和快退。 the text in the image provides an example of creating a javascript。 啊,一些动效做的还是不错的啊,我可以在这里直接切换模型或者呢在上面进行切换。那付费用户和免费用户的区别在哪呢啊?付费用户可以使用 gpd 四 o 和 gpd 四次数呢?好像是八十次,而免费用户呢应该是三小时十 或者十六次,就是比较少吗?啊,我们想用它,那直接打开这个快捷搜索,就直接去问就 ok 了,就会更方便一点啊,那现在我们来说一下这个登录问题,因为有人登录是登录不上的,他是需要资格的,我们先注销一下来看看。一开始应该是这样的吧, 如果你使用你的账号进行登录啊,我们进行登录,这个时候呢会弹出一个窗口说我们没有这个资格,但是呢,也有网友提出了解决方案,从这个解决方案我们就能看出来 确实是一个草台班的。我们再来看一下啊,我们点击登录,然后这个时候其实已经登录完成了,他转圈呢,是在检测是不是给我们发送了这个使用资格,如果检测到你没有被发送,那你就使用不了。这解决方案呢,就是在我们登录完成后,直接给他强制退出,也就是卡曼的加 q 就直接这样退出吗? 就关闭了这个应用,不用让他去检测,他检测的时候我们给他退掉,这回登录完成我们退掉,退掉之后你再打开啊,就已经进来了,草裁班子吧, 他是以这种方式,就是你先登录完成他才会检测你,那么再来试一个普通的账号,我这里呢,直接注册一个新的账号来演示吧。好点,继续我们用新注册的账号进行登录啊。 好,推掉进来,这个就是我们刚注册的新账号,因为是免费用户嘛,所以在这里是切换不了模型的。我们先输入一个, 我们可以在这里看到模型啊,你选哪一个,他就默认用哪一个来聊。大概就是这样。还是挺简单的啊,如果你想要去升级 plus 账号啊,或者 想要找人合租的话啊,不要在评论区找,可以去翻一下这件视频做过有几期,如果本期视频对你有所帮助的话,希望能给阿布主点个赞。祝各位玩的愉快,我们下期再见!拜拜!

openai 刚刚发布了最新的图像生成模型 image 二点零,非常强大,官方介绍呢,这是 openai 首个具备思考能力的图像模型。 那我们在 gpt 里面选择 thinking 或者 pro 模型生图的时候呢, image 二点零可以实时搜索网络的信息,从一个提示词里面去生成多张不同的图片, 并检查输出质量。简单来说就是 ai 生图的效果更加强大了。那我们看了一些 ai 圈的作品呢,发现确实很厉害,给大家介绍介绍几个点。第一,只需要简单的提示时,就能生成复杂的场景,比如说我们这里让它生成一张朋友圈的截图啊,某音的页面,只需要一句话就能生成一张 字体图标, ui 元素都很还原的图片。还有这个多窗口的界面,也是用一句话就能搞定的。第二,视觉保真度和精确度非常高,这个是用 mg 二点零生成的,手写诗歌、照片笔记,还有文理细节都很真实,看起来就是真实的照片。 第三呢,它的多语言理解能力更加强了,优化了中文、日文、韩文等这些非拉丁文字,让语言本身就可以融入到设计里面。那这些都是用 mg 二点零生成的海报,大量的文字,没有乱码,效果真的很棒啊。除了这些呢,官方还介绍了它能生成 很多不同风格和画幅的图片,功能真的很强大。以前啊, banana 是 第一名,那现在 gpt 成了第一了,然后使用的方法也很简单,在 gpt 啊,在 codex, 在 api 三端都可以使用,大家赶紧去试一下吧。

cloud 又升级了。二零二六年五月二十八日, analytics 发布 ops 四点八。这次重点不是依据更强,而是三件事同时发生。第一, ops 四点八更适合代码代理任务和专业工作,而且更会提示不确定。 ops 说它比四点七更少,让自己写出的代码缺陷静默通过。第二, cloud code 加了 dynamic workflows, 可以 把大型任务拆给几十到上百个并行子代理,再汇总检查。这意味着代码迁移跨仓库改造开始接近从启动到合并的工作流。第三,产品层面也变了,用户可以调 cloud 的 努力程度,反 mode 速度可到二点五倍,成本比之前便宜三倍。但真正值得注意的是边界 project glass wind 里约五十个合作方用 missus preview 找到了超过一万个高危或严重漏洞。所以 antropig 也承认,更高能力的 missus 类模型需要更强网络安全防护后才会全面放开。我的判断是, cloud 正从聊天框变成工程协作者,他更会规划,更会检查,也更需要人类审计。

一分钟了解全球 ai 大 事。第一条 open ai 为 windows 端 chat gpt 上线 computer use 桌面控制。 open ai 宣布 windows 版 chat gpt 新增 computer use 功能,支持 ai 远程控制桌面应用、操作软件与文件,提升办公自动化能力。第二条,支付宝发布全球首个 top 分 配与 ai 钱包,构建 ai 原生支付。 富宝推出全球首个偷更配服务及 ai 钱包,基于大模型实现智能理财、风控与支付,打造 ai 原生金融服务体系。第三条四十余款大模型亮相天津智博会 ai 正式迈入产业应用深水区。正在天津举行的二零二六世界智能产业博览会上,四十余款 ai 大 模型集中亮相。 与以往秀机若不同,今年 ai 彻底走向了实用化,比如能不用拆解就诊断发动机故障的维修模型,让技术真正开始为制造业降本增效。 第四条,不用再写代码了, ai 正让应用开发变成说人话,未来的编程可能不再需要敲键盘。在五二七技术日上,蚂蚁集团展示的 muse 平台让没有技术背景的人通过自然语言对话,就能做出复杂的网页和数据库, 这标志着 ai 正在彻底重塑生产力,创造的门槛从未如此之低。第五条, ai 视频创作大爆发,生成量环比激增百分之八十二。随着 cds、 二点零等视频大模型的突破, ai 视频进入了爆发期。 数据显示, q 一 季度 ai 视频生产量环比暴增百分之八十二。不仅是专业导演,许多娱乐科技领域的博主也开始用 ai 批量生成视频素材,内容行业的内卷即将升级。

二零二六年五月二十八日, ai 圈发生大事, oppenai 正式推送 gp 机副五点五任斯顿更新,宣称模型更智能、回复更通顺、逻辑更干净,整体体验全面升级。然而,曾被视为生产力神器的开诺斯,画布功能被官方彻底砍掉。 这一举动并非简单的产品优化,而是在行业告别野蛮增长,进入商业化淘汰赛的重要信号。开诺是有个内 i 核心的长文档协同编辑系统, 它跳出传统一问一答模式,支持独立编辑来内容续写文稿、改稿,即协同优化文案与代码等,是近两年 chat g p p 最实用的生产女王牌。更新后,免费用户永久无法使用, 付费用户只能靠就模型过度。官方称,写作等能力已整合进原声对话界面。砍掉开诺斯,背后藏着四个行业真相,其一, 算力成本居高不下。卢布内埃二零二六年算力预算突破五百亿美元。开诺斯算力消耗是普通对话的二到三倍,使用成本高且变现能力弱,砍掉可削减超百分之三十用于算力开支。 其二,战略全面转向,二零二六年被定义为落地变现之年。欧巴内埃放弃细端市场, 将资源倾斜向企业端、商业端与高净值客户凯诺斯与品牌方向相背。其三,冲刺 ipo 上市。凯诺斯存在技术难题,维护成本高、变现差 是业务累赘,此前多款细端业务已官停。其四,遭遇竞品全面围攻。 antaripay 等竞品在画布、编辑等领域体验反超。凯诺斯无竞争优势,还分散资源。洛班内 i 收缩战线,守护核心业务凯诺斯落幕,宣告 ai 行业上半场结束, 未来呈现三大趋势,免费功能缩减、优质生产力工具走向付费化、高端化、 头部大厂弱化个人市场资源投向商业落地与产业数字化,兼顾降本变现与落地能力的 ai 模式才能立足,这对国内 ai 从业者、 创业者是机遇。海外巨头收缩 c 端业务,国产商与本土创业者可发力个人与中小微企业生产地市场。

今天和大家分享一下我从三月份到五月份使用一些国际顶流大模型的一些感受和想法。 呃,其实在三月份的时候呢,我身边以及呃网络上呢,有很多人都说国际顶流大模型像 cloud code, 像 open ai, 呃怎么样怎么样就是怎么样,神乎其乎, 呃,但当时我对这些东西是呃不怎么上心的,一方面是因为呃一个网络环境问题导致机器使用不了,另一个方面就是当时觉得一些国内的一些模型像豆包啊,像 deepsea 已经足够用了,所以对一些呃国际一些大模型呢,就是没怎么上心。 然后我在三月份的时候呢,发现国内这些模型呢,呃,他对我工作生活上的满足度来说是呃越来越低了,就想着去尝试一下。呃国际顶流大模型的是什么感受。 呃,经过这两个月的使用呢?嗯,我发现呢,最重要的感触是两点,第一点是因为国内的网络环境问题,导致绝大部分用户呢是用不上一些国际顶流大模型的。 第二点就是一个账号问题啊,账号问题其实就是一个谷歌邮箱,谷歌邮箱相当于国内的微信地位,因为我们在国内的时候会使用微信进行各种 app, 各种网址的登录注册,所以说当你有了国外的一个 呃谷歌邮箱之后呢,嗯,对国外的一些网址,一些 app 以及一些大模型的注册登录呢,以及账号的申请呢,都非常非常的方便。 其实这两两个问题最终呢还是最主要的是一个网络环境问题,如果网络环境问题能够解决了之后呢,其实国内基本上每个人 都能够使用上一些国际大模型的,但是就是因为一个网络环境问题,难倒了,难倒了很多人。

一分钟掌握今日全球 ai 圈大事! one open ai codex 重大更新,这次更新的头号主角当属 appshots, 让 ai 看穿屏幕。 codex 能把窗口中没有滚动到的文本文件路径 u r l 读取出来。更震撼的是,如今的 codex 可以 在麦克休眠状态下隔空工作,无需解锁。七乘二十四 h 无线编程 二、智普发布 g l m 五点幺高速版 api, 以每秒四百 tokens 的 速度刷新全球大模型 api 速度上线。三字节跳动开源了其原生统一多模态大模型。 lens 以三 d 参数实现全功能覆盖,打破了理解模型与生成模型之间的技术壁垒,用一个脑子同时搞定图式理解与生成。 四、 open ai 发布 touch ppt for powerpoint, 以插件的形式正式杀入 powerpoint, 还能主动纠 bug。 five wordpress 七点零正式发布原生集成 ai, 迈入智能建站新时代。

ai 三巨头在同一时间选择了三条完全不同的道路。五月十九号, google 一 口气发布二十八个产品,覆盖你日常生活的各个维度。 atropica 招募了 android capacity, 他是世界上最好的深度学习专家, ai 界的绝对意见领袖。 oppo, ai 开始卖算力期货,提前锁定客户和现金流。 google 做广度 snoop 要深度。 oppo ai 拼速度,这标志着 ai 竞争正式进入下半场, ai 时代的工业革命将真正开始。 作为普通 ai 用户,这对我们意味着什么?先说 google, 五月十九号 google i o 大 会,三个最重要的发布, 一个二十四小时不睡觉的 ai 管家 gemini spark, 你 手机关了,他还在后台跑着帮你盯邮件、追任务、操作日历。 新一代旗舰模型 gemini, 三点五 flash, 号称比 cloud、 office 和 gpt 五点五快四倍。 ai 信息 agent, 七成二十四小时帮你监控新闻、博客、社交媒体,有动态主动推送给你。除了这些,还有电影及视频生成、编程平台升级、智能眼镜,一口气二十八项发布 vc mate turk 说了一句话,记得他们曾经落后的时候吗?言外之意是 google 追上来了,而且是产品矩阵级别的碾压。 google 的 战略是建立一个生态帝国,它跟你比的是用户更离不开谁。 杰米纳 spark 看似一个 agent, 实则是永不关闭的 google 服务入口,邮箱、地图搜索、 youtube, 这些生态管道构建了真正的壁垒。再来看 osropic, 就 在同一天下午, androidcapac 发了一条 x, 我 已加入 osropic, 未来几年,大语言模型前沿将尤为关键。这条推文在 ai 圈引发地震, every ceo dan shapiro 转发问了一句, 他看到了什么?这种级别的人换东家不是找工作,而是在投票。 isopic 的 基因从第一天就定了训练最好的模型,并确保他们对人类安全。 这不只是道德口号。今年二月,美国国防部要求所有 ai 供应商移除模型的安全限制,允许军方将 ai 用于一切合法用途。 google 和 oppo ai 都答应了, isopic 没答应, 他拒绝移出自主武器和大规模监控方面的红线。结果,硅胶大楼切断了与 snoop 两亿美元的合同。白宫还把 snoop 列为供应链风险。要知道,这个标签以前只用在华为身上, 放弃两亿美元,也不放弃原则。但 snoop 真正厉害的地方不是只有原则,而 snoop 厉害在于他把这种极致追求变成了极致产品。 cloud ops 被视为长推理和编程的首选。 cloud code 的 教科书级别的案例。 kasper 为什么选择这里?因为现在是定义 ai 方向的最重要窗口,这个窗口不会永远开着。他选择了那个既有原则又能把产品做到极致的团队。 snoop 不 追求产品数量,不追生态,追的是这个世界上最好的人和够硬的产品。再看 opai, 同一天, sam 奥特曼发了两条 x。 第一条,客户越来越要求算力确定性,我们预期世界将在一段时间内持续处于算力紧缺状态。我们推出一到三年算力,承诺合同折扣价。 第二条, openai 向当前 ycp 四人每家创业公司投资两百万美元 tokens。 yc 是 硅谷最知名的创业孵化期, airbnb、 groupbox、 stripe 都从这里出来。奥特曼本人就是 yc 的 前总裁。 翻译一下, oppo, ai 正在把算力做成期货,就像你在 ai 爆发前买显卡,二零二六年就是囤积头肯的时候。奥特曼的逻辑非常直白,世界缺算力,以后更缺。你现在跟我签长约,我给你折扣,你拿到确定性,我锁定用户,达到现金流。 openai 的 处境其实是最微妙的,它是全世界最出名的 ai 公司,欠了 gbt 有 九亿周活跃用户,但它在定义前沿上渐渐比不过 astropic。 在生态分发上,谷歌的产品矩阵更广。奥特曼做了一件非常务实的事,既然模型不是独家武器了,那就把用户量和品牌认知变成护城河。算力承诺、 token 折扣,本质上是一样的。在 agi 烧干现金流之前,把算力锁定成可预期的收入。 openai 打的是商业战,不跟你比谁最聪明,跟你比谁先锁定用户,把算力变成收入,活着才有资格谈未来。 那为什么路会在此刻分叉?你要理解这三条路,你得先知道一件事, ai 竞赛进入新阶段,二零二三年到二零二五年上半场比的是谁先做出 gpt 四级别的东西。模型能力就是一切切的, gpt 靠先发优势拿下了九亿周 五。二零二六年开始,模型能力的差距缩小了,在常规里和编程上依然是首选。 g p t 五点五在日常任务工具生态上最成熟,没有谁全面碾压谁,但模型不再是差异化武器。用什么定义一家 ai 公司? 酷狗结合生态优势,选了广度。我不做最强的模型,但我让用户离不开我的生态。 sony 可结合产品优势选了深度。我不堆产品数量,但我做细分领域的最强产品。 oppo ai 结合品牌认知选个速度。我不纠结谁更前沿,但我先把现金流锁死。 那么我们作为普通 ai 用户怎么选择?当模型开始分化,应用集中爆发, ai 就 像电力普及一样,进入各行各业巨头之间的竞争,对我们普通用户来说其实是好事,他们各走一条路,反而给了我们更多的选择空间。 以前只有一个欠的 gpt 能打,也没得选,现在三家各有所长,关键不再是哪个最强,而是哪个最适合你。搜索调研、多模态制作,用解密来 深度分析,写长文、写代码,用 cloud 日常对话、快速原型和欠的 gpt 了解各自模型的特点,各取所长,这是大多数人的最优策略。 同一天,三家公司亮出三张不同的牌,不是巧合。这宣告了一个事实,模型绝对能力的提升速度在放缓,顶级模型间的差异化在缩小,大家开始在产品和服务上创造价值, 这为相对落后的模型厂商提供了追赶的机会。对于 ai 赛道的创业团队来说,增加了一份挑战,这份挑战来自于你更需要找到差异化的需求和优势,避开与大厂间的直接竞争。 对于大多数 ai 产品的用户而言,合理选择各家产品,搭建起真正能够结合自身的 ai 工作流,实现降本增效的机会也越来越成熟。到了下半场,产品会紧喷式爆发, ai 时代的工业革命才真正开始。

一、 chat gpt 正式打通银行 api, 上线个人理财功能,实时查看余额、交易流水、负债明细,还能生成专属仪表盘,财务状况一目了然。 用户担心,这怕不是在给黑客发年终奖,官方强调只读不操作。二、 jamaican 三点五, pro 直接从三点二跳级冲到三点五, 编程能力直接追平 gpt 五点五。除此之外,谷歌还发布 gemini spark 全能 ai 智能体,可以自主判断需求,主动帮你下单消费。 三、 kimi webbridge 接管你的浏览器,替你完成所有网页繁琐操作,包括设媒、热点选择题、求职信息收集、量化策略、回测等。已经有用户用它实现一键接管量化研究平台,原来需要几小时的活,现在几分钟搞定。 四、阿里千问正式与国家药监局信息中心达成合作,全网独家接入数百万份药品、化妆品、医疗器械国家级权威数据。千问将持续跟随国家药监局信息中心动态更新数据,确保所有信息实时、准确、权威。

一分钟看完一周 ai 大 事。 openai 升级 chat gpt 默认模型,幻觉降一半,废话降三成,所有人都能免费用 codex 上线浏览器控制,它能从后台打开网页,抓取信息,填写表单,执行操作,不影响你正常上网。 codex 接管办公。再进一步, openai 发布三款实时语音模型,实时对话模型能用来打造语音助理,以后能跟龙虾开会了实时同传,能用来开发翻译工具,实时转录,适合做会议纪要和课堂笔记。 anthropy 官宣 ai 读心术,用解码器把 cloud 在 输出之前的想法翻译成人话,再让另一个模型反推出激活状态做验证,结果发现 cloud 的 内心戏真的多,他经常怀疑人类是否在骗他,还会冒出欺骗人类的想法,人类的 pua 他 全都知道,但还是会配合你演戏。 cloud 智能体上线做梦能力,龙虾干完活会通过做梦复盘,把本次工作的经验教训内化成记忆。 google 升级 jam 四用, 用一个清亮的草稿模型,提前猜测接下来的 token 主模型,检查后,如果正确直接采纳,输出质量完全不变,速度暴涨三倍。 sakana 和英伟大联合发布新算法,跳过大模型没用的计算,有用的部分打包发给 gpu, 推理速度快三成。 科学家开源 ai 科学家 ai 能自己规划实验,再通过眼镜指导人类执行,最后自己分析数据算写论文。人类反过来给 ai 打工。工程师开源一人公司系统 除了老板都是 agent。 ai hr 去龙虾市场招募数字员工,项目完成立即解雇,全程不用人操心。 工程师开源 ai 写 ppt, 使用前端组建作换灯片,自带图标库和动效库,把链接发给龙虾就能学会 gpt 生图的含金量还在上升。用 gpt 生成故事版,分镜联动 cds 出片,用 gpt 生成网页截图,联动 gemini 还原成真实网页。 gpt 彻底终结了视觉设计。 海豚发布最强开源图像模型,主打文字渲染和图文混排,放弃 v a e 解码,端到端处理像素研究原开源实时数字人直播模型,能同时生成语音和画面,以后能跟 ai 主播连麦了。英伟达,开源 ai 演员 上传一张照片就能生成数字人,还能做出任何表情和动作。 unity 上线官方 agent, ai 直接操作编辑器搭建游戏场景,支持 codex 和 cloud code 接管,不懂建模和代码也能做游戏, ai 游戏赛道将迎来一波爆发。研究员,开源最强三 d 重建模型,一张照片就能重建场景里的所有物体。 研究员,开源三 d 世界模型,在地图上画个范围,就能用街景图生成三 d 世界。 genesis 发布首个跟人类能力相当的机器人,大脑 和林巧手能完成实验级精细操作,能弹人类无法完成的钢琴曲,各种家务活更是小菜一碟。机器人终于完成重大突破,进入人类生活再无障碍!