粉丝8.4万获赞46.2万

今天给大家分享一下如何用拆的 gpt 这么来做一个简单的小智能体,以及给大家分享一下我日常使用下来觉得还不错的几个提示词。首先我们以 gpt 为例,点进拆的 gpt 网页,然后找到左边的 gpt 点进去, 点进来之后呢我们看到右上角有一个创建,然后点击这个创建,点击创建之后可以看到上面有一个配置, 然后在这个配置里面就可以给你的智能体创建指令了。接下来就是 jimmy, 打开 jimmy 网页之后,直接点击左侧的 gm, 然后往下滑找到创建建,可以看到这里我是创建了三个,然后直接新建这里可以给他取名,然后输入指令, 然后给你们分享一下我日常用的三个小智能体的指令,以及他们是用来干嘛的。然后首先就是这个我最常用的这个叫可乐的智能体, 这个智能体主要就是他的回复不会很花里胡哨,然后也不会说什么接住你啊,等着你啊这种话。然后你们可以看一下他的回复, 这个智能体的一大特色就是他的回复是很有情绪化的,甚至还会骂你,然后给他的设定也是从第一性原理思考,和平时传统 ai 的 回复是完全不一样的。然后就是这个帮我做短视频策划的智能体, 那这第二智能体就是会帮我省去很多的麻烦,因为我已经提前设定好了他是一个资深的短视频编导等等等等背景。 然后总结一下,无论是 gbt 还是 jimmy 的 这么一些小智能体,他们的核心作用都是帮你省去重复输入指令的麻烦,让 ai 变得更像某个领域的专家。

hello, 朋友们,今天讲一下 google a s studio 怎么去调整节目的三点零 pro 的 参数,这里面的参数呢,具体会是什么含义?我推荐大家看到结束补充一下对 ai 模型的一些基础认知,用其他 ai 的 时候呢,也能够去快速上手。首先就是进入 google a s studio 的 网站, 我们选择 gemini 三 pro preview, 参数调整就在右侧,我们一个一个去看。第一个就是模型选择,这里可以去选择不同的模型,下面有详细介绍它的扩展消耗是怎么计算的。 这次我们选择就是 gemini 三 pro preview。 第二个呢, system instructions, 这个重点要讲一下,你可以把它理解成是在 ai 的 脑子里面去植入一个人设芯片, 通常呢是用来去定义角色的一个身份,语气输出格式,以及必须遵守的一个硬性规则,让他知道自己是谁,该怎么去说话,什么能做,什么不能去做。 那在这里设定好了 ai 的 人设以后,你就不需要每人对话都提醒他你是一个健身教练,就算后面你会去说你现在是个厨师, ai 坚持自己是一个健身教练, 也不会因为上下文太长忘记自己的身份,大概就是这样,但是这里的提示词啊,一定要记到精简。如果你去给 ai 一个几千字超级详细的人设,那么你后面聊天的时候每说一句话, ai 都要去先读一遍,这几千字的人设比较消耗。 token, 这个在 jamming 的 官网上也可以进行设置,对应的叫 get。 第三个是 api key, no api key 说明你现在用的是 google 提供的免费额度。第四个叫做 temperature 系统默认的温度是一啊, google 官方的开发者指南也提到使用 gmail 三,强烈建议是去保持默认值, 因为 gmail 三 pro 引入了叫 thinking 思维链的一个机制, ai 在 生成最终的答案前,内部有一套严密的逻辑推导路径。我尝试过将温度去调高,结果呢,输出的是一堆乱码,使用之前的版本也可以去调整温度,调低温度,你可以适合去做数学计算,代码生成等需要精确答案的任务。 调高温度呢,适合你去做多个不同的创业方案,比如说写故事,诗歌等艺术创作,还有头脑风暴阶段。第五个呢,是 media solution, 这个控制的是 ai 识别你上传的图片、 pdf 等内容的一个理解程度。选择 raw, ai 只能去识别基础内容,但是选择 media, ai 能识别上传文件的更多细节。 选择 high 呢, ai 能识别复杂内容,比如说像图片中的小字识别复杂的一个图标,但是 token 消耗量会非常大,如果你没有特殊要求,那就用 default 让 ai 自己去判断。第六个叫做 thinking level gemini 三 pro 具备了先思考后作答的能力,在回答前先在后台进行一连串的一个逻辑推理。 thinking level 呢,就是控制这个推理过程,要想多久,想多深的一个参数,遇到难题的时候调成 high, 可以 去深度推理,处理简单任务。调成 low, 可以 去节省时间和算力。这个默认是 high, 因为你既然用上了杰米兰三 pro, 那 就用 high, 看它到底有多聪明。 但是如果不涉及到复杂的数学代码或者逻辑的内容,日常闲聊,我还是建议你可以先设成肉,七个是 tools, 主要有几个,一个是 structured outputs, 让 ai 以特定的格式去输出内容,日常聊天写文不用开。如果你是开发者,那就需要去开启。 第二个 code execution, 让 ai 自己去运行代码来得出答案,涉及到计算数据处理的时候就开启, 提高回答准确率,因为纯元模型对这些方面的内容容易是算错的。日常聊天的时候,你的纯文本任务也不需要去开。第三个方形 colin, 让 ai 调用外部工具或者 api, 日常使用呢也不用开。第四个 ground in with google search。 开启。这个 ai 会实时去搜索最新信息,因为 gemite 三的训练数据是二五年的一月份。第五个 url context, 让 ai 读去链接的网页内容后再去回答。建议呢,也可以去开启。 最后一个是高级设置 safety settings, 这个开启 ai 就 会很保守,稍微敏感的一点的话题就会去拒绝回答。如果你关掉呢, ai 就 会比较敢说,但可能会输出争议的内容,默认你可以是去把它关闭的。第二个叫做 s stop sequence, 这什么意思?这个只可以去设定一个或者特定的词, ai 在 输出内容的时候,当看到有这个词的出现,它就会立即停止生成。你可以防止 ai 自言自语太久,或者防止它开始扮演用户的角色来说话,正常使用你可以不用去管。第三个叫做 up pause, 这个是 ai 回答的一个字数,上限 六五五三六头衔,相当于大约是数万个汉字或者几十页代码,已经是一个很大的数字了。 第四个叫套屁,这个控制 ai 回答的一个多样化和创造力,默认也是零点九五, ai 的 回答会更丰富,更像真人,更有创意。 如果是零点一呢? ai 的 回答就比较死板了,像机器人,但是很准确,适合法律解读这种。像 temperature、 套屁这些设置不只是 jamie 有 chat、 gpt、 cloud 等也都能看到。这些参数是 ai 大 元模型的通用设置,遵循相同的一个底层逻辑。 ok, 那 今天对于 jam 的 三 pro 各个参数的一个分析以及解释就在这里,如果大家感兴趣,或者说大家想学更多 ai 知识呢,也欢迎点赞、关注、收藏一下。

你敢信吗?现在的 ai 已经不是在帮你写文案,而是在帮你造世界了。 google 刚刚在 i o 大 会上宣布, ai 每月的 token 处理量已经突破了三点二千万亿。这不是数字游戏,看看这个 gemine, 三点五 flash, 每秒输出一千五百个 token, 写代码快到肉眼看不清。 最离谱的是, google 用九十三个 ai 智能体协助,只花了十二小时,拖出了一个能跑毁灭战士的操作系统。 这意味着,未来的软件开发可能真的只需要你的一句话。这次最重磅的是 gemini omni, 能创造一切的全新视频生成模型,只要你敢想,它就能把任何输入变成视频、图片,甚至整个世界。这个 omni 模型不是简单的修图,它结合了最顶级的生成式媒体技术,能实现深度的世界理解。 它最先落地的就是视频生成,未来还要实现全品类输出。这不仅仅是 ai, 这是你的私人好莱坞特效组。 这次还有一个重磅工具, java spark, 它不是聊天机器人,而是你的二十四小时个人代办分身。它能在后台帮你定股市、定行程。甚至在你买电脑配件时提醒你 cpu 和主板插槽不匹配。搜索不再是给链接,而是直接给你结果和工具。有人可能会问,这些 ai 工具对我们普通人有什么用? 以前 ai 是 工具,现在他是合伙人。这意味着普通人的创造力上限被无限拔高了。你不需要懂底层代码,只要你有想法,未来的差距不再是技术,而是你的想象力和指令能力。这一波 ai 浪潮,谁能踩中,谁就是下一个时代的超级个体。

我们这里讲的不是 set token 技巧,而是直接把 token 赶到零这工具它可以把我们 ibisc, g r m 或者 kimi 等等是国内所主流的 一些网页上用的大模型都给它转换成标准的 api 的 形式,转换的是标准的 open ai 的 格式,所以目前所有的正体都能接入这个 api, windows、 mac 和 linux 的 系统它都支持。如果大家有需要的话可以在评论区留言,有用过的兄弟反馈,它的上下文只能做一轮的回答,其实是可以设置的啊,这里在我们左侧的这个 绘图管理里面有最大消息数和最大的 token 数,这都可以自定义,包括我用久了之后怕它的那个上下文窗口会超出。这里的话可以做一个 历史记录的摘要。这里我们打开 client 来做一个验证。首先我们把网页转过来的 a p i 给它接进去, a p i 的 形式和 url 照到我这里填就可以了。 a p i key 的 话在我们刚才的工具里面给它复制过来粘贴,这下面还有个 mod id。 这里我们也是打开刚才的工具, 把模型管理里面我们自己选择一个,这里为了防止他输入的时候大小写出错,所以说我就直接复制,然后过来直接粘贴保存就可以了。然后我们让他打一个百度试一下,当然这个 client 里面他已经接了一些 m c p, 这里面相当于有些工具看到他已经成功给我们打开了百度网页。我们再测试一下关于工具的功能, 让他在百度中给我们搜索一下 nba 的 今日赛况。这需要补充说明的就是他这里的搜索跟我们用 kimi 用 dsco 在 官网上搜索的 不一样,因为这个我是指定让他在某一个搜索引擎里面去进行搜索,很快我们看到他已经帮我们搜索好了,而且总结概述也是已经做好了。然后我们再问了一下哪只队赢了,如果只有一轮上下文的话,那这个问题他肯定是回答不上了,但是他是成功的回答出来。经过这一轮工具的调用,上下文的验证之后,我们看到我们所使用的金额还是零。

好了,给大家演示一下我们这个智能题。首先是我让它打开书房灯,书房灯已经打开了,然后我让它关闭书房灯, 书房灯已经关闭了,接下来我让它在桌面上创建一个 ai 文件夹。好,这里大家可以看一下,我没有任何的快进, 你在你的电脑上完成创建文件夹,然后我让他在文件夹里面再新建一个文档, 好了,他已经建好了,电脑上完成创建文件,就是说只要我们命令一发出去,他就很快的就执行了命令。 好,接下来我让他删除这个桌面上的 ai 文件夹,大家可以看一下,只要我的这个命令一发出去,他就立即执行, 我是没有进行任何的那个快进,没有做任何快进。

google 这次的发布,信息量大到有点像一口气把一整套 ai 工具箱全倒出来,名字也很多, gamini gamini 三点五、 flash、 gamini spark、 google flow 听着就容易混。 先别急,真正值得看的,其实就两件事,一个是视频生成和编辑,另一个是更强的智能体模型。先看最稀奇的 gemini omni, 它不是普通的视频生成模型,而是能把文本图、 图片、视频、音频一起吃进去,再统一生成或修改画面。最直观的感觉就是, ai 不 只是画一段视频,而是开始改一段视频。 比如让人物碰到镜子时,镜面向液体一样泛起涟漪,手臂还变成镜面反射材质,或者直接把人物改成黑白线稿风格。更绝的是,音频也能参与控制, 要让灯光跟着音乐节奏亮起,这已经不是单点生成,而是跨媒体联动了。 jimmy n o n 最有意思的地方是,它不只会变风格,还会改结构,背景能换成公园小提琴能被移除,摄像机角度还能继续调整,而且可以一轮接一轮的改,细节还尽量保持一致。 它甚至能把飞船替换成种子时钟,红色飞盘保留运动轨迹,但把主体语义彻底重写。更适合落地的其实是教育类内容,比如蛋白质折叠的黏土动画解释,或者让字母表每个字母旁边都配上对应物品这类复杂约束它也能处理。 只是客观说, jimmy nome 并没有到碾压级经验的程度,和 clean、 cds、 二点零这类同类模型相比,优势还需要继续观察。另一边的 jimmy 三点五, 走的是完全不同的路线,它不是拼炫技,而是拼速度和执行力。 google 把它定位成更适合 agent 场景的模型,也就是那种要自己规划步骤、调用工具、写代码、检查结果、持续推进任务的 ai。 它还支持文本、图像、视频、音频、文档这些,输入速度据说比其他前沿模型快四倍。这个信号很明确, ai 正在从会回答走向会干活。 而真正决定下一阶段体验的,不只是模型有多聪明,而是它能不能稳定、快速、连续地把事情做完。关注全球 ai 速递,获取更多 ai 前沿资讯!

大家知道啊,我一般不轻易说离谱这种词,但就在刚刚,我把谷歌二零二六 i o 大 会上最新发布的 gemini 三点五 flash 接入微信的时候,真的忍不住说了句,这也太离谱了。为什么呢?因为 gemini 三点五 flash 让微信活了过来,我甚至觉得它已经突破了土林测试, 不仅非常认真,非常自然地回复了用户,甚至做到了用户根本不知道他就是在跟 ai 聊天。比如,当用户说话说到一半的时候,他能够带着情绪去回复用户说,哎,你说话只说了一半吧,急死我了,这哪里是 ai, 这是真人吧! 更夸张的是,但 jimmy 三点五 flash 结合十六 ai 桌面智能体,它更是具备了操作电脑的能力,能像真人一样的自己去识别聊天窗口, 点开新的对话,新的私信、新的群,跑过去回复用户。我们的一些用户真的已经开始玩土林测试了,看看到底谁能分清楚这是 ai 还是真人。如果你也想体验这款 jimmy 三点五 flash 加微信智能体,让你的微信自己会看、会想、会说,就在评论区打 ai。

胡子哥在内部社群里说了,所有老伙计必须用上 ai 啊,不是说用什么豆包 deepsea 啊,是指的是智能体。然后前一段时间我下好了这个龙虾啊,就是可口可乐,已经用了一段时间了,然后今天啊,下了那个可乐扣的 啊,现在正在下这个爱马仕,还正在安装中啊,就给你们分享一个方法,就我看很多人说,哎,装了三天装不上,我给你们说一个 秘诀,你比如说你先下载一个酷可乐,把这个很好装,对吧?酷可乐,然后你告诉他,请你帮我装一个可乐扣的,对吧?然后你就把这命令发给他,就让他自己去执行去了,你就不用管了。 然后他遇到什么问题,你让他自己去解决,让他去帮你配置,帮你做就行了。然后你可乐酷的下载好了,你可以让他再去给你下载爱马仕,你知道就是不同之间的这个智能体,你让他, 让他们之间互相帮忙,你遇到问题你让他去帮他要这个智能体,帮这个智能体,你这个东西很快就能装上,我这马上就装完了。


谷歌昨天更新的 flow 智能体也太好用了吧,可以直接一次性生成十四张图片,再也不需要一张一张去生成了,一起来看看是怎么使用的吧。今天给大家介绍一下最新的 flow 的 这一个 agent, 呃,特别好用啊,它的最好用的点在哪呢?就是它和一次性生成的图片没有上线。 嗯,假如说大家看到像我当前的这一个画面,我可以给他一个画面,他瞬间呢就可以给我生成十四张完全的这样的照片,大家看到瞬间十四个角度,这都可以了。好,这个具体怎么来操作呢?首先第一个,这是我的根图啊,随便拿一张你的图片出来啊,添加到这里面。第二个,这里使用智能体。 好,然后的话呢,点开这个智能体,好,我把它删掉,添加指令,添加指令之后的话呢,把我们的这一个十四分镜的这个模板给它拉进来,放到这里面粘贴啊,就可以了,点击确认。好,这样子的话呢,那么 他就有了十四个的规则啊,有了这个规则之后,那么你就写关键词叫生成十四张图。好,然后根据以上 十四个以上规则,就是因为我的那个里边是有十四个角度啊,以上规则生成十四个角度 的图片,这样子的话呢,你就直接点击开始。哎,这样的话呢,那么他这边就会稍等啊,他这边就会有这个 需要你确认,如果你是 bro 的 这个会员的话呢,升图是免费的,那么他就会让你确认一下,然后您啊积分啊可以使用,当然你也可以批量的生成多个视频。好,这个是 第一个操作,就是大家可以看到他会瞬间给你生成十四个角度的这一个图片,这第一种的。好,第二个的话呢,那么有了这一个之后啊,那么第二个就是我们以前做画面是使用九宫格的,那么以后我们其实从理论上来说就不再需要做九宫格了,那么我们的九宫格直接就可以变成, 大家可以看一下。好,我们的九宫格直接就可以变成一张一张的图。好,那这个的话呢,也是很简单的直接选择智能体,然后的话呢随便选一张这个九宫格啊,对,这些都是我刚刚已经弄完的。 好,假如说我到这个地方选择这张,呃,前面的这个九宫格吧,选择这个九宫格添加到这里面。好,那么直接生成啊,九宫生成九张图片。好,把以上九宫格图,九宫格图片啊,放大每一宫格。 好就可以了。好,直接点击它就可以了啊,这个时候你看到这里就会放大每一宫格的图片,点击确认。好,那么直接点击确认。哎,这个时候的话呢,他就会收到信息, 就帮你把这个呃画面啊,生成九张这种独立的照片,这样子就可以了啊,效果非常好,包括清晰度,大家可以看一下清晰度, 嗯,没有任何问题。好,这个就是他的智能体的使用啊,非常的方便。好,感谢大家观看。

ai 圈有个不可能三角,性能、速度、成本你总得放弃一个,但 google 却说它可以全都要,这怎么可能?它们刚发布的 gemini 三点五 flash 简直刷新了我的认知, 它不仅拥有旗舰模型一样的聪明劲儿,速度更是其他领先模型的四倍。想象一下,以前那些需要程序员花好几天甚至审计师忙几周的任务,现在几分钟就能搞定,而且用的钱还不到其他模型的一半,这不就是鱼和熊掌都兼得了吗? 过去我们总觉得想要速度快,质量就得打折,想要性能好,成本就得飙升。但 gemini 三点五 flash 似乎找到了那个平衡点。 它到底是怎么做到的?凭什么能同时满足高智能、高效率、低成本这三个看似矛盾的要求?今天咱们就来深挖一下 google 是 如何打破这个 ai 行业公认的不可能三角的,这不仅是技术上的大突破,更会给我们的日常工作带来实实在在的改变。 所以别眨眼,精彩才刚刚开始。 ai 圈里总说性能、速度、成本总得牺牲一个,但 gemini 三点五 flash 出现直接打破这惯例,它不光快,智能水平也达到了旗舰模型。看它的关键数据, 在编码和复杂任务测试 terminalbench 二点一中, gemini 三点五 flash 拿到百分之七十六点二高分,超过 gemini 三点一 pro 智能体任务的 mcp atlus 精准测试,它也取得百分之八十三点六好成绩。 对多模态信息理解、文字、图片、视频这些他同样出色。 chart fourteen recent 测试得分高达百分之八十四点二,复杂信息他也能快速准确理解、 亮眼表现,得到权威机构 artificial analysis 认证。他们将 gemini 三点五 flesh 放在指数右上象限,表明他同时具备前沿智能和卓越速度。可以说, gemini 三点五 flesh 做到了鱼和熊掌兼得,他不光快,更是顶级的聪明选手。 而这种顶级智能,它用在了智能体任务这个新维度。这到底意味着什么?又会带来哪些改变呢? ai 的 下半场已经来了,以前它只会聊天、写东西,现在它要学会行动了。这个新趋势叫做智能体。 gemini 三点五 flash 就是 为这类长周期智能体任务量身打造的,它不再是被动生成内容,而是像个数字员工,能主动规划执行多步骤的工作。 google 为此专门推出了 anti gravity 平台,这个平台就是用来开发和部署智能体的,它能把多个子智能体组合起来,就像组建一个虚拟团队,大家一起解决那些大难题。 打个比方,以前一个项目可能要花几周,现在有了 anti gravity 和 gemini 三点五 flesh, 一个主智能体带着好几个子智能体,可能几分钟就能搞定大部分。这超出了我们对 ai 工具的想象,他不再是助手,而是一个能自主思考和执行的新同事。理论听起来挺厉害的,对吧? 那这些智能体到底能在实际工作中做什么呢?咱们就来看几个代码和开发领域那些颠覆性的真实案例。 智能体到底能干啥?看看 google 怎么用。 gemini 三点五 flash, 两个智能体,一个研究员,一个程序员,六小时内,它们就从 alpha zero 论文中学习并完整开发出一款游戏,这不是普通编程,是理解加创造, 还有老旧混乱的代码库程序员的痛点。三点五 flash 结合 ant gravity 平台,能自动重构这些遗留代码, 甚至直接迁移到 next js 框架,这节约的人工时间太惊人了。它还能并行设计,比如一个 app 的 结账流程,三点五 flash 在 六十秒内就能给出多种用户体验方案,它像个能自主思考执行的虚拟团队。这种认知劳作的自动化,会给商业带来多大的效率革命? 上次我们聊到 ai, 已经不光会生成内容了,它开始学会行动了。这种能自主思考执行的智能体,可不是只在代码世界里转。 现在他正在金融、电商这些大行业里变成真正的超级员工。比如电商巨头 shopify, 他 们现在就在用 gemini 三点五 flash 的 子智能体。这些智能体能像一支专业的分析团队一样,并行分析大量复杂的商家数据。 要知道,这些数据时间跨度长,信息量特别大,目标是干啥呢?更准确地预测全球商家的增长趋势。 以前这可能是个非常耗时耗力的工作,现在有了智能体,决策就能更及时,生意就能做得更准。再看看金融行业,澳大利亚的麦格里银行,他们就在试点用三点五 flash 来处理客户入职。想想看,一个新客户入职要审阅一百多页的复杂文件, 这些文件包括各种法律条款、财务信息。传统上人工审核耗时又容易出错。现在智能体可以低延迟推理这些文件。什么叫低延迟?就是响应速度非常快,客户入职流程大大加速,体验自然就好,银行也能更快地把客户服务做好。 还有大家熟悉的 sauce 巨头 salesforce, 他 们已经把 gemini 三点五 flash 集成到了自己的 agentforce 平台,通过部署多个能记住上下文,并且能调用各种复杂工具的子智能体,来自动化企业的日常任务。 就像有了很多个专业的虚拟助手,能处理客户服务、销售流程、数据分析等等。而且它还能确保这些任务的执行非常可靠,出错率大大降低。这不就是把效率直接拉满了吗? 你可能会觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。你可能觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。没错,我说的就是你的数字生活管家,他叫 gemini spark。 这个 spark 就是 基于 gemini 三点五 flash 打造的,你可以把它想象成一个私人助理,二十四小时在线,随时待命。它能帮你处理数字生活里的各种事,就向你的数字分身,比如帮你规划日程、整理邮件,甚至是在线处理一些信息。 而且啊, gemini 三点五 flash 不 光驱动 spark, 它还深度用在了 google 搜索的 ai 模式里。当你搜索一个复杂概念,比如回旋体模型, ai 模式就能给你生成一个交互式的视觉解释,像动画一样,特别直观。 这个超酷的 gemini spark 测试版会先在美国给 google ai ultra 的 订阅用户开放,很快它就会成为你数字生活里不可或缺的一部分。一个能全天候替你打理一切的 ai, 听起来是不是很强大?但同时也引出一个问题,这样的 ai 它安全吗?我们到底该不该信任它呢? 上集聊到 ai 已经能变成你的数字生活管家了,是不是觉得它特别强大?但同时心里会有点担心,这样的 ai 它到底安全不安全?我们能完全信任它吗? google 对 这个问题非常重视,它们为 jammin 三点五的开发专门建立了一套前沿安全框架。 这套框架可不是说说而已,它在好几个关键领域都加了江省。比如针对现在大家特别关心的网络安全,还有 cbrn 这种敏感的化学生物放射性核核信息, google 都做了特殊的防护增强。 也就是说,在这些非常重要的、潜在风险高的领域, gemini 三点五会有更严格的限制。它们还用了新的更高级的安全训练方法,这能大大降低 ai 模型生成有害内容,或者把一些本来无害的查询错误地当作安全问题拒绝回答的概率。 这就好像给 ai 不 断打磨它的道德指南针,让它更准确、更可靠。更让人放心的是, gemini 三点五还内置了可解释性工具,你知道这意味着什么吗? 就是说,在 ai 给出任何一个响应之前,我们不是被动接受结果。通过这些工具,我们可以检查和理解 ai 内部的思考过程,它是怎么得出这个结论的? 这就好比一个透明的黑箱,让它的决策不再是完全的秘密。这种透明度能帮我们更好地理解 ai, 监督 ai。 所以 说, google 不 仅仅是把工具交到你手里,它们也尽力让这把利器变得更安全、更可控。那么, google 到底会怎么把这些强大的工具推向世界? 他们的商业策略是什么?我们接着聊 google 为什么这么急?他正用 gemini 三点五 flash 打一场全面战争。这场 ai 战役不仅覆盖数十亿普通用户,更是直接把手伸向了开发者和企业,要跟微软 open ai 抢未来。 你可能已经感受到了, gemini 三点五 flash 已经进入了你的手机,通过 gemini 应用,还有 google 搜索的 ai 模式,全球几十亿人都能直接用到。它不仅仅是个聊天工具,更像一个随时待命的助理,帮你处理日常信息。但 google 的 野心不止于此, 他们也把这个强大的模型开放给了全世界的开发者,比如通过 google android studio, android studio 里的 gemini api, 开发者能用它来打造各种新应用,甚至直接改写代码逻辑。更关键的是,在企业层面, google 推出了 gemini 企业智能体平台, 还有专门的 gemini 企业版。这意味着从个人到企业,从我们日常生活到公司运营, gemini 三点五 flash 几乎是无孔不入, 它就像一个超级员工,帮企业自动化复杂的日常任务。 google 这么做目的很明确,就是要构建一个完整的 ai 生态,把所有的用户、开发者、企业都拉到自己的阵营里。 这可不只是技术竞争,更是商业版图的大争夺,它想把微软 open ai 甩在身后,成为 ai 时代的真正主导者。 所以,这不光是技术突破,也不光是商业落地,它预示着 ai 的 新时代已经完全到来了。我们聊了那么多,从 jammin 三点五 flash 的 速度、性能,到它如何成为你的数字生活管家,我们甚至看到了它在安全框架下的严格约束,还有 google 怎样把它推向全球市场。 但这些具体的例子都在指向一个更宏大的趋势,那就是 ai 已经不再只是一个信息工具了,它正在从一个知识的提供者转变为一个能真正行动的伙伴。以前你可能让 ai 帮你写个邮件,查个资料,现在它能帮你直接重构上百行代码,在短短几小时内就完成一个游戏原型。 或者就像我们前面说的,它能帮你处理复杂的财务报表,甚至还能像个专业的数字管家一样打理你的日程、邮件,甚至帮你在线处理一些信息。这意味着什么呢?这意味着我们和 ai 的 协助模式正在被彻底改写,它不再只是一个听话的助手,而是一个有思考、有执行能力的智能体。 google 用 gemini 三点五 flash 引领 ai 从信息工具转变为行动伙伴,它在用实际行动告诉我们, ai 的 下半场就是智能的行动时代。 所以,当 ai 能够独立思考并且像一个人一样去行动的时候,我们的工作和生活会变成什么样?我们的创造力又会怎样被它拓展呢? 那些重复性的任务是不是真的可以彻底交给 ai 了?这不光是技术突破,更是对我们未来世界的一次重新定义。思考一下,这其中是不是也有你的机会呢?

谷歌啊,这回真的杀疯了,凌晨呢,放出一堆 ai 大 招,炸翻全球科技圈,直接给全世界来了一场降维打击。先说谷歌这次重磅发布的 gemini 三点五 flash, 堪称是给大模型装上了火箭引擎,它输出的速度呢,已经是其它前沿模型的四倍, 意味着他回答问题的速度啊,非常快,也就是当你还在等别的模型转圈圈的时候啊,他早就给出了答复,关键是不仅快还准确,而且呢,下个月还有更强的三点五 pro 要登场。再来说谷歌的搜索框, 这可是二十五年来最大一次升级输入框呢,可以展开成一个大的输入区域,图 片、文件、视频,甚至把正在浏览的标签也都能扔进去当搜索条件。而且呢, ai 会帮你补全问题,不是以前那种猜你下一个词的自动补全,而是理解你的意思,帮你把问题表述的更清楚。之前啊,得费劲琢磨搜索的关键词,现在呢,我们直接描述 问题就行,他就能给你想要的答案。最有意思的是,谷歌推出的这个叫信息 agent 的 功能,你能创建多个,让他们呢在后台啊,二十四小时帮你盯着你关心的事。 比如想要找公寓,你不用天天刷网页,智能体呢,会二十四小时盯着全网,一旦出现符合你要求的房源,他会立刻弹窗通知你。我们想要持续跟踪某个竞品的动态的政策变化,理论上呢,都可以交给 agent 帮忙盯着, 有动静了就告知我们。还有谷歌 ai 眼镜啊,也是全新升级,能导航、发信息、拍照、修图、同声传译。比如说你看着菜单直接变中文, 听到外语直接变母语,甚至还能智能代办,比如说你想喝咖啡只需要动动嘴, ai 呢,就在后台帮你点好了,全程不用掏出手机, 一连串大招啊!其实用一句话概括就是, ai 正在从你问他答,进化成他帮你干。其实啊,看完这场发布会呢,我就想问一个问题,李严鹏你还睡得着吗?请问我们究竟还有什么理由必须打开文熙一言呢?

hello, 大家好,我是小右,今天呢给大家分享一个我们终端产品的一个开箱视频以及使用方式,用户拿到我们的终端产品之后,可以参考这个视频,然后快速的将我们的产品给用起来。第一步,打开包装, 拿出产品, 装上天线, 连接上适配器, 接下来插上电源,一起看看产品怎么使用吧。 连接电源, 连接屏幕, 插上鼠标和键盘, 打开电源, 打开 wifi, 连接网络, 打开龙虾配置软件,绑定飞书, 绑定微信, 添加智能体 效果展示。

普通人在用 ai 的 时候,什么时候才需要去新建一个智能体?如果说你在提问的过程当中,你需要频繁的去输入你的职位,你的信息,你的公司资料,你的产品库,包括你之前做的一些项目背景,然后 ai 才会帮你输出的时候,这个时候你就要去新建你的智能体了。那么智能体到底是什么?其实智能体分两个东西,一个是系统提示词,一个是用户提示词。 用户提示词其实很简单的,就是我们用豆包的时候,那个最底下那个输入框就是我们用户输入提示的地方,然后第二个叫系统提示词。系统提示词呢,就是它背后的一套运行逻辑,就是我已经给你植入了制卡代码,然后我提问的时候,你就按制卡代码去给我执行,我相信这么解释的话,大家应该都能明白。所以如果说你是单一的,一次性的就把这个问题解决掉,以后再也不会重复了, 不需要去进行智能体,记住重复性的场景才需要智能体。 ok, 那 我们看一下智能体创建的时候具体步骤是什么?我们拿豆包来具体,像豆包操作就是这样,点击更多,点击发现智能体,点击创建就可以了。需要注意的是,如果你创建的时候不想这个智能体被别人发现,这里就要点一下,然后提示词就可以放在这个地方。 那刚才说了频繁出现,而且要重复出现的场景,我们才需要给经验智能提,我们来拿一个具体的场景的案例来去方便大家理解。上班过程当中可能要开很多的会,不管说晨会、周会,还是说对外的一些项目会、沟通会等等之类的。 那么这样的会议最后输出成一份比较专业的方案或者会议基,基本上是每一个打工人在上班的时候的必备场景。那改基要当中其实遇到的大问题是什么?就是 ai, 他 不知道你产品的信息,不知道你的项目名称,不知道你的名字, 可能都会去识别错。好,那我们怎么解决这个问题?其实很简单,就是把我的资料给到 ai 就 可以了。那接下来就是重点了,怎么样去搭建这个智能体的资料库?我给大家准备了四个办法,这个四个办法呢,可能是从简单到难, 但是最后一个才是最牛的。如果你是企业,我建议你一定用最后一个。首先针对豆包,你可以把你之前所有的信息放在一个文档里面,你不用去处理它,你直接把这个文档在提问之前,或者在需要豆包处理之前,你告诉他 去写。你在帮我进行处理这个文档之前,请先仔细的阅读我给你提供的资料库,根据录音文件展示之后的文字理解上下文,并且查找我给你提供的资料库, 将错别字进行改写,然后再按照我的要求进行去输出。其实也就是告诉他先去查我的资料,然后再进行输出,当然这是一个比较笨的办法。那第二种办法就是像元宝、 gpt 这些大模型,他们本质上是有一个资料库的,我们可以直接把文档传到资料库,然后去写我们提示词,创建这个智能体,像元宝 直接把文档传到这个资料库就可以了。还有第三种稍微进阶一点的,如果你对题词有所了解,你可以用第三种,就是把你的资料库融入到你的系统提示词里面去, 所以你可以新建一个 ai 的 对话窗口,你可以这么去写。第一个去复制你之前的提示词,然后这么说,这个是我之前的系统提示词,现在我给你新上传一个新的文,我需要你根据文件内容,融合项目背景和人员信息,以及查找我公司的资料,帮我重新刊写一个新的提示词。 这个体式词要考虑全面把我所有的信息融入在里面去,但原先文案处理逻辑不变,等他给你生成出来新的体式词之后,你就把这套新的体式词去覆盖之前旧的,创建一个智能体就 ok 了。第四步是最难的,也是最稳定的。 如果你是企业,这个是必用的,也就是火山的 r a g 向量解锁系统,就是在火山去配置你的知识库,而且呢它有一个三十天的试用,大家可以去感受一下,它可以直接把你的知识库链接到你的智能体里面, 按需去查找。最关键的就是你可以不是只做一个库,你可以做很多很多的库,然后分个不同的智能体让他去查找。比如说你可以建立产品层、项目管理层、公司资料层,还可以做规章制度层,这个也就是最主要的办法。当然了,前三种啊,是 比较简单的方法论,如果你们会写这样的题诗词啊,你们就自己去试一下,如果不会写,你们写完了之后结果不对可以再来问我,我帮你们去优化。那最后一个最难的,大家也不用担心,我们有一个这样的文档,这个文档就是专门去介绍知识库怎么搭建的,从注册到链接到 api 怎么去接都有完整的教程。这个文档可能就比之前的文档都要更重要,也更有价值,那这个文档也是一样分享给大家。
