hello, 大家好,最近做了一个 ai 热点追踪器,那么起因是现在 ai 新闻太多了,然后也充斥了很多垃圾信息, 然后就想着看能不能过滤一下,就是及时的跟一跟热点,再加上现在 webcoding 也比较火, gbt 也发布了它最新的呃, codex 五点三,然后所以就想着来简单实现一下,那么目前来看效果挺好的。 呃,架构的话是简单的分为四层吧现在,呃,首先第一层的话就是一个数据源层,接入了 i s s 和 google news 等信息源,那么第二层就是进行一个预处理, 呃,进行一个数据的清洗,然后去重垃圾过滤。那么第三层就是一个热点引擎,进行一个剧类,然后热度的排行。 那么第四层就应用层,前端的话主要是负责呃展示,然后后端就是提供刷新和分类的相关功能。呃,我给大家简单演示一下,那么刷新的话就在这里不刷新了。呃,大概需要一到两分钟吧。呃,这里就先省略了, 下面也可以根据公司的名称进行一个筛选。呃呃,这些都是比较大的科技公司嘛,然后这里面也会。呃,这里面也会跟一些其他的一些就比较热点的,比如说 github 上的项目, 那么就以 open air 为例吧。呃,这边的右边的热点详情就是可以直接点进去,那么目前就是这样,就是这。呃,目前是一个最小运行的版本,后续的话也会进行功能的扩展啊,流程后面也写了, 就是会进行一个中英互译,那么还有一个 ai 的 二次整合,整合完以后可以推送到飞书啊语学这种笔记软件。 呃, ai 大 乱斗的图文内容也会持续更新,感兴趣的可以也关注一下。 ok, 先到这里。
粉丝65获赞577

opencloud 最近很火,但如果你没装对 skill, 本质上你用的只是一个会聊天的机器人。只要找到合适的 skill, 它可以帮你干活,自动帮你做市场调研、自动分析用户痛点、自动生成可式化报告。大多数 skill 未必能在你的真实工作场景里帮你解决实际问题。 我今天分享我自己在用的 skill 组合 reddit c o i 加 data analytics, 帮助产品经理自动抓取 reddit 数据,并直接生成可式化的市场分析报告。 首先介绍一下这两个 skill, ready c o i 是 一个专门用来抓 ready 数据的工具,它是我在推特上看到一个网友分享的,它和 ready 官方 api 有 一个很大的区别,你可以把 ready api 理解成你必须走官方流程拿数据。你要申请权限,要做认证,还会被限速。 而 reddit c o i 走的是另一条路,它直接在你的电脑终端登录 reddit, 然后像正常刷帖子一样把数据一条条拿下来。所以你不需要申请权限,也不需要写复杂代码,只要一条命令,就可以抓取大量的帖子和评论。你在浏览器的 reddit 上做的任何事情,它都可以替你完成。 reddit c o i 解决的是数据从哪里来?这是第一步。 呃,下一步。 data analyst 是 一个可以帮你做数据分析的 skill, 把数据丢给他,他就会帮你做三件事,第一,自动整理数据,把复杂的评论变成结构化的信息。第二,自动分析,帮你找出高频问题、用户痛点、需求点。第三,自动生成报告,包括总结、生成格式化图表。 这两个 skill 结合在一起就变成一个自动化的流程,抓数据,分析出报告,全自动完成。你不需要写一行代码,也不需要手动整理数据,只需要一句话就可以完成一次 reddit 市场调研。这里我演示一下。首先,你需要确保 opencloud 是 部署在你的设备本地,如果部署在服务器或者是在 docker, c o i 是 没有权限执行的,那么你也可以像我一样直接使用 cloud code 或者 codex 这样的 web coding 工具。我认为 open cloud 直接部署在设备本地其实是不安全的,所以我这里直接用 codex 作为演示。不管你用的是 open cloud 还是 cloud code 或者是 cursor, 都是同理。第一步,我们先安装 red c o i skill, 在 对话框输入以下指令,让 ai 帮你安装这个 skill。 过程中会需要 cookie, 你 将浏览器登录 red mac 电脑,按住 command, 加 option, 加 i, 打开开发者工具,在 cookie 里找到 ready session, 复制给它即可。 安装完成之后再继续输入指令,安装 data analyst。 接下来就可以直接用一句提示词调用这两个 skill。 比如,我想调研 switch 二配件的市场,可以这样说,使用 read c o i 和 data analyst 对 switch 二配件产品做市场调研,生成可化的 html 格式的报告。 很快,一份完整的 read 市场报告就出来了,可以看到这个报告,它总共抓取了一千四百八十条 read 原始帖子, 时间范围覆盖了二五年到二六年的数据,这个数据量足以支持一份专业的研究报告。这份分析报告详细的包含到用户人群、使用场景、需求痛点和趋势分析、品牌分析以及产品建议。 关键数据还可以直接点击跳转到 ready 帖子链接。在 ai 时代,产品经理的工作方式已经变了,当你想做一件事情,第一反应不应该是自己去做,而是应该先问自己一个问题,这件事情能不能交给 ai 去做, 把需求讲清楚,把任务交出去。真正的效率差距不在于你有多努力,而在于你能不能把事情交给 ai 去替你完成。

tiktok 一 周热点汇总第一百一十三期本期的内容呢,包括了 ai 终端工具 rap 正式开园, 一站式黑客工具箱 type script, 顶流的 cloud code skill codex 生态技能精选和一句话生成 ai 短视频。 最后呢,还是分享两份资料,如果觉得内容不错呢,也别忘了点赞和关注,那这里呢,也是祝大家五一快乐,无论是出去玩还是在家里,都可以开开心心的享受假期。那话不多说啊,我们进入正式内容 web, 现在呢,是一个智能体的开发环境,而一开始呢,它是一个终端的工具 web。 其实啊,发布的时间也不短了,早在二零二一年的七月份呢,它就以 fast rustbase terminal 的 口号啊发布了,当时的产品呢,以非常前卫的设计啊,吸引了不少人的关注。 而随后呢,它也第一时间啊接入了 ai 的 功能,并且呢一直做的非常好。 web 内置了编程的智能体,也可以呢,接入你自己的 c l i 智能体,比如呢,像 cloud code codec 或者是 jimmy c l i。 但是伴随着产品的发展呢,社区啊,一直在呼吁着开源, 那就在这一周啊,它终于开源了,并且呢热度爆表,目前呢,已经超过了四十 k 的 star wap。 在 使用的时候呢,如果使用 ai 功能需要登录,那一开始呢,你可以选择使用 terminal 的 模式还是内置的 agent 模式, 如果是 agent 模式的话呢,那就相当于啊,你直接进入了一个 cloud code 的 状态的一个终端,那因为它本身啊就是一款终端的工具,所以在使用上呢,确实会更流畅,更有优势。 所以呢,如果你是一个开发者的话,并且你喜欢 c r i 的 工作模式,那 rap 呢,会是一个非常值得尝试的方案。那另外一个让大家非常关注的啊,就是 open ai 是 项目的 funding sponsor, 这一方面呢,说明了产品的水平,那另外一方面啊,同时也让人联想到将来呢,会不会被收编 rap 呢?现在啊,已经不是一个单独的终端了,它也推出了 o 云端的 a 阵的编排平台, 你可以啊,同时跑多达四十个的并发症 agent 正在呢,一步一步的去完善自己的生态。那最后还想说一个的就是啊,为什么到现在才开源呢?用它创始人的说法,现在开发的瓶颈啊,已经转移了,以前呢,最值钱的是代码, 但是现在啊,代码其实不值钱了, ai 写代码呢,写的飞快,真正重要的呢,是人类做的事情,定义产品的规格,验证行为是否正确。那我觉得呢,这个认知的转变啊,值得所有人去仔细的体会,未来的趋势啊,真的在变化。 hiking tool 呢,是网络安全领域的一把瑞士军刀,他做的事情呢,很直接,把渗透测试啊各阶段的工具整合到一个图形化的界面里, 支持的功能呢,包括了像信息收集,紫域名,美举端口扫描,漏洞扫描,外部攻击, circle 注入无限的攻击,还有密码破解,逆向工程啊等等的,这些工具 基本覆盖了安全测试的全流程。那它呢,是基于开利 linux python 写的 mit 协议,最大的优势呢,就是见面友好,不用呢,你去记十几个工具的不同的命令,行的命令。那对于刚入门安全方向的朋友来说呢,这个上手的成本呢就非常的低, 当然呢还是要注意啊,这些东西呢都适合学习和小规模的测试,对于网络安全呢,我建议大家啊,要好好学习,不要干坏事。 本项目的作者啊, matt pocock, 是 一个 type script 社区的顶流博主,那这一回呢,他把自己啊日常使用的 cloud code 的 技能全部开圆了,在不到三个月的时间里啊,项目获得了四万五千个 star, 那 这个速度呢,在开圆圈啊,也算是非常快的了, 他特意强调了一点啊,就是这个呢,不是教你怎么去外部抠顶,而是给真正的工程开发的人去使用的。里面呢包含了超过十八个技能模块儿,包含了任务的拆解,架构设计, tdd 的 工作流, get 的 安全操作,还有技术文档的写作等内容。 那安装呢,也很简单啊,一行命令 n p x i 的 就可以了,那每个技能呢,都是独立的,你可以按需去选装,不需要呢,全装安全评分呢,也拿到了满分一百分。项目的介绍里呢,写了很多项目的相关思路, 值得呢去阅读一下。比如呢,像软件开发当中最常见的故障模式啊,是理解的偏差,那对于 ai agent 呢,其实也是一样的,现在呢,我们其实能看到啊,很多优秀的 skill 仓库啊,都非常的火爆,从中呢我们也能看出 ai 发展趋势的一个变化。 上一个项目呢,是 macbook 的 个人技能实践,那这个项目啊,就是社区层面的一个总结。 composter 团队啊,维护了一个 codex 技能的精选列表, 目标呢就是让 openai 的 codecri 能够连接超过一千个的外部应用,那它可以做什么呢?比如啊,像自动的部署 cicd 流程的自动化,代码的审查,还有连接 select, github 等外部的服务。 基本上呢,把你日常需要手动去操作的工作流都可以交给 ai 去自动的跑,那每一个技能呢,都是模块化的,可以独立啊,按需去安装组合。大家呢,可能经常会听到一些分享 cloud code 的 东西,而忽略了 codex。 其实呢,最近啊, codex 的 更新还有 gpt 模型能力的提升呢,都非常的不错, 在累加上对于国服的友好和用量的充足,那在我看来呢,他绝对是近期最值得使用的一个开发方案。顺便呢,也给大家一个直观的对比啊,这几天呢,我不正好在试用 deepsea 吗?那我让 deepsea 开发了一个俄罗斯方块的 ios 应用,同时呢,我也把这个需求给到 codex。 deepsea 用了三十多分钟的时间啊,代码给我写好了,但是呢,没有给我触使化 aos 的 项目,然后啊让我自己去做新建调试和触使化。而 codex 里面啊,用了八分钟时间就开发出了出版,并且呢,在等待的这个空挡啊,我已经完成了多轮的一个细节调整,并且呢,它不需要我去自己干任何的事情。差距呢,是非常直观的。 那本相吗?是一个比较实用的 ai 工具,它的卖点呢就是你输入一个主题,可以输出一个完整的 ai 短视频。那整个流程呢,是全自动的,让 ai 先写文案,然后再根据文案去生成配图, 再逐帧呢去生成视频,然后自动的合成语音解说,配上背景音乐,最后呢,合成完整的视频。那每一个环节呢,你都可以自定义,比如呢,换不同的 ai 模型去升图,换不同的语音引擎,调整视觉风格等等内容。那模块化的设计和灵活性呢,还是不错的, 因为我个人呢,也经常去玩一些 ai 生图和视频的生成啊,模型的能力还是非常关键的。那还有呢,就是好的模型啊,它的成本非常的高,比如呢,像 c box 二点零模型能力非常强,但是生成视频的价格呢,也是蛮贵的。那其实这个项目你看样子也能感觉到它不是特别的复杂, 那其实我猜啊,他很有可能也是外部抠定出来的,但是呢,他确实啊,做了一个比较有意思和实用的事情,那我分享出来呢,也是希望大家可以做一个参考。其实呢,你有兴趣的话,完全可以自己外部抠定出类似的工具,如果是买了抠定 plan 的 话,那完全可以自己去试着搞一搞。 那最后啊,还是分享两份资料,第一份呢是二零二六,中国 ai 短剧行业发展与受众洞察报告。二零二五年啊,短剧的爆火,让无数人看到了商机。 二零二六年呢,在 ai 技术的发展之下, ai 短距呢,也被推到了风口浪尖,我呢,也是非常看好这个方向的,我自己啊,没事也经常去研究这个东西,感兴趣的朋友啊,可以来看一看资料。那第二份呢,就是中国 o p c 发展研究报告。二零二六, o p c 呢,是指一人公司,就是由一个自然人呢去独立设立和运营的有限责任公司。那其实啊,我就是一个 o p c, 但是说实话,之前呢,我都不知道这个词儿。 那其实随着 ai 的 进步啊,个体经济呢,也是越来越火,大家呢,其实都可以有一些这方面的意识,那有需要的可以告诉我啊。那以上啊,就是本周的全部内容,那我们下次再见。

程序员又又又又偷偷搞出大动作了!今天是二零二六年五月十四日, github 今日新增 star, 前十里第一名 magpocock 的 skills 单日充了三千三百九十二个 star。 今天最明显的是 agent 工作流,和 ai 助手一起爆了自动化浏览器、 spec 驱动和本地 tts 也在升温。接下来我不念说明书,只讲项目是什么,能帮你解决什么问题。 这十个项目主要集中在八类 agent 工作,留有两习,开发提效也有两习,另外还有自动化浏览器、 ai 助手、 agent 记忆、 ai 增长、本地 tts 和 ai 学习。 你不用自己刷 github, 我 直接按今天掌心最多的顺序讲它能帮你做什么。第一个是 macbook 的 skills, 今天新增三千三百九十二个 star, 它可以帮你直接拿现成 skills 开工,把常见开发动作变成标准化能力。第二个是 cloak browser, 今天新增一千八百三十五个 star, 它可以帮你把浏览器自动化换成更抗检测的隐身浏览器,做采集和自动化更稳。 第三个是 openhuman, 今天新增一千六百九十六个 star, 它可以帮你搭一个更私有、更可控的个人 ai 助手,把能力和数据尽量掌握在自己手里。第四个是 superpowers, 今天新增一千四百零一个 star, 它可以帮你把 agent 的 写作和软件开发流程方法优化,减少一人一个姿势的混乱。 第五个是 agent memory, 今天新增一千三百七十九个 star, 它可以帮你给 ai coding agent 补一层持久记忆,让它跨任务保留关键上下文。 第六个是 speckit, 今天新增一千一百二十个 star, 它可以帮你把开发先拉回到 spec 驱动,先写清楚再开工,减少后面返工。 第七个是 ai, 今天新增九百八十一个 star, 它可以帮你快速了解怎么把 ai 和增长内容、赚钱路径结合起来。 第八个是 supertonic, 今天新增八百五十九个 star, 它可以帮你把多语言 tts 直接跑在本地设备上,速度快,也更适合离线场景。第九个是 lms from scratch, 今天新增八百二十一个 star, 它可以帮你从零实现 chat gpt 类似的大模型,把底层原理真正学明白。 第十个是 react doctor, 今天新增六百零四个 star, 它可以帮你专门揪出 agent 写出来的 react 的 问题。把前端质量卡在提交前。关注我不是为了看我报榜,而是我每天帮你筛选解决问题值得收藏的项目。

本周爱爱圈最重要的变化是入口、硬件、 agent、 价格和操作系统同时开展。第一条主线是 google i o google 把 gemini 推进 android 搜索 workspace 和开发工具里。 第二条是 ai, 指能眼镜和 xr 重新升温,导航、实时翻译、拍照消息和视觉理解都被放进眼镜场景。第三条是 codax 产品化加速,它不只是代码助手,而是跨设备持续干活的开发者工作系统。第四条是 deepsixv 四 pro apr 永久降价, 模型 a p i 价格战继续,开发者试错成本下降。第五条是腾讯 marvis 上线,国内大厂开始抢 os 即入口。本周核心判断是被爱竞争正在从模型能力转向系统及控制权。 下周继续看入口速度、 agent、 产品战和 a p i 降价潮,你最看好哪条主线?评论区聊聊。

这可能是目前复刻网页最完整的 ai skill, 你 只需要丢给它一个网址,它会自动看页面、抓样式、拆组建,再让 ai 把整个网页重新搭出来。重点是它不是把网页截成一张图,而是生成一个可以继续修改的项目,做落地页、产品原型仿真练习。这个思路都很实用,感兴趣的朋友记得试一下。关注我,带你了解更多 ai 干货!

写代码遇到报错还得手动复制一堆日制给 ai 看吗? codex 新功能, appshots 上按两下 command 键,当前窗口直接附加到对话里,而且不是截图,是直接获取窗口里所有文本内容, 甚至包括屏幕装不下的部分,相当于把你的工作界面实时共享给了 ai。 你 觉得这个功能最能帮你解决什么痛点?评论区聊聊,关注我,带你打破更多信息差!

今天这期直接看五条科技新闻,豆包付费,小米咪某开源 open 停审 x i i gpu 利用率,国产 ai 芯片生态 豆包开始测试付费订阅,说明国内 ai 应用已经从抢用户转向抢付费能力。基础版免费,专业版收费,这是典型的分层商业化。 小米 miami v 四五开源后,重点不是又一个模型,而是它能不能直接跑进国产推理芯片生态能适配才叫真正落地。 这条新闻的本质不是八卦,而是控制权。 oppenai 还是不是原来的非盈利方向。马斯克和奥特曼在法庭上的拉扯,其实是在争这家公司到底为谁服务。 x i 被爆出有五十五万张英伟达 gpu, 但利用率只有百分之十一,这说明 ai 竞争不只是拼买卡数量,真正卡住的是调度数据管线和任务负债。 国产 ai 芯片这条线重点不只是单卡性能,而是模型、框架、算子部署、生态能不能闭环。 deepsea、 威克和金腾韩五 g 被频繁提起就是这个逻辑。 今天就到这里关注初一,下一期继续把科技圈的新变化,拆成你一眼能看懂的事实。

今天带大家来看一下如何零头肯自动操作浏览器,比如说抓电商数据,比如说抓社媒平台的数据,用到的工具是什么呢?那就是我们大名鼎鼎的 open client 和 browser hollis 双剑合璧。我们来举几个应该能发得出来的例子, 比如说我想看一下上海的哈尔滨的这个火车票,说话间他就完成了。还比如说我想看一看这个最近的这些热点视频,你看他后台,我把他隐藏,他就会开始操作,这个全程是没有任何加速的,你可以看到他现在已经打开了这个网站,他就会自己去拉一些视频啊之类的。 然后呢,操作完成了以后,他就会给我一个这样的报告,那他可以转成 excel 啊之类的,各种各样的格式都可以。 你比如说看看某鱼的未读消息,我想给他第一个人回复一个一,他也是能够在咱俩说话的。这个空档他就已经完成了。安装也很简单,我们直接去 github, 然后把这个链接一复制,然后直接到 codex 里面, 或者随便一个 ai 工具,请帮我安装一下,然后按照他的指示来就 ok 了。 open client 它把国内一百多家主流网站全部都做成了这样的命令。行,你再让 ai 把这些命令排列组合一下,那就能做出超出你想象的东西,那它也是有边界的, 它的优点是零头啃,然后速度非常快,那它的缺点也很明显,只能执行已经被自动化的操作。那如果说我们要做一些比较复杂,同时又没有现成命令的操作,应该怎么办呢?这个时候就要用到 brothe harness, 我 们来举个例子,让他去各个平台找一找,去哈尔滨见你家乡父老最便宜的机票。这个过程可能比较长,我会加速 好跑完了。它的安装也很简单,去 github, 然后把链接粘给 agent, 让他帮你安装就行。 好,最后,为什么我要说它是双剑合璧呢?看到 open claw, open client 擅长的刚好是 browser harness 不 擅长的。 open client 它擅长的就是零头肯,然后速度飞快,但是它的拓展性,还有就是多绘画变形啊之类的可能就不太好。 然后 browser harness 的 话,它就是 token, 它可能会用的比较多一点,但是呢,它真的能实现超级复杂的任务啊,还可以多绘画并行。当你让 ai 把这两个工具同时权衡着使用起来的时候,那你无敌了。好,那今天视频就到这里,有问题咱们评论区留言。

生产力大爆发啊! openai codex 正式支持 chrome 浏览器了!不管你是 macos 还是 windows 用户,现在只需安装插件, ai 就 能直接在你的浏览器后台跨标签页并行处理任务。 这意味着你在浏览网页的同时, codex 已经在静默处理你的工作流,完全不干扰操作。想体验这种无缝衔接的丝滑感吗?赶紧去更新插件,咱们评论区见!

太炸裂了兄弟们, codex 新出的这个谷歌浏览器弹嘴插件,让你可以同时指挥多个子 agent 操作不同网页,它们在后台并行跑,你该刷网页刷网页互不干扰, 关键是用你已经登录好的浏览器 crm 内部后台需要账号的系统全都能自动操作。这种病发干活不添乱的体验真的太爽了!你最想让 codex 替你操作哪个网页的重复劳动评论区告诉我,关注我,带你打破更多信息差!

兄弟,你看啊,我给你加了一个东西,然后这个 ai 助手,然后一点它, 然后呢?我就可以跟他说,哎,搜抓取什么?我说帮我抓取密带无跳台,呃,销量前五的产品, 然后我一回车他就去理解这句话的意思。嗯嗯, 理解理解理解,哎,出来一个好,是不是这个?然后点确认,然后他就直接替我抓去了。 抓抓抓抓抓抓抓抓,哎,就抓出来了,看到了吧?抓出来了。

github 一 周热点汇总第一百一十期,本期的内容呢,包括了 github 历史增长最快的项目,谷歌的端测, ai 体验 app 生化危机女主的 ai 记忆系统,自进化的智能体和一个免费的录屏神器。最后呢,还是分享两份资料,如果觉得内容不错啊,也别忘了点赞和关注。 那这周的第一个项目啊,我想做一个一加一的模式。首先要说的呢,就是目前为止啊, github 历史上增长最快的项目, 短短两周的时间呢,就已经达到了恐怖的十八万 star。 这个呢,就是用 rust 重写的 cologold。 那 上周啊,其实我们也聊到过 cologold 的 泄露事件,当时呢,有一个哥们拿到原码以后,立刻呢用 python 和 rust 完全的重写了 cologold。 那 这个啊,就是 cologold 这个项目。上周呢,我们做视频的那个节点啊,这个项目刚好搜不到了,后来呢,应该是解禁了,在项目的介绍里啊,也能看到 finally unlocked。 所以呢,感兴趣的朋友啊,就不用再找我去要代码了,自己去学习一下吧。那因为这个项目啊,其实和相州的关联很紧密,但是呢,又没有必要介绍太多,所以呢,就作为一个简短的介绍。那另外一个我想介绍的部分呢,就是他在重写这个过程当中啊,用到的 oma codex 这个工具。 那这是一个呢,构建在 openai codex 之上的一个工作流的层。那他当时在重写的这个过程啊,是这样组织的, 用 team mode 呢去执行并行的 review, 然后呢用 rough mode 去执行持久的循环,然后呢,还有这种架构级别的验证,还有 codex 驱动的实现。那用过这个 codex c r i 的 朋友啊,应该有感受, 本身呢, codex 是 一个非常不错的代码执行的引擎,它的开发能力啊,非常的不错,但是呢,在工作流的管理上呢,就比较的基础, 所以呢,习惯用 codex 的 小伙伴呢,可以去学习和了解一下这个项目。那从开发的效果来说啊,我个人的感受是, codex 应该是目前性价比综合来说非常高的一款,因为它的效果和它的这个量大管保的特性啊, 我还是非常喜欢用的。那安装和使用 omcodex 呢,也比较简单,直接 npm install 就 可以了,然后呢,再执行 oms setup 就 可以开始运行了。 注意啊,项目的说明里特意说明了,这个是针对于 codex cri 的 一个强化,如果你是用 codex app, 那 就不要使用了,可能会引起问题。 google ai h gallery 呢,是谷歌做的一个本地 ai 应用商店加模型跑分和演示平台。 上周的节目当中啊,我们介绍了谷歌刚刚发布了最新的开源模型 demo 四,那它呢,能以离线的形式运行在这个平台之上,使用的呢,是完全的手机本身的 gpu 资源,可以呢,第一时间啊,在手机上去体验谷歌最新模型的能力。 而且呢,不只是聊天啊,它还有很多的功能模块,比如呢,像 agent skill 啊,可以给手机接上维基百科去做这种事实的调查。还有呢,像 ask image, 可以 去拍照识别物体,还有视觉的理解, 那 audio scrab 呢,可以实现语音的转录,甚至呢,还做了一个 tinning garden 的 小游戏,用自然语言呢,来去虚拟画圆,那它底层用的是 google 的 light r t 推理引擎支持呢,从 hackin face 上下载各种的开源模型, 还能呢自己跑奔驰 bug 来去看各个模型在你手机上的实际的表现。那说实话,谷歌做的这个端侧的 ai 体验呢,还是比较超前的,之前他们推出的各种这种 on device 的 ml 工具呢,也是一直在迭代, 那这一次呢,做成了 gallery 这种形式的一个合集啊。那对于普通用户来说啊,这个体验的门槛啊,确实降低了很多,直接呢,从 google play 或者是 app store 来去下载就能使用。 当然呢,你要自己去切换一下到海外的区域,目前国区啊,是没有这个 app 的, 不过目前呢,主要还是体验和演示的性质。如果你好奇啊,大模型在手机上跑到底是什么样的体验,那这个呢,是一个非常直观的入门方式。 madam palace 呢,是一个最近火爆的 ai 记忆项目,四月五号才创建,那短短的四天呢,就超过了三万 star, 而且这个创始人啊,你是不是也非常的眼熟?没错啊,他就是那个演生化危机的女主角,不是姐妹啊,咱们演演科幻片就算了,怎么还玩上真实了? 难道你是在演戏的时候拿到了红皇后的原代码吗?那 madam palace 到底能干什么呢?它解决的问题啊,就是你和 ai 聊天的所有内容,每次绘画结束以后就没了, 那 memo policy 的 思路呢,就是全部给它存下来,当然也不是一股脑的去推进啊,而是用记忆宫殿的架构来去组织。那这个记忆宫殿的原理呢,来自古希腊的演说学家的记忆术, 他把要记的东西呢放进想象当中的一个建筑物里的不同房间里。那项目呢,就是把你的对话按照项目 人物分成不同的 e, 还有不同的厅,那厅下面呢,还有分室,形成一个可导航的记忆地图。那在相关的基准测试上啊,它的 ro mode 呢,拿到了百分之九十六点六的这个评分,是迄今为止公开的最高分,而且呢是零 api 调用,完全呢在本地运行,它 也支持了像 cloud, code, cursor 等主流的工具,通过 m c p 呢去进行集成。不过有意思的是啊,在项目上线四十八小时之内啊,就被社区扒出了很多的小问题, 比如呢,像官方宣称的这种无损压缩啊,其实是有性能损耗的。还有呢,像百分之三十四的这种性能提升呢,其实是 chroma d b 标准功能的一个效果。 当然创始人呢,也很快的进行了公开的承诺和一些问题的修复。说实话,虽然项目上线呢就被打脸,但是呢,反而呀,也说明这个项目呢还真有两下子。 pumas agent 呢,是一个开源的 ai 智能体,它的核心卖点啊,就是和你一起成长,不是每一次绘画呢就完全失去记忆的 agent, 而是呢,不断的去进行学习的循环。那简单来说啊,它就是会在任务完成以后自动的去创建技能,以后呢,遇到类似的任务啊,直接附用。 它有持久的记忆系统,通过 circle light 和 f t s 呢去进行权威的搜索和跨绘画的解锁的历史对话。 他还会呢定期的去进行自省,主动的把重要的知识啊去沉淀下来。那其实啊,伴随着这个项目的发展,最多的讨论呢,就是和 openclaw 进行对比,很多人呢也都说啊,对比 openclaw 来说呢,它会更好用。当然呢,其实 openclaw 的 记忆模式呢,也可以配合一些自动化的 skill, 也可以做到啊,这种持续的自我成长。 所以呢,具体的好坏啊,还是由大家去自主的评判。那 hymerx agent 呢,功能是比较全面的,支持了多种的后端,包括了像本地啊, dakar s, s, h 啊, daytona 等等的这种后端。 那模型的方面呢,也是支持的很全啊, open router 上两百多个模型,像 openai 啊, astropik, kimi, mini max 都可以支持。还有呢,像私有的模型, 那通过一条命令, hermes model 就 可以进行切换。那消息平台的支持呢,也很全, telegram, discord, slex 都可以。还有呢,像 c l i 的 工具也支持呢定时的任务和自然语言的设置。 那安装方面呢,也提供了一键的安装脚本,而且还非常有意思的一点啊,是它提供了一个从 openclaw 迁移的工具,那能够呢,自动导入你的记忆技能,配置,还有 api 的 密钥,可以看得出来啊,就是想啊,直接抢 openclaw 的 用户。 open screen 呢,是一款开源免费的录屏软件,绝大多数的朋友啊,我相信都用过录屏, 这个呢也是一个比较刚需的品类。那 open screen 呢,支持呢,录制指定的窗口或者是全屏自动或者手动呢,去添加缩放的动画,可以录制麦克风和系统的音频,支持裁剪,变速标注,还能呢,自定义背景,能够导出不同的比例和分辨率。 那项目呢,也给自己定了一个非常直观的对标对象啊,就是 screen studio。 那 open screen 呢,就是一个它的简化版本,覆盖了大部分人的核心需求。那对于做产品的 demo 还有录制教程的场景来说呢,是完全够用的, 而且呢它是 mit 协议,个人呢和商业都可以免费使用,这在录屏软件当中呢,是比较实在的一种做法。那项目啊,目前支持 macos, windows 和 linux, 那 macos 上呢,可能需要你去处理一些 gatekeeper 的 拦截,给终端呢,去加一个全词盘的访问的许可,还有呢就是执行一条命令来去授权一下。 那就在上周啊,一款名为 happy house 一 点零的匿名模型呢,作为黑马,以一千三百三十三分的分数啊,登顶了 artificial analysis 的 视频经济场排行榜,超越了字节的 c dunks, 还有可灵啊, skyrim 等一众的模型。那必须要注意的是啊,目前市面上各种 happy house 的 官网都是假的, 大家不要因为好奇呢而被骗了。那最新的消息是啊, happy house 已经进行了澄清,它是阿里 ath 创新事业部正在内测当中的一个产品, 目前呢还没有上线。也是说了一下啊,目前网上的这些官网都不是真的,那 happy house 啊,正式与大家见面还是需要一些时间,顺便呢也吐槽一下啊, happy house 快 乐马杰克马,这个是不是也是阿里的一种致敬文化啊? 那最后啊,还是分享两份资料,第一份呢是聚深智能发展报告,这个呢是信托院出的一个报告,聚深智能啊,一直非常被关注,他可以说是未来 ai 的 集大成的一个形态。 尤其呢是下周啊,就会开启第二届的机器人马拉松,到时候呢,我也会去现场看看热闹。关注这方面啊,可以先来看看资料。那第二份呢,就是二零二六老年群体 ai 应用研究报告,这个呢是安永的一份报告, 对于老年人和 ai 啊,一直是蛮有意思的一个话题。那随着 ai 呢,在日常生活当中啊,日夜的去发挥作用,那本报告啊,就探讨了六十到八十五岁的人群如何与人工智能进行互动并体验其影响。那有需要的呢可以告诉我。以上呢就是本周的全部内容,那我们下次再见。

真的太牛了,我终于把 ai 批量操作多个浏览器,多个店铺的流程调通了,真的可以像人一样操作。你看我这里给他两个链接,一个文档,让他自己去学习怎么去做批量操作。 过了一会他就说已经读到了我的二十九个店铺,后面可以直接替代我打开店铺访问页面,点击输入截图,抓内容等操作。比如说打开这个店铺,访问某个链接,并截图 打开这个店铺,点击什么按钮,提取文字给我,还能批量检查多个店铺, ok, 我 将信将疑,我让他把我所有的店铺列表打印出来,二十九个全部都在这里。于是我让他打开了某个店铺,然后教他登录帐,密码已经填好了,就直接点登录按钮就可以了,还要告诉他有弹窗,全部都关闭了, 点击这个全球按钮进入店铺。最后我突发奇想,想让他去操作店小秘的按钮就是这个插件,我让他去点击这个按钮去采集,既然也能实现, ok, 我 最后让他把这个整个流程梳理成了一个 skill, 那 下次他就直接照这个 skill 操作就可以了。 而且他有个非常好的习惯,就是遇到问题他会截图,你看这个时候是他登录不了的时候。好,我再演示一遍,让他去操作两个账号,去采集这个店铺的订单金额,发这么一段指令给他, 然后他就开始思考整个纸巾过程。打开了第一个店铺的浏览器, 切换账号登录,然后点击登录。进入到店铺之后,打开采集框,勾选店铺,然后点击采集,你看他现在就开始正在采集了。 ok, 他 打开了第二个店铺,同样的进行登录操作,同样打开采集框,勾选店铺,确认采集, 然后是第三个店铺。前几次调试的时候,它的动作是没这么顺畅的,当我这梳理出完整的流程,让它整理成 skill 状,它的操作是非常顺畅,非常快速的。你看它现在只花了不到三分钟时间,就把三个店铺采集工作完成了, 并给出了三个店铺的采集工作的截图,这样子我们就可以一个个检查了。现在我能让 ai 去做这样的一个操作,那发动你的想象力, ai 还能代替人去做哪些运营操作?可以说大部分后台人工的操作都是可以被替代的。

给大家看一下我的四个真正能干活的超级员工啊。第一个是我的热点员工,我只要给他一个方向,他就会自动的去找相关话题的热门内容,把标题数据还有核心观点全部整理到飞书的多 a 表格里,而且不是简单的堆砌啊,它会分组排序,还能做成一个精致的数 据看板。我每天打开飞书,就能直接看到哪些话题值得追,哪些内容可以拆。第二个和第三个是我的产品员工, 负责帮我设计方案和开发。第四个呢,是我的对标分析员工,他会帮我拆解对标账号的内容结构,还有标题打法以及爆款原因。最后呢,再反推我自己的账号应该怎么去改?你看啊,这就不是简单的让 ai 写一段文案了,这是让 ai 全程参与我的内容产品 还有研发和增长。那这些东西我是怎么做到的呢?其实底层不是某一个神奇的工具啊,而是一套组合,最基础的呢,就是 cloud code 和 codex。 那 为什么两个要一起用呢?很简单啊,就是成年人不想做选择题而已,一个擅长理解复杂项目,一个擅长本地执行和代码写作,我就让他们一起干。 找热点用的是我现在屏幕上的这个项目,他负责去拿信息,晒内容做整理对接。飞书呢,用的就是飞书的 c l i, 你可以把它理解成一根管道。 ai 找到的内容不是停在聊天框里,而是直接写进我的飞速表格文档和数据看板。对标分析呢,用的是这个项目,那如果任务量很重呢?这里有个小技巧,我还会直接告诉他这个任务拆解成多个 sub agent 去做翻译。成人话呢,就是我让一个总负责人去指挥几个小员工并行的去干活,有人负责找资料,有人负责分析,有人负责写,有人负责检查结果。所以你看啊,我表面上是在用 ai, 实际上我是在大一家公司。 ai 真正值钱的地方不是会聊天,而是能不能替你跑完一个完整的流程,从找信息到整理数据,到分析判断到输出结果,最后变成一个真正能干活的业务系统。

三分钟带你搞定 codex 客户端配置。如果你是第一次用 codex, 不知道从哪开始,这条照着做就行。 这期我们解决三个问题,配置文件在哪? p 怎么填?模型怎么选? codex 客户端可以读取项目、修改代码、运行命令。开始前准备三样东西, codex 客户端可用的 apikey, 一个本地项目文件夹。 注意 apikey 不要发给别人,也不要提交到公开仓库。接下来找到 codex 的 配置文件,一般是在用户目录下的 codex 配置目录里, 你要找的核心文件通常叫 config tomel, 如果没有,可以新建一个。这个文件的作用就是告诉 codex 用哪个模型连接哪个服务,默认怎么运行。第一项是模型,比如这里填写你要使用的模型名称,模型名要写准确。第二项是 a p i t, 更推荐放到环境变量里,不要直接写死在配置文件。 第三项是工作目录,新手建议先选一个测试项目,配置完成后,打开 codex 客户端,选择刚才的项目目录,先让他阅读项目结构,比如输入,请帮我阅读这个项目结构,并告诉我主要文件的作用。 如果他能正常读取文件,并解释说明基础连接和目录权限没问题。再是一个小修改,请帮我给 vtome 增加一个项目说明,如果能生成修改结果,说明文件编辑权限也正常。新手最常见的坑有三个 t 没生效,模型名称写错,没有打开项目跟目录。 所以排查问题时,先看这三项环境变量、模型名称、项目目录。到这里, codex 客户端的基础配置就完成了。下一期讲怎么让 codex 更安全地改代码,不怕改坏项目。

这一周 ai 圈真的有点像系统升级。先说 open ai gpt, 五点五 instant 进了叉, gpt 回答更稳更短。 codex 开始能看网页,点按钮填表。实时语音模型也来了,语音助理同声翻译会议记录,越来越像一个真正能干活的入口。 claw 这边更科幻, antropic 的 n l a 研究不是玄学读心术,而是尝试把模型内部状态翻译成人能读懂的话。 manage agents 的 dreaming 则是在空闲时复盘任务,把经验写进记忆。模型加速也在爆发。 google gemma 四用多 token 预测提速。 sakana 和 nvidia t w e l l 在 gpu 上跳过一部分无效计算,让推理更省 agent 方向开始向一家公司 labos 瞄准 ai 科学实验。 one man company 让数字员工协助做项目。 open slide 把 ppt 变成 react 组件,让 ai 更容易生成页面级换灯片、图像视频和数字人继续卷 g p p image 二、强化设计能力。 hydra 一 走开原图像路线, hello live 瞄准实时数字人。 drex 展示了虚拟演员和表情动作生成。 最后是三 d 游戏和机器人。 unity ai 进入编辑器, redgen 和 mypart world 把照片、地图和三 d 世界连起来。 genesis gene 二十六点五则把灵巧手操作推到更接近现实任务 这一周最大的变化不是 ai 又会聊天了,而是他越来越会执行任务。关注我,每周带你看懂 ai 真正的大变化。

周一 coldx 选的金瑞矿业,周一跟周五两日涨停,周二周三基本没有涨跌幅,周四早盘高开八个点,午后收盘下跌了两个点,这个跟整个大盘趋势下跌有关。 金瑞矿业入选理由是碳酸钾、硫磺涨价加国家电投入主等相关利好消息。按照实验规则,下周一停止测试这只股票, 该股票测验浮盈十八点五三个百分点。丰龙股份是周四尾盘 codyx 选出来的,周五早盘下跌五个点后,随后强势拉升涨停。 这是一只波动很大的股,从高位七十一路杀跌至五十四幅,均,随后开始微型反弹。 codex 的 策略抓一进二,按照测试规则,这只股会测试到周四午后收盘,我们一起继续期待它的表现吧!周五 codex 策略选出来的这只大连热电,典型的游资操纵路径,急速拉升出货砸盘,低位回补,再次拉升, 策略判断他目前有再次拉升的可能性,看看他周一的表现吧。再次重申一下,本数据是测试数据,不能当做投资参考,只是跟大家分享 ai 的 选股能力,是否真的可以值得相信。兄弟们给我点点关注,点点推荐, 后面我也会分享一些让 ai 写策略的一些小经验小技巧。最近实在是太忙了,每天部署不完的 ai 策略,兄弟们我们周一见!

你以为 ai 做视频就是输入一句话,然后等他吐出一段短片?这次不太一样。最近 hegen 的 hyperframes 开始被很多人讨论,因为他把一件事推到了台前。 codex 这类 ai 编码代理也可以参与做视频了。 过去你做一条视频流程,通常是先写脚本,再找图配音,然后进剪辑软件,拖时间线,对字幕调转场,改封面。 他的思路是反过来,把视频拆成 html 样式动画字幕、时间线和素材,再让 ai agent 直接生成一个可以预览、可以修改、可以渲染成 mp 四的作品。 他真正厉害的地方不是替你审美,而是把可重复的视频生产变成可省略的工作流。第一类最先受益的人是自媒体和短视频运营、热点解释、工具、教程清单总结、产品推荐,本来就经常使用同一种结构。 第二类是产品和销售团队,一个新功能,一篇更新,日制、一个网页,都可以被拆成演示视频,至少第一版可以由 ai agent 起草。 第三类是会一点 ai 编程的人,对他们来说,视频不再只是剪辑文件,而是一个项目,能附用、能版本管理、能批量改,也能接入自动化流程。 以后你可能不是从零开始剪,而是对 codex 说,把这篇文章做成四十五秒竖屏视频,前三秒给冲突,后面分三段解释,结尾给行动。建议 agent 生成第一版,你再改标题,改节奏,换素材、调风格,人负责判断它好不好看,准不准确,能不能发。 但这里也要降温,真实拍摄素材强,审美包装复杂,人物叙述还是需要人来把关。中文标题、字幕节奏也必须人工审核。如果你是普通创作者,可以先关注三个能力,模板化、批量化、可修改。 所以这条新闻真正值得看的不是 codex 又多了一个插件,而是 ai 正在从帮你写内容往前走,到帮你搭建内容生产线。视频不会马上消失在剪辑软件里,但可重复的视频生产会越来越像一个由 ai 维护的代码项目。

嘿,你有没有这种感觉,装完 cloud code 的, 除了写代码不知道还能干啥?想做内容吧,选择题要刷半个小时,新闻稿子还要写两小时,封面还要找 ai 画半天,折腾一整天,折腾不出一条。 其实吧,五句话就能搞定。今天教你一招,五句出篇,从选题到素材一条龙。先收藏这条,下次打开 cloud code 的 直接跟着做。 我把自己做内容踩的坑全打包成了十三个 skill, 裸的扣的只会写代码,装上 skill, 它就是你的内容搭档,一条命令装满,即拿即用。 然后你看第一句说抓今天的 ai 精选,这个叫热点 skill, 它同时从三个地方抓 ai, 获得精髓,一页九个平台,还有抖音 ai 标签筛选,三路并行,三十秒出一份结构化简报,关键是去重合并。我之前刷半小时新闻找选择题,现在三十秒搞定, 从热点里挑一个。第二句说,帮我写口播稿,这个是创作 scale。 这一句背后有很多故事,他先做了十二项规划,弄点结构,暗剂选配 全想清楚了再动笔。写完还跑六关,检查 ai 位测试, ai 位检测近词扫描原创性底线,不过的话就换角度重写。老韩自己写一篇要两小时,他三分钟出粗稿,而且质量不是那一种一眼看到就是 ai 的 流水线。你想想看,选题和稿子这两座大山,两句话就办了。 接下来是包装。第三句说生成封面提示词。封面 scale 上场,它根据口播稿生成三种完全不同的视觉故事。不是换件衣服拍三张,是换了三个场景,每个场景再出三三种比例,竖版、方版、横版,一共九个版本,丢给 gmail 封面图就有了。之前早 之前找 ai 画半天凑不齐,现在一句话九个,是不是有点意思啊?第四句说,生成换灯片图片素材,这个是换灯片 skill, 口播直接扔给 notebook, lm 自动生成中文换灯片,导出 png 格式,你直接拖进剪映当背景。 这四句走完口不稿,封面换登篇全有了,相当于买菜炒菜摆盘全搞停,就差最后一步。第五句说,帮我预测这个叫教种 scale, 老韩压箱底了,给稿子打分,六个维度逐项评标题能不能被搜到,操作性能能不能跟着做,时长合不合适,收藏价值够不够? 开头够不够炸?结尾够不够完整?每个维度都有一本卡。关键是他不是打完分就完了,他会直接猜这条视频能跑多少,播放多少,点赞,收藏率多少,开头多少人跳出多少人会转发。发布三天后拿真实数据一对一的比,测试对了,说明你的判断力在涨, 预测错了就知道哪里看走眼。跑完五条以后,他会自动化进行评分权重,是不是有点意思?这整个五 g 出片的流程不是我纸上谈兵,我的每条视频都是这么出来的,之前一天出一出来一条,现在五句话搞定。一个人一台电脑就够了,安装就一条命令, 回车,十三个 skill 全装好,装完打开 cloud code, 说今天的 ai 精选就开始了。好了,今天就聊到这十三个 skill 的 完整清单,我放在视频描述里,先收藏这条,下次打开 cloud code 的 直接跟着做。你再用哪些 skill 评论区告诉我,我看看有没有我漏掉的。 这是 cloud code 的 保姆教程的第四期,前三期教你装,教你配,教你用,这期教你真正产出内容,下期教你剩下的几个 skill, 录屏、自动化文案、违规检测、一键自创 skill, 个个都是实用货。我是老韩,咱们下期见。

今天看八条官方 ai 动态,等很久的 codex 手机端终于来了。 chat gpt 不 安全, cloud 进法律公益、谷歌窥奥看安全交通国内生态也更新。先看 openai, 等了很久的 codex 手机端终于来了,它正在进入 chat gpt 移动端预览,以后不在电脑前也能盯住任务进度。手机上可以看终端输出和代码。 def ai 程序员开始随身化。 openai 还补了一条安全更新,拆 dgp, 不 再指定当前这句话,他会看短期安全摘药, 判断风险是不是在多轮对话里升高,遇到高风险内容会更谨慎地拒绝或引导求助。 codex 在 windows 上继续补安全底座,重点是安全杀箱,文件写入、网络访问、高风险操作都要被管住。 ai 可以 进电脑干活,但不能在本地乱动。 clode 今天走进法律团队 anserapic 的 官方威猛那儿,讲合同审阅、红线修改和文档取草。法务不是指问答,更像把 clode 放进真实工作流。 anserapic 还和盖茨基金会合作,规模是两亿美元,资源会投向全球健康、教育和经济,流动性 口 o 大, 不只做商业智能体,也开始进入公益项目。 go go cloud 这条篇企业安全 他和魏思一起讲,多云策略攻击者在用 ai, 企业也要用 ai 查代码、查基础设施、查云风险,说白了就是 ai 看 ai。 google cloud 还讲城市交通, ai 可以 预测道路风险,也能做交通仿真,辅助城市规划。它不是聊天功能,而是在帮城市提前发现危险。 国内看 deepseek 旧模型接口会签到 b 四体系,价格页还显示 v 四 pro 折扣到五月底,开发者要注意模型名变化,别等接口停用才改。 最后快速扫三条 bug, build with ai 继续做全球开发者活动跃至暗面的 kimi 状态页显示服务正常。 glm 继续强化 ai 编程订阅。 今天的主线很实在, ai 正在从模型能力走向真实工作流和基础设施。