呃,这些呢是我在网上买的一些策略小卡,都是一些很经典的量化交易策略的,它的好处在于它把,呃,比如说条件开仓和平仓都写得很清楚,大家可以点暂停去看一下。 然后我一会呢要把这个策略啊,把它放在回测框架中啊,利用这个真实的历史行情数据去跑一下,看看它的效果怎么样。我们写代码呢,用到的是 ai 大 模型,我这次选择是千问,然后我们进到录屏阶段去看一下, 我已经把这个卡片上的这个策略内容输入到了千问的输入框里啊,我们这次的大模型选选择的是千问,然后还有一个 ai 的 前置规则文件,这样的话我们生成的代码就是呃,在一定的 规则里面约束的,可以放在回收框架里面直接使用。经过一些深入思考,那么生成了两部分代码,一部分呢是因子代码,一部分呢是策略代码啊,这个是和我们的预期一致的。接着呢,我们要把因子和策略呢逐渐导入到框架中去啊,点击仓库因子增加因子, 然后还有策略同样复制,然后策略增加策略粘贴 好,现在因子和策略就已经进去了,我们就可以直接在我们的灰色框架中去使用我们这个卡片上面的策略内容 选量化,选一个模型数据呢,我们选择第一组数据啊,这个是一个期末的数据,有两千一百条,选这个开仓策略我们看一下啊,开仓策略的话选,我们刚刚 导入了这个有五日、二十日、十日和三十日这四个均线的这个策略啊, ai 零幺幺八选这个平常呢还是啊?平常这个应该是按照啊按照名称排序的选这个,这两个就是我们刚刚的 生成的策略,点击开始回测, 很快啊,这个就生成了,红色的代表的是净值的一个曲线,蓝色的呢,它指的是原始的那个行情数据的书盘价的价格,然后还有最大回撤, 包括这些交易的纸仓以及他的收益。这样一个情况,我们可以整体看出这种均线策略,他更像一种行情的跟随策略啊,你看这个下跌的时候他也在下跌,上涨的时候呢,后面啊上涨的话也会有一定的上涨,所以整体上表现, 嗯,一般般吧。如果说觉得这个策略还不错,那么就可以点击这个保存回测数据, 这样的话就可以将它保入到保存到本的数据库啊,可以在仓库然后会在信息这里去进行查看啊,点进去还可以看到主笔的交易信息啊,可以帮方便我们去对着 k 线图去回测,也就是这样一个过程,大家觉得怎么样?
粉丝19获赞19

朋友们大家过年好啊,各种 ai 的 红包领到了吗?现在呢国产大模型啊也来拜年了,大模型领域的元神千问在除夕当天呢,发布了开源模型的新版本千问三点五, 虽然说啊,最近好多新模型发布,但是呢,千问三点五确实是我最关注的,因为呢它是毫无疑问的开源模型的领军者,所以呢,我也第一时间啊去做了上手的测试。今天呢就来分享一下我的千问三点五的实际体验。 如果说啊,你也做了体验,那可以来聊一聊。首先呢是参数,虽然呢我对参数现在不是特别的敏感,但是还是想和大家快速的过一下千分三点五的整体参数情况,那这一次开源的呢是千分三点五三九七 b a 十七 b, 也就是啊,三百九十七 b 的 总参数激活十七 b。 那 这次模型啊,采用了创新的混合架构,将限性的注意力啊和稀疏混合专家呢进行结合,力争呢在能力,速度和成本之间啊去达成一个最优的结果。 那还有一点啊,要特别注意的就是千万三点五是一个原生的多模态模型,也就是呢,从训练之初啊,他就让视觉和语言在统一的表征空间当中去联合学习,这个呢也是目前模型发展的一个趋势,在 g u i 理解还有视频分析等场景当中呢,都可以做到一模到底了, 数字呢总是很抽象的。那接下来呢,我们就进入实际的体验环节,因为啊,三百九十七币的总餐数量,估计大家呢想本地部署也比较困难,所以呢,想体验的话,主要就是通过千万 chat 还有阿里云百链的 api, 那我们先到千万 chat 里来做一些热身活动,先试试它的推理能力。那最近啊, ai 洗车的问题在网上很火,很多的模型呢都翻车了,我呢就先来试一下千万三点五怎么样?那我这里告诉他啊,洗车店离我家五十米,那我要洗车的话,我应该开车去还是走过去呢? 这里呢,千分三点五没有翻车,他注意到了问题的关键呢是洗车,另外呢还提示了一下可以叫上门洗车的服务。但是呢,这个服务在国内多吗?反正我是没有体验过啊。 那接下来呢,我再让他去写一个祝福语来试一下。在中文方面呢,其实我觉得啊,谦问的表现一直是可以信任的,这个祝福语的水平呢,也是相当可以的,文字方面的内容啊,我就不想放太多的精力了。接下来呢,我们就来试一下多模态,感受一下呢它的原声多模态支持。 那首先呢,我想试一个场景,在春节期间啊,大家都会刷到很多的爆款的 ai 视频,那很多时候呢,都会去求提示词,那是不是啊,可以用千字三点五来去帮我理解。然后呢直接去复刻这个视频, 这里呢,我传一个看到的很酷的视频啊,然后呢让千问去帮我分析一下视频的画面的整体风格,还有色彩,运镜动作。那最终啊,给我提示词,来去复刻视频。那很快呢,千问呢就可以分析出来视频的内容了。 其实呢,很多时候我们做不出高质量的 ai 视频,就是因为我们自己啊,写不出合适的描述,那我呢也使用同样的模型来试一下这个推理出来的提示词,它的生成效果, 那基本上可以说啊,它的复刻程度达到了百分之九十以上。那我呢也用千瑞 chat 自带的这个视频生成啊,也试了一下,那因为默认啊,它生成的是五秒视频,效果上呢就会有一些差异,但大体上呢也能复刻,所以呢,说明啊,它的理解是没有问题的。 那这一次啊,千万三点五也特意强调了它在开发方面的提升,而这个呢正是我最关注的一个部分,同时呢千万 chat 也加了一个 web dev 的 功能。那我们呢就先来快速的试一下,开发一个 web 上的小应用。 那昨天晚上啊,春晚的哈尔滨分会场,我觉得非常的不错,那我呢就给谦问一张哈尔滨分会场的图片,让他啊帮我去用三 d 的 方式重构这个场景,那还要可以自由的缩放和切换角度,那代码生成的速度啊,确实非常快,稍等一小会儿就能拿到结果。 那从功能的完成度来说呢,非常不错,尤其是啊,还非常细节的注意到了烟花灯光还有人群的特效处理, 可以单独的去做开关,特别是人群啊,真是太细节了。还有呢就是预设的这个镜头和时间,可以说呢,他在我的基本要求之上延伸出了很多有用的细节的内容。 可能唯一需要提升的呢就是这个建模的细节吧,那能根据一张图片做到这种程度,总体来说是非常不错了。另外呢,这个外部 app 呢,是可以直接做发布的,那发布出去之后啊,你就可以把拿到的这个链接丢给别人去看和使用了。 那除了这种基础的小型外部的开发呢,我还想试一下这种复杂场景下它的开发效果, 那我啊就在 cloud code 里去接入一下纤维三点五,然后啊最近我刚好有一个需求,就是呢,我本地呢经常会启动很多的开发服务,比如呢像 cloud code 里启动的, ide 里启动的,命令行里启动的,有的时候呢,我自己也记不清楚有哪些,那在启动新服务的时候呢,就经常冲突, 那我呢就想做一个工具啊,可以自动的去扫描所有的端口,然后呢通过格式化的界面来去给我查看和操作。另外呢还要可以做收藏,我可以把经常会使用到的服务呢收藏下来,下一次呢直接在这启动就可以了, 那我呢就来实际的开发一下,那开发的过程当中啊,我们配合上一些 skill, 它的体验是很不错的,那千万呢会先去准备计划,然后再实际的去执行开发。这里呢我开发的这个内容啊,其实它是麻雀虽小,五脏俱全的,它会涉及到前端的页面,后端的 api, 还有底层的扫描命令, 以及呢还有保存收藏信息的这个数据库,所以呢是一个比较完整的一个项目结构。那最后我们来看一下效果啊,也说一下我个人的感受。首先呢在功能上啊,它是完成了我需要的全部功能的,可用性呢是通过的, 那在效果方面来说呢,我觉得视觉的效果还是不错的,你觉得怎么样呢?因为我这里啊也特意要求了使用萨德 c n u i, 所以呢,其实它自己能发挥的自由空间不算大。 那第三个在 bug 处理上啊,开发的过程当中也遇到过 bug, 那 铅汞三点五我觉得有个比较强的能力呢,就是它确实能够把遇到的 bug 给解决掉。那最后呢,我们再来试一下这 u i 理解的能力。 那刚好前面我们开发完成了这个项目的功能,我呢就直接把铅汞三点五配置给本地的 openclo, 让他呢去用视觉的方法去操作一下网页,来试用一下这些功能。 那这里啊,我的动作描述呢,其实相对来说比较简单,那能够看到啊,它会根据自己的理解再推理出来应该如何去操作,最后呢也会自己进入到松仓夹来去做确认,整体的表现呢,我觉得非常不错。 而且呢,还必须要提一句啊,就是速度非常快。这里呢,我是有点惊喜的,因为现在啊,大家去配合 open cloud 使用的时候呢,速度快,在体验上的提升啊,那真是非常直观的。 那截止到二零二六年一月,哈根 face 上最新的数据显示啊,千万衍生的模型数量呢,突破了二十万,成为了全球首个达成此目标的开源大模型。同时呢,千万系列模型的下载量突破了十亿次,平均呢每天被开发者们下载一百一十万次,稳居呢全球开源大模型的 top one。 所以呢,千万模型的更新啊,很多时候不单单是为了无数的子子孙孙都会呢进入新时代。 那还有一点呢,我很关注的就是后续的基于千万三点五出的更小规模的模型,如果呢有七十倍八十倍左右的模型出来,那在本地和端侧呢,就会有更多的想象力。 那这一次啊,我综合的体验来说呢,我觉得是非常不错的,尤其呢,这一次的原生多媒体支持,让他的表现呢更加全面。那在二零二六年选择模型的时候呢,千万依然会是我第一时间想到的一个选择。好了,这里是爱的咖啡馆,我们下次再见。

除夕夜别人都在放鞭炮,阿里直接放新模型,困三点五三百九十七 b a 十七 b 呢,正式开源了,这次呢,不是参数再大一点的升级,而是架构层面动刀, 它是一款原生多模态模型,就不是那种视觉,一个模型语言一个模型,在推理的时候呢,做一下拼凑, 而是从训练阶段开始啊,图像视频文本就混在一起学,属于从底层就打通了。参数呢是三千九百七十亿,用的是 m o e 的 混合专家架构,每次推理呢,只需要激活一百七十亿参数,简单来说呢,就是三百九十七币的脑子,只花十七币的电费,再加上啊限行注意力, getty dotnet 上下文呢,直接给到了一照支持二百零一种语言,速度呢,比上一代更快了,成本却更低。榜单成绩呢,的确很好看啊,但是呢,我们更关心另外一个问题,就是这些听起来很猛的架构升级,到底能不能够实际落地呢? 他能不能够真正做到看图,搜信息,写代码,读视频,一条龙完成?所以说今天这个视频呢,我们就不看榜单,不念指标,直接上真实任务, ok, 我 们现在开始。 那我们首先呢,丢给他一道之前很多模型都翻车的问题,我会问他啊,我想去洗车,洗车店呢,离我们家五十米,我应该是开车过去还是走过去,那很多模型呢,可能会下意识的回答,走过去更加环保,但忽略了一个关键点,就是我们洗的是车,而不是人。 困三点五呢,直接是抓住了这个问题的核心逻辑啊,车还在家里,最终呢,是必须要把这个车开过去, 他没有被距离很近这种表层信息带偏,而是理解了真正的目标。那这类题目呢,不是很复杂,但是他很考验啊,场景理解的一个能力。 所以说接下来呢,我们就把这个难度再拉高一点,我这里准备了一张电影截图,我会跟他说这部电影呢,我有点印象,但是具体的剧情,主演导演是谁我已经记不清了,你帮我做一个详细介绍的 html 网页, 我们点开看一下他的这个执行过程吧。那首先呢,他会识别图像,从而确定这是哪部电影,然后他就开始获取电影阿甘正传的一个详细信息了, 紧接着他会开始整理信息,并构建结构化的内容。最后呢,生成了这样的一个网站,我们现在呢,把这个网站下载下来,看一下它的效果。整体的这个电影脉络呢,他已经是梳理的非常清楚了, 不过呢,他这边是没有去搭配啊剧照图片,而且整体的这个紫色配色还是有些单调的,对吧?那于是呢,我就去啊,让他再加一点剧照,然后改一下这个电影感的配色。稍等片刻呢,他就开始去搜索相关的一个电影剧照了。然后呢做了这个配色 ui 的 一个调整,我们再次看一下它的这个效果, 那这一版呢,整体内容就更加丰富了,对吧?而且呢,他每一个经典的画面都会有这种匹配的剧照,这个呢,其实就是一次完整的多默契协同任务啊。从图片的这个理解,到互联网搜索,再到最后的这个网站代码的编辑落地,大家觉得他做的怎么样呢?可以在弹幕给他打个分啊, 那接下来的话呢,我们来测试一下它的这个代码能力和任务规划的能力啊,我这边呢使用 open code 来做,来到 open code 的 配置文件,首先呢我们需要去修改这个 base url 和 api key, 那 这些信息呢,大家可以在百联云平台获取。 配置完成之后呢,我们输入斜杠 models 来切换这个 queen 三点五 plus 模型。那这次呢,我们做的不是一个小 demo 小 游戏,而是呢直接让它在一个现有的后台里面做一个完整的电商后台 mvp。 并且呢我对范围做了一下控制啊,只需要做商品管理,订单管理, 库存扣减以及基础的一些状态流转。并且呢我们这边只需要去完成管理端,不需要去做小程序。那我把这个需求调给他之后呢,他没有开始直接写代码,而是先分析需求,拆解模块,规划结构, 这一点呢是很关键的,因为真正的工程能力啊,不是说你速度有多快,而是思路是否清晰,在任务执行的过程当中呢,他会边思考,然后边调用相关的工具。这种连续的任务推进呢,其实就是原生视觉语言模型的一个优势 啊,所有的步骤呢,都在同一个模型当中去完成,而不是拼接式的写作。在数据库部分呢,它设计了这个 product order, order item, 还有 user 这些核心表,库存校验啊,订单状态啊,也都是考虑进去了。 后端层面呢,它也做了这个代码分层,结构是非常的清晰。前端部分呢,它生成了商品列表,页表单页和订单管理前端后端数据库都是在协助推进的,项目也是可以直接启动并运行的。来我们看一下它的这个实际效果,商品列表搜索,新增上架、订单查询这些呢,都是可以去完美跑通的, 从任务规划到最终的代码落地,它没有出现结构混乱或者是推翻前面设计的这种情况,整体的逻辑啊,还是非常的连贯的。同样的任务呢,我之前也用这个 gmail 三 pro 测试过啊,虽然说两者最后都能够把这个项目给做出来,但是昆三点五呢,它这边是开源模型,而且 api 成本是更低的, 那如果说两个模型能力接近,但是其中一个成本更低,步数更自由,这对开发者来说意义就不一样了。如果是我的话呢,我会选择做的到但是更划算的那一个。最后呢,我们来测试一下他的视频理解能力啊,那这里呢,我准备了一个小游戏的测试视频,我们把它上传上去, 我让他呢自己去读懂这个视频,然后复刻这个小游戏。首先呢,他会去分析这个游戏的核心机制,玩法与视觉风格。接下来的话呢,他就开始构建游戏的一个视觉与交互框架。最后呢,他开始用 html 代码编写游戏。 ok, 现在他已经全部写完了,我们下载下来看一下效果。 整体功能界面我觉得还原度还是很高的啊。星空的背景,星空的元素大家可以看到,而且呢,在生命值这个地方,它没有去像呃原来的素材那样继续去使用数字,而是采用 icon 来代替。 并且呢在 level 这里,他也会随着数值越大,游戏难度相应增大,整体可玩性我觉得还是非常不错的。 ok, 那 到这里的话呢,四个 case 就 已经全部测试完毕了啊,从图像到搜索,从文本到代码,从视频到程序,这种端到端的能力呢,正是原生视觉原模型想要去解决的问题。 那这条视频呢,其实只是一个开始啊,后面我们还会继续用更加复杂的业务系统,甚至是多轮智能体写作。 如果说你对上面某 case 印象深刻,或者说想要让我去加大难度,可以在评论区告诉我。那现在呢,这个 quan 三点五相关模型啊,已经是开放使用了,大家可以在掐点 quan, 点 ai 或者是摩达社区使用。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频,再见, peace!

大家好,我是小木头。在新春佳节之际,首先呢祝大家在马年新年快乐,万事如意,身体健康,马到成功。在新春来临之际,通易千万也发布了他们最新款的大模型千万三点五, 本期视频,我们就来了解一下这款全新的大模型,并且尝试将其集成到 openclock, 从而打造自己最强的国产 ai 助手。 那现在就开始咱们马年的第一期视频分享吧。首先咱们对千万三点五还是来做一番简单的了解,这是通用千万系列最新一代模型千万三点五首发开放权重版本是三九五 b a 十七 b, 这个是整个三点五系列的起点。大家要注意的是,这是开放权重,不是完全开源,但是呢,你可以拿到模型权重自己部署。 这是一套原生多模台模型,他并不是传统的厚接插件式的多模台,而是从训练阶段就做了早期的文和图的融合,基于了原生多模台的架构, 这与过去的那种先训练文本模型在外挂视觉编码器的方式呢是不同的。在原生多胞胎的支持下,信息融合更深,上限呢更高,多语言覆盖从上一代的一百一十九种语言和方言提升到了二百零一种, 这对于非英语场景的开发者来讲是一个非常大的利号。云端版本的千万三点五 plus 默认是支持到了一百万的 token, 这个呢指的是上下文窗口,同时内置了官方工具和自定义的工具调用,官方给到了全面的测评,从分数来讲呢,显然这与过去我们在了解新模型时并没有什么意外,最新的模型在方方面面的测评上表现都非常非常的优秀。 我们来看一组数据,在三十二 k 上下文架,相比于千文塞 max, 它的解码吞吐提升了八点六倍, 二百五十六 k 下更加的夸张,达到了十九倍,相比于千万三二三五 b, 也有三点五到七点二倍的提升, 这把大模型可用性往前推升了一大步。从这张图标可以看到,这个对比效果呢,也是非常夸张的,在过去的对比中,似乎我们还没有看到这么大的飞跃。官方博克还给到了我们许多有趣的 demo, 展示了多模态理解加工具调用、加长链路执行的合体能力。这其中呢,包含了编码 agent、 视觉 agent、 空间理解、图像推理,每一个都并不是一个独立的 demo, 感兴趣的朋友呢可以来一个一个的观看了解一下,非常的有趣。 在官方博克这里也专门提到了在 open clone 中的基层,它能够很好地支撑像编码这类任务的执行, 再集成到 openclo, 并且部署到云端,看起来我们完全可以打造一款自己的国产 ai 助手,并且是最强大的哟。 现在呢,我们就尝试将千万三点五这款最新的大模型集成到 openclo。 openclo 是 近期非常热门的一款 ai 助手,在过去的视频分享中,我们也介绍了如何在本地如何在云端进行部署与配置,还没有做这部操作的朋友呢,可以回看过去的视频分享, 那现在呢,我们就来做集成千万三六模型,在许多的云端平台都提供了支持,同时呢,作为一款开放权重的模型,大家也可以实现本地化的部署,我们今天要介绍的呢,是以 open router 所提供的 api 为例,看看如何集成到 open clone。 我 现在分享的是在腾讯云端部署的小龙虾,大家可以在任何的部署中采用同样的方式来配置。 openroute 是 我常用的一款服务,目前呢也第一时间提供了千万三点五模型的支持,目前有两款,一个是三点五 plus, 一个是三点五三九七 b a 十七 b。 我 们以三点五 plus 为例,在云端 通过 openroute config 来进行模型的配置选择。 model 在 分类中已经有了 openroute, 我 们选择它就好。 因为我已经完成过了 openerer 的 配置,已经添加了 api key, 所以 在这里呢,直接就跳到了模型的选择。我们现在翻到 openerer 所提供的模型列表这里,大家或许会发现并没有前文三点有模型, 怎么办呢?没有关系,我这里呢其实已经配置过老的像 cam 三二三五 b 的 模型,我们可以继续这里的配置选择,继续退出当前的配置。 在目前我已经配置过 api key 的 情况下,大家看起来这波操作呢并没有做什么,那如果大家是初次配置呢,这样呢就完成了 open directory api key 的 配置。我们接下来要做的是使用当前这个命令 openclo model set 来设置 open directory 这一款千万三点五的模型, 设置的这个值,它的格式呢是服务商。以 openerer 为例,在这里呢就是 openerer 斜杠后面带上的就是模型的 id, id 来自于模型页面,我们在这里复制这个 id 就 好, 我正是通过这种方式粘贴过来的。这样呢,就完成了三点五模型的配置。配置完成后,或许大家可以尝试重启 dm, 接下来我们来到 channel, 比如以 telegram 为例,我们来看看配置的情况。在 telegram 中,可以使用 slashmodels 命令来选择我们想要使用的模型或列出当前的模型服务商。 当我选择了 openraw, 会列出其中已经配置的模型。这是我已经配置的几款模型,大家根据自己的情况可能会看到的有所不同。 那我如果点击千万三点五这款模型,理论上期望是将其设置为默认模型,但在这里大家会看到这么一个错误,说这个模型呢,还不被允许使用, 那么该怎么做呢?我们是来到 opencl 后台进行手工的配置调教,还是说通过对话的方式让 opencl 来帮助我们解决这个问题呢? 在 ai 时代,在智能体时代,我们应该尝试避免手工再去做这些事情了,完全可以交给 open core 自己解决。因此在这里我们告诉他问题是什么呢?这个模型三点五不能够被使用,希望他帮助我添加到 open core, 他 会自动的帮我完成这个工作, 它会更新配置,重启网关,并告诉我重启后就可以使用了。那在这里呢,我们来看看。 当然了,在对话中,我还将其切换回了 gpt 三点五 codex, 并且期望 codex 帮我验证当前的配置是否一切正常了。它告诉我是的,一切正常,我们可以开始使用千万三点五了。 那么我们通过模型的配置这里呢再次确认过它的模型呢,已经设置为了铅汞三点五。那接下来呢,我打个招呼,看起来一些工作正常,我们现在可以回到 openclo, 作为开发者,我们还是希望更多的验证究竟是不是正常的工作了。咱们可以使用 openclox dash dash follow 这个命令来实时的监控日制, 再打个招呼吧,看看对话情况。在这里大家可以看看日制的情况,在一个子系统的执行中,它用到的模型呢是千万三点五 plus 零二一五 think 模式是关闭的对话呢,一切正常,我们在这里也能看到它的回复,这表示端到端已经通了。大家如果还不确定是不是使用了三点五的模型,那现在呢,可以来到 open router 后台查看实时的 api 调用情况,我们可以看到最新的调用呢,就是用的千文三点五。 好了,这就是我们如何在 opencl 集成千万三点五。在这次的发布中,我们得到了两个版本,一个是千万三点五 plus, 一个呢是三点五三九七 b a 十七 b。 感兴趣的朋友呢,可以来集成这两款模型,分别在 opencl 中跑一跑,看看它们在功能上究竟有什么差异,在日常的编码任务的执行上,是否能够很好地完成我们交给他的任务。 那么这款模型的能力究竟如何?是否能够成为我们日常工作学习中的主力模型呢?大家在使用后也欢迎在评论区给我们留言吧, 那今天的分享就到这里,感谢大家收看。那么在视频结束前,也再次祝大家新年快乐,万事如意。好吧,那我们就下次视频分享再见同学们,拜拜!

八毛钱呢,在今天也就是半个馒头的钱,但在 ai 圈呢,现在可是一百万 token 的 价格。今天可是除夕啊,阿里正式开源了新一代的千万三点五系列, 我想这大概就是科技圈最卷的拜年方式了。这次发布的企业模型千万三 plus api 价格呢,直接达到了每百万 token。 八毛钱什么概念啊,这可是谷歌 gmi 三 pro 价格的十八分之一,而且阿帕奇二点零的协议,全尺寸开源,不管你是个人开发者、学生还是中小企业,都能直接免费的商用。 以前我们都知道最强和最便宜的这两个词呢,它是不可能出现在同一模型上的,要么性能顶级贵的离谱,要么是便宜呢,但是能力打折。千万三点五 plus 这次不仅是价格地板价,性能呢,更是直接硬钢了。这俩币源顶流登顶了全球最强的开源模型, 支持的源数量呢,也扩展了两百零一种。就因为这次用上了极致稀疏的 m o e 架构,传统模型呢,是所有参数同时干活,参数越多呢算的越贵。 m o e 的 思路呢,是按需激活,你问一个代码问题, 他就激活擅长代码的那组专家,你问数学题呢,他就切换到了数学专家,等于三百九十七币的知识储量,十七币的算力消耗不熟,显存占用直接降了百分之六十,推理速度快了八倍,这就是省钱的原因。 而且他还是原生多模态,不是后期拼装的视觉模块。从预训练第一天起呢,就是文字和图像混合数据上一起预训练的,天生就能看懂图片和视频,这种就很像当年的 linux, 当一个最好用最便宜最聪明的模型是开源的时候,他就会成为整个行业的空气和水。 以前要花大价钱才能用上,能力呢,现在门槛被技术本身再次拉低。摩达社区哈根 face 千万 a p p 千万披萨呢,现在已经可以体验了。不知道阿里这一波 ai 半年啊, open ai 和 google 看了是什么心情。


给大家测试一下千万三点五,今天的话千万三点五已经更新,我们可以看到在他的官网中已经可以进行测试,他是千万三点五。 然后接下来我给大家全面的介绍一下,我们以这五个为例,第一个就是测试一下他的代码能力,第二个就是一个最近的比较火的一个问题,然后接下来是这个数列问题,然后是他的一个数学问题, 接下来是它的一个知识读补的一个通用性的问。我们首先看一下原本的这个网页, 我们可以看到这是一个亮白色的一个汇报,千万三点五的一个网页,我们会把它进行一个基于此进行一个春节风格的改造,这个是千万三点五 plus 的 一个效果。 接下来就是三点五的一个三九七 b 的 一个模型,我们可以看一下 这个模型是开源的,然后接下来我们对比下一个模型,这个是 cloud 写的一个, 接下来我们使用工薪后的 deepsea 进行看一下它的代码能力,还是比较适合中国人的审美的。 然后接下来我们看一下 jrm 五的 它的一个春节风格的改造。 好的这就是我们第一个模块,然后给大家介绍一下它的三个核心的一个架构,第一个是它的一个注意力的机制, 使用了百分之七十五的 g d n, 这个就是为了大局的遗忘啊,然后是精确的一个攻心,然后我们看一下, 接着就是它的一个 o m o e 的 架构,然后是一个多模态的融合,它支持一个原声的语音,然后我们的一个视频,还有一个文本,或者输入我们图片的一个输入, 这是我们的一个技术路线的对比。然后我们接下来进行第二个,我们进行测试一下这个问题,我想去洗车。首先是我们的 这个问题,然后我同时发送给了左侧的三点五 a 十七 b 的 开源模型和三点五 plus, 在 它的一个摆链的一个平台上,然后我与此同时我会给 deepseek 进行发送以及 jrm 进行发送。 我们看一下它的一个对比的效果。在这个界面里面我们可以进行一个官方的对比看一下,我们可以看到我们输入的信息可以包括文本,图片,视频,然后的话它输出的是仅仅是文本,因此 比如说我们可以应用在一个视频的自动剪辑上面,是可以进行使用这个模型的。接下来是它的一个价格, 最重要的是它的一个上下文,在 opencloud 里面,上下文决定着很多的一个复杂的操作,可以看到这个上下文 plus 的 话是 em。 然后这个开源模型呢是二百五十六 k。 然后接下来我们看一下他的一个结果,这个答案是一个经典的逻辑题,我们必须要开车去对很聪明的模型。然后接下来我们看一下 step, 很 简单直接的告诉我们要开车去。然后接下来是 g r m 的, 它依然没有思考完毕, 这也是我们经常测试遇到的一个问题,但是它的答案是对的。然后我们接下来进行下一个问题, 我们测试一个树列, 首先进行对于这两个模型的一个测试,当然的话我已经测试完毕,这是没有问题的。然后接下来到了 deepsea, deepsea 的 思考确实很快,我们继续, 我们已经看到 deepsea 花了四秒的时间思考完毕,还是非常优秀的。然后接下来是它的 开源的模型已经输入的结果,然后接下来是三点五 plus, 结束结果是正确的,然后接下来看一下它的 g r m, 我 们稍等它一下也是对的。然后接下来我们测试最后一个问题, 我们的结论是全部通过,我们看一下,首先给 g m 一个,然后是 db6, 然后是这两个模型,我们发送 我们看一下它的一个反馈结果, dbic 花了五秒的时间测试完毕,五秒。然后接下来看一下 三点五的模型还在推理,看一下 g r m 的 g r m 的 话也在输出, 我们可以看到他花了四十七秒输出了他的一个正确的答案, g m 五。然后接下来我们看一下三点五 plus, 还有他的一个三九七 b 的 一个模型还正在思考, 我们可以看到三点五的 plus 已经正确的输出了答案,可以发现这几个模型还是能力比较强的。 然后接下来我们进行最后一个,它是一个通用型的知识图谱的一个抽取, 我们打开我的项目到这里面,我们可以看到现在我已经处理完毕, 我们使用的是民法典的前两章,一个使用的是他的一个三点五 plus, 另一个使用的是千问的一个 plus。 然后接下来我们进行交互问答一个问题,首先对于这个 三点五的话,他已经给出了一个答案,我们可以把它给复制出来,然后通过一个中间的 ai 进行一个测评, 我们在这输入自己的问题,然后发送,然后我们看一下它的一个最终的结果, 我们可以看到这是相关的一个问题,然后是它的答案,为什么一定要这种方式呢?因为知识图谱对于我们的一个文本是一个抽象性的一个连接概念,它比普通的 red 更加的一个有上下文的衔接性,因此我们可以对比一下它回答的一个维度。 然后我们看一下它的一个三元组,这个是 千问三点五 plus 抽取的一个实体,我们可以看到是一千多个,然后接下来是它的一个 plus 的 模型,这个少一些。


二月十六日除夕当天,阿里巴巴正式开源全新一代大模型千问困三点五 plus, 性能媲美 jameson 三 pro、 gpt 五点二等顶级闭源模型,登顶全球最强开源模型 千问三点五,实现了模型架构的全面革新。此次发布的困三点五 plus 版本总参数为三千九百七十亿,激活仅一百七十亿。以小胜大 性能超过万亿参数的 quan 三 max 模型,算力部署成本降低百分之六十,推理速度提升八倍,多项精准评测结果媲美超越 gpt 五点二这门 i 三 pro 等闭元第一梯队模型。原声多模态训练也带来千万三点五的视觉能力飞跃。 在多模态推理、通用视觉问答、 dk 文本识别和文件理解、空间智能视频理解等众多权威评测中,千万三点五均斩获最佳性能。相比上一代昆三 max 模型推理效率大幅提升,最大推理存储量已升至十九倍,且上下文越长,速度优势越明显。 在模型部署端,千万三点五通过混合注意力极致显著优化长文本场景的显存占用,并结合高希书猫架构,将每次推理的时机、计算量控制在极低水平,部署显存占用降低百分之六十。 这意味着大模型第一次真正具备了下沉到边缘设备陷入日常应用的工程可行性。当行业仍聚焦于跑分竞赛时,千万三点五已将竞争推向新阶段,谁的模型更实用、更易用、更多人用得起? 不光卷性能,阿里在 ai 应用端也实属卷亡。一月十五日,千问啊发布全球首个消费级 ai 购物 age 的 春节期间,千问 ai 购物 age 的 六天时间帮用户完成了一点二亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。 age 的 能力大幅增强的千问三点五,将进一步打开千问 app 在 工作和生活中帮人办事的想象空间。

ai 圈啊,真的太凶了,除夕夜呢,阿里又发大招,上线旗舰新模型千万三点五,据称啊,是原生多模态,激活参数更少,智能体能力更强, api 接入价格更是只要每百万 八毛。这是目前一些主流的 ai 模型的 api 接入价格啊,千万三点五呢,比 g p t 五点二便宜了整整十五倍,比科奥的便宜四十五倍。这么便宜的旗舰开源模型, 炒分看起来还比肩世界顶流与三家。为了验个真伪啊,我看到消息呢,就带你们测试去了。目前啊,千万三点五已经可以在 q n chat 免费使用,如果呢,想要测试编程能力,可以去阿里云百链接入 a p i。 那 我呢,就把自己的品牌手册 pdf 和商品图丢给他,让他呢帮我做品牌官网, 他呢就可以读懂 pdf 的 内容,还能精准识别每一张产品图,自己对号入座。我把前几天做的 ai 教程给他,让他自己做个网站,他呢提取了视频当中描述的这个模型特点,直接帮我做了个卖模型的网站,类比我当时测 gmi 三 pro 的 案例,现在 用千问三点五处理这样的三 d 游戏也完全不是问题了,有粒子特效,还能自动配上音效。小男孩面对这种游戏啊,哪有什么抵抗力,这不过年了嘛,我还会让我九岁的侄子提需求,他想怎么改啊,我们就让千问现场改带娃的互动性啊,也是 plus 了,一整天测下来,我跑了几十个案例。 确实啊,千万三点五的能力啊,目前已经可以算是世界顶尖模型了。我呢也去翻了他们的官方文章,里面呢介绍了模型用到的新架构,很显然啊,这次突破是架构创新带来的直接结果, ai 的 使用门槛正在一步步被技术本身推倒。目前世界上顶尖的 ai 能力 已经开始从高算力、高成本的壁环当中跳出来,成为个人、开发者、创业团队,甚至每一个普通中小企业都能随时调用的底层基建。这其实让我联想到最近爆火的 open cloud, 作为一个私人 agent, 它呢,需要分布处理,执行多个任务,消耗托克的量非常大。要是你们自己装过,你们肯定知道,如果大家直接给自己的 bot 配置上高价的闭源模型驱动,那个账单啊,真的会让你惊掉下巴。那这时候,像千万三点五 plus 这样的模型,就可以在性能强大和性价比之间找到一个合适的平衡点,真正让普通人也能用得起二十四小时随时在线的全能 ai 助手。这个呢,对开发者、企业和学生教育类的用户啊, 尤其友好。接下来啊,千万三点五可能还有其他尺寸的量化版本和更强的王炸版本会陆续登场。我呢,会持续跟进这些模型的 api 调用、实测、长文本压力测试,以及它们在 a 阵的开发中的实际表现。如果你也关注开源生态的下一次进化,或者正在寻找更高性价比的 国产大模型替代方案,别忘了点赞关注,我会第一时间为你带来千万三点五全系列模型的深度评测,我们下期再见!

我们来说说阿里巴巴,在二月十九日就要发最新的财报了,阿里现在一百五十美金一股吧,而且你看这个时间点掐了多好。就在北京时间的二月十六日,阿里巴巴的微信公众号消息称, 开源全新一代大模型阿里千问三点五 plus, 这个时间点真的是一箭双雕,既在春节给全国人民送了大礼, 同时呢又为自己马上就要到来的财报呢做了铺垫,证明我是全中国在人工智能 ai 领域中的领头人物,我想这个大模型的发布对阿里的股价一定也是有帮助作用的。 阿里在上个财报季的表现怎么样?咱们先来回顾一下,咱们用一句话来总结一下阿里在上个财报季的表现,叫做收入增长稳健,但盈利短期阵痛。说实话,阿里这么大的体量就在上个季度实现营收是两千四百七十八亿美元, 同比增长百分之五,这同比增长真的不多,但是利润可是巨降,今日利润同比下降百分之八十五,主要是阿里做了大量的贴补,在淘宝闪购这个领域血拼市场,投入了百亿级别的战略补贴,同时对人工智能还保持巨额的投入。 在即将马上就要到来的新财报季,现在预计阿里的整体营收在两千九百一十亿美元,同比增长百分之四,同比仍然是略有增长,说实话压力还是非常之大的。 好在华尔街市场对阿里的估值可是相当不错的,现在看华尔街十五位分析师给出阿里在二零二六年的平均目标价是二百零三美元,这可是有百分之三十的涨幅,还是相当可观的,那么在二月十九日要发布的阿里财报将是一个重要的考察节点, 一方面阿里又发布了最新的千万大模型,一方面马上就要到来新的财报,那么它的表现会怎么样呢?大家可以评论区留言。

阿里最近发布了个新 ai, 号称要挑战业界大佬,这事靠谱吗?我们来扒一扒。 这个新模型可不一般,它直接对标谷歌和 ansapic 的 最强产品,口气不小啊,它就是通易千问三点五,一个开源的全能型全兽,目标就是成为顶级玩家。它有个特点叫原生多模态, 简单说就是天生就能同时看懂图片和文字。而且他的体量大得吓人,参数量高达三千九百七十亿,绝对是个重量级选手, 不光大,还特别快,官方说处理速度比上一代快了整整十九倍。他的语言能力也很强,能说二百零一种语言和方言,覆盖面相当广了。那说了这么多,他跑分怎么样呢?官方给出的数据可以说是相当惊人了, 你看这个官方图标,在好几个硬核人物上,它都超过了现在市场上的老大哥们。比如号称在浏览器任务上赢了 cloud, 在 多模态测试里又比 jammy 强, 好纸面数均很漂亮,但问题是实战效果真有这么神吗?官方演示里用它一步就生成了个超酷的赛车游戏,看起来非常厉害。于是就有独立评测人去试了,想用公开的模型复现这个效果。 结果呢,游戏是做出来了,但比演示的要简单太多。这个差距就很有意思了。 其他的编程测试也差不多,速度很快,功能也还行,但就是不够精致。不过要论纯粹的看图识物能力,他有时候又精准的吓人,你看让他数这张图里有多少辆玩具车,他给出的答案是二十八,完全正确。 所以总结一下,优点是速度快,多模态能力强,缺点嘛,就是稳定性和一致性,还差点火候。 但是啊,关于他是怎么训练出来的,现在有个挺大的争议。我评测者爆料说他们确认了这个模型是用别家闭源 ai 的 出出来训练的,所以你看,第一步是宣传很猛,第二步是现实测试发现有差距。第三步它其实是个不错的选择,但有前提。 总的来说,它绝对是目前最强的开源模型之一,尤其适合做快速编程和多模态任务。这就给我们留下一个问题,随着开源模型越来越强,它们的训练数据来源是不是也变得越来越重要了?


今晚有两场春晚正在上演,一场是央视春晚,再搁在五万家团圆。另外一场是科技春晚,平地惊雷,重塑未来。就在刚刚,千万春节档真正的杀手锏来了,阿里正式开源了全新一代大模型千万三点五 plus。 可能有人会问,这模型有啥特别的,为什么可以称之为杀手锏? 就这么说吧,如果用七个字来概括它,那就是又快、又强、又省钱。相比上一代千万三 max, 千万三点五 plus 推理速度快了整整八倍, 除显存占用降低百分之六十。更夸张的是,在性能相当的情况下,宽三点五 plus 每百万 token 只需八毛钱,几乎是 jama na 三 pro 的 十八分之一,成本大降百分之九十五。过去几年,大模型圈信奉大力出奇迹,各家都在圈参数、拼榜单,参数从千亿堆向万亿,性能确实在涨, 但代价也居高不下。但千万三点五的出现,就好像为大模型行业开辟了一条全新的道路,他不比谁更大,而是比谁更聪明,比谁能用相对更小的模型,借助技术创新获得更大的智能,说白了,就是花更少的钱,办更大的事。这样一来,大模型之间的竞争直接拉到了好用、实用、用得起的新维度。千万三点五的实力到底如何呢? 在 m m l u pro 认知能力测试中,千万三点五拿下八十七点八分,超越 g p t 五点二。在博士级知识挑战 g p q a 中,以八十八点四分力压 clod 四点五 r, 在 指定遵循 if bench 榜单上以七十六点五分刷新历史记录。而在通用 a 阵评测 b f c l v 四搜索 a 阵评测、 broscom 等基 准中,千万三点五表现均超越 gemini 三 pro 技术向下扎根,应用向上生长。阿里不仅在模型曾追求星辰大海,也在产品端深耕人间烟火。 一个月前,千万 a p p 上线超过四百项 ai 办事功能,成为全球首个能完成真实生活复杂任务的 ai 助手。今年春节,数千万用户通过他点奶茶、买年货、订电影票,在日常点滴中切身感受到 ai 带来的便利。如今,随着 ai 阵的能力在快三点五中大幅增强, ai 不 仅将拓展技术的变 边界,也将进一步打开他在工作与生活中帮人做事的可能性。正如昨天千问总裁无加回应千问爆火时所言,阿里会一直追求模型的智能水平和先进性,两者合起来就是我们一直坚信的技术,不仅要追求星辰大海,也服务人间烟火。

新年好,这个春节, ai 圈的火药味烧得比汕头的烟花秀还猛啊!就在大家忙着抢红包吃年夜饭的时候,千万冷不丁就把 q 问三点五开源了。大过年发布新版本是不是成了中国 ai 圈的传统 了?去年是 d c, 今年是千问,明年又是谁呢?那我必须得说啊,这确实是全球目前最强的原生多模态开源模 行。注意,我并没有加国产两个字作为定语,因为它这次直接是跨过太平洋,把 g p d 五点二和 jammerite 三 pro 按在地上 摩擦。但听说昨天 google 发布了 jammerite 三点一 pro, 又夺回了宝座。这个我们下回再分解。今天先说说 q n 三点五,大过年的,我就不念参数了,直接上实测,看看它是不是真的遥遥领先。 我们先来测测他的智商,就是那个让很多大模型翻车的脑筋急转弯,我去洗车店里洗车,距离五十米,我是开车去还是走着去?这些好几个大模型都劝我为了健康走着去,但那个是去洗澡,而不是去 洗车啊。你看 q n 三点五秒回开车,这个就叫做懂逻辑,而不是只是懂概率。那接下来再测测他的眼, 这是它最大的升级,就是原生态膜态,特别值得关注的就是它的视觉能力。我随手拍了一张酒店外的汽车图片,问他这部车是什么型号,什么价格,他不仅认出来了,还给我发来了 详细的介绍。但这还不是最骚的,我把 q n 三点五自己官方宣传视频丢回给他,我说把这个视频转移成一个网页版本,没过多久的时间,一个图文并茂、排版整齐的 html 网页直接就生成了。兄弟们,这是什么概念呢?以前我们只是用 ai 总结笔记,现 现在呢,他不仅把视频摆好了,盘还直接喂到你嘴里了。以后我们想快速的看视频,看发布会,这简直就是物理的外挂嘛。 另外,官方还给出了多个案例,比如说手绘转成网页,你上传一张手绘的草图,它会自动的转成包含丰富图片和交互的完整移动端网页代码。它还能够用视频复刻游戏,比如你上传一段游戏的视频, a, 还会理解这个游戏的逻辑,直接复刻出可以玩的 h t d m l 五的游戏,这理解能力也没有谁了吧?还能用图片生成影视介绍,你上传一些剧照,它能自动解锁信息,并且生成详细的 ppt 介绍文档,以后做 ppt 是 不是更容易了呢?更绝的是,它还能够找不同和走迷 宫。对于这个视频的推理能力,官方还测试了驾车视频的事件分析。上传视频后,我们问大模型车子是什么时候并线的,在多少秒开始右转的? 这理解能力太牛了。作为自媒体博主,最后我还测试了音频转字幕。之前我在 touch ppt 上试过了,它无法识别音频,但 gmail 是 可以的。这次我在 q n 三点五上用同样的提示词,它已经可以做的跟 gmail 一 样。好了,识别字幕又多了一个选择,千万!这次更新的 q n 三点五,除了强,更恐怖的是它很便 一 a p i 成本是 g p d 五点二的十五分之一, g m l 三 pro 的 十八分之一。为什么呢?因为它是 m o e 架构的,简单说,它有三千九百七十亿个大脑, 是个全能的学霸。但每次你问他问题,他只叫醒对口的一百七十亿个专家来干活,其他人就可以继续睡觉,这就叫做资源合理调配。以前我们总说国产摩星是在追赶,但二零二六年这个春节, q 为落地的性价比 上攻守之时已经完全反过来了。对于我们普通开发者和小团队来说,这个开局非常的完美。不用再去高攀那些昂贵的美元账单了,最好的工具就在身 边,这才是给我们技术人最好的电子年货。你开始用了吗?把你测试出来的案例发在评论区,我们讨论一下。最后祝大家马年吉祥,身体健康。 ok, 以上就是今天的所有内容,我们下期再见!