粉丝7.6万获赞89.3万



上期我们介绍了通一千问七 b 模型的微调加部署方式,但在实际使用时,很多开发者还是希望能够结合特定的行业知识来增强模型效果, 这时就需要通过外接知识库让大模型能够返回更精确的结果。那么本期视频我们就来介绍一下如何从魔搭社区 nodebook 中一键实现本地知识库的搭建,从而增强大模型的能力。本次实践需要的所有相关资源都在阿里云点 com 免费试用中心领取。 在魔大世界上找到通一千万七 b chat 模型后,我们点击 notebook 快速开发,注意这里需要选择 gpu 资源。随后我们点击查看 notebook。 进入 notebook 后,我们需要稍等一下,把我们已经准备好的在 github 上开源的基于本地知识库 q a 的视力代码直接拷贝配色到 notebook 中。根据这段 代码你就可以实现本地知识库的搭建以及后续的大模型调用。相关链接也会放在视频简介中,这里我们已经把相关代码准备好了,点击运行即可。 接下来我们将介绍一下代码逻辑。首先我们引用了 dash scope, dash scope 不仅可以调用文本限量生成,还可以调用千文七币 chat j、 l、 m 等大模型进行推理训练。 dash vector 作为限量检索引擎,这里我们对本地知识库的存储引擎进行初始化。 接下来我们需要定义一个锁引数据的生成方法,用于后续逻辑。同时我们还需要定义基于 desktop 的文本项量生成逻辑,这里生成的项量将作为项量引擎 的锁影。最后向量原始文本数据会在这一段写入 dash vector, 从而完成本地知识库锁影的构建。 接下来我们操作一下如何调用知识库。首先我们需要定义一个检索方法,用于召回知识库信息。刚刚我们使用了一个天龙八部的知识库,现在我们检测一下召回效果。问他一个问题,段誉最喜欢的是谁? 可以看到这已经返回了段誉到底喜欢谁的一些相关信息,到这里知识部调影就完成了。 最后我们测验一下知识股锻炼前后大模型的生成效果。首先我们需要初始化下大模型,这里我们选用千万七 b chat。 然后我们再定义一个包含知识库信息的提示词模板, ok, 我们来测试一下效果。先问不带知识库的千万七币虚竹的女朋友是谁? ok, 他说无法回答这个问题,没有给出正确的答案。我们也问一下 gbt 四,他说是小龙女和阿紫也不对。最后来试一下包含知识库的模型, 嗯,蒙古回答是正确的,而且可以看到给出了相关的背景信息。再来一个上难度的问题,段誉的亲生父亲是谁? 可以看到千万七币回答的是段正醇。我们再问一下 g p t 四,他的回答也是段正醇,也不对。最后我们看一下包含知识库的效果, 嗯,这次终于对了,是段音庆,效果还不错, ok, 最后我们再问一个比较小众的问题,虚竹的母亲是谁? 可以看到前面 t b 讲的是错误的康敏郡主,我们再看一下 g b 四的回答,杀猪也是错的。我们最后看一下包含技术库的返回, ok, 这里返回是正常的,一二年效果很不错哦。以上就是通一千问七币基于本地知识库问答的操作和演示,其中我们使用了阿里云 dash scope 和 dash vector 的相关产品,链接在视频下方, 这种方法可以让各种行业的知识库与通易千文结合,给出更加精准的答案。相关代码已经在 github 上开源,操作文档也已在线,希望开发者来摩达社区体验。

阿里不是出了这个通易千问,通易千问里面有一个,看一下,嗯, tony 千万里面有一个专门写代码的一个插件,然后可以在 vs code 里面去装,但是它支持好几个, 但是它支持好几个,那我们来看一下 vs code 里面,呃,如何来安装,我们让它来生成一到三十二,然后六位不重复的数字,模仿双色球吧。 我们来先安装一下试一下。首先打开 vs code, 在这个扩展里面去搜这个通易千万通易 就是这个,我们安装 安装完成之后会在左边这个菜单栏中我们点一下, 点的时候因为我之前安装过,也登录过了,我先退出一下模仿登录一下。登录的话他直接就到了阿里云的这个登录界面,我们只需要去扫描即可。 刚刚手机扫描了一下,登录成功就 ok 了,他登录成功了,我们就可以使用这个。 首先我们来新建上一个文件,嗯,双色球吧, atml 新建的桌面上, 然后我们向通讯先问这个代码助手来提问,给他一个我们需要写的功能,打个比方, 用 gs 写一个五六位数字,从一到三十二位,一到三十二中, 嗯,等于。然后我们用第二个吧,把第二个先复制出来, 放在这个脚本里面。 完事之后我们把这个 输出一下, 打开刚新建的这个,打开控制台,刷新一下 出来了,看一二三四五六,刚好是六个,而且这六个数字是不重复的,他都是从一到三十二随机出现,那我们把它渲染到我们的这个页面中, 有一种双色球的这个效果,我们来试一下。 面无表情,越是心 抱我在胸口, 了解我内心的渴望,比表面 的时候你不负我当陪我却认同 梦想 那样我要再看他 地道曙光。再见吧, 空间只为逍遥。 然后我们用退一千万来生成一个, 生成一个装随机 yes, 来,我们新建一个来看一下,充一千万给他们生成的,他们还写了好长时间呢。 双色球。 来,我们来看一下同一千万给我们生产的。 很厉害了。 所以有什么呃,不会的可以跟通讯商会里面去问问啊。这种的话生存起来速度超级快又实用, 因为而且通一千。问他这个里面,呃你支持哪些语言? 他现在写的是加瓦 c 加加拍摄,呃, c 叉股, 这边是 grape p p 呃 rubbing 然后 go 跟 rest, 但是,呃好像用 three, 他也用 three 的写一个, 这里可以看到他用 swift 也可以写出来。所以有什么代码不会的可以用这个统一签。问好。今天就聊到这里,拜拜。



达摩院发布了自己的大模型通一千问,我第一时间测试了一下通一千问和 chat gpt 一样,通过输入语言去交互,但他单独设置了三个板块,九个功能,兼顾实用性和趣味性。 我先让他帮我做了一份五一的旅游规划,从出行方案到美食推荐都面面俱到。接着我又测试他对 pdf 文件的信息读取能力,他可以很轻松总结出文件的要点,并且根据内容回答我们的问题。 他的菜谱生成这个功能也是很有意思的,我问了他一个没有见过的菜宫爆菠萝丁,没想到生成的菜谱看上去还很靠谱。 除了这个呢,还有一个化学界的老段子叫探探剑,剑能能否否定定律?一、这个段子的笑点在于断句,亲爱的 g p t。 的 回答是不理解,而通易千问不光能理解,还给我们解释了这句话,可以看出,通易千问在这些领域是比亲爱的 gpt 还强的。在测试完这些后,我决定再测测他的逻辑能力。一开始我选了个简单的等差数列题, 这个解题步骤就像是不会做,还想拿分。接下来的测试里,我问他能不能处理图片信息,他的答案又自信又专业。我接着问他这张简单的图片里有哪些字, 但他接下来回答明显就是没有识别成功。这就算了,我指出他的问题反被倒打一耙。可以看出,通一千位适用于大部分生活场景, 而且是国内的大模型,有机会截入国内的 app, 帮我们订票、点外卖、回消息等等,希望在使用过程中,他能慢慢搞懂人情世故。