粉丝191获赞3015

hello, hello, 大家好,今天给大家介绍一下这个,就是可能大家很多人都看到了这个,这是腾讯开源的一个企业级的这种哎,大魔仙的这种知识库的这样这种这样的一个 一个项目,这边是他部署,我自己部署了一下,就可以看到是这样的一个一个一个界面,然后我最近高强度使用了一个星期吧,我感觉确实还可以,就最近正在写那个毕业论文, 然后我就就高强度的使用了一下,感觉还是可以的,就他的部署也很简单,直接用了一个多克就可以自己在本地就部署了, 然后它就是一个这种已经是这种啊,就是 production ready 的 这种就是已经是可以部署了,这个基本上就可以直接就开始用了。然后它的这个 agent 模式是比较好用的,就是你一般的那个知识库的话,就只能你 一次对话,他就是现在一次对话,他就在这个库里面给你搜搜那么相关的几个,然后他就就没了。但是他这个 agent 模式是是可以用那个 model 进行那个多轮对话,然后去进行一个呃,就是更更一个更精确的这样的一个一个搜索, 然后就下面是他的一些这种核心特性的介绍嘛。然后这里就是我主要是用来做这个啊,论文,读论文的, 还有他其他的也还可以,就是做一些这种,然后他的 a 战的模式,我就是想给大家展示一下,我觉得还是挺好用的啊。登录进来就是这样一个界面,然后我这里已经 搞了一些这个,我已经搞了一些这个文章进去了,就是可以看到我这里大概是有二十三、二十四篇文档,然后里面有一些那个别人的 c c s, 有些别人的 cc, 然后有一些这个 r t 口,然后这是其他的这个我分类搞了一些这个文章,然后, 呃,这里的话,你可以进来这个模型管理里面先加自己加一些模型,它这个是你如果 alma 自己有本机的话,也可以用本机的,但我这个 啊,就那个机子不行,就我都是用的 remote, 就是 这里 remote api, 你 可以自己如果有的话,你就可以去搞一下 remote。 然后这里给大家推荐一个 api 的 这个网站,就是这个,就是我自己用的一个 他的这个啊,模型非常的全啊,就大概有他这里有五百八十多个模型,就比较常用的什么这么 nice 呀?然后 g p g 五点二啊,这些最新的这些模型,这里都能都能找到,就都能用,但是 这个的话就是不推荐用那个这么 nice 三和二点五 pro, 因为我试了一下,因为这两个模型自带那个思考,可能你在那个 a 阵的调用的过程当中,它思考的时间太长了,就会把整个那个 workflow 就 打断了,所以这里的话用这个 deepsea 三点二,我感觉是 效果比较好的。然后 imbedding 的 话就用 openai 的 这个 imbedding 三 large, 然后 re rank 的 话就用千问这个,那就把这个模型一加,然后 对话模型策略的就用这个 agent agent 这个模式你就可以看这里最大是支持这个三十步的这个自己的迭代,然后它这里自己 agent 有 一些调用的这种模式啊,一些工具, 那就可以制定一个计划,然后在你的知识库里面自己去搜索一些相关的知识,然后再来进行那个回答。这个是我觉得它主要一个比较核心的一个,一个一个好用的一个比较比较好用的一个点。 好的,接下来我们来看一下这是,这是我之前,这是我之前问他的一个问题,就是我要他写我的这个博士论文,然后我让他给我推导一下这个贝耶斯分析的这个方法来 来探测这个,这是关于联系人的播用贝耶斯分法来啊的贝耶斯这个方法的这个论述,然后用 markdown 的 事情是给我们,我们我之前用的是 the text, 因为它的 text 编辑起来比较麻烦,用 markdown 的 话,等会就是看结果的时候会比较简单一点。现在我们让它来 让他来这个工作一下,然后现在你就可以去接杯咖啡或者什么,然后回来等着回来看结果就行了。他会这个,他这个 agent 模式会, 他会自己给他列一个那个,呃,列一个计划,然后他会根据这个计划再去一步一步的完成你的这个要求。 好的,可以看到他已经开始啊阅读完这些了,开始准备写了。 好啊,他已经完成了这个状写,我们复制一下,然后 打开我的 cursor, 然后我们新建一个文档,看一下 这个,从这个 ok, 好, 然后我们看一下效果啊, 可以看到就是这些基本上他写的这些都是对的,因为你是给了他那个参考文献的嘛,然后他这个写的这些,其实他还是就是就是保证他这个知识是准确的, 而且他写的也还可以。然后就是就是主要的问题就是你要把你的 prompt 写好,就是让他他可能一次,呃,不能完成一个比较 fun 的 一个 一个任务,你得把你的这个要求细化,但是他就是对于一些比较简单的这个问题,他还是可以完成的,挺好的。你看这个他写了,写了这么多,可能有,这应该有个两三页了吧,三四页可能都有了。就 就是我感觉这个它的这个效就是效果是要比那种单机,就是这个 agent 这个模式要比你基于一个知识库来进行一个回答,它这个效果是要好很多的。 嗯,好,这是这是关于这个就是这个维多利亚的编程的这个开源的知识库的这个 这个介绍,然后你只需要有一个这个啊模型的这个 a t i 你 就可以就可以直接用了, 然后感觉效果还是也还挺好的。这个所以大家有兴趣的话可以自己部署了,然后试一下。如果你用 alama 自己本地有模型的话,甚至都不需要花钱,就直接用 alama 本地模型就可以直接就可以用。好的,谢谢大家。

大家好啊,不知道你们是不是跟我一样,作为一名项目经理,每天的办公桌上简直就是文档的海洋。什么项目计划啦,技术规范、销售报告,每一样都是公司的宝贵资产。 但说实话啊,真到关键时刻想从这里面找一个具体的数据,那感觉真的就跟大海捞针一样。所以,今天呢,咱们就来聊一个叫 viknorah 的 开源框架,看看他到底是怎么把这些沉睡的文档变成一个能随时回答你问题的智能助手的。 你不妨先想一下这个问题,你公司里最有价值的那些知识和数据,是不是正安安静静地被困在各种 pdf、 word 还有 excel 文档里? 当你急着要一个关键数据的时候,你是能马上找到呢?还是得打开一堆文件夹,翻箱倒柜地去找? 嗯,这恐怕是很多公司每天都在上演的头疼事。现实情况就是这样,那些真正能带来业务突破的洞察力,往往就埋在这些海量又杂乱的文件里。 我们花了那么多时间去写这些报告,结果呢,在最需要他们的时候,他们却集体沉默了。这个不仅仅是效率低的问题,很多时候,它甚至会让我们错过一些至关重要的商业机会。那么,这个僵局要怎么打破呢? 威克纳尔这个框架就给我们提供了一个全新的思路,它利用了现在最前沿的人工智能技术,目的就是来真正的解锁这些文档里沉睡的价值。 威克纳尔的核心技术,说出来你可能听过,就是现在很火的解锁增强生成,英文简称 r a g。 这个概念听起来有点专业,但其实特别好理解,你可以把它想象成是给 ai 办了一场开卷考试,而所有的参考资料呢,就是咱们公司内部的所有文档。 在回答你的问题之前, ai 会先去老老实实地翻阅这些资料,找到最相关的段落,然后再根据这些找到的内容来组织它的答案。这么一来, ai 的 回答就不是狭隘了,而是有理有据,完全基于咱们自己的事实。 整个过程其实就分了很清晰的三步,第一步叫解锁,这时候系统就像一个超级图书管理员,刷刷刷,迅速在所有知识库里定位到最相关的信息片段。 第二步呢,叫增强,他会把刚才找到的这些上下文信息,跟你最初提的那个问题打包在一起。 最后一步就是生成了大语言模型,会根据这些丰富又精准的上下文,给出一个质量特别高、有深度的回答。 好了解了 r i g 的 基本原理之后,我们再来看看 renoir 是 怎么把它玩出花了。它提供的可不是那种简单的信息搜索,而是一种能真正理解你到底想干什么的智能问答方式。 这张对比图就特别清楚了,你看左边,是咱们熟悉的传统关键词搜索, 你搜完之后得到的是什么?是一长串的文档列表,还得自己一个一个点开去看累不累。 再看右边的 viknor agent 模式,它能直接理解你的意图,然后自动去分析,最后直接给你一份总结好的报告。 这完全是两种层次的工作体验,对吧?那它凭什么能做到这么精准呢?关键就在于它的混合监测策略,它不只靠一种方法,而是特别聪明地把好几种技术结合到了一起, 既有我们熟悉的关键词搜索,也有能理解语意相似度的向量搜索,甚至还有能分析实体之间复杂关系的知识图谱。这种多管齐下的方式,再加上一个解锁重排生成的优化流程,就能确保最后找到的信息质量最高也最相关。 好了,理论说了不少,咱们还是得看点实际的,接下来我们来看一个具体的实战案例。就想象一下,威克诺尔现在化身为一名数据分析师,他能帮我们做些什么呢? 这个场景我想大家肯定都见过。一份原始的销售报告,通常是 csv 或者 excel 格式,里面密密麻麻全是数字和表格,光看着就让人头大,想从这里面快速看出点门道来,真的太花时间了。 好,现在你作为管理者,只需要像跟同事说话一样,用大白话提出这样一个问题。在过去,就这么一个问题,可能就得让一个初级分析师吭哧吭哧忙上好几个小时。 那么,威克诺尔的这个数据分析时代里,是怎么处理这个问题的呢?它背后其实有一套非常严谨的逻辑。 第一步,它会自动去解析这个 excel 文件,然后识别出哪些劣势关键信息,比如产品线、销售额、日期这些。 接着呢,它开始进行计算和趋势分析。最后一步,也是最关键的一步,它把整个复杂的分析过程,用咱们能听懂的大白话儿总结出来。 瞧,这就是最终给到你的结果。从一堆乱糟糟的原始数据,到一份儿这么清晰直观、能直接用于决策的总结报告,整个过程可能也就是几秒钟的事儿,这才叫真正的从数据到情报的飞跃。 当然了,聊到企业级应用,尤其是一涉及到公司的核心数据,安钱绝对是头等大事。这一点威克 nora 早就替我们想到了, 这里面最最重要的一点就是你的数据完全由你自己掌控, weekner 全面支持本地化和私有云部署, 这意味着什么呢?就是所有的数据和处理过程都可以在你公司自己的防火墙内部完成,这就确保了最高级别的数据主权和安全性,从根源上杜绝了敏感信息泄露的风险。最后,咱们再来看看这个框架的架构设计, 要知道,一个优秀的工具不仅要能解决眼前的问题,更重要的是它得能适应未来的发展。 这张图就把维克诺尔的模块化设计展示的非常清楚,你看,从文档解析到大圆模型,每一个核心组件都是可插拔的, 这又意味着什么呢?就意味着你可以根据自己的实际需求,像搭积木一样自有的贴画和组合这些模块。比方说你觉得市面上某个新的向量数据库性能更好, ok, 可以 直接换掉,完全不用改动整个系统。 这种解偶的架构带来的最大商业价值就是面向未来。你想想,当未来出现了更先进的向量数据库,或者更强大的大语言模型时,你可以非常轻松的把它集成进来,根本不需要推翻重来。 这就保护了你的技术投资,让整个系统能够与时俱进,永葆活力。好了,聊到这,让我们回到最初的那个问题, 你可以尽情想象一下,如果你公司所有这些沉睡的数据,都能像一位资深的专家一样随时跟你对话,回答你哪怕是最刁钻的问题。那么你能用它来做什么?又能创造出怎样前所未有的价值呢?

最近很火的腾讯的 i m a 知识库,谷歌的 note book l m 我 下载了五次,卸载了五次,为什么这些被吹上天的神器 ai 软件, 普通人根本就用不下去?因为实在是太烦人心了。普通人想的是今晚吃什么,周末去哪玩,这是流水账日子。但这些装逼的软件是逼着你去做项目,去搞科研,写论文,整理几万次的资料。 承认吧,百分之九十的人根本不需要知识库,只需要记事本。所以问题来了,你现在的人生是留着过,还是项目志呢?

