粉丝8836获赞1.4万

本期内容由深空投资免费提供。时机信息全称为北京中长时机信息技术股份有限公司,注册地为北京市,股票于二零零七年在深交所上市。公司控股股东和实际控制人都是李仲初。 根据身外行业分类标准,公司属于软件开发行业,目前软件开发行业总共有一百三十一家 a 股上市公司。实际信息主要概念有云计算、区块链、大数据、国产软件等。 业务方面,实际信息是一家专门给大消费行业做信息系统的公司,主要服务对象是酒店、餐饮、零售、休闲娱乐等行业。公司占据了中国酒店和零售业一半以上的份额。 公司在酒店信息系统方面有多个品牌和子公司,可以给不同类型的酒店客户提供各种云端的系统和服务,比如酒店管理、 中央预定、会员管理、支付、产品开发咨询等。公司也是全球主要的酒店信息管理系统提供商之一,从二零一五年开始在亚太、欧洲和北美三大区域开展国际业务。公司在旅游休闲信息系统方面,主要服务于景区、主题乐园、旅游目的地和文旅集团, 在中国大型主题公园和集团化大型旅游项目市场上占据了领先地位。产品有高尔夫解决方案、剧院和活动管理解决方案、主题公园及景区解决方案。 公司营业收入构成中,百分之六十九来自计算机服务和软件业,百分之三十一来自商品批发与贸易行业。 从地域分布来看,百分之八十八来自国内,百分之十二来自海外地区。重要财务数据方面,公司注册资本二十一亿元,在行业一百三十一家上市公司中排名第七名, 当前市值四百六十五亿,位列行业第十二。二零二一年营业收入为三十二点一亿元,位列行业第十九。净利润为负四点八亿,位列行业第一百二十七。控制资产一百零五亿,位列行业第十。公司资产构成中,流动资产占百分之六十一,非流动资产占百分之三十九。 公司每一百元资产中有十六元是负债,每一百元营业收入亏损了十二点九元,股东每一百元钱亏损了五点九元。 成长能力方面,二零一二年到二零一九年,公司营业收入从八亿增长到三十七亿,期间年均增速为百分之二十四。二零一九年后,公司营收出现下滑, 从二零一九年的三十七亿下滑到了二零二一年的三十二亿。在公司营收高速增长的二零一二年到二零一九年,净利润仅从二点九亿增长到了 四点六亿,涨幅为百分之六十,远低于营收增速。且二零二零年和二零二一年出现亏损,十年间资产增加了五点九倍,负债增加了七点三倍,资产负债率基本在百分之二十以内,处于低负债水平。盈利水平方面, 公司最近几年毛利率都在百分之四十左右,低于行业中位数,净利率在二零一九年前处于行业中游。整体来看,公司在软件开发行业中盈利水平处于中下游。股东回报方面, 公司上市以来累计募集资金两次,共募集二十六点九亿元,进行了十五次分红,累计派息七点八亿元。最近十年每年都进行了分红, 近十年净资产收益率从百分之二十五一路下滑到百分之四,并在二零二零年和二零二一年出现亏损。市场表现方面,公司最近十年 年度股价表现取得了六正四负的成绩,最大涨幅出现在二零一五年,上涨了百分之一百三十,最大跌幅为二零一六年,下跌了百分之五十二。公司年末市值最高点出现在二零一五年,超过了五百亿,股东人数峰值出现在二零一七年,为二点五万。 估值方面,公司当前试营率负八十五倍,试镜率为五点八倍,估值高于历史上百分之四十七的时间。每天了解一家上市公司,我们明天见。

本期内容由深空投资免费提供,这期我们来开箱一家中国酒店信息系统领域绝对龙头时机信息时机信息全称叫做北京中长时机信息技术股份有限公司,注册地在北京市,股票二零零七年在深交所上市。公司的控股股东和实际控制人都是李仲初,组织形式属于大型民企。 根据涉外行业分类标准,公司一级行业属于计算机行业,这个行业目前有三个二级行业,共三百三十五家上市公司,实际信息属于其中的软件开发行业。目前这个行业总共有一百三十二家 a 股上市公司。 实际信息主要涉及到的概念有区块链、国产软件、大数据、新零售、电商概念、移动支付、跨境支付、远程办公、阿里概念。这些 时机信息干的事就是把酒店、餐厅、商场、景区每天离不开的收银、病房、记账、会员、供应链一整套软件做成标准包放到云上,客户不用买服务器,直接开浏览器就能用。公司靠卖这套系统赚钱,也顺带给客户配齐收音机、扫码枪这些硬件。 时机信息二零二四年全年收入二十九点五亿,最大头来自酒店,软件,占百分之三十六,毛利率百分之四十七。 赚钱套路分两步,先收一笔实施费,帮酒店把系统装上线,再按房间数或门店数收年费,平均续费率百分之九十。像万豪、洲际、希尔顿、首旅、锦江这些连锁集团都是他的客户,国内五星级酒店里百分之八十都至少用他一个子系统。 第二大收入是硬件分销,占百分之二十一,但毛利率只有百分之二点九,基本平价进出算帮客户跑腿。采购赚两三个点九,基本平价进出算帮客户跑腿。二点九,基本平价进出算传统分销商 第三大收入时,零售软件占百分之十八,毛利率百分之五十二点五,模式和酒店一样,先收实施费,再收年费。华润万家、王府井、 skp、 屈臣氏这些零售百强里,一半门店都用它,对手是多点科迈海底。 第四块是自己做的智能 pos 机占百分之十七,毛利率百分之十八点六,一次性卖断给超市、便利店、餐厅售后收点维护费,跟新大陆联迪商米正面抢市场。 整体来看,实际现在靠酒店软件吃饭,硬件跑量贪成本。零售软件当第二条腿,所有业务都在往云上搬,酒店这块已经摸到全球门槛,但还在烧钱换客户,盈利得等订阅规模再往上翻几级。 核心竞争力方面,实际信息把酒店餐饮零售三条赛道最常用、最难换、最合规的那套数字底座做成了云,并且已经让客户搬不动。先说客户搬不动的理由, 国内五星级酒店里,百分之八十至少运行着他的一款软件,数据格式、房价代码、会员等级、税务接口、公安上传支付通道,全部按他的模板存了十几年 换掉。他要把前台管理系统、中央预定系统、支付发票报表接口重新做一轮,没几家酒店愿意冒这个险,续费率因此稳在百分之九十以上。这是第一层护城河,第二层是合规和本地化。 中国税务外卖平台移动支付身份上传跨境数据,他提前全部买进系统,外国厂商想进来,得再花一年做补丁。反过来,他去海外也拿了全套认证,能把中国客户的境外分店一起接走。 第三层是规模带来的接口权,全球九万家酒店门店,两百二十条主流预定渠道,三十多家银行收单全部连进他的 a p i。 谁想再做一个新渠道,就先得按他的自断写代码。第四层是财务模型,公司酒店软件业务毛利率百分之四十七,零售软件百分之五十二。 二零二四年 cs 可重复订阅费五点二亿元,同比增长百分之二十五。一旦覆盖研发摊销边际成本接近零,利润弹性比传统一次性卖盘大的多。最后就是时间成本,避雷 公司两千零八十九名研发人员里,百分之四十二做海外版本。它能把同一套代码切成多租户、多货币、多语言,在亚马逊云、阿里云、本地机房三 d 同时落地,这个能力不是靠挖一两个团队就能复制它二零一五年开始国际化,现在才跑动,时间本身也是避雷。 综合来看,时机不是技术最尖端的公司,却是把替换成本、合规门槛、接口规模、云财务模型同时作实的少数玩家。客户不搬家,他就能继续收稳定月租。客户要搬家,也得先问清楚值不值得花掉半年的利润。 在产业链中,时机信息卡在甲方和乙方中间位置不算宽,却够深。酒店、零售、餐饮的门店要开门,先得把收银、订房、会员、库存这套系统跑通。时机就是提供这套数字水电的中间层,公司溢价能力来自替换成本。 五星级酒店一旦用时机的云前台管理系统,所有房型、房价、会员、账务、报表、接口都跑在他的数据模型上。换系统等于把脑子和脊椎一起换,没六个月干不完,还要再花一次培训费、接口费、停业损失,酒店集团算过账,宁愿继续交年费。 万豪、洲际这些甲方规模再大,也不敢轻易换核心系统,时机就能每年稳拿百分之九十续费率。向下游,他集中采购收银机、打印机,出货量大了,对上可以压价,对下可以平价,捆绑销售,赚两三个点渠道费,虽然毛利低,但现金流快。 向上游,云基础设施他自己不见全租,阿里云、亚马逊云、本地运营商、机房算力、贷款、存储都是大宗商品,他反而有挑选余地。 真正让他有话语权的是数据口径。银行、 o t a、 税务局、连锁总部,各自要求不同,自断时机,把接口做成标准件,谁想直连,就得按他的格式来,久而久之变成事实标准。新入局者,先得把这套接口全抄一遍。时间和成本都是壁垒, 只要客户规模不掉时机,就能继续收数字水电费,价格不提太多,客户也懒得搬。竞争格局方面,酒店、餐饮、零售三大场景的信息系统市场被一条最简单的指标划深两层。全球前五大酒店集团,用谁的前台管理系统,谁就是第一梯队,用不上就留在第二梯队。 这条分界线来自全球旅游数据权威机构 st 二二零二四年报告。万豪、希尔顿、周季雅、高凯悦合计客房规模约五百一十六万间,占全球连锁客房百分之五十五。他们的技术选型直接决定了供应商坐厕。 第一梯队只有三家, oracle、 时机 inforce 二期统计显示,这三家签下的全球五大集团客房渗透率分别是 oracle 约百分之四十、时机百分之三十一、 inforce 百分之十七。三家加起来吃掉九成份额。 oracle 靠早年收购的 hope 前台管理系统库存,最大 时机靠二零一五年后自研的 daylight 云套件,五年里拿下洲际半岛、凯宾斯基、星豪等标杆。 inforce 靠云源深架构守住雅高和少量希尔顿副品牌, 三家之外只能分到剩余百分之十自动落入第二梯队。第二梯队公司技术并不差,但缺少全球五大酒店合同,无法进入 s t r 的 统计表,也就失去了向其他酒店集团讲故事的最硬案例。 餐饮和零售系统没有 s t r 这样的统一榜单,但竞争逻辑一样,谁进全球前五的酒店餐饮或零售百强,谁就晋级 时机的云 pos 同时服务万豪、希尔顿、周季、雅高、凯悦的餐饮部门是唯一拿到大满贯的云 pass, 因此和 orco 的 symphony infot pass 并列餐饮第一梯队。其余公司因为没有同时覆盖五大酒店集团,只能算第二梯对。接下来我们看一下公司的财务情况。 时机信息二零二四年实现营收二十九点五亿元,比上一年多了不到两个亿,增速只有百分之七,增量主要来自酒店信息系统和硬件配靠订单的小浮爬升, 利润端就没那么体面了。规模净利润亏损两亿元,连续五年亏损,公司自己解释,全球 size 转型还在烧钱的半山腰,无形资产贪销,研发加码、参股公司简直一起挤占利润, 现金流倒是给了一点安慰。金银现金净流入六千七百万元,同比小幅增加百分之六。盈利指标上,公司综合毛利率百分之三十四点九,低于行业头部。公司净利润负百分之二点七,双双为负,在软件同行里明显掉队。 简单说,公司还在用利润换市场,盈利质量谈不上优秀,场概方面倒是不用担心。资产负债率只有百分之十六,账面现金占到总资产的百分之四十五,且没有有息负债,流动比例三点八五,速动比例三点六一。短期和长期场概都很宽裕,公司几乎不借钱,也就谈不上复习压力。 根据实际信息,最新譬如的二零二五年三季报,前三季度公司实现营收十九点二九亿元,同比小幅下滑百分之四。 归属于上市公司股东的净利润为两千一百一十六万元,看起来逆市增长百分之三十三,只是因为上年中期基数较小,实际增加额并不多。金银现金进流出四千万元,继续保持前三季度进流出的常态。 接下来我们看一下公司所处的行业情况,酒店、餐饮、零售这三个行业现在正悄悄进行一场后台升级。简单来说,整个行业从单机版全面滑向云订月,谁先把连锁集团拉上自己的云,谁就能在未来十年收稳定月租。这个市场规模不算特别庞大,但客户一旦用了就很难更换, 年薪极高。目前这个行业有三个新变化最值得关注,他们直接决定了未来的行业格局。第一个变化是云端前台管理系统的抢先潮。过去酒店装一套前台管理系统,从部署到能用,需要六个月时间,而现在的云端版本,四周就能完成上线,效率提升了好几倍。 正因为如此,洲际、希尔顿、雅高这些国际高端酒店集团,二零二四年在中国新开的酒店,都明确要求优先用云端系统。据行业统计机构 s t r 的 数据,二零二四年全球高端酒店的云端系统渗透率已经冲到了百分之三十八,预计到二零二六年就能超过一半。 这种云端系统的收费模式是按房间数收月租,每间房每个月三到五美元。对服务商而言,这是一笔非常稳定的现金流。 第二个变化是支付功能和软件绑定在一起。二零二四年,中国社会零售总额达到四十八点八万亿元,其中百分之八十六的交易都用了移动支付。对商家来说,顾客到店扫码付款、会员积分、累计开发票、核对账目,这些环节必须一次性打通,才能保证运营顺畅。 更重要的是,央行已经把商家这边的聚合支付接口纳入了合规检查范围,这意味着谁能提供稳定好用的收银软件,谁就能掌握商家的支付流量。第三个变化是 ai 帮商家提升收益。 这一点在酒店行业体现的最明显。酒店最头疼的就是房间空的没人住。二零二四年,万豪酒店试点了 ai 动态调价模型,简单说就是 ai 根据市场需求、节假日、竞争对手价格等因素,自动调整房间售价,结果平均每间可售房收入提升了百分之五点八,还省下了一点三个百分点的线上旅游平台佣金。 根据行业巨头 mds 的 最新白皮书计算,这种动态定价算法每年能给全球酒店行业多创造六十八亿美元的收入,相当于整个行业的总利润提高了百分之八。 现在这种 ai 模块也是按年收租的模式,每间房每年一百美元,毛利率高达百分之八十,已经成为软件服务商新的赚钱增长点。最后我们来看下公司的精彩发展史。 时机信息成立于一九九八年,最开始是做酒店信息系统的集成服务商。二零零三年,他们做了一件非常关键的事,拿到了美国公司 microsoft 的 明星产品酒店物业管理系统在中国内地的独家代理权。 这个系统是酒店前台最核心的软件,用来管理客房预定、入住、退房这些日常运营。借助这个全球领先的产品,时机信息迅速打入了国内高新级酒店市场,并建立了声誉。 二零零七年,公司在深交所成功上市,上市的时候他已经在全国五星级酒店市场占有了超过百分之八十的份额,可以说在高端市场打下了非常坚实的技术。 上市之后,公司开始通过收购的方式来快速扩大自己的业务范围,比如他们收购了杭州希软科技,这加强了他们在酒店管理软件方面的实力。他们还控股了专门做酒店中央预定系统和客户关系管理的实际昆仑软件 之后,他们又通过拿下 inforce 公司进入了餐饮信息管理系统领域,后来还收购了资讯软件,把业务拓展到了零售业,这样公司就从最初的酒店系统集成商,慢慢变成了能为酒店、餐饮、零售这几个大消费行业提供全面软件解决方案的供应商。 二零一四年,公司有一个重要的资本动作,就是引入了阿里巴巴作为战略投资者,这不仅带来了资金,也为后来在淘宝旅行、新零售等方面的业务合作打下了基础。从大约二零一六年开始,实际信息启动了新一轮转型,这次的目标是国际化和云化。 所谓云化,就是只把传统的需要酒店自己安装维护的软件,转变为通过互联网在线订阅使用的云服务。这对公司来说是个巨大的转变,因为收入模式从一次性卖软件使用的年度订阅费, 这几年公司的云产品确实取得了一些突破,成功进入了一些全球顶级的酒店集团,比如万豪、洲际、希尔顿等,成为他们选择的系统供应商之一。但同时转型也带来了挑战,比如大规模的研发投入和全球销售网络的建设成本很高,导致公司近几年净利润持续为负。 总的来说,实际信息从早期做酒店系统集成,到凭借代理国外优秀软件占据高端酒店市场,上市后通过并购扩大业务版图至餐饮零售,再到近年来全力向国际化云服务模式转型, 他目前正处在一个从传统软件公司向全球化 cs 平台服务商转变的关键阶段。每天了解一家上市公司,我们下期节目再见。

hello, 大家好,今天咱们聊个重磅新闻,阿里千问 ai 购物功能全球首发了,你知道吗?他们这次是打通了全链路 ai 购物,从搜索到履约,全流程 ai 搞定,连谷歌、亚马逊都没做到。 哇,这还挺厉害的,不过具体怎么实现的,能举个例子吗?比如说,你跟千问说周末想带爸妈去杭州西湖玩,他能自动帮你订机票、找酒店、安排行程,甚至直接下单景区门票,全程不用你自己切换 app。 而且他们还打通了淘宝闪购和支付宝 ai 付,说一句就能送到家,真的是懒人福音。听起来确实很方便,不过这背后肯定离不开合作伙伴的支持吧? 没错,这次阿里找了六家核心合作商,每家都有明确的分工,比如时机信息,阿里持股百分之十三是全球酒店 pms 龙头。 千问的酒店预定功能就是直接调用它的系统。光云科技是淘宝、天猫的头部 sas 服务商,帮商家做订单管理和数据分析,是首批生态 agent 合作服务商。 那威盟集团呢?我觉得他们是做智慧零售的,这次有什么合作?威盟和淘宝闪购战略合作,把智慧生鲜、商超、门店解决方案都接入了千问,还迭代出十五个 ai 智能体全家桶,覆盖了零售的各个环节。 数据港是阿里云核心 idc 服务商,百分之九十四的收入都来自阿里,之前还签了一百六十亿的十年期订单,负责给千问提供算力支持。 那为您健康和新大陆呢?这两家看起来和电商不太相关啊。为您健康是千问伙伴计划成员,和阿里健康合作开发 ai 辅助诊断系统,覆盖超两千家医院。这其实是阿里在布局 ai 医疗健康领域。 新大陆是支付宝核心收单服务商, ai 支付风控技术领先,负责保障千万 ai 支付的安全和效率。这么看来,阿里这次是构建了一个非常完整的 ai 电商生态壁垒啊,从技术到算力,从零售到医疗,全产业链都覆盖了。 没错,这就是阿里的差异化优势。谷歌、亚马逊虽然也在布局 ai 电商,但它们的生态不如阿里这么完整。阿里有淘宝、支付宝、高德、飞猪这些现成的业务,能直接把 ai 功能接入进去,形成携同效应。 而且千万的 qn 三 max 模型性能对标 gpt 五,支持多模态交互,能理解模糊需求,并推理出隐含刚需,这也是他们的技术优势。那从投资角度来看,这六家合作商有什么受阅逻辑吗? 首先,时机信息、光源科技、微盟集团这些直接参与 ai 电商生态建设的公司,会因为千万的推广而获得更多的订单和收入。数据港作为算力服务商,随着千万用户量的增长,算力需求会不断增加,他们的业绩也会受益。 瑞宁健康和新大陆虽然和电商关联不大,但他们能借助阿里的平台推广自己的 ai 技术,提升市场份额。 那你觉得 ai 电商真的能带来革命吗?会不会只是个噱头?我觉得 ai 电商确实会带来很大的改变,尤其是在用户体验方面。以前我们购物需要自己搜索、对比下单,现在只要说一句话就能搞定,这会大大降低购物门槛,提升购物效率, 而且 ai 还能根据用户的历史数据和偏好,推荐更符合需求的商品,提升用户的购物满意度。不过要真正带来革命,还需要解决一些问题,比如 ai 的 准确性和安全性,还有商家的接入成本等。 没错,任何新技术的推广都需要时间和过程。不过阿里这次的布局确实很有前瞻性,他们已经走在了 ai 电商的前列。 对,阿里这次是把 ai 作为核心战略来推进的,千万只是一个开始,未来他们还会把 ai 技术应用到更多的业务场景中,比如物流、金融、医疗等,构建一个更加智能的生态系统。好的,今天咱们就聊到这里。

最近 ai 应用涨了几天,又跌了回去,很多人就跑过来问,我看 ai 就是 炒概念啊,它不是主线行情结束了,那如果说这个就是你的全部认知,我建议啊,现在你就可以划走这个视频, 因为你想要的是明天就能涨停的代码,而我要讲的是未来一年真正的产业变化。那就在前天呢,我跟几个机构的资深朋友关起门来,激烈的讨论了将近两个小时啊,就吵一个问题, ai 的 行情到底结束了没有?那最后呢,我们达成了共识啊,可能跟市场上百分之九十九的噪音是截然相反的。 那我们认为呢, ai 不 仅没有结束,而且呢,主线地位从未如此清晰过。即便是这两天跌了,那我还是要站出来啊,跟大家去做产业知识的科普。只不过说当下市场这个钱,它正在从一个肤浅的第一阶段,流向一个更深刻也更残酷的第二阶段。你如果说看不懂这个切换的话,你就会觉得, 哎呀, ai 现在要完了。那你看啊,所有人都在跟你们说二零二六年是 ai 应用原点,听起来好像这个机会遍地都是,对吧? 但是今天呢,我就要告诉你一个可能有点反常识的真相啊,就是大多数人理解的 ai 应用,跟市场上聪明的资金,他们正在买正在下注的 ai 应用,根本就不是一回事。 你以为的 ai 应用是不是下一个国民级的 app, 就 比如说像抖音,像微信,像这种超级爆款啊?但机构的视角呢,就完全不一样, 他们看到的是什么呢?是 b 端,也就是企业端的全面赋能,是生态巨头的内部改造,是数据价值的终极重估,那这三件事情呢,不显山不露水,但这个才是这轮行情里面利润最后确定是最高的金矿。 今天这个视频呢,我就把接近两个小时的内部交流,用十分钟的时间给你去深度的拆解二零二六年啊 ai 应用的炒作脉络,帮你去重新认知所谓的 ai 应用,它到底是个什么东西。 那为什么说市场的共识可能错了呢?我们首先啊,要看一看机构眼中它的应用是什么。第一就是 b 端赋能,说白了呢,就是你要帮企业去赚钱,还要省钱, 这个不是说你做一个聊天机器人就可以了,而是要用 ai 呢去改造一个具体的行业,就比如说他要用 ai 去优化工厂流程啊,像这个中控技术,然后呢用 ai 去提升酒店的效率管理,就比如说时机,那用 ai 去辅助编程,那这里面的逻辑啊,它是效率及利润,那你想啊, 一年利润一个亿的工厂,如果说一套 ai 系统能够帮他去优化流程,然后节省百分之五左右的一个成本,那就是实打实的五百万的净利润,对吧?那你想老板他愿不愿意花这两百万去买你这套系统呢? 他太愿意了,那企业他愿意为看得见的降本增效去付钱,这个才是最硬的商业模式,核心呢,就是我们要去跟踪企业,他愿不愿意持续为 ai 买单。 那第二呢,就是生态闭环啊,那这个要看什么呢?就是看所谓的 ai 应用,它能不能去带动巨头的这个内生增长引擎,这个东西呢,就比你想象的更隐蔽了,那你以为阿里腾讯自己啊,它这个 ai 就 只是做个豆包通一千万给你去聊天用的吗? 大错特错了,他们最厉害的 ai 呢,根本就不是做什么独立的 app, 而是直接用来增强自己最赚钱的业务。 我给大家去打个比方啊,就比如说像阿里,他用 ai 让淘宝商品推荐的更准一点,让商家投放广告的回报更高一点,然后这节呢,他就用 ai 让抖音的每一条视频推送就更对你胃口一点,然后让你每天多刷五分钟,这每一点点的提升啊,带来的都是一级甚至十亿级的利润增长。 那我们投资这类机会呢,不是说你去买 ai 概念股,而是你要去买自身业务能被 ai 深刻改造的互联网巨头,或者是它们生态里面最铁的合作伙伴。第三呢就是设施还有数据,这个是无论刮风下雨都是确定性的方向啊,应用百花齐放。最后呢,都得问两个东西,一你要算力,第二你要数据, 算力层面呢,你就不要只盯着什么英伟达, ai 越往后发展,它对高速传输、高密度连接的需求呢,是非常恐怖的。所以说光模块、高端 pcb 电路板啊,先进存储这些硬件,它需求呢是刚性且持续的 啊,它们可能不能一下子就让你特别的激动啊,但是呢,它是不可或缺的,就比如说淘金热里面最稳赚的是卖铲子,还有卖牛仔裤的, 那数据层面呢,这个就是价值重估了, ai 模型是天才厨师,但是高质量的数据就是顶级食材,中国最大最优质的数据金矿在哪里呢?在政府,在国企,在核心企业手里。 以前这些数据啊,是沉睡着,现在呢,数据要受成 ai 的 政策啊,就是要去激活这座金矿啊,谁能够提供挖掘工具,就比如说数据标注处理,或者谁拥有矿产的这个探矿权,那谁的这个价值呢?就会被重新计算。 那我们理清了上面这三个重中之重,那我们就能够看到二零二六年 ai 看似散乱的这个机会呢,其实它的脉络非常的清晰, 那脉络一是什么呢?就是 b 端赋能,聚焦, ai 加制造, ai 加专业工具。那工业 ai, 这个就是政策最强导向, 人工智能加制造,比如说你关注在石油化工等流程工业啊,它有深厚积累的龙头,就比如说中控技术,它用 ai 帮工厂去优化流程,是从卖软件到收费服务的商业模式升级。 然后我们看企业服务 ai 就是 关注那些已经卡住企业核心系统的公司,就比如说酒店管理系统的实际信息,接入 ai 之后呢,能够直接提升客户的利润卖路二呢,就是生态闭环,绑定大厂朋友圈 啊。首先我们看一下阿里链,核心呢就是蚂蚁阿福健康管理,还有通一千问企业服务投资上呢,可以关注像健康数据的这个出口,阿里健康还有算力基座数据港。然后呢,自己就是 deepsea 链啊, 豆包呢,是国民应用, deepsea 呢,是技术先锋,关注其核心生态伙伴,就比如说每日互动,深度绑定 deepsea, 能充分的享受其技术红利。然后再看一下华为链,在国产算力中生态是最强的,你可以去关注一下它这个服务器配到的核心供应商,就比如说高速连接器领域的这个华丰科技。 然后再看一下麦洛三数据,还有算力基建啊,永恒的卖水人。数据要素呢,就要去关注一下稀缺数据资源,或者是顶尖标注能力的公司, 就比如说海天瑞声,这个是 ai 数据标注龙头,那再到算力硬件,那我们知道应用爆发,它可以倒闭。算力升级这里呢有三条线,第一呢就是光模块向一点六 t 升级。第二呢就是 pcb 用于高速服务器,还有交换级的这个互电股份。第三呢就是存储 hbn, 还有高端的 d r a n, 并且呢我要跟他去透个底啊,纯属的涨价周期呢,可能会延续全年,当然呢机会大,波动也大啊。这轮行情呢,有三个关键的风险点也要跟大家去说清楚。首先第一个呢就是业绩兑现不及预期, 很多的 ai 应用公司收入增长很快,但是呢利润还没有跟上,所以大家要仔细的去甄别,到底是真繁荣,还是说是烧钱换增长。第二呢就是技术路线变更, ai 技术迭代非常非常的快啊,今天的主力模型,明天呢可能就会被颠覆,你要去投资那些能够伴随巨头一起迭代的生态伙伴,而不是那些单打独斗的公司。第三呢就是政策还有海外的摩擦,我们看啊,像这个 h 二零芯片的这个进口是否开放,直接就影响了国产算力链条的情绪还有节奏。 那这里呢,我可以跟大家去讲一个策略啊,求稳的投资者呢,你可以优选脉络三,也就是算力基建,还有脉络二生态巨头自身,他们呢是相对明确的,北塔业绩能见度比较高, 那求弹性的投资者呢,你可以深入的挖掘脉络一,也就是 b 端赋能,还有脉络三当中的数据要素,这里呢,可能会出黑马,但是呢需要更精细的去研究它的基本面。 那最重要的一点是什么呢?就是忘记炒概念,然后你去建立跟踪指标,就比如说你要去看一下你所有的公司,它的这个 a r r 增速,还有 token 的 这个消耗量,核心的生态伙伴有没有什么订单进展,你要用产业的指标去看 ai 应用这条线,而不是用 k 线的这个指标来指导你的投资。 所以说呢,回到最开始的问题啊,二零二六年 ai 应用的这个投资,本质上呢,它是一场政治套利,市场呢,可能还在寻找那个万众瞩目的 ai 杀手级应用,而真正的战争呢,早在企业的后台,在巨头的服务器里面,在沉默的数据河流当中已经打响。 那我们的任务呢,不是说去猜哪个 app 会火,而是我们要去识别哪一些公司,它正在用 ai 重塑的商业世界,哪一些资产它正在被 ai 重新定价。 你从硬件到应用,从模型到生态,从流量到数据,它是一张全新的财富地图,你看懂了这个视频,你就看懂了这张地图。那如果说你觉得这个视频对你有用的话,记得点赞收藏,您的支持呢,是我持续更新的最大动力。

你的任务是利用 ai 算法。想象一下,你是一家大型电商公司的数据科学家,你的任务是利用 ai 算法为数百万用户提供个性化推荐。 你需要处理的数据包括用户购买记录、浏览行为、商品信息、图片视频等等。这些数据量巨大,而且类型各异。没有高效的数据基础设施,你的 ai 模型就无法训练,你的推荐系统就无法工作。 现实生活中的例子, netflix 使用数据湖舱一体架构处理 p b 机视频和用户行为数据,实现个性化推荐,这就是高校数据基础设施的实际应用。 想象一下,你正在组装乐高积木,每一种积木都有不同的形状和用途,你需要把它们巧妙地组合在一起,才能搭建出一个完整的模型。 ai 系统的数据也是如此,你需要把不同类型的数据源整合在一起,才能构建出一个强大的 ai 应用。 医疗 ai 系统需要整合 x 光片非结构化数据、患者病历结构化数据和实时监测数据,留数据才能进行准确的诊断, 这就是不同数据类型协同工作的完美例子。结构化数据像整齐的表格,使用关系型数据库,如 my sql 或 post sql, 存储数据有固定模式,通过 sql 查询和 api 集成访问半结构化数据更灵活。使用文档数据库,如 mongoddb 或 cassandra, 支持 json 格式和键值,存储适合变化的数据结构。非结构化数据包括图像、视频和文本。使用对象存储,如 s thine、 azure blob 或 google cloud storage, 通过对象键值和 rest api 访问实时流数据,用于即时事件处理。使用消息队列,如 kafka pulsar or aws kinesis, 支持发布订阅模式和流逝数据摄取延迟在毫秒级。想象一下,你在一家繁忙的电商网站,购物网站需要存储你的信息, 比如用户名,密码和购买记录,这些就是结构化数据,具有清晰表格结构和预定义模式的数据。这些结构化数据存储在关系型数据库中,比如 mysl 和 postgradsl, 它们使用表格来组织数据,并通过关系连接不同的表格。关系性数据库的优势包括 a c, i, d 事务支持,确保数据可靠, 以及强大的 sql 查询语言,可以轻松解锁和操作数据。在 ai 系统中,关系性数据库用于存储用户特征和商品信息。 比如一个电商网站的用户信息表,可以帮助 ai 生成个性化推荐。想象一下,你在社交媒体上发布了一条动态,包含文字、图片、视频,还有点赞和评论,这些信息如何存储呢?这就是半结构化数据的魅力所在。 它使用灵活的 json 格式,可以轻松处理复杂不规则的数据结构。半结构化数据不像结构化数据那样有严格的表格格式,而是使用文档数据库,如 mongoddb 和 cassandra。 这些数据库的优势在于灵活性,能够轻松扩展和支持复杂的数据结构,就像你发布的动态那样。在 ai 系统中,这些文档数据库非常有用,可以存储用户行为认知和社交媒体数据,帮助训练推荐算法和分析用户偏好。 想象一下,你是金融交易系统的工程师,每秒钟有成千上万的交易数据涌入,需要实时处理,这些数据就是实时流。数据,具有高速度、连续性和实时性。 kfk 是 一种强大的消息队列系统, 它通过生产者发送数据到代理,然后消费者接受数据。这种架构支持高吞吐量和低延迟,非常适合实时数据处理。 posr 提供了先进的流处理能力, 它使用代理来分发数据,支持持久存储和全球复制,使得数据处理更加可靠和灵活。 aws 是 云原生的消息队列服务, 它可以从多个生产者收集数据,并无缝集成到 a w s。 生态系统中,用于实时分析。在 ai 系统中,消息队列用于实时监控和欺诈检测。 例如,系统可以实时分析数据流来识别潜在的风险。举个例子,在金融交易系统中,每笔交易都是实时流数据,及时发现可疑活动并防止损失。 想象一下,你正在建造一座房子, e t l 就 像是在建造房子之前,先把所有的材料都加工好,再运到工地进行组装。 e l t 就 像是先把所有的原材料运到工地,再在工地上进行加工和组装, 后者可以节省运输成本,提高效率。传统 e t l 是 数据仓库时代的标准做法, 先从各种数据源提取数据,然后进行转换,比如清洗和过滤,最后加载到目的地。这种方法计算密集,需要专门的 e t l 工具。现代 e l t 配合现代数据站成为主流, 先提取数据,并直接加载到云数据仓库中,然后使用 sl 进行转换。这种方法将计算下推到数据仓库,大幅降低数据工程复杂度 工具包括 airbite 用于提取和加载, dbt 用于转换,以及 snowflake 或 data bricks。 作为仓库相比 etl, elt 将转换步骤移到数据仓库中,利用云的弹性计算降低数据工程的复杂度,提高整体效率, 这在云原生时代已成为主流选择。现实生活中,以前企业需要使用专门的 etl 工具来清洗和转换数据,然后再加载到数据仓库中。 现在,企业可以使用 e l t 工具,直接将原始数据加载到云数据仓库中,然后使用 sql 进行转换,大大简化了流程。在云原生时代, e l t 成为数据处理的新选择, 它通过利用云数据仓库的弹性计算能力,大大降低了数据工程的复杂度。 e l t 的 主要优势包括,利用云数据仓库的弹性计算能力,降低数据工程复杂度, 并支持大规模数据处理。现代数据站通常由 air byte、 dbt 和 snowflake 或 data bricks 组成,支持完整的 e l t 流程。在现实生活中,企业可以使用 air byte 将来自多个 s s 应用的数据加载到 snowflake 中, 然后使用 dbt 经数据转换,实现高效的数据处理。 elt 特别适用于大规模数据仓库和需要快速迭代的场景。想象一下,你有一个仓库,里面存放着各种各样的货物。 数据湖就像是一个巨大的仓库,可以存放各种类型的数据。数据仓库就像是一个经过精心整理的仓库,可以快速查询和分析数据。 lakehouse 就 像是一个既能存放各种类型的数据,又能快速查询和分析数据的仓库。数据湖仓一体架构将数据湖的灵活性和数据仓库的可能性结合在一起。 delta lake 和 patch iceberg 通过提供 ac 事务支持,让数据湖具备数据仓库的可信。 delta lake 增强数据湖的可信,提供事务支持和模式引进 a patch iceberg 也是一个优秀的 lake house 选择。 支持原数据管理和数据版本控制。 data bricks 的 统一方案已成为处理 p b g。 多模态数据 如视频、三 d 资产和文档的首选架构。 netflix 使用 delta lake 构建 lake house, 统一处理视频需与用户行为数据实现个性化推荐。想象一下,你的数据湖就像一座摇摇欲坠的房子, 每次数据更新都可能出现错误和不一致,导致整个系统不可靠。 delta lake 就 像一位可靠的建筑师,为数据湖提供了坚实的基础,确保数据的一致性和可靠性。 delta lake 的 核心是 asset 物,包括原子性、一致性、隔离性和持久性。这确保了数据操作的安全性,就像银行交易一样。可靠 模式眼镜功能让数据结构可以动态变化,比如添加星列而不会破坏现有的查询和应用。 时间旅行功能允许你回到任何历史数据版本,就像时光机一样,支持数据审计和快速恢复。 想象你在数据湖中更新用户数据时出错导致整个数据级混乱,这时 delta lake 的 时间旅行功能可以让你瞬间回滚到更新前的版本,就像从未出错过一样。 delta lake 在 数据审计和恢复中发挥关键作用,它允许追踪所有数据变更,确保合规性,并能在错误发生时快速恢复系统。总之, delta lake 通过 s i 事务模式眼镜和时间旅行,让数据湖变得可靠而强大, 确保你的数据始终安全一致。想象一家电商公司被 tb 级数据淹没,他们需要一个可靠的存储解决方案,这就是 apache iceberg 的 故事。 apache iceberg 的 关键特点包括支持大规模数据处理,甚至可以处理 p b 级数据。它提供高性能查询,确保在大数据级上快速分析。 iceberg 提供 a set 事务,确保数据操作的可靠性, 这包括原子性,全部或全无,一致性、隔离性和持久性。模式眼镜允许添加或删除列,甚至更改数据类型,而不会破坏现有数据。与 delta lake 相比, iceberg 的 优势是开源灵活,多引擎支持,但工具集成较少。 delta 的 优势在于强大的生态系统和性能优化,但可能有供应商锁定风险。现实生活中的例子, 一家需要处理 tb 级数据的电商公司,可以使用 a patch iceberg 构建 lake house, 实现可靠高效的数据处理。想象一下,你正在图书馆查找一本书,如果没有目录,你需要一本一本的查找,非常耗时。 向量数据库就像是一个图书馆的目录,可以帮助你快速找到需要的书。二零二六年,向量数据库已成熟,支持迁入向量查找。 milva thundering 使用 disk n 锁芯处理十亿级项量,延迟降至毫秒级。 pinicon serverless 适用于云原生环境,支持万亿级项量。 weviate q grant chroma d b 各善易购数据处理, 混合检测稠密加稀疏向量 rrf 算法优化 rate, 系统准确率达百分九十五。现实例子,在图像搜索引擎中,向量数据库存储图像特征向量,根据关键词快速检测相似图像。想象一个能处理海量数据的智能系统, milvis 三点零正是这样的工具。它是一款高性能向量数据库,支持多种缩影类型和快速查询。 milvis 三点零的核心特点包括支持多种缩影类型,如 h, n, s, i, v, f 和 diskn, 以及提供高性能查询能力。 diskn 硬盘缩影技术是 milvis 三点零的亮点,它允许处理高达十亿级别的向量规模,通过硬盘优化实现高效剪索。 milvis 的 架构包括代理协调器、工作节点和持久存储。使用 e, c, d, pulsar 等技术, 缩影过程包括数据输入、迁入居类图勾键,而搜索过程设计查询输入和结果输出。 milvis 三点零在实际应用中非常强大,例如图像搜索和推荐系统。 想象一个电商网站的故事,它使用 milvis 三点零存储商品的特征向量,然后根据用户的浏览历史快速推荐相似的商品,提升购物体验。 想象一下,你是一家创业公司的工程师,负责构建一个智能聊天机器人,需要处理成千上万的用户查询。 传统数据库可能无法应对这种海量向量数据的挑战,但 pinecone serverless 就 像一个神奇的助手,自动扩展来满足需求。 pinecone serverless 的 核心特点是其云原生架构, 它完全托管在云端,无需你担心服务器维护或基础设施问题,就像云端的一座智能仓库, 随时准备存储和解锁向量数据。另一个关键优势是自动扩展。当用户查询激增时, pineconvolus 会自动调整资源,就像弹性橡胶一样伸缩自如。 这意味着无论面对高峰期的流量还是平静的时刻,它都能保持高效运行。这种设计大大降低了韵味成本,你不再需要雇用专门的韵味团队来管理数据库,也不需要预先购买昂贵的硬件。 pinecone serverless 按需付费,让你的预算更灵活,就像用多少付多少的水电费一样。在实际应用中, pinecone serverless 特别适合 rag 系统和聊天机器人。 rack 系统通过解锁相关文档来增强回答准确性,而 pinecon serverless 能高效存储这些文档的特征向量。举个现实例子,一个处理大量用户查询的 rack 系统可以使用 pinecon serverless 来存储文档的特征向量。 当用户问问题时,系统快速解锁相关向量,生成准确答案,而无需担心数据库的扩展问题。在聊天机器人中, pinecon serverless 支持实时向量搜索,帮助机器人理解用户意图并提供个性化回复。 结合云原声优势,它让构建智能应用变得简单而经济。让我们先看看 v v 8 向量数据库。 他擅长处理复杂的数据结构和图关系,非常适合构建知识图谱。在医疗研究中,他可以处理互联的患者数据,帮助医生发现隐藏的模式。优点是灵活,但对简单用力可能过于复杂。 接下来是 qrent, 它以高性能的分布式架构著称,支持实时更新向量。在电商中,它能快速推荐数百万商品,帮助用户找到心仪的产品。优点是查询速度快,但资源消耗较大。 最后是 chroma db, 一个简单且开源的向量数据库,非常适合快速原型设计,创业公司可以用它迅速构建 ai 聊天机器人测试想法。优点是医用,但不适合大规模生产。 通过对比我们可以看到, wev8 适合复杂数据, qdrent 适合高性能查询,而 chroma db 适合快速原型。根据你的需求选择合适的数据库,就像选择合适的工具一样重要。 想象一下,你在使用一个智能问答机器人来寻求帮助,有时候他给出的答案很准确,但有时候却错过了问题的关键点,或者理解了错误的含义,这就是传统解锁方法的问题所在。 今天我们来聊聊混合检测和 rf 算法如何让机器人变得更聪明。稠密项链就像一个聪明的读者,他不止看字面意思,还理解整体语义。比如我喜欢苹果这句话,他能同时想到水果和科技公司, 这让他在理解复杂问题时很强大。但有时会忽略精确的搜索工具, 他只关注具体的关键词,比如苹果价格,他会直接匹配苹果和价格这两个词,这在需要精确信息时很有用,但可能错过语义上的相似表达。混合绞索就是把稠密向量和稀疏向量结合起来,使用 稠密向量处理语义,稀疏向量处理关键词,这样机器人就能同时理解意图和捕捉细节, 大大提升解锁的准确性。 rf 全称是刀数排名融合,它通过一个简单公式,新排名等于一除以 k 加上原始排名来融合稠密和稀疏解锁的结果, 这样就能得到一个统一的、更准确的文档排名。在现实的问答系统中,比如用户问苹果公司的最新产品 稠密向量,理解,这是关于科技公司的稀疏向量匹配。苹果和产品关键词 rf 算法融合着两者的解锁结果,最终给出更准确的答案。想象一下,你正在管理一个仓库,你需要把常用的货物放在容易拿到的地方,把不常用的货物放在角落里。 存储。成本优化就像是管理仓库一样,你需要把经常访问的数据放在高性能存储中,把不经常访问的数据放在低成本存储中。 分层存储是将数据分为热数据、温数据和冷数据。热数据经常访问放在高性能存储中,冷数据很少访问,放在低成本存储中,这样可以平衡成本和性能。 生命周期管理如 stime intelligent turing 会自动监控数据访问模式,如果数据三十天未访问,就移到不频繁访问层。如果更长时间未访问,就移到规档层,这样无需手动管理,节省成本。 数据压缩使用 park 或 o r c 格式,这些列式存储格式不仅压缩数据,减少存储成本,还能提高查询性能,因为只读取需要的列。 对于大模型训练数据需要特别关注。版本管理使用 dvc 可以 跟踪数据变更,确保训练过程可重现,避免数据漂移问题。 一个电商公司可以使用 s 三 intelligent tiering, 将经常访问的产品数据放在标准存储中,将不经常访问的历史数据放在 glacier 存储中,从而显着降低存储成本,同时保持必要的性能。 通过分层存储、生命周期管理和数据压缩,企业可以有效平衡存储成本与性能,为 ai 系统提供经济高效的数据基础设施。想象一下,你是一位摄影师,拥有数千张照片。 有些照片你每天都会查看,比如家人合影,有些偶尔看看,比如旅行回忆,而有些老照片可能几年才翻一次。 在数据存储中,我们也用类似的方式分层管理,这就是分层存储的概念。 根据访问频率,我们将数据分为三层,热数据需要快速访问,如 ssd 存储温数据,偶尔访问用 hdd, 冷数据很少访问。用磁带库,选择时要平衡速度和成本。 在实践中,数据会从热层流动到温层再到冷层。比如,你经常查看的照片保存在 ssd 上,旧照片移到 hdd, 追踪到磁带。 举个例子,你的照片库新拍的家庭合影放在 ssd 快 速访问,旧的旅行照片移到 hdd, 节省成本,而二十年前的照片存到磁带库里。分层存储帮你优化成本和性能。 想象一家电商公司每天上传数百万张商品图片,随着时间推移,许多旧图片很少被访问,但仍然占用昂贵的存储空间,导致成本不断上涨。 simeintelligent tiering 是 亚马逊云服务提供的智能存储解决方案,它可以根据数据的访问频率,自动将数据移动到最合适的存储层,从而降低成本。 sine 提供多个存储层级,标准存储用于频繁访问的数据。智能分层自动移动数据。冰川存储,用于长期规党 intelligent turing 在 这些层级之间自动切换数据。 使用 sine intelligent turing, 企业可以显着降低存储成本。数据显示,这种智能管理可以将存储成本降低多达百分之四十。 以电商公司为例,他们的商品图片中,许多旧图片很少被查看。通过 s 三 intelligent turing, 这些图片会自动移动到 glacier 存储层,成本大幅降低,同时保持随时可访问。总之, s 三 intelligent turing 通过自动化数据生命周期管理,帮助企业显著降低存储成本并提高效率。 这是现代云存储的智能解决方案。想象一下,你正在经营一家大型电商网站,每天有数百万用户点击、浏览和购买。 传统的数据存储方式就像把所有信息堆在一个大箱子里,查找起来非常慢,且占用空间巨大。传统的数据存储是形式存储, 把每一行的完整数据放在一起,这在读取整行数据时很方便。但在 ai 系统中,我们常常只需要查询某些列,比如用户的年龄或购买习惯。列式存储则相反,把同一列的数据放在一起, 这样可以更高效地压缩数据,因为相通类型的数据更容易找到重复模式。 parker 是 一种流行的列式格式,它把数据按列存储,并使用原数据来描述文件结构,包括数据类型、编码和偏移量。 这让查询变得更快,因为你只需要读取需要的列。 oc 是 另一种列式格式,专为 hedup 生态设计,它把数据分成条带,每个条带包含行数据、缩影和原数据。这种结构支持更高级的压缩和微词下推加速查询。 看这张图表, parky 和 oc 的 压缩率远高于未压缩的数据。使用 snappy 或 zep 算法,数据大小可以减少到原来的几分之一。这在 ai 系统中非常重要,因为训练数据往往巨大无比。 在 ai 系统中,使用列式格式存储数据,意味着你可以快速扫描特定列,比如用户的行为日制,这提高了查询速度,降低了存储成本。 举个现实例子,一家电商网站每天收集数 tb 的 用户行为数据,如果用传统格式存储,服务器很快就会爆满。但改用 park 格式后,存储空间减少了百分之七十, 查询用户偏好数据的速度提升了五倍,帮助 ai 推荐系统更快响应。 想象一下,你是一位数据科学家,正在训练一个大型图像分类模型,数据集不断变化,但你无法追踪变更或复现结果, 这就是 dvc 出现的原因。 dvc 即 data version control, 专门用于管理大型模型训练数据的版本,它就像 git 一 样。但针对数据文件, dvc 的 优势包括跟踪数据变更,就像代码一样管理数据版本以及复现实验结果, 确保训练过程可重复。现实生活中的例子,当训练图像分类模型时,使用 dvc 跟踪图像数据级的变更,并复现模型的训练结果。 dvc 让数据管理变得像代码管理一样简单,通过跟踪变更和确保复现性,提高了机器学习项目的效率。想象一下,你是智能城市项目的首席架构师,城市需要处理海量的视频监控、传感器数据和图像识别信息来优化交通和安全。 这就是 lake house 架构大显身手的地方。通过设计支持 p b 级多模态数据的 lake house, 你 可以将各种数据源无缝集成,为 ai 模型训练奠定基础。首先查看 lake house 架构的数据流, 从结构化、半结构化和非结构化数据源开始,通过 p 处理和流式摄取进入存储层, 然后在数据湖中进行 e t l 处理,添加原数据缓存和缩影,最后通过 api 供 bi 报告和机器学习使用。接下来是 e l t 管道,数据从多个来源提取加载到数据仓库中进行转换, 转换后的数据可以用于分析和适化和应用,这比传统 e t l 更高效,尤其在云环境中,数据库有多个层级,从原始数据开始,经过摄取、提炼、处理到深层洞察,最后连接到业务系统。 每个层级都优化了数据的可用性和效率。对于向量缩影,使用分层方法,每一层都有网络连接的点表示,最近您搜索虚线显示从入口点到下层的路径,这优化了大规模向量剪索。再看看另一个 lakehouse 架构,强调多模态数据的处理, 从数据源到消费层,确保支持图像、视频等多种格式。最后是 ai, lake house 集成数据集成 bi 工具、 ai 管道和基础设施服务,包括查询引擎、目录和监控,为完整的 ai 工作流服务。现在让我们用三 d 模型来可示画 lake house 架构, 慢慢旋转它,你可以看到数据如何在不同组建间流动?现实中的例子, netflix 用 delta lake 处理 pb 级视频和用户数据,节省成本百分之三十。 openai 在 gpt 五训练中使用 pinecone 向量数据库,提升准确率百分之二十。医疗 ai 如辉瑞则通过分层存储降低成本百分之四十。 根据场景选择实时解锁用 milvis, 云原声用 pinecone, 隐私保护用 wevii。 现在轮到你了,设计自己的 lake house 架构,包括数据源接入、 e、 l t 管道存储、分层和向量缩影。结合这些理论和实践,为 ai 模型训练和推理打下坚实基础。
