粉丝295获赞4127

有这么一个憨爆了的软件,现在可以不通过电脑用手机直接查看你们 iphone 配件的详细的数据,它可以查看屏幕和摄像头代工厂的优劣等级,也可以查看电池的各项参数跟续航的表现啊, 甚至还能查看硬盘的厂家和通电次数有多少。这软件大家可能不熟悉,但是你们一定用过,电脑版的沙漏电机就是我这位朋友当年制作开发出来的, 所以你们看到这个软件的功能这么强大也是很正常的,我现在给你们演示一下这些强大的功能都是什么。大家可以看到啊,我这台十七 pro max 后置摄像头呢,它是 lg 的 顶级,然后长焦镜头,前摄像头这些啊,所有的参数呢都是有显示的,硬盘是东芝的,然后屏幕呢是 lg dvc 的 这个收到屏幕这个代工厂呢,一般是由三星啊, lg 或者京东方的屏幕比较顶级的是 g 九 p 开头的或者 g 九 n, 其次呢就是 g 九 q, 然后呢 gvc。 往下最次的啊,就是 g h 三的这种不同代工厂的屏幕呢,它显示的效果包括色彩方面都是不一样的啊, 三星的屏幕呢,会更好一些。其次像摄像头这种代工厂呢, lg 算是顶级的了。呃,往下排呢,就是高伟电子或者富士康的, 就差一点意思啊,硬盘也分好几个等级,像三星啊,东芝啊,海力士或者闪迪的,呃,三星呢,也算是顶级。其次往下呢就是东芝往下排哈。电池方面有不同的生产厂家,像惠州德赛,东莞新能源, 长安新浦,还有深圳兴旺达这种。不管是哪个厂家的,它的质量呢都是有好有坏,不能通过厂家去判断这块电池是好是坏啊,比如说你看我这块呢,它就是新浦的,看一下电池的这个数据啊,一百五十三次呢,还有九十九点六一的详细的数据, 包括每一天的亮屏时间呢,还有这个续航的评分,这些软件是可以详细的让你们看到整体的续航水平,包括啊使用了什么都能显示出来,他不光能显示手机的这个电池健康度,也能显示,像手表的也可以啊,我这个手表 续航时间这些都能显示出来。他每一个功能呢都是有使用教程的,如果兄弟们不会呢,我们可以点击使用教程,一步步跟着教程去做。 可以了,后续我们可能还会增加通过技术手段检测屏幕是否更换过啊,比如说 fog 和国产屏幕的检测这个功能呢,还在测试啊,还有一个呢就是硬盘测速的功能,我们也会加进来,这个功能还是比较实用的啊,大家可以期待一波后续的更新。


亚马逊的评论为什么不能看全部啦?我一直不理解亚马逊这部棋是怎么走的,有什么战略性意义,是我党运营不知道的吗?每次只能看几条,想分析差评,分析不了,那还怎么改进?一开始我天真的以为点 see more reviews 就 可以看到更多,结果蹦出这个提示, your request to see more reviews has been sent you receive an email within five business hours。 气笑了,事情难不倒人的,我用卖家精灵下载评论,结果发现按照常规方式下载,下不了完整的评论,只有几条,难道插件队更新后,亚马逊的评论也无可奈何了吗?并不只是操作方式变了,正确步骤是一,点击 ai 评论分析, 生成卖家精灵分析报告三,点击立即前往。这样就可以在卖家精灵后台查看评论分析了,也可以下载下来自己表格分析。这里的评论并不是百分百跟亚马逊一样, 指的是数量。我问过客服,他们的说法是亚马逊现在对评论的管控愈来愈严格,亚马逊拦截我们是无法规避的,不过因为取得是真实存在的。亚马逊后台评论数量不一样,部分原因是 不是评论是 rating, 部分是没抓取到,也可能被拦截了,不过拿来分析还是够用的,技巧干到了的话,选品时能优化产品就优化, 能做差异化就做,实在解决不了痛点,还是不要碰这个品了。评分维护起来很难,一个差评至少顶五个好评,做了心累。过来人经验。今天的分享就到这里啦,每日吉祥话,祝大家身体健康,今年实现财富自由!

这期视频打工人必看 ai 做数据分析,这是我们在企业 ai 培训过程中遇到的最高频的需求之一,本期干货非常多,建议你来点赞收藏。 你有没有一张 excel 表格扔给 ai, 然后它生成了一份看起来非常专业的分析报告,图表漂亮,结论清晰,洞察深入。但是你有没有想过,这份报告里面的数字是真的算出来的,还是编出来的? 可能是 ai 应用领域我觉得最难肯,但也是企业最高频的痛点之一。我呢,干了十三年的商业分析,在咨询公司干了五年,在三六零做了两年,字节做了六年多,整个数据分析和洞察是我的老本行。那过去的一年呢?我测试了市面上绝大多数的 ai 的 工具和分析的方法, 论是 ai 做数据分析可用,但是坑更多。那这一期视频呢?我不会给你演示 ai 有 多么的厉害,相反,我会把 ai 做数据分析的真实的问题一条一条的摆在你面前,然后告诉你这些问题真实存在的情况下,怎么样做出靠谱的分析。 以上都是一些实打实的学类的教训,建议你来点赞收藏。首先哈, ai 做数据分析到底有哪些根本性的问题? 我们先从第一性原理来想这个问题哈, ai 是 什么?它是一个语言预测的系统,它的本质是预测下一个 token, 它不是计算的引擎,也不是一个数据库,也不是一个审计的工具,理解这一点,你就能理解它所有的问题的 来源。那我来给大家展示一个真实的案例,是我们的客户给我的一份用户调研的数据,四百二十六行十五列,那我策划了整个分析的逻辑,需要 ai 做五个补, 对数据进行描述性统计,进行基本的数据处理,进行相关性的分析,做数据的洞察挖掘,最后出可可化的报告。我呢,也用 deepsea、 kimmy cloud、 coat、 pycharm 的 各种工具来尝试。我们来看一下这些工具进行到整个分析的哪一步。 你可能不会想到 deepsea 在 第一步就已经挂了,这是 ai 做数据分析最主要的问题之一。数据阶段他根本就没有看完你的整 个表,大多数 ai 的 平台有上下文的窗口限制,你上传了一个十万行的销售数据表,他只看了前几千行,基于局 部的样本给你生成了一个整体的趋势分析,他不会告诉你他没有看完,他只会给你一个直接的结论。问题二,计算幻觉。他可能第一步对,但是第二步就开始 边了。一些常规的统计描述出错率是比较低的,因为这类任务相对来说简单,但是一旦涉及到多步骤的运算,比如说同比增长或者环比, ai 在 中间步骤就是有可能悄悄出错的。然后他会用一个非常流畅的语言,把错误的结论包装得非常自信,越复杂的运算越容易在中间某一步 产生幻觉,这是大家需要注意的地方。问题三,结果不稳定。也就是我们会发现 ai 做数据分析的时候,同一个问题,他可能明天的答案就是不一样的,他整个输出是有随机性的,今天你问他哪个产品线的利润最高,他给你 a, 但可能明天同样的数据,他会给你一个 b, 或者是说同一份数据,他给到的分析的结论每次都是不一样的。比如说他今天认为我们的核心人群是年轻人,明天会认为整个核心人群是一线城市的人群。 那第四个问题,不理解业务逻辑,也不理解数据的含义。如果你不告诉他你的表格中的字段之间的关系和关联,他会自己去做出一些假设,而且通常也不会说他自己做了什么样的假设,那他在分析的时候就在分析一堆他自己并不理解的符号。 所以这也是为什么我们通常要告诉他我们的业务逻辑,或者是数据之间的关联关系。问题五,基础算数也会错,加减乘除出错的概率是比较低的,但也不等于零。当数据量大,嵌套复杂的时候, ai 的 计算可能远不如一个 excel 公式。问题六,编造不存在的数据。 当数据缺失的时候,有些 a i 号会自动去填出一个合理的数字,而不是告诉你数据缺失。这是最危险的情况,因为你的报告里面混入了凭空捏造的一些数据点, 而你完全是不知情的。问题七,他缺乏对统计意义的常识。比如说我们让他做一些相关性的分析,或者是做一些分组的分析,剧烈的分析,哪怕某个分组的样本量非常低,根本不具备代表总量的代表性, 他也会一本正经的给你输出结论。这种时候我们就必须靠懂业务的人在提示词里面强行做一些限制,他才会规矩。还有问题八,安全问题。 因为我们上传到 ai 平台的数据有可能涉及到企业的敏感数据,比如说销售数据、用户的数据、财务的数据, 它是不允许上传到第三方平台的。这种情况下,我们怎么样去做数据分析呢?以上这八个点都是实际操作 ai 做数据分析过程之中遇到的问题点,你会发现这些问题它有一个共同的根源,就是 ai 是 一个语言生成的系统, 它的目标是生成听起来很合理的输出,而不是保证计算正确。这两个目标之间其实是存在着根本性的冲突的,那我们到底要怎么办呢?三个目标、三种解法理解了以上根本性的问题之后,我们就知道 ai 做数据分析存在着天然的局限,这也帮我们更明确用 ai 做数据分析的三个目标,准确、深度、安全。目前其实还没有一个方案能够完美去实现这三个目标,但是我们可以根据场景来选择。解法一、 优先保证准确我会推荐大家用 cloud for excel, 如果你需要对数据进行计算,而且你必须确保数据是对的,那我们最佳的实践实际上就是 excel 表格。 那为什么是 excel 呢?因为 excel 的 计算是非常透明的, ai 可以 帮你写公式,公式写在每一个 excel 的 单元格里,你能够看见它,能够检查它,能够追溯每一个数字的来源。这和把数据扔给 ai, 让它给你一个答案是有本质区别的, 因为 ai 给你答案是黑盒的,你不知道它是怎么算的,但是 ai 给你公式,公式在 excel 表格里运行,它是一个白盒的,每一步都是可以审计的, 所以我们要确保准确, excel 是 最佳的时间的场景。那这里我们还是用刚才的案例来给大家演示一下同样一个用户洞察的表,我们放在 excel 表格里面,这个 excel 表格里面是嵌入了 cloud 的, 让它先做。第一步,做描述性的统计,它直接会新建一个 sheet, 然后去做每一个题目的统计的结果, 并且你能够看到统计结果的公式,这意味着计算过程是足够透明,你可以回溯,能够审查。在准确性上, cloud 给你的确定性是绝对的。接下来我们要让它进行第二步,也就是数据的预处理, 这里让他对所有的题目进行交叉的分析,其实是一个特别大的计算量。我之前在市场研究公司的时候,我们是需要有专门的 d p 来做数据处理的,耗时至少是花一天的,但是 cloud 几分钟就做好了,而且能够准确地执行,并且帮助你重新生成一个 sheet, 这个是很厉害的,而且我检查了数据是完全没问题了。再进一步到第三步,我们让他做相关性的分析,这里面他会自己把计算相关性的维度和方法都尝试了, 并且主动进行显著性的检验。到这里基本的数据分析的工作其实已经进行了差不多的,接下来我们就是要去做数据的洞察和呈现的过程。 那这里我是直接让他基于所有的分析做总结的报告,他自己主动新增了一个 sheet, 然后把跨表格的结论进行了整体的分析和总结, 这是我认为保证数据分析的准确性、深度最有效的方法。 cloud code for excel 目前直接对表格进行操作的 ai 有 cloud 和 kimi, 最近千万也上了表格的 agent, 但是我自己认为嵌套在 excel 中的 cloud 做得更原生、更彻底、更透明,也意味着更可控。 那它与普通的 agent 的 最大的区别在哪里呢?我觉得,第一,它不让大模型直接来算数,可靠的,不会悄悄地去改文件。你让它去修复公式或者调整逻辑的时候, 它会优先地去展示计划修改的部分,并且解释原因,展示修改前后的公式,然后由你来审核决定是否来应用它。 所以大模型在这里只是负责去生成 excel 的 公式,而 excel 引擎去负责执行这个运算,这样是直接把数值计算的责任交给了 excel 本身。那大模型只负责写正确的公式,规避了直接让模型做算数的风险。 那 cloud for excel 的 架构的本质啊,我自己认为就是 a l m as formula generator, 然后 excel 就 as computer engine, 而人类就作为 final 的 reviewer, 而不是说让大模型端到端的去做整个数据的分析,这是我认为它控制数据分析不准确或者是控制风险的方法,这既是它的护城河,也是它能力的上限。第二点呢,我认为它是拥有跨表格的 联合分析的能力的。普通的数据分析的 excel 和工作模式就是,呃,我把数据给到模型,模型来生成结果,对吧?整个过程是在一个外部的沙箱的环境里面去运行的,跟原始的文件是脱节的。 而 cloud for excel 它的核心差异是 whatbook native。 这是什么意思呢?就是说把它的整个文件作为一个关联的系统来推理,而不是单个的单元格或者是单个的 sheet。 它直接在你的原始数据表格中做操作,做增加 sheet, 然后做跨 sheet 的 联合分析,那它能够去理解嵌套的公式以及跨多个 sheet 的 单元格的依赖的结构。那它在理解整个数据关系的时候,也考虑的是左 所有 sheet 的 上下文,这也给他提供了真正去思考逻辑关系的空间。所以简单说,普通的 ai 是 拿数据去外面分析, 而 cloud for excel 是 在数据里面思考。那第三个点,我认为它还有一个优点,就是它的边缘问题的处理机制。 cloud 能够去追踪一些无效的、空值的或循环引用等错误,并解释出了什么问题,应该怎么样去修复 且不破坏模型。其他的部分,甚至是我看到它的官方文档里面会对于一些报错有很严格的限制,它的官方文档里面写,当它的审核 agent 认为报错为零的时候,它才会输出结果。如 果不文明的时候,它会持续地去在底层做预算。我认为这些机制也能够去保证 cloud 做数据分析的时候的相对的准确性。那可能有人会说自己没有办法使用 cloud for excel, 有 没有什么替代的方案呢?有的,那我们这里给大家第二个解法,优先保证深度用 pmi。 国内目前通用平台做数据分析相对可靠的是 kimi, 为什么 kimi 相对可靠呢?相比其他的平台来说, kimi 在 处理长文本和大表格时截断率是更低的,而且它理解上下文的能力更强,上下文的窗口也更大, 意味着它能看到更多的数据并做分析。而且我们知道 kimi 有 两种模式,一种是 kimi 的 表格模式, cloud 一 样也可以在 excel 的 表格里面去做操作,并且也能够按照你的要求在表格中做预算做分析。但是它是直接在表格中输出结果的,而不是像 cloud 一 样输出的是公式。这也意味着你的整个结论都是在黑盒中的, 你需要去人工叫验它所有的数据分析的过程和结果。 timi 呢?还有一个 agent 的 模式是在沙箱的环境之中,后台有各种数据 agent 学童来操作,我直接来给大家演示一下哈。 我们还是刚才这样一个用户调研的数据的案例,我们给到 kimi, 让他来进行我们预设的五个分析步骤,那非常惊喜哈, kimi 在 这两个模式下, 整个数据的准确度是全部过关的,五个复杂的步骤跑下来完全没有失忆。最终我们能够看到他输出的报告 和可适化的分析的看法,也都达到了可以交付给客户的标准。所以我们其实想说, kimi 用来去做一些常规的数据分析肯定是没有问题的。但其实 kimi 过程中也有一些小的问题,或者是说我给到大家一些使用的建议吧。 第一是不要直接让他给你结论,要让他先描述他看到了什么数据,确认他没有截断,没有基于一些不准确的数据去做分析。 第二呢,是对一些关键的数据进行人工的抽查,把它定位为一个思考助手,而不是说计算的工具,因为它现在目前还是没有办法保证百分之百的准确的。第三个点就是它缺乏统计学意义的一些常识,所以你需要写专门的提示词进行限制,才能让它整体的输出准确而可靠。第四个点, timmy 的 表格模式,我觉得它更适合很纯粹的做数据的处理,但是偶尔会有一些格式上的 bug, 那 它的 a 整数模式更侧重于深度的洞察的挖掘, 我个人是更看重商业洞察的,所以我会建议大家首选 a 整数模式,因为它的整个思考的逻辑会严谨的多。那我们再看一下 timmy 的 整个的分析的步骤,第一步,让它做描述性的统计,完全没有问题,整体是非常准确的。 那第二步,让它进行数据的预处理,这个预处理就是做数据的交叉分析,让它对所有的题目基于特定的一些维度做交叉的数据表格,它能够帮助我们生成一个 sheet, 虽然需要花一定时间, 整个系统你下载下来整体也是没有问题的。接下来我们让他进一步做。第三步就是我们提到的做相关性的分析,这里面我们会给到他提示词,整个相关性应该怎么样去做,哎,他自己已经理解到了,所以他自己也会基于他的理解去做了整个相关性的分析,并且也给到了一些显著性检验的指标。 那接着第四步就开始让他帮我去做洞察的分析的结果,以及第五步,我进一步让他基于他整体的洞察分析的结果做出一个可适化的网页,整个分析非常的完整,还是很符合预期的。 那以上的两个方案我们其实探索了如何准确深度的用 ai 做数据分析,那么我们怎么样保证第三个点安全的做数据分析呢?那在我们做企业的 ai 培训的时候,会发现企业的管理层普 片都卡在一个死胡同,既极度渴望用 ai 挖掘数据的价值,又死死守着数据安全的红线,不敢越雷池一步。那企业其实也探索了很多的方法,但是都有一些致命的缺陷。比如说第一,把数据进行一些脱敏的处理,比如说哈,把一些列名改成指标 a, 指标 b, 但这样的脱敏处理会让他剥离了一些业务的含义, ai 只能做很低级的加减乘除,但没有任何洞察可言。 那第二个点呢,就是花重金在本地部署开源的小模型来做数据分析,那实际落地下来也会发现速度很慢,而且 ai 并不够聪明。所以这一章节我们给大家讲第三个解法,就是保证安全的情况下,怎么样去做数据分析。我们推荐的方案是本地的 python 加 ai 的 辅助, 那当我们在处理一些敏感的数据,最好的方式是数据不离开你的本地环境。你用 ai, 不 管是用 cloud 的, 用 gpt 或用其他的工具辅助帮助你去写 python 代码。然后呢,让代码在你自己的本地机器上运行, 数据不上传到任何平台。这个方法其实也非常的简单,唯一的要求是用户需要有一个 python 的 编辑器安装在本地的电脑。那整个流程就是首先你需要去描述你的需求,给到 ai, 然后 ai 帮你生成 python 的 代码,那接着呢,你去把这个代码拿到你的本地去运行,而 而且整个结果都是在本地去生成的,生成完之后,其实你自己如果想有任何的修改啊,验证啊,审查啊,你其实都是可以去做的,整个全程数据也是不会离开你的电脑的。那为什么这是相对来说最可靠的方案呢?计算由 python 来执行,不是 ai 来执行,所以准确性是有保证的。 那整个代码呢,也是可以保存、复制和分享,你可以是重复性去使用的。也就是说未来你的原始数据有了更新,你直接重新再跑一遍这个代码就可以了。第三个点,数据也是保存在本地的,安全性是可以保证的, ai 只负责把它擅长的部分,也就是把你的需求翻译成代码。但是这个方法也有一定的局限,就是有一点学习门槛,需要你能够看懂基本的 python 的 代码, 但实际上你并不需要会写,你只需要能读懂就可以。好,那我还是给大家来实操演示一下,你就会知道它的难度到底有多大,既不会过于害怕,也不会过于乐观。首先我们要下载一个 python 的 编辑器,我这里是开站,当然你也可以用别的,比如说 vs code 或者 cross。 我 知道哈,屏幕前的你可能听到我刚才说的这些词,你就想打退堂鼓了。别害怕,我保证你看完我操作之后,你就会豁然开朗。不, 不过如此,面对恐惧唯一的方法就是直面他。那我们来想象一下这个任务我们到底是怎么样去处理?首先我们的目标是让 ai 帮我们写出能够分析这些表格的代码。那这里我们的第一步其实就需要告诉 ai, 哎,我有哪些数据表?每个数据表里面有什么?数据表里面的数据结构是什么?那 这一步我们直接用 python 的 编辑器来帮我们输出,我们不需要去自己手动的去写每个表格的信息。那我们打开 python, 进入到我的工作区,我已经把原始文件放进去了, 你的原始的表格可以是一个,也可以是多个数据表,它都可以同时来处理好。这一步输入帮我们输出表格的 info 信息,我给了这样一段代码, 然后我们运行,运行后我们能看到表的基本信息了,有多少行,多少列,具体是哪些字段,对吧?然后我们来到 deepsea, 我 们跟他介绍一下背景,越详细越好。所以我是比较偷懒的,我会把所有的信息都给了他,比如说我直接把我在编程上的刚才写到的这些语句发给他, 然后把我们拿到的所有表格的 info 信息也发给他,接着跟他说我们的要求,那这个要求是什么呢?就是这一段提示词,要求他帮你输出分析的 python 代码文件,然后他会直接就给你写好代码了。 那我们直接下载好代码之后,来到 page 里面去运行,你就会直接拿到结果,他直接会把你分析的结果格式化,并且你能够看到。哎,这里是有一个看板,然后左边是有筛选去看特定的结果。 这个方法啊,很有效的地方在于 ai, 它基本上帮你做成了一个自动化的看板,后续你的原始数据有任何的更新,你重新再运行一下这个脚本就可以了。 那 ai 做数据分析不是说不能用,而是说需要用对地方,它很适合帮你思考分析的框架,把你的需求翻译为代码,但是它确实不适合承担计算和审计的职责。那把 ai 用在它真正擅长的工具, python 的 代码等等, 这才是目前来说相对可行的路径。那今天呢,给大家介绍了这三种数据分析的方法,但大家也需要注意到,这里的分析更多还是让 ai 不要出错,让 ai 能懂数据的关系,让 ai 能够安全的执行。但更多的关于洞察的部分,其实我们今天并没有详细展开, 因为它的难度是更升级的,如果第一步的准确度没有办法完整保证的话,其实洞察也没有办法真正展开。 那洞察呢,是一个更复杂的过程,也更需要对业务的理解,也需要一些特定的场景,觉得未来我们可以做一些专题来做分享。好,以上是今天的分享,如果你觉得还不错的话,可以收藏和点赞哦!我是江江,带你看懂 ai 一 线!

很多兄弟说这个素材跑不正核心逻辑,我们今天给大家就拆解一下,你打开那个素材分析啊,我们现在跑的是一个宠物食品,大家可以看一眼啊,我们测算的 r y 是 要到二点八左右,那么 我运营每天的工作就是先看数据,从左往右看,从刚才那个位置,哎,我们要核心的看几个点啊,第一要看整体的消耗,第二我们看整体成交金额,第三我们要看整体支付 r o i, 第四要看整体的成交订单, 第五要看整体的这个成交订单,还有展示数,还有点击率,还有转化率,还有点击单价,还有这个最后的是这个整体签字展现 有这几个核心的点,你们可以排序把它排到这个前面来,那你每天通过看这些数据,你就能来测测你的这个日常 roi 的 一个 运营情况吧。啊,那我们简单的给大家拆解一下你素材能不能打正的核心的几个点哈,第一呢,我们是要去看 啊 r y, 首先要看 r y 嘛,一定要把 r y 算出来,你 r y 算不出来一定不行的哈,那我们核心就看哪个,看这个点击率,点击率和转化率,点击转化率我们要找到一个投产打正的素材,我们要看这个素材的 点击率,转化率以及他的单次点击单价,是影响你整条素材是否有打正的核心逻辑 啊。我们这里让我们的运营老师跟大家分享一下如何通过点击单价来判断你这个素材是否优质。 来阿源给大家说一下,那有的视频就是不知道怎么去筛选,然后咱们目标投产的话是二点八,二点八的话,那 嗯这个是达不到咱们的要求的,但是他有优质或者是首发优质的话,咱们可以去尝试一下。对,去培养一下,然后去增加他的消耗,然后去提高咱们的一个目标的 r o i, 搜索更多的人群, 对,然后需要去逐步提高咱们的目标 r o i, 然后去看一下素材最终的一个情况, 然后但是咱们首先要考虑的是看一下视频的一个整体数据,然后这个的话前两条他的展示次数是比较高的,他跟咱们的消耗挂钩,然后点击次数的话是咱考核的一个标准,然后 考核的标准是什么呢?如果说他的当前的一个点击次数点击率还有一个转化率能达到咱们头产的一个标准,那他的这条视频就是符合咱们的要求的。然后那每一个产品有不同的一个 呃要求,但是他只要能达到咱们所需要的重点核心的要求,就是咱们的这个 整体的 roi, 能达到咱们要求的话,那他就可以去作为一个咱们当前素材的一个标准去判定。你比如说现在这一个是展现次数是一千八百四十五,然后他的点击次数的话有六十四,然后点击率的话是三点四七, 然后转化率是十点九四,然后但是他的点击单价是比较便宜的,然后点击单价便宜的话就是流量成本会相对应的便宜,然后但是他的点击率的话 也会略微的高,但是他的转化能达到咱们的一个要求的投产,能达到咱们的 要求的投产,那这条视频的话他就是属于,呃,符合咱们的要求的,可以去增加的,增加咱们的一个消耗,增加咱们的一个体量,可以通过追投或者是增加咱们的每日预算去进行。嗯,培养。

大家好,上次我们简单了解了美团的数据分析流程,今天我们再来了解一下携程的。首先打开我们携程的后台,第一步不是先看订单,而是先看一眼有没有违规, 然后打开右上角 p s i 分, p s i 分 在一定程度影响我们的账号权重,所以还是比较重要的。决定 p s i 分 最关键的两个指标就是我们酒店历史建业和历史营业额。 下面这个消费者实惠分,主要是你对比美团价格有没有劣势,这个也要关注一下。然后挂牌的酒店就先去看一下履约情况,点开这边的审核记录就可以看到。然后看一眼点评,携程的点评分,携程同程去哪和智行要挨个去看,能处理的及时处理,该回复的及时回复。 看完这些再去看我们的数据中心,先看销售数据,携程同程去哪都要看,这里主要看在店兼业,看完销售数据,下面就是打开流量数据, 看下面的流量漏斗,对比同行,看一下我们的劣势在哪,尤其是左边的转化率,这个是最关键的影响转化率的因素,前面视频也有详细介绍。一转主要看酒店首图,点评分,起步价、标签等。二转主要看房型图,房型名称、价格阶梯以及点平等, 看完数据有问题再去逐个优化。当然酒店的城市排名也要看一下,这个一般日常波动不会很大,然后有做广告的门店,这边余额也要看一眼。 最后回到我们携程的外网,关注一下周边竞队有没有一个大的价格调整,这个也很关键。今天有关携程的日常分析流程就先说到这里,还有问题的可以打在评论区,大家一起讨论吧!

你现在看到的是耗时三千九百五十六小时制作的二零二六全新数据分析实战教学爬虫篇,全长一百四十二小时三十三分钟,内容包含了爬虫概述、 web 请求、过程剖析、 request 实战抓取等知识点,零基础也能成为数分大牛。今天我们要讲解的是拆散锐模块使用。 好的,那么接着上一节课,接着说啊,那咱们,呃,之前学了怎么去写正则表达式对吧?正则咱会写了,但是呢, 呃,咱们的最终的目的不还是在咱们的程序里面去使用这些玩意吗?对不对?那在 python 里面想使用正则表达式啊,没别的,就是一个模块叫 r e 模块啊,那 r e 模块呢?我们用的时候也是比较简单的啊,比较简单,只要记住这里面的一些 啊,比较重要的操作,基本上就可以了啊,来,咱们直接上这个代码啊,来新建一个 python file, 这个是第几个?这个是。呃, r e 三二三啊,来,走二三, r e 模块。 好,那想用 r e 模块呢,第一件事,没别的说的,把它弄进来啊,把它导进来,导进来之后对不对?我们就可以说用 r e 模块去帮我们去啊, 匹配我们的字母串了,对不对?那我们第一个要学的叫 r e r 叫 find o 啊, find o, 你 看它的参数 叫 pattern 和这个 string 啊,后面 flag 咱们不管啊,咱们不管,那 pattern 呢就是正则,后面 string 呢就是字母串,你要匹配的字母串,所以这里面呢,第一个参数,比方说我写个杠一加,好吧,然后再往下我们写这个,呃,字母串,比如说我的电话号是幺零零八六, 对不对?我们看一眼他能不能给我们一个结果啊?但是他的 find out 的 结果呢?是一个列表啊,我这叫 list 哎 list 这个这个读起来还挺顺口是吧?走, ok。 幺零零八六对不对?他为什么是个 list 呢?很简单呢对吧?我女朋友的电话是对不对?幺零零幺零 对不对?他一下就会匹配出来两个呀,因为我们知道这一句话里面有两个是钢笔加能匹配的对吧?啊?然后还有一点你会发现这个正则底下他给你来了个波浪线,这个波浪线看着就很很痛苦啊,尤其有强迫症的小伙伴怎么办呢?在前面加一 r 啊在前面加一 r 这个 r 为什么放在这?你要是不理解的话去找他的基础,你要是不想翻的话你就记着正则前面这个 r 对 你只有好处没有坏处好吧。 ok, 那 这事咱们就呃学了一个对吧?叫范德奥。那范德奥他的意思是匹配字母串中所有的什么呢?符合正则的内容 对吧?所有符合正则的内容对吧?咱们想要的东西就出来了啊。叫范德奥。范德奥用的并不多啊并不多,因为如果你看我我我我这句话还是比较短的如果这句话很长 对不对?真的是一个网页的源码呢对不对?那你匹配的结果就会很多很多的话,咱们知道列表的效率并不高对吧?列表的效率并不高,那谁比较高呢?来小 friend 来匹配字符串中所有的内容啊。但是 返回的是什么呢?叫迭代器啊。返回的是迭代器这个东西啊我就不多说了,因为我们呃咋说呢?就是就是,还是得有一点的判断基础的。好吧,这个迭代器啊,来, eight 等于 叫 r e, 点 and eight 啊,里面的东西一模一样。来,你给我过来,一模一样啊,然后接下来我们 print eight。 走,你来,你看它是个什么 callable, 什么 interpreter? 它是一个迭代器,那从迭代器里面想拿东西怎么办呢? for 是 吧? i in it 对 吧?来, print i。 来,走 啊,一层东西。那你拿到的是个这么东西? r 一 点麦尺啊,麦尺,你麦尺的东西是什么?是这个幺零零八六,对不对?下一个麦尺的是幺零零幺零,对不对?两个结果啊,两个结果,那我就想要它,就想要它,我不想要这个,这个这个正常穿的东西,那怎么办呢啊?点格子, 走,来,幺零零八六幺零零幺零,发现发现问题了吧,就说他可以通过这个 group 函数,哎,能拿到我们匹配到的内容啊?匹配到的,所以我们返回的是迭代器,那么从迭代器中拿到内容需要什么点 啊?点 go, 那 这是 find 一 整啊,这个东西我们用的多,因为迭代器的效率肯定比你的什么这个列表要高的多啊。 好,那这两个暂且不说,接着再往下聊。有一个这个玩意是 r 一 点 search, search 这个东西要翻译过来的话,我觉得跟 find, 对 于中国人而言, find 跟 search 应该是一个意思,对吧?那它到底有什么不一样呢?对吧?一模一样的弄过来,来 s 等于来 print s。 走,来,我们发现一个熟悉的东西,刚才是不是见过这玩意,对吧?是不是这个 i 就 那个玩意?那想从这个玩意里面拿到内容,那就是点关注,对吧?来,走, 你看得到的是我们想要的结果,所以 search 来,你会发现 search 返回的结果是什么?是 match 对 象 啊。那从麦子里面拿东西呢?需要点啊?拿数据需要点关注跟上面就一样啊,跟上面就一样。然后再注意好像少点啥。幺零零八六不够,还有个幺零零幺零呢,但是, 嗯,没有,我再来一个,哎。还是幺零八六。什么意思呢?注意看这里边你拿了幺零零八六,拿了只能拿到幺零八六。为啥呢?因为 search 它有一个特点,它有个特点就是,嗯,就是全文去解锁, 解锁到一个直接就返回,证明它有啊,证明它存在过,知道吧?所以这个 search 还有这么一个特点,就是 找到一个结果就返回啊,找到一个结果就返回,这第二个就是拿不到的,好吧,拿不到,那再往下。呃,还有一个叫 match 啊,还有个东西叫 match。 来,各位, 我把这个复制一下吧,因为代码太像了。好吧,代码太像了,在这个来个 match 那 然后再再再走,直接运行就行。来这个发现, non type object has no attribute group。 各位各位各位。 呃,纯没有编程基础的小白们,各位, non type object has to object。 看到这句话,你第一想法就是应该找这一行,这一行里面谁有点点,前面那玩意是空 啊,有点有点快是吧?你只要看到这句话了,那你就你就找这一行,这一行里面找点点,前面那玩意是空。那这一行里面这是个点点,前面是空, s 是 空。什么意思?没匹配到,那为什么匹配不到呢?那看着 走看,幺零零八六又出来了,加个 a, 加个 z 也行,随便来,又爆头,那什么意思?这个 mash 啊,它是从头开始匹配, 知道吧?这个 search 呢,是全文匹配,它呢是从头开始匹配,就说白了,它默认会在你的这个什么,这个这个这个正格前面,你可以认为加了个这玩意, 好吧,你可以认为是加了个这玩意,所以呢?这个 match, 哎,我们用的其实也不是特别多啊,也不是特别多。好,再往下,再往下,那基本上我们平时用到的这个 r e 的 这个功能啊,基本上就这几个, find all 啊, find eater 啊, search 啊, match 啊,最重要的 find eater 啊,最重要的就是 find eater。 然后接下来要聊的东西基本上都是围绕着这些玩意进行进一步的操作,比方说他有这么一个操作,就是预加载什么呢?这个政 策,预加载政策的老师,这个是什么意思呢?咱们在呃,下一节其实你就看到了,就是我们想从一个网页里面匹配到内容啊,那个政策可能会写的很长,特别长 啊,特别长,特别复杂。那这个时候,呃,这个这个复杂的正则呢,可能又需要反复的去使用啊,可能需要反复的去调用它,那这个时候我们就可以想办法 把这个正则呢提前给它加载好,然后后面用的时候呢,直接拿来用,对不对?能够就是,呃,提高一点点效率并不高,但是确实能提高一点点效率,那这个时候我们就可以这样做, o b g 等于 r e 点叫什么?叫 compel, 好配有域加载或者编域编一段正则,那这里面一样的 r, 比方说杠 d 加,好吧,我随便写个杠 d 加,那我就相当于我的内存里面或者程序运行的时候,内存里面就有一个 o b j, o b j 表示的就是这段子, 那我想匹配东西怎么办? over 这一点,来, find eater, find, 哦,对吧? search, 对 不对?你,你刚才,刚才我给你们讲的这些玩意是不是都在这,对不对?所以我说前面这个玩意你要掌握了,其实后面的逻辑都差不多啊,都差不多,来,我们来个 find eater 啊, find 一 词,比方说,我们找谁呢?还是这句话吧,我也不想弄新玩意了。你,你要想,你要想弄新玩意呢,你可以自己去尝试。好吧,来这地方就会有一个结果, r e t 啊,来, print r e t。 你 会发现非常熟悉的玩意又来了, callable eater eater, 对 吧?又是个点来袭,那就我,我能,我能惯着你吗?对不对?来,走,看呐, go 啊, eight 吧。 in r e t。 来,从 in eight 点什么? go, 对 吧?从,从那个 lu p 里面往出拿东西来走 eight 吧。 in r e t。 来,从 in eight 点什么? go, 对 吧?从,从那个 lu p 里面往出拿东西来走。 哎,幺零八六,幺零幺零,还是我要的那个结果啊,只不过这个时候我是预加载,先加载,知道吧,他的好处是什么呢?我还可以反复的用,比如说 o v 这点犯的什么?这个,这个。哦,来,哥哥的,我就不信你不还我一个亿 啊,一个亿不行,对吧?这才是数字啊,这才是数字。好,我们看一眼结果,大家看一眼结果走, 对不对?哎,你会发现,这,这就是这一个正则,我是不是就可以在多个地方进行使用,对吧?那这就是这,这就是 compilter 的 一个作用啊 compilter, compilter 的 一个作用。而且我们如果说啊,你想如果这个正很长很长很长好好几行, 对吧?然后呢?像上面一样,如果像上面一样使前面是正则,后面是匹配的字母串,那么字母串也长,你这玩意也长,那这俩玩意合到一起就特别长,对吧?这样的话代码也能美观一点点啊一点。 ok, 那 这是预加载啊,预加载。然后接下来我们来讲解一个比较重要的一个点啊,比较重要的一个点,我现在想从我这一句话里面 提取到一个固定的内容啊,从从正则里面提取到那个,因为现在我们已经能从一句话里面提取内容了,但是我想从这个正则里边往外淘出一点东西来,我们来从这里面复制一段代码啊, 我想把这个字母串里面的这个这个这个这个中国联通啊,西游记啊或者说是 id 啊什么的,我想把这玩意给他拿出来,我准备一下这个字母串 啊这个字母串我为了各位看的更清楚,我把它变多一点啊。西游记,呃,这个西游记不太好啊。西游记在这块有点有点尴尬。这一歪吧。 sorry 他 行这一歪。 j y j j。 嗯,走运。我不知道我拼的对不对啊。嗯,塞了啊,再来个头啊,然后再来,再来,这是一号、 二号、三号、四号、五号,然后这个地方呢?我们随便写点东西,比方说,嗯,这个这个最近在看的一些电视剧吧。嗯,郭麒麟 好了,然后凤姐啊,然后再来一个大聪明,大聪明啊,然后再来一个范哲,范思哲是吧?范思哲, 我不知道对不对啊?胡说八道啊。好,随便写一个。那么接下来各位,我要提取这里面的郭麒麟宋体大聪明。范思哲,胡说八道,你就说我想取得这个,哎,这段 html 里面这个位置的内容啊,我想匹配这个位置的内容,我想把它拿出来, 我想把它拿出来,怎么办呢?我先准备 o b j 等于 com, 哎,错了,是是 r e 点 com 啊,别整错了。 然后这里边我要写正则嘛,前面带一 r, 那 么这个这里面每一行应该是作为一个单位的,对吧?那把这一行我就可以说,哎,从这个尖角号 d、 i、 v 开始进行匹配,对吧?匹配到哪呢?匹配到这个位置,因为从这个位置往下,你看每一行从这个位置往下都不一样了,那从这块是一样的,那 给他拿过来啊,拿过来之后到这块不一样了,那可能是 j y, 可能是 j, j, 可能是邹立,可能是什么什么玩意,那怎么办?可能是任意的东西,那是点星问号, 对不对?然后这个点星问号匹配到哪,对吧?他匹配到哪,是不是匹配到第一个这个对 吧?离得最近的这个单引号,所以这个地方来个单引号,单引号之后来各位后边的这一大堆东西是不是都一样, 对不对?到哪到这个单引号,所以拿过来复制啊,往里一粘到这个位置对不对?然后这个一二三四又不一样了,那怎么办呢?我就可以来再来一个点星问号,或者说我确定这个地方一定是数字的话,那我也可以干嘛?杠 d 对 不对?或者杠 d 加啊?杠 d 加不行,那杠 d 对 不对?好,杠 d, 杠 d 加好。行行,这我这里面行,是有东西的啊,是有东西的。然后再往下,各位,这个单引号后面的,到这到这 啊,到这这个到这个,到这个尖角号结束,然后这个位置是郭麒麟,这是宋铁大聪明。这块是不是就是任意的其他东西了?那我这块可以什么?点心问号,哎,点心问号到哪结束?是不是到这个位置拿过来结束, 对吧?所以你会发现它其实是一个套娃式的东西。套娃式的东西,那 d i v class, 这个那个正好能套上,对不对?这个地方点心问号能不能套上?能套上吗? 对不对?他能匹配这个 y 呀?然后再往下对不对?这些东西,哎,又跟这块是不是套上了,对不?就跟套娃是一样的?然后跟我的正则准备完了,注意接下来有一个比较重要的一个小点,就是这个地方加上一个 r 一 样大 s, 加上 r e 点大 s, 那 么之前一直没说看呐,这地方有个 flex, 有 个 flex, 这个 flex 是 什么意思呢?就包括你翻到也好,干什么也好,这都都有一个 flex。 这个 flex 呢是表示的是你的这个,这个这个政策匹配时候它可以往里面潜入一些特殊的规则, 潜入一些特殊的规则,一个状态位啊,一个状态位。那我放上 r e 点 s, 你 就记得一个事,它的作用的作用是让点能匹配换行符, 让点能匹配换行符。咱之前讲正则的时候说过,这个点是不能匹配换行的,除了换行以外,其他所有东西他都能匹配。但这时候我想让这个点能匹配换行 啊?能匹配换行,为啥呢?防止他断啊?防止他断,所以加上一个这么的让点,什么都能匹配,什么东西都可以让点来搞定啊。然后各位接下来 o v j 点干嘛呢? find 一 特,好吧? find 一 特拿谁呢?是不是搜索这个 s 里面东西,好把 s 给他,他会给我一个什么?一个结果啊? result, 先个 result, 好 给我一个结果,然后这个结果咱们就不多赘述了,这个结果里面一定是一个编码器,对吧?说 it in result 打开这个地方怼成一个 route, 这个时候总 你会发现我确实匹配出来了,但是呢,老师你这么搞,你不如,对吧? print 一个 s 是 吧?你那东西都都有,但是不能这么干,不能这么干。看啊, 我现在 eight 点格林物谱提取到的是不是这个正则匹配的内容,这个正则是不是正好匹配? 这这一句话对不对?但是我说了,我想要的是这一句话,这个正则匹配的内容里面的某些固定东西啊,某一个东西,也就说对正则本身就是对这个字幕上做了个解析,对吧?从这个字幕上里面提取东西,但是我想从匹配的内容里面再筛选一层, 再筛选一层,我想要国企,我想要宋体,我想要大聪明,我想要这个位置的东西,那这个位置在正则里面是哪?是不?这个这个位置账号匹配这些东西,那怎么办呢?我们可以在这个地方加上一个括号,哎, 圈起来,给它圈起来,圈起来之后这个地方就特殊了啊,就特殊了,不是以前的那个,那个那个点心问号了,他被圈起来了,圈起来之后还需要给这个地方加上一个问号。 p, 注意大写的 p 加上一个尖角号,然后给他起个名字,给他起个名字,就这个地方 捕捉到的内容给他放到一个名字里面,比方说我叫他,嗯,娃哈哈,那肯定证明这个地方,对吧?随便写。那也就是说这个位置 点心问号所匹配到的内容会扔给娃哈哈啊?会扔给娃哈哈。那么我再往外拿东西的时候,从哪一个组里面拿东西呢?从娃哈哈这个组里面去拿东西,那么从娃哈哈这个组里面看啊,我第一个匹配的是这句话, 是这句话,那么这句话里面谁和这个娃哈哈是匹配的呢?是不是郭麒麟这个位置就会扔给娃哈哈这一组?那娃哈哈这一组拿东西不就是郭麒麟吗? 对吧?就是我要的郭麒麟,所以我们试验一下,看看是不是要的结果看郭麒麟送铁大聪明,对不对?那这些数据就提取出来,那我还想批,就是拿到这个,这个杠 d 加,我想拿到这个 id 的 纸,我想拿到 id 的 纸,那怎么办,对吧?一样的道理,破起来。 然后呢?问号 p 起个名字对不对?叫 id 可以 吧?你叫啥都行,我叫 id。 那 我再想拿 id 的 话怎么办? id 走 对不对? id 对 不对啊?还可以取什么呢?还可以取这个,这个这个地方你都可以取啊,都可以去取,想拿什么就拿什么,对不对?那你想象一下,如果我现在真的给你个页面源代码,哎,真的给你个页面源代码,你是不是也有办法想办法从里面继续内容啊?逻辑是一模一样啊,一模一样的, 好了,那这个是我们要讲的关于爬虫的一个非常非常重要的点啊,这里面简单给各位去挪一下,这里面来加上括号,问号, p, 然后呢,这里面是尖角号,这块是名字,分组名字,它是分组啊,然后这里面写的正格, 你原来的正则就点星问号,杠 d 加 w 加,随便啊,你原来的正则,那么这样的话就可以单独的从正则匹配的内容中啊,提取到啊,什么某某某名字的啊,某某内容吧 啊,这是我们主要讲的一个重点,咱们写查重,如果是正则匹配的话,就这么来啊,就这么干就可以了。 好,那我们再看一眼啊,基本上就是这些玩意儿,基本上这玩意儿 find out 啊, search 啊, match 啊, find eater, 哎,对, find eater 用的多啊, find eater, 然后我们想获取到里边的内容的话呢,需要给它,对吧?分组起名字啊,分组起名字,然后就可以通过这种方式,对吧?可如何来拿东西了啊?拿东西了,好,那这是咱们要聊的关于 r e 模块的一些相关内容,那么下一节咱们进入到实战阶段。

pyasa 数据分析第一级数据分析的应用,你有没有过这样一种感觉,就好像总被一双无形的眼睛盯着,你刚打开购物软件,他就给你推荐正想买的东西,随手刷两下,手机平台也总能精准推给你爱看的视频,简直比你自己还懂你自己。 那问题就来了,他怎么就这么懂你呢?其实这一切背后都是数据在悄悄起作用,你的每一次点赞、搜索、评论,这些行为都会被记录下来变成分析。你的数据平台会分析你的偏好,把你的习惯归类到某一个用户画像里, 再根据这个用户画像推荐你可能感兴趣的内容。这就是为什么你越看越觉得对位,那数据分析除了用来推荐视频和商品,还能干什么? 这么说吧,他几乎可以用到各个领域。先说电商,电商领域可以根据用户喜好,精准分析出哪些用户喜欢哪些产品,帮商家提高销售额,还能根据偏好去预测爆款商品。再来看金融领域,金融领域可以通过挖掘历史价格波动率来评估风险,优化投资策略。 除了这些行业用数据分析挖掘商业价值之外,在人工智能领域,数据分析同样有大量应用。那么问题就来了,人工智能跟数据分析有什么关系?人工智能的本质是模仿人类的行为和认知方式,他模仿人类的手段正是通过海量数据进行反复训练。举个例子, 假如我们要训练一个能识别狗的种类的模型,我们需要给他投喂数以万计已经标注好品种的狗的照片。 但是如果这些数据中混入了模糊不清甚至无关的图片,例如将一只标注为狗的照片实际为一只狼,模型就会学会错误的特征。这时,数据分析的作用便凸显出来了,通过对海量原始数据进行分析以及过滤,将不良数据提前剔除。 否则再聪明的人工智能模型在垃圾数据里泡久了也会被浇坏。看到这里,相信你已经明白了数据分析为什么这么重要, 可问题是要筛选成千上万条数据,如果还用传统方式一条条筛选再分析,效率实在太低,等筛选完,可能早就错过了市场的风口。 那怎么办呢?为了更高效的工作,我们可以用上 python 的 力量,用 python 来自动化筛选数据。后面我也会推出 python 加数据分析的课程。如果你对这套让数据说话的能力感兴趣,不妨点赞收藏一下这个视频,告诉大数据,你对这方面知识有兴趣, 相信我,我会和以往一样,用最生动的例子,让每一个人都能听懂,学会怎么做数据分析。我们下个视频再见!拜拜!

你在用 python 做数据分析时,有没有碰到代码没问题,一运行就报错的难题?其实绝大部分原因就是 python 和 pandas 版本不兼容, 今天就手把手教你搞定 python 和 pandas 的 版本搭配。以下是版本搭配表,可自行截图保存。接下来我们用 python 三点九来实操一遍。想装与之兼容的 pandas 一 点三点零版本,首先打开命令行,输入这行代码,然后回车等待安装完成。那如果不确定版本是否匹配怎么办呢? 你只需要打开 python 编辑器,输入这四行代码,运行后根据自己的版本,再对照前面的搭配表就能判断是否匹配了。要是发现版本不匹配,如何更新或降级 python 呢? 我们可以在命令行输入这行代码,运行后会自动更新到当前 python 兼容的 python 最新版本。如果需要降级,可以输入这行代码,运行后就能降到指定版本。最后两个避坑小替子记得点赞关注,下期见!