大家在做机械学习或者数据处理时,肯定听过 lda 现行判别分析,名字听起来挺高大上,其实他干的事情特别简单,就是帮你在乱糟糟的数据里找一个最完美的观察角度,让不同类别的东西一眼就能分的开。想象一下, 你手里有一堆红豆和绿豆,他们摊在桌子上,位置乱七八糟,你想来个挡板把他们一分为二,发现怎么放挡板都会压到豆子。 这时候如果你能把这些豆子投影到一条线上,是不是就容易多了?但是随便找条线投影,比如横着或竖着,红豆和绿豆可能还是会记在一起。 lda 的 终极目标就是找到那条黄金曲线, 把豆子投影过去后,红豆缩成一团,绿豆缩成一团,且两团之间离得越远越好。要实现这个目标, lda 只有两个死理,你记住了,面试官都难不倒你。一、 背内方差最小,通俗点说就是自己人要抱团投影之后,同一类的数据点要尽量挤在一起,别到处乱跑。二、背间方差最大,通俗点说就是对手要离远点,投影之后, 红豆的中心和绿豆的中心距离越远越好。口诀,总内要团结,组建要对立。很多人分不清 lda 和 pca 主成分分析, pca 是 瞎子摸象, 他不管你是什么类,他只看哪里数据波动大就往哪里投影,他追求的是保留原始信息的完整性。而 d a 是 戴着眼镜找不同,他是有标签的,他专门看哪里能把类别分得最开。打个比方, p c a 像是给你拍全身照,要把你整个人拍清楚。而要 d a 像是给你拍证件照,只要能一眼看出是你还是吴彦祖就行。虽然咱们说是大白话,但 u d a 背后的工程咱得提一下,那就是 face 判别准则。他把我们刚才说的两个绝招写成了一个公式,分子是两类,中心点的距离越大越好。 分母是两类,各自的散步程度越小越好。我们要做的就是找到一个投影方向 w, 让这个分数 j w 跑到最高分率,效果就越牛。哎呦, da 虽然强,但也不是万能的。一、它是个直线思维,它只能处理先行分类。如果你的数据像个太极图一样嵌套, lda 就 抓瞎了。二、类别限制。如果你有 n 个类别, lda 降维之后最多只能剩下 n 一个维度。三、 正态分布。假设它默认你的数据分布是比较规整的中型曲线,如果数据太离谱,效果会打折扣。总结一下, lta 就是 通过组内抱团、组间隔离的方式,把高维数据压缩到低位,同时还要保住分类的特征,它是数据预处理阶段的 姜维打击神器。如果你觉得这期视频讲清楚了 lda, 记得点赞关注,我是机器学习的故事,一名爱讲大白话的博主,咱们下期见。
粉丝614获赞1373

这是一节所有人都可以学会的 s p s 分 析课程,今天我们要讲的是验证性因子分析。那么在讲验证性因子分析之前,我们先来了解一下它的一个基本概念,这里我们不讲它复杂的数学原理, 只用了解什么是验证性因子分析,以及验证性因子分析的结果该怎么看。 用通俗的语言来说,你的问卷已经提前设计好了维度,比如说你分了情绪、人际、生活三个维度,每道题 属于哪个维度是你已经规定好了的。验证性因子分析的作用就是用你的数据检验你设定的问卷结构是否与你划分的维度一致,也就是你的问卷结构对不对。 当然我们在前面已经介绍过探索性因子分析,这里我们讲的是验证性因子分析,它们两个是都属于因子分析里面的。探索性因子分析呢,是你不知道你的问卷划分几个维度,然后让数据自动帮你来找维度。 今天我们讲的是验证因子分析,也就是 cfoa, 这个是你已经设定好了维度,检验你的结构是否合理。 然后验证性因子分析的结果呢,主要包括三个板块,一个是因子载荷系数,还有就是模型拟合指标下面就是组合的 c r 和平方萃取 a v e, 也就是疏点消毒和区分消毒。 首先是这个因子载荷,它有零点六到零点九的这一个范围是最优的。如果说你的因子载荷系数做出来是小于零点五的,说明这道题是不符合你这个维度下的结构的,就需要删除掉。 然后就是最重要的也是模型和指标,它分了什么? c、 f、 i、 s r、 m、 r 这些指标 它会有一个对应的判断标准,比如说这两个它是大于零点九就是优秀,大于零点八五就是可以接受范围内。 然后如果说这些指标大部分都处在合理的范围内,说明你的问卷划分结构是比较合理的。下面就是信效 c r 和 a v e, 也就是收敛效率和区分效率, 这个呢它是主要是零点七为分界线,如果说大于零点七,就说明维度内部一致适应好, a v e 大 于零点五就说明收敛效率合理。 接下来我们以这个问卷为例,带着大家做一下验证性因子分析。这里我们可以看到它分了三个部分,一个是基本信息,然后是 多选题,还有一个是满意度,对应的是量表。当然这个验证性因子分析肯定是针对量表题来做的,然后这是它对应的一个数据, 这里我们借助 chat s p、 s 这个分析工具,在这里上传数据,然后下面会有对应的对话框,直接在对话框里告诉他对数据做一个验证性因子分析, 它就会自动帮你识别两表题,它这里识别到 q, 一 到 q 八是两表题,然后它会先帮你自动划分维度,根据题目的大概意思,它帮我划分出来五个维度,然后这里我认可它的这个模型,然后直接让它做 cfa。 下面它就可以直接把结果整理在三线表里面, 包括模型拟合度,然后区分效度、聚合效度,然后还有路径系数等等, 这些表格可以直接粘到 word 里的,粘进来之后就是这个样子的, 这里我们可以看到他直接把这个做的比较全面,比如说这个范围是否可接受,他这里显示的是全部接受,说明你的这个结构效度是比较好的。然后还有路径系数, 还有这个区分效度等等,这个工具里面还有很多的一些分析方法,大家都可以去尝试一下。

朋友们,今天继续讲讲 ai 挖掘因子,前两天洗澡的时候又想到像这样的项目应该有很多高手做过类似的,然后我就到 github 上找了一下,确实找到了一个比较适配的 这个项目,叫做 qlab。 然后呢,我就把 qlab 里面的 rda 准的思路接近了我的我们的 ai 因子挖掘里面, 然后我借鉴了 rda 准的四步管线假设、实线评估以及反思。然后我们用 lange 搭了一个自动循环的引擎,让 ai 挖掘的时候可以完成因子挖掘以及回测的全套流程。然后在报告中它可以显示出这些 因子的各类的评分,向我们去更好的判断这些因子到底有没有效果。

大家好,这是一节小白都可以学会的 spss 分 析课程,今天我们要讲的是探索性因子分析。首先在讲探索性因子分析之前,我们先来了解一下什么是探索性因子分析。 探索性因子分析它是一个探究多个观测变量背后的潜在结构,这个潜在结构它就被称为因子,说白了就是你有一堆问卷题目,然后你想看看哪几个题目它能归为一类,然后这一这个归为的这个类别就叫做因子, 然后当然用这个方法它就可以帮你找出你想找出的这种内在分组规律, 然后它有一几个关键的指标,然后首先是 k m o 值,它要最低的要求是要大于零点六才可以做探索性因子分析,然后就是球形检验,要小于零点零五显著, 然后就是这个测方差解释率一般是最低的要求就是大于百分之六十才能展现出你的原始数据从变异的百分比。 然后接下来我们以这个数据为例,带着大家做一下这个它首先因子分析,当然它肯定也是针对两本题来做,这里我们可以看到它罗列了这些两本题,我们先来 spaz 里面操作一下, 首先点开分析,然后降为因子,我们把刚刚的两表题拖入进去,是从这个 q 一 开始的,一直到 q 十八这些题目选入,然后点击克隆八系数, 选出这些水平提取,这里选用主成分就可以了。 最大方插法,这个旋转的话,因子旋转的方法一般是选用最大方插法就可以了,其他的可以不用了解,深入的了解,点击继续,然后点击确定 它就可以分析出来结果。我们先来看一下这个是 k m o 和 巴特利特检验,这里的显著性 p 是 小于零点零一的,然后 k m o 是 零点八五,说明它适合做因子分析。 接下来是总方差解释率,它是我们可以看到最后一个,它是大于百分之六十的,说明它的数据的解释程度是比较高的。然后是因子分析的因子载和系数表,我们可以看到这里 零点五,然后零点五,零点五几,零点五几,说明这这些因子它是可以划分为一类的,就是前三个,前四个。 接下来给大家介绍一个比较方便的一个分析工具,就是这个这个 s p s。 然后首先要把数据导入进来,我是已经把数据导入好的,然后就可以在这里对话框里告诉他,对数据做一个因子分析, 他就可以直接生成结果。然后 kmo 总放大显示率旋转后的因子载荷系数表,这些都是有的,然后这些表格它是可以直接粘到 word 里的,就是这个样子。 后面还有更多的分析方法,大家都可以去尝试一下。

ok, 跟各位股东们汇报一下,昨天晚上已经完成了建厂这条视频,我们来聊一聊什么是因子投资。传统来说,人们在进行金融投资的时候,总会习惯了去分析公司,对吧?这个公司是好还是坏?他的商业模式怎么样?这种其实非常主观的想法,因为同一家公司可能有不同的看法,有人觉得 这个商业模式上有人觉得不好,那另外还有呢,在传统做资产配置的时候,有人可能会根据,比如像是地理位置啊,甚至根据资产类别啊,来去进行一个资产,呃,资产的配置,哎,我要买多少的日金,我要买多少的这个标普,我要买多少黄金,多少债,多少股, 他们会通过这样的方式去进行配置,这些都是一种方法。那因子投资也是一种方法,只不过因子投资呢?第一个呢,也不依据所谓的资产 a、 b、 a, 它是根据一些数学或者统计学上的这种数据特征来去进行分配,它更加多基于一些可量化的数据特征。那这些可量化的数据特征就是我们说的因子,比如说我们能不能量化一下这个市场上面哪些公司有价值,哪些公司有质量,哪些公司长得好? 这个其实就是我们所对应的质量因子、价值因子、动量因子。这做一个简单的比喻啊,如果我们把投资比喻成吃饭的话,就好像有的人每天他会想说,哎,我今天是吃麦当劳还是吃兰州拉面还是吃日料?但是呢,健身人就会想,麦当劳拉面、日料皆是表面的现象, 他更关注的是每天吃了多少蛋白质,吃了多少纤维,吃了多少碳水化合物,他根据他每天要吃够的这些营养元素来去决定每天吃什么。那就像我们平时看到你要买多少股票,买多少证券,买多少黄金,这个就是表面上面的,你要吃什么汉堡,你要吃日料的,但底层的这一些元素,这些 蛋白质、碳水纤维就是对应的我们各个可量化的因子。好,那我们接下来说一说这些因子以及怎么去构建的。那这个世界上呢,有很多的这些因子,这些因子是不是越前年越好,越新越好?甚至你一个策略里面是不是越多因子越好呢? 其实不是的,我个人呢更加喜欢一些更古老的因子,比如说什么价值因子、质量因子、低波动因子、动量因子、小盘因子这一类的。因为其实我们看到有很多的学术论文,现在每年都还会去挖掘新的因子,但这些新的因子就给人感觉,哎,他又找到一个好像可以赚钱的数据量化特征。但其实你跑下来不一定 长期有超额收益,反而是那些传统的被时间无数人验证过的长期有效的因子,这些东西我比较喜欢。 那接下来我们就聊几个比较经典的因子。首先第一个呢就是小盘因子和价值因子。那小盘因子呢?这个非常经典的,因为在因子这一个流派最早的这个 farma french 三因子模型出来的时候,就带有市值因子, 当时他们就认为小盘股的超额收益可能会比大盘股来的更高。那这个呢,就是小盘因子,就相当于你发现了这个市场上面,哎,市值小的公司啊,长期来看,它的收益比市值大的公司更大,对吧?然后你就专门去投些市值小的公司,但有朋友会想说,就这么简单吗?没错,就这么简单 啊,只不过说纯粹的小盘因子呢,现在很多的论文的研究都看起来好像是失效了,好像纯粹的只是因为市值小,好像并没有带来超额收益。这里我也差一句话,怎么去定义这个市值小啊? 比如说你就在呃全市场取一个市值的中位数,那么低于这个中位数的这些市值的公司呢,就属于小市值,高于它就属于大市值,可以这样去处理。但是呢,也有很多大佬做过研究,就是市值因子其实并没有失效,而是因为小盘股里面太多垃圾了, 如果把那些垃圾公司剔除掉之后,然后剩下来的那些公司小盘依然是有明显的超额收益的。所以这就呃展开了,像是小盘因子跟价值因子的结合,或者小盘因子和质量因子的结合, 那我们就继续往下讲,什么是价值因子和质量因子,以及这些怎么去构建价值因子和质量因子,很多人它会混淆,但其实这两个是不一样的啊,价值因子指的是要买的便宜,便宜的东西有价值,其实它更加像一个性价比的概念,只不过说在一开始的时候定义了叫做价值,叫做 value, 然后就一直被传下来叫价值因子。 但它其实更像性价比的概念,比如说最经典的呢,就是这个市盈率、市净率、市销率这三个,对吧?啊?你就把市场上面,比如说整个市场所有的这些公司的市盈率去做一个排序,然后挑市盈率低的那百分之三十的公司拎出来,这里就构建了一个 价值因子的选股的一个结果。但当然你过程当中还可以做一些市值中心的,行业中心这之类的啊,这个我们就不去细说了,但是原理是不原理,那质量因子有什么呢?如果说价值因子的核心是要买的便宜的话,追求一个安全边际,那质量因子呢,就是要买的好。 我不管你这个东西便宜还是贵,但是我买到的东西必须要是好的。所以质量因子它更多是跟一些财报基本面有关的,比如说你的 o e 的 变化,你的净利润的增速啊,现金流的增速这一些,你通过财报的数据设定一些筛选条件,然后去筛出这个市场上面好的公司,不管它价格贵不贵,直接买进去啊,这个就是质量因子。 那么当你这样做呢,可能会塞出来一些估值比较高的公式,但没有关系的,相信模型,相信策略,贵有贵的道理嘛?所以价值因子呢是买的划算,质量因子呢是买的好。但在这里也说一下,同一个因子可能会有不同的构建方式啊,比如说有一些人觉得质量因子就应该更加侧重现金流层面的 来去构建,有一些人呢,可能会呃,在质量因子这里更加侧重凹义。质量因子里有些人可能更加侧重的数据特征,可能是呃利润表上面的营收的编辑变化,利润的编辑变化,但是这些本质上面都是质量因子,只是构建的方式有所不同而已。其讲到这里插一句话,你会看美股市场上有很多很成熟的那些呃 量化有关的 etf 的 产品,就是通过这些不同的因子构建而成的。比如说有一个 avu 啊,这个不构成任何推荐的,就只是做一个这个案例的一个展示。 avu 其实就是把小盘因子 和价值因子去做了一个结合利用的,就是我前面说的论文研究,就是在小盘股里面找出有价值的东西, 剔掉那些垃圾之后呢,可能仍然存在超额收益。还有像美股市场上面有一些跟质量因子有关的 e t f, 比如说 q l t y q l t i 啊,一个是美股本土的找那些高质量的公司,还有一个呢是去找国际上的高高质量的公司,但是这些在美股市场上一般来说流动性会差一点了, 它这个 e t f 因为这些比较冷门,所以流动性可能会比较差,但从他们上市以来的长期表现呢?看起来还行。然后再接下来我们说什么?再接下来我们说说动量因子和低波动因子啊, 这两个呢是我最喜欢的两个因子,一个进攻,一个防守。先说动量因子,动量因子是非常非常经典的,全球各个市场做金融人有很多人都去研究动量因子,因为它的逻辑非常的简单,强者恒强,弱者恒弱, 长得好的东西接下来会继续长得好,长得差的东西在接下来一段时间里面会继续长得差,对吧?但这个里面其实也有很多的误区, 比如说动量,很多人就会以为就是一家公司在过去长得好,他接下来就会长大,他不是这个这么简单啊,他首先最起码的你要分成横截面的动量跟时间序列的动量。那横截面的动量呢?就是比如说我在某一个时间点, 我去看市场上面的排名的这些公司有标普里面的五百家公司,这五百家公司长得好的靠前,长得差的靠后,这是一个相对的,这种比较长得好就叫横截面动量。还有第二个时间序列动量。时间序列动量就不不比较只看自身的绝对 一家公司在过去如果十二个月都是在上,呃,这个,这个连续上涨了多少多少个月的话, ok, 那 他就存在一个持续动量,他就走出了一定的趋势。 其实啊,其实持续的这种动量呢,更多时候我会把它愿意叫做趋势跟踪。那我自己平时所说的动量呢,更更加指的是横截面动量,因为横截面动量呢,是最传统最纯正的动量因子。好的,那么横截面跟持续动量可以解决我们什么叫做长得好,对吧?相对的长得好和绝对长得好。 那你怎么定义过去一段时间呢?哎,这里也是有一些门道的,我也看了,网上有很多的这种对于动量因子的定义,什么过去一个月长得好的,过去一天长得好的,我觉得都不太靠谱,因为这个是有实际的论文,并且呢是这个 cliff essence 啊,是很牛逼的一个人,大家可以去搜一下啊, fame french 的 学生 写过的一篇论文,做的一个研究,在动量因子这里,他去测试了过去一个月的动量,过去一年的动量和过去六十个月的相对长期一点的动量。 这三个不同时间维度的动量里面呢?短期一个月的跟长期六十个月的动量都不太靠谱,也就是你不能衡量过去一个月长得好,或者过去六十个月长得好,你未来就长得好。如果是按照这样的时间维度去定义的话,不太靠谱的,最靠谱的就是一年的维度,就是从现在这个时间节点过去一年, 但是要剔除最近的这个二月份,剩下的那些月份里面 的累计收益也好,平均收益也好,对全市场的工具取一个排名,然后把靠前的那些挑出来去投资,这个就是最纯粹纯正的横街面动量因子, 我自己试了一下,效果非常之猛,猛的我都有点怀疑人生了,但也有很多朋友说,就这么简单吗?动量因子确实就是这么简单,动量因子就是长得好的在未来会继续长得好。呃,其实这个里面它也是有道理的,因为本身价格就代表了很多的市场的指标。 动量因子呢,就是逻辑非常简单。那只不过你在处理数据的时候可能要麻烦一点。那美股市场上有很多 e t f 是 尝试去捕捉这个动量因子,什么 m t u m 啊,还有什么 s p m o 啊,但是 我觉得没有我的那个动量三十来的猛啊,我自己自己对比了一下。而动量因子还有一个玩法,就是它不只做 long lonely, 它去做 long shot 的 一个结合,去做多动量高的,做低动量差的那些,这个也是一种玩法, 去构建一些零贝塔的策略,但这个以后有时间再给大家展开来说吧,时间不要拖太长。最后再讲一个低波动因子,低波动因子这个也很简单,就是把市场上面波动率低的公司挑出来去进行投资,当然这个因子在构建的时候也是不同有不同定义,多低算低呢?排最后的那百分之三十,最后那百分之二十,最后那百分之十。 ok, 那 本质上面就是去挑选低波动的公式,这个是我觉得一个蛮反直觉的一个事情。那我没有去做过验证啊,因为正常来说,我们说你的收益本质上面是一种风险补偿,而波动又是风险, 你低波动了,你都低波动了,那风险补偿应该低啊,怎么可能会存在超额收益呢?但是我看你有一些论文说低波动因子也能创造一些的超额收益,所以其实在这一点上我自己是没太想明白的。但是看美股市场上面那些低波动因子的走势,哎,感觉还蛮有蛮蛮不错的哈。 这个感兴趣的朋友们呢,也可以继续研究,但我后面也会去看更多的一些跟低波动因子有关的一些研究啊,论文这些 深入了解一下,我还蛮感兴趣的。低波动因子,那为什么低波动还能有操作收益?好吧,那这条视频就给大家介绍一下什么是因子投资。那我自己呢,就是因为我自己工作和家庭的原因呢,工作上面会接收到比较多的我自己处理不过来的信息噪音, 然后在家庭层面呢,又有两个娃,所以实在是没有时间去再做主观多头去研究这些公司。那不如就把投资做的系统化一点,做一些不用钉盘的相信策略就好了。 那相信策略了之后,做了之后我发现不要相信自己,也不要相信别人,相信数据。好的,不知道这条视频这样讲对大家会不会有一些帮助啊?如果你们也对量化感兴趣呢?可以在评论区里面告诉我,后面可以多给大家出一些更加详细的关于基本变量化的一些视频。

这个开源项目,做量化和交易研究的人可以先收藏。它叫 web trading, github 上已经有七 k 多新,最大的亮点不是给你喊买卖点,而是把一句自然语言想法变成策略、回测和研究流程。你描述一个交易思路,它可以调用多市场数据, 覆盖 a 股、港媒股、加密期货和外汇。项目里还集成了七十四个金融技能,以及二十九组开箱即用的 a 阵团队。不同角色可以一起做研究、辩论、风控和复盘。对普通用户最有用的是,他把复杂流程做成了工作台,想做因子分析、组合、回测、策略导出, 不用每一步都从零搭工具。如果你研究 ai agent 或量化项目,这个项目值得单独收藏。记住,它是研究和回测工具,不构成投资建议,也不替你直接赚钱。

给所有大学生看一个非常恶心又很炸裂的东西,就是这个 ai 做数据分析,我上传数据让他帮我做一个描述分析,他看了直接帮我做了一个描述分析,最小值、最大值、均值、标准差,中位数都统一出来了,表格三线表复制粘贴到论文就可以用。 那后面文字分析报告给我们写的清清楚楚的,基于二百一十一分数据,然后做了描述分析,结果怎么样,均值多少,标准差多少,中位数多少都统计清楚了。我说我觉得不够,请你再多做两个分析。他又帮我做了评述分析, 然后描述分析,这个是重复的哈,那后面文字分析也帮我们写清楚了,真的太方便了,一句话就搞定了。 如果说还想做什么其他分析,可以直接这里打字告诉他,比如说在帮我做什么其他相关分析,或者回归分析,或者直接这里点字也可以相关分析,回归分析,我想要做方差分析都是可以的,一句话就搞定了,真的太方便了。

嗨,大家好,假设你对股票有一个想法,比如放量上涨后缩量回调,股票是不是容易反弹?你想知道这个想法在历史数据上到底靠不靠谱? 那今天我给大家介绍一个我自己做的项目,叫 qfrock, 能让你用一句自然语言描述这个想法,在短短的时间就能拿到一份完整的分析报告。在量化研究中,从脑中有一个想法到拿到一份可靠的分析报告,中间隔着一条很长的路。你得先把想法翻译成代码 对接行情数据处理缺失值和异常值、计算因子值,然后做统计检验、分组回测、画图、写报告等等。 整个炼录下来几个小时算快的,几天也不夸张。但真正有价值的部分就只有第一步,就是关于市场的直觉,剩下全部都是重复性的工程劳动。我想做的这个项目就是想把这段时间压缩到极致。我们直接来看实际运行的效果。界面左侧可以输入一段文字,比如放量上涨后缩量回调, 点击解析,几秒后系统会返回一公式和一段文字解释,这就是 ai 根据你的描述自动生成的选股的因子。然后点击运行回测和报告进度条,翻到报告页,一份完整的因子分析报告已经生成了 标题日期、核心指标图标完全自动完成,全程不需要写一行代码。那报告生成的上面的具体的指标该怎么看呢?我们核心关注这几个指标。 i c 衡量的是你的选股规则和股票未来涨跌之间的相关性,越高,说明你的想法越靠谱。 i c r 是 i c 的 新造币,是衡量这个相关性是不是稳定的,是持续有效呢?还是时灵时不灵的? i c 胜率是在所有的交易日里,因此方向判断正确的比例。 那下面这张分层收益图更加直观。系统把股票按照因子分成五组,追踪每组的收益走势。如果五组的收益都是呈现阶梯的排列,说明这个选股的规则确实能够区分股票的好坏。刚才看到的几分钟的背后的炼炉,是一条五个阶段的自动化流水线。 第一步,你用自然语言描述你的因子的想法。第二步, ai 大 模型把你的自然语言翻译成一个因子公式。第三步,编辑器会将公式转换成可执行的计算代码。第四步,算知每只股票每天因子值,并自动做数据清洗。第五步,跑统计检验和分组回测生成报告。 在传统的流程中,这五步各自独立,每一步都需要手动处理,但是 qflog 可以 把它们串成一个自动的管线。那这五步最有意思的是,第二步,就 ai 怎么把一句自然语言变成一个准确的因子公式呢? 我们系统不是把你写的自然语言直接丢给大拇指让他给我们公式,而是在后端让 ai 构造一套详细的指令,告诉他你的角色是一个量化因子的助手, 列出当前所有可用的计算算子和它们的含义。按照规定,输出必须是标准格式。那这相当于给 ai 一 本字典和一套语法规则,让它在约束下做翻译,而不是自由发挥。 翻译完成之后,系统还会自动做语法教学。 ai 生成公式,如果不合法,会直接拦截报错,不会进入到后续的计算。那你可能会问,为什么不让 ai 直接写代码呢? 因为代码太灵活了,灵活意味着出错的方式太多,比如变量名写错、函数调错、数据格式不匹配, ai 的 代码有时候会跑不通。所以我们设计了一套专门给因子使用的公式语言,那它就是自动 y 因子,常用的表达式叫 dsl, 它包含很多个固定的计算函数,比如均线波动力、 滚动相关、前面排名、布林带、 k、 d、 j 等等。关键在于只要这些计算的算子复购的范围足够广,那因子的表达空间就足够用。 那 ai 在 这套受限的空间里做因子挖掘就准确的多。生成的公式会经过一个变仪器,最终转换为高性能的可计算代码, 整个过程对我们用户来说是完全透明的。那有了因子,计算出来之后,还不能直接拿来下结论,因为原始数据可能会有异常值、 行业的偏差、大小盘的效应等等,这会干扰我们的判断。所以我们系统会做三步的清洗,第一步是去掉异常值,第二步是做中性化,剔除行业市值的影响。这步非常关键,如果不做的话,我们的选股规则可能就只是在说小盘股涨得多,而不是真正找一个有效的信号。 那第三步就是标准化,让不同的因子之间可以公平的对比。那在传统研究中,这三步可能都需要手动去运行,或者手写代码,但在这里是完全自动完成的。举一个具体的例子,比如说我们在界面中输入近期放量上涨,短期缩量回调,但是 跌幅有限的股票。这描述的是一个经典的技术形态,强势股回调。在买入 ai 将这句话翻译成六个条件的组合,当天上涨交易量超过二十日均量的一点五倍,十日趋势朝上, 近五天出现回调,成交量萎缩到均量的百分之八十以下,回调幅度不超过高点的百分之十。这六个条件同时满足时,因此值差为一。 这公式在经过翻译、计算、清洗和统计检验,最终会得出一个详细的报告,那这报告显示 ic 的 均值为负的零点零三八。 他的预测能力比较弱,那这本身就是一个有价值的结论,他能够快速帮你排出一个不够有效的想法。你可以继续调整条件,换一个角度继续探索,那整个一次验证就只花了几分钟而已。一个想法验证完了,你可能还有 十个、二十个更多的想法,那所有的因子盘会自动进入一个排行榜,按照预测能力从高到低进行排序。如你可以看一下,这是我自己做的一些实验,比如排在第一是动量函数因子,那 每个因子的公式描述、核心指标都一目了然,你不需要在一堆脚本文件夹里去找历史结果,所有的想法和表现都呈现在一张表里,那这其实就是在帮助你构建一个个人的选股规则库。同时,那单个因子的预测能力往往是有限的。 真正构造一个有效的策略是把多个因子要组合在一起。我们可以在因子排行榜中选举多个因子,那系统会自动启动一条机学区的流水线,数据预处理模型、训练效,深层构建组合、业绩归音,这九个步骤都自动执行, 最终输出一个完整的研究报告,覆盖总的收益、年化收益、下普率、最大回撤等核心绩效指标。 比如说我们这个系统可以实现从一个想法到一个投资组合的夜景模拟,整个链路都可以在这个 carefog 平台上完成。那最后我们来讲一下技术选型,解释一下它为什么如此的高效。数据层,我们使用的是 dk db 接入式分歧数据库,不需要安装配置,即动即用 数据处理,我们使用的是 pools, 比常见的 panda 快 五到十倍。那 agent 我 们接入的是 deepsea, 它的中文自然源理解能力很强,而且性价比也非常高, 而且整个项目都是非常轻量级的,我们可以在自己的个人电脑上就可以跑通,不需要服务器集群,不需要云服务。那和传统方式相比,传统方式需要用因子写代码,从想法到结果可能需要数个小时甚至数天, 每换一个因子需要重新走一遍全流程,那在我们的项目中,我们可以使用自然语言描述因子,对没有量化经验和不会写代码的投资爱好者来说非常友好,毕竟他在很短时间内就能出结果,自动入库,自动排行,自动生成报告。 那本质的区别就在于,我们 qflog 可以 帮助你把时间省下来花在思考市场规律上,而不是在调试代码上。我们总结一下 qflog 要做的事情,概括起来就是压缩脑中的想法到一份可信的分析报告之间的距离, 那它现在已经能够完成自然语言的因子解析、自动化分析报告、因子排行榜和记忆学习回测。那从去年下半年我就已经实现了这个项目, 到现在我已经使用了相当长的一段时间,他对我个人的投资还有因子研究有了非常大的便利,能够快速验证了我的一些想法之后,再让我去进行更加深度的研究。那我的初衷就是 量化研究应该回归到市场的思考本身,有想法描述他,让系统自动去验证他。好,以上就是本期视频的全部内容,我们下期见。

hello, 大家好,今天教大家一个不用打开 s p s s, 只通过对话就能完成探索型因子分析,那么这节课内容和上节课同样是 效度分析之后的一系列分析的第一个。那么效度分析,呃,包括 k m o 值的计算,然后求新检验,共同偏差检验,以及我们今天要讲的这个探索性因子的一个窄赫的一个分布。那么其实 啊,在 spss 里面我们要做碳素因子分析,那其实要做的内容还蛮多,如果你对这个软件不熟悉,那你首先得学这个操作,并且要注意的东西也蛮多,比如说我们用这个 spss, ibm 公司的这个原声的软件做那么点分析, 降为因子,然后把所有的,把所有的两秒提缩进去。描述要点, kmot 和巴特利特求精检验, 然后提取主成分特量值要大于一,旋转最大方长法选项大小排序 只只展示大于零点四,绝对是大于零点四的因子。那么点确定, 你看这里出了出现了很多的表格,你需要整理,那么在我们的 chatspass 当中直接告诉他,我要做消毒分析, 只要这一句话哦,他首先把 k m o 和巴特利特求精检验的结果这个表格,然后共同编差检验的表格,然后以及我们今天要讲最重要这个旋转后因子载荷矩阵的表格都显示出来, 并且你复制一下它可以把所有的表格全都整理到我们报告里面没看到,当然这个没有显示,你需要最好改一下, 加个粗啊之类的,每个维度对应的这个指标加个粗这样子。 那么这里要给大家说的是就是因子分析,具体我们是不是要做什么?首先效度分析之前已经说过了,他是要检验数据的核心度,那么因子分析他本质上是一个降维的过程。但是在问卷里面我们这是一个呃,等于说反向我们先设计的这个维度, 然后来验证做因子分析来验证它是否我们的数据。这么多个题项确实分成了那几个因子,也就是这几个维度,所以它是一个相反的过程,这个可以。呃,多看看文献去理解一下。

同学们大家好,今天来录一下这个因子分析。因子分析的话,通常用在探索 量表的结构,或者说探索相关性比较相近的一些因素,那么把它提取出来,提取成一个因子,那么这样就可以避免在后续的回归或者说相关性分析当中发生, 嗯,贡献性过高的一个情况,那么他的结果主要就是这个样子,首先有 k m o 值,有这个近似卡方有屁值, 然后其最主要的表格的话,就是这三个表格,这个 k m o 以及总方差解释率,还有这个因子旋转因子的载荷情况。 嗯,但是有一点要注意,就是通常我们在量标题的分期,也就是问卷分析当中,这个第一个因子的载荷他不要超过百分之 四十,如果超过了就代表有共同因子偏差,那这个结果是不好的,或者说这个数据他是不好的。一个情况好就当是这个情况,那么这个是怎么做的呢?首先将数据导入我们的 spss, 然后点击分析, 然后点击这个降维,然后选择因子分析,然后把量表 t 全部拖过去, 这个描述的话,这儿显著性决定因子 kmo 这几个,还有这几个要勾选上点,继续旋转的话,咱们选择最大方叉法,然后 选项的话,我们为了方便看出来它选项后的载荷是怎么样的,那么可以勾选上这个,然后把这个零点四以下的就不让它显示了,这样的话它就会载荷会显示很清晰, 那么点确定,那么它就是这样一个结果,这个是表一,然后 它的方法解释率,然后过就是这个载客的情况,主要看这个,呃,选择后的成分矩阵,那可以看到这些题目的话,它的贡献性就比较高,也就是它们相关性比较高,就可以浓缩为一个因子去对后面进行分析, 但这个表格整理起来是相当麻烦的啊,所以说这时候我们就可以借助一个工具去对他进行一个整理。我们打开咱们的 chat s p s 是 官网,然后将数据上传,也是将量表题上传,上传上去以后, 然后我们就直接对他说想要进行这个因子分析,那么可以看到他就会很快就出结果,并且有咱们的最重要的三个表,一个 kmo, 一个是放射解释率,还有因子载荷的情况,这跟你标注的明明白白哈。 然后出来以后呢,我们可以直接复制这个表格,这个表格是可以直接进行复制粘贴的,并复制,然后粘贴到这个 word 文档当中, 可以看到它就是直接的标准的三线表了。 嗯,另外再说一句这个因子分析,那么第一个表格也通常用在咱们的效度分析里面,嗯,就是。 呃,如果论文的要求不是那么严格的话,咱们也直接放这个 kmo 效度检验,那么这个值通常在零点六以上,那么就可以了,就不用进行下面的因子分析的具体情况的一个分析了。

各位同学大家好,很高兴今天能够相遇在二幺幺统计网络课堂,我们接着来学习 emos 入门教程验证性因子分析的部分。 在上一节的内容中,我们介绍了验证性因子分析是什么,验证性因子分析和探索性因子分析的一同,最终我们对验证性因子分析给大家有了一个非常细致的一个讲解。今天呢,我们来正式进入利用 emos 来求解验证性因子分析的一个讲解。 呃,首先我们来看一下验证因子分析的求解,主要分为以下三步,第一步,我们先需要在 amos 中绘制模型图,绘制完成模型图之后,第二步呢,我们就需要选择我们的数据文件。 第二步,我们需要选择我们的数据文件,呃,然后同时呢进行相应的求解选项的一个设置,最终呢,我们就可以直接对模型进行求解,得到的结果进行相应的合理的一个解释。 然后这个是我们今天需要验证的一个验证性因子分析的一个模型图。这个数据呢,就是还是上次老师介绍那个 老师自己的研究的一个数据,用的是 a、 b、 c、 d、 e 来代替的四个浅变,五个浅变量,然后每个分别有四个测量变量,三个测量变量、五个测量变量、三个测量变量、五个测量变量, 然后我们来做一个这五个浅变量的一个验证性的因子分析,看 a 一、 a 二, a 三, a 四是否归于 a b 一, b 二, b 三是否归于 b c 一、 c 二, c 三, c 四、 c 五是否归于 c d 一, d 二 d 三是否归于 d 一 一一二一三一四一五是否归于 e? 我 们主要来就是验证一个这样的过程,我们先把 ppt 看完,然后 ppt 看完之后呢,我们再来进行 osmos 的 实际的一个求解的一个过程。

现在 ai 太强了,这个 spss 的 所有数据分析都可以用 ai 来做。就是这个亲爱的 spss, 我 从这里上传数据给他说,我要做描述相关分析,你帮我选择变量,直接做,我看不懂不要问我。然后他就帮我选择变量了,先做了一个皮尔逊相关分析, 又做了一个描述性统计分析,表格都是三线表,我直接复制粘贴到 word 就 可以。后面文字分析报告也帮我写好了,这一句话就搞定了,真的。哎呀,太强了呀!右边所有的分析方法你都可以用,直接给他对话告诉他就可以了。

做声信、搞机制,发 s c i 的 同学们是不是都有过这种崩溃时刻?辛辛苦苦找到了关键基因,也画好了信号通路图, 结果一到上游,调控机制就卡壳,脑子一片空白。今天给大家分享一个高分 s c i 论文里几乎必用的分析方法,转入因子预测。简单来说,转入因子就是基因的总开关,它能特异性结合到基因的启动子区域,精准调控基因的开启与关闭, 决定基因表达水平的高低。而生性中的转录因子预测,本质上就是帮你解决三个最核心的机制问题,到底是谁在调控我的目标基因? 它们具体结合在基因的哪个位置,可能形成什么样的转录调控轴?常用的分析思路和工具其实就三大类,第一类是数据库直接预测,比如 jasper、 transfer 和 comical 这些权威数据库,只要输入目标基因的启动子序列,就能快速计算出可能结合的转录因子列表。 第二类是结合表达数据筛选,把你自己转录组得到的差异基因和转录因子,把基因数据库进行关联分析,就能精准锁定在你的研究疾病中真正发挥作用的那个转录因子。 第三类是多组学联合验证,如果你有七步减 se q 或 atc 减 se q 数据,直接用实验数据来验证,结合位点说服力比纯预测要强得多。做完这一套分析, 你的文章逻辑会瞬间提升一个档次,从原来单薄的基因表达有差异,变成了转录因子。把基因细胞表型、减分子机制的完整闭环 这样的完整链条摆出来,审稿人根本挑不出硬伤。最后给刚入门的同学一句忠告,想把机制做深,先从找转录因子开始。这个方法简单好用,投入产出比极高。

很多人入门量化,把选股条件写成代码,跑个回测,看着好看就觉得策略有效。其实这只是程序化回测,和真正的量化差太远,他只告诉你历史能赚多少,却分不清哪些条件有用,哪些是噪音,没法复制也没法改进。 而真正的量化,核心是因子分析,用横界面视角扫描全市场选股,还能通过 i c i 二分组收益图判断因子的预测力、稳定性和有效期。 这些都是程序化回测给不了的。以前想学会这些搭环境写代码、做可量化要两三年时间,不用再走弯路,这本电子工业出版的 ai 量化交易就能帮你快速落地。 作者是 worldqant 大 赛中国区 top 团队,把实盘验证的因子分析方法、十五个高频策略都做成了适配 deepsea 的 提示词模板和保姆级步骤,复制提示词就能生成可运行的因子分析代码,跟着步骤就能出完整报告。 ai 还能帮你修复报错,优化思路,让你专心享交易逻辑,轻松搞定因子分析,真正入门量化。

大家好啊,今天呢,我们来聊一个听起来特别高大上,但是其实非常有意思的概念因子分析。 你可以把它想象成是专业投资者手里的一个秘密武器,帮他们在看起来乱糟糟的股票市场里找到清晰的航向。那么在接下来的时间里,我们会一起走完这么一段探索之旅。 首先咱得逛明白因子到底是个啥,然后呢,我们会把怎么用它拆解成一个核心的三步流程,接着咱得学会怎么判断一个因子到底灵不灵。最后也是最有意思的,我们会去看看那些投资大师的绝妙灵感到底都是从哪冒出来的。 好的,那我们这就开始第一部分,先来打开专业投资者的工具箱,看看因子这个工具, 是不是很多人都想过要怎么才能像那些专业选手一样选股呢?嗯,这里的秘诀啊,其实不是让你去追各种小道消息,而是要有一套成体系的打法,而这套方法最核心的东西就是我们今天要说的因子。 那到底什么是因子?你可以把它想成是股票的基因,你看,就像咱们人的基因决定了高矮胖瘦这些特征一样,股票呢,它也有一些共同的基因,比如说公司规模大不大呀,估值是高是低呀, 这些基因就能解释为什么某一批股票的风险和回报总是那么相似。咱们先从一个最直观的因子说起吧,波动率, 这也很简单,就是看一只股票的价格在过去一个月里上蹿下跳的幅度有多大,你甚至可以把它想象成是股票的脾气,有的股票呢,脾气很温和,有的就特别暴躁,一天一个样。 哎,有意思的地方来了,按理说,脾气暴躁,波动大的股票风险高,那回报也应该更高,对吧?风险越高,收益越高嘛。但历史数据啊,告诉了我们一个完全相反的事实。 大家来看这张图,这是一个历史回测。你看这个蓝线,它代表的就是一个由那些脾气温和、波动率低的股票组成的组合。 绿线呢,就是整个市场的平均表现。你仔细看,从长期来看,这条蓝线的回报居然明显的跑赢了市场,这就是因子的魔力,它能帮你发现市场里那些反常识的规律。 当然了,因子的世界可远不止波动率这一个。这张图就给我们展示了一个更广阔的田地,比如说,我们可以专门去找那些价值被低估的价值股,这就是价值因子。 或者我们可以找那些赚钱能力超强的公司,这就是盈利因子。还有那些像火箭一样窜升的明日之星,那就是成长因子,这些全都是咱们可以用的强大工具。 好了,了解了这么多五花八门的因子,下一个问题就很自然了,我们到底该怎么系统的去用它们呢?舅舅引出了我们的第二部分核心分析流程。 整个过程啊,特别像大厨做菜,就分三步,特别清晰。第一步,获取数据,这不就是去菜市场买最新鲜的食材吗? 第二步,因子处理,也就是把菜洗好,切好,处理成我们想要的样子。最后一步,因子分析,就是下锅炒菜了,最后还得尝尝这道菜味道到底好不好。在这三步里,要说最关键最考验功夫的,那还得是第二步数据处理。 它的核心任务就是要把有用的信号从一大堆噪音里给提炼出来。咱们具体来看怎么做? 首先就是数据清洗。你想想,你拿到一份数据,结果里面好多格子是空的, 你要是直接把这些带空格的行都删了,那你手里的数据可能就没剩多少了。所以啊,我们得想办法把这些空白填上,比如说用它周围数据的平均值来代替, 这样就能保住一个完长的数据集了。接下来是标准化这一步是为了解决单位不一样的问题。你想啊,一家公司的市值可能是几千个亿,但它的市盈率可能就十几,你要是不处理那模型,就会傻傻的以为市值这个数字更大的因子更重要。 标准化呢?就好像把人民币、美元全都换算成一个标准,这样才能公平的比较。然后我们还要处理那些特别极端的异常值。 打个比方,你在算班级同学的平均身高,结果把姚明的身高也算进去了,那平均身高一下就被拉高了好多,根本不准。 在数据里,这些极端值就是姚明,我们必须把他们的影响控制住,不然整个分析结果可能就全歪了。 最后这部也是相当高阶的一部,叫中性化。这是什么意思呢?比如说我们发现一个盈利增长因子好像挺灵的,但可能他选出来的公司正好都是大公司,那我们就搞不清楚了,到底是盈利增长在起作用呢?还是公司规模大在起作用。 中性化处理就像做一场科学实验,你得控制变量,把像公司规模、所属行业这些乱七八糟的因素影响都给剥离掉,这样才能看清楚这个因子自己到底有没有独立的预测能 好了。经过前面这一系列复杂的操作,我们总算是拿到了一个干干净净的因子,但最关键的问题来了,我怎么知道这个因子是不是真的管用呢?这就是第四部分要解决的问题。验证因子。 一个特别简单直观的办法就是分组测试。我们把所有股票按这个因子的得分从高到低排个队,分成几组,然后看他们过去表现怎么样。 就拿这张图来说,最上面那条绿线代表得分最高的那组股票,最下面那条红线代表得分最低那组。你看,如果绿线能一直稳稳的跑在红线上面,这就说明这个因子是有效的,得分越高,未来的回报也真的越高。 当然,要是想用一个更专业的指标来衡量,那就是信息系数,简称 i c, 你 可以把它简单理解成这个因子和未来股票收益之间的相关性分数。如果分数是正的,就说明因子值越高,未来收益也可能越高。如果是负的,那就是反过来。 这里最关键的还不是 i c 值有多高,而是它的稳定线。大家看这张图里的绿线,这是 i c 值的移动平均线,你看它虽然有波动,但长期来看都稳稳地在零轴的上方, 这就说明什么呢?说明这个因子和未来收益之间存在着一个稳定的正向关系,而不是今天零,明天就不零了,这才是一个好因子该有的样子。 讲到这,你可能已经大概明白了因子分析的整个流程,但还有一个最最核心的问题,那些最初的绝妙的因子想法,究竟是从哪来的呢?现在我们就进入到最需要创造力的部分,挖掘因子。 其实啊,灵感真的是无处不在,比如说,它可能就来自于你平时看的财经新闻。 你可能看到新闻说某家公司花大价钱收购了另一家公司,结果资产负债表上多了一项叫商誉的东西,这个商誉说白了就是收购时多付的钱,如果这个数字太高,就可能藏着未来资产减值的风险。 你看,这不就是一个很好的风险因子吗?灵感也可以来自于对人性的洞察。心理学上有个词叫处置效应,说的是咱们普通人都有个倾向,赚了钱的股票总想快点卖了,落袋为安。可亏了钱的股票呢,就死死拿着不放,总想着有一天能回本。 你看,就是这种普遍存在的心理偏差,恰恰在市场上创造出了一种可以被量化、被捕捉的规律。 如果你需要一些具体的思路,这里有三个可以激发你思考的框架。第一种,由点到面,比如说你发现低波动因子有效,那是不是可以扩展到低换手率、低 beta 系数这些类似的概念上呢? 第二种,由浅到深,比如说大家都在用市盈率看估值,那你能不能用更精细的现金流数据去构建一个更好的价值因子呢? 第三种,由政倒反,比如说我们都知道高负债是风险,那反过来想,一个长期低负债、财务特别健康的公司,这本身是不是就是一个很好的品质型号呢? 说到底啊,因此分析它就是一套把我们的投资智慧系统性的转化成可执行策略的科学方法。 当你开始用因子的视角去观察市场的时候,你看到的就不再是乱七八糟的价格跳动了,而是一个充满了规律和逻辑的世界。那么下一个改变市场的因子会不会就是你的想法呢?感谢收看!

然后验证性因子分析与探索性因子分析的异同呢?就说我们在呃相信大家在多元统计分析里边,大家都接触过因子分析,当时的因子分析呢,就叫做探索性因子分析, 就是说我们有了一些数据,我们需要从数据中提取出来几个因子,简单的来说就是降维,比如说我们刚开始有十几二十个因子, 然后我们需要通过降维呢来提取几个公共的因子,使得这几个公共的因子能够最大可能的解释原始变量的信息,这就是探索性因子分析需要做的一点。 然后下面我们就来简要的分析一下,探索性因子分析和验证性因子分析有什么不一样呢? 就说最简单的,我们就可以通先来直观的来看一下,就是说探索型因子分析呢,他是一个先有一个数据, 根据你所测量的这个数据呢,来对其给出一个最终根据你的结果给出一个理论上的一个解释,是先有数据,再有理论,然后利用数据来探索,探索出测量变量的一个框架, 这是探索性因子分析一直在做的一个点。然后验证性因子分析呢,就是说验证性因子分析是我们先进行的理论呢,理论的观点或概念架构的一个 一个准备。我们在有了理论之后呢,我们想要通过数据来对这个理论进行一个检验, 我们来看看这个理论模型是否适当,是否合理。因此呢,我们就是先有理论再来做一个检验,这是验证性因子分析的验证性因子分析的逻辑。 然后验证性因子分析呢和探索因子分析呢?我们首先能发现的一个点呢?就是说他们的理论基础是不一样的, 然后验证性因子分析先有理论,然后根据数据来进行检验。探索性因子分析是我们只有数据,然后通过数据我们想要得出一个理论上的一个解解释,然后这是探索性因子分析呢?与验证性因子分析一个呃,最直观的一个差异。

各位同学,大家好,很高兴今天我们能够相遇在二幺幺统计网络课堂,我们来共同学习 emos 入门教程。 在前面的两章内容中,我们分别介绍了课程的一些情况,以及 emos 操作界面以及操作按钮的一个详细细致的讲解。 相信大家在学习完上两节的内容,上两张的内容之后,能够对 amos 如何应用,使得其画出一个符合我们预期的一个理论模型图,已经有一个非常详细的了解,相信通过大家后续自己的练习呢,也对这个有了一个非常清晰的一个认识。 从今天开始呢,我们就需要学习 amos 的 一些实际的一些应用,应用数据来进行一些相应的分析。今天呢,我们先来看一下第三章。第三章呢,我们将主要介绍验证性因子分析。 验证性因子分析呢,是在处理结构方程模型软件中一个必不可少的一个程序,因此呢,我们今天先来学习一下第三章第一节验证性因子分析的介绍。 验证性因子分析是什么呢?验证性因子分析与普通与探索型因子分析的异同。我们再来强调一下验证性因子分析的主要目的是什么? 验证性因子分析啊,就是说它是主要就是用来检验变量间的一个区分度测量,验证测量题目与因子的一个存储关系。 就说我们在利用我们自己开发的量表来构建了一个我们的我们认为的这个,用来用这个浅变量,用这些测量变量来测量,我们无法测量这个浅变量, 但是这个理论基础是否能够得到一个支持呢?因此呢,我们就需要应用数据来进行一个检验,使得呢我们检验得到的各项指标能够直观的反映出我们所构建的模型。我们的量表是 符合我们理论研究的需要的,这就是验证性因子分析的一个主要的一个一同主要的一个点。

下面呢我们再来看一下,从其他几个方面,我们再来看一下这个是否有一定的差异呢? 呃,我们首先来看一下他们的理论上的一个贡献。我们刚开始前面已经讲了,就是说呃探索型因子分析呢,是做一个理论上的一个呃产出,然后验证性因子分析呢,是做一个理论上的一个解释, 探索性是通过数据来产出一个新的理论,验证性是通过呃我们现有的数据,现有的理论,现有的理论基础,我们来对理论进行一个验证,所以这这是两个在理论上的一个差异, 同时呢,然后两个在处理的逻辑上也会存在一定的差异,就是探索性因子分析呢,我们就是说他先是理论启发,然后文献基础薄弱, 就说他没有相应的文献的研究基础,没有前任理论的研究基础,他仅仅是只能通过数据来对他进行一个相应的解释, 然后验证性因子分析呢,他就有一个非常强大的一个理论基础来做支撑,有了这个理论基础之后,我们再用我们的实际数据来对这个理论基础进行一个检验。 然后同时呢再再有一点不同的呢,就是说探索型因子分析呢,我们是最终为了决定这个因素的数量,我们最终要决定提取多少个公因子,能够最大限度的解释我们所提出的这个我们所原始的这些变量的一个情况。 然后验证性因子分析呢,就不同了,他是说他在我们在分析之前呢,我们根据现有的理论,我们每个浅变量所具有的测量变量,也就是我们这个模型的因素都已经是固定好的了, 我们只不过来对他进行一个检验,所以说呢,这就是两个决定因素的两个,两个理论的两个研究的方向的一个差异。探索性因子分析呢,是为了确定这个数量,然后验证性因子分析呢,是为了给出一个, 是为了给出理论已经确定好的一个模型的一个合理的解释,然后最终呢就是说还有一点就是说呢,呃,就是说这个辨探索型因子分析啊,我们是用来做探索的,对吧?我们不知道呢,这个变量是需要归为哪一类的 探索型因子分析呢?最简单的一个一个一个直观的一个猜,直观的一个解释就是说我们是原始信息,我们把原始信息绘制成,呃, 绘制在坐标系中,我们通过来进行一定的转轴,大家二维的就可以想象的出来,我们把 x 轴和 y 轴来进行一个旋转,使得我们的变量 尽可能的集中在第一个主轴,也就是 x 轴,然后在 y 轴上呢也会尽量的尽量的大,这样之后呢,我们就相当于把原来一个不太相关的 信息给他转换到一个非常相关的 x 主轴上,第一个相当于他的话就叫第一个因子,然后和 y 另外一个因子的这个一个一个过程, 然后验证性因子分析呢,我们是说的是这个某一个测量变量,它归属于某个浅变量,它是我们在研究分析之前已经通过理论给出一个确切的分类的,这个是我们没有没有办法进行更改的。 然后这个就是两个是否是否确定这个因素因素的归类,探索型因子分析呢?因素的归类是可以随机的,比如说我们这一次做,我们根据不同的准则来选的话,可能可能这个 a 问题就可以归到不同的 变量里边去。然后呢,验证性因子分析就说我们这个 a 问题是用来测量某个浅变量的,那它就只能归属于某个浅变量, 这个就是这个。我们我们就从四个方面给出了验证性因子分析和探索性因子分析的各个方面的一个异同,希望大家能够对验证性因子分析和探索性因子分析有一个直观细致的一个了解。 然后今天呢,就是我们简要的介绍了一下验证性因子分析的一个介绍,我们通过今天的介绍呢,希望大家能够对验证性因子分析和探索性因子分析产生一个宏观的认识。 最终呢为了后边学习各个模块,为了后面学习呢,我们下节课程的验证性因子分析的实际的求解以及后续的解释呢,就先打下一个坚实的一个理论基础,希望大家能够对今天的课程 能够在课下进行一定的熟悉,对这个理论呢有进一步的了解。呃,以上就是今天课程内容,谢谢大家,我们下节课。

有 ai 之后就不要再学这个传统的 spa 来做数据分析了,我找到一个 ai 工具,就是这个 chat s p s s, 从这里上传数据,然后我说帮我做一下信销度分析,你选择变量直接做,我看不懂,然后他就自己帮我选择变量。先做了维度的这个 信度分析就是克隆巴赫系数也是大于零点七的,结果都还挺好的。然后效度分析, kmo 近视考方球心度检验,这个 kmo 也是大于零点七的。 然后后面是方差解释率,然后这里是探索性因子分析,一共是五个因子,一二三四五都是一一对应的,结果都挺好的,这个一句话就搞定了。然后面是他对这个信度分析和效度分析的结果解读信度分析的,效度分析的,这个太方便了,一句话就搞定了。