粉丝536获赞1877

哈喽,大家好,今天呢,给大家讲一个如何在逼框上去构造的是悲哀,量化可是画策略的这样一个模板,它的过程在构建啊。任何策略之前,其实我们都是有目标,我们要构建一个什么样的策略,就是肯定有人说 当然是赚钱的策略啊。确实,大家做所有的研究,无论是传统投资也好,传统量化投资也好,还是哎量化投资也好,大家的目的都只有一个, 我要写一个赚钱的策略,但是这个目标来讲,他确实很准确,但同时呢也有点太空泛了。所以对于人工智能来讲,你给他 讲赚钱是一个什么样的概念呢?我是赚多少呢?我是赚百分之十叫赚钱,来赚百分之五回赚钱呢,其实是一个比较空旷的谈说法,我们要把这个目标去细化,计划到什么速度, 细化到能够让机器去识别他,认识他的一个程度。所以呢,我们将这个目标细化以后呢,我们可以这么写,比如说我是想要 strong 这个算法去找到未来五十最有可能上涨的股票,一下子这个目标是不是轻易多了?对于机器,机器来讲,他也更好去识别什么叫做收益好, 算法来讲,他其实是有根训练结合预测级,也就是我们的学习区域和我们的测验区域啊。如果对于算法的原理不太理解的朋友呢,推荐可以给你看一下这篇文章, 他很清楚的了说明了整个人工智能算法是如何运行的。那在这里呢,我们首先其实要划分的就是面积和预测级,这两个级呢,对于机器学习来说非常重要,他直接决定的机器,他能够学习到 的承诺和他能够做测验预测道理的结果啊,我们如何去搭建以这个为目标的策略呢?那首先来看我们要将策略分成训练级和预测级,这个呢其实是在一个是算法的运行原理了,我们如果大家感兴趣,我们下期可以专门来讲一下, 那我先把训练集画册出来,训练集的时间范围呢,我们选择二零一零年一月一号到二零二零年十二月三十一号的这样的数据集作为我们的训练集。那数数据确认好了以后,如何 设置我们的标注?也有人就会在问这里为什么要学习标注呢?标注呢其实就是说我们想让我们的积极学习算法,他学习到何种程度才算是学习好的,就他如何在我这一堆数据里面去找 他目标是相同的,也就是我们的标注是相同的数据呢?所以呢,在这里我们把未来五日的收益价格除一日的收盘价作用整个策略的一个标注。目的标注设定好以后,接下来我们要干什么呢?我们要找我们的英子 因子是什么呢?因子是整个策略很关键的部分,如果大家第一次不是很了解的话,可以去详细了解一下我们。因子对于近距离来讲还有一个重要特征性, 由于呢,我们刚刚选择的目标呢,是一个短科技的目标,所以在这里呢,我们因此要相应的选择短期的因子就在这里呢,我们选择亮家因子。 对于英子数据抽取,我们常用的两个文化是基础特征抽取和衍生特征抽取,那这两个文化的区别在于基础特征抽取,他抽取的是一款平台 已经预计算好的因子,比如说我们常见的 clothes 林、纳姆林瑞特尔林等等等等这样一些因子,我们直接可以通过名称就可以把它抽取出来。但是对于部分的用表达摄影情构建的因子,我们就要用到衍生特征抽取模块, 你们的 rap 与特尔林,除以 rap 与 tou 二五,它其实就是一个表达,是已经构建的因子,因此我们要用衍生特征模块来抽取这个因子的数据。 构建到这里,大家可能会有疑问,你觉得,哎,为什么有些是上下游的关系,然后呢?比如像我们的自动标志模块,还有因子冲洗着模块,它就是一个并列的关系呢, 在这里呢,是与他们之间的关系,其实是一个函数, y 等于 fx 这样关系,那 y 是什么? y 就是我们刚刚找到了一个标注, x 就是我们刚刚这 的一个因子。我们的目的呢,其实就找到这两种歪点, fx 他们之间的一个函数关系,所以在这里呢,他们并非上下有关系,而是一个并列的关系。那接下来呢,我们就是把这两块的数据连接起来,并且要对他的数据进行一个处理。我们都知道 在股票市场里面,股票可能因为临时停牌呀,或这样各样拿雨那样的原因,导致一部分日期是没有交易数据的。 在这里我们为了避免缺失值中断模型的训练,使用我们一般的处理方法是直接将缺失值做掉就可以了,我们的数据因子标注等等级都已经准备好了,拉近我们的算法,也就是我们的模型去找到 y 和 apx 之间的关系。那我们刚才讲过,目标里我们是希望用 stronger 来做这个模型训练的, 在这里呢,我们就选择 starbuck 训练的这个模块来训练我们的模型。到这里其实我们模型训练已经已经搭建完成了,那么模型呢?他在我们整个训练级的基础上会去学习我们刚刚的标注, 那我跟他讲我们的标注是否合理,我们的标注学习出来的关系是否是可以用于以后的场景的呢?所以在这里我们就要去设置我们的预测机, 同样的我们要去抽取预测级的数据给魔性用作验证。以我们的预测时间范围选择二零二一年一月一号到二零二一年十二月三十一号。这里重点强调一下, 我们的预测级和训练级的数据是不能重合的,因为这个呢会带来未来函数,就比如大家上学的时候考试的题和练习时出题一模一样,那这样的测验呢,是没有任 任何的效果的,所以在这里我们一定要把它完全的分开。同样的,我们预测级因为他是找 fy 的 fx 之间关系,所以他的 x 也是我们的因子呢,也是要跟我们的训练级是一样的。那这里我们直接把数据传入并做预测级的 就是处理就好了。我们的预测及数据做好以后,我们要怎么办呢?因为我们刚刚已经用 stronger 把整个模型训练出来了,我们要看它效果,那我们在这里再引入另外一个模块,在 stronger 的预测,预测里成了刚刚我们已经训练好的模型, 我们只需要将预测级的数据传递给 style ranker 的预测这个模块,我们就可以让他预测出我们一开始设定的整个策略目标,就用 style ranker 选择未来五日最有可能上涨的股票。到这里大家可能觉得,哎,这不就结束了吗?我们已经把 我们想要的结果找出来了,但是在整个完整的交易来讲,他选出来没有结束,你选择来我们要干什么?我们最终刚刚讲到一个很大的目标,是吧?我们需要有个能赚钱的策略,那这只股票,这几只股票,他是不是真的赚钱呢?我们要把它放到交易里面去看, 所以呢,在这里我们还要履入一个模块,叫翠的模块,也就是回侧模块,侧模块里面呢可以设置我们整个股票的交易逻辑,支仓卡点、手续费等等,这些呢都是可以用来处理整个真实环境的交易情况。那这里呢,我们不要进行细讲,我们直接用摸人就好了, 真正去了模块完成以后,整个策略就算是构建完成了,那我们来运行一下,看他一下他的结果怎么样。我们 starry 散发在亮化研究上的那个其实非常不错的,在这里啊,打主要看两个, 一个是这英子的铸造图,这是我们的英子,这个英子特征重要性其实是描述了英子在这个策略的权重、占比及因子对于策略的重要性影响。那当然分数越高的就是占比越重的,分数越低的就是对这个策略的影响 比较小的,这下面呢,我们可以看到整个回侧图,回侧曲线啊,回侧曲线是大家比较关注的, 也是重点,因为他可以看出他的一个表现如何,包括没有看到很多质量,比如下步比率,我们的大回撤,然后我们的收益率到这里呢?我们刚刚讲到用 star rocker 来预测未来我们具有可能上涨的股票,这个策略就构建成功了,我们下一期再见。


在上一个视频里,有朋友提到,折腾一年还不如一个简单的小市值策略收益好。于是呢,我随手做了一个小市值策略,回测了去年到现在,发现收益竟然有百分之六十四,而同清沪深三百指数则亏损了百分之十八。 这么一看,小市值策略的低价效应还是存在的。 nice! 在这里呢,我们不得不提到一个传奇的人物, 约翰邓普顿,他在美国大萧条时期,全世界都在抛树的时候买入低于股价一美元的公司,这使得他赚到了第一桶金,而后他的资产从一万美元上升到了二百二十亿美元。而他坚持的投资理念是 一直寻找便宜股,这个投资理念也就是我们今天所说的小市值策略。那什么是小 市值呢?对于小市值呢,其实没有一个标准的定义,一般来说,低于五十亿的都可以被称为小市值。那为什么我们要选择这些小市值的公司呢?这是因为 股价低、市值小的公司通常更具有灵活性和创新性,能够快速适应市场变化和发展,新的业务模式往往会带来更好的投资回报率。说千遍也不如回测一遍,我们按照下面这几个步骤来复刻一下小市值策略的辉煌。 a 股有四千多只股票,我们对这四千多只股票的市值进行排序,筛选出市值最小的五十只,对其进行均仓买入。 步骤如下,第一步,我们对股票进行过滤,去除 st, 停牌退市,合上是不满一年的新股。第二步,按照市值从小到大排序, 筛选出市值最小的五十只股票。第三步,第一个交易日开始均仓买入排名靠前的股票,仓位为百分之二点五。第四步,第五个交易日卖出不在列表中的股票,并买入在列表中但不在持仓中的股票。 那这个策略所需要的数据呢?在边框平台上都是可以直接调用的,包含了 a 股的一些行情数据,比如高开低收、成交量、成交额、涨跌辅档。还有很多因子数据,像基础因子、财务因子、技术因子、估值因子等。 元代码和数据都已经打包好了,你只需要一键运行即可看到结果。可以添加右下角我的微信,获取元码和数据使用方法,我们来看看哦。这里的运行结果,如果你从二零一零年一直到现在都坚持持有小市值的公司,那 收益可达百分之七千,而同期互升三百则为百分之十三点五六。对于小市值策略代码,有很多人可能不太明白其中的逻辑关系,我有一个视频呢,是专门对小市值代码进行了逐行讲解, 即使你不太懂拍子,不太懂量化,也能听得懂。需要这个视频讲解的可以添加右下角我的微信,可以把视频讲解和原码都发给你,今天就到这里,喜欢的朋友欢迎一键三连,你的鼓励是我创作的最大动力,下期见!
