上期我们用 skidlearn 的 限性模型玩了个入门级量化预测,但市场不可能是限性的。这一期咱们就将模型升级一下,大家不用担心升级后的强者横强,逻辑也超简单,不用看代码,你也能明白量化策略的思路。 先声明,本期视频里用到的代码纯粹是教学性质,目的是为了帮助大家学习量化相关知识,不构成任何买卖操作依据,不承诺收益,不承担任何投资损失责任。视频中涉及的回测数据也不代表未来的实际表现,切记! ok! 进入正题, 咱们这期代码的核心思路就是这样的,先用 a cap share 拉近一年 a 股数据,然后计算一堆技术指标当原料,再为给 x g boost 模型,让 x g boost 预测下一周五个交易日股价是涨还是跌, 再结合经典规则,站上 m a 二零 r s i。 强势动量,正做双保险,最后给出买不买的结论和止损建议。是不是很简单? 整个逻辑像打游戏,先侦查数据和指标,再用大招 x g boost 的 预测,最后用规则确认和风控补刀,简单粗暴,但超级实用。这里大家能看出 x g boost 在 这套逻辑里到底扮演啥角色了吧? 它就是核心大脑。代码里,我们用动量、 r s i m a c d 波动率等十个特征训练 x g b o s t。 分 类器,它会自动学出哪些指标组合最能预测下一周上涨, 说白了就是靠它来抓准涨跌的核心规律。那为啥 x g boost 能担起这个核心大脑的重任呢? 因为它在处理结构化金融数据时,本来就有更高的准确率、泛化能力和效率,尤其是小数据集上表现更稳。 也正因如此,相比上期的限性模型,它在股票这种噪音大、非限性的数据上效果更突出。实际回测里,不同股票、不同时期 x g boost 的 方向预测准确率足够帮你筛选出强势股。 注意, x g boost 的 不是神仙,但它只是让你的胜率从抛硬币变成有心算。这里要强调几个指标的处理, 首先, macd 在 这里不依赖人为设定的金叉死叉运值,而是让 xgboost 通过大量历史样本自动学习 macd 三条线在什么组合状态下最容易对应下一周上涨。抓趋势变化用的,这比手工规则更灵活,也更能捕捉微妙变化。 其次,十天涨幅百分比、十四天涨跌力量对比和二十天标准差。这几个指标既是 x g boost 的 重要特征,又是规则判断里的核心条件之一。 在规则中,这几个指标扮演的是一个过渡器,在模型中, x g boost 又会把这些指标当做独立的数值特征来学习。 逻辑介绍完,我们跑跑看。再次重申一下,本期视频里用到的代码纯粹是教学性质,目的是为了帮助大家学习量化相关知识,不是任何投资建议。视频中的数据我都做了脱敏处理,无具体股票代码或名称。回测数据不代表未来的实际表现,切记, 感觉都是偏正向的,对吧?上期跟大家强调了我选股策略是偏价值投资的,这些标的都是我提前根据安全边际过滤过的,不要觉得有了量化就能开悟了。投资是一场修行, 牢记风控三原则,守正积势待时守正就是守住本金,尊重自己的投资策略和交易纪律,设定好自动止损点。积势就是有长期思维,别老想着唆哈,慢慢建仓,强势股积累才是真功夫。 待时就是有耐心,股市无常花不开,别硬掰,耐心等信号出现,宁愿错过不盲从。下期咱们继续升级用 light gbm 量化模型的闪电侠版,再优化一次,敬请期待!点赞关注不迷路,我是普世即自然,咱们下期见!
粉丝165获赞314

新年开盘前, x b s 选股第三弹,招商轮船。各位观众朋友今天带大家关注一支航运领域的蓝筹龙头,招商轮船。六零一八七二首先来看主营业务,招商轮船是不折不扣的全球龙头,构建了由散汽车级的全船型布局,其中 游运是核心弹性来源,旗下拥有全球规模最大的 v l c c 船队,凭借地源冲突和合规运力稀缺,运价弹性极大。 l n g 运输则是尾现金流,基本盘六十四艘船大部分签了长约,保障了收入的稳定性。同时 公司还拥有全球最大的干散货船队以及集装箱和汽车滚装业务,业务结构非常均衡。再看业绩,二零二五年是公司的大年,年报预告显示, 全年规模净利润预计达到六十到六十六亿,同比增长百分之十七到百分之二十九,特别是第四季度,利润迎来了爆发式增长,单季预计二十七到三十三亿, 同比增幅高达百分之五十五到百分之九十,这背后主要是由于运价飙升带来的业绩贡献。整体来看, 公司负债率约百分之四十七,财务状况稳健,高分红的吸引力也一直很强。接下来是近期鱼情和市场表现,鱼情方面,游运超级周期是最大的核心催化,红海局是老旧船拆解、 新船交付不足等因素共同推动 v l c c 运价创下三年新高,市场对行业的景气度高度认可,当然也有高管小幅减持运价高位波动等中性信息。最后看近两个月的量价,从十二月底到现在, 股价经历了一轮明显的先扬后抑,股价从约九元一路冲高,在二月十二日迎来了涨停,最高数级十三点二二人, 区间涨幅接近百分之三十五,但在二月十三日股价出现了百分之七点八的大幅回调,成交量也同步放大,这说明资金在高位出现了明显的分歧,换手加具。总的来说, 招商轮船是游运周期、景气度与蓝筹稳健性的结合体,短期看核心变量是由于运价的持续性,中长期看, l n g 业务的增长和高分红是重要的支撑。以上就是招商轮船的概览,感谢收看!

x boost 模型选股,迈维股份,光伏设备基本盘占比约百分之七十五, 全球 h j t e。 质结整线龙头是占率超百分之六十二零一八到二零二三。丝网印刷设备全球是占率第一,累计交付五十一条 h j t。 产线三十点九瓦核心 p k v。 国产化百分之一百,效率百分之二十五点五,加 半导体设备第二。区县金源激光开槽设备国内是占率第一,先进封装二点五 d 三 d 设备批量进入长电通付微电二零二五,上半年收入暴增百分之四百九十七,新兴赛道第三,增长级 钙钛矿叠层电池设备, oled micro 太空光伏 h j t。 适配 spacex 真空加激光加精密装备三大技术平台赋用。近年业绩二零二四,全年营收九十八点三零亿加百分之二十一点五三, 规模净利九点二六亿加百分之十三点四,经营现金流零点五六亿二零二五,前三季度营收六十二点零四亿,负百分之二十点一三, 规模净利六点六三亿,负百分之十二点五六,经营现金流负十点四二亿,大幅恶化。资产负债率百分之六十三点九二。 行业高位关键特征,光伏周期下行拖累业绩,半导体海外订单高增,印度四点八吉瓦整线二十四亿加,现金流承压高负债近期逾期二千零二十六点一减二。正面 太空光伏概念,全 spacex 五亿美元 h j t。 订单,市值一度破千亿,技术突破 h j t。 效率百分之二十六点九二,该钛矿叠层百分之三十四点零二,全球领先。半导体设备交付 m e m s。 头部企业国产替代加速 负面争议,时空人十五天套现十七亿一点二九到二点一二,精准高位减持,业绩下滑与高估值 pe 一 百倍倍离泡沫争议大, 现金流恶化,高负债,行业周期压力热度,光伏,太空光伏,半导体概念龙头 龙虎榜密集上榜,机构分歧加具近两月量价二零二六年一月一日负二点一三,区间概览,股价一百八十四到两百八十四点四七元,最高三百七十三元,成交日均三十到五十亿,峰值九十六点九亿一点二六, 换手率百分之四百分之十四,关键节点,一月八日加百分之十五点六五起动,一月二十三日二十厘米涨停。太空光伏一点二六,最高三百七十三元, 市值破千亿,成交九十六点九亿。一月二十九日二月十二日时控人减持,股价高位震荡,二十三节前大跌负百分之八点三四,成交三十九点二亿,资金出逃,资金特征,油资加机构加散户合力, 高位筹码松动,主力净流出显著。五、核心总结,基本面, h j t 加半导体加钙钛矿,技术壁垒深厚, 短期业绩成压,现金流恶化,长期成长逻辑清晰。市场面,太空光伏加国产替代双重催化情绪与资金主导,估值极高,波动极大,风险突出。 风险提示,光伏周期时控人减持,高估值现金流行业竞争。

x boost 选股三零零幺三六,信为通信一个基本盘,消费电子占比约百分之五十。泛射频龙头,苹果华为核心供应商,主营天线模组、无线充电 m e t m c。 精密连接器散热、 ai 眼镜折叠屏,高端手机份额提升,毛利率修复至百分之二十一,加两大增长。引擎,商业航天卫星通信第二曲线, spacex 星链地面终端,高频高速连接器独家供应是占近百分之一百,墨西哥建厂专供。二零二五,年收入十五到二十亿,毛利率百分之四十五到五十, 新增第二家北美卫星客户智能汽车第三区线,车规 m l c c。 车载天线连接器进入特斯拉比亚迪理想。 二零二五,年收入二十到二十五亿,增速约百分之八十。安格新赛道 ai 硬件服务器 m l c c。 散热六 g r s。 互联网机器人才料加射频一体化壁垒二。近年业绩二零二四到二零二五,二零二四,全年营收八十七点四四亿加百分之零点八。规模净利六点六二亿,负百分之十二点三, 经营现金流十点七六亿,稳健。二零二五,前三季度营收六十四点六二亿加百分之一点零七。 规模净利四点八六亿,负百分之八点七七。扣菲四点二九亿,加百分之四点 五九亿加百分之四点二。净利三点二四亿加百分之二十五点四五,环比加七点六。 p c t。 显著改善。二零二五,全年预告 营收九十五到一百零五亿加百分之八到二十。净利七点零到八点五亿加百分之五到二十八。卫星加汽车驱动结构优化关键特征,营收起稳,尽力触底回升, 现金流强劲,前三季度十二点九四亿,资产负债率百分之四十三,健康三、净期余情二千零二十六点一减二 正面,一月二十一日官宣 spacex 独家供应卫星通信逻辑引爆六 g 布局 reis 星载毫米波,苹果透明天线散热液雾二零二六到二零二七,放量预期 q 三、业绩拐点,毛利率修复,基本面改善, 负面争议,时控人一月高位减持约八亿,引发资金分歧,消费电子周期仍弱,高估值 pe 六十倍。争议热度,卫星通信,商业航天龙头,龙虎榜密集上榜机构加油,资加散户合力 四、近两月量价二零二六年一月一日负二点一三,区间概览,股价幺九点八三六点五元,最高四十一点八八元,区间涨幅加百分之八十四,成交日均十五到三十亿,峰值六十八点三亿。一点二二, 换手率百分之三百分之二十五,关键节点,一点二一、官宣, spacex 独家,次日二十 c m 涨停, 成交四十五亿,情绪启动一点二二,最高四十一点八八元,成交六十八点三亿,换手百分之二十五,天量分歧一点二三减二点一三时控人减持加获利回吐,高位震荡 二点一三收三十六点五元,成交二十八点七亿。资金特征,游资主导加机构参与,高位筹码换手充分,主力净流入后转为净流出。五、核心总结,基本面,消费电子起稳,卫星加汽车双轮驱动, 业绩拐点,现金流强劲,长期成长清晰。市场面, spacex 独家加卫星通信加六聚三重催化 情绪与资金主导,估值偏高波动大风险收益并存。风险提示,消费电子周期时控人减持高估值 spacex 订单波动行业竞争。

各位小伙伴们大家晚上好,今天分享的是构建 sports 的 最佳模型,用 shop name, deluxe 等工具来做可解释的分析。那么首先我们来了解一下什么叫可解释性分析。在可解释性学习当中最常用的就是 app, 它是来衡量这个特征样本,它的不同特征对于这个预测结果贡献,这是一个 step value, 你 可以把它理解为个体输入的特征对模型预测值贡献的一个重要性。如果说这一个值它越高,也就是我们的 step value 它越高,那么就证明我们的贡献值越高 啊。这里有两种格式化来进行一个单个的一个预测,一个呢是我们的 summary plot, 然后另一个呢是我们的瀑布图,还有我们的例图。 我们来怎么来看这个图呢?就是红色的条呢,就表示该特征对预测值的一个正贡献,蓝条呢就显示该特征对预测值的一个负贡献。 然后呢都包含了一个整体的预期预测值,或者是叫我们的一个基值,这可以理解为整个训练值的平均模型输出。 然后条形图呢,是按照绝对重要性的降序来排列的。预测的概率是怎么计算的呢?首先呢啊,你要先计算出一个总的一个概率,也就是我们的平均概率, 然后我们可以叫它为大 p, 然后再通过个例概率,最后呢进行一个比较,比较大 p 和小 p, 也就是平均概率和各类概率。最后呢来确定患者它属于结局事件发生,高概率患者还是低概率患者。 好,让我们来看到我们的一个代码部分啊,因为这个代码又是比较的长,然后我们呢来大概讲解一下啊,它的一个大概的一个意思, 首先呢我们先从序面集当中提取了八个特征,一个目标结局变量,用 sports 的 算法呢来构建的二分类模型,然后我们的特征提取,这里是我们的一个特征提取,还有我们的一个目标结局变量的一个提取,然后来构建我们的 sports 的 一个模型, 然后训练集当中呢一共有呃一千四百九十九个样本特征呢,包括了我们的 a, s, t, 然后年龄还有我们的 w, b, c 等临床的一些指标,然后这里是我们的一个样本的一个筛选, 然后下面呢来进行一个建模,然后建模的话我们是用的是这一个函数来进行一个建模,处理我们的数据,这里的意思呢就是说一百迭代次数,然后目标函数呢是我们的二分类, 然后呢这这里的礼盒,我们的 sports 这个模型呢,它的参数是一个分类模型,所以说我们的 objective 呢选择是我们的二分类,也就是我们 x, y, 然后这里呢是我们的模型的一个礼盒,然后下面呢是我们的下部的一个可识画 格式化呢,它一共会通过我们的 sv importance 呢生成两种图,一个呢是我们的条形图,一个是我们的风琴图。我们首先来看我们的特征重要性图,然后这是我们的一个条形图, 然后呢下面一个呢就是我们的一个风琴图。为了看我们单个患者的一个预测过程,我们可以选择我们的第八百八十五号和我们的第八号患者来进行一个局部的一个解释,然后就是来做他的一个例图,还有一个瀑布图, 嗯,依赖图呢,展示了单个特征与 app 值的一个关系,比如说我们可以来做我们的 a s t 的 一个依赖图,年龄和心率的一个交互, 也就是这里这这里就是一个 app 的 一个依赖图,然后下面呢就是年龄与 hr 的 一个交互,然后这是 a s, t, 然后呢这是我们的 w, b, c 啊 l, l, p, 然后这些呢都是我们在前面筛选出来的八个特征,还有我们的一个呃结局变量, 下面呢就是 name, name 和 deluxe 的 一个补充特征, name 呢是通过局部拟合线性模型来解释单个样本, 我们选了第一个患者,这是第一个患者,然后用七个最重要的特征来进行一个解释,先是呢 name 进行一个模型的一个构建,然后再来解释我们的第一个样本,这里是解释第一个样本, 然后 dx 呢,它是用于全局或局部的一个模型诊断。然后就是变量的一个重要性部分依赖图就是 p d p, 然后单样本的下不值,然后变量重要性呢就是对应的是我们的一百零九,就这里一个代码变量重要性的一个分析, 然后 p d p 图就是来解释单个零序解,解释变量与响应变量之间的一个关系,然后单样本的下图呢,然后计算它的一个 value 值, 下面呢就是一个 roc 曲线的一个比较,我们这里呢是比较了我们的 a p, a, c, h e 三的一个 roc, 还有我们的 g c, s roc, 就是来比较它们两个之间的一个啊 r o c 的 一个曲线值, 如果这里需要添加我们 r o c 曲线的话,就将我们的 type 等于 s 改为 a 的 等于 true, 然后来添加我们的 a u c 的 一个值,然后下面就是进行一个外部验证,我们用独立,我们是采用的是一个独立的外部数据集, 也就是我们的 e, x, c, s, v。 我 们先做了一个基线表,然后呢确认两组患者在特征上的分布是均衡的。首先呢是读取我们的 web 数据, 这里是读读取我们的一个外部数据,然后再删除我们的一个缺失值。然后呢构建我们外部验证的一个基线表,然后再用训练好的模型在外部集上进行一个预测, 然后得到我们的一个 a u c 值,然后我们外外部级的一个 r o c, 然后再来绘制我们外部级的一个 r o c 的 一个啊,一个图, 这里的一个群的一个数据数据集的一个结局变量。因为我们之前被我们的啊更改了我们的数据类型,现在的话就需要将它的一个更改回来,从我们的零 e 变成我们的 low 和 yes。 前面的话,我们是将 low 和 yes 改为了它的一个零 e 嘛。 总的来说呢,我们通过 app name dx 从全职到局部呢完整地解释呢 s x box 模型的一个决策的一个逻辑,验证了我模型的一个可解释性和稳定性。 r o c 曲线和外部验证呢,也表明这个模型的性能明显优于我们传统的临床里的一些评分。 然后今天的分享就到这里结束了,谢谢大家。
